Текст
                    УДК 512.8
ББК 22.143
И 46
Учебник удостоен
Государственной премии СССР за 1980 год
Ильин В. А., Позняк Э.Г. Линейная алгебра: Учеб.: Для ву-
вузов. — 6-е изд., стер. — М.: ФИЗМАТЛИТ, 2005. — 280 с. — (Курс высшей
математики и математической физики). — ISBN 5-9221-0481-0.
Один из выпусков «Курса высшей математики и математической физи-
физики» под редакцией А. Н. Тихонова, В. А. Ильина, А. Г. Свешникова. Учеб-
Учебник создан на базе лекций, читавшихся авторами в течение многих лет на
физическом факультете Московского государственного университета. Со™
держание книги составляют теории матриц и определителей, конечномер-
конечномерных линейных и евклидовых пространств и линейных операторов в этих
пространствах, билинейных и квадратичных форм, тензоров, вопросы клас-
классификации поверхностей второго порядка и теории представления групп.
Третье издание — дополненное, 1984.
Для студентов высших учебных заведений, обучающихся по специаль-
специальностям «Физика» и «Прикладная математика».
Учебное издание
ИЛЬИН Владимир Александрович
ПОЗНЯК Эдуард Генрихович
ЛИНЕЙНАЯ АЛГЕБРА
Серия: «Курс высшей математики и математической физики»
Редактор Д. А. Миртова
Оригинал-макет: В. В. Худяков
Оформление обложки: А. А. Логунов
ЛР Ш 071930 от 06.07.99. Подписано в печать 14.01.05.
Формат 60x90/16. Бумага офсетная. Печать офсетная.
Усл. печ. л. 17,5. Уч.-изд. л. 19,46. Заказ №
Издательская фирма «Физико-математическая литература»
МАИК «Наука/Интерпериодика»
117997 Москва, Профсоюзная, 90
E-mail: fizrnat@maik.ru, http://www.finl.ru
Отпечатано с готовых диапозитивов в ПФ «Полиграфист»
160001, г. Вологда, ул. Челюскинцев, 3
Тел.: (8172) 72-55-31, 72-61-75, факс: (8172) 72-60-72
E-mail: forin.pfp@votel.ru http://www.vologda/~pfpv
5-9221-0481-0
9„785922
104814
ISBN 5-9221-0481-0
© ФИЗМАТЛИТ, 2004, 2005


ОГЛАВЛЕНИЕ Предисловие 10 Введение 12 Глава 1. Матрицы и определители 13 § 1. Матрицы 13 1. Понятие матрицы A3). 2. Основные операции над матрицами и их свойства A3). 3. Блочные матрицы A7). §2. Определители 19 1. Понятие определителя A9). 2. Выражение определителя непо- непосредственно через его элементы B5). 3. Теорема Лапласа B6). 4. Свойства определителей B8). 5. Примеры вычисления опреде- определителей C2). 6. Определитель суммы и произведения матриц C5). 7. Понятие обратной матрицы C6). §3. Теорема о базисном миноре матрицы 38 1. Понятие линейной зависимости строк C8). 2. Теорема о базис- базисном миноре C9). 3. Необходимое и достаточное условие равенства нулю определителя D1). Глава 2. Линейные пространства 42 § 1. Понятие линейного пространства 42 1. Определение линейного пространства D2). 2. Некоторые свой- свойства линейных пространств. D5). §2. Базис и размерность линейного пространства 46 1. Понятие линейной зависимости элементов линейного простран- пространства D6). 2. Базис и координаты D8). 3. Размерность линей- линейного пространства E0). 4. Понятие изоморфизма линейных про- пространств E1). §3. Подпространства линейных пространств 53 1. Понятие подпространства и линейной оболочки E3). 2. Новое определение ранга матрицы E5). 3. Сумма и пересечение подпро- подпространств E6). 4. Разложение линейного пространства в прямую сумму подпространств E8).
ОГЛАВЛЕНИЕ §4. Преобразование координат при преобразовании базиса п-мерного линейного пространства 60 1. Прямое и обратное преобразование базисов F0). 2. Связь меж- между преобразованием базисов и преобразованием соответствующих координат F1). Глава 3. Системы линейных уравнений 63 § 1. Условие совместности линейной системы 63 1. Понятие системы линейных уравнений и ее решения F3). 2. Нетривиальная совместность однородной системы F5). 3. Усло- Условие совместности общей линейной системы F6). §2. Отыскание решений линейной системы 68 1. Квадратная система линейных уравнений с определителем основ- основной матрицы, отличным от нуля F8). 2. Отыскание всех решений общей линейной системы G1). 3. Свойства совокупности решений однородной системы G3). 4. Заключительные замечания о реше- решении линейных систем G8). Глава 4. Евклидовы пространства 80 § 1. Вещественное евклидово пространство и его простейшие свойства 80 1. Определение вещественного евклидова пространства (80). 2. Простейшие свойства произвольного евклидова простран- пространства (83). §2. Ортонормированный базис конечномерного евклидова пространства 87 1. Понятие ортонормированного базиса и его существование (87). 2. Свойства ортонормированного базиса (89). 3. Разложение n-мерного евклидова пространства на прямую сумму подпро- подпространства и его ортогонального дополнения (91). 4. Изоморфизм n-мерных евклидовых пространств (92). §3. Комплексное евклидово пространство 93 1. Определение комплексного евклидова пространства (93). 2. Неравенство Коши-Буняковского. Понятие нормы (95). 3. Ортонормированный базис и его свойства (96). §4. Метод регуляризации для отыскания нормального решения линей- линейной системы 97 Глава 5. Линейные операторы 104 § 1. Понятие линейного оператора. Основные свойства 104 1. Определение линейного оператора A04). §2. Матричная запись линейных операторов 111 1. Матрицы линейных операторов в заданном базисе линейного пространства V A11). 2. Преобразование матрицы линейного опе- оператора при переходе к новому базису A13). 3. Характеристический многочлен линейного оператора A15).
ОГЛАВЛЕНИЕ § 3. Собственные значения и собственные векторы линейных операторов 116 §4. Линейные и полуторалинейные формы в евклидовом пространстве 118 1. Специальное представление линейной формы в евклидовом про- пространстве A18). 2. Полуторалинейные формы в евклидовом про- пространстве. Специальное представление таких форм A19). §5. Линейные самосопряженные операторы в евклидовом пространстве 122 1. Понятие сопряженного оператора A22). 2. Самосопряженные операторы. Основные свойства A23). 3. Норма линейного опера- оператора A25). 4. Дальнейшие свойства самосопряженных операто- операторов A26). 5. Спектральное разложение самосопряженных операто- операторов. Теорема Гамильтона-Кэли A32). 6. Положительные операто- операторы. Корни га-й степени из оператора A33). §6. Приведение квадратичной формы к сумме квадратов 135 §7. Унитарные и нормальные операторы 137 §8. Канонический вид линейных операторов 141 §9. Линейные операторы в вещественном евклидовом пространстве. . . 145 1. Общие замечания A45). 2. Ортогональные операторы A50). Глава 6. Итерационные методы решения линейных систем и задач на собственные значения 154 § 1. Итерационные методы решения линейных систем 155 I. Метод простой итерации (метод Якоби) A55). 2. Общий неяв- неявный метод простой итерации A58). 3. Модифицированный ме- метод простой итерации A64). 4. Метод Зейделя A66). 5. Метод верхней релаксации A67). 6. Случай несимметричной матрицы А A68). 7. Итерационный метод П.Л.Чебышева A68). §2. Решение полной проблемы собственных значений методом враще- вращений 172 Глава 7. Билинейные и квадратичные формы 178 § 1. Билинейные формы 178 1. Понятие билинейной формы A78). 2. Представление билиней- билинейной формы в конечномерном линейном пространстве A79). 3. Пре- Преобразование матрицы билинейной формы при переходе к новому базису. Ранг билинейной формы A80). §2. Квадратичные формы 182 §3. Приведение квадратичной формы к сумме квадратов 184 1. Метод Лагранжа A84). 2. Метод Якоби A86). §4. Закон инерции квадратичных форм. Классификация квадратичных форм 189 1. Закон инерции квадратичных форм A89). 2. Классификация квадратичных форм A91). 3. Критерий Сильвестра знакоопреде- знакоопределенности квадратичной формы A92).
ОГЛАВЛЕНИЕ §5. Полилинейные формы 194 §6. Билинейные и квадратичные формы в евклидовом пространстве . . 195 1. Предварительные замечания A96). 2. Приведение квадратичной формы к сумме квадратов в ортогональном базисе A96). 3. Одно- Одновременное приведение двух квадратичных форм к сумме квадратов в линейном пространстве A97). 4. Экстремальные свойства квад- квадратичной формы A98). §7. Гиперповерхности второго порядка 201 1. Понятие гиперповерхности второго порядка B01). 2. Парал- Параллельные переносы в евклидовом пространстве. Преобразования ор- тонормированных базисов в ортонормированные B02). 3. Преоб- Преобразование общего уравнения гиперповерхности второго порядка при параллельном переносе B04). 4. Преобразование общего урав- уравнения гиперповерхности второго порядка при переходе от орто- нормированного базиса к ортонормированному B06). 5. Инвари- Инварианты общего уравнения гиперповерхности второго порядка B07). 6. Центр гиперповерхности второго порядка B09). 7. Стандартное упрощение любого уравнения гиперповерхности второго порядка путем преобразования ортонормированного базиса B10). 8. Упро- Упрощение уравнения центральной гиперповерхности второго порядка. Классификация центральных гиперповерхностей B11). 9. Упроще- Упрощение уравнения нецентральной гиперповерхности второго порядка. Классификация нецентральных гиперповерхностей B13). Глава 8. Тензоры 217 § 1. Преобразование базисов и координат 217 1. Определители Грама B17). 2. Взаимные базисы. Ковариантные и контравариантные координаты векторов B18). 3. Преобразова- Преобразования базиса и координат B21). §2. Понятие тензора. Основные операции над тензорами 223 1. Понятие тензора B23). 2. Примеры тензоров B24). 3. Основ- Основные операции над тензорами B27). §3. Метрический тензор. Основные операции векторной алгебры в тен- тензорных обозначениях 231 1. Понятие метрического тензора в евклидовом пространстве B31). 2. Операция поднятия и опускания индексов с помощью метриче- метрического тензора B32). 3. Ортонормированные базисы в Еп B34). 4. Дискриминантный тензор B36). 5. Ориентированный объ- объем B37). 6. Векторное произведение B38). §4. Метрический тензор псевдоевклидова пространства 239 1. Понятие псевдоевклидова пространства и метрического тензо- тензора псевдоевклидова пространства B39). 2. Галилеевы координаты. Преобразования Лоренца B41). 3. Преобразования Лоренца про- пространства ЕAK) B42). §5. Тензор момента инерции 244
ОГЛАВЛЕНИЕ Глава 9. Элементы теории групп 246 § 1. Понятие группы. Основные свойства групп 246 1. Законы композиции B46). 2. Понятие группы. Некоторые свойства групп B46). 3. Изоморфизм групп. Подгруппы B50). 4. Смежные классы. Нормальные делители B51). 5. Гомоморфиз- Гомоморфизмы. Фактор-группы B52). §2. Группы преобразований 256 1. Невырожденные линейные преобразования B56). 2. Группа линейных преобразований B57). 3. Сходимость элементов в груп- группе GL(n) B58). 4. Группа ортогональных преобразований B59). 5. Некоторые дискретные и конечные подгруппы ортогональной группы B61). 6. Группа Лоренца B63). 7. Унитарные груп- группы B66). §3. Представления групп 266 1. Линейные представления групп. Терминология B67). 2. Матри- Матрицы линейных представлений. Эквивалентные представления B67). 3. Приводимые и неприводимые представления B68). 4. Характе- Характеры B69). 5. Примеры представлений групп B71). Предметный указатель 274
Предисловие Эта книга возникла в результате переработки курса лекций, читав- читавшихся авторами в МГУ. Отметим некоторые особенности изложения. Изложение начинается с изучения матриц и определителей, причем определитель п-го порядка вводится по индукции через определитель (п - 1)-го порядка с помощью формулы разложения по первой строке. При этом легко доказывается теорема о разложении по любой строке и по любому столбцу (схема доказательства этой теоремы оказывается совершенно аналогичной схеме доказательства теоремы Лапласа). Тра- Традиционное определение детерминанта (определителя) непосредственно через его элементы является простым следствием данного в этой книге определения. Изучению линейных систем предшествует теория линейных про- пространств и преобразований базисов и координат векторов в таких пространствах. При изучении линейных систем мы сразу же знакомим читателя не только с обычной, но и с матричной формой записи системы и вывода формул Крамера. Изучение вещественных и комплексных евклидовых пространств завершается доказательством теоремы А.Н. Тихонова об отыскании нормального решения линейной системы. При изучении линейных операторов излагаются все основные аспек- аспекты спектральной теории в конечномерных евклидовых пространствах. Теорема о приведении матрицы к жордановой форме доказывается с помощью предложенного А.Ф. Филипповым короткого метода, осно- основанного на индукции. Книга содержит специальную главу, посвященную итерационным методам, в которой с единой точки зрения рассматриваются важнейшие итерационные методы решения линейных систем (явный и неявный методы простой итерации, метод Зейделя, метод верхней релаксации) и устанавливаются условия сходимости этих методов. Для общего неявного метода простой итерации выясняются установленные А. А. Са- Самарским условия получения наиболее быстрой сходимости. Приводится доказательство сходимости метода вращений для решения полной про- проблемы собственных значений. Изложение теории билинейных и квадратичных форм завершается приведением к каноническому виду уравнений гиперповерхностей вто- второго порядка в n-мерном пространстве. При изучении тензоров, наряду с традиционным материалом, излагается важная для приложений тен- тензорная форма записи основных операций векторной алгебры. Здесь же даются понятия псевдоевклидова пространства, галилеевых координат и преобразований Лоренца.
ПРЕДИСЛОВИЕ 11 Книга завершается изложением элементов теории групп и их пред- представлений. Следует отметить, что данная книга примыкает к выпуску «Анали- «Аналитическая геометрия», хотя и может читаться независимо от него. Авторы приносят глубокую благодарность А.Н. Тихонову и А. Г. Свешникову за большое количество ценных замечаний, Ш.А. Алимову, вклад которого в эту книгу далеко вышел за рамки обычного редактирования, Л. Д. Кудрявцеву, С. А. Ломову и особенно А. А. Самарскому за весьма полезные критические замечания и ценные советы, Е.С. Николаеву, Д. Д. Соколову и Е.В. Шикину за большую помощь при написании некоторых разделов этой книги. 30 января 1974 г. В. Ильин, Э. Лозняк
Введение В этой книге мы будем иметь дело с внешне различными объ- объектами: 1) с матрицами (или прямоугольными таблицами из чисел), 2) с алгебраическими формами, включающими в себя так называемые линейные, билинейные и квадратичные формы, 3) с так называемыми линейными (и, в частности, евклидовыми) пространствами и с линей- линейными преобразованиями в таких пространствах. Элементарные представления об этих объектах читатель имеет из курса аналитической геометрии. В самом деле, в курсе аналитической геометрии изучались квадратные матрицы второго и третьего порядков и отвечающие этим матрицам определители. Линейная и квадратич- квадратичная формы представляют собой соответственно однородную линейную и однородную квадратичную функции нескольких независимых пере- переменных (например, координат вектора). Примером линейного простран- пространства может служить совокупность всех геометрических векторов на плоскости (или в пространстве) с заданными операциями сложения этих векторов или умножения их на числа. Если для совокупности таких векторов задано еще и скалярное произведение, то мы придем к понятию евклидова пространства. Примером линейного преобразова- преобразования в таком пространстве может служить переход от одного декартова прямоугольного базиса к другому. Несмотря на внешнее различие, перечисленные совокупности объ- объектов тесно связаны между собой: большинство утверждений допус- допускают равносильную формулировку для каждой из этих совокупностей. Наиболее отчетливо эта связь выявляется при изучении произвольных линейных и евклидовых пространств (и линейных преобразований в та- таких пространствах). Однако более конкретная, матричная трактовка результатов непо- непосредственно связана с фактическими вычислениями (и, в частности, с решением линейных систем уравнений). Именно поэтому мы начина- начинаем наше рассмотрение с изучения матриц и неоднократно возвращаем- возвращаемся впоследствии к матричной трактовке результатов.
Глава 1 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ В этой главе изучаются таблицы из чисел, называемые матрицами и играющие в дальнейшем важнейшую роль. Здесь вводятся основные операции над матрицами и детально изучаются свойства так называе- называемых определителей, являющихся основной числовой характеристикой квадратных матриц. § 1. Матрицы 1. Понятие матрицы. Матрицей называется прямоугольная таблица из чисел, содержащая некоторое количество т строк и некоторое количество п столбцов. Числа тип называются порядками матрицы. В случае, если т = = п, матрица называется квадратной, а число т = п — ее порядком. В дальнейшем для записи матрицы будут применяться либо сдво- сдвоенные черточки, либо круглые скобки: аи 0-21 «12 «22 «i ИЛИ «ml «m2 ••• Cimn \«ml «m2 ••• Впрочем, для краткого обозначения матрицы часто будет использо- использоваться либо одна большая латинская буква (например, А), либо символ \\a>ij\\, а иногда и с разъяснением: А = ||а^-|| = {aij) (г = 1, 2,..., га; Числа aij, входящие в состав данной матрицы, называются ее элементами. В записи а^- первый индекс г означает номер строки, а второй индекс j — номер столбца. В случае квадратной матрицы «и «21 «12 «22 «In «2гг «nl «п2 A.1) вводятся понятия главной и побочной диагоналей. Главной диагональю матрицы A.1) называется диагональ а\\п22- --апп, идущая из левого верхнего угла этой матрицы в правый нижний ее угол. Побочной диагональю той же матрицы называется диагональ ап\а^п_щ ••• а\п, идущая из левого нижнего угла в правый верхний угол.
14 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [гл. 1 2. Основные операции над матрицами и их свойства. Прежде всего договоримся считать две матрицы равными, если эти матрицы имеют одинаковые порядки и все их соответствующие элементы совпа- совпадают. Перейдем к определению основных операций над матрицами. а) Сложение матриц. Суммой двух матриц А = ||а^-|| (г = 1, 2,..., га; j = 1, 2,... , га) и В = \\bij\\ (г = 1, 2,..., га; j = 1, 2,..., га) одних и тех же порядков гаг и га называется матрица С = ||с^|| (г = 1, 2,..., гаг; j = 1, 2,..., га) тех же порядков гаг и га, элементы с^- которой равны (г = 1, 2,..., га; j = 1, 2,..., га). A.2) Для обозначения суммы двух матриц используется запись С = А + В. Операция составления суммы матриц называется их сложением. Итак, по определению аи а\п ami CLm2 ^22 (аи (a2i (ai2 + 612) (ain (a2n Из определения суммы матриц, а точнее, из формулы A.2), непо- непосредственно вытекает, что операция сложения матриц обладает те- теми же свойствами, что и операция сложения вещественных чисел, а именно: 1) переместительным свойством: А + В = В + А; 2) сочетательным свойством: (А + В) + С = А + (Б + С). Эти свойства позволяют не заботиться о порядке следования слага- слагаемых матриц при сложении двух или большего числа матриц. б) Умножение матрицы на число. Произведением мат- матрицы А = \\cLij\\ (г = 1, 2,..., га; j = 1, 2,..., га) на вещественное число А называется матрица С = ||с^|| (г = 1, 2,..., гаг; j = 1, 2,... ..., га), элементы с^ которой равны ij = \ciij (г = 1, 2,..., гаг; j = 1, 2,..., га). A.3) Для обозначения произведения матрицы на число используется запись С = ХА или С = АХ. Операция составления произведения матрицы на число называется умножением матрицы на это число. Непосредственно из формулы A.3) ясно, что умножение матрицы на число обладает следующими свойствами: 1) сочетательным свойством относительно числового множителя:
§ 1 ] МАТРИЦЫ 15 2) распределительным свойством относительно суммы матриц: \(А + В) = ХА + ХВ; 3) распределительным свойством относительно суммы чисел: (А + //)Л = ХА -\- fj,A. Замечание. Разностью двух матриц А и В одинаковых поряд- порядков тип естественно назвать такую матрицу С тех же порядков га и п, которая в сумме с матрицей В дает матрицу А. Для обозначения разности двух матриц используется естественная запись: С = А — В. Очень легко убедиться в том, что разность С двух матриц А и В может быть получена по правилу С = А + (— \)В. в) Перемножение матриц. Произведением матрицы А = = \\dij\\ (г = 1, 2,..., га; j = 1, 2,..., п), имеющей порядки, соответ- соответственно равные га и п, на матрицу В = \\bij\\ (г = 1, 2,..., п; j = = 1, 2,..., р), имеющую порядки, соответственно равные пир, назы- называется матрица С = \\cij\\ (г = 1, 2,..., га; j = 1, 2,..., р), имеющая порядки, соответственно равные га и р, и элементы Cij, определяемые формулой п cij=J2aikbkj (г = 1, 2,..., га; j = 1, 2,..., р). A.4) к=\ Для обозначения произведения матрицы А на матрицу В использу- используют запись С = А - В. Операция составления произведения матрицы А на матрицу В называется перемножением этих матриц. Из сформулированного выше определения вытекает, что матрицу А можно умножить не на всякую матрицу В: необходимо, чтобы число столбцов матрицы А было равно числу строк матрицы В. В частности, оба произведения А • В и В - А можно определить лишь в том случае, когда число столбцов А совпадает с числом строк Б, а число строк А совпадает с числом столбцов В. При этом обе матрицы А - В и В - А будут квадратными, но порядки их будут, вообще говоря, различными. Для того чтобы оба произведения А • В и В • А не только были определены, но и имели одинаковый порядок, необходимо и достаточно, чтобы обе матрицы Аи В были квадратными матрицами одного и того же порядка. Формула A.4) представляет собой правило составления элементов матрицы С, являющейся произведением матрицы А на матрицу В. Это правило можно сформулировать и словесно: элемент Cij, стоящий на пересечении г-й строки и у го столбца матрицы С = А • В, равен сумме попарных произведений соответствующих элементов i-й строки матрицы А и у го столбца матрицы В. В качестве примера применения указанного правила приведем фор- формулу перемножения квадратных матриц второго порядка | Ь\\ «22 ( ) («21^12 + «22^22) |
\6 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ ГЛ. 1 Из формулы A.4) вытекают следующие свойства произведения мат- матрицы А на матрицу В: 1) сочетательное свойство: (АВ)С = А(ВС); 2) распределительное относительно суммы матриц свойство: (А + В)С = АС + ВС или А(В + С) = АВ + АС. Распределительное свойство сразу вытекает из формул A.4) и A.2), а для доказательства сочетательного свойства достаточно заметить, что если А = \\aij\\ (г = 1, 2,..., га; j = 1, 2,..., n), B = \\bjk\\ (j = I, 2,... ..., п; Л = 1, 2,..., p), С = ||сы|| (/с = 1, 2,..., р; / = 1, 2,..., г), то элемент du матрицы (АВ)С в силу A.4) равен du = ^ ( Р \ а элемент dfu матрицы А(ВС) равен dfu = J^ a^-1 ^bjkCki), но тогда равенство di/ = d'u вытекает из возможности изменения порядка сум- суммирования относительно j и к. Вопрос о перестановочном свойстве произведения матрицы А на матрицу В имеет смысл ставить лишь для квадратных матриц А и В одинакового порядка (ибо, как указывалось выше, только для таких матриц А и В оба произведения АВ и В А определены и являются матрицами одинаковых порядков). Элементарные примеры показывают, что произведение двух квадратных матриц одинакового порядка не обладает, вообще говоря, перестановочным свойством. В самом деле, если положить А = || п п ||, В = |L q II, то АВ = 0 0 О О О 1 || ' Здесь мы укажем, однако, важные частные случаи, в которых справедливо перестановочное свойство 0 . Среди квадратных матриц выделим класс так называемых диа- диагональных матриц, у каждой из которых элементы, расположенные вне главной диагонали, равны нулю. Каждая диагональная матрица порядка п имеет вид dx 0 ... О D= ° * 0 0 ... dn где d\, d2,..., dn — какие угодно числа. Легко видеть, что если все эти числа равны между собой, т. е. d\ = d<i = ... = dn = d, то для любой квадратной матрицы А порядка п справедливо равенство AD = DA. В самом деле, обозначим символами Cij и cf{j элементы, стоящие на пересечении г-й строки и j-ro столбца матриц AD и DA соответствен- соответственно. Тогда из равенства A.4) и из вида матрицы D получим, что Cij = CLijdj = CLijd, C^ = didij = ddij, A.6) т.е. с^ = cf{j. l) Две матрицы, для произведения которых справедливо перестановочное свойство, принято называть коммутирующими.
МАТРИЦЫ 17 Среди всех диагональных матриц A.5) с совпадающими элемента- элементами d\ = dz = ... = dn особо важную роль играют две матрицы. Первая из этих матриц получается при d = 1, называется единичной матрицей п-го порядка и обозначается символом Е. Вторая матрица получается при d = 0, называется нулевой матрицей п-го порядка и обозначается символом О. Таким образом, Е = 1 О О 1 О О 1 0 = о о о о о о о В силу доказанного выше АЕ = ЕА и АО = О А. Более того, из формул A.6) очевидно, что АО = ОА = О. A.7) Первая из формул A.7) характеризует особою роль единичной мат- матрицы Е, аналогичную той роли, которую играет число 1 при пере- перемножении вещественных чисел. Что же касается особой роли нулевой матрицы О, то ее выявляет не только вторая из формул A.7), но и элементарно проверяемое равенство О А + О = О + А = А. В заключение заметим, что понятие нулевой матрицы можно вво- вводить и для неквадратных матриц (нулевой называют любую матрицу, все элементы которой равны нулю). 3. Блочные матрицы. Предположим, что некоторая матрица А = = \\a,ij\\ при помощи горизонтальных и вертикальных прямых разбита на отдельные прямоугольные клетки, каждая из которых представляет собой матрицу меньших размеров и называется блоком исходной мат- матрицы. В таком случае возникает возможность рассмотрения исходной матрицы А как некоторой новой (так называемой блочной) матри- матрицы А = ||^4а/з||, элементами Аар которой служат указанные блоки. Указанные элементы мы обозначаем большой латинской буквой, чтобы подчеркнуть, что они являются, вообще говоря, матрицами, а не чис- числами и (как обычные числовые элементы) снабжаем двумя индексами, первый из которых указывает номер «блочной» строки, а второй — номер «блочного» столбца. Например, матрицу А = «и «21 «31 пах «51 «12 Я-22 аз2 CLA2 а>Ь2 &2Ъ азз «14 «24 «34 «44 «54 ; «15 • «25 : «35 : «45 ; «55 «16 «26 «36 «46 «56 О Это равенство является прямым следствием формулы A.2).
18 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [гл. 1 можно рассматривать как блочную матрицу А = тами которой служат следующие блоки: АХ элемен- «21 «31 «41 «51 «12 «22 «32 «42 «52 «13 «23 «33 «43 «53 «14 «24 «34 «44 «54 «15 «16 «25 «26 «35 «45 «55 «36 «46 «56 42 = Замечательным является тот факт, что основные операции с блоч- блочными матрицами совершаются по тем же правилам, по которым они совершаются с обычными числовыми матрицами, только в роли эле- элементов выступают блоки. В самом деле, элементарно проверяется, что если матрица А = = \\cLij\\ является блочной и имеет блочные элементы Аар, то при том же разбиении на блоки матрице ХА = ||Аа^-|| отвечают блочные элементы \Аар 0 . Столь же элементарно проверяется, что если матрицы Aw В имеют одинаковые порядки и одинаковым образом разбиты на блоки, то сумме матриц А и В отвечает блочная матрица с элементами Сар = Аар + + Вар (здесь Аар и Вар — блочные элементы матриц А и В). Пусть, наконец, А и В — две блочные матрицы такие, что число столбцов каждого блока Аар равно числу строк блока Вр1 (так что при любых а, /3 и 7 определено произведение матриц АарВр7). Тогда произведение С = А В представляет собой матрицу с элементами Са7, определяемыми формулой Для доказательства этой формулы достаточно расписать левую и пра- правую ее части в терминах обычных (числовых) элементов матриц Aw В (предоставляем это сделать читателю). В качестве примера применения блочных матриц остановимся на понятии так называемой прямой суммы квадратных матриц. Прямой суммой двух квадратных матриц А и В порядков тип соответственно называется квадратная блочная матрица С порядка II А О II т + п, равная С = \\ q „ • Для обозначения прямой суммы мат- матриц А и В используется запись С = А 0 В. Из определения прямой суммы матриц А и В очевидно, что эта сумма, вообще говоря, не обладает перестановочным свойством. Од- Однако элементарно проверяется справедливость сочетательного свой- свойства: (А 0 В) 0 С = А 0 (В 0 С). С помощью свойств операций над блочными матрицами легко про- проверяются следующие формулы, устанавливающие связь между опера- *) При этом блочные элементы \Аар сами вычисляются по правилу умно- умножения матрицы Aaj3 на число Л.
§2] ОПРЕДЕЛИТЕЛИ 19 цией прямого суммирования и операциями обычного сложения и пере- перемножения матриц: (лт е ап) + (вт е вп) = (Ат + вт) е (Ап + вп), (Ат 0 Ап) (Вт 0 Яп) = АтВт 0 ЛПБП (в этих формулах Ат и Бт — произвольные квадратные матрицы по- порядка т, а Ап и Вп — произвольные квадратные матрицы порядка п). Проверку этих формул мы предоставляем читателю. § 2. Определители Целью настоящего параграфа является построение теории опреде- определителей любого порядка п. Хотя читатель (из курса аналитической геометрии) уже знаком с определителями второго и третьего порядков, мы будем вести изложение так, чтобы избежать каких-либо ссылок. Знакомство с определителями второго и третьего порядков разве лишь облегчит восприятие излагаемого ниже материала. 1. Понятие определителя. Рассмотрим произвольную квадратную матрицу любого порядка п: А = аи «21 Q>n\ A.8) С каждой такой матрицей свяжем вполне определенную численную характеристику, называемую определителем, соответствующим этой матрице. Если порядок п матрицы A.8) равен единице, то эта матрица состоит из одного элемента аи и определителем первого порядка, соответствующим такой матрице, мы назовем величину этого элемента. Если далее порядок п матрицы A.8) равен двум, т.е. если эта матрица имеет вид \\а аЦ A.9) an I a2i 0,22 то определителем второго порядка, соответствующим такой матрице, назовем число, равное а\\а^ — о>\2<*>2\ и обозначаемое одним из симво- символов О А = det A = 0,21 «22 . Итак, по определению Д = det A = an a22 A.10) Формула A.10) представляет собой правило составления определи- определителя второго порядка по элементам соответствующей ему матрицы. Словесная формулировка этого правила такова: определитель второго порядка, соответствующий матрице A.9), равен разности произведения 1) В отличие от матрицы для обозначения определителя употребляют не сдвоенные, а одинарные черточки.
20 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [гл. 1 элементов, стоящих на главной диагонали этой матрицы, и произведе- произведения элементов, стоящих на побочной ее диагонали ). В дальнейшем изложении мы будем говорить об элементах, стро- строках или столбцах определителя, подразумевая под этими терминами соответственно элементы, строки или столбцы отвечающей этому опре- определителю матрицы. Перейдем теперь к выяснению понятия определителя любого поряд- порядка п, где п ^ 2. Понятие такого определителя мы введем индуктивно, считая, что нами уже введено понятие определителя порядка п — 1, соответствующего произвольной квадратной матрице порядка п — 1. Договоримся называть минором любого элемента aij матри- матрицы п-го порядка A.8) определитель порядка п—\, соответствую- соответствующий той матрице, которая получается из матрицы A.8) в резуль- результате вычеркивания i-й строки и j-го столбца (той строки и того столбца, на пересечении которых стоит элемент а^). Минор элемен- элемента aij будем обозначать символом Mj. В этом обозначении верхний индекс обозначает номер строки, нижний — номер столбца, а черта над М означает, что указанные строка и столбец вычеркиваются. Определителем порядка п, соответствующим матрице A.8), п назовем число, равное ^ и обозначаемое символом Д = det А = аи 0,21 а\п A.11) Итак, по определению А = det A = а\\ 0,21 A.12) Формула A.12) представляет собой правило составления определителя порядка п по элементам первой строки соответствующей ему матрицы и по минорам Mj элементов первой строки, являющимся определите- определителями порядка п — 1. Заметим, что при п = 2 правило A.12) в точности совпадает с пра- правилом A.10), ибо в этом случае миноры элементов первой строки имеют вид: М/ = а22, М\ = а^\. Естественно возникает вопрос, нельзя ли использовать для получе- получения величины определителя A.11) элементы и отвечающие им миноры х) Напомним, что главной диагональю квадратной матрицы называется диагональ, идущая из левого верхнего в правый нижний угол (т. е. в случае матрицы A.9) — апагг), а побочной — диагональ, идущая из левого нижнего в правый верхний угол (т.е. в случае матрицы A.9) — cl2\cl\2)-
§2] ОПРЕДЕЛИТЕЛИ 2j_ не первой, а произвольной г-й строки матрицы A.8). Ответ на этот вопрос дает следующая основная теорема. Теорема 1.1. Каков бы ни был номер строки г (г = 1, 2,..., п), для определителя п-го порядка A.11) справедлива формула О ?1)*+''а0-М;, A.13) называемая разложением этого определителя по г-й строке. Замечание. Подчеркнем, что в этой формуле показатель степе- степени, в которую возводится число (-1), равен сумме номеров строки и столбца, на пересечении которых стоит элемент а^-. Доказательство теоремы 1.1. Формулу A.13) нужно дока- доказать лишь для номеров г = 2, 3,..., п 2). При п = 2 (т. е. для определи- определителя второго порядка) эту формулу нужно доказать лишь для номера г = 2, т. е. при п = 2 нужно доказать лишь формулу Д = Справедливость этой последней формулы сразу вытекает из выра- выражений для миноров матрицы A.9) М\ = а\2, М\ = an, в силу которых правая часть этой формулы совпадает с правой частью A.10). Итак, при п = 2 теорема доказана. Доказательство формулы A.13) для произвольного п > 2 проведем по индукции, т. е. предположим, что для определителя порядка п — 1 справедлива формула вида A.13) разложения по любой строке, и, опираясь на это, убедимся в справедливости формулы A.13) для опре- определителя порядка п. При доказательстве нам понадобится понятие миноров матри- матрицы A.8) порядка п — 2. Определитель порядка п - 2, соответствующий той матрице, которая получается из матрицы A.8) в результате вычер- вычеркивания двух строк с номерами zi и z2 и двух столбцов с номерами j\ и j*2 называется минором (п — 2)-го порядка и обозначается симво- символом М)\\. Определитель гг-го порядка А вводится формулой A.12), причем в этой формуле каждый минор Мх- является определителем поряд- порядка га— 1, для которого, по предположению, справедлива формула ви- вида A.13) разложения по любой строке. Фиксировав любой номер г (г = 2, 3,..., га), разложим в форму- формуле A.12) каждый минор Mj no г-й строке основного определите- определителя A.11) (в самом миноре Мх- эта строка будет (г — 1)-й). *) По смыслу теоремы п ^ 2. ) Ибо при г = 1 правая часть A.13) по определению равна det A.
22 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ ГЛ. 1 В результате весь определитель А окажется представленным в виде некоторой линейной комбинации 0 миноров (п — 2)-го порядка М ?? с несовпадающими номерами j и к, т.е. в виде 2) О-14) Для вычисления множителей $j/, заметим, что минор М ?? получается в результате разложения по (г — 1)-й строке 3) только следующих двух миноров (п — \)-го порядка, отвечающих элементам первой строки матрицы A.8): минора Mj и минора М^ (ибо только эти два минора элементов первой строки содержат все столбцы мино- Ра М}1). _ _ В разложениях миноров Mj и М^ по указанной (г — 1)-й строке выпишем только слагаемые, содержащие минор МД (остальные не интересующие нас слагаемые обо_значим многоточием). Учитывая при этом, что элемент а^ минора Mj стоит на пересечении (г — 1)-й строки и (к — 1)-го столбца этого минора 4), а элемент aij минора М\ стоит на пересечении (г — 1)-й строки и j-ro столбца этого минора 5), мы получим Щ = {-lf-l^k-^aikM^k + ..., A.15) Вставляя A.15) и A.16) в правую часть A.12) и собирая коэффи- коэффициент при Mjl, мы получим, что множитель djk в равенстве A.14) имеет вид Для завершения доказательства теоремы покажем, что и правая часть A.13) равна сумме, стоящей в правой части A.14), с теми же самыми значениями A.17) для fij^. Для этого в правой части A.13) разложим каждый минор (п — 1)-го порядка Mj по первой строке. В результате вся правая часть A.13) представится в виде линейной комбинации с некоторыми 1) Напомним, что линейной комбинацией каких-либо величин называется сумма произведений этих величин на некоторые вещественные числа. 2) Так как минор Mlj\ совпадает с М^-, то мы переберем все миноры (п — 2)-го порядка с данными номерами строк 1 иг, изменяя j от 1 до п и для каждого j беря все возможные к < j. 3) В матрице A.8) эта строка будет г-й. 4) Ибо в миноре Mj отсутствует первая строка и j-й столбец матрицы A.8) и j < к. _ 5) Ибо в миноре Ml отсутствует первая строка матрицы A.8), а единствен- единственный отсутствующий в этом миноре столбец матрицы A.8) имеет номер к > j.
§2] ОПРЕДЕЛИТЕЛИ 23 коэффициентами $j/, тех же самых миноров Mjl j=\k<j и нам остается вычислить множители djk и убедиться в справедливо- справедливости для них формулы A.17). Для этого заметим, что минор Mjl получается в результате раз- разложения по первой строке только следующих двух миноров (п — 1)-го порядка, отвечающих элементам г-й строки матрицы A.8): минора Mj и минора Ml (ибо только эти два минора элементов г-й строки содержат все столбцы минора М ??). В разложениях миноров Mj и М^ по первой строке выпишем только слагаемые, содержащие минор М??: (остальные не интересу- интересующие нас слагаемые обозначим многоточием). Учитывая при этом, что элемент а\к минора Mj стоит на пересечении первой строки и (к — 1)-го столбца 0 этого минора, а элемент a\j минора М^ стоит на пересечении первой строки и j-ro столбца 2) этого минора, мы получим Mj (lI+(fc1>MJ* A.19) } A.20) Вставляя A.19) и A.20) в правую часть A.13) и собирая коэффи- коэффициент при Mjl, мы получим, что djk в сумме A.18) определяется той же самой формулой A.17), что и в равенстве A.14). Теорема 1.1 доказана. Теорема 1.1 установила возможность разложения определителя п-го порядка по любой его строке. Естественно возникает вопрос о возможности разложения определителя n-го порядка по любому его столбцу. Положительный ответ на этот вопрос дает следующая основная теорема. Теорема 1.2. Каков бы ни был номер столбца j (j = 1, 2,..., п), для определителя п-го порядка A.11) справедлива формула A = detA = ^{-\у+'ацМ], A.21) г=\ называемая разложением этого определителя по j-му столбцу. Доказательство. Достаточно доказать теорему для j = 1, т. е. установить формулу разложения по первому столбцу А = Е(-1)Ж^1М/, A.22) г=\ О Ибо j < k и в миноре Mj отсутствует j-й столбец матрицы A.8). ) Ибо j < к, а у минора Ml отсутствует лишь к-й столбец матрицы A.8).
24 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ ГЛ. 1 ибо если формула A.22) будет установлена, то для доказательства формулы A.21) для любого j = 2, 3,..., п достаточно, поменяв ролями строки и столбцы, дословно повторить схему рассуждений теоремы 1.1. Формулу A.22) установим по индукции. При п = 2 эта формула проверяется элементарно (так как при п = 2 миноры элементов первого столбца имеют вид М\ = а22, М\ = а\2, то при п = 2 правая часть A.22) совпадает с правой частью A.10)). Предположим, что формула разложения по первому столбцу A.22) верна для определителя порядка п - 1 и, опираясь на это, убедимся в справедливости этой формулы для определителя порядка п. С этой целью выделим в правой части формулы A.12) для определи- определителя п-го порядка А первое слагаемое a\\Ml, а в каждом из остальных слагаемых разложим минор (п — 1)-го порядка Mj по первому столбцу. В результате формула A.12) будет иметь вид 3=2 1=2 где ftij — некоторые подлежащие определению коэффициенты. Для вычисления dij заметим, что минор М}*. получается при разложении по первому столбцу только одного из миноров (п — 1)-го порядка, отвечающих первой строке 0 , — минора Mj. Запишем в разложении минора М\ (при j ^ 2) по первому столбцу только то слагаемое, кото- которое содержит минор M/j (остальные не интересующие нас слагаемые обозначим многоточием). Учитывая, что элемент ац минора Mj (при j ^ 2) стоит на пересечении (г — 1)-й строки и первого столбца этого минора, мы получим, что при j > 2 Щ = (-\){1-х)+хапм1] + ... A.24) Вставляя A.24) в правую часть A.12)_(из которой исключено первое слагаемое) и собирая коэффициент при M/j, мы получим, что коэффи- коэффициент dij в формуле A.23) имеет вид „а . — ( 1 V+i + 1/7i п л М О^ " i 7 — V / ^* 17 z 1 • V/ Остается доказать, что и правая часть A.22) равна сумме, стоящей в правой части A.23) с теми же самыми значениями A.25) для i9ij. Для этого в правой части A.22) выделим первое слагаемое a\\Ml, а в каждом из остальных слагаемых разложим минор (п — 1)-го поряд- порядка Ml по первой строке. В результате_правая часть A.22) представится в виде суммы первого слагаемого a\\Ml и линейной комбинации с некоторыми коэффициен- При этом минор М/ предполагается исключенным.
§2] ОПРЕДЕЛИТЕЛИ 25 тами dij миноров (п — 2)-го порядка M/j, т.е. в виде аиЩ + ^^йцЩ, A.26) г=2j=2 и нам остается вычислить множители д^ и убедиться в справедливо- справедливости для них формулы A.25). Для этого заметим, что минор М\г- получается в результате разло- разложения по первой строке только одного из миноров п — 1-го порядка, отвечающих первому столбцу, — минора М\. Запишем в разложении минора М[(при г ^ 2) по первой строке только то слагаемое, которое содержит минор M/j (остальные не интересующие нас слагаемые обо- обозначим многоточием). Учитывая, что элемент a\j, минора М\ стоит на пересечении первой строки и (j - 1)-го столбца этого минора, мы получим, что при г ^ 2 м[ = (-ly+u-'VjM/; +... A.27) Вставляя A.27) в правую часть A.22), из_которой исключено первое слагаемое, и собирая коэффициент при M/j, мы получим, что dij в сумме A.26) определяется той же самой формулой A.25), что и в ра- равенстве A.23). Теорема 1.2 доказана. 2. Выражение определителя непосредственно через его эле- элементы. Установим формулу, выражающую определитель n-го порядка непосредственно через его элементы (минуя миноры). Пусть каждое из чисел а\, а^,..., ап принимает одно из значений 1, 2,..., п, причем среди этих чисел нет совпадающих (в таком случае говорят, что числа а\, с*2, •••, otn являются некоторой перестановкой чисел 1, 2,..., п). Образуем из чисел а\, а2,...,ап все возможные пары aidj и будем говорить, что пара a^aj образует беспорядок, если OLi > olj при г < j. Общее число беспорядков, образованных всеми парами, которые можно составить из чисел а\, аг,---, <^п, обозначим символом N(a\, «2,..., ап)- С помощью метода индукции установим для определителя гг-го порядка A.11) следующую формулу: Д = det A = J2 (~l)N{aua2'-'ап)аа[{аа22 ... аапП A.28) СХ\ , OL2, ..., Oin (суммирование в этой формуле идет по всем возможным перестановкам а\, «2,..., ап чисел 1, 2,..., п; число этих перестановок, очевидно, равно п\). В случае п = 2 формула A.28) элементарно проверяется (в этом случае возможны только две перестановки 1,2 и 2, 1, и, поскольку ЛГA, 2) = О, УУB, 1) = 1, формула A.28) переходит в равенство A.10)). С целью проведения индукции предположим, что формула A.28) при п > 2 справедлива для определителя порядка (п — 1).
26 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ ГЛ. 1 Тогда, записав разложение определителя п-го порядка A.11) по первому столбцу 0 : A = det^= jr (-l)ai+1aaiiM^ A.29) мы можем, в силу предположения индукции, представить каждый минор (п — 1)-го порядка М в виде (суммирование идет по всем возможным перестановкам а2,...,ап (п — 1) чисел, в качестве которых берутся все натуральные числа от 1 до п, за исключением числа а\). Так как из чисел а\, а2,..., ап, кроме пар, образованных из чисел а2,...,ап можно образовать еще только следующие пары а\а2, а\аз,..., а\ап, и поскольку среди чисел «2,..., ап найдется ровно (а\ — 1) чисел, меньших числа а\, то N(a\, a2,..., ап) = = N(a2, ..., ап) + а\ — 1. Отсюда вытекает, что _ /_ j \ N( a2, и, вставляя A.30) в A.29), мы в точности получим формулу A.28). Тем самым вывод формулы A.28) завершен. В заключение заметим, что в большинстве курсов линейной ал- алгебры формула A.28) положена в основу понятия определителя п-го порядка. 3. Теорема Лапласа 2). В этом пункте мы установим замечатель- замечательную формулу, обобщающую формулу разложения определителя п-го порядка по какой-либо его строке. С этой целью введем в рассмотрение миноры матрицы п-го порядка A.8) двух типов. Пусть к — любой номер, меньший п, а i\, 12, •••, ik и Jb J2>--- ..., jk — произвольные номера, удовлетворяющие условиям 1 ^ г\ < < %2 < • • • < ik < П, 1 < Jl < J2 < • • • < jk < П. Миноры первого типа М*1?2'"^ являются определителями поряд- порядка к, соответствующими той матрице, которую образуют элементы матрицы A.8), стоящие на пересечении к строк с номерами i\, гг,... ..., ik и к столбцов с номерами j\, j2,..., jk- Миноры второго типа ^]\}22'")кк являются определителями поряд- порядка п — к, соответствующими той матрице, которая получается из мат- матрицы A.8) в результате вычеркивания к строк с номерами i\, %2,..., ik и к столбцов с номерами j\, J2,..., jk- 1) Индекс, по которому производится суммирование, на этот раз нам удобно обозначить буквой а\. 2)П.С. Лаплас — выдающийся французский астроном, математик и физик A749-1827).
§2] ОПРЕДЕЛИТЕЛИ 27 Миноры второго типа естественно назвать дополнительными по отношению к минорам первого типа. Теорема 1.3 (теорема Лапласа). При любом номере к, меньшем п, и при любых фиксированных номерах строк i\, i^,..., ik таких, что 1 ^ i\ < г^ < • • • < ik ^ п> для определителя п-го порядка A.11) справедлива формула j\,32,-,jk называемая разложением этого определителя по к стро- строкам i\, %2, ..., ik- Суммирование в этой формуле идет по всем возможным значениям индексов j\, J2,..., jk, удовлетворяющим условиям 1 ^ ji < j*2 < ... < jk ^ п- Доказательство. Прежде всего заметим, что формула A.31) является обобщением уже доказанной нами формулы разложения опре- определителя п-го порядка по одной его строке с номером i\, в которую она переходит при к = 1 (при этом минор М^1 совпадает с элемен- элементом a^jj, а минор М^ — это введенный выше минор элемента очи1). Таким образом, при к = 1 формула A.31) доказана. Доказательство этой формулы для любого к, удовлетворяющего неравенствам 1 < к < < п, проведем по индукции, т.е. предположим, что формула A.31) справедлива для (к - 1) строк, и, опираясь на это, убедимся в спра- справедливости формулы A.31) для к строк. Итак, пусть 1 < к < п и фиксированы какие угодно к строк мат- матрицы A.8) с номерами i\, Z2,..., ik, удовлетворяющими условию 1 < ^ i\ < %2 < • • • < ik ^ п- Тогда, по предположению, для (к — 1) строк с номерами i\, i^,..., ik-\ справедлива формула Д = V (_i)^-+^-i+ii+-+ifc-iMili.2jfe-1Mili2jfc-1 A 32) Z^ V / JU2-3k-\ Э\32-Эк-\ v ' ; j\, 32,-, Зк-\ (суммирование идет по всем возможным значениям индексов j\, ... ..., jk-\ удовлетворяющим условиям 1 ^ j\ < J2 <...<jk-\ ^ п). Разложим в формуле A.32) каждый минор ^]\'"]кк~\ по строке, имеющей в матрице A.8) номер ik- В результате весь определитель А будет представлен в виде некоторой линейной комбинации мино- миноров ^]\"]kk~\ljkk c коэффициентами, которые мы обозначим через $j{...jk, т.е. для А будет справедливо равенство О А = ^ &ji...jk ^)\ ")кк> 3\,-,3к и нам остается вычислить коэффициенты ldjl...jk и убедиться в том, что они равны v3\-3k — \Ч тз\-з'к' yi.od) 1) Суммирование в этом равенстве, как и выше, идет по всем возможным значениям индексов j\,..., jk, удовлетворяющим условию 1 ^ j\ <J2 < ... ^ < jk < П.
28 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ ГЛ. 1 С этой целью заметим, что минор (п — к)-го порядка ^)\'")кк по- получается в результате разложения по строке с номером г& только следующих к миноров (п - к + 1)-го порядка 0 : Mil'"ik7l . , E=1, 2,..., к), A.34) Л-.7 А; (без Js) V ' ' ' /' V / ибо каждый из остальных содержащих строку js миноров (п — к + + 1)-го порядка не содержит всех строк и всех столбцов мино- В разложении каждого минора A.34) по строке матрицы A.8) с но- номером if, выпишем только то слагаемое, которое содержит ми- минор ^)\'")кк (остальные не интересующие нас слагаемые обозначим многоточием). Учитывая при этом, что в каждом миноре A.34) элемент o>ikja стоит на пересечении [г& — (к — 1)]-й строки и [js — (s — l)]-ro столбца этого минора 2), мы получим Теперь нам остается учесть, что в формуле A.32) каждый ми- минор A.34) умножается на множитель и после этого суммируется по всем s от 1 до к. Имея также в виду, что (_iJ-2fc-2s = i? мы получим, что [ s=l Замечая, что сумма в квадратных скобках представляет собой разло- разложение минора ^)\'")кк по его последней к-и строке, мы окончательно получим для i?jb..jfc формулу A.33). Теорема Лапласа доказана. Замечание. В полной аналогии с формулой A.32) записывается и выводится формула разложения определителя по каким-либо к его столбцам. 4. Свойства определителей. Ниже устанавливается ряд свойств, которыми обладает произвольный определитель n-го порядка. 1°. Свойство равноправности строк и столбцов. Транс- Транспонированием любой матрицы или определителя называется операция, в результате которой меняются местами строки и столбцы с сохранени- *) Символом М*1'"^^ . х обозначается минор, отвечающий пересечению строк с номерами i\,..., ik-i и всех столбцов с номерами j\,..., jk, за ис- исключением столбца с номером js, а символом A.34) — дополнительный к нему минор. 2) Это вытекает из того, что строке с номером ik предшествует (к — I) строк, а столбцу с номером js предшествует (s — 1) столбцов минора М11'"ъ.к7^ез . ч, к которому минор A.34) является дополнительным.
§2] ОПРЕДЕЛИТЕЛИ 29 ем порядка их следования. В результате транспонирования матрицы А получается матрица, называемая транспонированной по отношению к матрице А и обозначаемая символом А'. В дальнейшем мы договоримся символами |Л|, \В\, \А'\ ... обозна- обозначать определители квадратных матриц А, В, А' ... соответственно. Первое свойство определителя формулируется так: при транспони- транспонировании величина определителя сохраняется, т.е. \А'\ = \А\. Это свойство непосредственно вытекает из теоремы 1.2 (достаточно лишь заметить, что разложение определителя |Л| по первому столбцу тождественно совпадает с разложением определителя \А'\ по первой строке). Доказанное свойство означает полную равноправность строк и столбцов и позволяет нам все последующие свойства устанавливать лишь для строк и быть уверенными в справедливости их и для столбцов. 2°. Свойство антисимметрии при перестановке двух строк (или двух столбцов). При перестановке местами двух строк (или двух столбцов) определитель сохраняет свою абсолют- абсолютную величину, но меняет знак на противоположный. Для определителя второго порядка это свойство проверяется элементарно (из правила A.10) сразу вытекает, что определители аи отличаются лишь знаком). аи «12 7 Считая, что п > 2, рассмотрим теперь определитель n-го порядка A.11) и предположим, что в этом определителе меняются местами две строки с номерами i\ и i2. Записывая формулу Лапласа разложения по этим двум строкам, будем иметь д= ^(-i)ii+i2+^+^Mj^M};;?. A.35) При перестановке местами строк с номерами i\ и i2 каждый опреде- определитель второго порядка ^]\)\ в силу доказанного выше меняет знак на противоположный, а все остальные величины, стоящие под знаком суммы в A.35), совсем не зависят от элементов строк с номерами i\ и i2 и сохраняют свое значение. Тем самым свойство 2° доказано. 3°. Линейное свойство определителя. Будем говорить, что некоторая строка (а\, а2, ... , ап) является линейной комбинацией строк (Ь\, Ъ2,..., Ъп), (с\, с2,..., сп),..., (di, d2,..., dn) с коэффици- коэффициентами А, /х,..., i/, если clj = Xbj + fiCj + ... + vdj для всех j = = 1, 2,..., п. Линейное свойство определителя можно сформулировать так: если в определителе п-го порядка А некоторая i-я строка (аи, ai2,... ... , а\п) является линейной комбинацией двух строк (Ь\, Ъ2,..., Ьп) и (с\, с2,..., сп) с коэффициентами А и [i, то А = AAi + fj,A2, где Ai — определитель, у которого i-я строка равна (b\, b2,..., bn), а все остальные строки те же, что и у А, а А2 — определитель, у которого i-я строка равна (с\, с2,..., сп), а все остальные строки те же, что и у А.
30 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ ГЛ. 1 Для доказательства разложим каждый из трех определителей А, А\ и Д2_гю г-й строке и заметим, что у всех трех определителей все миноры MZj элементов г-й строки одинаковы. Но отсюда следует, что формула А = AAi + /iA2 сразу вытекает из равенств а^ = \bj + /j,cj (j = l,2,...,n). Конечно, линейное свойство справедливо и для случая, когда г-я строка является линейной комбинацией не двух, а нескольких строк. Кроме того, линейное свойство справедливо и для столбцов определи- определителя. Доказанные три свойства являются основными свойствами опреде- определителя, вскрывающими его природу. Следующие пять свойств являются логическими следствиями трех основных свойств. Следствие 1. Определитель с двумя одинаковыми строками (или столбцами) равен нулю. В самом деле, при перестановке двух одинаковых строк, с одной стороны, определитель А не изменится, а с другой стороны, в си- силу свойства 2° изменит знак на противоположный. Таким образом, А = -А, т. е. 2А = 0 или А = 0. Следствие 2. Умножение всех элементов некоторой строки (или некоторого столбца) определителя на число А равносильно умножению определителя на это число А. Иными словами, общий множитель всех элементов некоторой строки (или некоторого столбца) определителя можно вынести за знак этого определителя. (Это свойство вытекает из свойства 3° при /i = 0.) Следствие 3. Если все элементы некоторой строки (или неко- некоторого столбца) определителя равны нулю, то и сам определитель равен нулю. (Это свойство вытекает из предыдущего при А = 0.) Следствие 4. Если элементы двух строк (или двух столб- столбцов) определителя пропорциональны, то определитель равен нулю. (В самом деле, в силу следствия 2, множитель пропорциональности можно вынести за знак определителя, после чего останется опреде- определитель с двумя одинаковыми строками, который равен нулю согласно следствию 1). Следствие 5. Если к элементам некоторой строки (или неко- некоторого столбца) определителя прибавить соответствующие эле- элементы другой строки (другого столбца), умноженные на произволь- произвольный множитель А, то величина определителя не изменится. В самом деле, полученный в результате указанного прибавления определитель можно, в силу свойства 3°, разбить на сумму двух определителей, первый из которых совпадает с исходным, а второй равен нулю, в силу пропорциональности двух строк (или столбцов) и следствия 4. Замечание. Следствие 5, как и линейное свойство, допускает более общую формулировку, которую мы приведем для строк: если к элементам некоторой строки определителя прибавить соответ- соответствующие элементы строки, являющейся линейной комбинацией
§2] ОПРЕДЕЛИТЕЛИ 3j_ нескольких других строк этого определителя {с какими угодно коэффициентами), то величина определителя не изменится. Следствие 5 широко применяется при конкретном вычислении опре- определителей (соответствующие примеры будут приведены в следующем пункте). Прежде чем сформулировать еще одно свойство определителя, вве- введем полезное понятие алгебраического дополнения данного элемента определителя. Алгебраическим дополнением данного элемента aij определите- определителя п-го порядка A.11) назовем число, равное (— 1J+JM*- и обознача- обозначаемое символом Aij. Таким образом, алгебраическое дополнение данного элемента мо- может отличаться от минора этого элемента только знаком. С помощью понятия алгебраического дополнения теоремы 1.1 и 1.2 можно переформулировать так: сумма произведений элементов любой строки (любого столбца) определителя на соответствующие ал- алгебраические дополнения этой строки (этого столбца) равна этому определителю. Соответствующие формулы разложения определителя по г-й строке и по j-му столбцу можно переписать так: п А = ^2 aijAij (для любого г = 1, 2,..., п), A.13/) п A = ^2a,ijAij (для любого j = 1, 2,..., п). A.21х) г=\ Теперь мы можем сформулировать последнее свойство определи- определителя. 4°. Свойство алгебраических дополнений соседних строк (или столбцов). Сумма произведений элементов какой- либо строки (или какого-либо столбца) определителя на соот- соответствующие алгебраические дополнения элементов любой другой строки (любого другого столбца) равна нулю. Доказательство проведем для строк (для столбцов оно проводится аналогично). Записывая подробно формулу A.137) ап A.36) заметим, что поскольку алгебраические дополнения Ац, Ai2,..., Ain не зависят от элементов г-й строки ац, а^,..., а^п, то равенство A.36) является тождеством относительно ац, а^,..., а^п и сохраняется при замене чисел ац, сц2, •••, сцп любыми другими п числами. Заме- Заменив ац, di2,..., a,in соответствующими элементами любой (отличной от г-й) k-й строки ak\, ak2,..., а/сП, мы получим слева в A.36) опре-
32 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [гл. 1 делитель с двумя одинаковыми строками, равный нулю согласно след- следствию 1. Таким образом, Ai2ak2 Ainakn = О (для любых несовпадающих ink). 5. Примеры вычисления определителей. При конкретном вычис- вычислении определителей широко используются формулы разложения по строке или столбцу и следствие 5, позволяющее, не изменяя величины определителя, прибавлять к любой его строке (или столбцу) произ- произвольную линейную комбинацию других его строк (или столбцов). Осо- Особенно удобно использовать формулу разложения по тем строкам (или столбцам), многие элементы которых равны нулю. В частности, если в данной строке отличен от нуля только один элемент, то разложение по этой строке содержит только одно слагаемое и сразу сводит вопрос о вычислении определителя порядка п к вопросу о вычислении опре- определителя порядка (га — 1) (минора, стоящего в указанном слагаемом). Если в данной строке отличны от нуля несколько элементов, отвечающих пересечению этой строки с несколькими столбцами, то, применяя к указанным столбцам следствие 5, мы можем, не изменив определителя, обратить в нуль все элементы данной строки, за исклю- исключением одного. Перейдем к конкретным примерам. Пример 1. Пусть требуется вычислить следующий определитель четвертого порядка: А = Вычитая из первого столбца утроенный последний столбец, будем иметь А = Далее естественно разложить определитель по первому столбцу. В ре- результате получим 8 16 О А = 1 • 17 134 20 43 106 5 Теперь в определителе третьего порядка вычтем из второго столбца удвоенный первый столбец. При этом будем иметь 4 0 60 15 99 8 17 43 83 16 134 106 1 0 20 5 утроенный п 1 0 0 0 99 8 17 43 83 16 134 106 1 0 20 5 А = 8 0 0 17 100 20 43 20 5
§2] ОПРЕДЕЛИТЕЛИ 33 Разлагая, наконец, последний определитель третьего порядка по пер- первой строке, окончательно получим А = 100 20 20 5 = 8E00 - 400) = 800. Пример 2. Вычислим так называемый треугольный определи- определитель, у которого все элементы, лежащие выше главной диагонали, равны нулю аи «21 0 «22 «nl «п2 Разлагая определитель Ап по последнему столбцу, мы получим, что он равен произведению элемента апп на треугольный определитель (п — 1)-го порядка Ап-ь равный An-i = аи «21 о «22 о о Последний определитель мы снова разложим по его последнему столб- столбцу, в результате чего убедимся в том, что он равен произведению элемента a(n_i)(n_i) на треугольный определитель (п — 2)-го поряд- порядка Ап_2- Продолжая аналогичные рассуждения, мы придем к следу- следующему выражению для исходного определителя: Ап = а\\п22 ••• аПп- Итак, треугольный определитель равен произведению элементов, стоящих на его главной диагонали. Замечание 1. Если у определителя А равны нулю все элементы, лежащие ниже главной диагонали, то этот определитель также равен произведению элементов, лежащих на его главной диагонали (убедить- (убедиться в этом можно по схеме, изложенной выше, но примененной не к по- последним столбцам, а к последним строкам; можно и просто произвести транспонирование А и свести этот случай к рассмотренному выше). Аналогичным способом устанавливается, что определитель, у кото- которого равны нулю все элементы, лежащие выше (или ниже) побочной диагонали, равен произведению числа (—1)п(п~1)/2 и всех элементов, лежащих на этой диагонали. Пример 3. Обобщением треугольного определителя второго по- порядка может служить определитель 2п-го порядка следующей блочной А О матрицы в С ' в K0T0P°u Л, В и С — произвольные квадратные матрицы п-го порядка, а О — нулевая квадратная матрица п-го по- порядка. Убедимся в том, что для указанного определителя справедлива 2 Линейная алгебра
34 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [гл. 1 формула О А О В С = \А\\С\. A.37) Привлекая теорему Лапласа, разложим определитель, стоящий в левой части A.37), по первым п строкам. Так как определитель, у которого хотя бы один столбец состоит из нулей, равен нулю, то в формуле разложения A.31) будет отлично от нуля только одно слага- слагаемое, причем это слагаемое (в силу того, что (—l)A+-+n)+A+-+n) = 1) будет как раз равно \А\ \С\. Замечание 2. Аналогичными рассуждениями легко убедиться в справедливости формулы А В С О A.38) (А, В, С и О имеют тот же смысл, что и выше). Для этого следует разложить определитель, стоящий в левой части A.38), по последним п строкам и учесть, что (_n[(n+l) + ...+2n] + [l + ...+n] _ /_j\2nBn+l)/2 _ (_П™. Пример 4. Вычислим теперь так называемый определитель Ван- дермонда 2, ••• , Хп) = 1 X 1 Х2 4 п-\ 1 хп r»n-\ A.39) Вычитая первый столбец из всех последующих, будем иметь О Х\ (Х2 — Х\) . . . (хп А(хь 2,..., хп) = ) Далее естественно произвести разложение по первой строке, в ре- результате чего мы получим Х\) Х\) (жз - х\) (х\ - х\) (Хп - Х\) (х2п - х\) ¦х'{ ч 1) Напомним, что символами \А\, \В\, \С\, ... мы договорились обозначать определители матриц А, В, С, ... соответственно.
§2] ОПРЕДЕЛИТЕЛИ 35 Вычитая теперь из каждой строки предыдущую строку, умножен- умноженную на х\, получим А(х\, х2,..., хп) = (х2 - х\) - х\) — х\) (хп - х\) 2(Х2-Х\) X™ 2(хз-Х\) (хп — Х\) Далее мы можем вынести за знак определителя общий множитель первого столбца, равный (х2 — х\), общий множитель второго столбца, равный (х$ — х\),..., общий множитель (п — 1)-го столбца, равный (хп — х\). В результате получим А(х\, 2,..., хп) = - х\)... (хп -х\) 3,..., хп). Со стоящим в правой части определителем A(a?2, жз, •••, хп) посту- поступим точно так же, как и с А(х\, Х2,..., хп). В результате получим, что , хп) = , • • •, хп). Продолжая аналогичные рассуждения далее, окончательно полу- получим, что исходный определитель A.39) равен хп) = - х\) (хп - - х2) ... (хп - х2) ... (хп - хп-\). 6. Определитель суммы и произведения матриц. Непосредствен- Непосредственно из линейного свойства определителя вытекает, что определитель суммы двух квадратных матриц одного и того же порядка п А = = ||«гjII и В = \\bij\\ равен сумме всех различных определителей порядка п, которые могут получиться, если часть строк (или столбцов) брать совпадающими с соответствующими строками (или столбцами) матрицы А, а остальную часть — совпадающими с соответствующими строками (или столбцами) В. Докажем теперь, что определитель матрицы С, равной произве- произведению квадратной матрицы А на квадратную матрицу Б, равен произведению определителей матриц А и В. Пусть порядок всех трех матриц Л, В и С равен п, и пусть О — нулевая квадратная матрица порядка п, а (— \)Е следующая матрица: -1 О О -1 О О -1 В силу примера 2 из предыдущего пункта определитель матрицы (—\)Е равен числу (— 1)п. Рассмотрим следующие две блочные квадратные матрицы порядка 2п: А (-\)Е А С\ (-l)S О |
36 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [гл. 1 В силу формул A.37) и A.38) из предыдущего пункта, определите- определители этих матриц равны А О (-l)tf В = \А\-\В\, А С (-l)E О Таким образом, достаточно доказать равенство определителей А О (-l)E В А С (-l)E О Подробнее эти два определителя можно записать так: аи 0,91 «12 «22 ... а\п ... а2п 0 0 0 ... 0 ... 0 0 0>п\ -1 0 0 an a2i пп1 -1 0 0 ... -1 ... 0 ... ai2 a22 an2 0 ... -1 ... dnrr 0 0 -1 ain &2n dun 0 0 0 fell 621 bnl СЦ C21 Cnl 0 0 0 .. ^>12 •• 622 ЬП2 •• C12 • C22 Cn2 • 0 . 0 . . 0 bin • Kn cm ¦¦ C2n C-nn .. 0 .. 0 A.40) О О -1 О о о Для того чтобы убедиться в равенстве этих двух определителей, достаточно заметить, что первые п столбцов у этих определителей совпадают, а каждый столбец второго определителя A.40) с номером п п + к (где к = 1, 2,..., п), в силу формулы с^- = J^ aikbkj, получается к=\ в результате прибавления к (п + к)-му столбцу первого определите- определителя A.40) линейной комбинации первых п его столбцов с коэффи- коэффициентами, соответственно равными Ьк\, Ьк2,---, Ькп- Таким образом, определители A.40) равны в силу следствия 5 из п. 3. В заключение заметим, что непосредственно из формулы A.37) _\А О вытекает, что определитель прямой суммы |Л0В| = \'q ^ двух матриц А и В равен произведению определителей этих матриц. 7. Понятие обратной матрицы. Пусть А — квадратная матрица п-го порядка, а Е — единичная квадратная матрица того же порядка (см. п. 2 §1). Матрица В называется правой обратной по отношению к матри- матрице Л, если АВ = Е. Матрица С называется левой обратной по отношению к матри- матрице Л, если С А = Е.
§2] ОПРЕДЕЛИТЕЛИ 37 Так как обе матрицы А и Е являются квадратными матрицами порядка п, то матрицы В и С (при условии, что они существуют) также являются квадратными матрицами порядка п. Убедимся в том, что если обе матрицы В и С существуют, то они совпадают между собой. В самом деле, на основании равенств A.7) (см. п. 2 § 1), соотношений АВ = Е, С А = Е и сочетательного свойства произведения матриц получим С = СЕ = С {А В) = (СА)В = ЕВ = В. Естественно, возникает вопрос об условиях на матрицу А, при выполнении которых для этой матрицы существуют как левая, так и правая обратные матрицы 0 . Теорема 1.4. Для того чтобы для матрицы А существовали ле- левая и правая обратные матрицы, необходимо и достаточно, чтобы определитель det А матрицы А был отличен от нуля. Доказательство. 1) Необходимость. Если для матрицы А существует хотя бы одна из обратных матриц, например В, то из соотношения А • В = Е мы получим, что det А • det В = det Е = 1 2), откуда вытекает, что det А ф 0. 2) Достаточность. Пусть определитель А = det А отличен от нуля. Обозначим, как и выше, символом Aij алгебраические допол- дополнения элементов а^ матрицы А и составим матрицу В, в г-й строке которой стоят алгебраические дополнения г-го столбца матрицы А, поделенные на величину определителя А: В = Аи А АХ2 А А\п А Аъ\ А А22 А А2п А " А Ап2 А " А A.41) Убедимся в том, что эта матрица В является как правой, так и левой обратной по отношению к матрице А. Достаточно доказать, что оба произведения АВ и В А являются единичной матрицей. Для этого достаточно заметить, что у обоих произведений любой элемент, не лежащий на главной диагонали, равен нулю, ибо после выноса множителя 1/А этот элемент равен сумме произведений элементов одной строки (или одного столбца) на соответствующие алгебраические дополнения другой строки (или другого столбца). Что же касается элементов, лежащих на главной диагонали, то у обоих произведений АВ и В А все такие элемен- элементы равны единице в силу того, что сумма произведений элементов *) И, стало быть, эти матрицы совпадают. ) det Е = 1 в силу примера 2 из п. 5 этого параграфа.
38 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ ГЛ. 1 и соответствующих алгебраических дополнений одной строки (одного столбца) равна определителю. Теорема доказана. Замечание 1. Квадратную матрицу А, определитель det А кото- которой отличен от нуля, принято называть невырожденной. Замечание 2. Впредь мы можем опускать термины «левая» и «правая» и говорить просто о матрице В, обратной по отношению к невырожденной матрице А и определяемой соотношениями АВ = = В А = Е. Очевидно также, что свойство быть обратной матрицей взаимно в том смысле, что если В является обратной для А, то А является обратной для В. Матрицу, обратную к матрице А, впредь мы будем обозначать символом А~\ § 3. Теорема о базисном миноре матрицы 1. Понятие линейной зависимости строк. Выше мы уже догово- договорились называть строку О А = (а\, п2, ..., ап) линейной комбинацией строк В = (Ь\, &2, •••, Ьп),..., С = (с\, С2,..., сп), если для некоторых вещественных чисел Л,..., \± справедливы равенства clj = Xbj + ... + fj,Cj (j = 1, 2,..., n). A.42) Указанные п равенств A.42) удобно записать в виде одного равенства А = ЛБ + ... + /хС. A.43) Всякий раз, когда будет встречаться равенство A.43), мы будем понимать его в смысле п равенств A.42). Введем теперь понятие линейной зависимости строк. Определение. Строки А = (а\, а,2,..., ап), В = (Ь\, Ъ^, ..., Ьп), ... ..., С = (с\, С2,..., сп) назовем линейно зависимыми, если найдутся такие числа а, C,..., 7» не все равные нулю, что справедливы равен- равенства aaj+f3bj + ... + <ycj=0 U = 1, 2,..., п). A.44) Указанные п равенств A.44) удобно записать в виде одного равенства аА + рв + ... + jC = О, A.45) в котором О = @, 0,..., 0) обозначает нулевую строку. Строки, не являющиеся линейно зависимыми, называются линейно независимыми. Можно дать и «самостоятельное» определение линей- линейной независимости строк: строки А, В,..., С называются линейно независимыми, если равенство A.45) возможно лишь в случае, когда все числа а, /3,..., 7 равны нулю. Докажем следующее простое, но важное утверждение. 1) Каждую строку можно рассматривать как матрицу. Поэтому естественно использовать для обозначения строк большие латинские буквы.
§3] ТЕОРЕМА О БАЗИСНОМ МИНОРЕ МАТРИЦЫ 39 Теорема 1.5. Для того чтобы строки Л, В,..., С были линейно зависимы, необходимо и достаточно, чтобы одна из этих строк являлась линейной комбинацией остальных строк. Доказательство. 1) Необходимость. Пусть строки Л, В, ...,С линейно зависимы, т.е. справедливо равенство A.45), в котором хотя бы одно из чисел а, /3,...,7 отлично от нуля. Ради определенности допустим, что а ф 0. Тогда, поделив A.45) на а и введя обозначения Л = -C/а, ..., /i = -j/a, мы можем переписать A.45) в виде А = АБ + ... + //С, A.46) а это и означает, что строка А является линейной комбинацией строк В,..., С. 2) Достаточность. Пусть одна из строк (например, А) является линейной комбинацией остальных строк. Тогда найдутся числа Л,..., \± такие, что справедливо равенство A.46). Но это последнее равенство можно переписать в виде О (-1)А + АБ + ... + /хС = О. Так как из чисел — 1, A,..., /i одно отлично от нуля, то последнее равенство устанавливает линейную зависимость строк А, В,..., С. Теорема доказана. Конечно, во всех проведенных выше рассуждениях термин «строки» можно заменить термином «столбцы». 2. Теорема о базисном миноре. Рассмотрим произвольную (не обязательно квадратную) матрицу А = an an ... а\г ^2n A.47) «ml Минором k-го порядка матрицы А будем называть определитель к-то порядка с элементами, лежащими на пересечении любых к строк и любых к столбцов матрицы А. (Конечно, к не превосходит наимень- наименьшее из чисел т и п.) Предположим, что хотя бы один из элементов а^- матрицы А отличен от нуля. Тогда найдется такое целое положительное число г, что будут выполнены следующие два условия: 1) у матрицы А имеется минор r-го порядка, отличный от нуля, 2) всякий минор (г + 1)-го и более высокого порядка (если таковые существуют) равен нулю. Число г, удовлетворяющее требованиям 1) и 2), назовем рангом матрицы А 2). Тот минор r-го порядка, который отличен от нуля, назо- назовем базисным минором (конечно, у матрицы А может быть несколько 1) Здесь О = @, 0,..., 0) — нулевая строка. 2) Ранг матрицы А, все элементы которой — нули, по определению равен нулю.
40 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ ГЛ. 1 миноров г-го порядка, отличных от нуля). Строки и столбцы, на пересечении которых стоит базисный минор, назовем соответственно базисными строками и базисными столбцами. Докажем следующую основную теорему. Теорема 1.6 (теорема о базисном миноре). Базисные строки (ба- (базисные столбцы) линейно независимы. Любая строка (любой стол- столбец) матрицы А является линейной комбинацией базисных строк (базисных столбцов). Доказательство. Все рассуждения проведем для строк. Если бы базисные строки были линейно зависимы, то по теореме 1.5 одна из этих строк являлась бы линейной комбинацией других базис- базисных строк, и мы могли бы, не изменяя величины базисного минора, вычесть из этой строки указанную линейную комбинацию и получить строку, целиком состоящую из нулей, а это противоречило бы тому, что базисный минор отличен от нуля. Итак, базисные строки линейно независимы. Докажем теперь, что любая строка матрицы А является линейной комбинацией базисных строк. Так как при произвольных переменах строк (или столбцов) определитель сохраняет свойство равенства нулю, то мы, не ограничивая общности, можем считать, что базисный минор находится в левом верхнем углу матрицы A.47), т.е. расположен на первых г строках и первых г столбцах. Пусть j — любое число от 1 до п, а к — любое число от 1 до т. Убедимся в том, что определитель (г + 1)-го порядка an a\2 ... a\r a\j Ci2\ &22 • • • &2r 0,2 j ar\ ar2 ... arr arj A.48) равен нулю. Если j ^ г или к ^ г, то указанный определитель будет равен нулю в силу того, что у него будет два одинаковых столбца или две одинаковые строки. Если же оба числа j и к превосходят г, то A.48) является ми- минором матрицы А порядка (г + 1), а всякий такой минор равен нулю (по определению базисного минора). Итак, определитель A.48) равен нулю при всех j от 1 до п и всех к от 1 до га. Но тогда, разложив этот определитель по последнему столбцу и обозначив не зависящие от номера j алгебраические дополнения элементов этого столбца символами A\j = с\, A^j = С2, ..., Arj = сг, Akj = cr+i, мы получим, что C\CL\j + C2U2j + ... + Crarj + Cr+\CLkj = 0 (для всех j = 1, 2,..., п). Учитывая, что в последних равенствах ал- алгебраическое дополнение cr+i = A^j совпадает с заведомо отличным от нуля базисным минором, мы можем поделить каждое из этих равенств
§3] ТЕОРЕМА О БАЗИСНОМ МИНОРЕ МАТРИЦЫ 4j_ на cr+i. Но тогда, вводя обозначения л С\ л С2 л Сг мы получим, что afcj = \\a\j + A2a2j + ... + Xrarj (для всех j = = 1, 2,..., п), а это и означает, что &-я строка является линейной комбинацией первых г (базисных) строк. Теорема доказана. 3. Необходимое и достаточное условие равенства нулю опреде- определителя. Теорема 1.7. Для того чтобы определитель п-го порядка А был равен нулю, необходимо и достаточно, чтобы его строки {столбцы) были линейно зависимы. Доказательство. 1) Необходимость. Если определитель п-го порядка А равен нулю, то базисный минор его матрицы имеет порядок г, заведомо меньший п. Но тогда хотя бы одна из строк является не базисной. По теореме 1.6 эта строка является линейной комбинацией базисных строк. В эту линейную комбинацию мы можем включить и все оставшиеся строки, поставив перед ними нули. Итак, одна строка является линейной комбинацией остальных. Но тогда по теореме 1.5 строки определителя линейно зависимы. 2) Достаточность. Если строки А линейно зависимы, то по теореме 1.5 одна строка А{ является линейной комбинацией остальных строк. Вычитая из строки А{ указанную линейную комбинацию, мы, не изменив величины А, получим одну строку, целиком состоящую из нулей. Но тогда определитель А равен нулю (в силу следствия 3 из п. 4 §2). Теорема доказана.
Глава 2 ЛИНЕЙНЫЕ ПРОСТРАНСТВА Из курса аналитической геометрии читатель знаком с операцией сложения свободных векторов и с операцией умножения вектора на ве- вещественное число, а также со свойствами этих операций. В настоящей главе изучаются множества объектов любой природы, для элементов которых каким-либо способом (причем, безразлично каким) опреде- определены операция сложения элементов и операция умножения элемента на вещественное число, причем указанные операции обладают теми же свойствами, что и соответствующие операции над геометрическими векторами. Такие множества, называемые линейными пространства- пространствами, обладают целым рядом общих свойств, которые и будут установ- установлены в настоящей главе. § 1. Понятие линейного пространства 1. Определение линейного пространства. Множество R элемен- элементов х, у, z,... любой природы называется линейным (или аффинным) пространством, если выполнены следующие три требования. I. Имеется правило, посредством которого любым двум элементам х и у множества R ставится в соответствие третий элемент z этого множества, называемый суммой элементов х и у и обозначаемый символом z = х + у. П. Имеется правило, посредством которого любому элементу х мно- множества R и любому вещественному числу Л ставится в соответствие элемент и этого множества, называемый произведением элемента х на число А и обозначаемый символом и = Ах или и = хЛ. III. Указанные два правила подчинены следующим восьми аксио- аксиомам: 1° х + у = у + х (переместительное свойство суммы); 2° (х + у) + z = х + (у + z) (сочетательное свойство суммы); 3° существует нулевой элемент 0 такой, что х + 0 = х для любого элемента х (особая роль нулевого элемента); 4° для каждого элемента х существует противоположный эле- элемент х' такой, что х + х7 = 0; 5° 1 • х = х для любого элемента х (особая роль числового мно- множителя 1); 6° А(//х) = (A/i)x (сочетательное относительно числового множи- множителя свойство);
§ 1 ] ПОНЯТИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА 43 7° (Л + /i)x = Ах + //х (распределительное относительно суммы числовых множителей свойство); 8° Л(х + у) = Лх + Лу (распределительное относительно суммы элементов свойство). Подчеркнем, что при введении понятия линейного пространства мы абстрагируемся не только от природы изучаемых объектов, но и от конкретного вида правил образования суммы элементов и произведения элемента на число (важно лишь, чтобы эти правила удовлетворяли восьми аксиомам, сформулированным в данном выше определении). Если же природа изучаемых объектов и вид правил образования суммы элементов и произведения элемента на число указаны 0 , то мы будем называть линейное пространство конкретным. Приведем примеры конкретных линейных пространств. Пример 1. Рассмотрим множество всех свободных векторов в трехмерном пространстве. Операции сложения указанных векторов и умножения этих векторов на числа определим так, как это было сделано в аналитической геометрии (сложение векторов определим по правилу «параллелограмма»; при умножении вектора на вещественное число Л длина этого вектора умножается на |Л|, а направление при Л > 0 остается неизменным, а при Л < 0 — изменяется на противопо- противоположное). Элементарно проверяется справедливость всех аксиом 1°-8° (спра- (справедливость всех аксиом, за исключением аксиомы 5°, установлена в курсе аналитической геометрии 2), справедливость аксиомы 5° не вызывает сомнений). Таким образом, множество всех свободных векторов в пространстве с так определенными операциями сложения векторов и умножения их на числа представляет собой линейное пространство, которое мы будем обозначать символом В%. Аналогичные множества векторов на плоскости и на прямой, также являющиеся линейными пространствами, мы будем обозначать соот- соответственно символами B<i и В\. Пример 2. Рассмотрим множество {ж} всех положительных вещественных чисел. Определим сумму двух элементов х и у этого множества как произведение вещественных чисел х и у (понимаемое в обычном в теории вещественных чисел смысле). Произведение эле- элемента х множества {х} на вещественное число Л определим как воз- возведение положительного вещественного числа х в степень Л. Нулевым элементом множества {х} будет являться вещественное число 1, а про- противоположным (для данного элемента х) элементом будет являться вещественное число 1/х. 1) Разумеется, эти правила должны быть указаны так, чтобы были спра- справедливы свойства 1°-8°, перечисленные в данном выше определении в виде аксиом. ) См. выпуск «Аналитическая геометрия», гл.2, §1, п. 2.
44 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ ГЛ. 2 Легко убедиться в справедливости всех аксиом 1°-8°. В самом деле, справедливость аксиом 1° и 2° вытекает из переместаительного и сочетательного свойств произведения вещественных чисел; справед- справедливость аксиом 3° и 4° вытекает из элементарных равенств х • 1 = х, х - 1/х = 1 (для любого вещественного х > 0); аксиома 5° эквива- эквивалентна равенству хх = х\ аксиомы 6° и 7° справедливы в силу того, что для любого х > 0 и любых вещественных А и /i, имеют место Л Л ^х+^ х соотношения (жм)Л = жЛ/\ х^х+^ = хх • жм; наконец, справедливость аксиомы 8° следует из того, что для любых положительных х и у и для любого вещественного Л имеет место равенство (ху)х = ххух. Итак, мы убедились, что множество {х} с так определенными операциями сложения элементов и умножения их на числа является линейным пространством. Пример 3. Важный пример линейного пространства дает мно- множество Ап, элементами которого служат упорядоченные совокупно- совокупности п произвольных вещественных чисел (х\, Х2,..., хп). Элементы этого множества мы будем обозначать одним символом х, т. е. будем писать х= (х\, Х2,..., хп), и при этом называть вещественные чис- числа х\, Х2,..., хп координатами элемента х. В анализе множество Ап обычно называют п-мерным координат- координатным пространством 0 . В алгебраической трактовке множество Ап можно рассматривать как совокупность всевозможных строк, каждая из которых содержит п вещественных чисел (что мы уже и делали в §3 гл. 1). Операции сложения элементов множества Ап и умножения этих элементов на вещественные числа определим правилами: (Х\, Ж2,..., Хп) Н- B/1» 2/2, — , Уп) = {Х\+У\, Х2+У2,--., Хп + Уп), Х(х\, Х2, ... , Хп) = (\Х\, \Х2, • • • , Ххп). Предоставляем читателю элементарную проверку справедливости всех аксиом 1°-8° и того факта, что нулевым элементом рассматривае- рассматриваемого множества является элемент 0 = @, 0,... ,0), а противоположным для элемента (х\, Х2,..., хп) является элемент (—х\, —Х2,..., —хп). Пример 4. Рассмотрим далее множество С [а, Ь] всех функций х = x(t), определенных и непрерывных на сегменте а ^ t ^ b. Опе- Операции сложения таких функций и умножения их на вещественные числа определим обычными правилами математического анализа. Эле- Элементарно проверяется справедливость аксиом 1°-8° 2), позволяющая заключить, что множество С[а, Ь] является линейным пространством. Пример 5. Следующим примером линейного пространства может служить множество {Pn(t)} всех алгебраических многочленов степени, не превышающей натурального числа п, с операциями, определенными так же, как в предыдущем примере. Заметим, что множество {Pn(t)}, О См. выпуск «Основы математического анализа», часть I, гл. 14, § 1, п. 4. 2) В частности, нулевым элементом пространства С [а, Ь] является функция, тождественно равная нулю на сегменте а ^ t ^ Ь.
§ 1 ] ПОНЯТИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА 45 если его рассматривать на сегменте а ^ t ^ b, является подмноже- подмножеством линейного пространства С [а, Ь], рассмотренного в примере 4. Замечание 1. Для разъяснения изучаемого понятия линейного пространства укажем примеры множеств, по той или иной причине не являющихся линейными пространствами: а) множество всех векторов пространства с исключением векторов, коллинеарных некоторой прямой / (ибо в пределах этого множества нельзя складывать векторы, симметричные относительно указанной прямой /); б) множество всех многочленов степени, точно равной натурально- натуральному числу п (сумма двух таких многочленов может оказаться многочле- многочленом степени ниже п); в) множество всех многочленов степени, не превышающей на- натурального п, все коэффициенты которых положительны (элементы такого множества нельзя умножить на отрицательные вещественные числа). Замечание 2. Отметим, что элементы произвольного линейного пространства принято называть векторами. То обстоятельство, что ча- часто термин «вектор» употребляется в более узком смысле, при этом не приводит к недоразумениям, а, напротив, взывая к сложившимся гео- геометрическим представлениям, позволяет уяснить, а зачастую и предви- предвидеть ряд результатов, справедливых для линейных пространств произ- произвольной природы. Замечание 3. В сформулированном нами определении линейно- линейного пространства числа Л, ц,... брались из множества вещественных чисел. Поэтому определенное нами пространство естественно назвать вещественным линейным пространством. При более широком под- подходе можно брать Л, II,... из множества комплексных чисел. При этом мы придем к понятию комплексного линейного пространства. 2. Некоторые свойства произвольных линейных пространств. Из аксиом 1°-8° в качестве логических следствий можно получить ряд утверждений, справедливых для произвольных линейных пространств. В качестве примера установим два утверждения. Теорема 2Л. В произвольном линейном пространстве существу- существует единственный нулевой элемент и для каждого элемента х суще- существует единственный противоположный элемент. Доказательство. Существование хотя бы одного нулевого эле- элемента утверждается в аксиоме 3°. Предположим, что существуют два нулевых элемента Oi и О2. Тогда, полагая в аксиоме 3° сначала х = Oi, О = О2, а затем х = 02, 0 = Oi, мы получим два равенства Oi + O2 = Oi, 02 + Oi =02, левые части которых (в силу аксиомы 1°) равны. Стало быть, в силу транзитивности знака «=» равны и правые части двух последних равенств, т.е. Oi = O2, и единственность нулевого элемента установлена. Существование для каждого элемента х хотя бы одного противо- противоположного элемента у утверждается в аксиоме 4°. Предположим, что для некоторого элемента х существует два противоположных элемента У1 и У2> так что х + У1 =0 и х + у2 = 0. Но тогда, в силу аксиом
46 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ ГЛ. 2 3°, 2° И 1°, У1 = У1 + 0 = yi + (X + У2) = (У1 + X) + У2 = 0 + У2 = — У 2 + О = У2> т- е. У1 = У2> и единственность для каждого элемента х противоположного элемента доказана. Теорема доказана. Теорема 2.2. В произвольном линейном пространстве 1) нулевой элемент О равен произведению произвольного элемен- элемента х на вещественное число 0; 2) для каждого элемента х противоположный элемент равен произведению этого элемента х яа вещественное число — 1. Доказательство. 1) Пусть х — произвольный элемент, а у — ему противоположный. Последовательно применяя аксиомы 3°, 4°, 2°, 5°, 1°, 7° и снова 5° и 4°, будем иметь х-0 = х-0 + 0 = х-0 + + (х + у) = (х • 0 + х) + у = (х • 0 + х • 1) + у = х@ + 1) + у = х • 1 + + у = х + у = 0, т. е. х • 0 = 0. 2) Пусть х — произвольный элемент, у = (-1) • х. Используя аксиомы 5°, 7°, 1° и уже доказанное равенство х • 0 = 0, получим равенство х + у = х + (—1)х = 1 • х + (—1)х = [1 + (—1)]х = 0 • х = = х • 0 = 0, которое и доказывает (в силу аксиомы 4°), что у — элемент противоположный х. Теорема доказана. Отметим в заключение, что аксиомы 1°-4° позволяют доказать существование и единственность разности любых двух элементов линейного пространства х и у, которая определяется как элемент z, удовлетворяющий условию z + у = х 0 . (Таковым элементом служит сумма z = х + (— 1)у.) § 2. Базис и размерность линейного пространства 1. Понятие линейной зависимости элементов линейного про- пространства. В курсе аналитической геометрии 2) было введено понятие линейной зависимости векторов, а в п. 1 §3 предыдущей главы — понятие линейной зависимости строк (или, что то же самое, элементов пространства Лп, рассмотренного в примере 3 из п. 1 § 1 настоящей главы). Обобщением этих понятий является понятие линейной зависимости элементов совершенно произвольного линейного пространства, к вы- выяснению которого мы и переходим. Рассмотрим произвольное веще- вещественное линейное пространство R с элементами х, у,..., z,... Линейной комбинацией элементов х, у,..., z пространства R мы будем называть сумму произведений этих элементов на произвольные вещественные числа, т. е. выражение вида ах + /3у + ... + 7Z, B.1) где а, /3,..., 7 ~~ какие угодно вещественные числа. 1) Достаточно дословно повторить доказательство, данное в теории веще- вещественных чисел (см. выпуск «Основы математического анализа», часть I, гл. 2, §2, п.З). 2) См. выпуск «Аналитическая геометрия», гл.2, §1, п.З.
§2] БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 47 Определение 1. Элементы х, у, ...,z пространства R называют- называются линейно зависимыми, если найдутся такие вещественные числа а, /3,..., ^, из которых хотя бы одно отлично от нуля, что линейная комбинация элементов х, у,..., z с указанными числами является ну- нулевым элементом пространства R, т. е. имеет место равенство ax + /3y + ... + 7z = 0. B.2) Элементы х, у, ...,z, не являющиеся линейно зависимыми, мы будем называть линейно независимыми. Дадим другое определение линейно независимых векторов, постро- построенное на логическом отрицании содержания определения 1. Определение 2. Элементы х, у,..., z пространства R называются линейно независимыми, если линейная комбинация B.1) является нулевым элементом пространства R лишь при условии а = /3 = ... ... =7 = 0. Теорема 2.3. Для того чтобы элементы х, у,..., z простран- пространства R были линейно зависимы, необходимо и достаточно, чтобы один из этих элементов являлся линейной комбинацией остальных элементов. Доказательство. 1) Необходимость. Пусть элементы х, у, ...,ъ линейно зависимы, т.е. справедливо равенство B.2), в котором хотя бы одно из чисел а, C,..., 7 отлично от нуля. Пусть, ради определенности, а ф 0. Тогда, поделив B.2) на « и введя в т обозначения А = — —, ..., \i = — —, мы можем переписать B.2) в виде а а х = Ay + ... + /iz, B.3) а это и означает, что элемент х является линейной комбинацией элементов у,..., z. 2) Достаточность. Пусть один из элементов (например, х) является линейной комбинацией остальных элементов. Тогда найдутся числа А,..., II такие, что справедливо равенство B.3). Но это послед- последнее равенство можно переписать в виде (-l)x+Ay + ... + /iz = 0. B.4) Так как из чисел (— 1), А,..., \i одно отлично от нуля, то равен- равенство B.4) устанавливает линейную зависимость элементов х, у,..., z. Теорема доказана. Справедливы два элементарных утверждения. 1. Если среди элементов х, у,..., z имеется нулевой элемент, то эти элементы линейно зависимы. В самом деле, если, например, х = 0, то равенство B.2) справедливо при а=\, /3 = ... = 'у = 0. 2. Если часть элементов х, у, ...,z являются линейно зави- зависимыми, то и все эти элементы являются линейно зависимыми. В самом деле, если, например, элементы у,..., z линейно зависимы, то справедливо равенство (Зу + ... + jz = 0, в котором не все числа /3,..., 7 равны нулю. Но тогда с теми же числами C,..., 7 и с а = 0 будет справедливо равенство B.2).
48 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ ГЛ. 2 В заключение рассмотрим вопрос о линейной зависимости элемен- элементов пространства Ап, введенного в примере 3 п. 1 § 1. Докажем, что п элементов указанного пространства ei = A,0,0, ...,0), е2 = @, 1,0, ...,0), е3 = @, 0, 1, ..., 0), B.5) еп = @, 0, 0, ..., 1) являются линейно независимыми, а совокупность п элементов B.5) и еще одного произвольного элемента х = (х\, х2, • • •, хп) про- пространства Ап уже образует линейно зависимую систему элементов. Рассмотрим линейную комбинацию элементов B.5) с какими-либо числами а\, а2, аз,..., ап. В силу аксиом эта линейная комбинация представляет собой элемент а\е\ + а2е2 + ... + апеп = (а\, а2,..., ап), который является нулевым лишь при условии а\ = а2 = ... = ап = 0. Но это и означает линейную независимость элементов B.5). Докажем теперь, что система, состоящая из п элементов B.5) и еще одного произвольного элемента х = (х\, х2,..., хп) про- пространства Ап, уже является линейно зависимой. В силу теоремы 2.3 достаточно доказать, что элемент х = (х\, х2,..., хп) представляет собой линейную комбинацию элементов B.5), а это очевидно, ибо в силу аксиом х = (жь х2,..., хп) = x\ei + х2е2 + ... + хпеп. 2. Базис и координаты. Рассмотрим произвольное вещественное линейное пространство R. Определение. Совокупность линейно независимых элементов еь е2,..., еп пространства R называется базисом этого пространства, если для каждого элемента х пространства R найдутся вещественные числа х\, х2,..., хп такие, что справедливо равенство х = х\е\ + х2е2 + ... + хпеп. B.6) При этом равенство B.6) называется разложением элемента х по ба- базису е\, е2,..., еп, а числа х\, х2,..., хп называются координатами элемента х (относительно базиса ei, e2,..., еп). Докажем, что каждый элемент х линейного пространства R может быть разложен по базису еь е2,..., еп единственным спо- способом, т. е. координаты каждого элемента х относительно базиса ei, е2,..., еп определяются однозначно. Допустим, что для некоторого элемента х наряду с разложением B.6) справедливо еще и другое разложение по тому же самому базису х = х\е\ + х2е2 + ... + х'пеп. B.7)
§2] БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 49 Почленное вычитание равенств B.6) и B.7) приводит нас к соотно- соотношению О {хх - х\)ех + {х2 - х'2)е2 + ... + (хп - х'п)еп = 0. B.8) В силу линейной независимости базисных элементов еь е2,..., еп, соотношение B.8) приводит к равенствам х\ — х\ = О, х2 — х2 = 0,... ..., хп — х'п =0 или х\ = х[, х2 = xf2, ..., хп = х'п. Единственность разложения по базису доказана. Значение базиса заключается также и в том, что операции сложения элементов и умножения их на числа при задании базиса превращаются в соответствующие операции над числами — координатами этих элементов. Именно справедливо следу- следующее утверждение. Теорема 2.4. При сложении двух любых элементов линейного пространства R их координаты (относительно любого базиса про- пространства R) складываются; при умножении произвольного элемен- элемента на любое число X все координаты этого элемента умножаются на А. Доказательство. Пусть еь в2,..., еп — произвольный базис пространства R, х = a^ei + х2е2 + ... + хпеп и у = у\е\ + у2е2 + ... ... + упеп — любые два элемента этого пространства. Тогда в силу аксиом 1°-8° х + у = (х\ Ах = (Azi)ei + {Хх2)е2 + ... + (Ххп)еп. В силу единственности разложения по базису теорема доказана. Приведем примеры базисов конкретных линейных пространств. Из аналитической геометрии известно, что любые три некомпланар- некомпланарных вектора образуют базис в линейном пространстве Б3 всех свобод- свободных векторов (это пространство рассмотрено в примере 1 п. 1 § 1). Заметим далее, что совокупность п элементов B.5), рассмотренных в конце п. 1, образует базис в линейном пространстве Лп, введенном в примере 3 п. 1 § 1. В самом деле, в конце предыдущего пункта доказано, что элементы B.5) линейно независимы и что любой элемент х= (х\, х2,..., хп) пространства Ап представляет собой некоторую линейную комбинацию элементов B.5). Убедимся, наконец, что базис линейного пространства {х}, вве- введенного в примере 2 п. 1 § 1, состоит из одного элемента, в качестве которого можно взять любой ненулевой элемент этого простран- пространства (т.е. любое положительное вещественное число xq, не равное 1). Достаточно доказать, что для любого положительного вещественного 1) Возможность почленного вычитания равенств B.6) и B.7) и производи- производимой группировки членов вытекает из аксиом 1°-8°.
50 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ ГЛ. 2 числа х найдется вещественное число Л такое, что х = Xq 0 . Но это очевидно: достаточно взять Л = log^ x. 3. Размерность линейного пространства. Как и выше, будем рассматривать произвольное вещественное линейное пространство R. Определение 1. Линейное пространство R называется п-мерным, если в нем существует п линейно независимых элементов, а любые (п + 1) элементов уже являются линейно зависимыми. При этом число п называется размерностью пространства R. Размерность пространства R обычно обозначают символом dim R. Определение 2. Линейное пространство R называется бесконеч- бесконечномерным, если в нем существует любое число линейно независимых элементов 2). В настоящей книге мы будем изучать, в основном, пространства конечной размерности п. Бесконечномерные пространства составляют предмет специального изучения. (Они изучаются в гл. 10 и 11 выпуска «Основы математического анализа», часть П.) Выясним связь между понятием размерности пространства и вве- введенным в предыдущем пункте понятием базиса. Теорема 2.5. Если R — линейное пространство размерности п, то любые п линейно независимых элементов этого пространства образуют его базис. Доказательство. Пусть ei, е^,..., еп — любая система п ли- линейно независимых элементов пространства R (существование хотя бы одной такой системы вытекает из определения 1). Если х — любой элемент R, то, согласно определению 1, система (п + 1) элементов х, ei, е%,..., еп линейно зависима, т.е. найдутся не все равные нулю числа ао, а\, «2,..., ап такие, что справедливо равенство + а\е\ + «2^2 + • • • + OLnen = 0. B.9) Заметим, что число ао заведомо отлично от нуля (ибо в противном случае из равенства B.9) вытекала бы линейная зависимость элементов ei, е2,..., еп). Но тогда, поделив равенство B.9) на ао и положив OL\ Q.2 OLn /ел гл\ х\ = , Х2 = , • • •, хп = , мы получим из B.9) ао <*о ао х = х\е\ + ^2^2 + ... + хпеп. B.10) Так как х — произвольный элемент R, то равенство B.10) доказывает, что система элементов еь е2,..., еп является базисом пространства R. Теорема доказана. Теорема 2.6. Если линейное пространство R имеет базис, сос- состоящий из п элементов, то размерность R равна п. ) Напомним, что произведение элемента xq на число Л определяется как ЧИСЛО Xq. 2) Для обозначения того, что пространство R является бесконечномерным, используют следующую символику: dim Я = оо.
§2] БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 5j_ Доказательство. Пусть система п элементов ei, е2,..., еп яв- является базисом пространства R. Достаточно доказать, что любые (п + 1) элементов этого пространства xi, X2,..., xn+i линейно зави- зависимы 0 . Разложив каждый из этих элементов по базису, будем иметь Х2 = xn+i = a() () () где an, a\2,..., a(n+i)n ~ некоторые вещественные числа. Очевидно, линейная зависимость элементов xi, X2,..., xn+i экви- эквивалентна линейной зависимости строк матрицы an a\2 ... а\ (п+1I a(n+lJ ••• fl(n+l) Но строки указанной матрицы заведомо линейно зависимы, ибо поря- порядок базисного минора этой матрицы (содержащей (п + 1) строк и п столбцов) не превосходит п, и хотя бы одна из (п + 1) ее строк не является базисной и по теореме о базисном миноре 2) представляет со- собой линейную комбинацию базисных (а стало быть, и всех остальных) строк. Теорема доказана. Обращаясь к примерам, рассмотренным в конце предыдущего пунк- пункта, мы теперь можем сказать, что размерность пространства В$ всех свободных векторов равна трем, размерность пространства Лп равна п, а размерность пространства {х} равна единице. Примером бесконечномерного пространства может служить ли- линейное пространство С [а, Ь] всех функций х = x(t), определенных и непрерывных на сегменте а ^ t ^ b (см. пример 4 из п. 1 § 1). В самом деле, для любого номера п система (п + 1) элементов этого пространства 1, t, t2,..., tn является линейно независимой (ибо в про- противном случае некоторый многочлен Со + C\t + C^t2 + ... + Cntn, не все коэффициенты Со, С\,..., Сп которого равны нулю, оказался бы тождественно равным нулю на сегменте а ^ t ^ Ь). 4. Понятие изоморфизма линейных пространств. В этом пункте мы покажем, что различные линейные пространства одной и той же размерности п в смысле свойств, связанных со введенными в этих пространствах операциями, по существу не отличаются друг от друга. Так как в линейных пространствах введены лишь операции сло- сложения элементов и умножения элементов на числа, то естественно сформулировать следующее определение. Определение. Два произвольных вещественных линейных про- пространства R и R' называются изоморфными, если между элементами 1) Ибо базисные элементы ei, ег,..., еп образуют систему п линейно неза- независимых элементов пространства R. ) См. теорему 1.6 из п. 2 § 3 гл. 1.
52 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ ГЛ. 2 этих пространств можно установить взаимно однозначное соответ- соответствие 0 так, что если элементам х и у пространства R отвечают соответственно элементы х7 и у7 пространства R', то элементу х + у отвечает элемент х7 + у', а элементу Ах при любом вещественном А отвечает элемент Ах'. Заметим, что если линейные пространства R и R' изоморфны, то нулевому элементу R отвечает нулевой элемент R' и наоборот. (В самом деле, пусть элементу х пространства R отвечает некоторый элемент х7 пространства R'. Тогда элементу 0 • х пространства R отвечает элемент 0 • х7 пространства R'.) Отсюда следует, что если в случае изоморфизма элементам х, у,... ..., z пространства R отвечают соответственно элементы х7, у7,..., z7 пространства R', то линейная комбинация ах + /Зу + ... + jz является нулевым элементом пространства R тогда и только тогда, когда ли- линейная комбинация ах7 + /Зу7 + ... + 7Z7 является нулевым элементом пространства R'. Но это означает, что если пространства R и R! изоморфны, то максимальное число линейно независимых элементов в каждом из этих пространств одно и то же. Иными словами, два изоморфных пространства обязаны иметь одинаковую размерность. Стало быть, пространства разной размерности не могут быть изоморфны. Докажем теперь следующее утверждение. Теорема 2.7. Любые два п-мерных вещественных линейных про- пространства R и R! изоморфны. Доказательство. Выберем в R какой-либо базис ei, е2,..., еп, а в R! — какой-либо базис е[, е'2, ..., е7п. Поставим в соответствие каждому элементу х = a^ei + ^2^2 + ... + хпеп пространства R эле- элемент х7 = х\е[ + Х2е'2 + ... + хпе'п пространства R' (т.е. мы берем в качестве х7 тот элемент Rf, который имеет относительно базиса е[, е'2, ..., е'п те же самые координаты, что и элемент х относитель- относительно базиса еь е2,..., еп). Убедимся в том, что установленное соответствие является взаимно однозначным. В самом деле, каждому элементу х пространства R однозначно соответствуют координаты х\, Х2,..., хп, которые, в свою очередь, определяют единственный элемент х7 пространства R'. В силу равноправности пространств R и Rf, каждому элементу х7 простран- пространства Я7, в свою очередь, соответствует единственный элемент х про- пространства R. Остается заметить, что если элементам х и у пространства R отвечают соответственно элементы х7 и у7 пространства Rf, то в силу 1) Напомним, что соответствие между элементами двух множеств R и R' называется взаимно однозначным, если при этом соответствии каждому эле- элементу R отвечает один и только один элемент R', причем каждый элемент R' отвечает одному и только одному элементу R.
§3] ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 53 теоремы 2.4 элементу х + у отвечает элемент х' + у', а элементу Ах отвечает элемент Ах'. Теорема доказана. Из приведенного нами рассмотрения следует, что единственной су- существенной характеристикой конечномерного линейного пространства является его размерность. § 3. Подпространства линейных пространств 1. Понятие подпространства и линейной оболочки. Предполо- Предположим, что некоторое подмножество L линейного пространства R удо- удовлетворяет следующим двум требованиям. 1°. Если элементы х и у принадлежат подмножеству L, то и сумма х + у принадлежит этому подмножеству. 2°. Если элемент х принадлежит подмножеству L, а А — лю- любое вещественное число, то и элемент Ах принадлежит подмно- подмножеству L. Убедимся в том, что подмножество L, удовлетворяющее требованиям 1° и 2°, само является линейным пространством. До- Достаточно убедиться в справедливости для элементов подмножества L аксиом 1°-8° из определения линейного пространства. Все указанные аксиомы, кроме аксиом 3° и 4°, заведомо справедливы для элементов подмножества L, поскольку они справедливы для всех элементов пространства R. Остается проверить выполнение аксиом 3° и 4°. Пусть х — любой элемент подмножества L, а А — любое вещественное число. Тогда в силу требования 2° элемент Ах также принадлежит L. Остается заметить, что (в силу теоремы 2.2) этот элемент Ах при А = 0 превращается в нулевой элемент пространства R, а при А = — 1 превращается в противоположный для х элемент. Таким образом, подмножеству L принадлежит нулевой элемент и противоположный (для каждого элемента х) элемент, а это и означает, что для элементов подмножества L справедливы аксиомы 3° и 4°. Тем самым полностью доказано, что подмножество L само является линейным пространством. Определение. Подмножество L линейного пространства R, удовле- удовлетворяющее требованиям 1° и 2°, называется линейным подпростран- подпространством (или просто подпространством) пространства R. Простейшими примерами подпространств могут служить: 1) так называемое нулевое подпространство, т.е. подмножество ли- линейного пространства R, состоящее из одного нулевого элемента; 2) все пространство R (которое, конечно, можно рассматривать как подпространство). Оба эти подпространства принято называть несобственными. Укажем примеры подпространств более содержательного вида. Пример 1. Подмножество {Pn(t)} всех алгебраических многочле- многочленов степени, не превышающей натурального числа п 0, в линейном *) Это подмножество введено в примере 5 п. 1 § 1 настоящей главы.
54 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ ГЛ. 2 пространстве С [а, Ь] всех функций х = x(t), определенных и непре- непрерывных на сегменте а < t < b 0 (справедливость для элементов под- подмножества {Pn(t)} требований 1° и 2° не вызывает сомнений). Пример 2. Подмножество #2 всех свободных векторов, парал- параллельных некоторой плоскости, в линейном пространстве В$ всех сво- свободных векторов 2) (справедливость для элементов В^ требований 1° и 2° очевидна). Пример 3. Пусть х, у, ...,z — совокупность элементов неко- некоторого линейного пространства R. Линейной оболочкой элементов х, у,..., z будем называть совокупность всех линейных комбинаций этих элементов, т. е. множество элементов вида ах + /3у + ... + 7Z, где а, /3,..., 7 ~~ какие угодно вещественные числа. Договоримся обозначать линейную оболочку элементов х, у,..., z символом L(x, у,..., z). Для линейной оболочки произвольных элементов х, у, ...,z ли- линейного пространства R, очевидно, выполняются требования 1° и 2°, сформулированные в начале настоящего пункта. Поэтому всякая ли- линейная оболочка является подпространством основного линейного пространства R. Это подпространство, очевидно, содержит элементы х, у, ...,z, на которых построена линейная оболочка L(x, у,..., z). С другой стороны, всякое подпространство, содержащее элементы х, у,..., z, обязано содержать и все линейные комбинации этих эле- элементов. Поэтому линейная оболочка элементов х, у,..., z является наименьшим подпространством, содержащим элементы х, у,..., z. Конкретным примером линейной оболочки может служить линей- линейная оболочка элементов 1, t, t<i,..., tn линейного пространства С [а, Ь] всех функций х = x(t), определенных и непрерывных на сегменте а ^ t ^ b. Эта линейная оболочка, очевидно, представляет собой мно- множество {Pn(t)} всех алгебраических многочленов степени, не превы- превышающей п. Другие примеры подпространств будут рассмотрены в п.З настоя- настоящего параграфа. Рассмотрим вопрос о размерности подпространства (и, в частности, линейной оболочки). Можно утверждать, что размерность любого подпространства п-мерного линейного пространства R не превосходит размерно- размерности п пространства R (ибо всякая линейно независимая система элементов подпространства является одновременно линейно независи- независимой системой элементов всего пространства R). Более точно можно утверждать, что если подпространство L не совпадает со всем п-мерным линейным пространством R, то размерность L строго меньше п. 1) Пространство С [а, Ь] введено в примере 4 п. 1 § 1 этой главы. 2) Множества B<i и В% были введены в примере 1 п. 1 § 1 этой главы.
§3] ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 55 Это вытекает из того, что если размерности L и R обе равны п, то всякий базис подпространства L, поскольку он состоит из п элементов, является (в силу теоремы 2.5) базисом и всего пространства R. Заметим, что если во всем пространстве R выбран базис еь е2,... ...,еп, то базисные элементы подпространства L, вообще говоря, нельзя выбирать из числа элементов еь е^,..., еп (ибо в общем слу- случае ни один из элементов еь е2,..., еп может не принадлежать L). Однако справедливо обратное утверждение: если элементы е\, e2,... ... , e/g составляют базис к-мерного подпространства п-мерного линейного пространства R, то этот базис можно дополнить элементами е^+ь ..., еп пространства R так, что совокупность элементов еь ..., е&, е^+ь ..., еп будет составлять базис всего пространства R. Докажем это утверждение. Если к < п, то найдется элемент e^+i пространства R такой, что элементы еь в2,..., е/,, e^+i линейно неза- независимы (в противном случае пространство R оказалось бы /г-мерным). Далее, если к + 1 < п, то найдется элемент е^+2 пространства R такой, что элементы еь е2,..., е&, е&+ь е/~+2 линейно независимы (в противном случае пространство R оказалось бы (к + 1)-мерным). Продолжая аналогичные рассуждения, мы докажем сформулированное утверждение. В заключение докажем важную теорему о размерности линейной оболочки. Теорема 2.8. Размерность линейной оболочки L(x, у,..., z) эле- элементов х, у,..., z равна максимальному числу линейно независимых элементов в системе элементов х, у,..., z. В частности, если эле- элементы х, у,..., z линейно независимы, то размерность линейной оболочки L(x, у,..., z) равна числу элементов х, у,..., z (а сами эти элементы образуют базис линейной оболочки L(x, у,..., z)). Доказательство. Допустим, что среди элементов х, у, ...,z имеется г линейно независимых элементов (обозначим их через xi, Х2,..., хг), а любые (г + 1) из элементов х, у,..., z линейно зави- зависимы. Тогда каждый из элементов х, у,..., z представляет собой неко- некоторую линейную комбинацию элементов хь Х2,..., хг 0, и посколь- поскольку по определению каждый элемент линейной оболочки L(x, у,... ..., z) представляет собой некоторую линейную комбинацию элемен- элементов х, у, ...,z, то каждый элемент указанной линейной оболочки представляет собой некоторую линейную комбинацию одних только элементов хь Х2,..., хг. Но это и означает, что система линейно независимых элементов хь Х2,..., хг образует базис линейной оболоч- оболочки L(x, у,..., z) и что размерность L(x, у, ...,z) равна г. Теорема доказана. 2. Новое определение ранга матрицы. В §3 гл. 1 мы определили ранг произвольной матрицы А как порядок ее базисного минора, т. е. 1) Это устанавливается с помощью тех же самых рассуждений, которые были проведены при доказательстве теоремы 2.5.
56 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ ГЛ. 2 как число г, удовлетворяющее требованию существования у матри- матрицы А отличного от нуля минора порядка г и отсутствия у этой матрицы отличных от нуля миноров порядка, большего г. В этом пункте мы убедимся, что ранг произвольной матрицы А равен максимальному числу линейно независимых строк (или столб- столбцов) этой матрицы. Отсюда будет следовать новое определение ранга матрицы как максимального числа линейно независимых строк (или столбцов) этой матрицы 0. Проведем все рассуждения для строк (для столбцов они анало- аналогичны). Рассмотрим в линейном пространстве Ап (введенном в при- примере 3 п. 1 § 1) линейную оболочку базисных строк произвольной, содержащей т строк и п столбцов матрицы А и предположим, что число базисных строк равно г. Из теоремы 1.6 о базисном миноре вытекает, что любая строка матрицы А является элементом указан- указанной линейной оболочки, а из линейной независимости г базисных строк и из теоремы 2.8 вытекает, что размерность указанной линейной оболочки равна г. Стало быть, любые (г + 1) элементов указанной линейной оболочки (и, в частности, любые (г + 1) строк матрицы А) линейно зависимы. А это и означает, что число г представляет собой максимальное число линейно независимых строк. 3. Сумма и пересечение подпространств. Пусть L\ и L2 — два произвольных подпространства одного и того же линейного простран- пространства R. Совокупность всех элементов х пространства R, принадлежащих одновременно L\ и L2, образует подпространство пространства R 2), называемое пересечением подпространств L\ и L2. Совокупность всех элементов пространства R вида у + z, где у — элемент подпространства L\, a z — элемент подпространства L2, образует подпространство пространства R 3), называемое суммой под- подпространств L\ и L2. Пример. Пусть R — линейное пространство всех свободных векторов (в трехмерном пространстве), L\ — подпространство всех свободных векторов, параллельных плоскости Оху, L2 — подпростран- подпространство всех свободных векторов, параллельных плоскости Oxz. Тогда суммой подпространств L\ и L2 будет являться все пространство R 4), *) В частности, отсюда будет следовать весьма нетривиальная теорема о том, что у любой матрицы максимальное число линейно независимых строк совпа- совпадает с максимальным числом линейно независимых столбцов. 2) Ибо элементы этой совокупности удовлетворяют требованиям 1° и 2°, сформулированным в начале п. 1. 3) См. предыдущую сноску. 4) В самом деле, любой вектор х пространства R представляет собой линей- линейную комбинацию х = ш + /3j + 7k базисных векторов i, j, k, параллельных осям Ох, Оу и Oz соответственно, причем вектор ш + /3j принадлежит L\, а вектор 7k принадлежит L^.
§3] ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 57 а пересечением подпространств L\ и L2 будет являться множество всех свободных векторов, параллельных оси Ох. Справедливо следующее утверждение. Теорема 2.9. Сумма размерностей произвольных подпро- подпространств L\ и L2 конечномерного линейного пространства R равна сумме размерности пересечения этих подпространств и размерности суммы этих подпространств. Доказательство. Обозначим через Lq пересечение L\ и L2, а через L — сумму L\ и L2. Считая Lq ^-мерным, выберем в нем базис ei,e2,...,efc. B.11) Используя утверждение, доказанное в п. 1, дополним базис B.11) до базиса еь...,е*, gi,...,g/ B.12) в подпространстве L\ и до базиса еь...,е*, fb...,fm B.13) в подпространстве L2. Достаточно доказать, что элементы gl,...,g/,e1,...,ebf1,...,fm B.14) являются базисом суммы L подпространств L\ и L2 0 . Для этого, в свою очередь, достаточно доказать, что элементы B.14) линейно независимы и что любой элемент х суммы L представляет собой некоторую линейную комбинацию элементов B.14). Сначала докажем, что элементы B.14) линейно независимы. Предположим, что некоторая линейная комбинация элемен- элементов B.14) представляет собой нулевой элемент, т.е. справедливо равенство «lgi + ••• + oliEi + P\G\ + ... + /3kek + 71 fi + ... + 7mfm = 0 B.15) или -...+Pkek = -71 fi - ••• - 7mfm- B.16) Так как левая часть B.16) является элементом L\, а правая часть B.16) является элементом Ь%, то как левая, так и правая часть B.16) принадлежит пересечению Lq подпространств L\ и L^. Отсюда следует, в частности, что правая часть B.16) представляет х) Ибо при этом размерность L, равная / + к + т, в сумме с размерностью Lq, равной к, будет равна сумме размерностей к + / и к + т подпространств L\ и L^.
58 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ ГЛ. 2 собой некоторую линейную комбинацию элементов B.11), т.е. найдутся такие числа Ль ..., А&, что -71 fi - ••• -7mfm = Aiei + ... +Afcefc. B.17) В силу линейной независимости базисных элементов B.13) равенство B.17) возможно лишь в случае, когда все коэффициенты 7ь---> 7т, Ль ..., А& равны нулю. Но при этом из B.15) мы получим, что + ... + ougi+Pia + ...+Ckek = 0. B.18) В силу линейной независимости базисных векторов B.12) равен- равенство B.18) возможно лишь в случае, когда все коэффициенты а\,... ...,a/, /3i,...,/3fc равны нулю. Тем самым мы установили, что ра- равенство B.15) возможно лишь в случае, когда все коэффициенты ai,...,a/, /3\,..., /3fc, 7ь---»7ш равны нулю, а это и доказывает линейную независимость элементов B.14). Остается доказать, что любой элемент х суммы L представля- представляет собой некоторую линейную комбинацию элементов B.14), но это сразу следует из того, что этот элемент х представляет собой (по определению L) сумму некоторого элемента xi подпространства L\, являющегося линейной комбинацией элементов B.12), и некоторого элемента Х2 подпространства L2, являющегося линейной комбинацией элементов B.13). Теорема доказана. Возвращаясь к примеру, рассмотренному перед формулировкой тео- теоремы 2.9, заметим, что в этом примере размерность каждого из под- подпространств L\ и L2 равна двум, размерность их суммы равна трем, а размерность их пересечения равна единице. 4. Разложение линейного пространства в прямую сумму под- подпространств. Пусть R\ и R2 — два подпространства линейного п-мер- ного пространства R. Определение. Будем говорить, что пространство R представляет собой прямую сумму подпространств R\ и R2, если каждый элемент х пространства R может быть единственным способом представлен в ви- виде суммы x = xi+x2 B.19) элемента xi подпространства R\ и элемента х2 подпространства R2. Тот факт, что R представляет собой прямую сумму R\ и R2 симво- символически записывают так: R = R\® R2. Последнее равенство обычно называют разложением простран- пространства R в прямую сумму подпространств R\ и R2. Так пространство R всех свободных векторов (в трехмерном про- пространстве) можно разложить в прямую сумму подпространства R\ всех векторов, параллельных плоскости Оху и подпространства R2 всех векторов, параллельных оси Oz. Теорема 2.10. Для того чтобы п-мерное пространство R пред- представляло собой прямую сумму подпространств R\ и R2, достаточ- достаточно, чтобы пересечение R\ и R2 содержало только нулевой элемент
§3] ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 59 и чтобы размерность R была равна сумме размерностей подпро- подпространств R\ и R2. Доказательство. Выберем некоторый базис е\,...,ек в под- подпространстве R\ и некоторый базис gi,..., g/ в подпространстве R2. Докажем, что объединение этих базисов еь...,еь gi,...,g/ B.20) представляет собой базис всего пространства R. Так как по условию теоремы размерность п всего пространства R равна сумме к + / размер- размерностей R\ и R2, то достаточно (в силу теоремы 2.5) доказать линейную независимость элементов B.20). Предположим, что некоторая линейная комбинация элемен- элементов B.20) представляет собой нулевой элемент, т. е. справедливо равенство aiei + ... + акек + Pigx + ...+fagi = 0, B.21) или ... + акек = -/3igi - ... - /3zgz. B.22) Так как левая часть B.22) является элементом R\, а правая — элемен- элементом R2, а пересечение R\ и R2 содержит лишь нулевой элемент, то как левая, так и правая часть B.25) представляет собой нулевой элемент, а это (на основании линейной независимости элементов каждого из базисов ei,..., ек и gi,..., g/) возможно лишь при условии ах = ... = ак=0, Pi = ...=/3, =0. B.23) Тем самым мы установили, что равенство B.21) возможно лишь при условии B.23), а это и доказывает линейную независимость эле- элементов B.20) и тот факт, что элементы B.20) образуют базис всего пространства R. Пусть теперь х — любой элемент R. Разложив его по базису B.20), будем иметь х = Aiei + ... + Хкек + AMgi + ... + /i/g/ или х = xi + х2, где xi = Aiei + ... + Хкек — элемент Дь а х2 = /iigi + ... + /i/g/ — элемент R2. Остается доказать, что представление B.19) является единствен- единственным. Предположим, что, кроме B.19), справедливо и еще одно пред- представление x = x'1+xf>, B.24) где Xj — элемент R\, а x.f2 — элемент R2. Вычитая B.24) из B.19), получим, что 0 = xi — Xj + Х2 — Xg, или xi — Xj = Х2 — Х2- Так как в левой части последнего равенства стоит элемент R\, а в правой — элемент R2 и поскольку пересечение R\ и R2 содержит лишь нулевой элемент, то из этого равенства следует, что xi — х.[ =0, х^ — х2 = 0, т. е. х.[ = xi, X2 = Xg. Теорема доказана. Замечание. В случае, когда пространство R представляет собой не прямую, а обычную сумму подпространств R\ и R2, представление
60 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ ГЛ. 2 B.19) любого элемента х пространства R также справедливо, но не является, вообще говоря, единственным. Пусть, например, R представляет собой трехмерное пространство всех свободных векторов, R\ — подпространство всех векторов, па- параллельных плоскости Оху, a R2 — подпространство всех векторов, параллельных плоскости Oxz. В предыдущем пункте мы выяснили, что R представляет собой сумму (но, конечно, не прямую сумму) подпространств R\ и R2. Обозначим через i, j и к базисные векторы, параллельные осям Ох, Оу и Oz соответственно, и разложим произ- произвольный элемент х пространства R по базису i, j, k. Найдутся веще- вещественные числа а, /3 и 7 такие, что х = ш + Д] + 7^, так что, с одной стороны, х = xi + Х2, где xi = ш + /3} — элемент R\, а Х2 = 7k ~~ элемент R2, с другой стороны, х = х.[ + х.2, где х.[ = /3j — элемент R\, а х.2 = ш + 7k — элемент R2. § 4. Преобразование координат при преобразовании базиса n-мерного линейного пространства 1. Прямое и обратное преобразование базисов. Пусть еь е2,... ..., еп и е[, е2, ..., е'п — два произвольных базиса n-мерного линей- линейного пространства R. Как всякий элемент пространства R, каждый элемент е[, е'2, ..., е^ может быть разложен по базису ei, e2,..., еп. Предположим, что элементы е[, е2, ..., е'п выражаются через ei, e2,... ..., еп с помощью формул - ... + а\пеп, ¦ «22^2 + • • • + а2пеп, B.25) JI ^*fll I I ^77,2 2 I • • • I U'TITI П ' Это означает, что переход от первого базиса ei, e2,..., еп ко второму базису е[, е2, ..., е'п задается матрицей Л = an ai2 ••• a\n U2\ CL22 • • • 0>2п Q>n\ B.26) Подчеркнем, что определитель А матрицы B.26) заведомо отличен от нуля 0, ибо в противном случае в силу теоремы 1.7 строки этой матрицы (а стало быть, и базисные элементы е[, е2, ..., е^) оказались бы линейно зависимыми. Убедимся в том, что обратный переход от второго базиса е[, е2, ..., е'п к первому базису еь е2,..., еп осуществляется с по- помощью матрицы В, обратной к матрице А. 1) Такую матрицу в п. 7 §2 гл. 1 мы договорились называть невырожденной.
§4] ПРЕОБРАЗОВАНИЕ КООРДИНАТ 61 Напомним, что матрица В, обратная к матрице А, введена в п. 7 §2 гл. 1 и имеет вид В = An A A12 A AXn A21 A A22 A ' A2m An\ " A An2 " A Ann B.27) где через А обозначен определитель матрицы А, а через А^ — алгебраическое дополнение элемента а^ этого определителя. Умно- Умножим уравнения B.25) соответственно на алгебраические дополнения A\j, A2j,..., Anj элементов j-ro столбца определителя А и после это- этого сложим эти уравнения. В результате получим (для любого номера j, равного 1, 2,..., п) e'2A2j + ...+e'nAnj = aniAnj). i=\ Учитывая, что сумма произведений элементов г-го столбца на соответ- соответствующие алгебраические дополнения элементов j-ro столбца равна нулю при г ф j и равна определителю А при г = j 0 , получим из последнего равенства е[ AXj + e'2A2j откуда ej = дробнее А ¦е;^=е,-А, P-e7n (j = 1, 2,..., n) или по- B.28) Формулы B.28) и устанавливают, что обратный переход от бази- базиса е[, е'2, ...,е'п к базису еь е2,..., еп осуществляется с помощью матрицы B.27), обратной к матрице А. Эту обратную к А матрицу мы кратко будем обозначать символом А~К 2. Связь между преобразованием базисов и преобразованием соответствующих координат. Пусть, как и выше, базис ei,e2,... ..., еп преобразуется в базис е[, е2, ..., е'п с помощью невырожденной матрицы B.26), так что обратное преобразование базисов задается мат- матрицей B.27). Пусть далее х — произвольный элемент рассматриваемого линейного пространства R, (х\, х2,..., хп) — его координаты относи- 0 См. свойство 4° из п. 4 §2 гл.,1.
62 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [гл.2 тельно первого базиса ei, е2,..., еп, (х[, х2,..., х'п) — его координаты относительно второго базиса е[, е2, ..., е'п, так что х = х[е[ х'2е'2 х'пе'п = Подставив в это равенство вместо элементов е ния, определяемые формулами B.28), получим - ... + хпеп. , е2,..., еп их выраже- х = = х, \ ! ' A z А Из последнего равенства (в силу единственности разложения по ба- базису е[, е2, ..., е^) сразу же вытекают формулы перехода от координат (х\, х2,..., хп) относительно первого базиса к координатам (х[, х2,... ..., х'п) относительно второго базиса: Хх = —г— XX Н ~Z~X2 + ... Н т— Хп, B.29) -х2 ... Н 4 A l A z ' ••• ' Д п' Формулы B.29) показывают, что переход от координат (жь х2,... ...,хп) к координатам (ж^, х2,..., ж^) осуществляется с помощью матрицы С = транспонированной к обратной матрице B.27). Мы приходим к следующему выводу: если переход от первого базиса ко второму осуществляется с помощью невырожденной матрицы Л, то переход от координат произвольного элемента относительно первого базиса к координатам этого элемента от- относительно второго базиса осуществляется с помощью матрицы (А~1у, транспонированной к обратной матрице А~К Ли А А2х А АпХ А А А22 А дп2 А Ахп '" А Л2п ¦" А Апп '" А
Глава 3 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Из элементарного курса и из курса аналитической геометрии чи- читатель знаком с системой двух линейных уравнений с двумя неиз- неизвестными и с системами двух и трех линейных уравнений с тремя неизвестными 0 . Целью настоящей главы является изучение системы произвольного числа т линейных уравнений с произвольным числом п неизвестных. Мы сначала установим необходимое и достаточное условие суще- существования хотя бы одного решения (или, как говорят, совместности) такой системы, а затем займемся отысканием всей совокупности ее решений. В §4 гл.4 будет рассмотрен важный для приложений случай при- приближенного задания всех коэффициентов системы и ее свободных чле- членов. Для этого случая будет изложен метод регуляризации А.Н. Тихо- Тихонова, позволяющий найти так называемое нормальное (т. е. наиболее близкое к началу координат) решение указанной системы с точно- точностью, соответствующей точности задания коэффициентов и свободных членов. В гл. 6 будет дано представление о численных (итерационных) ме- методах решения систем линейных уравнений. § 1. Условие совместности линейной системы 1. Понятие системы линейных уравнений и ее решения. В общем случае система т линейных уравнений с п неизвестными (или, кратко, линейная система) имеет следующий вид: а\\х\ + а\2Х2 + ... + а\пхп = Ь\, ат\х\ + ат2Х2 + ... + ашпхп = Ьт. При этом через х\, Х2,..., хп обозначены неизвестные, подлежащие определению (число их п не предполагается обязательно равным числу уравнений т); величины аи, а\2,..., ашп, называемые коэффициен- коэффициентами системы, и величины Ь\, 62,..., Ьш, называемые свободными членами, предполагаются известными. Каждый коэффициент системы О См. выпуск «Аналитическая геометрия», дополнение к гл. 1.
64 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ ГЛ. 3 dij имеет два индекса, первый из которых г указывает номер урав- уравнения, а второй j — номер неизвестного, при котором стоит этот коэффициент. Система C.1) называется однородной, если все ее свободные члены b\, &2,..., bm равны нулю. Если хотя бы один из свободных членов Ь\, 62,..., bm отличен от нуля, то система C.1) называется неоднородной. Система C.1) называется квадратной, если число т составляющих ее уравнений равно числу неизвестных п. Решением системы C.1) называется такая совокупность п чисел с\, С2,..., сп, которая при подстановке в систему C.1) на место неиз- неизвестных х\, Х2,..., хп обращает все уравнения этой системы в тожде- тождества. Не всякая система вида C.1) имеет решения. Так, система линей- линейных уравнений Х\ + Х2 = 1, Х\ + Х2 = 2 заведомо не имеет ни одного решения (ибо если бы существовало решение этой системы, то при подстановке этого решения в левых частях обоих уравнений стояли бы одинаковые числа и мы получили бы, что 1=2). Система уравнений вида C.1) называется совместной, если она имеет хотя бы одно решение, и несовместной, если у нее не существу- существует ни одного решения. Совместная система вида C.1) может иметь или одно решение, или несколько решений. Два решения совместной системы вида C.1) c\l\ ci , •••, Сп B) B) B) и с\ , ci> ,..., сп называются различными, если нарушается хотя бы одно из равенств r(l) _ rB) Jl) _ J2) A) _ B) С1 — С1 ' С2 — С2 ' ' ' ' ' сп — сп • Совместная система вида C.1) называется определенной, если она имеет единственное решение. Совместная система вида C.1) называется неопределенной, если у нее существуют по крайней мере два различных решения. Весьма удобно записывать линейную систему C.1) в матричной форме. Для этого используем введенное в п. 2 § 1 гл. 1 понятие произве- произведения двух матриц (таких, что число столбцов первой из этих матриц равно числу строк второй из матриц). В качестве перемножаемых матриц возьмем две матрицы: матрицу А = аи а\2 ... а\п Ci2\ CL22 ... 0,2-п C.2) содержащую т строк и п столбцов и составленную из коэффициентов при неизвестных (такую матрицу мы в дальнейшем будем называть
УСЛОВИЕ СОВМЕСТНОСТИ ЛИНЕЙНОЙ СИСТЕМЫ 65 основной матрицей системы C.1)), и матрицу X, содержащую п строк и 1 столбец, т. е. один столбец вида X = C.3) Согласно правилу перемножения двух матриц 0 произведение АХ матрицы C.2) на матрицу C.3) представляет собой матрицу, содержа- содержащую т строк и 1 столбец, т. е. один столбец следующего вида: а\\х\ а\пхп C.4) Система равенств C.1) означает, что этот столбец C.4) совпадает со столбцом В = C.5) Таким образом, в матричной записи систему C.1) можно заменить одним эквивалентным ей матричным уравнением АХ = В, C.6) в котором матрицы А, X и В определяются соотношениями C.2), C.3) и C.5). Решение матричного уравнения C.6) заключается в отыскании такого столбца C.3), который при заданной матрице C.2) и заданном столбце правых частей C.5) обращает уравнение C.6) в тождество. В этом и в следующем параграфах мы выясним в отношении ли- линейной системы C.1) следующие три вопроса: 1) способ установления того, является система C.1) совместной или нет, 2) способ установления того, является система C.1) (в случае ее совместности) определенной или нет, 3) способ отыскания единственного решения совместной систе- системы C.1) (в случае ее определенности) и отыскания всех ее решений (в случае ее неопределенности). 2. Нетривиальная совместность однородной системы. Начнем с рассмотрения однородной линейной системы вида C.1), т.е. системы а\\х\ 0-21 X1 п = О, п = О, C.7) аш\х\ ашпхп = 0. 1) См. п. 2 § 1 гл. 1, формулу A.4). 3 Линейная алгебра
66 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ ГЛ. 3 Сразу же отметим, что эта система всегда совместна, ибо она всегда обладает так называемым тривиальным (или нулевым) решением х\ = = Х2 = • • • = хп = 0 0 . Возникает вопрос о том, при каких условиях однородная система C.7) имеет, кроме указанного тривиального решения, еще и другие решения (т.е. является «нетривиально совместной»). Этот вопрос решается довольно просто. Заметим, что существо- существование нетривиального решения системы C.7) эквивалентно линейной зависимости столбцов матрицы C.2) (ибо линейная зависимость столб- столбцов матрицы C.2) означает, что существуют числа х\, Х2,..., хп, не все равные нулю и такие, что справедливы равенства C.7)). Но в силу теоремы 1.6 о базисном миноре линейная зависимость столбцов матрицы C.2) будет иметь место тогда и только тогда, когда не все столбцы этой матрицы являются базисными, т.е. тогда и толь- только тогда, когда порядок г базисного минора матрицы C.2) меньше числа п ее столбцов. Мы приходим к следующей теореме. Теорема 3.1. Однородная система C.7) имеет нетривиальные решения тогда и только тогда, когда ранг г матрицы C.2) меньше числа п ее столбцов. Следствие. Квадратная однородная система2) имеет нетри- нетривиальные решения тогда и только тогда, когда определитель, со- составленный из коэффициентов при неизвестных, равен нулю. В самом деле, в случае квадратной однородной системы C.7), т.е. при т = п ранг г матрицы C.2) будет меньше числа т = п тогда и только тогда, когда определитель этой матрицы равен нулю. 3. Условие совместности общей линейной системы. Установим теперь необходимое и достаточное условие совместности общей (вооб- (вообще говоря, неоднородной) системы вида C.1). С этой системой связаны две матрицы: матрица А, определяемая соотношением C.2), которую принято называть основной матрицей системы C.1) (она составлена из коэффициентов при неизвестных), и матрица и = an ai2 ... a\n b\ C.8) «m2 которую принято называть расширенной матрицей системы C.1) (она получается из основной матрицы путем добавления к этой матрице столбца C.5) свободных членов). Справедлива следующая основная теорема. х) Действительно, подставив в систему C.7) нули на место всех неизвест- неизвестных х\, Х2,..., хп, мы обратим в тождества все уравнения этой системы. 2) То есть система C.7), у которой число уравнений т равно числу неиз- неизвестных п.
§ 1 ] УСЛОВИЕ СОВМЕСТНОСТИ ЛИНЕЙНОЙ СИСТЕМЫ 67 Теорема 3.2 (теорема Кронекера-Капелли 0 . Для того чтобы линейная система C.1) являлась совместной, необходимо и доста- достаточно, чтобы ранг расширенной матрицы этой системы был равен рангу ее основной матрицы. Доказательство. 1) Необходимость. Пусть система C.1) совместна, т.е. существуют такие числа с\, С2,..., сп, что справедливы равенства а\\с\ + а\2С2 + ... + а\псп = Ь\, + U22C2 + ... + CL2nCn = &2, /g g\ аш\С1 + аш2С2 + ... + атпсп = Ьш. Обозначим через г ранг основной матрицы системы C.1) и рассмотрим линейную оболочку L г базисных столбцов этой матрицы. В силу теоремы 1.6 о базисном миноре любой столбец основной матрицы принадлежит указанной линейной оболочке L. Иными словами, любой столбец расширенной матрицы C.8), кроме последнего ее столбца, принадлежит указанной линейной оболочке L. Из равенств C.9) следует, что и последний столбец расширенной матрицы C.8) принадлежит линейной оболочке L (ибо этот последний столбец в силу равенств C.9) линейно выражается через все столбцы основной матрицы и поэтому линейно выражается через ее базисные столбцы). Таким образом, все столбцы расширенной матрицы C.8) принадлежат указанной линейной оболочке L. В п. 2 § 3 гл. 2 мы уже установили, что размерность указанной линейной оболочки L равна г. Это означает, что любые г + 1 столбцов расширенной матрицы C.8) линейно зависимы, т. е. ранг расширенной матрицы (равный макси- максимальному числу линейно независимых столбцов этой матрицы) также равен числу г. Необходимость доказана. 2) Достаточность. Пусть ранги основной и расширенной мат- матриц совпадают. Тогда г базисных столбцов основной матрицы бу- будут являться базисными столбцами и расширенной матрицы C.8) 2). По теореме 1.6 о базисном миноре, последний столбец расширенной матрицы C.8) представляет собой некоторую линейную комбинацию указанных г базисных столбцов. Стало быть, последний столбец рас- расширенной матрицы C.8) представляет собой некоторую линейную ком- комбинацию и всех столбцов основной матрицы C.2) 3), т. е. существуют числа с\, С2,..., сп такие, что справедливы равенства C.9). Послед- Последние равенства означают, что числа с\, С2,..., сп представляют собой решение системы C.1), т.е. эта система является совместной. Теорема полностью доказана. 1) Леопольд Кронекер A823-1891) — немецкий математик, Альфред Капел- ли A855-1910) — итальянский математик. 2) Ибо указанные г базисных столбцов линейно независимы, а большего чем г числа линейно независимых столбцов расширенная матрица не имеет. 3) Не изменяя линейной комбинации г базисных столбцов, мы можем доба- добавить к ней все небазисные столбцы с множителями, равными нулю.
68 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ ГЛ. 3 §2. Отыскание решений линейной системы Теорема Кронекера-Капелли устанавливает необходимое и доста- достаточное условие совместности линейной системы, но не дает способа нахождения решений этой системы. В этом параграфе мы займемся отысканием решений линейной системы C.1). Сначала мы рассмотрим простейший случай квадрат- квадратной системы линейных уравнений с отличным от нуля определителем основной матрицы, а затем перейдем к отысканию совокупности всех решений общей линейной системы вида C.1). 1. Квадратная система линейных уравнений с определителем основной матрицы, отличным от нуля. Пусть дана квадратная си- система линейных уравнений а\\х\ + а 12^2 + • • • + а\пхп = Ь\, + + • • • + а2пхп = b2, /g jqx ап\х\ + ап2Х2 + ... + аппхп = Ьп с отличным от нуля определителем А основной матрицы А = an CL\2 ... CL\n U2\ O>22 • • • CL2n C.11) Докажем, что такая система имеет, и притом единственное, реше- решение, и найдем это решение. Сначала докажем, что система C.10) может иметь только одно решение (т. е. докажем единственность решения системы C.10) в предположении его существования). Предположим, что существуют какие-либо п чисел х\, Х2,..., хп такие, что при подстановке этих чисел в систему C.10) все уравнения этой системы обращаются в тождества (т. е. существует некоторое ре- решение системы C.10) х\, Х2,..., хп). Тогда, умножая тождества C.10) соответственно на алгебраические дополнения A\j, A2j,..., Anj эле- элементов j-ro столбца определителя А матрицы C.11) и складывая затем получающиеся при этом тождества, мы получим (для любого номера j, равного 1, 2,..., п) a2iA2j + ... + aniAnj) = b\AXj + b2A2j + ... + bnAnj. i=\ Учитывая, что сумма произведений элементов г-го столбца на соответ- соответствующие алгебраические дополнения элементов j-ro столбца равна нулю при г ф j и равна определителю А матрицы C.11) при г = j 0 , мы получим из последнего равенства XjA = b\AXj + b2A2j + ... + bnAnj. C.12) О См. свойство 4° из п. 4 §2 гл. 1.
§2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 69 Обозначим символом Aj(fr^) (или, более кратко, символом Aj) определитель, получающийся из определителя А основной матрицы C.11) заменой его j-го столбца столбцом из свободных членов b\,b2,...,bn (с сохранением без изменения всех остальных столб- столбцов А). Заметим, что в правой части C.12) стоит именно определитель AjFi) /, и это равенство принимает вид XjA = Aj (j = 1, 2,..., п). C.13) Поскольку определитель А матрицы C.11) отличен от нуля, равен- равенства C.13) эквивалентны соотношениям *i = x (i = 1> 2>¦¦¦'п)- (ЗЛ4) Итак, мы доказали, что если решение х\, Х2,..., хп системы C.10) с определителем А основной матрицы C.11), отличным от нуля, существует, то это решение однозначно определяется формула- формулами C.14). Формулы C.14) называются формулами Крамера 2). Еще раз подчеркнем, что формулы Крамера пока получены нами в предположении существования решения и доказывают его единствен- единственность. Остается доказать существование решения системы C.10). Для этого в силу теоремы Кронекера-Капелли достаточно доказать, что ранг основной матрицы C.11) равен рангу расширенной матрицы 3) an ai2 ... a\n b\ И = C.15) но это очевидно, ибо в силу соотношения А ф 0, ранг основной матри- матрицы равен п, а ранг содержащей п строк расширенной матрицы C.15) больше числа п быть не может и потому равен рангу основной матрицы. Тем самым полностью доказано, что квадратная система линей- линейных уравнений C.10) с определителем основной матрицы, отличным от нуля, имеет, и притом единственное, решение, определяемое формулами Крамера C.14). х) Чтобы убедиться в этом, достаточно записать разложение определителя Aj(bi) по элементам г-го столбца. 2) Габриель Крамер A704-1752) — швейцарский математик. 3) Существует и другой способ доказательства существования решения системы C.10), заключающийся в проверке того, что числа х\, Х2,..., хп, определяемые формулами Крамера C.14), обращают в тождества все уравнения системы C.10).
70 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [гл. 3 Х2 , в = Ъх Ь-2 К Доказанное нами утверждение еще проще устанавливается матрич- матричным способом. Для того чтобы сделать это, заменим (как и в п. 1 § 1) систему C.10) эквивалентным ей матричным уравнением АХ = В, C.16) где А — основная матрица системы C.11), а X и В — столбцы, X = первый из которых подлежит определению, а второй задан. Так как определитель А матрицы А отличен от нуля, то существует обратная матрица А~х (см. п. 7 §2 гл. 1). Предположим, что существует решение системы C.10), т.е. су- существует столбец X, обращающий в тождество матричное уравне- уравнение C.16). Помножая указанное тождество слева на обратную матри- матрицу А~\ будем иметь А~Х(АХ) = А~ХВ. C.17) Учтем теперь, что в силу сочетательного свойства произведения трех матриц (см. п. 2 § 1 гл. 1) и в силу соотношения А~х А = Е, где Е — единичная матрица (см. п. 7 §2 гл. 1), А~Х(АХ) = (А~1А)Х = ЕХ = = X, так что мы получим из C.17) X = А~ХВ. C.18) Развертывая равенство C.18) и учитывая вид обратной матрицы 0 , мы и получим для элементов столбца X формулы Крамера. Итак, мы доказали, что если решение матричного уравнения C.16) существует, то оно однозначно определяется соотношением C.18), эк- эквивалентным формулам Крамера. Легко проверить, что столбец X, определяемый соотношением C.18), в самом деле является решением матричного уравнения C.16), т. е. при подстановке в это уравнение обращает его в тождество. В са- самом деле, если столбец X определяется равенством C.18), то АХ = = А(А~ХВ) = (АА~Х)В = ЕВ = В. Итак, если определитель А матрицы А отличен от нуля (т. е. ес- если эта матрица является невырожденной), то существует, и при- притом единственное, решение матричного уравнения C.16), определя- определяемое соотношением C.18), эквивалентным формулам Крамера. Пример. Найдем решение квадратной системы линейных урав- уравнений х\ + 2^2 + Зжз + 4^4 = 30, —х\ + 2x2 — З^з + 4^4 = Ю, Х2 ~ Х3 Н~ Х4 = 3, Х\ + Х2 + Жз + Х4 = 10 1) См. формулу A.41) из п. 7 §2 гл. 1.
§2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 71 с отличным от нуля определителем основной матрицы А = Поскольку Ai = 30 2 3 4 -12 3 4 3 1-11 10 1 1 1 1 2 30 4 -1 2 10 4 0 13 1 1 1 10 1 12 3 4 -12-3 4 0 1-11 1111 = -4, А2 = = -12, А4 = = -4. 1 30 3 4 -1 10 -3 4 0 3-11 1 10 1 1 1 2 3 30 -1 2 -3 10 0 1-13 1 1 1 10 = -16, то, в силу формул Крамера, единственное решение рассматриваемой системы имеет вид х\ = 1, х% = 2, жз = 3, х\ = 4. Основное значение формул Крамера состоит в том, что они дают явное выражение для решения квадратной системы линейных урав- уравнений (с определителем, отличным от нуля) через коэффициенты уравнений и свободные члены. Практическое использование формул Крамера связано с довольно громоздкими вычислениями (для реше- решения системы п уравнений с п неизвестными приходится вычислять (п + 1) определитель п-го порядка). К этому следует добавить, что если коэффициенты уравнений и свободные члены представляют собой лишь приближенные значения каких — либо измеряемых физических величин или округляются в процессе вычислений, то использование формул Крамера может привести к большим ошибкам и в ряде случаев является нецелесообразным. В §4 гл.4 будет изложен метод регуляризации, принадлежащий А.Н. Тихонову и позволяющий находить решение линейной системы с точностью, соответствующей точности задания матрицы коэффици- коэффициентов уравнений и столбца свободных членов, а в гл. 6 дается пред- представление о так называемых итерационных методах решения линейных систем, позволяющих решать эти системы при помощи последователь- последовательных приближений неизвестных. В заключении отметим, что в этом пункте мы исключили из рас- рассмотрения случай обращения в нуль определителя А основной мат- матрицы системы C.10). Этот случай будет содержаться в общей теории систем т линейных уравнений с п неизвестными, излагаемой в следу- следующем пункте. 2. Отыскание всех решений общей линейной системы. Рассмот- Рассмотрим теперь общую систему т линейных уравнений с п неизвестны- неизвестными C.1). Предположим, что эта система совместна и что ранг ее основ- основной и расширенной матриц равен числу г. Не ограничивая общности, мы можем предположить, что базисный минор основной матрицы C.2) находится в левом верхнем углу этой матрицы (общий случай сводится
72 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ ГЛ. 3 к этому случаю посредством перестановки в системе C.1) уравнений и неизвестных). Тогда первые г строк как основной матрицы C.2), так и расширен- расширенной матрицы C.8) являются базисными строками этих матриц 0, и, по теореме 1.6 о базисном миноре, каждая из строк расширенной матри- матрицы C.8), начиная с (г + 1)-й строки, является линейной комбинацией первых г строк этой матрицы. В терминах системы C.1) это означает, что каждое из уравнений этой системы, начиная с (г + 1)-го уравнения, является линейной комбинацией (т. е. следствием) первых г уравнений этой системы (т. е. всякое решение первых г уравнений системы C.1) обращает в тож- тождества и все последующие уравнения этой системы). Таким образом, достаточно найти все решения лишь первых г урав- уравнений системы C.1). Рассмотрим первые г уравнений системы C.1), записав их в виде а\\х\ + а\2Х2 + ••• + а\гхг = Ь\ - ai(r+i);rr+i - ... - а\пхп, п2\Х\ + CL22X2 + ... + п2гХг = &2 ~ 0>2{г+\)хг+\ ~ ••• ~ «2n^n, /g jq\ аг\х\ + аг2Х2 + ... + arrxr = br — аг(г+1)Жг+1 — ... — arnxn. Если мы придадим неизвестным жг+1,..., жп совершенно произ- произвольные значения cr+i,..., cn, то система C.19) превратится в квад- квадратную систему г линейных уравнений для г неизвестных х\, Х2,... ..., хг, причем определителем основной матрицы этой системы явля- является отличный от нуля базисный минор матрицы C.2). В силу ре- результатов предыдущего пункта, эта система C.19) имеет единственное решение, определяемое формулами Крамера, т. е. для произвольно вы- выбранных cr+i,..., сп существует единственная совокупность г чисел с\, С2,..., сг, обращающих в тождества все уравнения системы C.19) и определяющихся формулами Крамера. Чтобы записать это единственное решение, договоримся обозначать символом Mj(di) определитель, получающийся из базисного минора М матрицы C.2) заменой его j-ro столбца столбцом из чисел d\, cfe,--- ..., d{,..., dr (с сохранением без изменения всех остальных столб- столбцов М). Тогда, записывая решение системы C.19) с помощью формул Крамера и пользуясь линейным свойством определителя, мы получим - _L м (ь - - \- Cj — —— IVljiUi G^er_i_n Cr_|_i ••• 0>гпСп) — M v ' = -j^ Wj(bi) - cr+\Mj(anr+\)) - ... - cnMj(ain)] C.20) l) Так как ранги основной и расширенной матриц оба равны г, то базисный минор основной матрицы будет одновременно являться базисным минором и расширенной матрицы.
§2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 73 Формулы C.20) выражают значения неизвестных Xj = Cj (j = 1, 2,... ..., г) через коэффициенты при неизвестных, свободные члены и про- произвольно заданные параметры сг+ь ..., сп. Докажем, что формулы C.20) содержат любое решение системы C.1). В самом деле, пусть с^, с!],..., с^, с^+1,..., с®п — произвольное решение указанной системы. Тогда оно является решением и систе- системы C.19). Но из системы C.19) величины с°{, с!],..., с°г определяются через величины с^+1,..., с^ однозначно и именно по формулам Краме- Крамера C.20). Таким образом, при cr+i = с^+1, ..., сп = с^ формулы C.20) дают нам как раз рассматриваемое решение с^, с!],..., с1^, с^+1,..., с^. Замечание. Если ранг г основной и расширенной матриц си- системы C.1) равен числу неизвестных п, то в этом случае соотноше- соотношения C.20) переходят в формулы Mj(bi) /• 1 о ч ^ ( 12) определяющие единственное решение системы C.1). Таким об- образом, система C.1) имеет единственное решение (т.е. является определенной) при условии, что ранг г основной и расширенной ее матриц равен числу неизвестных п (и меньше числа уравнений т или равен ему). Пример. Найдем все решения линейной системы х\ — Х2 + жз — х\ = 4, х\ +х2 + 2ж3 + 3ж4 = 8, 2ж1 + 4ж2 + 5ж3 + 10ж4 = 20, ( } 2х\ — Ах2 + хо, — 6x4 — 4. Нетрудно убедиться в том, что ранг как основной, так и расширенной матрицы этой системы равен двум (т. е. эта система совместна), причем можно считать, что базисный минор М стоит в левом верхнем углу 1 -1 1 1 основной матрицы, т. е. М = = 2. Но тогда, отбрасывая два последних уравнения и задавая произвольно сз и с4, мы получим си- систему х\ - х2 = 4 - с3 + с4, х\ + Х2 = 8 — 2сз — Зс4, из которой в силу формул Крамера получаем значения 3 1 х\ = с\ = 6 — - сз — с4, Ж2 = С2 = 2 — - сз — 2с4. C.22) Таким образом, четыре числа (б - | сз - С4, 2 - i сз - 2с4, сз, с4) C.23) при произвольно заданных значениях сз и с4 образуют решение систе- системы C.21), причем строка C.23) содержит все решения этой системы.
74 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ ГЛ. 3 3. Свойства совокупности решений однородной системы. Рас- Рассмотрим теперь однородную систему т линейных уравнений с п неиз- неизвестными C.7), предполагая, как и выше, что матрица C.2) имеет ранг, равный г, и что базисный минор М расположен в левом верхнем углу этой матрицы. Поскольку на этот раз все Ь{ равны нулю, вместо формул C.20) мы получим следующие формулы: cj = -ji[Cr+lMj(ai{r+l)) + ... + cnMj(ain)} (j = 1, 2,..., г), C.24) выражающие значения неизвестных Xj = Cj (j = 1, 2,..., г) через коэффициенты при неизвестных и произвольно заданные значения сг+ь ..., сп. В силу доказанного в предыдущем пункте формулы C.24) содержат любое решение однородной системы C.7). Убедимся теперь в том, что совокупность всех решений однород- однородной системы C.7) образует линейное пространство. Пусть Х\ = (х\ ,..., хп ) и Х% = (х\ ,..., хп ) — два произволь- произвольных решения однородной системы C.7), а Л — любое вещественное число. В силу того, что каждое решение однородной системы C.7) является элементом линейного пространства Ап всех упорядоченных совокупностей п чисел, достаточно доказать, что каждая из двух совокупностей ХХ+Х2 = AXi = также является решением однородной системы C.7). Рассмотрим любое уравнение системы C.7), например г-е уравне- уравнение, и подставим в это уравнение на место неизвестных элементы ука- указанных совокупностей. Учитывая, что Х\ и Х^ — решения однородной системы, будем иметь v^ Г (О , BI v^ A) , v^ B) r\ j = \ j = \ j = \ n = Л ^^ aijxj = 0» а это и означает, что совокупности Х\ + Х^ и \Х\ являются решени- решениями однородной системы C.7). Итак, совокупность всех решений однородной системы C.7) обра- образует линейное пространство, которое мы обозначим символом R. Найдем размерность этого пространства R и построим в нем базис. Докажем, что в предположении о том, что ранг матрицы однородной системы C.7) равен г, линейное пространство R всех решений од- однородной системы C.7) изоморфно линейному пространству Ап~г всех упорядоченных совокупностей (п — г) чисел 0 . Пространство Ат введено в примере 3 п. 1 § 1 гл. 2.
§2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 75 Поставим в соответствие каждому решению (ci,...,cr, cr+i,... ..., сп) однородной системы C.7) элемент (cr+i,..., cn) пространства А(п-г)^ Поскольку числа сг+ь ..., сп могут быть выбраны произвольно и при каждом выборе с помощью формул C.24) однозначно опре- определяют решение системы C.7), то установленное нами соответствие является взаимно однозначным. Далее заметим, что если элементы (сг]_{,..., сп ) и (сг]_{,..., сп) пространства Ап~г отвечают элемен- / A) A) A) 0)\ / B) B) B) B)ч там [с\,...,Сг, с^р ..., eh ) и (cj ,..., Сг , с^р ..., Сп ) про- пространства R, то из формул C.24) сразу же следует, что элементу (cr+i + cr+i' •••' с™} + с^2)) отвечает элемент (c\l) + cf\ ..., с^ + + с! , сг_^_х + с^р ..., сп + сп ), а элементу (Ас^,..., Хсп ) при любом вещественном А отвечает элемент (Aq ,..., Хсг , Ас^р ... ..., Хсп ). Тем самым доказано, что установленное нами соответствие является изоморфизмом. Итак, линейное пространство R всех решений однородной системы C.7) с п неизвестными и рангом основной матрицы, равным г, изоморфно пространству Ап~г и, стало быть, имеет размерность п - г. Любая совокупность из (п - г) линейно независимых решений однородной системы C.7) образует (в силу теоремы 2.5) базис в пространстве R всех решений и называется фундаментальной совокупностью решений однородной системы C.7). Для построения фундаментальной совокупности решений можно отправляться от любого базиса пространства Ап~г. Отвечающая этому базису совокупность решений системы C.7), в силу изоморфизма, бу- будет линейно независимой и поэтому будет являться фундаментальной совокупностью решений. Особо выделяют фундаментальную совокупность решений систе- системы C.7), отвечающую простейшему базису ei = A, 0, 0,..., 0), е% = = @, 1, 0,..., 0), ..., еп_г = @, 0, 0,..., 1) пространства Ап~г и на- называемую нормальной фундаментальной совокупностью решений однородной системы C.7). При сделанных выше предположениях о ранге и расположении базисного минора, в силу формул C.24), нормальная фундаментальная совокупность решений однородной системы C.7) имеет вид: / Mi(gi(r+i)) Mr(gi(r+i)) \ Х'-{ м "•" М '1'°"--'0J' Mi(gi(r+2)) Mr(ai{r+2)) \ М '••" М '°'1"--'0J' C.25) Y , Mi(ain) Mr(ain)
76 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ ГЛ. 3 По определению базиса любое решение X однородной системы C.7) представимо в виде X = СХХХ + С2Х2 + ... + Сп-гХп_г, C.26) где С\, G2,..., Сп-Г — некоторые постоянные. Поскольку в формуле C.26) содержится любое решение однородной системы C.7), то эта формула дает общее решение рассматриваемой однородной си- системы. Пример. Рассмотрим однородную систему уравнений: Х\ — Х2 + Х% — Х\ = О, Х\ + Х2 + 2^3 + 3^4 = О, 2ж1 + 4х2 + 5ж3 + Юх4 = 0, C'27) 2а?1 — 4x2 + ^з — 6ж4 = О, соответствующую неоднородной системе C.21), разобранной в примере в конце предыдущего пункта. Там мы выяснили, что ранг г матрицы этой системы равен двум, и взяли в качестве базисного минор, стоящий в левом верхнем углу указанной матрицы. Повторяя рассуждения, проведенные в конце предыдущего пункта, мы получим вместо формул C.22) соотношения 3 1 9 с\ = -g сз - с4, с2 = -- с3 - 2с4, справедливые при произвольно выбранных сз и с4. С помощью этих соотношений (полагая сначала сз = 1, с4 = 0, а затем сз = 0, с4 = 1) мы получим нормальную фундаментальную совокупность двух решений системы C.27): X2 = (-1,-2, 0,1). Общее решение однородной системы C.27) имеет вид Х = СХ (-|, -i, 1, О) + С2(-1, -2, 0, 1), C.28) где С\ и Сч — произвольные постоянные. В заключение этого пункта установим связь между решениями неоднородной линейной системы C.1) и соответствующей ей однород- однородной системы C.7) 0. Докажем следующие два утверждения. 1°. Сумма любого решения неоднородной системы C.1) с любым решением соответствующей однородной системы C.7) представля- представляет собой решение системы C.1). В самом деле, если с\,..., сп — решение системы C.1), a d\,... ..., dn — решение соответствующей ей однородной системы C.7), то, *) С теми же самыми коэффициентами при неизвестных.
§2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 11_ подставив в любое (например, в г-е) уравнение системы C.1) на место неизвестных числа с\ + d\, ..., сп + dn, получим j=\ j=\ j=\ что и требовалось доказать. 2°. Разность двух произвольных решений неоднородной систе- системы C.1) является решением соответствующей однородной систе- системы C.7). В самом деле, если с[,..., с'п и с7/,..., с" — два произвольных решения системы C.1), то, подставив в любое (например, в г-е) урав- уравнение системы C.7) на место неизвестных числа с\ — с", ..., с'п — с", получим п п п J2 CLij^'j ~ С") = J2 <*ijCfj ~ Yl ai3C'j =Ь{-Ь{=0, j=\ j=\ j=\ что и требовалось доказать. Из доказанных утверждений вытекает, что, найдя одно решение неоднородной системы C.1) и складывая его с каждым решением соответствующей однородной системы C.7), мы получим все реше- решения неоднородной системы C.1). Другими словами, сумма частного решения неоднородной систе- системы C.1) и общего решения соответствующей однородной системы C.7) дает общее решение неоднородной системы C.1). В качестве частного решения неоднородной системы C.1) есте- естественно взять то его решение О ^^V C.29) которое получится, если в формулах C.20) положить равными нулю все числа cr+i,..., cn. Складывая это частное решение с общим ре- решением C.26) соответствующей однородной системы, мы получим сле- следующее выражение для общего решения неоднородной системы C.1): X = Хо + СХХХ + С2Х2 + ... + Сп-гХп_г. C.30) В этом выражении Хо обозначает частное решение C.29), С\, С2, ••• ..., Сп-Г — произвольные постоянные, а Х\, Х2,..., Хп_г — элемен- элементы нормальной фундаментальной совокупности решений C.25) соот- соответствующей однородной системы. Так, для рассмотренной в конце предыдущего пункта неоднородной системы C.21) частное решение вида C.29) равно Хо = F, 2, 0, 0). Складывая это частное решение с общим решением C.28) соответ- 1) При этом предполагается, как и выше, что ранги основной и расширенной матриц системы C.1) равны г и что базисный минор находится в левом верхнем углу этих матриц.
78 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ ГЛ. 3 ствующей однородной системы C.27), мы получим следующее общее решение неоднородной системы C.21): X = F, 2, 0, 0) + С, (-|, ~, 1, О) + <72(-1, -2, 0, 1). Здесь С\ и Съ — произвольные постоянные. 4. Заключительные замечания о решении линейных систем. Развитые в предыдущих пунктах методы решения линейных систем упираются в необходимость вычисления ранга матрицы и нахождения ее базисного минора. После того, как базисный минор найден, решение сводится к технике вычисления определителей и к использованию формул Крамера. Для вычисления ранга матрицы можно использовать следующее правило: при вычислении ранга матрицы следует переходить от миноров меньших порядков к минорам больших порядков] при этом, если уже найден отличный от нуля минор М порядка к, то требу- требуют вычисления лишь миноры порядка (к + 1), окаймляющие 0 этот минор М; в случае равенства нулю всех окаймляющих миноров порядка (к + 1) ранг матрицы равен к 2). Укажем и другое правило вычисления ранга матрицы. Заметим, что со строками (столбцами) матрицы можно производить три элементар- элементарные операции, не изменяющие ранга этой матрицы: 1) перестановку двух строк (или двух столбцов), 2) умножение строки (или столбца) на любой отличный от нуля множитель, 3) прибавление к одной строке (столбцу) произвольной линейной комбинации других строк (столб- (столбцов) 3). Будем говорить, что матрица ||а^-||, содержащая т строк и п столбцов, имеет диагональный вид, если равны нулю все ее элементы, отличные от аи, а,22, •••, о,гг, где г = min{m, n}. Ранг такой матрицы, очевидно, равен г. Убедимся в том, что посредством трех элементарных операций любую матрицу аи ... а\п А = C.31) можно привести к диагональному виду (что и позволяет вычислить ее ранг). х) То есть содержащие внутри себя минор М. 2) В самом деле, в указанном случае все строки (столбцы) матрицы при- принадлежат линейной оболочке ее к строк (столбцов), на пересечении которых стоит минор М, а размерность указанной линейной оболочки равна к. 3) Эти три операции не изменяют ранга матрицы вследствие того, что операции 1) и 2) не изменяют максимального числа линейно независимых строк (столбцов) матрицы, а операция 3) обладает тем свойством, что линейная оболочка всех строк (столбцов), имевшихся до проведения этой операции, совпадает с линейной оболочкой всех строк (столбцов), полученных после проведения этой операции.
§2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 79 В самом деле, если все элементы матрицы C.31) равны нулю, то эта матрица уже приведена к диагональному виду. Если же у мат- матрицы C.31) есть отличные от нуля элементы, то путем перестановки двух строк и двух столбцов можно добиться того, чтобы был отличен от нуля элемент аи. Умножая после этого первую строку матрицы на а^1, мы превратим элемент аи в единицу. Вычитая далее из j-ro столбца матрицы (при j = 2, 3,..., п) первый столбец, умноженный на a\j, а затем вычитая из г-й строки (при г = 2, 3,..., п) первую строку, умноженную на аи, мы получим вместо C.31) матрицу следующего вида: 0 0 о Совершая уже описанные нами операции с матрицей, взятой в рамку, и продолжая действовать аналогичным способом, мы после конечного числа шагов получим матрицу диагонального вида. Изложенные в предыдущих пунктах методы решения линейных систем, использующие, в конечном итоге, аппарат формул Крамера, могут привести к большим погрешностям в случае, когда значения ко- коэффициентов уравнений и свободных членов заданы приближенно или когда производится округление этих значений в процессе вычислений. В первую очередь это относится к случаю, когда матрица, отвечающая основному определителю (или базисному минору), является плохо обу- обусловленной (т. е. когда «малым» изменениям элементов этой матрицы отвечают «большие» изменения элементов обратной матрицы). Есте- Естественно, что в этом случае решение линейной системы будет неустой- неустойчивым (т. е. «малым» изменениям значений коэффициентов уравнений и свободных членов будут отвечать «большие» изменения решения). Отмеченные обстоятельства приводят к необходимости разработки как других (отличных от формул Крамера) теоретических алгоритмов отыс- отыскания решения, так и численных методов решения линейных систем. В §4 гл.4 мы познакомимся с методом регуляризации А.Н. Тихо- Тихонова отыскания так называемого нормального (т. е. наиболее близкого к началу координат) решения линейной системы. В гл.6 будут изложены основные сведения о так называемых ите- итерационных методах решения линейных систем, позволяющих решать эти системы при помощи последовательных приближений неизвестных.
Глава 4 ЕВКЛИДОВЫ ПРОСТРАНСТВА Из курса аналитической геометрии читатель знаком с понятием скалярного произведения двух свободных векторов и с четырьмя ос- основными свойствами указанного скалярного произведения. В насто- настоящей главе изучаются линейные пространства любой природы, для элементов которых каким-либо способом (причем безразлично каким) определено правило, ставящее в соответствие любым двум элементам число, называемое скалярным произведением этих элементов. При этом важно только, чтобы это правило обладало теми же четырьмя свойствами, что и правило составления скалярного произведения двух свободных векторов. Линейные пространства, в которых определено указанное правило, называются евклидовыми пространствами. В на- настоящей главе выясняются основные свойства произвольных евклидо- евклидовых пространств. § 1. Вещественное евклидово пространство и его простейшие свойства 1. Определение вещественного евклидова пространства. Вещественное линейное пространство R называется вещественным евклидовым пространством (или просто евклидовым простран- пространством), если выполнены следующие два требования. I. Имеется правило, посредством которого любым двум элементам этого пространства х и у ставится в соответствие вещественное число, называемое скалярным произведением этих элементов и обозначаемое символом (х, у). П. Указанное правило подчинено следующим четырем аксиомам: 1°. (х, у) = (у, х) (переместительное свойство или симметрия); 2°. (xi + Х2, у) = (хь у) + (х2, у) (распределительное свойство); 3°. (Ах, у) = А(х, у) для любого вещественного А; 4°. (х, х) > 0, если х — ненулевой элемент; (х, х) = 0, если х — нулевой элемент. Подчеркнем, что при введении понятия евклидова пространства мы абстрагируемся не только от природы изучаемых объектов, но и от конкретного вида правил образования суммы элементов, произведения элемента на число и скалярного произведения элементов (важно лишь, чтобы эти правила удовлетворяли восьми аксиомам линейного про- пространства и четырем аксиомам скалярного произведения).
§ 1 ] ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 8j_ Если же природа изучаемых объектов и вид перечисленных правил указаны, то евклидово пространство называется конкретным. Приведем примеры конкретных евклидовых пространств. Пример 1. Рассмотрим линейное пространство Во, всех свобод- свободных векторов. Скалярное произведение любых двух векторов опреде- определим так, как это было сделано в аналитической геометрии (т. е. как произведение длин этих векторов на косинус угла между ними). В кур- курсе аналитической геометрии была доказана справедливость для так определенного скалярного произведения аксиом 1°-4° 0 . Стало быть, пространство В% с так определенным скалярным произведением явля- является евклидовым пространством. Пример 2. Рассмотрим бесконечномерное линейное пространство С [а, Ь] всех функций x(t), определенных и непрерывных на сегменте а ^ t ^ Ь. Скалярное произведение двух таких функций x(t) и y(t) определим как интеграл (в пределах от а до Ь) от произведения этих функций ъ 'x{t)y{t)dt. D.1) Элементарно проверяется справедливость для так определенного ска- скалярного произведения аксиом 1°-4°. В самом деле, справедливость аксиомы 1° очевидна; справедливость аксиом 2° и 3° вытекает из ли- линейных свойств определенного интеграла; справедливость аксиомы 4° ъ вытекает из того, что интеграл § x2(t) dt от непрерывной неотрицатель- а ной функции x2(t) неотрицателен и обращается в нуль лишь тогда, когда эта функция тождественно равна нулю на сегменте а < t < Ъ 2) (т.е. является нулевым элементом рассматриваемого пространства). Таким образом, пространство С [а, Ь] с так определенным скалярным произведением представляет собой бесконечномерное евклидово про- пространство. Пример 3. Следующий пример евклидова пространства дает n-мерное линейное пространство Ап упорядоченных совокупностей п вещественных чисел, скалярное произведение двух любых элементов х= (х\, Х2,..., хп) и у = (г/1, у2,..., Уп) которого определяется ра- равенством (х, у) = a?!2/i + х2у2 + • • • + хпуп. D.2) Справедливость для так определенного скалярного произведения ак- аксиомы 1° очевидна; справедливость аксиом 2° и 3° легко проверяет- проверяется достаточно вспомнить определение операций сложения элементов О См. выпуск «Аналитическая геометрия», гл.2, §2, п.З. 2) См. выпуск «Основы математического анализа», часть I, свойства 1° и 2° из п. 1 §6 гл. 10.
82 ЕВКЛИДОВЫ ПРОСТРАНСТВА [гл. 4 и умножения их на числа: (х\, х2,..., хп) + B/ь 2/2,---, 2/п) = (^1 +2/1, ^2 + 2/2,---, жп + 2/п), наконец, справедливость аксиомы 4° вытекает из того, что (х, х) = = х\ + х\ + ... + х\ всегда является неотрицательным числом и обра- обращается в нуль лишь при условии х\ = Х2 = • • • = хп = 0. Рассмотренное в этом примере евклидово пространство часто обо- обозначают символом Еп. Пример 4. В том же самом линейном пространстве Ап введем скалярное произведение любых двух элементов х = (х\, Х2,..., хп) и у = (г/1, г/2, •••, Уп) не соотношением D.2), а другим, более общим, способом. Для этого рассмотрим квадратную матрицу порядка п an a\2 ... a\n A = D.3) Составим с помощью матрицы D.3) однородный многочлен второго порядка относительно п переменных х\, Х2,..., хп п п J2 Yl aikXiXk. D.4) г=1 к=\ Забегая вперед, отметим, что такой многочлен называется квадратич- квадратичной формой (порождаемой матрицей D.3)) 0 . Квадратичная форма D.4) называется положительно определен- определенной, если она принимает строго положительные значения для всех значений переменных х\, Х2,..., хп, одновременно не равных нулю 2). Так как при х\ = Х2 = ••• = хп = 0 квадратичная форма D.4), очевид- очевидно, равна нулю, то можно сказать, что положительно определенная квадратичная форма обращается в нуль лишь при условии х\ = = Х2 = • • • = Хп = 0. Потребуем, чтобы матрица D.3) удовлетворяла двум условиям. 1°. Порождала положительно определенную квадратичную фор- форму D.4). 2°. Была симметричной (относительно главной диагонали), т.е. удо- удовлетворяла условию aik = ам для всех г = 1, 2,..., п и k = I, 2,..., п. С помощью матрицы D.3), удовлетворяющей условиям 1° и 2°, опре- определим скалярное произведение двух любых элементов х = (х\, Х2,... 1) Квадратичные формы систематически изучаются в гл. 7 этой книги. 2) В гл. 7 этой книги будет указано необходимое и достаточное условие положительной определенности квадратичной формы.
§ 1 ] ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 83 ..., хп) и у = (г/1, г/2,..., уп) пространства Ап соотношением п п (х, у) = J2 Y1 агкХгУк- D.5) г=1 к=\ Легко проверить справедливость для так определенного скалярного произведения всех аксиом 1°-4°. В самом деле, аксиомы 2° и 3°, очевидно, справедливы при совершенно произвольной матрице D.3); справедливость аксиомы 1° вытекает из условия симметричности мат- матрицы D.3), а справедливость аксиомы 4° вытекает из того, что квад- квадратичная форма D.4), представляющая собой скалярное произведение (х, х), является положительно определенной. Таким образом, пространство Ап со скалярным произведением, определяемым равенством D.5), при условии симметричности матри- матрицы D.3) и положительной определенности порождаемой ею квадратич- квадратичной формы, является евклидовым пространством. Если в качестве матрицы D.3) взять единичную матрицу, то соотношение D.4) перейдет в D.2), и мы получим евклидово простран- пространство Еп, рассмотренное в примере 3. 2. Простейшие свойства произвольного евклидова прост- пространства. Устанавливаемые в этом пункте свойства справедливы для совершенно произвольного евклидова пространства как конечной, так и бесконечной размерности. Теорема 4.1. Для любых двух элементов х и у произвольного евклидова пространства справедливо неравенство (х,у)Ч(х, х)(у,у), D.6) называемое неравенством Коши-Буняковского. Доказательство. Для любого вещественного числа Л, в си- силу аксиомы 4° скалярного произведения, справедливо неравенство (Ах — у, Ах — у) > 0. В силу аксиом 1°-3°, последнее неравенство можно переписать в виде А2(х, х)-2А(х, у) + (у, у)^0. Необходимым и достаточным условием неотрицательности последнего квадратного трехчлена является неположительность его дискриминан- дискриминанта, т. е. неравенство О (х, уJ-(х,х)(у,уК0. D.7) Из D.7) сразу же вытекает неравенство D.6). Теорема доказана. Наша очередная задача — ввести в произвольном евклидовом про- пространстве понятие нормы (или длины) каждого элемента. Для этого введем понятие линейного нормированного пространства. 1) В случае (х, х) = 0 квадратный трехчлен вырождается в линейную функцию, но в этом случае элемент х является нулевым, так что (х, у) = 0 и неравенство D.7) также справедливо.
84 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ ГЛ. 4 Определение. Линейное пространство R называется нормирован- нормированным, если выполнены следующие два требования. I. Имеется правило, посредством которого каждому элементу х пространства R ставится в соответствие вещественное число, назы- называемое нормой (или длиной) указанного элемента и обозначаемое символом ||х||. П. Указанное правило подчинено следующим трем аксиомам: 1°. ||х|| > 0, если х — ненулевой элемент; ||х|| = 0, если х — нулевой элемент; 2°. ||Ах|| = |А| ||х|| для любого элемента х и любого вещественного числа А; 3°. для любых двух элементов х и у справедливо следующее нера- неравенство Цх + уИН + ЦуЦ, D.8) называемое неравенством треугольника {или неравенством Мин- ковского). Теорема 4.2. Всякое евклидово пространство является нормиро- нормированным, если норму любого элемента х в нем определить равенством D.9) Доказательство. Достаточно доказать, что для нормы, опреде- определенной соотношением D.9), справедливы аксиомы 1°-3° из определе- определения нормированного пространства. Справедливость для нормы аксиомы 1° сразу вытекает из аксиомы 4° скалярного произведения. Справедливость для нормы аксиомы 2° почти непосредственно вытекает из аксиом 1° и 3° скалярного произведения. Остается убедиться в справедливости для нормы аксиомы 3°, т. е. неравенства D.8). Будем опираться на неравенство Коши-Буняковско- го D.6), которое перепишем в виде |(х,у)|^Ум7М- D-7') С помощью последнего неравенства, аксиом 1°-4° скалярного произве- произведения и определения нормы получим ||х + у|| = V(x + y, х + у) = д/(х, х) + 2(х, у) + (у, у) Теорема доказана. Следствие. Во всяком евклидовом пространстве с нормой элементов, определяемой соотношением D.9), для любых двух эле- элементов х и у справедливо неравенство треугольника D.8).
§ 1 ] ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 85 Заметим далее, что в любом вещественном евклидовом про- пространстве можно ввести понятие угла между двумя произвольными элементами х и у этого пространства. В полной аналогии с векторной алгеброй, мы назовем углом ip между элементами х и у тот (изменя- (изменяющийся в пределах от 0 до тг) угол, косинус которого определяется соотношением Данное нами определение угла корректно, ибо в силу неравенства Коши-Буняковского D.7') дробь, стоящая в правой части последнего равенства, по модулю не превосходит единицы. Далее договоримся называть два произвольных элемента х и у евклидова пространства Е ортогональными, если скалярное произ- произведение этих элементов (х, у) равно нулю (в этом случае косинус угла (р между элементами х и у будет равен нулю). Снова апеллируя к векторной алгебре, назовем сумму х + у двух ортогональных элементов х и у гипотенузой прямоугольного тре- треугольника, построенного на элементах х и у. Заметим, что во всяком евклидовом пространстве справедлива теорема Пифагора: квадрат гипотенузы равен сумме квадратов катетов. В самом деле, поскольку х и у ортогональны и (х, у) = О, то в силу аксиом и определения нормы ||х + у||2 = (х + у, х + у) = = (х, х) + 2(х, у) + (у, у) = (х, х) + (у, у) = ||х||2 + ||у||2. Этот результат обобщается и на п попарно ортогональных элемен- элементов xi, Х2,..., хп: если z = xi + Х2 + ... + хп, то ||z||2 = (xi + х2 + ... + xn, xi + х2 + ... + хп) = = (хь xi) + (х2, х2) + ... + (хп, хп) = = ||х1||2 + ||х2||2 + ... + ||хп||2. В заключение запишем норму, неравенство Коши-Буняковского и неравенство треугольника в каждом из конкретных евклидовых про- пространств, рассмотренных в предыдущем пункте. В евклидовом пространстве всех свободных векторов с обычным определением скалярного произведения норма вектора а совпадает с его длиной |а|, неравенство Коши-Буняковского приводится к виду (а, ЬJ ^ |а|2 |Ь|2 0, а неравенство треугольника — к виду |a + b| ^ + |Ь| 2). О Для скалярного произведения векторов (a, b) = |a| |b| cos</? это неравен- неравенство тривиально вытекает из того, что cos2 <р ^ 1. 2) Если сложить векторы а и b по правилу треугольника, то это неравенство тривиально сводится к тому, что одна сторона треугольника не превосходит суммы двух других его сторон.
86 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ ГЛ. 4 В евклидовом пространстве С [а, Ь] всех непрерывных на сегменте a ^t ^ b функций х = x{t) со скалярным произведением D.1) норма Гь элемента х = x(t) равна л /J x2(t) dt, а неравенства Коши-Буняковско- V а го и треугольника имеют вид ъ -.2 б б 2(?) dt \ y2(t) dt, x(t) + y{t)f dt < W J *2(*) Л + W J 2/2(t) dt. у a V a Оба эти неравенства играют важную роль в различных разделах мате- математического анализа. В евклидовом пространстве Еп упорядоченных совокупностей п вещественных чисел со скалярным произведением D.2) норма любого элемента х = (х\, Х2, • • •, хп) равна ||х|| = J а неравенства Коши-Буняковского и треугольника имеют вид = Jх\ + х\ Наконец, в евклидовом пространстве упорядоченных совокупно- совокупностей п вещественных чисел со скалярным произведением D.5) норма любого элемента х = (х\, х2,..., хп) равна О In n а неравенства Коши-Буняковского и треугольника имеют вид п п \2 / п п \ / п п Y^ Y1 агкхгУк I ^ I Х!Е а{кХ{Хк ] f ^ S агкУгУк ), i=\ к=\ ' \{=\к=\ /\{=\к=\ п п У, Y1 агкУгУк i=\ k=\ V г=\ к=\ V г=\ к=\ 1) Напоминаем, что при этом матрица D.3) симметрична и порождает поло- положительно определенную квадратичную форму D.4).
§2] БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 87 § 2. Ортонормированный базис конечномерного евклидова пространства В этом параграфе будут изучаться евклидовы пространства конеч- конечной размерности п. Распространение изучаемых здесь результатов на бесконечномерные евклидовы пространства выходит за рамки этой кни- книги и является предметом специального изучения. (Такие пространства изучаются в главах 10 и 11 выпуска «Основы математического анализа, часть II».) 1. Понятие ортонормированного базиса и его существование. В гл. 2 было введено понятие базиса n-мерного линейного простран- пространства. В линейном пространстве все базисы являлись равноправными, и у нас не было оснований предпочитать один базис другому. В евклидовом пространстве существуют специальные, особо удоб- удобные базисы, называемые ортонормированными базисами. Эти базисы играют ту же роль, что и декартов прямоугольный базис в аналитиче- аналитической геометрии. Перейдем к определению ортонормированного базиса. Определение. Будем говорить, что п элементов еь е2,..., еп n-мерного евклидова пространства Е образуют ортонормированный базис этого пространства, если эти элементы попарно ортогональны и норма каждого из этих элементов равна единице, т. е. если ¦{ при г = к, ПрИ 1фк. Для того чтобы установить корректность сформулированного опре- определения, следует доказать, что входящие в это определение элементы еь е2,..., еп образуют один из базисов рассматриваемого п-мерного пространства Е, а для этого, в силу теоремы 2.5, достаточно доказать, что эти элементы ei, е2,..., еп линейно независимы, т.е. что равен- равенство а2е2 + ... + апеп = 0 D.11) возможно, лишь когда а\ = а2 = ... = ап = 0. Докажем это. Пусть к — любой из номеров 1,2, ...,п. Умно- Умножая равенство D.11) скалярно на элемент е^ и пользуясь аксиомами скалярного произведения и соотношениями D.10), мы получим, что ак=0. Докажем теперь следующую основную теорему. Теорема 4.3. Во всяком п-мерном евклидовом пространстве Е существует ортонормированный базис. Доказательство. Согласно определению размерности в про- пространстве Е найдется п линейно независимых элементов fi, f2,..., fn. Докажем, что можно построить п элементов ei, e2,..., еп, линейно выражающихся через fi, i2,..., fn и образующих ортонормированный базис (т.е. удовлетворяющих соотношениям D.10)). Проведем доказательство возможности построения таких элементов еь е2,..., еп методом математической индукции.
88 ЕВКЛИДОВЫ ПРОСТРАНСТВА [гл. 4 Если имеется только один элемент fi, то для построения элемен- элемента ei с нормой, равной единице, достаточно нормировать элемент fi, т.е. умножить этот элемент на число [\/(fi, fi) ] , обратное его нор- норме 0 . Мы получим при этом элемент ei = [\/(fi, fi)]-1fi с нормой, равной единице. Считая, что т — целое число, меньшее п, предположим, что нам удалось построить т элементов ei, е2,..., ет, линейно выражаю- выражающихся через fi, f2,..., fm, попарно ортогональных и имеющих нормы, равные единице. Докажем, что к этим элементам еь е2,..., ет можно присоединить еще один элемент em+i, линейно выражающийся через fi, f2,..., fm+i, ортогональный к каждому из элементов ei, е2,..., ет и имеющий норму, равную единице. Убедимся в том, что этот элемент em+i имеет вид em+l = ^m+l[lm+l ~~ (^т+Ь Gm)Gm ~ - (fm+ь em_i)em_i - ... - (fm+b ei)ei], D.12) где am+i — некоторое вещественное число. В самом деле, элемент em+i линейно выражается через fi, f2,... ...,fm+i (в силу того, что он линейно выражается через ei,e2,... ..., em, fm+i, а каждый из элементов ei, е2,..., ет линейно выража- выражается через fb f2,..., fm). Отсюда сразу же следует, что при am+i Ф О элемент em+i заведомо не является нулевым (ибо, в противном случае, являлась бы нуле- нулевым элементом некоторая линейная комбинация линейно независимых элементов fi, f2,..., fm+i, в которой, в силу D.12), отличен от нуля коэффициент при fm+i). Далее из того, что элементы ei, е2,..., em попарно ортогональны и имеют нормы, равные единице, и из соотношения D.12) сразу же вы- вытекает, что скалярное произведение (em+i, e/.) равно нулю для любого номера к, равного 1, 2,..., т. Для завершения индукции остается доказать, что число ат+\ мож- можно выбрать так, что норма элемента D.12) будет равна единице. Выше уже установлено, что при am+i Ф 0 элемент em+i, а, стало быть, и элемент, заключенный в D.12) в квадратные скобки, не является нулевым. Стало быть, для того чтобы нормировать элемент, заключенный в квадратные скобки, следует взять число am+i обратным положитель- положительной норме этого, заключенного в квадратные скобки, элемента. При этом норма em+i будет равна единице. Теорема доказана. Доказанная теорема приводит к следующему осуществляемому шаг за шагом алгоритму построения по данной системе п линейно неза- независимых элементов fi, f2,..., fn системы п попарно ортогональных 1) Напомним, что среди линейно независимых элементов fi, f2,..., fn не может быть нулевого элемента, так что норма fi больше нуля.
§2] БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 89 элементов ei, e2,..., еп, норма каждого из которых равна единице: о2 о /о е2 = — —> где g2 = i2 — (i^ V(g2, g2) е3 = h g3 , где g3 = f3 - (f3, e2)e2 - (f3, V (g3, gs) rAegn = fn - (fn, en_i)en_i - ... - (fn, V (gn, gn) Указанный алгоритм обычно называют процессом ортогонализа- ции линейно независимых элементов fi, f2,..., fn. Замечание. Конечно, в каждом n-мерном евклидовом простран- пространстве Е существует много ортонормированных базисов. Действительно, если, например, строить ортонормированный базис процессом ортого- нализации одних и тех же линейно независимых элементов fi, f2, ... ..., fn, то, начиная процесс ортогонализации с различных элементов f/~, мы придем к различным ортонормированным базисам. Ниже, в п. 2 §7 гл. 7 будет рассмотрен вопрос о том, как связаны между собой различ- различные ортонормированные базисы данного евклидова пространства Е. Примером ортонормированного базиса может служить декартов прямоугольный базис евклидова пространства всех свободных векторов или совокупность п элементов ei = A, 0, 0,..., 0), е2 = @, 1, 0,..., 0), еп = @, 0, 0,..., 1) евклидова пространства Еп всех упорядоченных совокупностей п ве- вещественных чисел со скалярным произведением D.2). 2. Свойства ортонормированного базиса. Пусть ei, e2,..., еп — произвольный ортонормированный базис n-мерного евклидова про- пространства Е, а х и у — два произвольных элемента этого пространства. Найдем выражение скалярного произведения (х, у) этих элементов через их координаты относительно базиса еь е2,..., еп. Обозначим координаты элементов х и у относительно базиса еь е2,..., еп соответственно через (х\, ж2,..., хп) и (г/ь г/2, • • •, Уп), т.е. предположим, что х = х\е\ + ж2е2 + ... + хпеп, у = у\е\ + + гу2е2 + ... + Уп^п- Тогда (х, у) = (х\е\ +ж2е2 + ... + хпеп, ухе\ + у2е2 + ... + упеп). Из последнего равенства, в силу аксиом скалярного произведения и соотношений D.10), получим (X, У) = ( 5Z ) к=\ ' i=\k=\ = Х\у\ + Х2У2 + ••• + Хпуп.
90 ЕВКЛИДОВЫ ПРОСТРАНСТВА [гл. 4 Итак, окончательно, (х, у) = хху\ + ж2у2 + ... + жпуп. D.13) Таким образом, в ортонормированном базисе скалярное произве- произведение двух любых элементов равно сумме произведений соответ- соответствующих координат этих элементов. Рассмотрим теперь в n-мерном евклидовом пространстве Е совер- совершенно произвольный (вообще говоря, не ортонормированный) базис f 1, f2,..., fгг и найдем выражение скалярного произведения двух про- произвольных элементов х и у через координаты этих элементов относи- относительно указанного базиса. Обозначим координаты элементов х и у относительно базиса fi, f2,..., fn соответственно через (х\, х2,..., хп) и (у\, у2,..., уп), т. е. предположим, что X = ?ifi + ?2f2 + ••• + Хп?п, у = yifi + У2?2 + ••• + v Пользуясь аксиомами скалярного произведения, получим (X, у) = (х\(\ Jfe=l / i=\k=\ Таким образом, в произвольном базисе fi, f2,..., fn скалярное про- произведение двух любых элементов х = х\?\ + ?2f2 + ... + хп?п и у = = 2/i fi + 2/2f2 + • • • + 2/nfn определяется равенством п п (х, у) = V V aikXiyk, D.14) г=1 /с=1 в котором матрица Ца^Ц (г = 1, 2,..., гг; /г = 1, 2,..., гг) имеет эле- элементы п{к = (f^, f/g). Последнее утверждение приводит к следующему результату: для того чтобы в данном базисе ?\, f2,..., fn евклидова пространства Е скалярное произведение двух любых элементов было равно сумме произведений соответствующих координат этих элементов, необ- необходимо и достаточно, чтобы базис ?\, f2,..., fn был ортонормиро- ванным. В самом деле, выражение D.14) переходит в D.13) тогда и только тогда, когда матрица \\aik\\ с элементами aik = (f;, f^) является еди- единичной, т. е. тогда и только тогда, когда выполнены соотношения при г = к, при г Ф к, устанавливающие ортонормированность базиса fi, f2,..., fn. Вернемся к рассмотрению произвольного ортонормированного бази- базиса еь е2,..., еп гг-мерного евклидова пространства Е. Выясним смысл координат произвольного элемента х относительно указанного базиса.
§2] БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 91. Обозначим координаты элемента х относительно базиса ei, e2,... ..., еп через х\, Х2, •••, хп, т. е. предположим, что х = х\е\ + ^2^2 + ... + хпеп. D.15) Обозначим далее через к любой из номеров 1, 2,..., п и умножим обе части D.15) скалярно на элемент ек. На основании аксиом скаляр- скалярного произведения и соотношений D.10) получим / п \ п \»=1 / г=1 Таким образом, координаты произвольного элемента относи- относительно ортонор мир о ванного базиса равны скалярным произведени- произведениям этого элемента на соответствующие базисные элементы. Поскольку скалярное произведение произвольного элемента х на элемент е, имеющий норму, равную единице, естественно назвать проекцией элемента х на элемент е, то можно сказать, что коор- координаты произвольного элемента относительно ортонор мир о ванно- ванного базиса равны проекциям этого элемента на соответствующие базисные элементы. Таким образом, произвольный ортонормированный базис обладает свойствами, вполне аналогичными свойствам декартова прямоугольно- прямоугольного базиса. 3. Разложение n-мерного евклидова пространства на пря- прямую сумму подпространства и его ортогонального дополнения. Пусть G — произвольное подпространство n-мерного евклидова про- пространства Е. Совокупность F всех элементов у пространства Е, ортогональ- ортогональных каждому элементу х подпространства G, называется ортого- ортогональным дополнением подпространства G. Заметим, что ортогональное дополнение F само является подпро- подпространством Е (ибо из ортогональности каждого из элементов yi и у2 элементу х, очевидно, вытекает, что и любая линейная комбинация элементов yi и у2 ортогональна элементу х). Докажем, что всякое п-мерное евклидово пространство Е пред- представляет собой прямую сумму своего произвольного подпростран- подпространства G и его ортогонального дополнения F. Выберем в G произвольный ортонормированный базис ei,e2,... ..., ek. В силу доказанного в п. 1 § 3 гл. 2, этот базис можно дополнить элементами f/,+i,..., fn пространства Е до базиса во всем Е. Про- Произведя процесс ортогонализации элементов e\,...,ek, f^+i,..., fn, мы получим ортонормированный базис еь...,е^, е&+ь ..., еп всего пространства Е. Разложив произвольный элемент х пространства Е по этому базису, т.е. представив его в виде х = х\е\ + ... + хкек + + ж&+1е&_|_1 + ... + хпеп, мы получим, что этот элемент х однозначно представим в виде х = х7 + х", где х' = х\е\ + ... + хкек — совершен- совершенно определенный элемент G, а х." = хк+\ек+\ + ... + хпеп — совер- совершенно определенный элемент ортогонального дополнения ,Р(каждый элемент е^+ь ..., еп ортогонален к любому из элементов е\,...,ек,
92 ЕВКЛИДОВЫ ПРОСТРАНСТВА [гл. 4 а потому ортогонален любому элементу G; поэтому и линейная ком- комбинация Xk+\&k+\ + ••• + хпеп ортогональна любому элементу G, т.е. является совершенно определенным элементом F). 4. Изоморфизм n-мерных евклидовых пространств. В этом пункте мы покажем, что различные евклидовы пространства одной и той же размерности п в смысле свойств, связанных со введенными в этих пространствах операциями, по существу не отличаются друг от друга. Поскольку в евклидовых пространствах введены лишь операции сложения элементов, умножения элементов на числа и скалярного перемножения элементов, то естественно сформулировать следующее определение. Определение. Два евклидовых пространства Е и Е' называют- называются изоморфными, если между элементами этих пространств можно установить взаимно однозначное соответствие так, что если элементам х и у пространства Е отвечают соответственно элементы х7 и у7 пространства Е', то элементу х + у отвечает элемент х7 + у7, элементу Ах (при любом вещественном А) отвечает элемент Ах7 и скалярное произведение (х, у) равно скалярному произведению (х7, у7). Таким образом, евклидовы пространства Е и Е1 изоморфны, если они изоморфны как линейные пространства 0 и если этот изоморфизм сохраняет величину скалярного произведения соответствующих пар элементов. Теорема 4.4. Все евклидовы пространства одной и той же размерности п изоморфны между собой. Доказательство. Достаточно доказать, что любое п-мерное евклидово пространство Е' изоморфно евклидову пространству Еп упорядоченных совокупностей п вещественных чисел со скалярным произведением D.2). Согласно теореме 4.3 в евклидовом простран- пространстве Е' существует ортонормированный базис е[, е2,..., е^. Каждому элементу х7 = х\е[ + а?2е2 + ... + хпе'п пространства Е' поставим в со- соответствие п вещественных чисел х\, Ж2,..., хп, т.е. вполне опреде- определенный элемент х = (х\, Х2, •••, хп) пространства Еп. Установленное соответствие будет взаимно однозначным. Кроме то- того, из теоремы 2.4 вытекает, что если элементам х7 = (х\, х%, •••, хп) и у7 = (г/i, г/2,..., уп) пространства Е' 2) отвечают соответственно элементы х = (х\, Х2, •••, хп) и у = (у\, у2,..., уп) пространства Еп, то элементу х7 + у7 отвечает элемент х + у, а элементу Ах7 отвечает элемент Ах. Остается доказать, что для соответствующих пар элементов х7, у7 и х, у сохраняется величина скалярного произведения. В силу ортонормированности базиса е\, е2,..., е'п и формулы D.13), (х7, у7) = х\у\ + Х2У2 + ••• + хпуп. С другой стороны, в силу О См. п. 4 §2 гл.2. 2) Координаты этих элементов берутся относительно базиса е[, е'2,..., е'п.
§3] КОМПЛЕКСНОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 93 формулы D.2), определяющей скалярное произведение в простран- пространстве Еп, (х, у) = х\у\ + Х2У2 + ••• + хпУп- Теорема доказана. Доказанная теорема позволяет утверждать, что если в каком-ни- каком-нибудь конкретном n-мерном евклидовом пространстве Е' доказана тео- теорема, сформулированная в терминах операций сложения, умножения на числа и скалярного перемножения элементов, то эта теорема спра- справедлива и в совершенно произвольном n-мерном евклидовом простран- пространстве Е. § 3. Комплексное евклидово пространство 1. Определение комплексного евклидова пространства. В конце п. 1 §1 гл.2 мы уже указывали, что если в определении линейного пространства числа A, /i, ... брать не из множества вещественных чи- чисел, а из множества всех комплексных чисел, то мы придем к понятию комплексного линейного пространства. На базе комплексного линейного пространства строится ком- комплексное евклидово пространство, играющее фундаментальную роль в теории несамосопряженных линейных преобразований. Для введения комплексного евклидова пространства следует ввести в комплексном линейном пространстве понятие скалярного произве- произведения двух его элементов, подчиненное соответствующим четырем аксиомам. Определение. Комплексное линейное пространство R называется комплексным евклидовым пространством, если выполнены следую- следующие два требования. I. Имеется правило, посредством которого любым двум элементам х и у этого пространства ставится в соответствие комплексное число, называемое скалярным произведением этих элементов и обозначаемое символом (х, у). П. Указанное правило подчинено следующим четырем аксиомам: 1° (х,у) = (у^)'); 2°. (xi +х2, у) = (xi, у) + (х2, у); 3°. (Ах, у) = А(х, у); 4°. (х, х) представляет собой вещественное неотрицательное число, обращающееся в нуль лишь в случае, когда х — нулевой элемент 2). х) Здесь и в дальнейшем символом а обозначается число, комплексно- сопряженное с а. 2) Аксиома 1° отличается от соответствующей аксиомы 1° вещественного евклидова пространства. Легко убедиться в том, что при переходе к ком- комплексному пространству невозможно сохранить без изменения все три акси- аксиомы 1°, 3° и 4° вещественного скалярного произведения. В самом деле, при наличии аксиом (х, у) = (у, х) и (Ах, у) = А(х, у), мы получили бы, что (х, Ау) = (Ау, х) = А(у, х) = А(х, у). Но тогда оказалось бы, что (Ах, Ах) = = А2(х, х), и, стало быть, при А = г мы получили бы, что (гх, гх) = — (х, х), а это противоречило бы аксиоме 4° о неотрицательности (у, у) для любого элемента у.
94 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ ГЛ. 4 Логическими следствиями аксиом 1°-3° являются следующие два соотношения: (х, Ау) = А(х, у), (х, yi + у2) = (х, yi) + (х, у2). В самом деле, из аксиом 1° и 3° заключаем, что (х, Ау) = (Ау, х) = А (у, х) = А(х, у), а из аксиом 1° и 2° получаем, что (X, У1 + у2) = (У1 + У2, X) = (уЬ X) + (у2, X) = (х, yi) + (х, у2). Приведем примеры конкретных комплексных евклидовых про- пространств. Пример 1. Рассмотрим совокупность С* [а, Ь] всех функций z = z(t), определенных для значений t из сегмента а ^ t ^ b и при- принимающих комплексные значения z(t) = x(t) + iy(t) такие, что веще- вещественные функции x{t) и y(t) являются непрерывными на этом сегмен- сегменте. Операции сложения этих функций и умножения их на комплексные числа заимствуем из анализа. Скалярное произведение двух любых та- ъ ких функций определим соотношением (z\(t), Z2(t)) = z\(t) Z2(t) dt. Нетрудно убедиться в справедливости для так определенного ска- скалярного произведения всех аксиом 1°-4°, из чего следует, что рас- рассматриваемая совокупность представляет собой комплексное евклидово пространство. Пример 2. Рассмотрим комплексное линейное пространство Л™, элементами которого служат упорядоченные совокупности п комплекс- комплексных чисел х\, Х2,..., хп с такими же определениями операций сложе- сложения элементов и умножения их на числа, как и в случае вещественного линейного пространства Лп. Скалярное произведение двух любых элементов х = (х\, Х2, • • •, хп) и у = (г/ь г/2,..., Уп) определим соотношением (X, у) = Xijji +Х2У2 + ••• +Хпуп. D.16) Справедливость для так определенного скалярного произведения аксиом 1°-3° проверяется совершенно элементарно. Справедливость аксиомы 4° вытекает из соотношения (X, X) = Х\Х\ + Ж2^2 + ... + ХпХп = \х\ Стало быть, пространство А™ со скалярным произведением D.16) является комплексным евклидовым пространством. Пример 3. В том же самом комплексном линейном простран- пространстве А™ можно ввести скалярное произведение не соотношением D.16),
§3] КОМПЛЕКСНОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 95 а более общим соотношением О п п (х, у) = X) Z) aikXiVk, D.17) г=\ к=\ в котором \\ciik\\ — произвольная матрица, состоящая из комплексных чисел ctik, удовлетворяющих условию а^ = aki, такая, что квадратич- п п ная форма ^ ^ aikXiXk для всех комплексных х\, Х2,..., хп при- г=\ к=\ нимает вещественные неотрицательные значения и обращается в нуль лишь при условии \х\\2 + \х2\2 + ... + \хп\2 = 0. Предоставляем читателю проверку того, что так определенное ска- скалярное произведение удовлетворяет аксиомам 1°-4°. 2. Неравенство Коши-Буняковского. Понятие нормы. Докажем, что для любых двух элементов х и у произвольного комплексного евклидова пространства справедливо неравенство Коши-Буняков- Коши-Буняковского 2) |(х, у)|2 < (х, х)(у, у). D.18) На основании аксиомы 4° для любого комплексного числа Л спра- справедливо неравенство (Лх-у, Ах-у)>0. D.19) Так как в силу аксиом 1°-3° и их логических следствий (Лх - у, Лх - у) = АА(х, х) - Л(х, у) - А(у, х) + (у, у) = = |А|2(х, х) - А(х, у) - А (х, у) + (у, у), то неравенство D.19) принимает вид |Л|^(х, х) - Л(х, у) - Л (х, у) + (у, у) > 0. D.20) Обозначим через (р аргумент комплексного числа (х, у) и представим это число в тригонометричеекой форме 3) (х, у) = |(х, y)|(cos^ + isin^). D.21) Положим теперь комплексное число Л равным Л = t(cos (р - г sin ф), D.22) О D.17) переходит в D.16), когда матрица \\a,ik\\ является единичной. 2) Поскольку (х, у) является, вообще говоря, комплексным числом, то нель- нельзя записывать неравенство Коши-Буняковского в виде D.6). 3) Понятия аргумента и тригонометрической формы комплексного числа разбираются, например, в § 1 гл. 7 выпуска «Основы математического анализа», часть I.
96 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ ГЛ. 4 где t — произвольное вещественное число. Из соотношений D.21) и D.22) очевидно, что |Л| = \t\, Л(х, у) = Л (х, у) = ?|(х, y)|. Поэтому при выбранном нами Л неравенство D.20) переходит в неравенство *2(х, х)-2*|(х, у)| + (у, у)^0, D.23) справедливое при любом вещественном t. Необходимым и достаточ- достаточным условием неотрицательности квадратного трехчлена, стоящего в левой части D.23), является неположительность его дискриминанта, т.е. неравенство |(х, у)|2 — (х, х)(у, у) ^ 0, эквивалентное неравенст- неравенству D.18). С помощью неравенства Коши-Буняковского D.18) и рассуждений, полностью аналогичных доказательству теоремы 4.2, устанавливается, что всякое комплексное евклидово пространство является нормиро- нормированным, если в нем норму любого элемента х определить соотно- соотношением ||х|| = д/(х, х). D.24) В частности, во всяком комплексном евклидовом пространстве с нормой, определяемой соотношением D.24), справедливо неравен- неравенство треугольника ||х + у|| ^ ||х|| + ||у||. Замечание. Подчеркнем, что введенное для вещественного ев- евклидова пространства понятие угла ip между двумя произвольными элементами х и у теряет смысл для комплексного евклидова простран- пространства (вследствие того, что скалярное произведение (х, у) является, вообще говоря, комплексным числом). 3. Ортонормированный базис и его свойства. Элементы х и у произвольного комплексного евклидова пространства будем называть ортогональными, если скалярное произведение (х, у) этих элементов равно нулю. Ортонормированным базисом n-мерного комплексного евклидова пространства назовем совокупность его элементов еь е2, ..., еп, удовлетворяющих соотношениям -{ ПРИ i = к, ПрИ 1фк (т.е. попарно ортогональных и имеющих нормы, равные единице). Как и в п. 1 §2, доказывается, что эти элементы линейно независи- независимы и потому образуют базис. В полной аналогии с доказательством теоремы 4.3 (т. е. с помощью процесса ортогонализации) устанавливается существование в произ- произвольном n-мерном комплексном евклидовом пространстве ортонорми- рованного базиса. Выразим скалярное произведение двух произвольных элементов х и у n-мерного комплексного евклидова пространства через их коорди- координаты х\, Х2,..., хп и у\, г/2,..., Уп относительно ортонормированного базиса еь е^,..., еп.
§4] МЕТОД РЕГУЛЯРИЗАЦИИ 97 Так как х = У = ... + хпеп, то в силу аксиом 1°-4° и соотношений D.25) получим (х, у) = k=\ i, ek) = i=\k=\ Выразим далее координаты х\,Х2,...,хп произвольного элемен- элемента х относительно ортонормированного базиса еь е2,..., еп. Умножая разложение этого элемента по базису х = х\е\ + Ж2^2 + ... ... + хпеп скалярно на е^ и пользуясь соотношениями D.25), получим (для любого к, равного 1, 2,..., п) (X, г=1 Итак, как и в случае вещественного евклидова пространства, ко- координаты произвольного элемента х относительно ортонормиро- ортонормированного базиса равны скалярным произведениям этого элемента на соответствующие базисные элементы. В полной аналогии с доказательством теоремы 4.4 устанавливается, что все комплексные евклидовы пространства одной и той же размерности п изоморфны между собой. § 4. Метод регуляризации для отыскания нормального решения линейной системы Снова возвратимся к рассмотрению общей линейной системы т уравнений с п неизвестными вида C.1). Эту систему кратко запишем в матричной форме О АХ = В. D.26) Напомним, что в этой записи символ А обозначает матрицу А = ||а^-|| (г = 1, 2,..., т; j = 1, 2,..., п), а символы X и В обозначают столбцы (или векторы) вида X = первый из которых подлежит определению, а второй — задан. Х\ Х2 Хп , в = Ъх ь2 Ьт 1) См. формулу C.6) из предыдущей главы. 4 Линейная алгебра
98 ЕВКЛИДОВЫ ПРОСТРАНСТВА [гл. 4 Будем рассматривать случай, когда значения элементов матрицы А и столбца свободных членов В заданы нам лишь приближенно 0 . Тогда естественно говорить лишь о приближенных значениях искомого столбца X. Изложенные в предыдущей главе и основанные на форму- формулах Крамера алгоритмы вычисления столбца решений X в этом случае могут приводить к большим погрешностям и теряют практический смысл 2). В этом параграфе мы изложим принадлежащий А.Н. Тихонову алгоритм, позволяющий находить так называемое нормальное (т. е. наиболее близкое к началу координат) решение X с точностью, соот- соответствующей точности задания элементов матрицы А и столбца В 3). Введем в рассмотрение так называемые сферические нормы столб- столбцов В и X и матрицы А, положив их равными п ? 4 • D-27) Заметим, что нормы столбцов В и X определяются как обычные нормы векторов — элементов пространств Ет и соответственно Еп. Норма матрицы А согласована с нормой n-мерного столбца X в том смысле, что норма m-мерного столбца АХ, равного произведению матрицы А на столбец X, удовлетворяет условию 4) \\АХ\\^\\А\\\\Х\\. D.28) Будем считать, что вместо точных значений элементов матрицы А = = \\dij\\ и столбца правых частей В = \\bij\\ нам заданы приближенные значения А = ||а^-||, В = ||&ij|l- 1) Такая ситуация будет иметь место в случае, если эти значения получа- получаются из физических измерений или если в процессе вычислений приходится округлять указанные значения до некоторого знака. 2) Особенно это относится к случаю так называемых «плохо обусловлен- обусловленных» матриц (для которых «малые» изменения элементов матрицы базисного минора ведут к «большим» изменениям элементов обратной матрицы). 3) См. Тихонов А.Н. О некорректных задачах линейной алгебры и устойчи- устойчивом методе их решения // ДАН СССР. 1965. Т. 163, №3. С. 591-594. 4) В самом деле, пользуясь определением произведения матрицы на стол- столбец, соотношениями D.27) и неравенством Коши-Буняковского для элементов евклидова пространства Еп, будем иметь = \\л\\2\\х\\2
§4] МЕТОД РЕГУЛЯРИЗАЦИИ 99 Матрицу А (столбец В) будем называть 5-приближением матри- матрицы А (столбца В), если справедливо неравенство <8\. /J <S г=\ j = \ V у i=\ D.29) Назовем нормальным решением совместной системы D.26) то ее решение Х° = , норма \\Х°\\ которого является наименьшей сре- среди норм ||Х|| всех решений X этой системы. Заметим, что у всякой совместной системы D.26) (в том числе и у неопределенной) существу- существует единственное нормальное решение. Введем в рассмотрение следующую функцию п переменных х\, Х\ 2, •••, хп или одного столбца X = u..., xn, A, B) = , А, В) = \\АХ - а\\Х\\\ D.30) зависящую, как от параметров, от элементов матрицы А и столбца В, а также зависящую от некоторого числового параметра а. В подробной записи эта функция выглядит так: , а, в) = D.307) Фактически Fa(X, А, В) является функцией от элементов X ев- евклидова пространства n-мерных столбцов Еп. Такого рода функцию, аргументом которой служат элементы некоторого линейного простран- пространства, принято называть функционалом 0 . Легко убедиться в том, что при любом фиксированном а > О неотрицательный функционал D.30') достигает своего минималь- минимального (во всем пространстве Еп) значения в единственной точке Ха = ... пространства Еп. В самом деле, дважды дифференцируя функцию D.3(У), получим 1 при к = /, где 8Ы = i=\ при к ф I. 1) Функционалы систематически изучаются в следующей главе.
100 ЕВКЛИДОВЫ ПРОСТРАНСТВА [гл.4 Следовательно, второй дифференциал функции Fa имеет вид п п Г т 1 п п d2Fa =Y^Y^\H °чкац Skidxkdxi + а ^ J2 к=\ l=\ L г=1 -I к=\ г=1 г=1 L jfe= aikdxk + a J к=\ Из этого равенства вытекает оценка d2Fa означаю- к=\ к\ щая, что функция Fa является строго выпуклой вниз. Кроме того, 1~ Fa —> +счэ при °°- Отсюда очевидным образом сле- следует, что Fa имеет, и притом единственную, точку минимума Ха 0 . Методы отыскания минимальных значений функционалов вида D.30) хорошо разработаны 2). Докажем следующую фундаментальную теорему, сводящую во- вопрос о приближенном отыскании нормального решения системы D.26) к отысканию того элемента Ха = , на котором достигает своего минимального значения функционал D.30). Теорема Тихонова. Пусть матрица А и столбец В удовле- удовлетворяют условиям, обеспечивающим совместность системы D.26), — нормальное решение этой системы, А — 8-прибли- 8-приближение матрицы А, В — 8-приближение столбца В, еE) и аE) — какие-либо возрастающие функции 6, стремящиеся к нулю при 5 —> 0 + 0 и такие, что 52 < e(S)a(S). Тогда для любого е > 0 най- найдется положительное число So = ёо{е, ||^°||) такое, что при любом S < 5о(е, ||^°||) и при любом а, удовлетворяющем условию е(8) аE), D.31) элемент Ха = , доставляющий минимум функционалу D.30), удовлетворяет неравенству D.32) О См., в частности, выпуск 1 «Основы математического анализа», часть I, гл.14, §7. Dm. там же. 2)Civ
§4] МЕТОД РЕГУЛЯРИЗАЦИИ 101_ Доказательство. Рассмотрим в линейном пространстве Ет подмножество {ил} всех элементов U = U\ , представимых в виде U = АХ, где X = Х\ — произвольный элемент пространства Еп. Совершенно очевидно, что подмножество {Uл} представляет собой линейное пространство и поэтому является подпространством Ет. Обозначим через {V^} ортогональное дополнение {Од} (до всего Ет) и разложим Еш в прямую сумму подпространств {Uл} и {V^} 0 . Пусть Вл обозначает проекцию столбца В на подпространство {ил}, так что В = Вл + (В — Вл), где (В - Вл) — элемент {V^}. Тогда, поскольку для любого элемента X пространства Еп столбец АХ является элементом {U^}, мы получим следующее разложение: АХ - В = (АХ - В~) + (Вл - В), в котором элементы (АХ - Вд) и (Вд - В) ортогональны друг другу и принадлежат соответственно {U^} и {V^}. Пользуясь теоремой Пифагора (см. п. 2 §1), мы получим (для лю- любого элемента X пространства Еп) \\АХ - В\\2 = \\АХ - ВЛ\\2 + \\В - ВА\\\ D.33) Из D.33) следует, в частности, неравенство \\В-ВА\\^\\АХ-В\\, D.34) также справедливое для любого элемента X пространства Еп. Из D.33) и D.30) мы получим, что для любого X из Еп Fa(X, А, В) = \\В - Вл\\2 + Fa(X, А, Вл), D.35) т.е. функционалы, стоящие в левой и в правой частях D.35), имеют общий элемент Ха, доставляющий им минимум. Установим теперь для любого а, удовлетворяющего условиям D.31), следующее неравенство: Fa(Xa, А, В~) < аеE)С2 + а||Х°||, D.36) в котором через С обозначена величина С = 2A + ||Х°||), а Х° - нормальное решение системы D.26). Так как столбец Ха доставляет минимум функционалу, стоящему в правой части D.35), то Fa(Xa, А, Вл) < Fa(X°, А, ВА) = \\АХ° - Вл\\2 + а\\Х°\\2. D.37) О См. п.З §2 этой главы.
102 ЕВКЛИДОВЫ ПРОСТРАНСТВА [гл. 4 Пользуясь соотношением ЛХ° = В и неравенством треугольника, получим ||АХ° - Вл\\ < ||АХ° - АХ°\\ + \\В - В\\ + ЦБ - Вл\\. В пра- правой части последнего неравенства воспользуемся соотношениями D.28) и D.29), а также неравенством D.34), взятым при X = Х°. Получим \\АХ° - Вл\\ < ?||Х°|| + 5 + \\В - АХ°\\. D.38) Еще раз учитывая, что АХ° = В, и снова пользуясь неравенством треугольника и соотношениями D.28) и D.29), получим, что \\В - АХ°\\ < \\В - В\\ + \\АХ° - АХ°\\ ^5 + 5\\Х°\\. D.39) Из D.38) и D.39) следует, что \\АХ° - Вл\\ < 2EA + ||Х°||) = С6, D.40) д ( ||||) Для завершения доказательства оценки D.36) остается подставить D.40) в D.37) и воспользоваться неравенством D.31). Поскольку из определения функционала Fa сразу вытекает, что а||Ха||2 ^ Fa(Xa, А, Вл), то из доказанного нами неравенства D.36) вытекает также следующее неравенство: ll*aKII*°ll+?i(^ D.41) в котором s\(S) —> 0 при E^0 + 0. Из D.41) вытекает, что при всех достаточно малых 5 множество {Ха} точек Ха пространства Еп является ограниченным. Теперь уже нетрудно доказать теорему от противного. Предполо- Предположим, что для некоторого so > 0 существует последовательность дп —> —> 0 + 0 и отвечающая ей последовательность {ап} чисел ап, удовле- удовлетворяющих условию 1L 4 <«*<«(«„), D.31*) такая, что для всех номеров п ||Xa»-X°||^eo- D.42) Так как множество {Ха} ограничено, то в силу теоремы Больцано- Вейерштрасса из последовательности {Xa™} можно выделить сходя- сходящуюся подпоследовательность. Чтобы не менять обозначений, будем считать, что вся последовательность {Хап} сходится к некоторому столбцу Х° = х° т. е. \\Хап — Х°|| —)> О при п —>• оо. Убедимся в том, что ->> 0 при п ->> оо. D.43)
§4] МЕТОД РЕГУЛЯРИЗАЦИИ 103 В самом деле, пользуясь неравенством треугольника, оценка- оценками D.28), D.29), D.36) и D.40) и соотношением D.31*), получим а»-АХ°\\^ < \\АХа" - АХ<*"\\ + \\АХа» - ВЛ\\ + \\ВА - АХ°\\ < «~, А, ВА) + С5п < Sn(\\Xa-\\ + C) + ^/ane(Sn)C + an\\XY ->¦ 0 при п —> оо. Из неравенства D.43) вытекает, что ЛХ° = АХ°, т.е. предель- предельный элемент Х° является решением системы D.26), удовлетворяю- удовлетворяющим, в силу соотношения D.41), неравенству ||X°|| < ||^°||- Так как по определению для нормального^ешения Х° справедливо обратное неравенство ||Х°|| < ||Х°||, то ||Х°|| = ||Х°||, т.е. Х° = Х°, а это противоречит неравенству D.42), справедливому для любого номера п. Полученное противоречие завершает доказательство теоремы.
Глава 5 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В этой главе исследуются так называемые линейные отображения линейных и евклидовых пространств, т. е. такие отображения, при которых образ суммы элементов равен сумме их образов и образ про- произведения элемента на число равен произведению этого числа на образ элемента. При этом мы будем рассматривать комплексные линейные и евклидовы пространства. Результаты, относящиеся к вещественным пространствам, будут оговорены специально. § 1. Понятие линейного оператора. Основные свойства 1. Определение линейного оператора. Пусть V и W — линейные пространства, размерности которых равны соответственно пит. Мы будем называть оператором А, действующим из V в W, отображение вида А: V —>> W, сопоставляющее каждому элементу х пространства V некоторый элемент у пространства W. При этом будем использовать обозначение у = А (х) или у = Ах. Определение. Оператор А, действующий из V в W, называется линейным, если для любых элементов xi u Х2 пространства V и лю- любого комплексного числа Л выполняются соотношения: 1°. A (xi + X2) = Axi + Ax2 (свойство аддитивности опера- оператора); 2°. А (Лх) = Л Ах (свойство однородности оператора). Замечание 1. Если пространство W представляет собой ком- комплексную плоскость, то линейный оператор Л, действующий из V в W, называется линейной формой или линейным функционалом. Замечание 2. Если пространство W совпадает с пространст- пространством V, то линейный оператор, действующий в этом случае из V в V, называют также линейным преобразованием пространства V. 2. Действия над линейными операторам. Пространство линей- линейных операторов. В множестве всех линейных операторов, действую- действующих из V в W, определим операции суммы таких операторов и умно- умножения оператора на скаляр. Пусть А и В — два линейных оператора, действующих из V в W. Суммой этих операторов назовем линейный оператор А + В, определяемый равенством (А + В)х = Ах + Вх. E.1)
§ 1 ] ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА 105 Произведением линейного оператора А на скаляр Л назовем линей- линейный оператор ЛА, определяемый равенством (ЛА)х= Л(Ах). E.2) Назовем нулевым оператор, обозначаемый символом О и отобра- отображающий все элементы пространства V в нулевой элемент пространст- пространства W. Иными словами, оператор О действует по правилу Ох = 0. Для каждого оператора А определим противоположный опера- оператор —А посредством соотношения -А = (-1)А. Легко проверить справедливость следующего утверждения. Множество L(V, W) всех линейных операторов, действующих из V в W, с указанными выше операциями суммы и умножения на скаляр и выбранными нулевым оператором и противоположным оператором образует линейное пространство. 3. Свойства множества L (V, V) линейных операторов. Иссле- Исследуем подробнее линейные операторы, действующие из V в V, т. е. изучим подробнее множество L(V, V). Назовем тождественным (или единичным) оператором линейный оператор I, действующий по правилу 1х = х (здесь х — любой эле- элемент V). Введем понятие произведения линейных операторов из множест- множества L(V, V). Произведением операторов А и В из L(V, V) называется опера- оператор АВ, действующий по правилу (АВ)х = А(Вх). E.3) Отметим, что, вообще говоря, АВ ф ВА. Справедливы следующие свойства линейных операторов из L(V, V): 1°. А(АВ) = (АА)В; 2°. (А + В)С = АС + ВС; 3°. А(В + С) = АВ + АС; 4°. (АВ)С = А(ВС). Первое из свойств 1°-4° следует из определения произведения линейного оператора на скаляр (см. E.2)) и определения произведения операторов (см. E.3)). Перейдем к обоснованию свойства 2°. Имеем, согласно E.1), E.2) и E.3), ((А + В)С)х = (А + В)(Сх) = А(Сх) + В(Сх) = = (АС)х + (ВС)х = (АС + ВС)х. E.4) Сравнивая левую и правую части последних соотношений, мы по- получаем равенство (А + В)С = АС + ВС. Свойство 2° установлено.
106 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Совершенно аналогично доказывается свойство 3°. Свойство 4° справедливо, поскольку, согласно определению (см. E.3)), произведение линейных операторов заключается в их последовательном действии, и поэтому линейные операторы (АВ)С и А(ВС) совпадают и, следовательно, тождественны. Замечание 1. Свойство 4° позволяет определить произведение АВ...С любого конечного числа операторов из L(V, V) и, в частно- частности, п-ю степень оператора А с помощью формулы An= AA...A. п сомножителей Очевидно, справедливо соотношение An+m = AnAm. Нам понадобится понятие обратного оператора для данного опе- оператора А из L(V, V). Определение 1. Линейный оператор В из L(V, V) называется об- обратным для оператора А из L(V, V), если выполняется соотношение АВ = ВА = I. Обратный оператор для оператора А обычно обозначается симво- символом А. Из определения обратного оператора А следует, что для любого х G V справедливо соотношение А Ах = х. Таким образом, если А~1Ах = 0, то х = 0, т.е. если оператор А имеет обратный, то из условия Ах = 0 следует, что х = 0. Мы будем говорить, что линейный оператор А действует взаимно однозначно из V в V, если любым двум различным элементам xi и Х2 отвечают различные элементы yi = Axi и у 2 = Ах2. Если оператор А действует взаимно однозначно из V в V, то отображение А: V —> V представляет собой отображение V на V, т. е. каждый элемент у е V представляет собой образ некоторого элемента xgV: У = Ах. Чтобы убедиться в этом, достаточно, очевидно, доказать, что п линейно независимых элементов хь Х2,..., хп пространства V отображаются посредством оператора А в п линейно независимых Axi, Ax2,..., Ахп элементов этого же пространства. Итак, пусть xi, X2,..., хп — линейно независимые элементы V. Если линейная комбинация aiAxi + a^Ax2 + ...+ anAxn представ- представляет собой нулевой элемент пространства V: а\ Axi + CK2AX2 + ... + anAxn = 0, то из определения линейного оператора (см. п. 1 этого параграфа) следует, что A(aixi + a2x2 + • • • + апхп) = 0. Так как оператор А действует из V в V взаимно однозначно, то из последнего соотношения вытекает, что aixi + «2Х2 + ••• + ап^п = = 0. Но элементы хь Х2,..., хп линейно независимы. Поэтому а\ =
§ 1 ] ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА 107 = «2 = ... = осп = 0. Следовательно, элементы Axi, Ax2,..., Ахп также линейно независимы. Отметим следующее утверждение. Для того чтобы линейный оператор А из L(V, V) имел обрат- обратный, необходимо и достаточно, чтобы этот оператор действовал взаимно однозначно из V в V. Убедимся, что сформулированное условие необходимо. Пусть опе- оператор А имеет обратный, но не действует взаимно однозначно из V в V. Это означает, что некоторым различным элементам xi и Х2, Х2 — xi ф = 0 из V отвечает один и тот же элемент у = Axj = Ах2. Но тогда А(х2 — xi) = 0, и поскольку оператор А имеет обратный, xi — Х2 = 0. Но выше было отмечено, что xi — Х2 Ф 0. Полученное противоречие доказывает необходимость условия утверждения. Докажем достаточность этого условия. Допустим, что оператор А действует взаимно однозначно из V в V. Тогда каждому элементу у ? V отвечает элемент х ? V такой, что у = Ах. Поэтому имеется оператор А, обладающий тем свойством, что А-1у = А (Ах) = х. Легко убедиться, что оператор А линей- линейный. По определению А — обратный оператор для оператора А. Достаточность условия утверждения также доказана. Введем понятия ядра и образа линейного оператора. Определение 2. Ядром линейного оператора А называется мно- множество всех тех элементов х пространства V, для которых Ах = 0. Ядро линейного оператора А обозначается символом ker А. Если ker A = 0, то оператор А действует взаимно однозначно из V в V. Действительно, в этом случае из условия Ах = 0 вытекает х = 0, а это означает, что различным xi и Х2 отвечают различные yi = = Axi и у2 = Ах2 (если бы yi = у2, то А(х2 — xi) = 0, т. е. xi = х2 и элементы xi и Х2 не были бы различны). Таким образом, согласно доказанному выше утверждению условие ker A = 0 является необходимым и достаточным для того, чтобы оператор А имел обратный. Определение 3. Образом линейного оператора А называется множество всех элементов у пространства V, представимых в виде у = Ах. Образ линейного оператора А обозначается символом im A 0 . Замечание 2. Отметим, что если ker А = 0, то im A = V, и на- наоборот. Поэтому наряду с отмеченным выше условием ker A = 0 усло- условие imA = V также является необходимым и достаточным для того, чтобы оператор А имел обратный. Замечание 3. Очевидно, ядро ker А и образ imA — линейные подпространства пространства V. Поэтому можно рассматривать раз- размерности dim (ker А) и dim (imA) этих подпространств. Справедлива следующая теорема. 1) Символ im следует отличать от символа Im, используемого для обозначе- обозначения мнимой части комплексного числа.
108 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Теорема 5.1. Пусть размерность dimV пространства V рав- равна п, и пусть А — линейный оператор из L(V, V). Тогда dim (im А) + dim (ker A) = п. Доказательство. Так как ker А представляет собой подпрос- подпространство V, то можно указать такое подпространство V\ простран- пространства V, что V будет представлять собой прямую сумму V\ и ker A 0 . Согласно теореме 2.10 dim Vi + dim (ker A) = п. Поэтому для доказа- доказательства теоремы достаточно убедиться, что dim V\ = dim(imA). Пусть dimVi = р, dim(imA) = q и уьУ2,...,У9 — базис в imA. Так как линейный оператор А действует взаимно однозначно из V\ в im А 2), то каждому элементу у из im А можно поставить в соответствие единственный элемент х ? V\ такой, что Ах = у. По- Поэтому в V\ определены элементы xi, X2,..., хд такие, что Ах/~ = у&, к = 1, 2,..., q. Элементы хь Х2,..., хд линейно независимы, ибо если + «2*2 + • • • + otqyiq = 0, то A(aixi + «2^2 + • • • + aqxq) = aiyi + ••• + OLqyq = 0, а так как элементы у\, у2,..., yq линейно независимы, то а\ = а^ = ... = aq = 0, т. е. и xi, х2,..., хд линейно независимы. Таким образом, в V\ имеется q линейно независимых элементов. Следовательно, р^ q (напомним, что р = dim V\). Предположим, что р > q. Добавим к линейно независимым эле- элементам xi,X2,...,xg элементы xg+i, xg+2»---»xp так> что хьх2»--- ..., хр образуют базис в V\. Так как р > q и q = dim (imA), то эле- элементы Axi, Ax2,..., Ахр, принадлежащие imA, линейно зависимы, и поэтому существуют не все равные нулю числа Ль Л2,..., Хр такие, что AiAxi + Л2АХ2 + ...+ ЛрАхр = 0. Отсюда следует, что A(AiXi + + А2Х2 + ...+ Архр) = 0. Так как А действует из V\ в imA взаимно однозначно, то из последнего равенства получаем А1Х1 + A2X2 + ... ... + Архр = 0. Но xi, Х2,..., хр — базис в V\. Поэтому Ai = А2 = ... = Хр = 0. Выше указывалось, что не все Ai, A2,..., Ар равны нулю. Следователь- 0 Чтобы убедиться в этом, выберем в V такой базис ei, ег,..., еп, что первые г векторов ei,e2,...,er образуют базис в ker А, тогда линейная оболочка векторов er+i,..., еп представляет собой V\ (см. подробнее гл.4). 2) По аналогии с линейными операторами, действующими взаимно одно- однозначно из V в V, можно ввести понятие линейного оператора А, действующего взаимно однозначно из линейного пространства V в линейное пространство W. Эти операторы характеризуются тем, что различным элементам xi и Х2 про- пространства V отвечают различные элементы yi = Axi и у2 = Ах2 простран- пространства W. Таким свойством обладает рассматриваемый оператор А, действующий из пространства V\ в пространство imA. Действительно, если xi e Vi, х2 ? V\, х2 — xi / 0, то х2 — xi G V\, и поэтому Ах2 ф Axi (Axi G imA, Ax2 G imA, ибо если бы Ах2 = Axi, то А(х2 — xi) = 0, т. е. х2 — xi e ker А, что противоречило бы принадлежности х2 — xi G Vi и условию х2 — xi ф 0 (Vi и ker А составляют прямую сумму и поэтому имеют общим лишь нулевой элемент).
§ 1 ] ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА 109 но, предположение р > q ведет к противоречию. Таким образом, р = q. Теорема доказана. Имеет место также следующая теорема, в определенном отношении обратная теореме 5.1. Теорема 5.2. Пусть V\ и V^ — два таких подпространства п-мерного пространства V, что dimVi +dimV2 = dim V. Тогда су- существует такой линейный оператор А из L(V, V), что V\ = im A и V2 = ker А. Доказательство. Пусть dim V\ = p, dim V2 = q- Выберем в про- пространстве V базис еь е2,..., еп так, чтобы элементы ер+ь ер_|_2> ..., еп принадлежали У%. Далее в пространстве V\ выберем некоторый базис gi, g2,..., gp. Определим теперь значения линейного оператора А на базисных векторах ei, е2,..., еп пространства V следующим образом: =gi, Ae2 = g2, ..., Аер = gp, Aep+i = 0, Аер+2 = 0,..., Аеп = 0. Далее, если х = х\е\ + ж2е2 + ...+ хрер + ^p+iep+i + ...+ хпеп, то Ах = x\g\ + #2g2 + ... + xpgp. Очевидно, оператор А линейный и обладает требуемыми свойствами. Теорема доказана. Введем понятие ранга линейного оператора А. Назовем рангом линейного оператора А число, обозначаемое сим- символом rang А и равное rang A = dim(imA). Отметим следующее очевидное следствие из теоремы 5.1 и из замечания 2 этого пункта. Следствие из теоремы 5.1. Для того чтобы оператор А из L(V, V) имел обратный А~\ необходимо и достаточно, чтобы rang A = dim V = п. Пусть А и В — линейные операторы из L(V, V). Справедлива следующая теорема. Теорема 5.3. Имеют место следующие соотношения: rangAB ^ rang A, rangAB ^ rang В. Доказательство. Докажем сначала первое из отмеченных соотношений. Очевидно, imAB С imA 0. Поэтому dim(imAB) ^ ^dim(imA), т.е. rangAB ^ rang А. Для доказательства второго соотношения воспользуемся следую- следующим очевидным включением 2): ker В С ker AB. Из этого включения следует, что dim (ker В) ^ dim (ker AB). Из последнего неравенства, в свою очередь, следует неравенство dim V — dim (ker AB) ^ dimV— dim (ker В), а из него, согласно тео- 1) Символ С здесь и в дальнейшем обозначает включение, т. е. запись А С С В обозначает, что А является подмножеством В. 2) Так как АВ и ВА различные, вообще говоря, операторы, то включение imAB С imB может не иметь места, и поэтому для доказательства второго соотношения rangAB ^ rang В требуются специальные рассуждения.
ПО ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 реме 5.1, получаем dim(imAB)^ dim(imB), т.е. rangAB ^ rang В. Теорема доказана. Докажем еще одну теорему о рангах линейных операторов. Теорема 5.4. Пусть А и В — линейные операторы из L(V, V) и п — размерность V. Тогда rangAB ^ rang A + rang В — п. Доказательство. Согласно теореме 5.1 dim (im AB) + dim (ker AB) = п. E.5) Так как rangAB = dim(imAB), то из E.5) получаем rangAB = п - dim (ker AB). E.6) Поскольку, согласно теореме 5.1, dim (ker A) + dim (ker В) = 2п - (rang A + rang В), E.7) то для доказательства теоремы достаточно установить неравенство dim (ker AB) < dim (ker A) + dim (ker B). E.8) Действительно, из этого неравенства и из соотношения E.6) следует неравенство rangAB > п — (dim (ker A) + dim (kerВ)), из которого, согласно E.7), сразу же вытекает справедливость утвер- утверждения теоремы. Итак, перейдем к обоснованию неравенства E.8). Пусть dim (ker В) = q. E.9) Согласно теореме 5.3 dim (ker AB) ^ q. Поэтому справедливо соот- соотношение dim (ker AB) = p + q, где р > 0. E.10) Так как ker В С ker AB, то в подпространстве ker AB можно вы- выбрать базис хь Х2,..., хр+9 так, что элементы хр+ь . ..,хр+д об- образуют базис в ker В. При таком выборе хь Х2,..., хр+д элементы Вхь Вх2,..., Вхр линейно независимы (если линейная комбинация р / р \ р Y^ AfcBxfc = 0, то В( ^2 AfcXfc 1 = 0, т.е. ^ Ад.х*. С ker В, а это к=\ Vjfe=l / к=\ может быть, в силу выбора xi, Х2,..., хр, лишь при А/, = 0, к = 1, 2,... ..., р). Поэтому элементы Bxi, Bx2,..., Вхр принадлежат ker А, т.е. р^ dim (ker А). Из этого неравенства и соотношений E.9) и E.10) вытекает требуемое неравенство E.8). Теорема доказана. Следствие из теорем 5.3 и 5.4. Если rang А = п (п — размер- размерность V), то rangAB = rang В А = rang В. Указанное следствие вытекает из неравенств rangAB ^ rang В (теорема 5.3), rangAB > rang В (теорема 5.4 при rang А = п). Из этих неравенств получим, что rangAB = rang В. Аналогично дока- доказывается соотношение rang В А = rang В.
§2] МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ Ш § 2. Матричная запись линейных операторов 1. Матрицы линейных операторов в заданном базисе линей- линейного пространства V. Фиксируем в линейном пространстве V базис ei, е2,..., еп. Пусть х — произвольный элемент V и x=f>/ce/c E.11) к=\ разложение х по данному базису. Пусть А — линейный оператор из L(V, V). Тогда из E.11) полу- получаем Ах= JTxkAek. E.12) к=\ Полагая Ae* = ?>ieif E.13) перепишем E.12) в следующей форме: п п п / п ( к=\ j = \ j = \ V к=\ Таким образом, если у = Ах и элемент у имеет координаты у\ уо = $>?**, j = l,2,...,n. E.14) у2,...,уп,то к=\ Рассмотрим квадратную матрицу А с элементами а3к\ А = ("{)• Эта матрица называемся матрицей линейного оператора в задан- заданном базисе е\, е%,..., еп. Наряду с ранее указанным способом записи линейного операто- оператора используется при заданном базисе ei, e2,..., еп матричная форма записи: у = Ах, причем, если х = (х1, х2,..., хп), то у = (у1, у2,... ..., уп), где yj, j = 1, 2,..., п, определяются с помощью соотноше- соотношений E.14), а элементы а3к матрицы А вычисляются по формулам E.13). Замечание 1. Если оператор А нулевой, то все элементы матри- матрицы А этого оператора равны нулю в любом базисе, т.е. А — нулевая матрица. Замечание 2. Если оператор А единичный, т. е. А = I, то матри- матрица этого оператора будет единичной в любом базисе. Иными словами, в этом случае А = Е, где Е — единичная матрица. В дальнейшем единичную матрицу мы будем обозначать также символом /.
112 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Мы выяснили, что каждому линейному оператору А из L(V, V) при заданном базисе линейного пространства V отвечает матрица А этого оператора. Естественно, возникает обратный вопрос — каждой ли данной матрице А при заданном базисе в V можно поставить в соответствие линейный оператор А, матрицей которого будет данная матрица. Важно также выяснить вопрос о единственности матрицы линейного оператора в заданном базисе. Справедливо следующее утверждение. Теорема 5.5. Пусть в линейном пространстве V задан базис еь е2,..., еп, и пусть А = (а°к) — квадратная матрица, содержа- содержащая п строк и п столбцов. Существует единственный линейный оператор А, матрицей которого в заданном базисе является мат- матрица А. Доказательство. Докажем сначала существование операто- оператора А. Для этой цели определим значения Ае^ этого оператора на базисных векторах е& с помощью соотношения E.13), полагая в этом соотношении а\ равными соответствующим элементам заданной мат- матрицы А. Значение оператора А на произвольном векторе х е V, раз- разложение которого по базисным векторам ei, е2,..., еп дается форму- формулой E.11), определим по формуле E.12). Очевидно, построенный оператор линейный и матрицей этого опе- оператора является матрица А. Единственность оператора А, матрицей которого в базисе еь е2, ... ..., еп является матрица А, следует из соотношений E.13): с помо- помощью этих соотношений единственным образом определяются значения оператора на базисных векторах. Замечание 3. Пусть А и В — квадратные матрицы порядка п, А и В — отвечающие им линейные операторы в заданном базисе {е/,} пространства V. Из доказательства теоремы 5.5 следует, что матрице А + ХВ, где Л — некоторое число, отвечает линейный оператор А + ЛВ (напомним, что А, В и А + ЛВ принадлежат L(V, V)). Докажем следующую теорему. Теорема 5.6. Ранг линейного оператора А равен рангу матри- матрицы А этого оператора: rang A = rang Л. Доказательство. По определению rang A = dim(imA), a imA — линейная оболочка векторов g^: (см. матричную форму записи оператора и определение imA). Поэтому rang А равен максимальному числу линейно независи- независимых векторов gfc. Так как векторы еь е2,..., еп линейно независимы, то, согласно E.15), максимальное число линейно независимых векто- векторов gfc совпадает с максимальным числом линейно независимых строк (а\., а|,..., ajj) матрицы А, т.е. с рангом А. Теорема доказана. Пусть А и В — произвольные квадратные матрицы, содержащие п строк и п столбцов. Из теорем 5.3-5.6 вытекают следующие следствия.
§2] МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ ИЗ Следствие 1. Ранг rangAB произведения А и В удовлетворяет соотношениям rangAB < rang Л, rangAB < rang Б, rang AB ^ rang A + rang В — п. Следствие 2. Обратный оператор А для оператора А су- существует только тогда, когда ранг матрицы А оператора А равен п (п = dim V). Отметим, что в этом случае существует также и обратная матрица А~х для матрицы А. 2. Преобразование матрицы линейного оператора при переходе к новому базису. Пусть V — линейное пространство, А — линейный оператор из L(V, V), е\, е2,..., еп и ёь ёг,..., ёп — два базиса в V и ek = J2ukei^ A:= 1, 2,..., п E.16) г=\ — формулы перехода от базиса {е^} к базису {ек}. Обозначим через U матрицу (игк): */ = («?)• E-17) Отметим, что rang U = п. Пусть А = (а{) и А = (а{) E.18) — матрицы оператора А в указанных базисах. Найдем связь между этими матрицами. Справедливо следующее утверждение. Теорема 5.7. Матрицы А и А оператора А в базисах {ек} и {ё/,} соответственно связаны соотношением А = U~lAU, где U~x — обратная матрица 0 для матрицы U, определенной равенством E.17). Доказательство. Обращаясь к понятию матрицы линейного оператора, получим, согласно E.18), п п г=1 г=1 Из определения линейного оператора, из формул E.16) и второй из формул E.19) следуют соотношения / п \ п п Аек = А ( ^2 и1ег ) > Аё^ = ^2 ягк ^2 uiej • П 7 Поэтому справедливо равенство ^ г^Ае^ = ^ »=i з= l) Так как rang U = n, то обратная матрица U 1 матрицы f/ существует.
114 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Подставляя в левую часть этого равенства выражение Ае^ по пер- первой из формул E.19), найдем ) Так как {е^} — базис, то из последнего соотношения вытекают равенства ?14 з, к =1,2,..., п. E.20) г=\ г=\ Если обратиться к матрицам А, А и U (см. E.17) и E.18)), то соотношения E.20) будут эквивалентны следующему матричному равенству: UА = AU. Умножая обе части этого равенства слева на матрицу U~\ получим требуемое соотношение А = U~x AU. Теорема доказана. _ Замечание 1. Обратимся к формуле А = U~XAU. Умножая обе части этого матричного равенства слева на матрицу U и справа на U~l, получим соотношение _ A = UAU~\ E.21) представляющее собой другую форму связи между матрицами А и А линейного оператора А в разных базисах. Замечание 2. Пусть А и В — квадратные матрицы порядка п, А и В — отвечающие им линейные операторы в заданном базисе {ек}. Как уже отмечалось (см. замечание 3 предыдущего пункта), матрице А + ХВ отвечает линейный оператор А + АВ. Выясним вид матрицы этого оператора в базисе {ё/,}. Пусть А и В — матрицы операторов А и В в базисе {ё/.}. Тогда, согласно E.21), имеем A = UAU~\ B = UBU-1. E.22) Матрица линейного оператора А + АВ в базисе {ё/.} имеет, со- согласно E.21), следующий вид: U(A + XB)U~K Используя распредели- распределительное свойство умножения матриц, перепишем последнюю формулу следующим образом (напомним, что эта формула представляет собой матрицу линейного оператора А + АВ в базисе {ё/г}: UAU~l +\{UBU-1). Обращаясь к соотношениям E.22), видим, что матрица операто- оператора А + АВ в базисе {ек} записывается следующим образом: В частности, если В — единичная матрица, В = I, то В = I (см. замечание 2 предыдущего пункта и теорему 5.5) и поэтому мат- матрица линейного оператора А + AI в базисе {ек} имеет вид А + XI. Следствие из теоремы 5.7. det A = det A.
§2] СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ П5 В самом деле, так как определитель произведения матриц равен произведению определителей этих матриц, то из равенства А = U~x AU следует, что _ det A = det U~l det A det U. E.23) Поскольку det U~^ det U = 1, то из соотношения E.23) получаем равен- равенство det Л =det А. Таким образом, определитель матрицы линейного оператора не зависит от выбора базиса. Поэтому можно ввести понятие определителя det А линейного оператора А, полагая det A = det Л, E.24) где А — матрица линейного оператора А в любом базисе. 3. Характеристический многочлен линейного оператора. Пусть А — линейный оператор, а I — тождественный оператор из L(V, V). Определение. Многочлен относительно Л det (A - AI) E.25) называется характеристическим многочленом оператора А. Пусть в пространстве V задан базис {е/.} и А = (аэк) — матрица оператора А в этом базисе. Тогда, согласно E.24), характеристический многочлен E.25) оператора А запишется следующим образом: E.26) Запишем характеристический многочлен E.25), обозначая через dk коэффициент при \к det (A - AI) = jr dk\k. E.27) fc=0 Замечание 1. Так как значение определителя det (А — AI) не зависит от выбора базиса, то коэффициенты dk характеристического многочлена в правой части E.27) также не зависят от выбора базиса. Таким образом, коэффициенты dk характеристического многочлена оператора А представляют собой инварианты — величины, значе- значения которых не зависят от выбора базиса. В частности, коэффициент dn-\ равный, очевидно, а} + а\ + ... ... + а™, является инвариантом. Этот инвариант называется следом оператора А и обозначается символом trA (от английского слова trace — след): trA = a\ Замечание 2. Уравнение det (A -AI) = «1- ai A a\- al A ... a? a? al-\ trA = a\ +а^+ ... + <. E.28) det(A-AI)=0 E.29) называется характеристическим уравнением оператора А.
116 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 § 3. Собственные значения и собственные векторы линейных операторов Пусть V\ — подпространство n-мерного линейного пространства V и А — линейный оператор из L(V, V). Определение 1. Пространство V\ называется инвариантным под- подпространством оператора А, если для каждого х, принадлежаще- принадлежащего V\, элемент Ах также принадлежит V\. Примерами инвариантных подпространств оператора А могут слу- служить ker А и imA. Определение 2. Число Л называется собственным значением опе- оператора А, если существует ненулевой вектор х такой, что Ах = Лх. E.30) При этом вектор х называется собственным вектором оператора А, отвечающим собственному значению Л. Справедливо следующее утверждение. Теорема 5.8. Для того чтобы число А было собственным зна- значением оператора А, необходимо и достаточно, чтобы это число было корнем характеристического уравнения E.29) оператора А. Доказательство. Пусть Л — собственное значение оператора А и х — собственный вектор, отвечающий этому Л (х ф 0). Перепишем соотношение E.30) в следующей форме: (А - Л1)х = 0. Так как х — ненулевой вектор, то из последнего равенства следует, что ker (А - AI) ф 0, т. е. dim (ker (A - AI)) > 1. E.31) Поскольку, согласно теореме 5.1, dim (im (A - AI)) + dim (ker (A - AI)) = n, то из этого равенства и неравенства E.31) получаем dim (im (A - AI)) < n - 1. E.32) По определению, dim (im (A — AI)) равняется рангу оператора А — AI. Поэтому из неравенства E.32) следует: rang (A- AI) < п. E.33) Таким образом, если А — собственное значение, то ранг матрицы А — XI оператора А — AI меньше п, т. е. det (А — AI) = 0 и, следова- следовательно, А — корень характеристического уравнения. Пусть теперь А — корень характеристического уравнения E.29). Тогда справедливо неравенство E.32), а следовательно, и неравен- неравенство E.31), из которого вытекает существование для числа А такого ненулевого вектора х, что (А — А1)х = 0. Последнее соотношение
§3] СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ П7 эквивалентно соотношению E.30). Поэтому Л — собственное значение. Теорема доказана. Следствие. Каждый линейный оператор имеет собственное значение. Действительно, характеристическое уравнение всегда имеет корень (в силу основной теоремы алгебры). Справедлива следующая теорема. Теорема 5.9. Для того чтобы матрица А линейного опера- оператора А в данном базисе {ек} была диагональной 0, необходимо и достаточно, чтобы базисные векторы ек были собственными векторами этого оператора. Доказательство. Пусть базисные векторы ек являются соб- собственными векторами оператора А. Тогда Аек = Хкек, E.34) и поэтому матрица А оператора А имеет вид (см. соотношения E.13) и понятие матрицы линейного оператора) (Ai 0 ... 0 \ 0 Л2 '•• ° I , E.35) 0 "(Г У.." An/ т. е. является диагональной. Пусть матрица А линейного оператора А в данном базисе {ек} диагональна, т.е. имеет вид E.35). Тогда соотношения E.13) примут вид E.34), а это означает, что ек — собственные векторы оператора А. Теорема доказана. Докажем еще одно свойство собственных векторов. Теорема 5.10. Пусть собственные значения Х\, А2,..., Хр опера- оператора А различны. Тогда отвечающие им собственные векторы е\, е2,..., ер линейно независимы. Доказательство. Применим индукцию. Так как ei — ненулевой вектор, то для одного вектора (р = 1) утверждение справедливо (один ненулевой вектор является линейно независимым). Пусть утверждение теоремы доказано для т векторов еь е2,..., ет. Присоединим к этим векторам вектор em+i и допустим, что имеет место равенство m+l ^2 akGk = 0- E.36) k=\ Тогда, используя свойства линейного оператора, получим m+l ^2 akA.ek = 0. E.37) k=\ 1) Напомним, что матрица называется диагональной, если все ее элементы, расположенные не на главной диагонали, равны нулю.
118 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Так как ек — собственные векторы, то Аек = Хкек, и поэтому равенство E.37) можно переписать следующим образом: \ ак\кек=Ъ. E.38) к=\ т+\ Согласно E.36) ^ \т+\акек = 0. Вычитая это равенство из ра- к=\ венства E.38), найдем 0. E.39) к=\ По условию все Хк различны, т. е. Хк — Am+i ф 0. Поэтому из E.39) и предположения о линейной независимости векторов ei,e2,...,em следует, что а\ = «2 = ••• = &т = 0- Отсюда и из E.36), а также из условия, что em+i — собственный вектор (em+i ф 0), вытекает, что am+i = 0. Таким образом, из равенства E.36) мы получаем, что а\ = а.2 = ... = c^m+i = 0. Это означает, что векторы еь е2,..., em+i линейно независимы. Индукция проведена, и доказательство теоремы завершено. Следствие. Если характеристический многочлен оператора А имеет п различных корней, то в некотором базисе матрица опера- оператора А имеет диагональный вид. Действительно, в рассматриваемом случае, согласно только что доказанной теореме, собственные векторы линейно независимы и по- поэтому могут быть выбраны в качестве базисных. Но тогда по теореме 5.9 в этом базисе матрица оператора А будет диагональной. §4. Линейные и полуторалинейные формы в евклидовом пространстве 1. Специальное представление линейной формы в евклидовом пространстве. Пусть V — евклидово пространство, а С — комплекс- комплексная плоскость (одномерное комплексное линейное пространство). В п. 1 § 1 этой главы мы ввели понятие линейной формы — линейного оператора, действующего из V в С. В этом пункте мы получим специальное представление произвольной линейной формы / из L(V, С). Лемма. Пусть / — линейная форма из L(V, С). Тогда существу- существует единственный элемент h из V такой, что /(х) = (х, h). E.40) Доказательство. Для доказательства существования элемен- элемента h выберем в V ортонормированный базис еь е2,..., еп.
§4] ЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФОРМЫ П9 Рассмотрим элемент h, координаты hk которого в выбранном базисе определяются соотношениями О hk = ТЫ- E-41) П Таким образом, h = ^ Нкек. к=\ п Пусть х = ^2 %кек — произвольный элемент пространства V. Ис- к=\ пользуя свойства линейной формы / и равенство E.41), получим х> f>^. E-42) к=\ к=\ Так как в ортонормированном базисе {ек} скалярное произведе- произведете n n ние (х, h) векторов х = ^ хкек иЬ=^ hkek равно ^ xkhk, то к=\ к=\ к=\ из E.42) получаем /(х) = (х, h). Существование вектора h доказано. Докажем единственность этого вектора. Пусть hi и h2 — два векто- вектора таких, что с помощью этих векторов форма /(х) может быть пред- представлена в виде E.40). Очевидно, для любого х справедливо соотно- соотношение (х, hi) = (х, h2), из которого следует равенство (х, h2 — hi) = = 0. Полагая в этом равенстве х = h2 — hi и используя определение нормы элемента в евклидовом пространстве, найдем ||h2 — hi|| = 0. Итак, h2 = hi. Лемма доказана. Замечание. Очевидно, лемма справедлива и в случае, если V — вещественное евклидово пространство, а / ? L(V, R), где R — вещест- вещественная прямая. 2. Полуторалинейные формы в евклидовом пространстве. Спе- Специальное представление таких форм. Введем понятие полуторали- нейной формы в линейном пространстве. Определение. Числовая функция В(х, у), аргументами которой являются всевозможные векторы х и у линейного пространства L, называется полу тор алинейной формой, если для любых векторов х, у и z из L и любого комплексного числа Л выполняются соотношения , z), Б(х, y + z) = Б(х, у) + Б(х, z), Б(Лх, у) = ЛБ(х, у), E'43) Б(х, Лу) = ЛБ(х, у). Иными словами, полуторалинейная форма В(х, у) представляет со- собой числовую функцию двух векторных аргументов х, у, определенную О Черта над f{^k) означает, что берется комплексно-сопряженное значение этого выражения.
120 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 на всевозможных векторах х и у линейного пространства L, линейную по первому аргументу х и антилинейную по второму аргументу у. Замечание 1. Если линейное пространство L является веще- вещественным, то полуторалинейные формы переходят в так называемые билинейные формы, т. е. формы, линейные по каждому из аргументов (четвертое из соотношений E.43) в силу вещественности Л будет характеризовать линейность и по второму аргументу). Билинейные формы изучаются в гл. 7. Обратимся к полуторалинейной форме, заданной в евклидовом про- пространстве V. Справедлива следующая теорема о специальном представ- представлении такой формы. Теорема 5.11. Пусть В {к, у) — полу тор алинейная форма в ев- евклидовом пространстве V. Тогда существует единственный линей- линейный оператор А из L(V, V) такой, что Б(х, у) = (х, Ау). E.44) Доказательство. Пусть у — любой фиксированный элемент пространства V. Тогда В(х, у) представляет собой линейную форму аргумента х. Поэтому по лемме предыдущего пункта можно указать такой однозначно определенный элемент h пространства V, что В(х, у) = (х, h). E.45) Итак, каждому у из V по правилу E.45) ставится в соответствие единственный элемент h из V. Таким образом, определен оператор А такой, что h = Ay. Линейность этого оператора элементарно следует из свойств E.43) полуторалинейной формы и из свойств скалярного произведения. Докажем единственность оператора А. Пусть Ai и А2 — два оператора таких, что с помощью этих операторов форма В {к, у) может быть представлена в виде E.44). Оче- Очевидно, для любых х и у справедливо соотношение (х, Aiy) = (х, А2у), из которого следует равенство (х, А2У — Aiy) = 0. Полагая в этом равенстве х = А2У — Aiy и используя определение нормы элемента, найдем ||А2у - Aiy|| = 0. Таким образом, для любого у из V имеет место равенство А2у = = Aiy, т.е. А2 = А\. Теорема доказана. Следствие. Пусть Б(х, у) — полу тор алинейная форма в ев- евклидовом пространстве V. Тогда существует единственный линей- линейный оператор А из L(V, V) такой, что Б(х, у) = (Ах, у). E.46) Справедливость следствия вытекает из следующих рассуждений. Во-первых, форма Bi(x, у) = В(х, у) является полуторалинейной (это следует из того, что Б(х, у) — полуторалинейная форма, и из опре- определения такой формы). Далее, по теореме 5.11 получаем для #i(x, у) представление в виде ?i(y,x) = (y, Ах). E.47)
§4] ЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФОРМЫ 121 Так как сопряженное значение от В\(~к, у) равно В\(х, у), то, беря сопряженное значение левой и правой частей E.47) и учитывая равенство #i(x, у) = В(х, у), получим В(х, у) = (у, Ах). E.48) Но (у, Ах) = (Ах, у) (см. гл.4, §3, п. 1). Поэтому из E.48) полу- получаем равенство E.46). Следствие доказано. Замечание 2. Теорема 5.11 и следствие из этой теоремы спра- справедливы и для случая вещественного евклидова пространства. В этом случае в формулировке теоремы и следствия термин «полуторалиней- ная форма» надо заменить термином «билинейная форма». См. также замечание 1. Введем понятие матрицы полуторалинейной формы в данном ба- базисе {ек}. п п Пусть х, у принадлежат Уих=^ x^ej, у = ^ ук&к — разложе- j=\ к=\ ния х и у по базису {е/,}. Из определения полуторалинейной формы следуют соотношения Б(х, у) = В ( J2 x*ejt ? укек) = ? ? х*укВ{е^ ек). E.49) Vj=i к=\ ' j=\k=\ Полагая bjk = B(ejt ek), E.50) запишем выражение E.49) в следующей форме: Б(х, у)= ? 6^27*. 3,к=\ Матрица В = (bjk) называется матрицей полуторалинейной формы Б(х, у) в базисе {ек}. Справедливо следующее утверждение. Пусть полу тор алинейная форма В(х, у) представлена в ви- виде E.46) Б(х, у) = (Ах, у). Пусть далее элементы матрицы А оператора А в данном ортонор- мированном базисе равны ак. Тогда в этом базисе bjk = ак. Для доказательства обратимся к выражению E.50) для коэффициентов bjk полуторалинейной формы. Преобразуем правую часть E.50) с помо- помощью E.46). Получим, согласно E.13), (п \ q=\ ' q=\ ' q=\ Так как базис {ек} ортонормированный, то (е9, е&) = 0, если q ф к и (ек, ек) = 1. Поэтому из всех слагаемых последней суммы отличным
122 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 от нуля будет лишь то, которое получается при q = к. Таким образом, bjk = a1?. Утверждение доказано. Замечание 3. Если полуторалинейная форма представлена в виде Б(х, у) = (х, Ау) и элементы матрицы А оператора А в данном ортонормированном базисе равны aj, то в этом базисе bjk = a*. § 5. Линейные самосопряженные операторы в евклидовом пространстве 1. Понятие сопряженного оператора. Мы будем рассматривать линейные операторы в конечномерном евклидовом пространстве V. Определение 1. Оператор А* из L(V, V) называется сопряженным к линейному оператору А, если для любых х и у из V выполняется соотношение (Ах, у) = (х, А*у). E.51) Легко убедиться в том, что оператор А*, сопряженный к линейному оператору А, сам является линейным оператором. Это вытекает из очевидного соотношения (Ах, ayi + /Зу2) = п(Ах, у,) + /3(Ах, у2) = = й(х, А*У1) + 0(х, А*у2) = (х, A*(ay, + /Зу2)), справедливого для любых элементов х, у\, у2 и любых комплексных чисел а и /3. Докажем следующую теорему. Теорема 5.12. Каждый линейный оператор А имеет единствен- единственный сопряженный. Доказательство. Очевидно, скалярное произведение (Ах, у) представляет собой полуторалинейную форму (см. гл. 4, § 3, п. 1 и определение полуторалинейной формы). По теореме 5.11 существует единственный линейный оператор А* такой, что эта форма может быть представлена в виде (х, А*у). Таким образом, (Ах, у) = х, А*у. Следовательно, оператор А* — сопряженный к оператору А. Един- Единственность оператора А* следует из единственности представления полуторалинейного оператора в виде E.44). Теорема доказана. В дальнейшем символ А* будет обозначать оператор, сопряженный к оператору А. Отметим следующие свойства сопряженных операторов: 1°. 1*=1, 4°. (А*)*= А, 2°. (А + В)* = А* + В*, 5°. (АВ)* = В*А*. 3°. (АА)* = АА*, Доказательства свойств 1°-4° элементарны, и мы предоставляем их читателю. Приведем доказательство свойства 5°. Согласно определению произведения операторов справедливо соотношение
§5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 123 (АВ)х = А(Вх). С помощью этого равенства и определения сопряженного оператора получаем следующую цепочку соотношений: ((АВ)х, у) = (А(Вх), у) = (Вх, А*у) = = (х, В*(А*у)) = (х, (В*А*)у). Таким образом, ((АВ)х, у) = (х, (В*А*)у). Иными словами, опе- оператор В*А* является сопряженным к оператору АВ. Справедливость свойства 5° установлена. Замечание. Понятие сопряженного оператора для вещественного пространства вводится совершенно аналогично. Выводы этого пункта и свойства сопряженных операторов справедливы и для этого случая (при этом свойство 3° формулируется так: (АА)* = АА*). 2. Самосопряженные операторы. Основные свойства. Определение 2. Линейный оператор А из L(V, V) называется самосопряженным, если справедливо равенство А* =А. Самосопряженный оператор в вещественном пространстве определяет- определяется аналогично. Простейшим примером самосопряженного оператора является тож- тождественный оператор I (см. свойство 1° сопряженных операторов в предыдущем пункте). С помощью самосопряженных операторов можно получить специ- специальное представление произвольных линейных операторов. Именно, справедливо следующее утверждение. Теорема 5.13. Пусть А — линейный оператор, действующий в комплексном евклидовом пространстве V. Тогда справедливо пред- представление А = Ая + ^А/, где А я и А/ — самосопряженные опе- операторы, называемые соответственно действительной и мнимой частью оператора А. Доказательство. Согласно свойствам 2°, 3° и 4° сопряженных операторов (см. предыдущий пункт этого параграфа) операторы AR = = (А + А*)/2 и А/ = (А - А*)/2г — самосопряженные. Очевидно, А = А я + гА/. Теорема доказана. В следующей теореме выясняются условия самосопряженности про- произведения самосопряженных операторов. Мы будем говорить, что опе- операторы А и В коммутируют, если АВ = В А. Теорема 5.14. Для того чтобы произведение АВ самосопря- самосопряженных операторов А и В было самосопряженным оператором, необходимо и достаточно, чтобы они коммутировали. Доказательство. Так как А и В — самосопряженные операто- операторы, то, согласно свойству 5° сопряженных операторов (см. п. 1 этого параграфа), справедливы соотношения (АВ)* = В*А* = ВА. E.52)
124 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Следовательно, если АВ = ВА, то (АВ)* = АВ, т.е. оператор АВ — самосопряженный. Если же АВ — самосопряженный опе- оператор, то АВ = (АВ)*, и тогда, на основании E.52), АВ = ВА. Теорема доказана. В дальнейших теоремах устанавливается ряд важных свойств само- самосопряженных операторов. Теорема 5.15. Если оператор А самосопряженный, то для лю- любого х G V скалярное произведение (Ах, х) — вещественное число. Доказательство. Справедливость утверждения теоремы выте- вытекает из следующего свойства скалярного произведения в комплексном евклидовом пространстве (Ах, х) = (х, Ах) и определения самосопря- самосопряженного оператора (Ах, х) = (х, Ах) 0 . Теорема 5.16. Собственные значения самосопряженного опера- оператора вещественны. Доказательство. Пусть Л — собственное значение самосопря- самосопряженного оператора А. По определению собственного значения операто- оператора А (см. определение 2 § 3 этой главы) существует ненулевой вектор х такой, что Ах = Лх. Из этого соотношения следует, что вещественное (в силу теоремы 5.15) скалярное произведение (Ах, х) может быть представлено в виде 2) (Ах, х) = Л(х, х) = Л||х||2. Так как ||х|| и (Ах, х) вещественны, то, очевидно, и Л — веще- вещественное число. Теорема доказана. В следующей теореме выясняется свойство ортогональности соб- собственных векторов самосопряженного оператора. Теорема 5.17. Если А — самосопряженный оператор, то соб- собственные векторы, отвечающие различным собственным значениям этого оператора, ортогональны. Доказательство. Пусть Ai и Л2 — различные собственные значения (Ai Ф \^) самосопряженного оператора A, a xj и хз - соответственно отвечающие им собственные векторы. Тогда имеют место соотношения Axi = А1Х1, Ах2 = А2Х2. Поэтому скалярные про- произведения (Axi, X2) и (xi, AX2) соответственно равны следующим выражениям 3): (Ахь х2) = Ai(xb x2), (хь Ах2) = А2(хь х2). Так как оператор А самосопряженный, то скалярные произведения (Ахь х2) и (xi, Ax2) равны, и поэтому из последних соотношений 1) Напомним, что если комплексное число равно своему сопряженному, то это число — вещественное. 2) Напомним, что символ ||х|| обозначает норму элемента х. 3) Так как собственные значения самосопряженного оператора веществен- вещественны, то (xi, AX2) =
§5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 125 путем вычитания получаем равенство (A2-Ai)(xi,x2)=0. Поскольку А2 ф Аь то из последнего равенства следует равенство нулю скалярного произведения (хь хг), т.е. ортогональность собствен- собственных векторов xi и Х2. Теорема доказана. 3. Норма линейного оператора. Пусть А — линейный оператор, отображающий евклидово пространство V в это же пространство. Введем понятие нормы оператора А. Определение 3. Нормой \\A\\ линейного оператора А называется число, определяемое соотношением О ||А||= sup ||Ax||. E.53) Цх|| = 1 Из определения нормы линейного оператора вытекает следующее очевидное неравенство: ||Ах|| < ||А|| ||х|| E.54) (для доказательства достаточно воспользоваться соотношением Ах = ( х \ А---г I ||х||). Из соотношения E.54) следует, что если ||А|| = О, то - 1-л оператор А является нулевым. Норму самосопряженного оператора А можно определить и другим способом. Именно, справедливо утверждение'. Если А — самосопряженный оператор, то введенная выше нор- норма ||А|| оператора А равна sup||x||=1 |(Ax, х)|: sup |(Ax, х)| = ||А||. E.55) Цх|| = 1 Доказательство. Для любого х из V справедливо неравенство Коши-Буняковского (см. п. 2 §3 гл.4) Из него и из неравенства E.54) получаем следующее неравенство: |(Ах, х)| ^ ||А|| ||х||2. Поэтому число li= sup |(Ax, x)| E.56) удовлетворяет соотношению E.57) х) Напомним, что ||Ах|| = <у/(Ах, Ах) . Отсюда следует, что ||Ах|| пред- представляет собой непрерывную функцию х, которая на замкнутом множестве ||х|| = 1 достигает конечного наибольшего значения.
126 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Отметим, что из равенства (Az, z) = I А---г, ---г I ||z|| , z ф О V llzll llzll/ Z Z V / и определения числа /i (см. E.56)) вытекает следующее неравенство: |(Az, z)| </i||z||2. E.58) Обратимся теперь к следующему очевидному тождеству: 4 Re (Ах, у) = (А(х + у), х + у) - (А(х - у), х - у) (в этом тождестве символ Re (Ax, у) обозначает действительную часть комплексного числа (Ах, у), само тождество легко вытекает из свойств скалярного произведения, см. п. 1 §3 гл.4). Беря левую и правую части этого тождества по модулю, используя свойство модуля суммы и неравенство E.58), получим следующие соотношения 0 : 4|Re (Ах, у)| < м||х + у||2 + м||х - у||2 = 2/х(||х||2 + ||у||2). Отсюда при ||х|| = ||у|| = 1 получаем неравенство |Re(Ax, у)Км. Полагая в этом неравенстве у = Ах/||Ах|| (очевидно, ||у|| = 1) и учи- учитывая, что число (Ах, Ах) = ||Ах||2 является вещественным (поэтому Re (Ах, Ах) = (Ах, Ах) = ||Ах||2), получим ||Ах|| ^ /i, ||x|| = 1. От- Отсюда, согласно неравенству E.53), найдем ||А|| < /i. Для завершения доказательства остается сравнить полученное неравенство с неравенством E.57) и воспользоваться определением числа /i (см. E.56)). 4. Дальнейшие свойства самосопряженных операторов. В этом пункте мы докажем ряд важных свойств линейных операторов, связан- связанных с понятием нормы. Сначала мы установим необходимое и доста- достаточное условие самосопряженности оператора. Докажем следующую теорему. Теорема 5.18. Для того чтобы линейный оператор А был само- самосопряженным, необходимо и достаточно, чтобы 2) Im (Ax, х) = 0. Доказательство. По теореме 5.13 произвольный линейный опе- оператор А может быть представлен в виде А = А я + гА/, где А# и А/ — самосопряженные операторы. Поэтому (Ах, х) = (Адх, х) + г(А/х, х), х) Мы использовали при этом определение нормы элемента в комплексном евклидовом пространстве. 2) Символ Im (Ax, х) обозначает мнимую часть комплексного числа (Ах, х). Равенство Im (Ах, х) = 0 означает, что число (Ах, х) является вещественным.
§5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 127 причем, согласно теореме 5.15, для любого х числа (А#х, х) и (А/х, х) — вещественные. Следовательно, эти числа соответственно равны действительной и мнимой частям комплексного числа (Ах, х): Re (Ах, х) = (Адх, х), Im (Ах, х) = (А/х, х). Допустим, что А — самосопряженный оператор. По теореме 5.15 в этом случае (Ах, х) — вещественное число, и поэтому Im (Ax, х) = 0. Необходимость условия теоремы доказана. Докажем достаточность условия теоремы. Пусть Im(Ax, х) = (А/х, х) = 0. Отсюда следует, что ||А/|| = 0, т. е. А/ = 0. Поэтому А = А#, где А# — самосопряженный оператор. Теорема доказана. В следующих утверждениях выясняются некоторые свойства соб- собственных значений самосопряженных операторов. Лемма. Любое собственное значение X произвольного линейного самосопряженного оператора А в евклидовом пространстве равно скалярному произведению (Ах, х), где х — некоторый вектор, удо- удовлетворяющий условию ||х|| = 1: Л = (Ах, х), ||х|| = 1. E.59) Доказательство. Так как Л — собственное значение операто- оператора А, то существует такой ненулевой вектор z, что Az = Az. E.60) Полагая x = z/||z|| (очевидно, ||х|| = 1), перепишем E.60) следу- следующим образом: Ах = Лх, ||х|| = 1. Отсюда получаем соотношения (Ах, х) = Л(х, х) = А||х||2 = Л, т.е. E.59) имеет место. Лемма дока- доказана. Следствие. Пусть А — самосопряженный оператор и X — любое собственное значение этого оператора. Пусть далее т = inf (Ах, х), М = sup (Ax, х). E.61) llxll=1 l|x||=i Справедливы следующие неравенства: т^Х^М. E.62) Замечание 1. Так как скалярное произведение (Ах, х) пред- представляет собой непрерывную функцию от х, то на замкнутом мно- множестве ||х|| = 1 эта функция ограничена и достигает своих точных граней т и М. Замечание 2. Согласно теореме 5.16 собственные значения са- самосопряженного оператора вещественны. Поэтому неравенства E.62) имеют смысл. Доказательство следствия. Так как любое собственное значение А удовлетворяет соотношению E.59), то, очевидно, каж- каждое собственное значение заключено между точными гранями т
128 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 и М скалярного произведения (Ах, х). Поэтому неравенства E.62) справедливы. Мы докажем, что числа т и М, определенные соотношения- соотношениями E.61) являются соответственно наименьшим и наибольшим соб- собственными значениями самосопряженного оператора А. Предваритель- Предварительно убедимся в справедливости следующего утверждения. Теорема 5.19. Пусть А — самосопряженный оператор и, кроме того, (Ах, х) ^ О для любого х. Тогда норма |[А|| равна наибольше- наибольшему собственному значению этого оператора 0 . Доказательство. Мы уже отмечали (см. утверждение преды- предыдущего пункта), что ||А|| = sup||x||=1 |(Ах, х)|. Так как (Ах, х) ^ О, то ||А|| = sup||x||=1(Ax, x). Согласно замечанию 1 этого пункта для некоторого х0, ||хо|| = 1, (Ахо, х0) = ||А|| = Л. Обращаясь к определению нормы и используя только что написан- написанные равенства, получим соотношения 2) ||(А - Л1)хо||2 = ||Ахо||2 - 2А(Ах0, х0) + Л2||х0||2 = = ||А||2-2||А|Н|А|| + ||А||2-1=0. Таким образом, (А — Л1)хо = 0, или, иначе, Ахо = Лхо, т.е. Л = = ||А|| — собственное значение оператора А. То, что Л — наибольшее собственное значение, вытекает из только что установленного след- следствия из леммы этого пункта. Теорема доказана. Докажем теперь, что числа т и М (см. E.61)) являются наи- наименьшим и наибольшим собственными значениями самосопряженного оператора А. Теорема 5.20. Пусть А — самосопряженный оператор, а т и М — точные грани (Ах, х) на множестве ||х|| = 1. Эти числа представляют собой наименьшее и наибольшее собственные значе- значения оператора А. Доказательство. Очевидно, достаточно доказать, что числа т и М — собственные значения оператора А. Тогда из неравенств E.62) сразу же следует, что т и М являются соответственно наименьшим и наибольшим собственными значениями. Докажем сначала, что М — собственное значение. Для этого рас- рассмотрим самосопряженный оператор В = А — ml. Так как (Вх, х) = (Ах, х) - га(х, х) > О, х) Так как собственных значений конечное число и они вещественны, то из них можно указать наибольшее. 2)Мы также воспользовались равенством ||Ахо||2 = ||А||2, которое следует из соотношений ||А|| = (Ах0, х0) < ||Ахо||) и ||А|| = sup||x||=1 ||Ax||.
§5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 129 то оператор В удовлетворяет условиям теоремы 5.19, и поэтому нор- норма ||В|| этого оператора равна наибольшему собственному значению. С другой стороны, ||В|| = sup (Вх, х) = sup (Ах, х) - т = М - т. ||х|| = 1 ||х|| = 1 Таким образом, (М — т) — наибольшее собственное значение опера- оператора В. Следовательно, существует такой ненулевой вектор х0, что Вх0 = (М-т)хо. E.63) Так как В = А — ml, то Вхо = Ахо — mlxo = Ахо — гахо. Подставляя это выражение Вхо в левую часть равенства E.63), получим после несложных преобразований соотношение Ахо = Мхо- Таким образом, М — собственное значение оператора А. Убедимся теперь, что число т также является собственным значе- значением оператора А. Рассмотрим самосопряженный оператор В = -А. Очевидно, что —т = sup||x||=1(Bx, x). Согласно только что проведенному доказатель- доказательству число — т представляет собой собственное значение оператора В. Так как В = —А, то т будет являться собственным значением опера- оператора А. Теорема доказана. В следующей теореме выясняется важное свойство собственных векторов самосопряженного оператора. Теорема 5.21. У каждого самосопряженного линейного опера- оператора А, действующего в п-мерном евклидовом пространстве V, существует п линейно независимых попарно ортогональных и еди- единичных собственных векторов. Доказательство. Пусть Ai — максимальное собственное зна- значение оператора A (Ai = sup||x||=1(Ax, x)). Обозначим через ei соб- собственный вектор, отвечающий Ai и удовлетворяющий условию ||ei|| = = 1 (возможность его выбора следует из доказательства леммы этого пункта). Обозначим через V\ (n — 1)-мерное подпространство простран- пространства V, ортогональное к е^ Очевидно, V\ — инвариантное подпро- подпространство оператора А (т. е. если х е V\, то и Ах е V\. Действительно, пусть х G V\ (т. е. (х, е^ =0). Тогда О (Ах, ех) = (х, Ае{) = Ai(x, e^ = 0. Следовательно, Ах — элемент V\, и поэтому V\ — инвариантное подпространство оператора А. Это дает нам право рассматривать опе- оператор А в подпространстве V\. В этом подпространстве А будет пред- представлять собой самосопряженный оператор. Следовательно, имеется х) Мы использовали свойство самосопряженности оператора (Ах, ej) = = (х, Ае^ и то обстоятельство, что ei — собственный вектор оператора: Aei = 5 Линейная алгебра
130 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 максимальное собственное значение А2 этого оператора, которое можно найти с помощью соотношения О Хо = max (Ax, х). ||x=l||,x_LeiV Кроме того, можно указать такой вектор е2, e2_Lei, ||е2|| = 1, что Обращаясь далее к (п - 2)-мерному подпространству V2, ортого- ортогональному векторам ei и е2, и повторяя проведенные выше рассуж- рассуждения, мы построим собственный вектор ез, ||ез|| = 1, ортогональный ei и е2. Рассуждая и далее таким же образом, мы последовательно найдем п взаимно ортогональных собственных векторов еь е2,..., еп, удовлетворяющих условию Це^Ц = 1, г = 1, 2,..., п. Замечание 1. Договоримся в дальнейшем нумеровать собствен- собственные значения самосопряженного оператора в порядке убывания с уче- учетом повторяющихся, т. е. кратных собственных значений. При этом Ai ^ А2 ^ ... ^ Ап и отвечающие им собственные векторы ei, е2,... ..., еп можно считать взаимно ортогональными и удовлетворяющими условию ||е^|| = 1. Таким образом, [О при г ф j. Замечание 2. Из рассуждений в доказательстве теоремы следует Л (Ах, х) ~ соотношение Am+i = max —. -^. Это соотношение можно также x±efc, (X, Х) к=\,2,...,т (Ах х) записать в виде Am+i = max ——Ц-^-, где Ет — линейная оболочка векторов ei, e2,..., ет. Справедливость замечания вытекает из того, что (х, х) = ||х||2, и поэтому (Ах, х) _ ул., л.) причем норма элемента х/||х|| равна 1. Пусть Ит — множество всех m-мерных подпространств простран- пространства V. Справедливо следующее важное минимаксное свойство соб- собственных значений. Теорема 5.22. Пусть А — самосопряженный оператор и Х\,Х2,...,Хп — его собственные значения, занумерованные в порядке, указанном в замечании 1. Тогда (Ах х) Ат+1 = min max —.—^—-. E.64) X_L?v \Л\, Л\) Доказательство. Пусть Ет — линейная оболочка собственных векторов ei, е2,..., ет оператора А (см. замечание 1). ) Символ ei±e2 обозначает ортогональность векторов ei и в2.
§5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 131. В силу замечания 2 (Ах, х) л max \ ^ = Am+i. х±Егп (X, Х) ^ Поэтому для доказательства теоремы достаточно убедиться в спра- справедливости соотношения (Ах, х) (Ах, х) л /с ссч max ^ ^ > max ^ ^ = Am+i E.65) (х, х) x_L#m (х, х) ^ для любого Е G ?ш. Перейдем к доказательству соотношения E.65). Обозначим сим- символом Е1- ортогональное дополнение подпространства Е (см. п.З §2 гл.4). Из теоремы 2.10 следует, что размерность Е1- равна п — т. Следовательно, dim Е1- + dim Ет+\ = (п - т) + (т + 1) = п + 1 > п. Это означает, в силу теоремы 2.9, что пересечение подпространств Е1- и Ет+\ содержит ненулевой элемент. Итак, существует элемент х m+l такой, что x_L?/, ||х|| = 1, xG ^ш+ь т. е. х = ^ Так как ||х|| = 1 и базис ei, е2,..., em+i — ортонормированный, то в силу теоремы Пифагора (см. п. 2 § 1 гл.4) 7П+1 Цх||2= Е Ы2=1. E.66) к=\ т-\-\ ттг+1 Имеем далее Ах = А ^ с^е^ = ^ с^Ае^. Поскольку е/, — соб- ственные векторы оператора А, то из последних соотношений получаем m+l Ах = Е ск^кек- Отсюда и из ортонормированности е/, следует спра- к=\ ведливость соотношения (m+l m+l \ m+l Е ck\kek, Е срер) = Е Ы2*к. E.67) к=\ р=\ / к=\ Мы занумеровали собственные значения в порядке убывания с уче- учетом возможной их кратности. Поэтому Am+i ^ А&, к = 1, 2,..., т. Отсюда и из соотношений E.67) и E.66) получаем (Ах, х) т+1 = е 1с&12- к=\ ^к ^ ^т+1 т+1 Е к=\
132 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Замечая, что для любого х ф 0 норма элемента х/||х|| равна 1 и ||х|| = 1, а также учитывая, что Зс±Е, получим (Ах, х) /^ах х ^\ \ / л ~ ~\ \ л тах^ ^ = max А]—[Т, ]—гг > (Ах, х) > Am+i. х±е (х, х) х±я у ||х|| ||х||у Итак, соотношения E.65) установлены. Теорема доказана. 5. Спектральное разложение самосопряженных операто- операторов. Теорема Гамильтона-Кэли. Рассмотрим самосопряженный оператор А и собственные значения Ai ^ А2 ^ ... ^ Ап этого оператора. При этом ei, е2,..., еп — ортонормированный базис, состоящий из собственных векторов, отвечающих {А^}. Пусть х ? V. Тогда п х= ?(х,е*)е* E.68) к=\ (см. п. 3 § 2 гл. 4), а так как Ае/. = А^е/,, то с помощью E.68) получаем Ах = Y, л^(х> ек)ек- E.69) к=\ Оператор Р/г, определяемый соотношением Р^х = (х, ек)ек, E.70) называется проектором на одномерное подпространство, порожденное вектором е/г. Из свойств скалярного произведения сразу же следует, что Р& — самосопряженный линейный оператор. Отметим следующие важные свойства проекторов: 1°. Р| = Pfc (отсюда следует, что Р^1 = Р&, где ш — натуральное число). 2°. Р*Р,- = 0, где к ф j. Доказательство этих свойств следует из соотношений (РкР,-)х = Р^(Р^-х) = Рк(х, е,-)е, = Заметим также, что непосредственно из определения E.70) следует, что Р/, коммутирует с каждым оператором, который коммутирует с А. Из соотношений E.68), E.69) и E.70) получаем следующие выра- выражения для х и Ах: ? E.71) fe=i Ах = ? AfcPfcx. E.72)
§5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 133 п Из равенства E.71) следует, что оператор J^ P& является тожде- к=\ ственным: п i=Ep* E-73) к=\ Из равенства E.72) получаем так называемое спектральное разло- разложение самосопряженного оператора: А=?А*Р*. E.74) fe=i Из свойств 1° и 2° проекторов и из соотношения E.74) вытекает следующее выражение для А2: А2 = ± X2kPk- k=\ Очевидно, вообще для любого целого положительного s As=JT\skPk. E.75) /c=l т Рассмотрим произвольный полином р(Х) = ^qA\ По определе- г=1 т нию считают р(А) = ^ скАк. Обращаясь к соотношению E.75), легко к=\ получить следующее выражение для р(А): т Р;. E.76) г=\ Докажем следующую теорему. Теорема 5.23 (теорема Гамильтона-Кэли). Если А — самосопря- самосопряженный оператор и р(Х) = det (А — AI) — характеристический мно- многочлен этого оператора, то р(А) = 0. Доказательство. Действительно, если А — самосопряженный оператор и А^ — собственные значения этого оператора, то, согласно теореме 5.8, А^ является корнем характеристического уравнения, т. е. p(\i) = 0. Отсюда и из соотношения E.76) следует, что р(А) = 0. Теорема доказана. 6. Положительные операторы. Корни га-й степени из операто- оператора. Самосопряженный оператор А называется положительным, если для любого х из V справедливо соотношение (Ах, х) > 0. E.77) Если оператор А — положительный и из условия (Ах, х) = 0 следует, что х = 0, то А называется положительно определенным оператором.
134 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Положительные и положительно определенные операторы соответ- соответственно обозначаются символами А ^ 0 и А > 0. Отметим следующее простое утверждение. Каждое собственное значение положительного (положительно определенного) оператора неотрицательно (положительно). Это утверждение следует из простых рассуждений. Пусть Л —собственное значение оператора А. Тогда, согласно лемме п. 4 этого параграфа, можно указать такой элемент х, ||х|| = 1, что Л = (Ах, х). Отсюда и из соотношения E.77) получаем, что А > 0 для по- положительных операторов и Л > 0 для положительно определенных операторов. Утверждение доказано. Введем понятие корня т-й степени (т — натуральное число) из оператора. Определение. Корнем т-й степени из оператора А называется оператор В такой, что Вт = А. Корень 7П-Й степени из оператора А обозначается символом Естественно выделить какой-либо класс операторов, для которых имела бы смысл операция нахождения корня m-й степени. Определен- Определенный ответ на этот вопрос дается следующей теоремой. Теорема 5.24. Пусть А — положительный самосопряженный оператор, А ^ 0. Тогда для любого натурального т существует положительный самосопряженный оператор А1/771, А1/771 ^ 0. Доказательство. Обозначим через Л& собственные значения оператора А, и пусть {ек} — ортонормированный базис из собственных векторов. Обозначим далее через Р& проектор на одномерное подпро- подпространство, порожденное вектором е^. Согласно предыдущему пункту имеет место спектральное разложе- разложение E.74) самосопряженного оператора А: Так как А& ^ 0 (см. только что доказанное утверждение), то можно ввести следующий самосопряженный оператор В: В=ЕА^/тР,. E.78) /с=1 Согласно E.70) справедливо соотношение (Pfcx, x) > 0, из которого следует положительность операторов Рк и положитель- положительность оператора В (см. E.78)). Из свойств 1° и 2° проекторов Рк (см. п. 5 этого параграфа) п вытекает, что Вт = ^ A/gP/г. Сравнивая это выражение для Вт к=\ с выражением E.74) для А, получим Вт = А. Выше была установлена положительность оператора В. Теорема доказана.
§6] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ 135 Замечание 1. Отметим без доказательства, что существует един- единственный положительный оператор А1/771. Замечание 2. В ортонормированном базисе {е/,} собственных векторов оператора А матрица оператора А1/771 имеет следующий вид: О ... О лУт ... о 1/т i § 6. Приведение квадратичной формы к сумме квадратов В этом параграфе мы изучим вопрос о выборе такого базиса, в ко- котором квадратичная форма (инвариантная квадратичная функция коор- координат вектора; точно это понятие определяется ниже) имеет наиболее простой вид. Квадратичные формы подробно изучаются в гл. 7. Там будут, в част- частности, рассмотрены различные способы приведения таких форм к сум- сумме квадратов. Введем понятие так называемых эрмитовых форм. Определение. Полуторалинейная форма В {к, у) называется эрми- эрмитовой, если для любых х и у справедливо соотношение В(х, у) = В(у, х). E.79) Согласно следствию из теоремы 5.11 любая полуторалинейная фор- форма В(х, у) (в том числе и эрмитова) может быть единственным обра- образом представлена в виде Б(х, у) = (Ах, у), E.80) где А — линейный оператор. Докажем следующие два утверждения, в которых выясняются усло- условия, при которых полуторалинейная форма является эрмитовой. Теорема 5.25. Для того чтобы полуторалинейная форма В {к, у) являлась эрмитовой, необходимо и достаточно, чтобы опе- оператор А в представлении E.80) этой формы был самосопряженным (А = А*). Доказательство. Действительно, если А — самосопряженный оператор, то, используя свойства скалярного произведения, получим В(х, у) = (Ах, у) = (х, Ау) = (Ау, х) = В(у, х). Таким образом, выполнено соотношение E.79), т.е. форма В(х, у) = (Ах, у) является эрмитовой. Если же форма Б(х, у) = (Ах, у) эрмитова, то, опять обращаясь к свойствам скалярного произведения, получим равенства (Ах, у) = Я(х, у) = В(у, х) = (Ау, х) = (х, Ау).
136 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Таким образом, (Ах, у) = (х, Ау), т.е. оператор А является само- самосопряженным. Теорема доказана. Теорема 5.26. Для того чтобы полу тор алинейная фор- форма В(х, у) была эрмитовой, необходимо и достаточно, чтобы функция В {к, х) была вещественной. Доказательство. Форма В(х, у) будет эрмитовой в том и толь- только в том случае, когда линейный оператор А в представлении E.80) этой формы является самосопряженным (см. теорему 5.25). Согласно же теореме 5.18, для того чтобы оператор А был самосопряженным, необходимо и достаточно, чтобы для любого х скалярное произведе- произведение (Ах, х) было вещественным. Теорема доказана. Введем теперь понятие квадратичной формы. Пусть Б(х, у) — эрмитова форма. Квадратичной формой, соответствующей форме Б(х, у), назы- называется функция Б(х, х). Докажем следующую теорему о приведении квадратичной формы к сумме квадратов. Теорема 5.27. Пусть В(х, у) — эрмитова форма, определенная на всевозможных векторах х и у п-мерноео евклидова простран- пространства V. Тогда в этом пространстве существует такой орто- нормированный базис {е/,} и можно указать такие вещественные числа Xk, что для любого х, принадлежащего V, квадратичная форма В(~х, х) может быть представлена в виде следующей суммы квадратов координат ?& вектора х в базисе {} В(х, х)= ?Afc|a|2- E.81) Доказательство. Так как форма В(х, у) эрмитова, то, согласно теореме 5.25, существует самосопряженный оператор А такой, что В(х, у) = (Ах, у). E.82) Обратимся теперь к теореме 5.21. По этой теореме для операто- оператора А можно указать ортонормированный базис {е/.} из собственных векторов этого оператора. Если А& — собственные значения А, а ?& — координаты вектора х в базисе {е&}, так что п х = ? &efe, E.83) то, используя формулу E.12) и соотношение Ае/г = Xk^k *), получим следующее выражение для Ах: Ах= ?л,6еь E.84) /с=1 1) Это соотношение следует из того, что Xk и ед, — соответственно соб- собственные значения и собственные векторы оператора А.
§7] УНИТАРНЫЕ И НОРМАЛЬНЫЕ ОПЕРАТОРЫ 137 Из E.83), E.84) и ортонормированности базиса {ек} получим сле- следующее выражение для (Ах, х): к=\ Из этого выражения и из соотношения E.82) получим E.81). Тео- Теорема доказана. Докажем теперь важную теорему об одновременном приведении двух квадратичных форм к сумме квадратов. Теорема 5.28. Пусть Л(х, у) и Б(х, у) — эрмитовы формы, определенные на всевозможных векторах х и у п-мерного линейного пространства V. Допустим далее, что для всех ненулевых элемен- элементов х из V имеет место неравенство Б(х, х) > 0. Тогда в про- пространстве V можно указать базис {ек} такой, что квадратичные формы Л(х, х) и Б(х, х) могут быть представлены в следующем виде: Л(х,х) =?а,|6|2, E.85) /с=1 В(х,х) =Е|6|2, <5'86) /с=1 где \к — вещественные числа, а ^к — координаты вектора х в базисе {ек}. Доказательство. Так как свойства скалярного произведения и свойства эрмитовой формы Б(х, у) при дополнительном требовании о том, что В(х, х) > 0 при х ф 0, формулируются одинаково, мы мо- можем ввести в линейном пространстве V скалярное произведение (х, у) векторов, полагая (х, у) = В(х, у). E.87) Таким образом, V представляет собой евклидово пространство со скалярным произведением E.87). По теореме 5.27 можно указать в V такой ортонормированный базис {ек} и такие вещественные числа Хк, что в этом базисе квадра- квадратичная форма Л(х, х) будет представлена в виде E.85). С другой стороны, в любом ортонормированием базисе скалярное произведение (х, х), равное, согласно E.87), В(х, х), равно сумме квадратов модулей координат вектора х. Таким образом, представление В(х, х) в виде E.86) также обосновано. Теорема доказана. § 7. Унитарные и нормальные операторы В этом параграфе рассматриваются свойства важного класса опера- операторов, действующих в евклидовом пространстве V. Определение 1. Линейный оператор U из L(V, V) называется унитарным, если для любых элементов х и у из V справедливо соотношение (Ux, Uy) = (x, у). E.88)
138 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 В дальнейшем соотношение E.88) будем называть условием уни- унитарности оператора. Замечание 1. Из условия E.88) унитарности оператора следу- следует, что для любого унитарного оператора U справедливо равенство ||Ux|| = ||х||. Отметим следующее утверждение. Если А — собственное значение унитарного оператора U, то |А| = 1. Действительно, если Л — собственное значение U, то существует такой элемент е, что ||е|| = 1 и Ue = Ле. Отсюда и из замечания 1 следуют соотношения |Л| = ||Ле|| = ||Ue|| = ||е|| = 1. Утверждение до- доказано. Докажем следующую теорему. Теорема 5.29. Для того чтобы линейный оператор U, действу- действующий в евклидовом пространстве V, был унитарным, необходимо и достаточно, чтобы было выполнено соотношение U*=U-1. E.89) Доказательство. 1) Необходимость. Пусть оператор U унитарный, т.е. выполнено условие E.88). Обращаясь к определению сопряженного оператора U*, можно переписать это условие в следую- следующей форме 0 : (U*Ux, у) = (х, у), E.90) или, иначе, для любых х и у выполняется равенство ((U*U - 1)х, у) = 0. Фиксируя в этом равенстве любой элемент х и считая у произволь- произвольным, получим, что линейный оператор U*U — I действует по правилу (U*U - 1)х = 0. Следовательно, U*U = I. Совершенно аналогично можно убедить- убедиться, что UU* = I. Таким образом, U и U* — взаимно обратные операторы, т. е. соот- соотношение E.89) выполнено. Необходимость условия теоремы доказана. 2) Достаточность. Пусть выполнено условие E.89). Тогда, оче- очевидно, UU* = U*U = I. Обращаясь к определению сопряженного опе- оператора и используя только что написанные соотношения, получим при любых х и у равенства (Ux, Uy) = (x, U*Uy) = (x, Iy) = (x, у). Таким образом, условие E.88) унитарности оператора выполнено. Следовательно, оператор U унитарный. Теорема доказана. 1) Напомним, что оператор U* называется сопряженным к оператору U, если для любых z и у выполняется соотношение (z, Uy) = (U*z, у). Полагая z = Ux, получим E.90).
§7] УНИТАРНЫЕ И НОРМАЛЬНЫЕ ОПЕРАТОРЫ 139 Замечание 2. В процессе доказательства теоремы установлено, что условие E.88) унитарности оператора U и условие U*U = UU* = I E.91) эквивалентны. Таким образом, в основу определения унитарного опе- оператора можно положить условие E.91). Это условие также можно называть условием унитарности опера- оператора U. Введем понятие нормального оператора. Определение 2. Линейный оператор А называется нормальным, если справедливо соотношение А*А = АА*. E.92) Обращаясь к условию E.91) унитарности оператора и к усло- условию E.92), мы видим, что любой унитарный оператор является нормальным оператором. Нам понадобится следующее вспомогательное утверждение. Лемма. Пусть А — нормальный оператор. Тогда оператор А и оператор А* имеют общий собственный элемент е такой, что ||е|| = 1 и справедливы соотношения Ае = Ае и А*е = Ае. Доказательство. Пусть А — собственное значение операто- оператора А, и пусть R\ = ker (А — AI). Иными словами, R\ — множество всех элементов х таких, что Ах - Ах = 0. Убедимся теперь, что если х принадлежит R\, то и А*х принадле- принадлежит R\. Действительно, если Ах = Ах (т.е. х ? R\), то, поскольку А — нормальный оператор, А(А*х) = А* (Ах) = А* (Ах) = А(А*х). Иными словами, вектор А*х является собственным вектором опе- оператора А и отвечает собственному значению А, т.е. принадлежит Яд- Рассматривая далее оператор А* как оператор, действующий из R\ в R\, и используя вывод следствия из теоремы 5.8 о том, что каждый линейный оператор имеет собственное значение, мы можем утвер- утверждать, что в R\ существует элемент е такой, что ||е|| = 1 и справед- справедливы соотношения А*е = /хе и Ае = Ае. Используя эти соотношения и условие ||е|| = 1, найдем (Ае, е) = = (Ае, е) = А||е||2 = А, (е, А*е) = (е, /хе) = Д||е||2 = Д. Так как (Ае, е) = (е, А*е), то, очевидно, А = Д. Лемма доказана. Докажем теперь следующую теорему. Теорема 5.30. Пусть А — нормальный оператор. Тогда суще- существует ортонормированный базис {ек}, состоящий из собственных элементов операторов А и А*. Доказательство. Согласно только что доказанной лемме опера- операторы А и А* имеют принадлежащий V общий собственный элемент еь причем ||ei|| = 1. Собственные значения для операторов А и А*, соот- соответствующие еь равны соответственно Ai и Ai.
140 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Пусть V\ — ортогональное дополнение элемента ei до простран- пространства V. Иными словами, V\ — совокупность всех х, удовлетворяющих условию (х, ех) = 0. Докажем, что если х принадлежит V\, то Ах и А*х принадле- принадлежат V\. Действительно, если (х, е\) = 0, то (Ах, ех) = (х, А*ех) = (х, Aiei) = Ai(x, ех) = 0, т.е. Ах g V\. Аналогично, если (х, е^ =0, то (А*х, е{) = (х, Ае{) = (х, Aiei) = Ai(x, е{) = 0, т.е. А*х е V\. Таким образом, V\ — инвариантное подпространство операторов А и А*. Поэтому, по только что доказанной лемме, в подпространстве V\ существует общий собственный элемент е2 операторов А и А* такой, ЧТО Ав2 = А2в2, А*в2 = А2в2- Далее мы обозначим через V^ ортогональное дополнение элемен- элемента е2 до V\. Рассуждая так же, как и выше, мы докажем, что в У% есть общий собственный элемент ез операторов А и А* такой, что ||е3|| = 1. Продолжая аналогичные рассуждения, мы, очевидно, постро- построим в пространстве V ортонормированный базис {е^}, состоящий из собственных элементов операторов А и А*. Теорема доказана. Следствие 1. Пусть А — нормальный оператор. Существует базис {ек}, в котором А имеет диагональную матрицу. Действительно, по только что доказанной теореме существует ба- базис {е/г} из собственных векторов оператора А. Согласно теоре- теореме 5.9 в этом базисе матрица оператора А диагональна. Следствие 2. Унитарный оператор имеет полную ортонор- мированную систему собственных векторов. Следующая теорема является обратной для теоремы 5.30. Теорема 5.31. Если у действующего в п-мерном евклидовом пространстве V оператора А имеется п попарно ортогональных собственных элементов е\, е2,..., еп, то оператор А нормальный. Доказательство. Пусть {е/.} — попарно ортогональные соб- собственные векторы оператора А. Тогда Аек = Х^к и, согласно E.69), имеет место следующее представление оператора А 0 : п Ах= ^2 л^(х> ек)ек- к=\ Докажем, что сопряженный оператор А* действует по правилу А*у=?А*(У>е*)е*. E.93) к=\ 1) Представление E.69) справедливо для любого оператора, имеющего п попарно ортогональных собственных векторов.
§8] КАНОНИЧЕСКИЙ ВИД ЛИНЕЙНЫХ ОПЕРАТОРОВ 141. Достаточно доказать, что для операторов А и А*, определяемых соот- соотношениями E.69) и E.93), справедливо равенство (х, А*у) = (Ах, у). E.94) Подставляя в левую часть этого равенства выражение А*у по фор- формуле E.93), получим после несложных преобразований (х, А*у) = ?)(х, Хк(У> ек)ек) = Е ЛПУ' е/с)(х> ек) = к=\ к=\ J2 , ек)(ек, у) = (Ах, у). к=\ Таким образом, равенство E.94) доказано, т.е. оператор А*, дей- действующий по правилу E.93), является сопряженным к оператору А. Чтобы завершить доказательство теоремы, нужно убедиться в спра- справедливости равенства E.92): А*А = АА*. Согласно E.93) имеем Ч п АА*х = J2 Мх, ек)Аек = к=\ > ек)ек = А*Ах. к=\ к=\ Итак, для операторов А и А* справедливо равенство E.92) и, следова- следовательно, оператор А является нормальным. Теорема доказана. § 8. Канонический вид линейных операторов В этом параграфе рассматривается вопрос о выборе для заданного линейного оператора специального базиса, в котором матрица этого оператора имеет простейший вид, называемый жордановой формой матрицы. Введем понятие присоединенного элемента оператора А. Определение. Элемент х называется присоединенным элементом оператора А, отвечающим собственному значению Л, если для некото- некоторого целого т ^ 1 выполняются соотношения (А - AI)mx /О, (А - AI)m+1x = 0. При этом число т называется порядком присоединяемого элемен- элемента х. Иными словами, если х — присоединенный элемент порядка га, то элемент (А — AI)mx является собственным вектором опера- оператора А. В этом параграфе мы докажем следующую основную теорему. О Мы воспользовались также соотношениями Аед, =
142 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [гл.5 Теорема 5.32. Пусть А — линейный оператор, действующий в п-мерном евклидовом пространстве V. Существует базис {е™}, k= 1,2,..., I; m = 1, 2, ..., пк; щ + п2 + ... + щ = п, E.95) образованный из собственных и присоединенных векторов операто- оператора А, в котором действие оператора А описывается следующими соотношениями: AeJ. = Хке[, /с = 1, 2,..., /; т = 2, 3,..., пк. E.96) Прежде чем перейти к доказательству, сделаем ряд замечаний. Замечание 1. Очевидно, векторы е\ базиса E.95) являются собственными векторами оператора А, отвечающими собственным зна- значениям Хк. Из определения присоединенных векторов и соотношений E.96) следует, что векторы е™ (к = 1, 2,...,/; т = 2, 3,..., пк) являются присоединенными векторами порядка т, отвечающими собственным значениям Хк соответственно. Замечание 2. Обращаясь к формулам E.13) и E.12), мы видим, что соотношения E.96) действительно определяют действие операто- оператора А в пространстве V при заданном базисе {е™}. Замечание 3. Матрица А линейного оператора А в базисе {е^1} имеет следующий «клеточный» вид: А = °\ \0 E.97) где клетка Л& представляет собой следующую матрицу: (Хк 0 0 V 0 1 хк 0 0 0 ... 1 ... 0 ... 0 ... 0 0 1 хк E.98) Замечание 4. Форма E.97) матрицы А линейного оператора А называется жордановой формой матрицы этого оператора. При этом клетка Л& обычно называется жордановой клеткой матрицы А. Отме- Отметим, что теорему 5.32 о приведении матрицы оператора к простейшему виду E.97) называют теоремой о приведении матрицы оператора к жор- жордановой форме. Замечание 5. Жорданова форма матрицы E.97) определена с точностью до порядка расположения клеток Ак по диагонали матри- матрицы. Этот порядок зависит от порядка нумерации собственных значе- значений Хк.
§8] КАНОНИЧЕСКИЙ ВИД ЛИНЕЙНЫХ ОПЕРАТОРОВ 143 Мы дадим доказательство теоремы 5.32, предложенное А.Ф. Фи- Филипповым 0 . Доказательство теоремы 5.32. Для доказательства теоремы применим метод индукции. При п = 1 утверждение теоремы очевидно. Пусть п > 1 и теорема верна для пространств размерности меньше п. Докажем, что при этом предложении она верна и для пространств размерности п. Этим и будет завершено доказательство теоремы. Пусть Л — собственное значение оператора А. Согласно теоре- теореме 5.8 это число является корнем характеристического уравнения det (А — AI) = 0. Следовательно, ранг г линейного оператора 2) В = А - AI E.99) меньше п, т.е. г < п. Линейный оператор В отображает пространство V на подпростран- подпространство imB. Поэтому оператор В отображает подпространство imB размерности г < п в это же подпространство. По предположению индукции в imB есть базис E.100) в котором действие оператора В из imB в imB дается следующими соотношениями: к= 1,2,..., р, E Ш1) к = 1, 2,..., р; т = 2, 3,..., гк. Таким образом, в этом базисе матрица В оператора В, действую- действующего из imB в imB 3), имеет следующий клеточный вид: В = /Mi 0 \ \0 где Мк = 1к 0 0 Q 1 Ilk 0 0 0 .. 1 .. 0 .. 0 .. . 0 . 1 E.102) Пусть лишь первые m\(m\ ^ 0) собственных значений оператора В равны нулю. Так как ранг каждой клетки Мк (см. E.102)), для которой /j,k = = 0, равен гк — 1, а ранг клетки, для которой /j,k ф 0, равен гк, то, ~ р согласно E.100), ранг матрицы В равен ^ гк - т\ = г — т\. Поэтому к=\ х) Филиппов А. Ф. Краткое доказательство теоремы о приведении матрицы к жордановой форме // Вестник Московского университета. 1971. №2. 2) Напомним, что ранг г линейного оператора В равен размерности imB; согласно теореме 5.6 ранг г равен рангу матрицы этого оператора. 3) Символом В мы будем обозначать оператор В, действующий из imB в imB.
144 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 размерность подпространства кегВ равна т\ 0 и кегВ представля- представляет собой линейную оболочку векторов h}, hd,,..., hj^. Эти векторы в силу^линейной независимости образуют базис в kerJB. Очевид- Очевидно, кегВ с кегВ. Дополним базис h}, Ц,..., hlmi в кегВ до базиса в кегВ векторами gk, к = 1, 2,..., то, то = п — г — т\ (размерность ker В по теореме 5.1 равна п — dim im В, т. е. равна п — г). Так как е*. ? ker В, то Bgfc = O. E.103) Обратимся теперь к векторам hrkk, /с = 1, 2,..., т\. Поскольку эти векторы принадлежат imB, то существуют такие векторы ik е V, что Bik = Kk, к = 1, 2,..., mi. E.104) Докажем теперь, что векторы h^ (к= 1, 2,...,р; ш= 1, 2,..., г*), g* (fc=l,2,...,m0), ffc (fc=l,2,...,mi) ( линейно независимы. Рассмотрим следующую равную нулю линейную комбинацию f этих векторов: Р Гк то т\ ife=l m=l к=\ к=\ Рассмотрим действие оператора В на этот элемент f. Получим, согласно E.101), E.103) и E.104), следующее выражение: Р Р гк т\ Bf = Е ^i^hi + Е Е «*m(wh? + ь--1) + е 7*4* = о. к=\ к=\т=2 к=\ E.107) Соотношение E.107) представляет собой равную нулю линейную комбинацию базисных векторов {h^}, поэтому коэффициенты при этих векторах в указанной линейной комбинации равны нулю. По- Поскольку цк = 0 при fe^mi, то из E.107) следует, что коэффициенты при Ъ.гкк в точности равны 7ь и поэтому jk = 0. Отсюда и из соотно- соотношения E.106) получаем равенства т0 р гк = - Е Е актК, E.Ю8) Е к=\ к=\ т=\ из которых следует, что вектор g, представляющий собой линейную комбинацию векторов {gk}, принадлежит ker В (напомним, что векто- векторы {gk} составляют часть базиса в ker В). С другой стороны, из E.108) вытекает, что g представляет собой линейную комбинацию векторов h^1, т.е. принадлежит imB. Следова- 0 Ранг ^матрицы В равен dim imB. ^Согласно теореме 5.1 dim imB + + dim ker В = г. Следовательно, dim ker В = т\.
§9] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 145 тельно, g принадлежит кегВ (напомним, что кегВ есть пересечение ~ mi imB и кегВ), и поэтому g = ^ ^hl- к=\ Так как линейные оболочки наборов векторов {gk} и {h^} имеют общим лишь нулевой элемент (эти наборы вместе образуют базис в кегВ) и, как мы установили, g принадлежит каждой из упомянутых линейных оболочек, то g = 0. Но тогда из E.108) следует, что /3& = 0 (к = 1, 2,..., то) и akrn = 0 (к = 1, 2,..., р; т = 1, 2,..., г&). Итак, все коэффициенты в линейной комбинации E.106) векторов E.105) равны нулю, т.е. векторы E.105) линейно независимы. Общее число векторов E.105) равно г + то + т\. Так как то = п — — г — т\ (это было установлено выше, в доказательстве при введении векторов gfc), то общее число векторов E.105) равно п и поэтому они образуют базис в V. Обозначим h = Kk+x E-109) и запишем векторы этого базиса в следующей последовательности серий: {gi}; {g2>; •••; {gm0}; ..,h^,h^+1}, fc=l,2>...,mi; E.110) Рассмотрим действие оператора В на векторы базиса E.110) в про- пространстве V. Обращаясь к соотношениям E.101), E.103), E.104) и E.109), убедимся, что действие В в базисе E.110) дается соотноше- соотношениями Bgfc=0, к= 1, 2,..., mo, Bh^fe+1=h^, k=l,2,...,ml и соотношениями E.101). Итак, в базисе E.110) оператор В = А — AI действует по прави- правилу E.96), указанному в формулировке теоремы 5.32. Но тогда в этом базисе и оператор А = В + AI действует по этому же правилу. Теорема доказана. § 9. Линейные операторы в вещественном евклидовом пространстве В этом параграфе мы покажем, каким образом определения и ре- результаты предыдущих параграфов переносятся на случай веществен- вещественных евклидовых пространств. 1. Общие замечания. Рассмотрим произвольное n-мерное веще- вещественное евклидово пространство V и оператор А, действующий из V в V. Понятие линейного оператора для случая вещественного линейного пространства формулируется в полной аналогии с соответствующим понятием для комплексного пространства.
146 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Определение 1. Оператор А называется линейным, если для лю- любых элементов xG^ u yG^ и любых вещественных чисел а и /3 выполняется равенство А(ах + /3у) = аАх + /ЗАу. E.111) В полной аналогии с комплексным пространством вводится понятие собственного значения и собственного вектора оператора. Важно заметить, что собственные значения являются корнями ха- характеристического уравнения оператора. Обратное утверждение в вещественном случае верно лишь тогда, когда соответствующий корень характеристического уравнения веще- вещественный. Только в этом случае указанный корень будет собственным значением рассматриваемого линейного оператора. В связи с этим естественно выделить какой-либо класс линейных операторов в вещественном евклидовом пространстве, все корни харак- характеристических уравнений которых вещественны. В доказанной выше теореме 5.16 было установлено, что все соб- собственные значения самосопряженного оператора вещественны. Кро- Кроме того, понятие самосопряженного оператора играло важную роль в выводах §6 настоящей главы о квадратичных формах. Естественно поэтому перенести понятие самосопряженного оператора на случай вещественного пространства. Предварительно введем понятие оператора А*, сопряженного к опе- оператору А. Именно оператор А* называется сопряженным к А, если для любых х и у из V выполняется равенство (Ах, у) = (х, А*у). Без затруднений на случай вещественного пространства перено- переносится теорема 5.12 о существовании и единственности сопряженного оператора. Напомним, что доказательство теоремы 5.12 опирается на понятие полуторалинейной формы. В вещественном случае вместо полуторали- нейной формы следует воспользоваться билинейной формой Б(х, у). По этому поводу в п. 2 §4 гл. 5 сделано соответствующее замечание. Напомним в связи с этим определение билинейной формы в лю- любом вещественном, не обязательно евклидовом, линейном простран- пространстве L. Пусть В — функция, сопоставляющая каждой упорядоченной паре (х, у) векторов х ? L и у ? L вещественное число В(х, у). Определение 2. Функция В(х, у) называется билинейной формой, заданной на L, если для любых векторов х, у и z из L и любого вещественного числа Л выполняются соотношения: ?(x + z, y) = Я(х, y) + ?(z, у), Я(х, у + z) = S(x, у) + Б(х, z), E.112) Я(Ах,у) = Я(х, Лу) = ЛБ(х, у). Важную роль в данном параграфе будет играть специальное пред- представление билинейной формы В(х, у) в виде В(х, у) = (Ах, у), E.113)
§9] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 147 где А — некоторый линейный оператор. Соответствующая теорема (теорема 5.11) об аналогичном представлении полуторалинейной фор- формы в комплексном пространстве опиралась на выводы леммы п. 1 §4 настоящей главы о специальном представлении линейной формы /(х). В конце указанного пункта отмечалось, что эта лемма верна и в ве- вещественном пространстве. Заметим только, что в доказательстве лем- леммы выбор элементов hk нужно производить не по формуле E.41), а с помощью формулы hk = /(е/.), где /(х) — данная линейная форма в вещественном пространстве. В §6 настоящей главы были введены эрмитовы формы. Эрмитова форма — это полуторалинейная форма В(х, у) в комплексном про- пространстве, характеризующаяся соотношением Б(х, у) = В(у, х) (черта над В означает, что берется комплексно-сопряженное значение для В). В случае вещественного пространства аналогом эрмитовых форм служат симметричные билинейные формы. Такая форма характектери- зуется соотношением В(х, у) = В(у, х). E.114) Билинейная форма В {к, у), заданная на линейном пространстве L, называется ко со симметричной, если для любых векторов х и у из L выполняется соотношение Б(х, у) = —В(у, х). Очевидно, что для каждой билинейной формы функции В2(х, у) = I [S(x, у) - В(у, х)] являются соответственно симметричной и кососимметричной билиней- билинейными формами. Поскольку Б(х, у) = #i(x, у) + В2(х, у), то мы полу- получаем следующее утверждение. Любую билинейную форму можно представить в виде суммы симметричной и кососимметричной билинейной формы. Нетрудно видеть, что такое представление является единственным. Мы докажем следующую теорему о симметричных билинейных формах (эта теорема служит аналогом теоремы 5.25 об эрмитовых формах). Теорема 5.33. Для того чтобы билинейная форма В(х, у), за- заданная на всевозможных векторах х и у вещественного евклидова пространства V, была симметричной, необходимо и достаточ- достаточно, чтобы линейный оператор А, фигурирующий в представле- представлении E.113), был самосопряженным. Доказательство. Если А — самосопряженный оператор, то, используя свойства скалярного произведения, получим В(х, у) = (Ах, у) = (х, Ау) = (Ау, х) = В(у, х). Таким образом, выполняется соотношение E.114), т.е. билинейная форма В(х, у) = (Ах, у) симметричная.
148 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 Если же форма В(х, у) = (Ах, у) симметричная, то справедливы соотношения (Ах, у) = Б(х, у) = В (у, х) = (Ау, х). Следовательно, оператор А самосопряженный. Теорема доказана. Введем понятие матрицы линейного оператора А. Пусть ei, ei,... ..., en — какой-либо базис в n-мерном вещественном линейном прост- п ранстве L. Положим Ае& = J^ a\ei- i=\ Тогда, как и в комплексном случае, нетрудно показать, что если п х = ^2 xkek, то Для компонент вектора у = Ах справедливо представ- к=\ п ление уг = ^2 а\хк. к=\ Матрица Л = (агк) называется матрицей линейного оператора А в базисе {е/.}. Аналогично тому, как это было сделано в § 2 настоящей главы, можно доказать, что величина det А не зависит от выбора базиса и, тем самым, корректно вводится определитель det А оператора А. Характеристическим уравнением, отвечающим оператору А, на- называется уравнение det (А - AI) = 0, а многочлен, стоящий в левой части этого уравнения, называется характеристическим многочленом оператора А. Докажем теперь теорему о корнях характеристического многочлена самосопряженного оператора в вещественном евклидовом простран- пространстве. Теорема 5.34. Все корни характеристического многочлена само- самосопряженного линейного оператора А в евклидовом пространстве вещественны. Доказательство. Пусть А = а + г/3 — корень характеристиче- характеристического уравнения det (A- AI) =0 E.115) самосопряженного оператора А. Фиксируем в V какой-либо базис {е/,} и обозначим через а^ элементы матрицы оператора А в этом базисе (отметим, что а^ — вещественные числа). Будем искать ненулевое решение следующей системы линейных однородных уравнений относительно ?ь &> ••• > in- f>^a = AO, j = l,2,...,n, E.116) k=\ где А = a + г/3. Так как определитель системы E.116) равен det (А — AI) (напом- (напомним, что определитель матрицы линейного преобразования не зависит от выбора базиса и, согласно E.115), этот определитель равен нулю), то система E.116) однородных линейных уравнений имеет ненулевое решение ?& = #& + iyk, k = 1, 2,..., п.
§9] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 149 Подставляя это решение в правую и левую части системы E.116), учитывая при этом, что А = а + г/3, и отделяя затем веществен- вещественную и мнимую части полученных соотношений, найдем, что наборы (х\, Х2, • ••, хп) и (г/i, г/2, •••, 2/п) вещественных чисел 0 удовлетворя- удовлетворяют следующей системе уравнений: E.117) = 1 2... n. Рассмотрим в данном базисе ei, e2,..., еп векторы х и у с коорди- координатами х\, Х2, •••, хп и г/i, г/2, •••, i/n соответственно. Тогда соотноше- соотношения E.117) можно переписать в виде Ах = ах - /Зу, Ау = ау + /Зх. Умножим первое из полученных соотношений скалярно на у, а вто- второе — на х. Очевидно, получим равенства (Ах, у) = а(х, у)-/?(у, у), (х, Ау) = а(х, у) + /3(х, х). EЛ18) Так как оператор А самосопряженный, то (Ах, у) = (х, Ау). По- Поэтому путем вычитания соотношений E.118) получим равенство /3[(х, х) + (у, у)]=0. Но (х, х) + (у, у) ф О (если (х, х) + (у, у) = 0, то хк = О и ук = О, к = 1, 2,..., п; следовательно, решение ?& = хк + гу/г было бы нуле- нулевым, тогда как по построению это решение ненулевое). Поэтому /3 = 0, а так как /3 — мнимая часть корня Л = а + г/3 характеристического уравнения E.115), то, очевидно, Л — вещественное число. Теорема доказана. Как и в комплексном случае, для самосопряженного оператора справедливо утверждение о существовании ортонормированного ба- базиса, состоящего из собственных векторов этого оператора (аналог теоремы 5.21). Докажем это утверждение. Теорема 5.35. У каждого самосопряженного линейного опера- оператора А, действующего в п-мерном вещественном евклидовом про- пространстве V, существует ортонормированный базис из собствен- собственных векторов. Доказательство. Пусть Ai — вещественное собственное значе- значение оператора A, a ei — единичный собственный вектор, отвечающий этому собственному значению (||ei|| = 1). Обозначим через V\ (n — 1)-мерное подпространство простран- пространства V, ортогональное к ei. Очевидно, V\ — инвариантное под- подпространство пространства V (т.е. если х е V\, то Ах е V\). Дей- *) Напомним, что не все эти числа равны нулю.
150 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 ствительно, пусть xG Vj; тогда (х, ei) =0. Поскольку оператор А самосопряженный и Ai — собственное значение А, получим (Ах, е^ = = (х, Aej) = Ai(x, ei) = 0. Следовательно, Ах е V\, и поэтому V\ — инвариантное подпро- подпространство оператора А. Поэтому мы можем рассматривать оператор А в подпространстве V\. Ясно, что в V\ оператор А будет самосопря- самосопряженным. По теореме 5.34 у оператора А, действующего в V\, имеется вещественное собственное значение А2, которому отвечает собствен- собственный вектор е2 G V\ оператора А, удовлетворяющий условию \\^\\ = 1- Обращаясь далее к (п - 2)-мерному подпространству V2, ортого- ортогональному векторам ei и е2, и повторяя только что описанные рассужде- рассуждения, мы построим собственный вектор ез оператора А, ортогональный векторам ei и е2 и удовлетворяющий условию ||ез|| = 1. Рассуждая и дальше таким же образом, мы в результате найдем п взаимно ортогональных собственных векторов еь е2,..., еп операто- оператора А, удовлетворяющих условию ||е^|| = 1, к = 1, 2,..., п. Очевидно, векторы {е/г} образуют базис в V. Теорема доказана. Замечание. Пусть еь е2,..., еп — ортонормированный базис в n-мерном евклидовом пространстве V, состоящий из собственных векторов самосопряженного оператора А, т.е. Ае& = А^е/,. Тогда мат- матрица оператора А в базисе {е/.} является диагональной, причем диаго- диагональные элементы имеют вид а% = А&. Отметим, что если {е/,} — произвольный ортонормированный базис в вещественном евклидовом пространстве V, то матрица самосопря- самосопряженного оператора А будет симметричной, т. е. А7 = А. Верно и об- обратное утверждение, т. е. если в некотором ортонормированном базисе {е/,} матрица оператора является симметричной, то оператор А — самосопряженный. Этим вещественный случай отличается от комплексного, поскольку в комплексном случае оператор А является самосопряженным тогда и только тогда, когда матрица А этого оператора в ортонормированном базисе является эрмитовой, т. е. элементы а\ матрицы А удовлетворя- удовлетворяют условию а\ = а\ (черта означает комплексное сопряжение). Указанное утверждение непосредственно следует из того, что если (агк) — матрица оператора А, то матрица сопряженного оператора в вещественном случае равна (af), а в комплексном случае — (af), что легко проверяется прямым вычислением. 2. Ортогональные операторы. В комплексном евклидовом про- пространстве важную роль играют унитарные операторы, введенные в § 7. Аналогом унитарных операторов в вещественном евклидовом простран- пространстве являются ортогональные операторы. Определение 1. Линейный оператор Р, действующий в веществен- вещественном евклидовом пространстве V, называется ортогональным, если для любых х и у из V выполняется равенство (Рх, Ру) = (х, у). E.119)
§9] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 151. Таким образом, ортогональный оператор сохраняет скалярное про- произведение. Отсюда непосредственно следует, что если ei, е2,..., еп — ортонормированный базис евклидова пространства V, то Pei, Ре2,... ...,Реп также является ортонормированным базисом. В дальней- дальнейшем условие E.119) будем называть условием ортогональности опера- оператора Р. Справедливо следующее утверждение. Теорема 5.36. Для того чтобы линейный оператор Р был орто- ортогональным, необходимо и достаточно, чтобы существовал опера- оператор Р и было выполнено равенство Р* = Р~\ E.120) где Р* — оператор, сопряженный к Р, а Р — оператор, обрат- обратный к Р. Доказательство. 1) Необходимость. Пусть Р — ортого- ортогональный оператор, т.е. выполняется условие E.119). Применяя сопря- сопряженный оператор Р*, это условие можно записать в виде (Р*Рх, у) = = (х, У). Таким образом, для любых х и у выполняется равенство ((Р*Р - 1)х, у) = 0. Фиксируя в этом равенстве любой элемент х, считая у произволь- произвольным, получим, что линейный оператор Р*Р — I действует по прави- правилу (Р*Р - 1)х = 0. Следовательно, Р*Р = I; совершенно аналогично можно убедиться, что РР* = I. Таким образом, операторы Р* и Р взаимно обратны, т.е. условие E.120) выполнено. 2) Достаточность. Пусть выполнено условие E.120). Тогда, очевидно, РР* = Р*Р = I. Обращаясь к определению сопряженного оператора и используя только что написанные соотношения, получим для любых х и у равен- равенства (Рх, Ру) = (х, Р*Ру) = (х, 1у) = (х, у). Мы видим, что условие E.119) выполнено, следовательно, опера- оператор Р ортогональный. Теорема доказана. Введем теперь понятие ортогональной матрицы Р. Определение 2. Матрица Р называется ортогональной, если Р'Р = рр' = I, E.121) где Р' — транспонированная матрица, а / — единичная матрица. Если еь е2,..., еп — ортонормированный базис в евклидовом про- пространстве V, то оператор Р является ортогональным тогда и только тогда, когда его матрица в базисе {е/,} ортогональна. Непосредственно из равенства E.121) следует, что если матри- матрица Р = (р^) является ортогональной, то ki _ П ПРИ k = l, Vp'-Л г г \0 при кф1.
152 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ ГЛ. 5 В комплексном евклидовом пространстве аналогом ортогональной матрицы является унитарная матрица. Именно, матрица U называется унитарной, если выполняется соотношение U*U = UU* = I, E.122) в котором U* — эрмитово сопряженная матрица, т.е. U* = Uf, где штрих означает транспонирование, а черта — комплексное сопряжение. Нетрудно показать, что в ортонормированном базисе матрица ли- линейного оператора U является унитарной тогда и только тогда, когда оператор U является унитарным. В заключение рассмотрим для примера ортогональные преобразова- преобразования в одномерном и двумерном пространствах. В одномерном случае каждый вектор х имеет вид х = ае, где а — вещественное число и е — вектор, порождающий данное пространство. Тогда Ре = Ае, и так как (Ре, Ре) = А2(е, е) = (е, е), то А = =Ы. Таким образом, в одномерном случае существуют два ортогональ- ортогональных преобразования: Phx = х и Р_х = —х. В двумерном случае каждое ортогональное преобразование определяется в произвольном ортонормированном базисе ортого- ортогональной матрицей порядка 2, т.е. матрицей Р = (а ,J . Из усло- условия РР' = Р'Р = I следует Полагая а = cos ip, b = — sin ip, получаем, что каждая ортогональная матрица порядка 2 имеет вид p,=(COS(P ~ sin Ч> \ причем во второй строке в обоих случаях следует брать либо знак +, либо знак —. Отметим, что det P± = ±1. Ортогональная матрица Р+ называется собственной, а ортогональная матрица Р_ — несобственной. Оператор F^_ с матрицей Р+ в ортонормированном базисе еь е2 осуществляет поворот в плоскости еь е2 на угол (р. Для того чтобы выяснить, как действует оператор Р_ с матрицей Р_, введем матрицу Q = (~ А , совпадающую с Р_ при (р = 0, и за- заметим, что Р_ = QP+. Матрице Q отвечает отражение плоскости от- относительно оси еь следовательно, действие оператора Р_ заключается в повороте на угол (р и последующем отражении. Заметим, что векторы Р_еь Р+е2 образуют, в силу ортогонально- ортогональности Р+, ортонормированный базис и в этом базисе матрица операто- оператора Р_ совпадает с Q, т.е. является диагональной. В общем случае, когда ортогональный оператор Р действует в n-мерном евклидовом пространстве, существует ортонормированный
§9] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 153 базис ei, е2,..., еп, в котором матрица оператора Р имеет вид /1 \ О \ -1 COS (f\ sin if\ — sin (pi — COS (f\ COS (fk — Sin (fk В этой матрице все элементы, кроме выписанных, равны нулю. Таким образом, в некотором ортонормированном базисе действие ортогонального оператора сводится к последовательным поворотам и отражениям относительно координатных осей.
Глава 6 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ И ЗАДАЧ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ В настоящей главе изучаются различные методы решения системы линейных уравнений с вещественными коэффициентами относительно неизвестных, также принимающих вещественные значения. Все используемые на практике методы решения систем линейных уравнений можно разделить на две большие группы: точные методы и итерационные методы. Под точным методом решения понимается метод, теоретически позволяющий получить точные значения неизвестных в результате проведения конечного числа арифметических операций. Примером точ- точного метода может служить изложенный в гл. 3 метод, основанный на применении формул Крамера 0 . Итерационные методы позволяют получить искомое решение лишь в виде предела последовательности векторов, построение которых про- производится с помощью единообразного процесса, называемого процес- процессом итераций (последовательных приближений). Итерационные методы весьма удобны для использования современной вычислительной тех- техники. Изложению наиболее употребительных итерационных методов решения линейных систем посвящен § 1 настоящей главы. Итерационные методы находят широкое применение и при реше- решении другой важной вычислительной задачи линейной алгебры — так называемой полной проблемы собственных значений (так называют проблему отыскания всех собственных значений и отвечающих им собственных векторов заданной матрицы 2)). В итерационных методах собственные значения вычисляются как пределы некоторых числовых последовательностей без предварительного определения коэффициен- коэффициентов характеристического многочлена. х) Практически метод, основанный на формулах Крамера, обычно не при- применяется, ибо он требует проведения очень большого числа арифметических операций и записей. Более удобным является точный метод, основанный на последовательном исключении неизвестных и называемый методом Гаусса (его изложение можно найти, например, в книге Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. — М.: Физматгиз, 1963, гл. 2). 2) В отличие от этой проблемы, задачу отыскания некоторых (например, наибольших по модулю) собственных значений заданной матрицы называют частичной проблемой собственных значений.
МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 155 В § 2 настоящей главы разбирается один из самых важных (наибо- (наиболее употребительных на ЭВМ) итерационных методов решений полной проблемы собственных значений — так называемый метод вращений (или метод Якоби). Этот метод применим ко всякой симметричной (или к эрмитовой) матрице, легко реализуется на ЭВМ и всегда схо- сходится. Он устойчив по отношению к ошибкам округления результатов промежуточных вычислений и обладает тем замечательным свойством, что наличие кратных и близких друг к другу собственных значений не только не замедляет его сходимости, а напротив, ускоряет ее. Метод вращений, предложенный Якоби и известный еще с середины прошлого века, долгое время не находил практического применения из-за боль- большого объема вычислений, необходимых для его реализации. И лишь появление быстродействующих электронных вычислительных машин сделало его самым эффективным методом решения полной проблемы собственных значений симметричных и эрмитовых матриц. § 1. Итерационные методы решения линейных систем I. Метод простой итерации (метод Якоби). Рассмотрим квадрат- квадратную систему линейных уравнений с вещественными коэффициента- коэффициентами C.10) (см. п. 1 §2 гл.З), которую запишем в матричном виде АХ = F, понимая под А основную матрицу системы А = аи а под X и F векторы-столбцы вида X = Х\ х2 Хп , F = /i h fn F.1) F.2) первый из которых подлежит определению, а второй задан. Предлагая однозначную разрешимость системы F.1), заменим мат- матричное уравнение F.1) эквивалентным ему матричным уравнени- уравнением X = X — тАХ + tF, в котором через г обозначено вещественное число, обычно называемое стационарным параметром. С помощью этого последнего уравнения составим итерационную последовательность векторов {Хк}, определив ее рекуррентным соот- соотношением Xk+l=Xk-TAXk+TF (к = 0,1,...) F.3) при произвольном выборе «нулевого» приближения Xq. Метод простой итерации заключается в замене точного решения X системы F.1) к-и итерацией Хк с достаточно большим номером к. Оценим погрешность Zk = Хь — X метода простой итерации.
156 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ ГЛ. 6 Из соотношений F.3) и F.1) сразу же вытекает следующее матрич- матричное уравнение для погрешности Z^\ Zk+i = (E-rA)Zk, F.4) где Е — единичная матрица порядка п. Введем в рассмотрение норму вектора в пространстве Еп и опера- операторную норму квадратной матрицы порядка п. Как обычно, назовем нормой вектора X число ||Х||, равное корню квадратному из суммы квадратов координат этого вектора. Назовем операторной нормой про- произвольной матрицы А число \\A\\, равное либо точной верхней грани отношения ||ЛХ||/||Х|| на множестве всех ненулевых векторов X, либо (что то же самое) точной верхней грани норм ||ЛХ|| на множестве всех векторов X, имеющих норму, равную единице. Итак, по определению <65> Напомним, что для любой симметричной матрицы А 0 оператор- операторная норма этой матрицы равна наибольшему по модулю собственному значению этой матрицы (см. п. 4 § 5 гл. 5), т. е. = max |AS|. F.6) Из F.5) вытекает следующее неравенство, справедливое для любой матрицы А и любого вектора X: \\АХ\\^\\А\\\\Х\\. F.7) Из матричного уравнения для погрешности F.4) и из неравенства F.7) мы получим, что для любого номера к ||Zfc+1||<||??-T^||||Zfc||. F.8) Докажем теперь следующую простую, но важную теорему. Теорема 6.1. Для того чтобы итерационная последователь- последовательность F.3) при любом выборе нулевого приближения Xq и при данном значении параметра г сходилась к точному решению X системы F.1), достаточно, чтобы было выполнено условие р= \\E-tA\\ < 1. F.9) При этом последовательность F.3) сходится со скоростью геомет- геометрической прогрессии со знаменателем р. В случае, если матрица А является симметричной, условие яв- является и необходимым условием сходимости итерационной после- последовательности F.3) при любом выборе нулевого приближения. Доказательство. Для установления достаточности усло- условия F.9) заметим, что из неравенства F.8) вытекает следующее соотношение: , \\Zk\\^\\E-rA\\k\\Z0\\. F.10) Матрица А называется симметричной, если А = А'.
§ 1 ] МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 157 Из F.10) очевидно, что условие F.9) обеспечивает сходимость последовательности погрешностей Z& к нулю со скоростью геометри- геометрической прогрессии со знаменателем р. В случае, если матрица А является симметричной, будет симмет- симметричной и матрица Е — тА, а поэтому в силу F.6) условие F.9) можно переписать в эквивалентном виде р = тах |1 -т\8\ < 1 F.11) (здесь через {Xs} обозначены собственные значения матрицы А). Убедимся в том, что условие F.11) является необходимым усло- условием сходимости к нулю последовательности {Zk} при любом выборе нулевого приближения Х$. Предположим, что условие F.11) не вы- выполнено. Тогда существует собственное значение Xs, удовлетворяющее неравенству |1 — rXs\ ^ 1. Обозначим через Х^ отвечающий этому собственному значению собственный вектор матрицы А и выберем нулевое приближение Xq так, чтобы Zq совпало с X^s\ Тогда, после- последовательно записывая соотношение F.4) для номеров 1, 2,..., к, мы получим, что Zk = A — rXs)kZq. Из последнего соотношения в силу неравенства |1 — rXs\ ^ 1 вытекает, что \\Zk\\ не стремится к нулю при к —> оо. Теорема 6.1 доказана. Сразу же заметим, что для практических целей недостаточно уста- установить только факт сходимости последовательности итераций. Цен- Центральной задачей численных методов является оценка скорости схо- сходимости. Очень важно знать, как наилучшим способом распорядиться стационарным параметром г для того, чтобы получить наиболее быст- быструю сходимость. Остановимся на этом вопросе подробнее. Пусть задана ^-точность, с которой нам требуется получить точное решение системы F.1). Требуется найти итерацию Хк с таким номе- номером к, для которого \\Zk\\^s\\Z0\\. F.12) Из F.9) и F.10) вытекает, что \\Zk\\ < рк \\Z0\\ и, стало быть, F.12) выполняется при рк < е, т.е. при к > 1пA/е)/1пA/р). Отсюда видно, что для уменьшения числа итераций к, достаточных для достижения требуемой ^-точности, следует выбрать параметр г так, чтобы получить минимум функции р = р(т) = \\Е — тА\\. Считая матрицу А симметричной и положительно определенной, мы приходим к следующей задаче оптимизации: найти минимум функции min р(т) = min \\Е — тА\\ = minimax II — tAJ}. Т Т Т S Решение этой и несколько более общей задачи, предложенное А. А. Самарским, излагается в следующем пункте. Там будет доказано, что указанный минимум функции р = р(т) достигается для значе- значения т = 2/G1 + 72)» гДе 71 и 72 — соответственно минимальное и мак- максимальное собственные значения матрицы Л, причем минимальное
158 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ ГЛ. 6 значение функции р(т) равно 1 -71/72 = 72 -71 1 +7i/72 72 + 71 ' 2. Общий неявный метод простой итерации. Снова обратимся к решению линейной системы F.1), но на этот раз заменим итераци- итерационную последовательность F.3) более общей итерационной последова- последовательностью, определяемой соотношением Bxk+l-xk + АХк = F F 13) в котором В представляет собой некоторую «легко обратимую» квад- квадратную матрицу п-го порядка, а г — стационарный параметр. Та- Такой метод составления итерационной последовательности и называется неявным методом простой итерации. Рассмотренный в предыдущем пункте явный метод простой итерации получается из неявного метода в частном случае В = Е, где Е — единичная матрица порядка п. Для того чтобы сформулировать в удобной для приложений форме условие сходимости общего неявного метода простой итерации, напом- напомним некоторые понятия, введенные в предыдущей главе. Напомним, что матрица А называется положительно определен- определенной, если (АХ, X) > О для любого ненулевого вектора X. В гл. 5 было доказано, что необходимым и достаточным условием положительной определенности симметричной матрицы А (или, что то же самое, самосопряженного линейного оператора А) является положительность всех собственных значений этой матрицы (этого оператора). Если матрица А является положительно определенной, то мы договоримся писать неравенство А > 0. Далее договоримся писать неравенство В > А (или А < В) в случае, если В - А > О (т. е. если матрица В - А является положительно определенной). Докажем следующую замечательную теорему 0 . Теорема 6.2 (теорема А. А. Самарского). Пусть матрица А явля- является симметричной и выполнены условия А > О, В > О (симметрич- (симметричность матрицы В, вообще говоря, не предполагается). Тогда для того чтобы итерационная последовательность, опре- определяемая соотношением вхк+х-хк + Лх^ = F F 13) г при любом выборе нулевого приближения Xq сходилась к точному решению X системы АХ = F, достаточно, чтобы были выполнены условия 2В>тА, тА>0. F.14) При дополнительном предположении о том, что матрица В является симметричной, условия F.14) не только достаточны, но 1) Эта теорема является частным случаем доказанного известным советским математиком А. А. Самарским значительно более общего утверждения. (Самар- (Самарский Л.Л. Введение в теорию разностных схем. — М.: Наука, 1971.)
§ 1 ] МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 159 и необходимы для сходимости указанной итерационной последова- последовательности при любом выборе нулевого приближения Xq. Доказательство. 1) Достаточность. Прежде всего оценим погрешность Z& = Х& — X. Так как X удовлетвовлетворяет уравне- уравнению АХ = F, a Xk соотношению F.13), то для Zk получим соотно- соотношение 7 7 BZfc+1r~Zfc +AZk=0. F.15) Установим для погрешности Zk так называемое основное энерге- энергетическое соотношение. Умножая F.15) скалярно на вектор 2(Zk+l-Zk)=2rZk+1~Zk, получим равенство 2r(Bf^±l—f^f f^±l—f±*\ + 2rlAZk, ^^——J =0. F.16) Если воспользоваться обозначением С = 2В — г А и соотношением Zk = 2 2 = 2 2 т ' то равенство F.16) можно переписать в виде .1+Zk),Zk+i-Zk)=0. F.17) Далее заметим, что в силу симметрии матрицы А второе слагаемое в F.17) равно {AZk+i, Zk+\) — {AZk, Zk). Это приводит нас к основ- основному энергетическому соотношению: у (AZk+i, Zk+x) = {AZk, Zk). F.18) Для доказательства достаточности условий F.14) остается с по- помощью основного энергетического соотношения доказать сходимость к нулю последовательности {||^||}. Из основного энергетического соотношения и из положи- положительной определенности матрицы С = 2В - г А вытекает, что (AZk+\, Zk+\) ^ {AZk, Zk), т.е. вытекает невозрастание последова- последовательности {{AZk, Zk)}. Из условия А > 0 вытекает, кроме того, что эта последовательность ограничена снизу нулем, а поэтому сходится. Но тогда из основного энергетического соотношения следует, что lim (cZk+x~Z\ Z*+1-Z*)=0. F.19) Напомним, что для положительно определенной матрицы С всегда найдется S > 0 такое, что {СХ, X) > 5{Х, X) для любого вектора X или, что то же самое, \\X\\2 < {\/5){СХ, X). Последнее неравенство позволяет заключить, что из равенства нулю указанного выше преде- предела F.19) следует, что lim \\Zk+l-Zk\\=0. F.20)
160 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ ГЛ. 6 Для завершения доказательства достаточности следует воспользо- воспользоваться соотношением BZk+1~Zk +AZk=0, из которого, в силу существования для положительно определенной матрицы А ограниченной обратной матрицы А~\ вытекает, что Последнее равенство и соотношение F.20) дают право заключить, что lim \\Zk\\ =0. Достаточность доказана. Для доказательства необходимости условий F.14) при дополни- дополнительном предположении о том, что матрица В симметрична, привлечем следующую лемму. Лемма. Пусть С — некоторая симметричная матрица, а В — симметричная положительно определенная матрица. Тогда матри- матрица С является положительно определенной в том и только в том случае, когда являются положительными все собственные значения задачи СХ = ХВХ. Для доказательства леммы заметим, что так как матрица В явля- является симметричной и положительно определенной, то (в силу теоре- теоремы 5.24 из п.6 §5 гл.5) существует самосопряженный положительно определенный оператор В1/2 такой, что для соответствующей ему матрицы ВХ12 справедливо равенство Б1/2 х Б1/2 = В. Так как мат- матрица В1/2 является положительно определенной и симметричной, то для нее существует ограниченная и симметричная обратная матрица, которую мы обозначим через Б/2 Заметим далее, что с помощью замены X = В~Х12У и умноже- умножения слева на матрицу Б/2 задача на собственные значения СХ = = ХВХ переходит в эквивалентную задачу на собственные значения В~Х12СВ~Х12У', так что для доказательства леммы остается убедиться в том, что заведомо симметричная матрица В~Х12СВ~Х12 является положительно определенной тогда и только тогда, когда является поло- положительно определенной матрица С. Это последнее сразу вытекает из того, что для любых ненулевых векторов X и У, связанных соотноше- соотношением У = В~Х12Х, справедливо равенство (в-{/2св-{/2х, х) = (св~х12х, в~х>2х) = (су, у). Лемма доказана. Теперь мы можем перейти к доказательству необходимости усло- условий F.14) теоремы 6.2 при дополнительном предположении о том, что матрица В является симметричной. 2) Необходимость. Будем опираться на следующее утвержде- утверждение из доказанной выше леммы: если матрица В является сим- симметричной и положительно определенной, а матрица С является симметричной и не является положительно определенной, то за-
§ 1 ] МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 161. дача на собственные значения СХ = ХВХ имеет хотя бы одно неположительное собственное значение Xs. Предположим, что не выполнено первое из условий F.14), т.е. не выполнено требование 2В — г А > 0. Полагая в проведенных выше рассуждениях С = 2В - г А, мы по- получим, что задача на собственные значения BВ - тА)Х = ХВХ имеет хотя бы одно неположительное собственное значение Xs. Обозначим через Х^ отвечающий Xs собственный вектор и выберем нулевое приближение Xq так, чтобы было выполнено условие Zq = X^s\ Тогда, переписав уравнение для погрешности F.15) в виде BZk+\ = = — BZk + BВ — rA)Zk, мы получим, последовательно полагая к равным 0, 1,..., = (-1 + Ae)xW, Z2 = (-1 Поскольку — 1 + Xs ^ — 1, то очевидно, что \\Zk\\ не стремится к нулю при к -> оо. Аналогично рассматривается случай невыполнения второго усло- условия F.14), т.е. условия г А > 0. В этом случае в проведенных выше рассуждениях следует положить С = г А. Мы получим при этом, что задача г АХ = ХВХ имеет хотя бы одно неположительное соб- собственное значение Xs с собственным вектором X^s\ Выбирая нулевое приближение Xq так, чтобы было справедливо равенство Zq = Х^ и переписывая F.15) в эквивалентном виде BZk+\ = BZk - rAZk, мы получим, что Так как А ^ 0, то очевидно, что \\Zk\\ не стремится к нулю при к —>• оо. Теорема 6.2 полностью доказана. Перейдем теперь к оценке скорости сходимости общего неявного метода простой итерации. Следуя А. А. Самарскому 0 , выясним вопрос о выборе такого значения параметра т, которое обеспечивает наиболее быструю сходимость. Предположим, что матрица В является симметричной и положи- положительно определенной. С помощью такой матрицы естественно ввести так называемое энергетическое скалярное произведение двух произ- произвольных векторов X и Y, положив его равным (ВХ, У) = (X, BY). Такое скалярное произведение будем обозначать символом (X, У)в- С помощью матрицы Б1/2 это скалярное произведение можно за- записать в виде (X, У)в = (В1/2В1/2Х, У) = (В1/2Х, ВХ12У). С по- помощью последнего равенства легко проверяется справедливость для х) Самарский А. А. Введение в теорию разностных схем. — М.: Наука, 1971. Самарский А.А., Гулин А.В. Устойчивость разностных схем. — М.: Наука, 1973. 6 Линейная алгебра
162 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ ГЛ. 6 введенного нами скалярного произведения четырех аксиом скалярного произведения (см. п. 1 § 1 гл.4). Далее естественно ввести энергетическую норму вектора X, поло- положив ее равной ч/(Х, Х)в = у/(ВХ, X). Эту энергетическую норму мы обозначим символом ||Х||в- Две различные нормы одной и той же совокупности векторов ||X||i и ||Х||ц называют эквивалентными, если существуют такие положи- положительные постоянные 71 и 72 > что справедливы неравенства Заметим, что энергетическая норма вектора X и обычная его норма являются эквивалентными. В самом деле, справедливость неравенства 7111^11 ^ И^Цв, т.е. неравенства ^(Х, X) < (ВХ, X) вытекает из положительной определенности матрицы В, а справед- справедливость неравенства \\Х\\В < 72||^||> т-е- неравенства (ВХ, X) < ^ 72ll^ll2 вытекает из неравенства Коши-Буняковского и оценки F.7) (достаточно положить ^\ = ||Б||). Установленная эквивалентность обычной и энергетической норм позволяет утверждать, что последовательность ||Л^|| сходится к ну- нулю тогда и только тогда, когда сходится к нулю последователь- последовательность ||Xfc||B. Для дальнейших рассуждений энергетическая норма является бо- более удобной, чем обычная норма. Докажем следующую фундаментальную теорему. Теорема 6.3 (теорема А. А. Самарского). Пусть матрицы А и В симметричны и положительно определены, Zk обозначает погреш- погрешность общего неявного метода простой итерации. Тогда для того чтобы при р < 1 было справедливо неравенство \\Zk\\B ^ /^Н^оНв, достаточно, чтобы было выполнено условие ]—?-В^А^ !±^В. F.21) т т Замечание. А.А. Самарским доказано, что условие F.21) не только достаточно, но и необходимо для справедливости неравен- неравенства ||Zk||в ^ р^Н^оНв, но мы на этом останавливаться не будем. Доказательство теоремы 6.3. Для удобства разобьем дока- доказательство на два шага. 1°. Сначала докажем, что если симметричные и положительно опре- определенные матрицы А и В удовлетворяют условиям Самарского F.14), то (BZk+x, Zk+x)^(BZk, Zk). Умножая равенство F.15) скалярно на 2rZk+x = r(Zk+x + Zk) + r(Zk+x - Zk), получим (B(Zk+i - Zk), Zk+X + Zk) + (B(Zk+i - Zk), Zk+X - Zk) + + r(AZk+u Zk+X + Zk) + r(AZk, Zk+X - Zk) = 0.
§ 1 ] МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 163 В последнем равенстве заменим AZk на разность l-A(Zk+1+Zk)-l-A(Zk+l-Zk). Тогда, учитывая вытекающее из симметрии матрицы А равен- равенство (A(Zk+i - Zk), Zk+\ + Zk) = (Zfc+i - Zk, A(Zk+x + Zk)), мы по- получим тождество - \ A) (Zk+l - Zk), + i (rA(Zk+l + Zk), Zk+x + Zk) = 0. Учитывая, что (в силу условий Самарского F.14)) операторы тА и В - — (т/2)А являются положительно определенными, мы получим из последнего тождества следующее неравенство: (B(Zk+i-Zk), Это неравенство эквивалентно доказываемому неравенству u Zk+\) (в силу вытекающего из симметрии оператора В тождества (BZk+u Zk) = (Zk+u BZk)). 2°. Пусть теперь при р < 1 выполнены условия Самарского F.21). Докажем справедливость неравенства ||^||в ^ р^Ц^оЦв- Положим Zk = ркУк- Тогда, очевидно, Zk+l -Zk = Pk+xVk+\ - PkVk = pk+\Vk+\ - Vk) - A - p)PkVk. Подставляя эти значения Zk и Zk+\ — Zk в равенство F.15) и произ- производя сокращение на рк, получим для величин Vk следующее соотно- шение: в котором В = рВ, А = А В. В силу условий F.21) операторы В и А удовлетворяют услови- условиям г А > 0, 2В > г А. Из этих условий и из того, что уравнение F.22) для Vk совершенно идентично уравнению FЛ5) для Zk, в силу первого шага для Vk вытекает следующая оценка: (BVk+\, Vfe+i) ^ (BVk, Vk)- Из этой оценки в свою очередь, учитывая, что В = рВ, получим неравенство {BVk+\, Vk+\) < {BVk, Vk). Последовательное применение указанного неравенства для номе- номеров к = 0, 1, ... приводит нас к соотношению {BVk, Vk) ^ (BVq, Vq),
164 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ ГЛ. 6 а умножение последнего соотношения на р приводит к окончательной оценке 0 (BZk, Zk) < p2k{BZ0, Zo). Тем самым неравенство ||^||в < < р^Ц^оЦв доказано. Доказатель- Доказательство теоремы 6.3 завершено. В заключение применим теорему Самарского 6.3 для выяснения вопроса о выборе такого значения параметра т, при котором скорость сходимости является максимальной. Из доказанной в теореме 6.3 оцен- оценки ||Zk||в ^ рк\\Zq||в вытекает, что эта задача сводится к нахождению такого значения т, при котором достигается минимальное значение функции р = р(т). Так как обе матрицы А и В симметричны и положительно опре- определены, то существуют положительные постоянные 71 и 72 такие, что справедливы неравенства j\B < А < 72 #• Будем считать, что постоянные 71 и 72 в этих неравенствах нам заданы 2). Сопоставляя только что написанные неравенства с условиями F.21), мы получим, что минимальное значение р достигается при условии A — р)/т = 7ь A + р)/т = 72» откуда получаем оптимальное значение т = 2/G1 + 72) и минимальное значение р, равное G2 ~ 7i)/G2 + 7i)- Частным случаем проведенного нами рассмотрения является явный метод простой итерации, изученный в п. 1. Для этого метода справед- справедливы все полученные нами результаты. В следующих трех пунктах с помощью общего неявного метода простой итерации и теоремы Самарского 6.2 мы рассмотрим несколько наиболее употребительных итерационных методов и установим условия их сходимости. 3. Модифицированный метод простой итерации. Этот метод получается из общего неявного метода простой итерации в том случае, когда стационарный параметр т равен единице, а матрица В пред- представляет собой диагональную матрицу D, состоящую из элементов матрицы А, лежащих на главной диагонали, т.е. В = D, где D = аи 0 ... О О а22 ... О О 0 ... апп F.23) При этом, конечно, предполагается, что матрица А является сим- симметричной и что все ее диагональные элементы аи, а22, •••, а>пп явля- являются положительными (последнее требование необходимо и достаточно для положительной определенности диагональной матрицы В = D). Из теоремы 6.2 сразу же вытекает, что для сходимости моди- модифицированного метода простой итерации при любом выборе нуле- ОМы учитываем, что Zk = pkVk, Zo = V&. ) Постоянные 71 и 72 естественно назвать константами эквивалентно- эквивалентности матриц А и В. Для коммутирующих матриц А и В постоянные 71 и 72 соответственно равны наименьшему и наибольшему собственным значениям задачи АХ = ХВХ.
§ 1 ] МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 165 вого приближения достаточно, чтобы были выполнены два условия: 2D > А, А > 0. Теорема 6.1 позволяет выразить достаточное условие сходимости модифицированного метода простой итерации и в другой форме 0 : \\Е - D~XA\\ < 1 F.24) (под нормой матрицы, как и выше, понимается операторная норма). Так как \\Е - D~x А\\ = \\D~\D - А)\\ = \\D~\A - D)\\, то доста- достаточное условие сходимости F.24) можно переписать в эквивалентном виде \\D-\A-D)\\<1. F.25) Неравенство F.25) позволяет получить различные достаточные условия сходимости модифицированного метода простой итерации. Прежде всего заметим, что если наряду с операторной нормой матрицы F.2), которую мы, как и выше, будем обозначать симво- символом ||А||, ввести так называемую сферическую норму этой матрицы, обозначаемую символом ||Л||Сф и определяемую равенством ||Л||Сф = I/2 Ь ' то' как Д°казано в §4 гл. 4 (см. формулу D.28)), для любого вектора X пространства Еп будет справедливо неравенство 2) \\AX\\ < ИЦефЦЛ-Ц. F.26) Из F.26) и F.5) сразу же вытекает, что операторная и сферическая нормы матрицы связаны соотношением ||Л|| ^ ||Л||Сф. Таким образом, в силу F.25) достаточное условие сходимости модифицированного метода простой итерации выражается неравен- неравенством ||D-1(^ — ?>)||сф < 1, которое в развернутой записи имеет вид г=1 j = \ Заметим далее, что при определении операторной нормы F.5) мат- матрицы А мы исходили из обычной (так называемой сферической) нормы Х\ , равной ||Х|| =\У\х? 1/2 вектора X = '¦ г=1 Часто вводят еще две нормы вектора X: так называемую кубиче- кубическую норму, определяемую равенством ||Х||куб = max \xi\, и так на- \<i<n 1) Мы учитываем, что в рассматриваемом случае вместо матрицы А следует взять матрицу А, определяемую формулой А = В~ХА и положить В = D, т= 1. :) В этом неравенстве под нормой вектора X = называемая сферическая норма Х\ понимается так
166 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [гл. 6 зываемую октаэдрическую норму, определяемую равенством ||Х||0КТ = п = ^2 \xi\- Если в определении F.5) операторной нормы матрицы А г=\ понимать под нормой вектора соответственно его кубическую или октаэдрическую норму, то соотношение F.5) приведет нас к определе- определению соответственно кубической и октаэдрической операторных норм матрицы А. Можно доказать, что кубическая и октаэдрическая операторные нормы матрицы F.2) следующим образом выражаются через элементы этой матрицы 0 : ку6 = ,ж Е = max Дословное повторение проведенных выше рассуждений с заменой сферических норм соответственно кубическими и октаэдрическими приведет нас к достаточному условию сходимости модифицирован- модифицированного метода простой итерации, выраженному соотношением F.25), в котором под нормой матрицы следует понимать соответственно ее кубическую или октаэдрическую операторные нормы. Это приводит нас к следующим двум условиям, каждое из кото- которых является достаточным для сходимости модифицированного метода простой итерации Е < 1 (для г = 1, 2,... , п); п Е аи < 1 (для j = 1, 2,..., п). 4. Метод Зейделя. Представим симметричную матрицу F.2) в виде суммы трех матриц А = D + L + U, где D — диагональная мат- матрица F.23), a L и U соответственно строго левая и строго правая матрицы, имеющие вид L = и удовлетворяющие условию Lr = U. Метод Зейделя получается из общего неявного метода простой итерации в том частном случае, когда стационарный параметр т равен 0 а>21 ап\ 0 0 ап2 ... 0 ... 0 ... 0 , и = 0 0 0 0 '. 0 . .. 0 х) См., например: Крылов В.И., Бобков В.В., Монастырный П.И. Вычисли- Вычислительные методы высшей математики. — Минск: Вышэйшая школа, 1972. Т. 1. С.111-112.
§ 1 ] МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 167 единице, а матрица В равна сумме D + L. Таким образом, последова- последовательные итерации в методе Зейделя определяются соотношением (D + L)(Xk+1-Xk) + AXk = F. Докажем, что метод Зейделя сходится для любой симметричной и положительно определенной матрицы А. В силу теоремы 6.2 достаточно доказать, что для любой такой матрицы А выполнено условие 2(D + L) > A. F.27) Для доказательства F.27) заметим, что для любого вектора X B(D + L)X, X) = (DX, X) + (DX, X) + (LX, X) + (LX, X) = = (DX, X) + (DX, X) + (LX, X) + (X, UX) = = (DX, X) + (AX, X). Таким образом, для доказательства неравенства F.27) достаточно убедиться в положительной определенности матрицы D, но она сразу вытекает из того, что у положительно определенной и симметричной матрицы А все элементы, лежащие на главной диагонали, являются положительными 0 . Сходимость метода Зейделя доказана. 5. Метод верхней релаксации. Этот метод получается из общего неявного метода простой итерации в том частном случае, когда г = = uj, В = D + loL, а параметр uj выбран так, чтобы являлось наи- наименьшим наибольшее по модулю собственное значение матрицы Е — uj(D + uoL)~x Л, осуществляющей переход от к-и итерации к (к + 1)-й. Докажем, что если матрица А является симметричной и поло- положительно определенной, то для сходимости метода верхней релак- релаксации достаточно, чтобы было выполнено условие 0 < uj < 2. В силу теоремы 6.2 для сходимости достаточно выполнение усло- условий uj > О, 2(D + uL) > ujA. Второе из этих условий для любого вектора X приводит к неравен- неравенству B(D + ujL)X, X) > (иАХ, X). F.28) Последнее неравенство эквивалентно каждому из неравенств в следу- следующей цепочке: BDX, X) + (ujLX, X) + (ujLX, X) > (соАХ, X), B - u)(DX, X) + (ujDX, X) + (uLX, X) + (X, ujUX) > (ujAX, X), B-u)(DX, X) >0. l) Достаточно заметить, что если у вектора X k-я координата равна едини- единице, а все остальные нулю, то (АХ, X) = акк > 0.
168 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ ГЛ. 6 Из последнего неравенства и из положительной определенности D заключаем, что F.28) справедливо при 2 — uj > О, т. е. при со < 2. Итак, доказано, что условия 0 < uj < 2 обеспечивают сходимость метода верхней релаксации. 6. Случай несимметричной матрицы А. В случае несимметрич- несимметричной матрицы А мы можем умножить матричное уравнение F.1) слева на матрицу А' и заменить уравнение F.1) уравнением АХ = F, в ко- котором F = A'F, А = А!А, так что матрица А является симметричной и (как легко убедиться) положительно определенной. 7. Итерационный метод П. Л. Чебышева 0 . Всюду выше при рассмотрении общего неявного метода простой итерации мы предпо- предполагали, что итерационный параметр г принимает одно и то же посто- постоянное значение. Естественно возникает идея рассмотреть более общий случай, когда в указанном методе значения итерационного параметра зависят от номера к итерации. В таком случае последовательность итераций будет определяться не соотношением F.13) вхк+х-хк г а более общим соотношением вхк+х-хк k Tfc + l При этом, как и выше, В — некоторая легко обратимая квадратная матрица порядка п. При таком выборе итерационной последователь- последовательности для погрешности Zk = Хк - X итерационной схемы получится соотношение тк+\ Предположим, что обе матрицы А и В симметричны и положитель- положительно определенны. Тогда, как уже отмечалось выше, найдутся положи- положительные постоянные 71 и 72 такие, что j\B ^ А ^ 72^- Будем считать, что эти постоянные 71 и 72 нам заданы и еще раз напомним, что эти постоянные равны соответственно наименьшему и наибольшему собственным значениям задачи АХ = ХВХ. Оценим энергетическую норму погрешности ||^||в- Напомним еще раз, что для симметричной и положительно опреде- определенной матрицы В существует симметричная и положительно опреде- определенная матрица Б1/2 такая, что В1/2 • В1/2 = В. Как и выше, догово- договоримся обозначать символом Б/2 матрицу, обратную к матрице Б1/2 Для оценки нормы погрешности Zk сделаем замену, положив Zk = = B~xl<1Vk. При такой замене соотношение для погрешности Zk пере- переходит в следующее соотношение для Vk\ Vk+l = (Е - rk+iC)Vk (k=0, 1,2, ...), 1) Пафнутий Львович Чебышев A821-1894) — великий русский математик и механик.
МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 169 где через С обозначена матрица вида С = В 1/2АВ xl<1. Убедимся в том, что квадрат обычной нормы вектора Vk равен квадрату энерге- энергетической нормы вектора Zk. В самом деле, \\Vk\\2 = (Vk, Vk) = (B{/2Z, BXI2Z) = (BZk, Zk) = \\Zk\\%. Таким образом, для оценки энергетической нормы Zk достаточно оценить обычную норму Vk. Оценим норму \\Vk\\- Прежде всего заметим, что из нера- неравенств 71 {ВХ, X) ^ (АХ, X) ^ ^(ВХ, X) с помощью замены X = = В~Х12У получаются неравенства Ъ(У, Y) < (CY, У) < -у2(У, У)- Последние неравенства эквивалентны тому, что j\E ^ С ^ 72^- Поскольку, кроме того, матрица С = В~Х12АВ~Х12 симметрична, то все собственные значения этой матрицы вещественны и расположены на отрезке [71, 72]- Последовательно записывая соотношение Vjt+i = = (Е — Tk+\C)Vk для номеров к = 0, 1,..., мы придем к следующему равенству: к из которого сразу же вытекает, что к IIМ) Но тогда из равенства |Ц4|| = Ц^Цб вытекает, что Ц^Цб ; к где qk = Т\(Е — TjC) . Следовательно, итерационный процесс схо- дится при условии, что последовательность {qk} стремится к нулю, причем тем быстрее, чем меньше величины qk. Поскольку каждое значение qk является функцией парамет- параметров т\, Т2,..., тк, возникает задача построения оптимального набора итерационных параметров из условия минимума qk для фиксированного к. Перейдем к решению этой задачи. Предположим, что все собственные значения Xs матрицы С лежат на заданном сегменте [71, 72]- Учитывая симметрию матрицы С, мы приходим к следующей задаче оптимизации: найти mm , тк) = = min = min < {Tj} I max Поскольку все Xs лежат на отрезке [71, 72], то расширяя область, по которой берется максимум, мы получим, что min qk(r\, тк) min тах
170 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ ГЛ. 6 Полученная огрубленная задача имеет более простое решение. Кроме того, при решении такой задачи не используется информация о кон- конкретном расположении собственных значений Xs на отрезке [71, 72]» а учитываются лишь границы этого отрезка. Такой подход позволяет построить набор оптимальных параметров для матриц произвольной структуры. Перейдем к решению указанной огрубленной задачи оптимизации. Положим и заметим, что полином P(t) удовлетворяет условию нормиров- нормировки Р@) = 1. С помощью замены переменной где 72 — 71 Ро = 72 + 71 71 + 72 мы отобразим отрезок 71 ^ t ^ 72 в отрезок -1 < 5 < 1, причем точка t = 0 переходит в точку S = So = I/ро > 1. При такой замене рассматриваемая задача_ оптимизации переходит в следующую задачу: среди всех полиномов Pk(S) степени к, удовле- удовлетворяющих условию нормировки Pk{l/po) = 1, найти такой, для которого max IP EI минимален. |5К1 Таким полиномом, как известно, является полином Чебышева где {cos (к arccos5) при |5| < 1, при|5|>1. Так как max \ТкEI = 1, то |5К1 min max \Pk(t)\ = причем = qk = 1 Pl2fc, где px = 7feEo) 1+P Для вычисления оптимального набора параметров будем исходить из равенства Pk{t) = П A - rjt) = qkTk
§ 1 ] МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 171. (мы учли, что S = — ). Приравняем корни полиномов, стоящих V ро / в левой и в правой частях этого равенства. Так как полином Pk(t) имеет корни tj = 1/tj (j = 1, 2,..., к), а полином Tk(S) имеет корни . 1 — oqS 1 1 — SjOq , . i о то, учитывая, что t = —, получим — = -1— (j = 1, z,... TO Tj T0 ..., k; Sj определены выше). Итак, оптимальными значениями итерационных параметров будут значения "- — ° где Sj = cos -^—— тг, j = 1, 2,..., к. J 1 + SoSj' " J 2k Итерационный процесс с указанным оптимальным набором пара- параметров называется чебышевским. Мы приходим к следующей теореме. Теорема 6.4. Если матрицы А и В симметричны и положитель- положительно определены и если j\B ^ А ^ 72^?> то чебышевский итераци- итерационный процесс сходится и для погрешности Zk после выполнения к итераций справедлива оценка л 2pf где qk = H\k при рх = 1 + p\k Если в качестве условия окончания процесса взять для заранее заданной ^-точности требование Ц^Цб ^ ^||^о||б> то из теоремы 6.4 получается для числа итераций к следующая оценка: к ^ ko(s) = = In (e/2)/ \np\. Сравнивая эту оценку с установленной выше оценкой числа итераций для метода простой итерации к ^ ко(е) = \пе/\про, мы получим, при условии, что величина ? = 72/71 мала, что ко(е) « « lnB/e)/B<v/j), A;o(e) ~ In A/б:)/B?). Сравнение этих оценок ука- указывает на преимущество чебышевского метода (в случае, когда вели- величина ? = 72/71 мала). Описанный нами чебышевский метод известен еще с начала 50-х годов. Иногда его называют методом Ричардсона. Следует отметить, что мы изучили этот метод для идеального вычислительного процесса с бесконечным числом знаков, в то время как на ЭВМ вычисления ведутся с конечным числом знаков, в связи с чем имеются числа, являющиеся машинной бесконечностью М^ и машинным нулем. Если в процессе вычислений на ЭВМ появляется число М, превосходящее М^, то происходит аварийный останов ма- машины (авост). С точки зрения идеального вычислительного процесса значения итерационных параметров tj можно упорядочить как угодно (любым из к\ способов). Любые две последовательности итерационных па-
172 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ ГЛ. 6 раметров {tj} с точки зрения идеального вычислительного процесса эквивалентны, ибо для них требуемая ^-точность достигается за одно и то же число итераций. Но при вычислении на ЭВМ различные последовательности пара- параметров {tj} не эквивалентны. Для одних последовательностей зна- значений {tj} может произойти аварийный останов машины вследствие роста промежуточных значений. Для других последовательностей зна- значений {tj} аварийного останова машины не происходит, но в связи с немонотонным характером стремления к нулю погрешности Z^, т.е. вследствие того, что норма матрицы Е — TjC перехода от (j — 1)-й итерации к j-й может быть больше единицы, для этой погрешно- погрешности не справедлива установленная нами для идеальной ситуации оценка. Вследствие указанных обстоятельств возникает теоретическая про- проблема — указать такой наилучший закон упорядочения значений {tj}, при котором для чебышевского метода было бы наименьшим влияние ошибок округления. Исчерпывающее решение этой проблемы можно найти в книге Самарский А. А. Теория разностных схем. — М.: Наука, 1977. С. 572 и далее. §2. Решение полной проблемы собственных значений методом вращений Ради простоты сначала будем рассматривать вещественную сим- симметричную матрицу А, определяемую равенством F.2). Заметим, что отыскание всех собственных значений и собственных векторов этой матрицы сводится к отысканию такой ортогональной матрицы Т, для которой произведение D = Т'АТ F.29) представляет собой диагональную матрицу. В самом деле, если такая ортогональная матрица Т будет найдена, то диагональные элементы матрицы D будут являться собственными значениями матрицы Л, а столбцы матрицы Т будут являться соответствующими собственными векторами матрицы А ). Введем в рассмотрение сферическую норму матрицы А: [п п 1 Е Е 4 г=\ 7 = 1 -I 1/2 О Для доказательства этого обозначим через Ai, A2,..., Ап диагональные элементы матрицы D и положим ек = ||ej.||, где элементы е\ столбца ед, удовлетворяют условию: е\ = 0 при к ф г и е\ = 1. Тогда, очевидно, Dek = = Хкек, т.е. Т'АТек = Хкек, и так как Т' = Т~\ то АТек = ХкТек. Следовательно, Тек являются собственными векторами матрицы А.
§2] МЕТОД ВРАЩЕНИЙ 173 Тогда, очевидно, для диагональных элементов матрицы Л будет справедливо неравенство Е г=1 1И112 сф' F.30) причем это неравенство переходит в точное равенство только в случае, когда матрица Л является диагональной. Заметим теперь, что при ортогональном преобразовании мат- матрицы А (т. е. при преобразовании вида Л = UAR, где U и R — ортогональные матрицы) сферическая норма этой матрицы не изме- изменяется 0 . Отсюда следует, что от всех ортогональных преобразований матрицы Л преобразование F.29) отличается тем, что это преобразо- преобразование делает максимальной сумму квадратов диагональных элементов преобразованной матрицы и минимальной — сумму квадратов всех внедиагональных элементов этой матрицы. Методом вращения называется итерационный метод, при котором указанная выше матрица Т находится как предел бесконечного произ- произведения элементарных матриц вращения, каждая из которых имеет вид О COS (f sin (р - sin (р COS (f 0 1 г-я строка F.31) j-я строка В целом метод вращений состоит в построении последовательности матриц Л, Ль Л2,..., А„, А„+ь..., F.32) каждая последующая из которых получается из предыдущей при по- помощи элементарного шага вида Аи+\ = Т/.Л^Т^-. Если для^ упрощения записи опустить индекс v и рассмотреть один такой шаг Л = T^ATij, осуществляемый с помощью матрицы F.31), то для элементов а^- преобразованной матрицы Л мы получим следу- 1) В самом деле, если А = UAR, а символ tr С обозначает сумму воех^эле- воех^элементов матрицы С, лежащих на ее главной диагонали, то \\А\\2Сф = tr (A'A) = = tT(R'A'U'UAR) =tr {R'A'AR) = \\AR\\% = \\(AR)% = \\R'A% = = tr {ARR'A') = tr (AA') = \\А'\\2сф = \\А\\2сф.
174 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [ ГЛ. 6 ющие выражения через элементы а^- матрицы А: aki = ак1 при кфг, j, 1ф г, j; 'O'il — ail cos <? + ajl sm <? ПРИ l Ф i, j\ 'a.ji = —an sin (p + aji cos (p при l Ф i, j', ^li = а/г cos <? + aZj sm <? ПРИ l Ф i, j\ aij = -a/i sin (^ + aLj cos у? при / ф i, j; F.33) a^ = (ац cos 99 + aji sin <p) cos y? + (a^- cos 99 + ajj sin y?) sin y?; Tiji = (—а^г sin y? + aji cos <p) cos (p + (—a^- sin (p + a^j cos y?) sin (p\ Hjj = —(—ац sin (^ + а^г cos ip) sin y? + {—aij sin 99 + a^j cos ip) cos 99; a^j = — {aa cos y? + aji sin <p) sin 99 + (a^ cos 99 + ajj sin y>) cos y?. Из соотношений F.33) и из условия симметричности матрицы А вытекает следующее легко проверяемое равенство: п п п п 1 Е YAi = Е Eai/ - 2<4- + - [(ajj - ац) sm2<p + 2a{j cos2<p}2. k=\i=\ k=\i=\ кф1 кф1 F.34) Из этого равенства вытекает, что для максимального уменьшения суммы квадратов всех внедиагональных элементов необходимо матри- матрицу F.31) выбрать так, чтобы были выполнены два требования: 1) номера г и j выбрать так, чтобы квадрат элемента а^-, был наи- наибольшим среди квадратов всех недиагональных элементов матрицы Л, т. е. выбор номеров г и j подчинить условию а2-- = max a\i\ 2) угол поворота (р в матрице F.31) выбрать так, чтобы было справедливо равенство (ajj — ац) sin2</? + 2аij cos2</? = 0. F.35) Равенство F.35) однозначно определяет угол (р, удовлетворяющий условиям tg2<p = -**!—, H<J. F.36) Это равенство позволяет вычислять cos (p и simp по формулам 1/2 1/2 где р = 2aij/(au - aj
§2] МЕТОД ВРАЩЕНИЙ 175 Заметим, что если матрица F.31) выбрана так, что выполнены указанные выше требования 1) и 2), то равенство F.34) переходит в следующее соотношение: Jfe=l/=1 k=\l = \ кф\ кф\ в котором ctij представляет собой наибольший по модулю внедиаго- внедиагональный элемент матрицы. Теперь мы можем более точно сказать, что метод вращений состоит в построении последовательности матриц F.32), каждая последующая из которых получается из предыдущей посредством ортогонального преобразования Av+\ = T^A^Tij, в котором матрица Т^- = Т^- (р) выбирается так, чтобы были выполнены указанные выше два требова- требования 0 . Докажем сходимость метода вращений. Обозначим символом Si сумму квадратов всех внедиагональных элементов матрицы Av, а сим- символом а^ наибольший по модулю внедиагональный элемент этой матрицы. Тогда в силу F.37) справедливо равенство F.38) Далее, поскольку общее число внедиагональных элементов матри- матрицы Av равно п(п — 1), а а"\ — наибольший по модулю из этих элементов, то справедливо неравенство п 9 п2 *Щ > / п F.39) п(п — 1) Из F.38) и F.39) вытекает неравенство ^] F.40) Последовательно используя неравенство F.40), записанное для номе- номеров 0, 1,..., is, и обозначая через Sq = Sq(A) сумму квадратов всех внедиагональных элементов основной матрицы А, мы получим, что 1) Номера г и j на каждом шаге выбираются такими, чтобы наибольшим по модулю являлся внедиагональный элемент матрицы Av с этими номерами.
176 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ [гл. 6 Из неравенства F.41) сразу же следует, что hm 5?+i = 0, что и до- казывает сходимость метода вращений. В качестве приближенных значений собственных чисел матрицы А берутся диагональные элементы матрицы 4, а в качестве прибли- приближенных собственных векторов матрицы А берутся столбцы матри- матрицы TixjlTi2J2 ...Tiuju. Более точные результаты получены В. В. Воеводиным 0. Для слу- случая, когда произвольная (не обязательно симметричная) матрица А не имеет жордановых клеток и все ее внедиагональные элементы являются величинами порядка е и малы по сравнению с числом р = = min \Xi — Xj\, В.В. Воеводин получил следующие оценки: а) для собственных значений оценку п Аг = ац + . Р=\ ц - ар (из указанной суммы исключаются значения р, принадлежащие мно- множеству Щ тех чисел j = 1, 2,..., п, для которых Xj = A;); б) если Т — матрица, столбцы которой являются собственными векторами матрицы А и Т = Е + Н, где Е — единичная матрица, то для элементов hij матрицы Н справедливы оценки О, О(е2), если Xi = если Если Л — комплексная эрмитова матрица, то вместо матри- матрицы F.31) следует взять унитарную матрицу О COS (f — sin (p • е i-Ф о-^ cos (р 1-Я строка F.42) .7-я строка 1) Воеводин В. В. Численные методы алгебры. Теория и алгорифмы. — М.: Наука, 1966.
§2] МЕТОД ВРАЩЕНИЙ 177 При этом вместо равенства F.34) мы придем к равенству k=\i=\ k=\i=\ 2\ai cos2 <p • eia - sin2 <p • е{{2ф~а) + (ajj - ai{) cos <p sin в котором через а обозначен аргумент комплексного числа а^-. Для максимального уменьшения суммы квадратов модулей внедиа- гональных элементов следует у матрицы F.42) выбрать такие номера г и j, чтобы элемент а^- был наибольшим по модулю внедиагональным элементом матрицы А, а выбор углов (риф подчинить условию |а^-|(со82 (р • eia - sin2 (p • е1^'^ + (ajj - an) cos (р • sin (р • е^) = 0. Последнее условие приводит к соотношениям Доказательство сходимости метода вращений проводится точно так же, как и для случая вещественной матрицы.
Глава 7 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ В этой главе изучаются билинейные формы, определенные в веще- вещественном линейном пространстве, т. е. числовые функции двух вектор- векторных аргументов, линейные по каждому из этих аргументов. Подробно исследуются так называемые квадратичные формы, представляющие собой билинейные формы, определенные для совпадающих значений их аргументов. Рассматриваются также некоторые приложения теории билинейных и квадратичных форм. § 1. Билинейные формы 1. Понятие билинейной формы. Понятие билинейной формы в произвольном линейном пространстве было введено нами ранее в гл.5. Однако для удобства изложения в этом пункте мы напомним некоторые определения и простейшие утверждения. Определение 1. Числовая функция Л(х, у), аргументами кото- которой являются всевозможные векторы х и у вещественного линейного пространства L, называется билинейной формой, если для любых векторов х, у и z из L и любого вещественного числа Л выполняются следующие соотношения: Л(х + z, у) = Л(х, у) + A(z, у), Л(х, у + z) = Л(х, у) + Л(х, z), Л(Лх, у) = ЛЛ(х, у), GЛ) Л(х, Ау) = АЛ(х, у). Иными словами, билинейная форма представляет собой число- числовую функцию Л(х, у) двух векторных аргументов х и у, опреде- определенную на всевозможных векторах х и у вещественного линейного пространства L и линейную по каждому из этих аргументов 0 . Простейшим примером билинейной формы может служить произве- произведение двух линейных форм /(х) и g*(y), определенных на векторах х и у линейного пространства L. 1) При этом часто говорят, что билинейная форма Л(х, у) задана на ли- линейном пространстве L.
§ 1 ] БИЛИНЕЙНЫЕ ФОРМЫ 179 Определение 2. Билинейная форма Л(х, у) называется симмет- симметричной {ко со симметричной), если для любых векторов х и у линей- линейного пространства L выполняются соотношения Л(х, у) = А(у, х) (Л(х, у) = -Л(у, х)). G.2) Справедливо следующее утверждение: любую билинейную форму можно представить в виде суммы симметричной и кососимметрич- ной билинейных форм (см. п. 1 §9 гл.5). 2. Представление билинейной формы в конечномерном ли- линейном пространстве. Пусть в n-мерном линейном пространстве L задана билинейная форма В(х, у). Выясним вопрос о представлении формы В(х, у) в случае, когда в L задан определенный базис е = = (еь е2,..., еп). Справедливо следующее утверждение. Теорема 7.1. Билинейная форма Б(х, у) при заданном в п-мер- ном линейном пространстве L базисе е = (еь е2,..., еп) может быть однозначно представлена в следующем виде: В(х, у) = ? bijdvj, G.3) i, j = \ где bij = B(eit еД G.4) a & и rjj — координаты в базисе е векторов х и у соответственно. п п Доказательство. Пусть х = ^ ^е^ иу= ^ 'П^з ~ разложе- г=\ j=\ ние векторов х и у по базису е. Так как форма В(х, у) линейна по каждому из аргументов х и у (см. G.1)), то , У) = В J2 v J=l / t,J=l Таким образом, для формы В(х, у) справедливо представле- представление G.3) с выражениями G.4) для коэффициентов bij. Чтобы доказать однозначность этого представления, предположим, что для В(х, у) справедливо представление G.3) с некоторыми коэф- коэффициентами bij. Беря в G.3) х = е^, у = е^, мы сразу же получим выражения G.4) для коэффициентов bij. Теорема доказана. Определение. Матрица (bn b\2 ... Ь\п б21622::б2п Ьп\ ЬП2 ... Ьпп/ элементы bij которой определены с помощью соотношений G.4), назы- называется матрицей билинейной формы В(х, у) в данном базисе е. Замечание 1. Обратимся к вопросу о построении всех били- билинейных форм в данном конечномерном вещественном пространстве L.
180 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 Ответ на этот вопрос следующий: любая квадратная матрица (bij) является в данном базисе е = (ei, e2,..., еп) матрицей некоторой билинейной формы. Убедимся в справедливости этого утверждения. Определим в линейном пространстве L с данным базисом е = = (еь е2,..., еп) с помощью матрицы (bij) числовую функцию Б(х, у) двух векторных аргументов х = ^ &е^ и у = ^ rjjej вида г=1 j=\ Б(х, у)= ? ЬцЬъ. i, j' = l Легко видеть, что эта функция удовлетворяет всем условиям опре- определения билинейной формы. Но тогда, согласно теореме 7.1, элемен- элементы bij заданной матрицы равны В(е^, ej), а написанная выше формула есть представление этой формы в виде G.3). Согласно сделанному замечанию естественно называть представле- представление G.3) билинейной формы В(х, у) общим видом билинейной формы в п-мерном линейном пространстве. Замечание 2. Если В(х, у) — симметричная (кососимметрич- ная) билинейная форма, то матрица G.5) этой формы в базисе е является симметричной (кососимметричной). Справедливо и обрат- обратное — если матрица G.5) билинейной формы В(х, у) симметрична (кососимметрична), то и билинейная форма является симметричной (кососимметричной). Убедимся в справедливости этого замечания. Пусть В(х, у) — симметричная (кососимметричная) билинейная форма. Полагая в соотношениях G.2) х = е^, у = е • получим, соглас- согласно G.4), bij = bji (bij = -bji), G.6) т.е. матрица G.5) является симметричной (кососимметричной). Пусть теперь матрица G.5) билинейной формы Б(х, у) симмет- симметрична (кососимметрична), т.е. ее элементы удовлетворяют соотноше- соотношениям G.6). Тогда из соотношения G.3) и соотношения Б(х, у) = п = J2 bij&Vj, следует, что Б(х, у) = В(у, х) (Б(х, у) = -В(у, х)), i,j = l т.е. форма В(х, у) является симметричной (кососимметричной). 3. Преобразование матрицы билинейной формы при переходе к новому базису. Ранг билинейной формы. Рассмотрим в линейном пространстве L два базиса: е = (ei, е2,..., еп) и / = (fi, f2,..., fn). Пусть А(е) = (dij) и A(f) = (bij) — матрицы данной билинейной формы в указанных базисах. Выясним вопрос о связи этих матриц, т. е. выясним вопрос о пре- преобразовании матрицы a,ij билинейной формы при переходе от базиса е к новому базису /. Справедливо следующее утверждение.
§ 1 ] БИЛИНЕЙНЫЕ ФОРМЫ 181. Теорема 7.2. Матрицы А(е) и A(f) билинейной формы Л(х, у) в базисах е = (ei, е2,..., еп) и f = (f\, fy,..., fn) связаны соотноше- соотношением A(f) = CfA(e)C, G.7) где С = (cpq) — матрица перехода от базиса е к базису f, а С — транспонированная матрица С. Доказательство. Элементы fq нового базиса / выражаются через элементы ер старого базиса е с помощью матрицы С = (cpq) по формулам f* = Е wv G-8) Р=\ Так как bik = A(fi, f&), то, согласно G.8), получим / п п \ bik = А(Ь, ffc) = A f J2 cuei> E cJ*>ej ] = = J2 Л(ег> ej)CUCjk = E aijcilCjk- G.9) Напомним, что элементы с'н транспонированной матрицы С связаны с элементами сц матрицы С соотношениями сц = с'н. Подставляя эти соотношения в правую часть G.9), получим для bik следующее выражение: п п / п \ bik = Е aiJcUcJk = E C'li ( Е аЧС1к ) • G.10) n Сумма ^ cLijCjk (по определению произведения матриц) представ- i ляет собой элемент матрицы Л(е) С Отсюда следует, что выраже- выражение в правой части G.10) является элементом матрицы С'А(е)С. Но в левой части G.10) стоит элемент матрицы A(f). Поэтому A(f) = = СА(е) С. Теорема доказана. Следствие. Ранг матрицы A(f) равен рангу матрицы А(е). Это сразу вытекает из соотношения G.7), из того, что матрица С и, стало быть, матрица С являются невырожденными, и из теоремы о том, что ранг матрицы не изменяется при умножении ее на невырож- невырожденную матрицу. Это следствие позволяет ввести важный числовой инвариант били- билинейной формы — так называемый ранг билинейной формы. Определение 1. Рангом билинейной формы, заданной в конеч- конечномерном линейном пространстве L, называется ранг матрицы этой формы в произвольном базисе пространства L. Определение 2. Билинейная форма Л(х, у), заданная в конечно- конечномерном линейном пространстве L, называется невырожденной (вы- (вырожденной), если ее ранг равен (меньше) размерности пространства L.
182 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 § 2. Квадратичные формы Пусть Л(х, у) — симметричная билинейная форма, заданная на линейном пространстве L. Определение 1. Квадратичной формой называется числовая фун- функция Л(х, х) одного векторного аргумента х, которая получается из билинейной формы Л(х, у) при х = у. Симметричная билинейная форма Л(х, у) называется полярной к квадратичной форме Л(х, х). Полярная билинейная форма Л(х, у) и квадратичная форма Л(х, х) связаны следующим соотношением: Л(х, у) = i [Л(х + у, х + у) - Л(х, х) - Л(у, у)], которое вытекает из очевидного равенства Л(х + у, х + у) = А(х, х) + Л(х, у) + Л(у, х) + Л(у, у) и свойства симметрии формы Л(х, у). Пусть в конечномерном линейном пространстве L задана симмет- симметричная билинейная форма Л(х, у), полярная к квадратичной фор- форме Л(х, х). Пусть, кроме того, в L указан базис е = (еь в2,..., еп). Согласно теореме 7.1 форму Л(х, у) можно представить в виде G.3) п Л(*> У) = X) aijiiVj, где & и rjj — координаты в базисе е векторов х и у соответственно. При этом, в силу симметрии Л(х, у), aij = aji G.11) (см. замечание 2 п. 2 предыдущего параграфа). Полагая в G.3) х = у (т.е. rjj = ?j), мы получим следующее пред- представление для квадратичной формы Л(х, х) в конечномерном про- пространстве L с заданным базисом е: Л(х, х)= ? а^;- G.12) Матрица aij называется матрицей квадратичной формы Л(х, х) в заданном базисе е. Согласно G.11) матрица (а^) является симметричной. Очевидно, каждой симметричной матрице (aij) отвечает с помощью соотноше- соотношения G.12) квадратичная форма Л(х, х), причем G.12) будет представ- представлением Л(х, х) в пространстве L с заданным базисом е (см. также замечание 3 п. 2 предыдущего параграфа). Отметим, что матрица квадратичной формы при переходе к новому базису преобразуется по формуле G.7). Поэтому ранг этой матрицы не меняется при переходе к новому базису.
§2] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ 183 Обычно ранг матрицы квадратичной формы Л(х, х) называется рангом квадратичной формы. Если ранг матрицы квадратичной формы равен размерности про- пространства L, то форма называется невырожденной, а в противном случае — вырожденной. В дальнейшем мы будем использовать следующую терминологию. Определение 2. Квадратичная форма Л(х, х) называется: 1) положительно (отрицательно) определенной, если для любого ненулевого х выполняется неравенство Л(х, х) > 0 (Л(х, х) < 0) (такие формы называются также знакоопределейными)', 2)знакопеременной, если существуют такие х и у, что Л(х, х) > 0, Л(у, у) < 0; 3) квазизнакоопределенной, если для всех х Л(х, х) > 0 или Л(х, х) < 0, но имеется отличный от нуля вектор х, для которого Л(х, х) = 0. В дальнейшем мы укажем признаки, по которым можно судить о принадлежности формы Л(х, х) к одному из указанных типов. Отметим следующее важное утверждение. Если Л(х, у) представляет собой билинейную форму, поляр- полярную положительно определенной квадратичной форме Л(х, х), то Л(х, у) удовлетворяет всем аксиомам скалярного произведения век- векторов в евклидовом пространстве. Обратимся к четырем аксиомам скалярного произведения (см. п. 1 §1 гл.4). Если число, называемое скалярным произведением векторов х и у, обозначить символом Л(х, у), то эти аксиомы запишутся следующим образом: 1°. Л(х, у) = Л(у, х). 2°. Л(х + г, у) = Л(х, у) + Л(г, у). 3°. Л(Лх, у) = ЛЛ(х, у). 4°. Л(х, х)Hи Л(х, х) > 0 при х ф 0. Так как билинейная форма Л(х, у), полярная квадратичной фор- форме Л(х, х) симметрична, то аксиома 1° выполняется. Аксиомы 2° и 3° в сочетании с требованием симметрии выполнены в силу определения билинейной формы (см. п. 1 § 1 этой главы). Аксиома 4° выполняется, так как квадратичная форма Л(х, х) положительно определена. Замечание. Очевидно, аксиомы скалярного произведения можно рассматривать как совокупность требований, определяющих билиней- билинейную форму, полярную положительно определенной квадратичной фор- форме. Поэтому скалярное произведение в линейных пространствах может быть задано с помощью такого вида билинейной формы.
184 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 § 3. Приведение квадратичной формы к сумме квадратов В этом параграфе указаны различные методы приведения квадра- квадратичной формы к сумме квадратов, т. е. будут указаны методы выбора такого базиса / = (fi, f2,..., fn) в линейном пространстве L, по отно- отношению к которому квадратичная форма представляется в следующем каноническом виде: Л(х, х) = ХхгЦ + М4 + ... + Хпт]2п, G.13) (т/ь V2, •••, Vn) — координаты х в базисе /. Коэффициенты (Ль Л2,..., Лп) в выражении G.13) называются ка- каноническими коэффициентами. Подчеркнем, что мы рассматриваем квадратичные формы в произ- произвольном вещественном линейном пространстве. В § 6 будут изучены квадратичные формы в евклидовом пространстве и будет доказана воз- возможность приведения каждой квадратичной формы к каноническому виду даже в ортонормированном базисе. Исходя из результатов гл. 5, в том же § 6 настоящей главы будет получено новое доказательство теоремы о приведении квадратичной формы к каноническому виду в произвольном (не обязательно евклидовом) вещественном линейном пространстве. Настоящий же параграф посвящен не только доказательству воз- возможности приведения квадратичной формы к каноническому виду, но и описанию двух методов такого приведения, имеющих большую практическую ценность и широко встречающихся в приложениях. Так как каждому преобразованию базиса отвечает невырожденное линейное преобразование координат, а невырожденному преобразова- преобразованию координат — преобразование базиса, то вопрос о приведении формы к каноническому виду можно решать путем выбора соответ- соответствующего невырожденного преобразования координат. 1. Метод Лагранжа. Докажем следующую теорему. Теорема 7.3. Любая квадратичная форма Л(х, х), заданная в п-мерном линейном пространстве L, с помощью невырожденного линейного преобразования координат может быть приведена к ка- каноническому виду G.13). Доказательство. Проведем доказательство теоремы методом Лагранжа. Основная идея этого метода заключается в последова- последовательном дополнении квадратного трехчлена по каждому аргументу до полного квадрата. Будем считать, что Л(х, х) ф О 0 ив данном базисе е = (ei,e2,..., еп) имеет вид Л(х, х)= ? aijtiZj. G.14) 1) Если форма Д(х, х) = 0, то ее матрица в любом базисе состоит из нулевых элементов, и поэтому такая форма по определению имеет канониче- канонический вид.
§3] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ 185 Убедимся, во-первых, что с помощью невырожденного преобразова- преобразования координат форму Л(х, х) можно преобразовать так, что коэффи- коэффициент при квадрате первой координаты вектора х будет отличен от нуля. Если в данном базисе этот коэффициент отличен от нуля, то нуж- нужное невырожденное преобразование является тождественным. В случае, если аи =0, но отличен от нуля коэффициент при квадрате какой-либо другой координаты, то с помощью перенумерации базисных векторов можно добиться требуемого результата. Ясно, что перенумерация является невырожденным преобразованием. Если же все коэффициенты при квадратах координат равны ну- нулю, то нужное преобразование можно получить следующим способом. Пусть, например, а\2 ф 0 0 . Рассмотрим следующее невырожденное преобразование координат 2): ?1=6-6, ^2 = 6+6, ?=6, 2 = 3,4,..., П. После этого преобразования коэффициент при ^ будет равен 2а\2 и поэтому отличен от нуля. Итак, будем считать, что в соотношении G.14) аи Ф 0. Выделим в выражении G.14) ту группу слагаемых, которые содержат ?i. По- Получим п Л(х, x) = an?? + 2ai2?i6 + -»+2ain?i?n+ J2 "ijtitj- G-15) г, 3=2 Преобразуем выделенную группу слагаемых следующим образом: ? +2a,266 + ••• +2а,„6?„ = а„ (б + ^ & + ••• + — &») " V аи аи / 2 2 _ &Yl_ Л _ а\п с2 pai2ai3 t ? — 2ain~lCLln ? ? an an n ац an Очевидно, выражение G.15) можно теперь переписать так: i,j=2 где a*j — коэффициенты при 60' полученные после преобразования. Рассмотрим следующее невырожденное преобразование координат: т=6 + —6 + ... + —6» т = Ь, -.., vn = in. а\\ а\\ С помощью этого преобразования и представления G.1) для Л(х, х) получим п Л(х, х) = auVi + Yl Uij^iVj- G-17) г, 3=2 1) Напомним, что Л(х, х) ф 0, и поэтому хотя бы один коэффициент aij отличен от нуля. 2) Определитель матрицы этого преобразования равен 2, и поэтому это преобразование невырожденное.
186 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 Итак, если форма Л(х, х) ф О, то с помощью невырожденного преобразования координат эту форму можно привести к виду G.17). п Обратимся теперь к квадратичной форме J^ a*jTjiTjj. Если эта форма тождественно равна нулю, то вопрос о приведении Л(х, х) п к каноническому виду решен. Если же форма J^ a^rjirjj ф О, то г, 3=2 мы можем повторить рассуждения, рассматривая преобразования ко- координат rj\,...,T]n, аналогичные описанным выше, и не меняя при этом координату щ . Очевидно, такого типа преобразования коорди- координат 77ь 772, •••, Vn будут невырожденными. Ясно, что за конечное число шагов мы приведем квадратичную форму Л(х, х) к каноническому виду G.13). Отметим, что нужное преобразование исходных координат ?ь ?2,... ..., ?п можно получить путем перемножения найденных в процессе рассуждений невырожденных преобразований. Теорема доказана. Замечание 1. Базис, в котором квадратичная форма имеет кано- канонический вид, называется каноническим. Отметим, что канонический базис определен неоднозначно. Замечание 2. Если форма Л(х, х) приведена к каноническому виду G.13), то, вообще говоря, не все канонические коэффициен- коэффициенты Xi отличны от нуля. Оставляя в G.13) лишь отличные от ну- нуля Xi и перенумеровывая их заново, получим следующее выражение для Л(х, х): Л(х, х) = ХхгЦ + А2т722 + ... + ХкгЦ. G.18) Ясно, что к < п. Так как ранг квадратичной формы по определению равен рангу ее матрицы в любом базисе, то из G.18) и условия Xi ф О при г = 1, 2,..., к вытекает, что ранг формы равен к. Таким образом, число отличных от нуля канонических коэффициентов равно рангу квадратичной формы. 2. Метод Якоби. При некоторых дополнительных предположениях о квадратичной форме Л(х, х) можно указать явные формулы перехода от данного базиса е = (еь е2,..., еп) к каноническому базису / = = (fi, f2,..., fn) и формулы для канонических коэффициентов А^. Предварительно мы введем понятие треугольного преобразования базисных векторов. Преобразование базисных векторов ei, e2,..., еп называется тре- треугольным, если оно имеет следующий вид: fi =еь f2 = a2iei + e2, f3 = a3iei + a32e2 + e3, G-19) fn = aniei + an2e2 + ... +en
§3] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ 187 Замечание. Так как определитель матрицы треугольного преоб- преобразования G.19) отличен от нуля (равен 1), то векторы fi, f2,..., fn образуют базис. Введем в рассмотрение угловые миноры матрицы А(е) = (а^) коэффициентов формы Л(х, х) в базисе е, обозначив их символа- символами Аь Д2,..., Ап-1- аи ... а\гП-\ an_i,i ... ап-\,п-\ G.20) Справедливо следующее утверждение. Теорема 7.4. Пусть миноры Ai, A2,..., Ап матрицы (a^j) квад- квадратичной формы Л(х, х) отличны от нуля. Тогда существует един- единственное треугольное преобразование базисных векторов еь ©2,... ..., еп, с помощью которого форму Л(х, х) можно привести к ка- каноническому виду. Доказательство. Напомним, что коэффициенты bij фор- формы Л(х, х) в базисе fi, f2,..., fn вычисляются по формулам bij = = A(fi,fi). Если форма Л(х, х) в базисе fi, f2,..., fn имеет канонический вид, то bij = 0 при г ф j. Поэтому для доказательства теоремы достаточно построить с помощью треугольного преобразования G.19) такой ба- базис fi, f2,..., fn, в котором будут выполняться соотношения A(ti, fj) = 0 при г ф j, или, что то же, при г < j G.21) (при этом, конечно, надо убедиться, что искомое преобразование един- единственно). Если обратиться к формулам G.19) для f^, то, используя линейное свойство квадратичной формы Л(х, х) по каждому аргументу, легко заметить, что соотношения G.21) будут выполнены, если будут выпол- выполнены соотношения О A(ei,fj)=0, Л(е2, fj) =0, ..., Л(е^_ь f^ = 0, j = 2, 3,..., п. G.22) Запишем формулы G.22) в развернутом виде. Для этого подставим в левые части этих формул выражение f^ = QLj\Q\ -\- QLJ2&2 + • • • + OLj j — l6j_l + Gj G.23) для fj из соотношений G.19). Используя далее свойство линейности Л(х, х) по каждому аргументу и обозначение A(eit e^) = а^-, получим в результате следующую линейную систему уравнений для неизвест- *) Нетрудно убедиться, что из соотношений G.21) следуют соотношения G.22).
188 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 ных коэффициентов а^: <%j2a\2 + ... + OLj j-\CL\ j-1 + CL\j = 0, G.24) OLj\CLj-\,\ + aj2CLj-\f2 + ••• + OLjj-iCLj-ij-i + CLj-ij = 0. Определитель этой системы равен Aj-ь По условию Aj-i ф 0. Следовательно, система G.24) имеет единственное решение. Таким образом, можно построить единственное треугольное пре- преобразование базисных векторов, с помощью которого форма Л(х, х) приводится к каноническому виду. Теорема доказана. Приведем формулы, по которым можно вычислить коэффициен- коэффициенты OL{j искомого треугольного преобразования, и формулы для канони- канонических коэффициентов Xj. Обозначим символом Aj_i?j минор матрицы (а^), расположен- расположенный на пересечении строк этой матрицы с номерами 1, 2,..., j — 1 и столбцов с номерами 1, 2,..., г — 1, г + 1,..., j. Тогда, обращаясь к системе G.24) и используя формулы Крамера, получим следующее выражение для а^-: i+i^bL G.25) Займемся вычислением канонических коэффициентов Xj. Так как Xj = bjj = A(fj, fj), то из выражения G.23) для fj и фор- формул G.22) получаем Xj = A(fj, fj) = A(aj{ei + aj2e2 + ... + ajtj-ie^-i +е^, fj) = = A(ej, fj) = v4(ej, aj\ex + aj2e2 + ... + «i,j-iej-i +ej) = Подставляя выражение G.25) для olj{ в правую часть последнего соот- соотношения, найдем Числитель последнего соотношения представляет собой сумму про- произведений элементов строки с номером j в определителе Aj на ал- алгебраические дополнения этих элементов в указанном определителе. Следовательно, этот числитель равен Aj. Поэтому Aj = -^, j=2, 3,...,n. G.26) Так как Ai = A(f\, fi) = ^4(ei, ei) = an = Ai, то отсюда и из G.26) получаем следующие формулы для канонических коэффициентов: А,=Дь А2 = ^, .... Ап = -^=-. G.27)
§4] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ 189 § 4. Закон инерции квадратичных форм. Классификация квадратичных форм 1. Закон инерции квадратичных форм. Мы уже отмечали (см. за- замечание 2 п. 1 предыдущего параграфа), что ранг квадратичной формы равен числу отличных от нуля канонических коэффициентов. Таким образом, число отличных от нуля канонических коэффициентов не за- зависит от выбора невырожденного преобразования, с помощью которого форма Л(х, х) приводится к каноническому виду. На самом деле при любом способе приведения формы Л(х, х) к каноническому виду не меняется число положительных и отрицательных канонических коэф- коэффициентов. Это свойство называется законом инерции квадратичных форм. Прежде чем перейти к обоснованию закона инерции, сделаем неко- некоторые замечания. Пусть форма Л(х, х) в базисе е = (еь в2,..., еп) определяется матрицей А(е) = (а^-): Л(х, х) = JT ац№,, G.28) где ?ь?2>--->?п ~~ координаты вектора х в базисе е. Допустим, что эта форма с помощью невырожденного преобразования координат приведена к каноническому виду Л(х, х) = Ai/^ + A2/i2 + --- + A/cA4, G.29) причем Ль Л2,..., Л/г — отличные от нуля канонические коэффициен- коэффициенты, занумерованные так, что первые q из этих коэффициентов положи- положительные, а следующие коэффициенты — отрицательные: Ai>0, А2>0, ..., Xq>0, Ag+i<0, ..., \k<0. Рассмотрим следующее невырожденное преобразование коорди- координат fii 0 : 1 Vh=J=nllkt G-30) В результате этого преобразования форма Л(х, х) примет вид Л(х, х) = гЦ + rjl + ••• + vl ~ V2q+i ---ril G-31) называемый нормальным видом квадратичной формы. *) Легко видеть, что определитель этого преобразования отличен от нуля.
190 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 Итак, с помощью некоторого невырожденного преобразования ко- координат ?i, ?2» • • • > ?п вектора х в базисе е = (ei, е2,..., еп) Vi = ап€\ + а*2& + ••• + ачп?т г = 1, 2,..., тг, det(o^)/0 G.32) (это преобразование представляет собой произведение преобразований ?B/iH/iB7/no формулам G.30)) квадратичная форма может быть приведена к нормальному виду G.31). Докажем следующее утверждение. Теорема 7.5 (закон инерции квадратичных форм). Число сла- слагаемых с положительными (отрицательными) коэффициентами в нормальном виде квадратичной формы не зависит от способа приведения формы к этому виду. Доказательство. Пусть форма Л(х, х) с помощью невырож- невырожденного преобразования координат G.32) приведена к нормальному виду G.31) и с помощью другого невырожденного преобразования координат приведена к нормальному виду А(х, х) = С? + Cl + ¦¦¦ + (I ~ ?и " ••• " & G-33) Очевидно, для доказательства теоремы достаточно убедиться в справедливости равенства р = q. Пусть р > q. Убедимся, что в этом случае имеется ненулевой вектор х такой, что по отношению к базисам, в которых форма Л(х, х) имеет вид G.31) и G.33), координаты rj\, щ,..., rjq и Ср+ь ••• > Сп этого вектора равны нулю: 771=0, ^=0, ..., щ= 0, Ср+1 = 0, ..., Сп=0. G.34) Так как координаты щ получены путем невырожденного преобразо- преобразования G.32) координат ?ь ..., ?п, а координаты d — с помощью анало- аналогичного невырожденного преобразования этих же координат ?ь ..., ?п, то соотношения G.34) можно рассматривать как систему линейных однородных уравнений относительно координат ?i,...,?n искомого вектора х в базисе е = (еь е2,..., еп) (например, в развернутом виде соотношение 771 = 0 имеет, согласно G.32), вид an?i + «12^2 + ••• • •• + OL\nin = 0)- Так как р > q, то число однородных уравнений G.34) меньше п, и поэтому система G.34) имеет ненулевое решение относи- относительно координат ?i,..., ?n искомого вектора х. Следовательно, если р > q, то существует ненулевой вектор х, для которого выполняются соотношения G.34). Подсчитаем значение формы Л(х, х) для этого вектора х. Обраща- Обращаясь к соотношениям G.31) и G.33), получим л(х, х) = -rfq+x -... - 4 = с! + с! + ¦¦¦ + с2Р. Последнее равенство может иметь место лишь в случае 77^+1 = ... ... = % = о и Ci = C2 = ... = CP = o. Таким образом, в некотором базисе все координаты (\, С2>---> Сп ненулевого вектора х равны нулю (см. последние равенства и соотно- соотношения G.34)), т.е. вектор х равен нулю. Следовательно, предположе-
§4] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ 191. ние р > q ведет к противоречию. По аналогичным соображениям ведет к противоречию и предположение р < q. Итак, р = q. Теорема доказана. 2. Классификация квадратичных форм. В п. 1 §2 этой главы (см. определение 2) были введены понятия положительно определен- определенной, отрицательно определенной, знакопеременной и квазизнакоопре- деленной квадратичных форм. В этом пункте с помощью понятий индекса инерции, положитель- положительного и отрицательного индексов инерции квадрата формы мы укажем, каким образом можно выяснить принадлежность квадратичной формы к тому или иному из перечисленных выше типов. При этом индексом инерции квадратичной формы будем называть число отличных от нуля канонических коэффициентов этой формы (т.е. ее ранг), положитель- положительным индексом инерции — число положительных канонических коэф- фициетов, отрицательным индексом инерции — число отрицательных канонических коэффициентов. Ясно, что сумма положительного и от- отрицательного индексов инерции равна индексу инерции. Итак, пусть индекс инерции, положительный и отрицательный ин- индексы инерции квадратичной формы Л(х, х) соответственно равны к, pnq(k = p-\-q).B предыдущем пункте было доказано, что в любом каноническом базисе / = (fi, f2, ..., fn) эта форма может быть приве- приведена к следующему нормальному виду: Л(х, х) = г)\ + 4 + ... + rj2p - n2p+l -•••-rjl G.35) где 7?1, г/2, •••, rjn — координаты вектора х в базисе /. 1°. Необходимое и достаточное условие знакоопределенности квадратичной формы. Справедливо следующее утверждение. Для того чтобы квадратичная форма Л(х, х), заданная в п-мерном линейном пространстве L, была знакоопределенной, необходимо и достаточно, чтобы либо положительный индекс инерции р, либо отрицательный индекс инерции q был равен размерности п пространства L. При этом, если р = п, то форма положительно определенная, если же q = n, то форма отрицательно определенная. Доказательство. Так как случаи положительно определенной формы и отрицательно определенной формы рассматриваются анало- аналогично, то доказательство утверждения проведем для положительно определенных форм. 1) Необходимость. Пусть форма Л(х, х) положительно опреде- определена. Тогда выражение G.35) примет вид Л(Х,Х) = 7/2 + 7/1 + ... + ^. Если при этом р < п, то из последнего выражения следует, что для ненулевого вектора х с координатами 77!= О, т=0, ..., 77Р = О,
192 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 форма Л(х, х) обращается в нуль, а это противоречит определе- определению положительно определенной квадратичной формы. Следовательно, р = п. 2) Достаточность. Пусть р = п. Тогда соотношение G.35) имеет вид Л(х, х) = г\\ + г)\ + ... + rjp. Ясно, что Л(х, х) > 0, причем, если А = 0, то г/1 = г/2 = ... = т]п = 0, т. е. вектор х нулевой. Следовательно, Л(х, х) — положительно определенная форма. Замечание. Для выяснения вопроса о знакоопределенности квад- квадратичной формы с помощью указанного признака мы должны привести эту форму к каноническому виду. В следующем пункте мы докажем критерий Сильвестра знако- знакоопределенности квадратичной формы, с помощью которого можно вы- выяснить вопрос о знакоопределенности формы, заданной в любом базисе без приведения к каноническому виду. 2°. Необходимое и достаточное условие знакопеременности квадратичной формы. Докажем следующее утверждение. Для того чтобы квадратичная форма была знакопеременной, необходимо и достаточно, чтобы как положительный, так и от- отрицательный индексы инерции этой формы были отличны от нуля. Доказательство. 1) Необходимость. Так как знакопере- знакопеременная форма принимает как положительные, так и отрицательные значения, то ее представление G.35) в нормальном виде должно со- содержать как положительные, так и отрицательные слагаемые (в про- противном случае эта форма принимала бы либо неотрицательные, либо неположительные значения). Следовательно, как положительный, так и отрицательный индексы инерции отличны от нуля. 2) Достаточность. Пусть р ф О и q ф 0. Тогда для векто- вектора xi, с координатами rj\ ф 0, ..., rjp ф 0, rjp+\ = 0, ..., rjn = 0 имеем Л(хь xi) > 0, а для вектора Х2 с координатами щ =0,... ..., rjp = 0, 7/р_|_1 ф0, ..., 7/п ф 0 имеем Л(х2, хг) < 0. Следовательно, форма Л(х, х) является знакопеременной. 3°. Необходимое и достаточное условие квазизнакоопределен- квазизнакоопределенности квадратичной формы. Справедливо следующее утверждение. Для того чтобы форма Л(х, х) была квазизнакоопределенной, необходимо и достаточно, чтобы выполнялись соотношения: либо р < п, q = 0, либо р = 0, q < п. Доказательство. Мы рассмотрим случай положительно ква- квазизнакоопределенной формы. Случай отрицательно квазизнакоопреде- квазизнакоопределенной формы рассматривается аналогично. 1) Необходимость. Пусть форма Л(х, х) положительно ква- зизнакоопределенная. Тогда, очевидно, q = 0 и р < п (если бы р = п, то форма была бы положительно определенной), 2) Достаточность. Если р < п, q = 0, то Л(х, х)H и для ненулевого вектора х с координатами г]\ = 0, щ = 0, ..., rjp = 0, 7/p+i ф = 0, ..., г]п ф 0 имеем Л(х, х) = 0, т.е. Л(х, х) — положительно квазизнакоопределенная форма.
§4] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ 193 3. Критерий Сильвестра 0 знакоопределенности квадратичной формы. Пусть форма Л(х, х) в базисе е = (ei, e2,..., еп) определяет- определяется матрицей А(е) = (а^-): > х) = и пусть = аи, А2 = аи а\2 , А„ = аи а\п угловые миноры и определитель матрицы (а^). Справедливо следующее утвер- утверждение. Теорема 7.6 (критерий Сильвестра). Д/гя того чтобы квад- квадратичная форма Л(х, х) была положительно определенной, необходимо и достаточно, чтобы были выполнены неравен- неравенства Ai > О, А2 > 0, ..., Ап > 0. Для того чтобы квадратичная форма была отрицательно опре- определенной, необходимо и достаточно, чтобы знаки угловых миноров чередовались, причем Ai < 0. Доказательство. 1) Необходимость. Докажем сначала, что из условия знакоопределенности квадратичной формы Л(х, х) следует Д. /0, г = 1, 2,..., п. Убедимся, что предположение Д& = 0 ведет к противоречию — при этом предположении существует ненулевой вектор х, для которого Л(х, х) = 0, что противоречит знакоопределенности формы. Итак, пусть А/г = 0. Рассмотрим следующую квадратную однород- однородную систему линейных уравнений: = 0, = 0, = 0. Так как А/, — определитель этой системы и А/, = 0, то система имеет ненулевое решение ?ь ?г> ••• > ?& (не все ii равны 0). Умно- Умножим первое из уравнений G.36) на ?ь второе на ^2» •••> последнее на ?k и сложим полученные соотношения. В результате получим ра- k венство aijiiij = 0, левая часть которого представляет собой ,3 значение квадратичной формы Л(х, х) для ненулевого вектора х с ко- координатами (?ь ?г> ••• > ?ь 0> ••• > 0)- Это значение равно нулю, что противоречит знакоопределенности формы. Итак, мы убедились, что А^ ф 0, г = 1, 2,..., п. Поэтому мы можем применить метод Якоби приведения формы Л(х, х) к сумме квадратов (см. теорему 7.4) и воспользоваться формулами G.27) для канониче- канонических коэффициентов Л^. Если Л(х, х) — положительно определенная форма, то все канонические коэффициенты положительны. Но тогда *) Джемс Джозеф Сильвестр A814-1897) — английский математик. 7 Линейная алгебра
194 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 из соотношений G.27) следует, что Ai > О, Д2 > 0, ..., Ап > 0. Если же Л(х, х) — отрицательно определенная форма, то все канонические коэффициенты отрицательны. Но тогда из формул G.27) следует, что знаки угловых миноров чередуются, причем Ai < 0. 2) Достаточность. Пусть выполнены условия, наложенные на угловые миноры Д^ в формулировке теоремы. Так как Д^ ф 0, г = = 1, 2,..., п, то форму А можно привести к сумме квадратов методом Якоби (см. теорему 7.4), причем канонические коэффициенты А^ могут быть найдены по формулам G.27). Если Ai > 0, А2 > 0, ..., An > 0, то из соотношений G.27) следует, что все А^ > 0, т. е. форма Л(х, х) положительно определенная. Если же знаки Д^ чередуются и Ai < 0, то из соотношений G.27) следует, что форма Л(х, х) отрицательно определенная. Теорема доказана. § 5. Полилинейные формы Определение. Полилинейной формой А(~к\, Х2,..., хр) р вектор- векторных аргументов называется числовая функция, определенная на все- всевозможных векторах xi,X2,...,xp линейного пространства L и ли- линейная по каждому из аргументов, при фиксированных значениях остальных аргументов. Простейшим примером полилинейной формы может служить про- произведение линейных форм А{х.\) А{х.2)... Л(хр). Полилинейная форма А(~к\, Х2,..., хр) называется симметричной (ко со симметричной), если для каждых двух ее аргументов х& и х/ и для любых значений этих аргументов выполняется соотношение Л(хь..., х*,..., х/,..., хр) = Л(хь..., х/,..., хь-.., Хр) (Л(хь..., х*,..., х/,..., Хр) = -Л(хь..., х/,..., хь-.., Хр)). Пусть полилинейная форма Л(хь Х2,..., хр) задана в конечномер- конечномерном линейном пространстве L, и пусть ei, е2,..., еп — базис в L. Обратимся к разложению каждого вектора х^ по базисным векто- векторам ei, e2,..., еп: п Хг = 6iei +Ые2 + --- + &пеп = Y;&JeJ> i=l,2,...,p. G.37) i=i Подставляя выражения для х^ по формулам G.37) в полилинейную форму Л(хь Х2,..., хр) и используя свойство линейности этой формы по каждому аргументу, получим Л(хь х2,..., хр) = A E ?1*6у2-"?ИИ(ел-,,ел> ...,ejp). G.38) h. h ip=l
§6] ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 195 Таким образом, значения полилинейной формы Л(хь Х2,..., хр) в конечномерном пространстве с выделенным базисом ei, е2,..., еп определяются всевозможными значениями A(ej{, е^2, ..., eJp) этой формы на векторах е^, ej2,..., eJp. Докажем следующее утверждение. Теорема 7.7. Любая полилинейная ко со симметричная фор- форма Л(хь Х2,..., хп), заданная в п-мерном линейном пространст- пространстве L с выделенным базисом еь е2,..., еп, может быть представле- представлена в виде ^ , G.39) где а = А(е\, е2,..., еп), а (?ц, ^2, •••, &п) — координаты векто- вектора х^ в базисе е\, е2,..., еп. Доказательство. Так как форма Л(хь Х2,..., хп) является кососимметричной, то для произвольной перестановки (ji, j2,..., jn) индексов A, 2,..., п) имеем A(ejlt ej2,..., ein) = (-1)^ь^'-'^)А(еь е2,..., en) = 2,...,in)a> G40) где N(j\, J2,..., jn) — число беспорядков в перестановке (ji,j2,--- ..., in)- В силу кососимметричности формы для двух одинаковых индексов Зк и 3i Uк = ji) значение A(ej{,..., ejfe,..., ejt, ..., ejri) равно нулю. Отсюда и из соотношения G.40) следует, что для рассматриваемого случая соотношение G.38) примет вид Л(хьх2)...,х„) = а ? (_1)^ьл inN.i6.2...^. G.41) Сравнивая формулу G.41) с формулой A.28) гл. 1 для определителя порядка п, мы убедимся в справедливости соотношения G.39). Теорема доказана. § 6. Билинейные и квадратичные формы в евклидовом пространстве В предыдущих параграфах мы изучали билинейные и квадратичные формы в произвольном (не обязательно евклидовом) вещественном линейном пространстве L. В этом параграфе мы получим ряд сведе- сведений о билинейных и квадратичных формах, заданных в вещественном евклидовом пространстве. При этом мы будем широко пользоваться результатами §9 гл.5, посвященного линейным операторам. В п. 3 настоящего параграфа будет показано, каким образом тео- теория евклидовых пространств может быть применена для получения
196 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 содержательных результатов в произвольных линейных пространствах. В частности, нами будет получено независимое доказательство теоре- теоремы о том, что каждая квадратичная форма в линейном пространстве может быть приведена к каноническому виду. 1. Предварительные замечания. В этом пункте мы напомним некоторые понятия теории линейных операторов. Пусть V — n-мерное вещественное евклидово пространство и А — линейный оператор, действующий из V в V. Оператор А* называется сопряженным к А, если для всех х ? V и у ? V выполняется равенство (Ах, у) = (х, А*у). G.42) Оператор А называется самосопряженным, если А = А*, т.е. для всех х G V и у ? V (Ах, у) = (х, Ау). G.43) Рассмотрим билинейную форму В(х, у), заданную в евклидовом пространстве V. В гл.5 было установлено, что каждой такой фор- форме В(х, у) однозначно соответствует линейный оператор такой, что справедливо равенство Б(х, у) = (Ах, у). G.44) Кроме того, в теореме 5.33 было доказано, что билинейная фор- форма В(х, у) является симметричной тогда и только тогда, когда опера- оператор А, фигурирующий в G.44), является самосопряженным. Напомним также, что в теореме 5.35 для любого самосопряженного оператора А было доказано существование ортонормированного базиса из собственных векторов. Это означает, что существуют ортонорми- рованная система еь е2,..., еп и вещественные числа Ль Л2,..., Лп такие, что Аек = Хкек. G.45) Отметим, что в базисе {ек} матрица оператора А имеет диагональ- диагональный вид. 2. Приведение квадратичной формы к сумме квадратов в орто- ортогональном базисе. Пусть Б(х, у) — симметричная билинейная форма, заданная в вещественном евклидовом пространстве V, а В(х, х) — определяемая ею квадратичная форма. Докажем следующую теорему о приведении квадратичной фор- формы В(х, х) к сумме квадратов. Теорема 7.8. Пусть В(х, у) — симметричная билинейная форма, заданная в евклидовом пространстве V. Тогда в пространстве V существует такой ортонормированный базис {ек} и можно ука- указать такие вещественные числа Хк, что для любого х е V квадра- квадратичная форма В(х, х) может быть представлена в виде следующей суммы квадратов координат ^к вектора х в базисе {ек}: В(х, х) = ? \к&. G.46) к=\
§6] ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 197 Доказательство. Так как В(х, у) — симметричная билинейная форма, то существует самосопряженный оператор А такой, что В(х, у) = (Ах, у). G.47) По теореме 5.35 для оператора А можно указать ортонормирован- ный базис {е/,} из собственных векторов этого оператора; пусть Хк — собственные значения, отвечающие ек. Пусть вектор х имеет в базисе ек координаты ?&: х= ?&е*. G.48) к=\ Тогда, очевидно, поскольку ек — собственные векторы оператора А: п Ax=?Afc&efc. G.49) к=\ Из соотношений G.48) и G.49) вследствие ортонормированности базиса {ек} получаем следующее выражение для скалярного произве- произведения Л(х, х): Л(х, х) = ? \k?l G.50) к=\ Отсюда и из соотношения G.47) получаем G.46). Теорема доказана. 3. Одновременное приведение двух квадратичных форм к сум- сумме квадратов в линейном пространстве. Докажем теперь важную теорему об одновременном приведении двух квадратичных форм к сумме квадратов в произвольном (не обя- обязательно евклидовом) вещественном линейном пространстве. Теорема 7.9. Пусть Л(х, у) и В(х, у) — симметричные били- билинейные формы, определенные в вещественном линейном простран- пространстве V. Допустим далее, что для всех х е V, х ф 0, справедливо неравенство В(х, х) > 0 (т.е. квадратичная форма В(х, х) — поло- положительно определенная). Тогда в пространстве V можно указать базис {ек} такой, что квадратичные формы Л(х, х) и В(х, х) могут быть представлены в виде Л(х, х) = ? А*& G.51) В(х, х) = ? &, G.52) к=\ где ?/. — координаты вектора х в базисе {ек}. Доказательство. Согласно замечанию в конце §2 этой главы скалярное произведение в конечномерном вещественном пространстве может быть задано с помощью билинейной формы В(х, у), полярной к положительно определенной квадратичной форме В(х, х).
198 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 Поэтому мы можем ввести в линейном пространстве V скалярное произведение (х, у) векторов х и у, полагая (х, у) = В(х, у). G.53) Таким образом, V представляет собой евклидово пространство со скалярным произведением G.53). По теореме 7.11 можно указать та- такой ортонормированный базис {е/,} и такие вещественные числа А&, что в этом базисе квадратичная форма Л(х, х) представляется в ви- виде G.51). С другой стороны, в любом ортонормированном базисе скалярное произведение (х, х), равное, согласно G.53), В(х, х), представляется в виде суммы квадратов координат вектора х. Таким образом, представление В(х, х) в виде G.52) в базисе {е/,} также обоснованно. Теорема доказана. Замечание. Из доказанной нами теоремы непосредственно сле- следует, что любую квадратичную форму в произвольном вещественном линейном пространстве можно привести к каноническому виду. Однако способ такого приведения является, вообще говоря, более сложным, чем способы, изложенные выше в §3, поскольку он требует нахожде- нахождения всех собственных векторов некоторого самосопряженного операто- оператора (см. по этому поводу гл.6). 4. Экстремальные свойства квадратичной формы. Рассмотрим произвольную дифференцируемую функцию /, определенную на неко- некоторой гладкой поверхности S (см. определение гладкой поверхности в гл.5 части II «Основ математического анализа»). Будем говорить, что точка хо поверхности S является стационарной точкой функции /, если в точке хо производная функции / по любому направлению на поверхности S равна нулю. В частности, точки экстремума функции / являются ее стационарными точками. Значение /(хо) функции / в стационарной точке хо называется стационарным значением. Иногда стационарную точку хо функции / называют ее критической точкой, а величину /(хо) — критическим значением. В этом пункте мы исследуем вопрос о стационарных и, в частности, экстремальных значениях квадратичной формы В(х, х) на сфере единичного радиуса в евклидовом пространстве V и о связи этих значений с собственными значениями самосопряженного операто- оператора А, с помощью которого симметричная билинейная форма В(х, у), полярная квадратичной форме В(х, х), представляется в виде В(к, у) = (Ах, у). G.54) При этом единичной сферой в V мы будем называть множество тех векторов х G V, которые удовлетворяют уравнению (х, х) = 1 или ||х|| = 1. G.55) Для упрощения рассуждений мы воспользуемся выводами преды- предыдущего пункта о приведении квадратичной формы к сумме квадратов.
§6] ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 199 Итак, пусть В(х, х) — квадратичная форма, В(х, у) — полярная этой форме билинейная форма, А — самосопряженный оператор, свя- связанный с В(х, у) соотношением G.54). По теореме 7.8 в ортонормированном базисе {е/,}, состоящем из собственных векторов оператора А, квадратичная форма В(х, х) име- имеет вид п Б(х, х) = ? \k?l G.56) к=\ где ?k — координаты вектора х в базисе {е/.}, А& — собственные значения оператора А. Мы договоримся нумеровать эти собственные значения в порядке убывания: Ai >А2 > ... > Ап. G.57) Заметим, что в выбранном базисе единичная сфера, определяемая уравнением G.55), в координатах вектора х задается уравнением Е & - 1 = 0. G.58) к=\ Докажем следующую теорему. Теорема 7.10. Стационарные значения квадратичной фор- формы В {к, х) на единичной сфере G.55) равны собственным значе- значениям \k оператора А. Эти стационарные значения достигаются, в частности, на единичных собственных векторах ек оператора А. Доказательство. Так как речь идет о стационарных значе- значениях функции В(х, х) при условии (х, х) = 1, т.е. об условном экстремуме этой функции, то мы можем воспользоваться методом неопределенных множителей Лагранжа (см. «Основы математического анализа» часть I, п. 2 §5 гл.15). Составим для функции В(х, х), используя ее выражение G.56) в данном базисе {е/,}, функцию Лагран- Лагранжа Ф(?ь ^2>---> ?п)> учитывая при этом, что уравнение связи имеет вид G.58). Получим ф=Еа*Й-а(х;^_Л> G59) /c=l Vjfe=l / где А — неопределенный множитель Лагранжа. Напомним, что если А в G.59) выбрано так, что при условии G.58) выполняются соотношения |^=0, fc=l,2,...,n, G.60) то в точках сферы G.58), отвечающих этим значениям А, функ- функция В(х, х) (квадратичная форма В(х, х)) имеет стационарное значение. Таким образом, вопрос о стационарных значениях В(х, х) на сфе- сфере (х, х) = 1 редуцируется к исследованию системы уравнений относи- относительно неизвестных А и координат ?i, ?2>---> ?п вектора х. Отметим,
200 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 что при этом ?i,?2>--->?n будут координатами того вектора х, на котором В {к, х) будет иметь стационарное значение. Так как то интересующая нас система G.58), G.60) примет вид ?d=l. (А*-А)&=0, A = 1,2,..., п. G.61) к=\ Пусть система G.61) имеет решение А = А, x=(?i, &,..., ?п). Умножая каждое из соотношений (Хк - АN =0 на ?к, суммируя п ^ затем полученные соотношения и учитывая, что ^ ?| = 1, получим, согласно G.56), следующее значение для А: к=\ Таким образом, если А и х = (?i, 6> •••> Сп) — решение систе- системы G.61), то А равно значению квадратичной формы ,В(х, х) на векторе х = (^i, ^2> ••• > ?п)> ^^ котором эта форма имеет стацио- стационарное значение. Легко видеть, что решениями системы G.61) служат следующие значения неизвестных Аи^: А = Аь 6 =0, ..., 6-1 =0, 6 = 1, 6+1 =0, ..., 6 = 0, /с= 1, 2,..., п. Очевидно, эти решения являются собственными значениями \к и координатами соответствующих собственных векторов е^. Теорема доказана. Замечание. Мы только что выяснили, что собственные значения Хк являются стационарными значениями квадратичной формы В(х, х) на сфере (х, х) = 1. Оказывается, числа Ai и Хп (при условии G.57)) являются соот- соответственно наибольшим и наименьшим значениями В(х, х) на сфе- сфере (х, х) = 1 (то, что эти значения достигаются, установлено выше). Чтобы убедиться в справедливости замечания, достаточно заменить в G.56) все Хк сначала на Ап, а затем на Ai и воспользоваться соотношениями G.57) и G.58). Очевидно, получим неравенства Ап ^ В(х, х) ^ Х\.
§7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 201_ § 7. Гиперповерхности второго порядка В этом параграфе мы познакомимся с понятием и основными ти- типами гиперповерхностей второго порядка. Кроме того, будут указаны способы исследования таких поверхностей. 1. Понятие гиперповерхности второго порядка. Пусть V — n-мерное вещественное евклидово пространство. Ради геометрической наглядности будем называть векторы х этого пространства точками. Гиперповерхностью S второго порядка будем называть геомет- геометрическое место точек х, удовлетворяющих уравнению вида Л(х, х) + 2Б(х) + с = 0, G.62) где Л(х, х) — не равная тождественно нулю квадратичная форма, Б(х) — линейная форма, а с — вещественное число. Уравнение G.62) будем называть общим уравнением гиперповерх- гиперповерхности второго порядка. Выделим в пространстве V какой-либо ортонормированный ба- базис {ек}. Координаты вектора х (точки х) в этом базисе обозначим через (х\, Х2, •••, хп). Тогда (см. п.2 §1 этой главы) квадратичная форма Л(х, х) может быть представлена в виде п Л(х, х) = ^2 cijkXjXk, G.63) j,k=l где a,jk = A(ejf ек) G.64) и A(ej, ек) — значение на векторах ej и ек симметричной билинейной формы Л(х, у), полярной квадратичной форме Л(х, х). Линейная форма В(х) в указанном базисе {ек} представляется в виде 0 п ?(х)= $>***. G.65) к=\ Таким образом, общее уравнение гиперповерхности второго по- порядка в евклидовом пространстве V с выделенным базисом {ек} может быть представлено в следующей форме: п п "?2 ajkXjXk + 2J2bkXk + c = 0. G.66) j,k=l к=\ Договоримся о следующей терминологии. х) Согласно лемме п. 1 §4 гл.5 линейная форма В(х) может быть представ- представлена в виде В(х) = (х, Ь), где b — постоянный вектор. Обозначая Ь\, &2, ••• ..., Ьп координаты вектора b и учитывая ортонормированность базиса {} мы получим представление В(х) в виде G.65).
202 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 п Слагаемое Л(х, х) = ^ ajkXjXk будем называть группой стар- j,k=\ ших членов уравнения G.62) или G.66). п Группу слагаемых В(х) + с = ^ bkXk + с будем называть линей- к=\ ной частью уравнения G.62) или G.66). Мы будем рассматривать в дальнейшем матрицы х /аи ... а\п Ь\у аи ... а\г КапХ ... и,пп/ уЬ{ К и определители det А и det В этих матриц. Исследование гиперповерхностей второго порядка мы будем прово- проводить с помощью метода, сходного с методом, применяемым в анали- аналитической геометрии при исследовании кривых и поверхностей второго порядка, заданных общими уравнениями. Идея этого метода заключается в том, что путем выбора специаль- специальной декартовой системы координат на плоскости (для кривых второго порядка) или в пространстве (для поверхностей второго порядка) до- достигается максимальное упрощение уравнения кривой или поверхно- поверхности. Затем путем исследования этого уравнения выясняются геомет- геометрические свойства кривой или поверхности. Кроме того, перечисление всех возможных типов простейших (канонических) уравнений кривых или поверхностей второго порядка позволяет дать их классификацию. Чтобы использовать этот метод в многомерном случае, мы снача- сначала должны изучить такие преобразования (отображения) п-мерного евклидова пространства, которые представляют собой аналоги преоб- преобразований декартовых прямоугольных координат в случае двух и трех измерений. Такими преобразованиями в n-мерном случае будут параллельные переносы и такие преобразования базисов, при которых ортонорми- рованный базис переходит в новый ортонормированый базис. Точные определения этих преобразований будут даны в следующем пункте. Очевидно, гиперповерхность второго порядка, рассматриваемая как геометрический объект пространства V, не изменяется, если произво- производится преобразование указанного выше вида. Ниже мы убедимся, что для каждого уравнения вида G.62) (или G.66)) можно выбрать такое начало координат и выбрать такой ортонормированный базис в V, что это уравнение, записанное в координатах относительно нового базиса, будет максимально простого вида, и поэтому, как и в случае двух и трех измерений, можно будет указать геометрические характеристи- характеристики таких поверхностей и дать им классификацию. 2. Параллельные переносы в евклидовом пространстве. Пре- Преобразования ортонормированных базисов в ортонормированные. Параллельным переносом в евклидовом пространстве мы будем назы-
§7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 203 вать преобразование, задаваемое формулами х = х' + х, G.68) где х — фиксированная точка, называемая новым началом координат. Пусть точки х, х7 и х имеют координаты, соответственно равные (х\, Х2,..., Хп), (х\, Xf2,..., х'п) И (х\, Х2,..., Хп). Тогда в координатах параллельный перенос определяется форму- формулами хк = х'к + хк, к = 1, 2, ..., п. G.69) Отметим, что при параллельном переносе любой фиксированный базис не изменяется. Перейдем теперь к выяснению характеристики преобразования ор- тонормированного базиса в ортонормированный. Допустим, что ортонормированный базис {ек} преобразуется в но- новый ортонормированный базис {е^}. Разложим каждый вектор е'к по векторам {ек}. Получим • • • + Pn2^n, G.70) e'n = pine\ + P2n^2 + • • • + Pnn^n- Обозначим буквой Р матрицу преобразования G.70): (pn P21 ••• Pni\ P12 P22 ... Pn2 G71) Pin P2n ••• Pnn/ Так как базисы {е^} и {е'к} ортонормированные, то из G.70) путем скалярного умножения е^- на е^ получим j = к, /7 7О\ ( при i / А. G72) Рассмотрим теперь транспонированную матрицу Р\ т. е. матрицу, полученную из Р перестановкой строк и столбцов. Очевидно, согласно G.72), рр' = р'р = /, G.73) где / — единичная матрица. Равенства G.73) показывают, что матрица Р' является обратной для матрицы Р, т. е. Р~х = Р1. G.74) Допустим теперь, что мы рассматриваем преобразование ортонор- мированного базиса {е&} по формулам G.70), причем матрица Р этого преобразования удовлетворяет условию G.73) (или, что то же, G.74)).
204 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 Тогда, очевидно, элементы р^ матрицы Р удовлетворяют усло- условию G.72), что, согласно этим же соотношениям G.72), эквивалентно условию ортонормированности базиса {е^}. Напомним, что в §9 гл.5 матрицу Р, удовлетворяющую усло- условию G.73), мы назвали ортогональной. Итак, для того чтобы преобразование G.70) было преобразовани- преобразованием ортонор мир о ванного базиса в ортонормированный, необходимо и достаточно, чтобы матрица Р этого преобразования была орто- ортогональной. Замечание. Обращаясь к формулам E.14) преобразования координат вектора при преобразовании базиса (см. п. 1 §2 гл.5) и учитывая, что обратная матрица для ортогональной матрицы Р есть матрица Рг, получим следующие формулы преобразования координат точки х при переходе от ортонормированого базиса к ортонормированному: Х\ = Х2 = Р2\Х[ + Р22%2 + • • • + Р2пХ'п> G.75) 3. Преобразование общего уравнения гиперповерхности второ- второго порядка при параллельном переносе. Рассмотрим параллельный перенос, который определяется как преобразование пространства V по формуле G.68) (или в координатах по формуле G.69)). Левая часть G.62) после подстановки вместо х его выражения по формуле G.68) в силу линейности квадратичной формы по первому и второму аргументу 0 и свойств линейной формы примет следую- следующий вид: Л(х', х7) + 2[Л(х', х) + Я(х')] + [А(х, х) + 2В(х) + с] = 0. Итак, общее уравнение G.62) гиперповерхности S при параллель- параллельном переносе G.68) запишется в форме Л(х', х') + 2Б/(х/) + с' = 0, G.76) где линейная форма Bf(x.f) и постоянное число с' определяются соот- соотношениями Б'(х') = Л(х', х) + В(х'), G.77) с' = Л(х, х)+2Б(х) + с. G.78) Запишем полученные формулы в координатах. 1) Квадратичная форма А(х, х) связана с симметричной билинейной фор- формой А(х, у), полярной к форме А(х, х). Билинейная форма А(х, у) линейна по аргументам х и у. Фигурирующее в дальнейшем тексте выражение А(хг, х) представляет собой значение формы А(х, у) на векторах х' и х.
§7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 205 Пусть координаты точек х' и х равны соответственно х[, х2,... ..., х'п и х\, Х2 ..., хп. Так как при параллельном переносе базис {ек} не меняется, то квадратичная форма Л(х', х') запишется следующим образом: Л(х', х7) = jr ajkxfjXfk G.79) (отметим, что коэффициенты а^к = A(ej, ek) не меняются, так как не меняются базисные векторы ек). Следовательно, мы можем сделать важный вывод: при параллель- параллельном переносе группа старших членов сохраняет свой вид. Займемся теперь формулами G.77) и G.78). Так как ^(х'> х) = J2 ( Е a>jkxAx'k, Б(х7) = JT bkx'k, к=\ \j=\ ' k=\ п п Л(х, х) = Yl ajkXjXk, В(х) = J2 ькхк, j,k=\ k=\ то формула G.77) примет вид В'(х7) = Е Ь'кх'к = Е [ Е ajk°Xj + bk] xfk, G.80) к=\ k=\lj=\ J а формула G.78) запишется следующим образом: п п -с. G.81) Таким образом, уравнение G.76) в координатах будет иметь следу- следующий вид: п п Е ajkx'jXk + 2 Е ь'кх'к + с7 = 0. G.82) j,k=\ к=\ Нам понадобится несколько иное, чем G.81), выражение для с'. Запишем G.81) в следующей форме: п Г п с' = ZM 5Z азк%з +Ьк\хк+ J2 ькХк + с. G.83) L J Учитывая, что коэффициенты Ь'к выражаются, как это следует из G.80), по формулам «4 = ?>,*?; +6* G-84) мы получим из G.83) нужное нам выражение для с'\ ^ с. G.85)
206 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 4. Преобразование общего уравнения гиперповерхности второ- второго порядка при переходе от ортонормированного базиса к ортонор- мированному. Пусть ортонормированный базис {е/,} преобразуется в новый ортонормированный базис {е^} по формулам G.70) и Р — ор- ортогональная матрица этого преобразования (см. G.71)). Тогда, согласно замечанию в п. 2 этого параграфа, координаты хк и х'к точки в бази- базисах {в/,} и {е^} связаны соотношениями G.75). Подставляя выражение для Xk из G.75) в левую часть уравнения G.66) и учитывая, что вследствие однородности соотношений G.75) группа старших членов и линейная часть уравнения G.66) преобразуются автономно, получим следующее выражение для общего уравнения гиперповерхности вто- второго порядка в координатах х'к точек в преобразованном базисе{е^}: ? а'^хк+2^Ькх'к + с' = 0. G.86) j,k=\ к=\ Согласно отмеченной выше автономности преобразования группы старших членов, справедливы равенства J2 а'зкХ'зХ'к = J2 aJkXjXk, J2 Ъ'кХк = J2 Ь**Хк, С = С. G.87) j,k=\ j,k=\ k=\ k=\ Обращаясь к первой из формул G.87), мы видим, что для опреде- определения коэффициентов а'^к можно воспользоваться правилом преобра- преобразования коэффициентов квадратичной формы при переходе к новому базису. Именно, если обозначим буквой А' матрицу квадратичной формы Л(х, х) в базисе {е^}, то, согласно теореме 7.2 и соотноше- соотношению Р' = Р~\ получим следующую связь между матрицами А и А' формы Л(х, х) в базисах {ек} и {е'к}: А' = Р~ХАР G.88) (напомним, что Р — матрица ортогонального преобразования). Будем рассматривать теперь матрицу А' как матрицу некоторого линейного оператора А в базисе {е^} 0 , а матрицу Р~х как матрицу перехода от базиса {ек} к базису {е^}. Тогда, согласно теореме 5.7 (см. п. 2 §2 гл.5), матрицу А можно рассматривать как матрицу этого линейного оператора А в базисе {ек}. Иными словами, матрица квадратичной формы при преобразова- преобразовании ортонормированного базиса в ортонормированный изменяется как матрица некоторого линейного оператора. Этот вывод мы используем в следующем пункте. Замечание. Отметим, что оператор А, матрица которого в ор- тонормированном базисе совпадает с матрицей квадратичной фор- формы Л(х, х), самосопряженный. х) Согласно теореме 5.5 (см. п. 1 §2 гл.5) любая квадратная матрица из п строк и п столбцов может рассматриваться как матрица некоторого линейного оператора, действующего в n-мерном пространстве.
§7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 207 Для доказательства проведем следующие рассуждения. Пусть Л(х, х) — квадратичная форма и Л(х, у) — симметричная билинейная форма, полярная форме Л(х, х). Согласно теореме 7.8 билинейная форма Л(х, у) может быть представлена в виде Л(х, у) = (Ах, у), где А — самосопряженный оператор. Поэтому квадратичная форма Л(х, х) может быть представлена в виде Л(х, х) = (Ах, х). Докажем, что в ортонормированном базисе {ек} матрицы операто- оператора А и квадратичной формы совпадают. Этим будет доказано утвер- утверждение замечания. Пусть djk — элементы матрицы формы Л(х, х) и ajk — элементы матрицы оператора А в базисе {ек}. Согласно п. 2 § 1 этой главы ajk = = A(ej, е/,), а элементы й^, согласно п. 1 §2 гл.5, формуле E.13), п могут быть найдены из равенств Aej = ^ a>jpep. Р=\ Умножим обе части последнего соотношения скалярно на ек. Тогда, учитывая ортонормированность базиса{е/с}, получим (Ае^-, ек) =Hjk. Так как A(ej, ek) = (Aej, ek), то ajk = ^jk- Утверждение замечания доказано. 5. Инварианты общего уравнения гиперповерхности второго порядка. Назовем инвариантом общего уравнения G.62) (или G.66)) гиперповерхности второго порядка относительно параллельных пе- переносов и преобразований ортогональных базисов в ортогональные такую функцию /(ац, ai2,..., ann, b\, Ъ^, •••, Ьп, с) коэффициентов этого уравнения, значение которой не меняется при указанных преоб- преобразованиях пространства. Докажем следующее утверждение. Теорема 7.11. Инвариантами общего уравнения G.62) (или G.66)) гиперповерхности второго порядка являются коэффициенты характеристического многочлена матрицы А квадратичной формы Л(х, х) и определитель det В матрицы В в соотно- соотношении G.67). В частности, инвариантами являются det Л и след аи + а22 + ••• + сьпп матрицы А. Доказательство. Очевидно, инвариантность перечисленных в условии теоремы величин достаточно доказать отдельно для параллельного переноса и преобразования ортонормированного базиса в ортонормированный. Рассмотрим сначала параллельный перенос. В п.З этого параграфа мы установили, что при этом преобразовании группа старших членов сохраняет свой вид (см. формулу G.79)). Поэтому не меняется матри- матрица А, а следовательно, и характеристический многочлен этой матрицы. Докажем инвариантность det В.
208 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [гл.7 При параллельном переносе G.68) (или G.69)) матрица преобразу- преобразуется в матрицу В', определитель которой, согласно G.82), имеет вид det В' = Ь\ 0>п\ пп ь' Ь'п G.89) где величины Ь'к и с' определяются по формулам G.84) и G.85). Вычтем из элементов последней (п + 1)-й строки определите- определителя G.89) элементы первой строки, умноженные на х\, затем элементы второй строки, умноженные на х% и т.д., и, наконец, элементы п-и строки, умноженные на хп. Так как при таких преобразованиях опреде- определитель не меняется, то, используя G.84) и G.85), получим соотношение det В' = an ь[ ... а\п ••• CLnn ... Ь'п ь[ Ь'п ( П о \ У2Ькхк + с 4=1 / G.90) Вычтем теперь из элементов последнего (п + 1)-го столбца опреде- определителя G.90) элементы первого столбца, умноженные на х\, затем эле- элементы второго столбца, умноженные на Х2, и т.д., и, наконец, элемен- элементы п-го столбца, умноженные на хп. Так как при таких преобразова- преобразованиях определитель не меняется, то, используя соотношение а^ = a&j, вытекающее из симметричности формы Л(х, у), и формулу G.84), мы получим в результате det В. Итак, равенство det В1 = det В доказано. Следовательно, det В инвариантен относительно параллельных пере- переносов. Рассмотрим теперь преобразование ортонормированного базиса в ортонормированный. Во-первых, убедимся, что коэффициенты характеристического мно- многочлена матрицы А квадратичной формы являются инвариантами рас- рассматриваемого преобразования. В предыдущем пункте мы установили, что при переходе к новому ортонормированному базису матрица А изменяется как матрица неко- некоторого линейного оператора. Но в таком случае, как следует из заме- замечания 1 п.З §2 гл.5, коэффициенты характеристического многочлена этой матрицы не меняются при переходе к другому базису. В частности, определитель det А и след an + а^ + ... + апп матри- матрицы А, как коэффициенты характеристического многочлена, являются инвариантами. Нам остается доказать инвариантность определителя det В при преобразовании ортонормированного базиса в ортонормированный. Приступим к этому доказательству. Применим следующий прием. Введем обозначения bk = а&>п+ь к = 1, 2,..., п, с = an_|_i>n_|_i. Тогда уравнение G.66) гиперповерхности
§7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 209 можно записать следующим образом: п+1 Еп т - —Г) (J Q]\ Uj q Д» ьЛ/ q *Xj Д» \J у \ I • \J Л. I j,k=\ где xn+\ = 1. Рассмотрим преобразование переменных х\, X2,..., xn, xn+\ в пе- переменные x[, x'2,..., x'n, x'n+x, при котором первые п переменных пре- преобразуются по формулам G.75), а переменная хп+\ преобразуется по формуле жп+1 = х'п+х. Ясно, что это преобразование переменных можно рассматривать как преобразование координат при преобразовании ортонормированно- го базиса еь е2,..., en, en+i (n + 1)-мерного евклидова пространства, причем матрица Р этого преобразования имеет вид рп ••• Рп\ 0 / р = Легко видеть, что матрица Р удовлетворяет условию Р' = Р 1 и по- поэтому является ортогональной. Но тогда, согласно п. 2 этого параграфа, ортонормированный базис еь е2,..., en, en+i преобразуется с помо- помощью матрицы Р в ортонормированный базис. Выше было выяснено, что при таком преобразовании матрицы В квадратичной формы опре- определитель det В этой матрицы представляет собой инвариант. Теорема доказана. Замечание. Из рассуждений в доказательстве теоремы следует, что инвариантами общего уравнения гиперповерхности второго поряд- порядка будут также величины rang Л и rang Б. 6. Центр гиперповерхности второго порядка. Попытаемся найти такой параллельный перенос, при котором общее уравнение G.76) не содержало бы слагаемого 2В'(х.') (или, если обратиться к уравне- п нию G.82), то слагаемых 2 ^ Ь'кх'к). к=\ Иными словами, будем искать параллельный перенос (т. е. коор- о о о о динаты х\, Х2, ..., хп точки х), при котором обратятся в нуль все коэффициенты Ь'к. Обращаясь к формулам G.84), найдем, что искомые координаты х\, Х2, •••, хп точки х представляют собой решение сле- следующей системы линейных уравнений: bk=0, к= 1, 2, ..., п. G.93) Уравнения G.93) называются уравнениями центра гиперповерхно- гиперповерхности второго порядка, а точка х с координатами (х\, Х2, •••, хп), где (х\, Х2, •••, хп) — решение системы G.93), называется центром этой поверхности.
210 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 Поясним наименование «центр» гиперповерхности. Пусть начало координат помещено в центр х, т. е. произведен искомый параллельный перенос. Тогда уравнение поверхности S примет вид ? а,кх'зх'к + сг = 0. G.94) Пусть точка х с координатами х[, х'2,..., х'п расположена на S. Это означает, что ее координаты удовлетворяют уравнению G.94). Очевид- Очевидно, точка —х с координатами —х[, —х2, ..., —xfn, симметричная точке х о относительно точки х, также расположена на S, ибо ее координаты тоже удовлетворяют уравнению G.94). Таким образом, если у гиперповерхности S есть центр, то относи- относительно центра точки S располагаются симметрично парами. Замечание 1. Если гиперповерхность S второго порядка имеет центр, то инварианты det A, det В и свободный член с' в уравне- уравнении G.94) связаны соотношением det Б = с'det Л. G.95) Действительно, для уравнения G.94) получим аи ... а\п 0 det Б = о>п\ ••• а-пп 0 0 ... 0 с' Из последней формулы и вытекает G.95). Наличие центра у гиперповерхности второго порядка связано с раз- разрешимостью уравнений центра G.93). Если уравнения центра имеют единственное решение, то гипер- гиперповерхность S будем называть центральной. Так как определитель системы G.93) равен det Л, а необходимым и достаточным условием существования единственного решения этой системы является отличие от нуля ее определителя, то мы можем сделать следующий вывод: для того чтобы гиперповерхность S была центральной, необходимо и достаточно, чтобы det А фО. Замечание 2. Если начало координат перенесено в центр цен- центральной гиперповерхности S, то уравнение этой гиперповерхности будет иметь вид Е aJk%jXk + ^j=O. G.96) j,k=\ Действительно, после переноса начала в центр уравнение гиперпо- гиперповерхности примет вид G.94). Так как для центральной гиперповерхно- гиперповерхности det А ф 0, то из формулы G.95) найдем с1 = det В/ det A. Подставляя это выражение для с' в формулу G.94), мы и получим уравнение G.96). 7. Стандартное упрощение любого уравнения гиперповерхно- гиперповерхности второго порядка путем преобразования ортонормированного базиса. По теореме 7.8 существует такой ортонормированный базис,
§7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 2П_ в котором квадратичная форма Л(х, х) записывается в виде суммы квадратов. Обозначим этот базис через {е/,}, а координаты точки х в этом базисе обозначим через х[, х'2,..., х'п. Кроме того, буква- буквами Ль Л2,..., Лп обозначим собственные значения самосопряженного оператора А, матрица которого в ортонормированном базисе совпадает с матрицей квадратичной формы Л(х, х) (см. замечание в п. 4 этого параграфа). Используя теперь выводы теоремы 7.8, запишем квадратичную фор- форму Л(х, х) в координатах (х[, xf2,..., х'п) точки х в базисе следующим образом: Л(х, х) = ? Хкх'к\ G.97) к=\ Итак, перейдем от базиса {е/.} к базису {е^}. Так как формулы преобразования координат точек при таком преобразовании линейны и однородны (см. замечание п. 2 этого параграфа, формулы G.75)), то группа старших членов и линейная часть уравнения гиперповерхно- гиперповерхности S преобразуются автономно. На основании этого и в силу G.97) уравнение гиперповерхности S в базисе {е^} будет иметь следующий '> ^ ^ с = 0. G.98) к=\ к=\ Приведение любого уравнения гиперповерхности S второго порядка к виду G.98) будем называть стандартным упрощением этого урав- уравнения (путем преобразования ортонормированного базиса). 8. Упрощение уравнения центральной гиперповерхности вто- второго порядка. Классификация центральных гиперповерхностей. Выводы, сделанные в предыдущих двух пунктах, позволяют решить вопрос о классификации всех центральных гиперповерхностей второго порядка. Решение этого вопроса мы проведем по следующей схеме. Во-первых, путем переноса начала координат в центр гиперповерх- гиперповерхности G.66) мы приведем ее уравнение к виду G.96). После этого произведем стандартное упрощение уравнения G.96). В результате, очевидно, мы получим, согласно G.98), следующее уравнение цен- центральной поверхности второго порядка: Mxf + X2xf + ... + Xnxf + Ц| = 0, G.99) в котором А/, — собственные числа матрицы А квадратичной фор- формы Л(х, х) в уравнении G.62), а х'1 — координаты точки х в оконча- окончательном ортонормированном базисе {е^}. Отметим, во-первых, что все собственные числа А/,, к = 1, 2, ... ..., п, отличны от нуля. 1) Напомним, что при переходе от ортонормированного базиса к ортонорми- рованному свободный член с в уравнении поверхности S не меняется (см. тре- третью из формул G.87)).
212 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 Действительно, подсчитывая det А для уравнения G.99), получим det А = AiЛ2 ... Ап, а так как для центральной поверхности det А ф О, то очевидно, что все Хк ф 0. Договоримся далее все положительные собственные числа матри- матрицы А нумеровать первыми индексами, а отрицательные — последую- последующими. Таким образом, найдется такой номер р, что Ai > 0, А2 > 0, ..., Хр > 0, Ap+i < 0, Ар+2 < 0, ..., Ап < 0. Введем теперь следующие обозначения: det Б , Л если sgn -—— ф 0, то положим detj J\ det В ак ПРИ к = I, 2,..., р, det Л Лк = —2" при /с = 1, 2, ..., р, G.100) det Л при /г = р + 1,..., п; det В ак det В А если sgn = 0, то положим 6 det Л Хк = — при к = 1, 2,..., р, ^ G.101) Afc = 2" при к = р + 1,..., п. ак Тогда, очевидно, уравнение G.99) может быть переписано следую- следующим образом (при этом мы заменим обозначение координат х'к' на хк): = 0. ai а2 агр ар+х an det Л Уравнение G.102) называется каноническим уравнением централь- центральной гиперповерхности второго порядка. Величины а&, к = 1, 2,..., п, называются полуосями центральной гиперповерхности второго порядка. Они могут быть вычислены по формулам G.100) и G.101). С помощью канонического уравнения G.102) дадим следующую классификацию центральных гиперповерхностей. 1 о det В 1 ^ о 1°. р = п, sgn = — 1. В этом случае гиперповерхность *S назы- F n6 det Л вается (п - Хумерным эллипсоидом. Канонические уравнение такого эллипсоида обычно записывают в виде 2 2 ^ + ... + ^ = 1. G.103) Если ai = а2 = ... = ап = R, то (п — 1)-мерный эллипсоид пред- представляет собой сферу радиуса R в n-мерном пространстве.
§7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 213 Замечание 1. В случае р = О, sgn -—— = 1 мы также получаем (п — 1)-мерный эллипсоид. Очевидно, в этом случае уравнение G.102) может быть записано в виде G.103). оо det В 1 „ 2°. р = п, sgn-—- = 1. 1 иперповерхность является мнимой и на- det A зывается мнимым эллипсоидом. Замечание 2. Очевидно, в случае р = 0, sgn-—- = -1 мы det А также получаем мнимый эллипсоид. 3°. 0 < р < п, sgn -—- ф 0. Центральные гиперповерхности назы- det A ваются в этом случае гиперболоидами. Геометрические характеристики гиперболоида зависят от соотноше- detB ния чисел р и п и значения sgn . det A 4°. sgn -—— = 0. Центральные гиперповерхности называются в этом случае вырожденными. Среди вырожденных гиперповерхностей отметим так называемый вырожденный эллипсоид, отвечающий значениям р = 0 и р = п. 9. Упрощение уравнения нецентральной гиперповерхности вто- второго порядка. Классификация нецентральных гиперповерхностей. Пусть гиперповерхность S, заданная уравнением G.62), не является центральной, т. е. detA = 0. G.104) Произведем стандартное упрощение уравнения G.62). В резуль- результате это уравнение примет вид G.98). Подсчитаем det Л, исполь- используя G.98) (это возможно, так как det Л — инвариант). Получим, учитывая G.104), det Л = AiA2...An = 0. Таким образом, по крайней мере одно собственное значение А& матрицы Л равно нулю. Подчеркнем, что не все собственные значения равны нулю, ибо иначе квадратичная форма Л(х, х) была бы тожде- тождественно равной нулю, мы же предполагаем (см. п. 1 § 1 этой главы), что эта форма ненулевая. Оставим в выражении G.98) лишь те слагаемые в первой сумме, которые отвечают ненулевым собственным значениям, а затем про- произведем такую перенумерацию базисных векторов, чтобы первым р базисным векторам е[,...,е'р отвечали все ненулевые собственные значения Ai, A2,..., Хр (отметим, что р = rang Л). Очевидно, после этого уравнение G.98) может быть переписано следующим образом: ?Afc42 + 2"?Ь'кх'к+2 ? Ь'кх'к + с = 0 G.105) к=\ к=\ к=р+\ (здесь 0 < р < п, Х\ ф 0, ..., Хр ф0; кроме того, мы специально выделили первые р слагаемых второй суммы в уравнении G.98)). Проведем теперь следующие преобразования.
214 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 1°. Для каждого номера к, 1 ^ к ^ р, объединим слагаемые с этим номером из первой и второй суммы в G.105) и затем проделаем следу- следующие преобразования (при этом мы учитываем, что Хк ^ 0): \кх'к + 2Ъ'кх'к = Хк I х'к + 2-^ х'к + -у- I - -*- = V Лк К / Лк Очевидно, после этих преобразований G.105) запишется следую- следующим образом: ь'\2 v4 +2 ? ^4 + c' = 0> G.106) /с=1 где постоянная с' определяется равенством р ,,2 с' = с-^^г- G.107) к=\ Хк Осуществим теперь параллельный перенос по формулам В результате уравнение G.106) перейдет в уравнение р п к=\ к=р+\ причем с' определяется по формуле G.107). 2°. Будем искать теперь такое преобразование ортонормированно- го базиса {е^}, при котором первые р базисных векторов е^,..., е' не меняются, за счет же изменения базисных векторов е'р+х,...,еп попытаемся преобразовать слагаемое 2 ^ ^'кх'к к ВИДУ 2/хж^', где к=Р+\ х1" — п-я координата в новом базисе. Отметим, что при такого вида преобразованиях свободный член с1 не меняется. Заметим, во-первых, что если все коэффициенты Ь'к в G.108) равны нулю, то цель преобразования п. 2° достигнута — слагае- слагаемое 2 ^2 ^'кх'к имеет ВИД 2/хж"', где /i = 0. к=р+\ Итак, будем считать, что по крайней мере один из коэффициен- коэффициента тов Ь'к в сумме ^ ^'кх'к отличен от нуля. Тогда мы можем рассмат- к=Р+\ ривать эту сумму как некоторую линейную форму В" (х), заданную в подпространстве V", которое представляет собой линейную оболочку
§7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 215 векторов вр+1,..., е^. Согласно лемме п. 1 §4 гл.5 эта форма в ука- указанном подпространстве может быть представлена в виде В" (х) = = (h, x), где h — некоторый вектор подпространства V". Если мы теперь в подпространстве V" направим единичный вектор е" по век- вектору h, так что h = /хе", а векторы е^+1, ...,е^_1 выберем так, чтобы система е"+1, ....ej.^ejj была базисом в Vй, то, очевидно, в этом базисе В" (х.) = (h, x) = /i(e", x) = //ж"', поскольку (е", х) = = х'Ц. Таким образом, выбирая в V" базис описанным выше способом, п мы преобразуем ^ ^'кх'к к ВИДУ 1^хп'• к=Р+\ Итак, можно указать такое преобразование базиса е[,..., е'п в ор- тонормированный базис е", ...,е^ (при этом преобразовании векто- векторы е[,...,ер остаются неизменными), что уравнение G.108) примет следующий вид (при этом мы заменим обозначение координат х'{! на Xk)'. Y, \кх\ + 2fixn + с' = 0. G.109) к=\ Отметим, что в уравнении G.109) не исключается случай /i = 0. Уравнение G.109) называется каноническим уравнением нецен- нецентральной гиперповерхности второго порядка. С помощью канонического уравнения G.109) дадим следующую классификацию нецентральных гиперповерхностей. Возможны следу- следующие случаи. 1°. \i ф 0, р = rang Л = га—1. В этом случае последние два слагаемых в уравнении G.109) запи- ( с \ шем в виде 2\ixn + с' = 2/i I хп + ^— ) и сделаем параллельный пере- V / нос по направлению оси хп на величину —c//2/jj. Чтобы не осложнять запись, не будем при этом менять обозначение координат. В результате каноническое уравнение G.109) примет вид Aizf + .-. + An-ia^.! +2цхп =0. G.110) Гиперповерхности второго порядка, каноническое уравнение кото- которых имеет вид G.110), называются параболоидами. 2°. \i = 0, р = rang Л < п. В этом случае каноническое уравнение G.109) перепишется так: Ai^ + ... + Ap^ + с^О. G.111) Очевидно, в подпространстве, являющемся линейной оболочкой векторов e[,...,efp, уравнение G.111) представляет собой канониче- каноническое уравнение центральной поверхности Sf второго порядка. Чтобы получить представление о гиперповерхности S во всем пространстве, нужно в каждой точке поверхности Sf поместить плоскость, парал- параллельную плоскости V" (линейная оболочка векторов е^+1,..., е^). Геометрическое место таких плоскостей образует поверхность S.
216 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ ГЛ. 7 Таким образом, поверхность S представляет собой центральный цилиндр с направляющей поверхностью Sr, определяемой уравне- уравнением G.111), и образующими плоскостями, параллельными плоско- плоскости V". 3°. II ф О, р = rang А < п - 1. Поступая так же, как и в случае 1°, мы приведем каноническое уравнение G.109) к виду \хх\ + ... + Хрх2р + 2цхп = 0. G.112) Очевидно, что в подпространстве, представляющем собой линейную оболочку векторов е[,..., efp,..., е'п, уравнение G.112) определяет па- параболоид S' (см. случай 1°). Чтобы получить представление о строении гиперповерхности S во всем пространстве, нужно в каждой точке S' поместить плоскость, параллельную плоскости V" (линейная оболочка векторов е^+1, ..., efn_\). Геометрическое место таких плоскостей об- образует поверхность S. Таким образом, поверхность S представляет собой параболоидалъ- ный цилиндр с направляющей поверхностью S', определяемой урав- уравнением G.112), и образующими плоскостями, параллельными плоско- плоскости V".
Глава 8 ТЕНЗОРЫ В этой главе рассматриваются важные объекты, называемые тензо- тензорами и характеризующиеся в каждом базисе совокупностью координат, специальным образом преобразующихся при переходе от одного ба- базиса к другому. Тензоры широко используются в геометрии, физике и механике. Понятие тензора возникает при изучении различных ани- анизотропных явлений (например, при изучении распределения скоростей распространения света в кристалле в зависимости от направления его распространения). § 1. Преобразование базисов и координат В данном параграфе, носящем вспомогательный характер, мы рас- рассмотрим законы преобразования координат в произвольном веществен- вещественном евклидовом пространстве Еп. Возникающие при этом наводящие соображения делают более прозрачным понятие тензора, вводимого в следующем параграфе. 1. Определители Грама 0 . В этом пункте мы укажем способ, с помощью которого можно выяснить вопрос о линейной зависимости системы векторов еь е2,..., е& в евклидовом пространстве. Введем для этого так называемый определитель Грама указанной системы векторов. Определителем Грама системы векторов еь е2,..., е/. называется следующий определитель: (ei, ei) (еь е2) ... (еь ек) (е2, ei) (е2, е2) ... (е2, ек) (ек, ei) (ek, е2) ... (ек, ек) (8.1) Справедливо утверждение. Теорема 8.1. Для того чтобы система векторов е\, е2,..., е& евклидова пространства Еп была линейно зависимой, необходимо и достаточно, чтобы определитель Грама (8.1) этой системы был равен нулю. 1) Морген Грам A850-1916) — датский математик.
218 тензоры [гл. 8 Доказательство. 1) Необходимость. Пусть векторы ei, e2,..., ек линейно зависимы. Тогда один из них, например ек, является линейной комбинацией остальных: ек = ol\G\ + ct2e2 + ... + ак-\ек-\. Умножая написанное соотношение скалярно на е^, г = 1, 2,..., к, мы получим, что последняя строка определителя Грама (8.1) является линейной комбинацией первых к — 1 строк. По теореме 1.7 этот опре- определитель равен нулю. Необходимость условия доказана. 2) Достаточность. Предположим, что определитель Грама (8.1) равен нулю. Тогда его столбцы линейно зависимы, т. е. существуют не все равные нулю числа /3\, C2,..., (Зк такие, что для г = 1, 2,..., к выполняются соотношения Переписывая эти соотношения в виде (е^, /3iei +/32e2 + ...+/3/ee/c) =0, i= I, 2, ..., к, убеждаемся, что вектор /3\е\ + C2е2 + ... + (Зкек ортогонален всем векторам ei, в2,..., е^, т.е. ортогонален линейной оболочке L этих векторов. Так как этот вектор принадлежит L, то он равен нулю. Поскольку не все /3i равны нулю, то это означает, что векторы еь е2,... ..., ек линейно зависимы. Теорема доказана. Следствие. Если векторы е\, е2,..., ек линейно независимы, то определитель Грама этих векторов отличен от нуля. Докажем, что в указанном случае определитель Грама поло- положителен. Пусть L — линейная оболочка векторов е\, е2,..., ек. Очевидно, ei, в2,..., ejfe — базис в L. Рассмотрим билинейную сим- симметричную форму Л(х, у), представляющую собой скалярное произ- произведение (х, у): Л(х, у) = (х, у). Соответствующая квадратичная фор- форма Л(х, х) = (х, х) будет, очевидно, знакоопределенной, и поэтому, согласно теореме 7.6 (критерию Сильвестра), определитель det(a^) ее матрицы (a,ij) в базисе ei, e2,..., ек положителен. Но этот определи- определитель и представляет собой определитель Грама (8.1) системы еь е2,... ..., ек, ибо aij = (ei, ej). 2. Взаимные базисы. Ковариантные и контравариантные ко- координаты векторов. Пусть еь в2,..., еп — базис в евклидовом про- пространстве Еп. Базис е1, е2,..., еп называется взаимным для базиса е^, г = 1, 2, ..., п, если выполняются соотношения 1 при< = ,;, 0 при г ф j. при г, j = 1, 2,..., п. Символ 5j называется символом Кронекера. Возникает вопрос о существовании и единственности взаимного базиса. Ответ на этот вопрос утвердительный: для любого данного базиса е1, е2,..., еп существует единственный взаимный базис.
§ 1 ] ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 219 Для доказательства поступим следующим образом. Пусть х\, х°2,... ..., х°п — координаты искомых векторов е-7 в базисе е^: ej =х\ех +афз2 + ... + <еп, j = 1, 2,..., п. (8.3) Умножая скалярно обе части последних равенств на е^, получим, используя (8.2), х3х(е{, ei) + x32(ei, е2) + ... -\-x3n(eif en) = ^, г, j = 1, 2,..., гг. (8.4) Соотношения (8.4) при фиксированном j можно рассматривать как квадратную систему линейных уравнений относительно неизвестных координат ж}, х°у,..., xJn вектора е-7 в базисе е^. Так как определитель системы (8.4) представляет собой определитель Грама базисных векто- векторов ei, е2,..., еп, он, согласно следствию из теоремы 8.1, отличен от нуля, и поэтому система (8.4) имеет единственное решение ж], xJ2,... ..., xJn, которое будет ненулевым, поскольку эта система неоднородная. Затем с помощью соотношений (8.3) строятся векторы е-7, которые, очевидно, удовлетворяют соотношениям (8.2). Мы должны еще убедиться, что векторы е1, е2,..., еп образуют базис. Пусть некоторая линейная комбинация этих векторов равна нулю: с^е1 + а2е2 + ... + апеп = 0. Умножая скалярно последнее равенство последовательно на ei, е2,..., еп и используя (8.2), получим а\ = 0, а2 = 0, ...,ап = = 0. Следовательно, векторы е1, е2,..., еп линейно независимы, т.е. образуют базис. Итак, взаимный базис е-7 для базиса е^ существует и определяется единственным образом. Замечание 1. В силу симметрии соотношений (8.2) относительно е^ и е-7, взаимным базисом для базиса е-7 будет базис е^. Поэтому в дальнейшем мы будем говорить о взаимных базисах е^, е-7. Замечание 2. Если базис ei,e2,...,en ортонормированный, то взаимный базис е-7 совпадает с данным базисом. Действительно, по- полагая в этом случае е-7 = е^-, мы убедимся, что соотношения (8.2) выполняются. Используя свойство единственности взаимного базиса, мы убедимся в справедливости замечания. Пусть е^, е-7 — взаимные базисы, ах — произвольный вектор про- пространства. Разлагая вектор х по базисным векторам е^ и е-7, получим х = а^е1 + Ж2^2 + ... + хпеп, 1 2 „ <8-5) х = х е\ + х е2 + ... + х еп. Координаты (х\, Х2,..., хп) вектора х в базисе е-7 называются ковариантными кооординатами вектора х, а координаты (х\ ж2,... ..., хп) этого вектора в базисе е^, называются контравариантными координатами вектора х. Эти наименования будут разъяснены в сле- следующем пункте.
220 тензоры [гл. 8 Для сокращения записи формул, в которых фигурируют однотип- однотипные слагаемые (примерами таких формул могут служить соотноше- соотношения (8.5)), мы будем пользоваться в дальнейшем соглашением о сум- суммировании. Это соглашение заключается в следующем. Пусть имеется выражение, составленное из сомножителей, которые снабжены конеч- конечным числом индексов, часть из которых нижние, а другая часть — верхние. При этом договариваются все нижние индексы обозначать различными символами. Верхние индексы также договариваются обо- обозначать различными символами. Если в этом выражении встречаются два одинаковых индекса, из которых один верхний, а другой нижний, то считают, что по этим индексам производится суммирование, т. е. индексам последовательно даются значения 1, 2,..., п, а затем скла- складываются полученные слагаемые. Например, X ^ t3 — X \ t3 ~т~ X 2 ^3 "т~ • • • ~т~ X л t3 , О • — 01 ~\ О о ~т~ • • • ~т~ О «~ , gijXlX3 = (g{jXlX3) + (g2jX2X3) + ... + (gnjXnX3) = ...+glnXlXn) + 2X2 + ...+g2nX2Xn) + ... + (g \xnxx -\- g 9Xnx2 + + g xnxn) С помощью соглашения о суммировании формулы (8.5) записыва- записываются следующим компактным образом: Л. «iyjC , Л. iL K^i . y<u .\J J Замечание З. Верхние и нижние одинаковые индексы, о кото- которых говорилось в соглашении о суммировании, обычно называются индексами суммирования. Ясно, что индексы суммирования могут обозначаться любыми одинаковыми символами. При этом не изменятся выражения, в которых они фигурируют. Например, xie1 и Xje3 пред- представляют собой одно и то же выражение. Получим теперь явное вы- выражение для ковариантных и контравариантных координат вектора х. Для этого умножим скалярно первое из равенств (8.6) на е^, а вто- второе — на е3. Учитывая затем соотношения (8.2), найдем Итак, xj = (х, еД х3 = (х, е3). (8.7) С помощью соотношений (8.7) запишем формулы (8.6) в следующем виде: х = (х, е^)е\ х = (х, ег)е^. (8.8) Соотношения (8.8) называются формулами Гиббса 0 . 1) Д. У. Гиббс A839-1903) — американский физик-теоретик.
§ 1 ] ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 22j_ Обратимся еще раз к вопросу о построении взаимных базисов. С помощью формул (8.8) имеем е* = (е\ ej)ej, e{ = (eif ej)ej. (8.9) Введем обозначения р-.. — (р. РЛ Лэ — (pi pj\ (R ]0) С помощью этих обозначений перепишем соотношения (8.9) следу- следующим образом: iii > (8.11) Итак, для построения базиса ег по базису е^ достаточно знать матрицу (glj), а для построения базиса е^ по базису ег достаточно знать матрицу (gij). Докажем, что указанные матрицы взаимно обратны. Отметим, что так как элементы обратной матрицы могут быть вычислены через элементы данной матрицы, то ясно, что с помощью соотношений (8.11) решается вопрос о построении взаимных базисов. Итак, установим, что матрицы (g1^) и (gij) взаимно обратны. Умножая первое из равенств (8.11) скалярно на е&, получим (е\ ек) = gij(ej, ek). Из этого соотношения, учитывая (8.2) и (8.10), найдем 1 при i = к, Таким образом, произведение матриц (glj) и (gij) представляет со- собой единичную матрицу. Следовательно, матрицы (glj) и (gij) взаимно обратны. 3. Преобразования базиса и координат. Пусть е^ и ег — заданные взаимные базисы, а е^ и ег — некоторые новые взаимные базисы, элементы которых мы обозначим штрихованными индексами. Фактиче- Фактически это означает, что мы вводим новый натуральный ряд 1', 2', 3', ... ... и считаем, что индекс г' принимает значения 1', 2/,..., п''. Таким образом, индексы гиг7 независимо принимают различные значения: г= 1, 2,..., п, г" = V, 2',..., пг. Используя введенное в предыдущем пункте соглашение о сумми- суммировании, запишем формулы преобразования базисных векторов. В ре- результате получим: 1) формулы перехода от старого базиса е^ к новому базису е^ и формулы обратного перехода е*/ = «фе*, е* = Ь|'е*/, г = 1, 2,..., п, г = 1', 2',..., п , (8.12) 2) формулы перехода от старого базиса ег к новому ег и формулы обратного перехода e*' = &fe\ е*=?*,е\ г = 1, 2,..., п, г1 = V, 27,..., п'. (8.13)
222 тензоры [гл. 8 Так как преобразования (8.12) (равно как и преобразования (8.13)) взаимно обратны, то матрицы (Ь\,) и (Ь\ ) (равно как и матрицы (Ь\,) и (Ь\ )) взаимно обратны. Докажем, что матрицы (b\,) (b\t) тождественны. Тем самым будет доказана тождественность и матриц (Ь\ ) и (Ь\). Для доказательства умножим скалярно первое из равенств (8.12) на ек, а второе из ра- равенств (8.13) — на е&/. Учитывая соотношения (8.2), получим (е\ ек,) ^.(^, ек.) =%51, =%¦ Из этих соотношений при к = г, к' = г' получим Ь\, = (ее, е<), (8.14) Ь\, = (е„,е*). (8.15) Поскольку правые части соотношений (8.14) и (8.15) равны, то равны и левые части. Иными словами, Ъ\, = Ь\,, а это и означает тождественность матриц (Ь\,) и (Ь\,). Отметим, что элементы Ъ\, мат- матрицы (Ь\,) могут быть вычислены по формулам (8.14). Итак, справедливо следующее утверждение. Для перехода от базиса е^ (или ег) /с базису е^ (или к ег ) доста- достаточно знать лишь матрицу (Ъ\,) перехода от базиса е^ /с базису е^ (матрица (Ь\ ) вычисляется по матрице (b]f)). Приведем полную сводку формул преобразований базисных векторов: еу = b\,ei, ei = b\ei4 e*'=6fe\ <s = bW. (8Л6) Перейдем к выводу формул преобразования координат вектора х при переходе к новому базису. Пусть Х{/ — ковариантные координаты х в базисе е^. Тогда, соглас- согласно (8.7), имеем ху = (х, е^). Подставляя в правую часть этого соотно- соотношения выражение для е^ из формул (8.16), найдем Х{> = (х, b\,Gi) = = 65/(x,ei) = 6l/Xi. Мы приходим к следующему выводу: формулы преобразования ковариантных координат вектора х при переходе к новому базису имеют вид xi,=b\,xi. (8.17) Следовательно, при переходе к новому базису ковариантные ко- координаты вектора х преобразуются с помощью матрицы (Ь\,) пря- прямого перехода от старого базиса к новому. Это согласование преобразований и объясняет наименование кова- ковариантные 0 координаты вектора. Ковариантный — согласованно изменяющийся.
§2] ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 223 Рассмотрим теперь преобразование контравариантных координат вектора х. Подставляя в правую часть соотношения хг = (х, ег ) выражение для ег из формул (8.16), получим после преобразований х1' = Ь]х\ (8.18) Мы видим, что при переходе к новому базису контравариантные координаты вектора х преобразуются с помощью матрицы {Ь\ ) обратного перехода от нового базиса к старому. Это несогласование преобразований и объясняет термин контрава- риантные 0 координаты вектора. § 2. Понятие тензора. Основные операции над тензорами 1. Понятие тензора. В этом параграфе мы рассматриваем произ- произвольное (не обязательно евклидово) вещественное n-мерное линейное пространство Ln. Определение. Тензором А типа (р, q) (р раз ковариантным и q раз контравариантным) называется геометрический объект, который: 1) в каждом базисе е^ линейного пространства Ln определяется пр+9 координатами Агх"\ q (индексы i\,..., ip, k\,..., kq независимо прини- принимают значения 1, 2,..., п); 2) обладает тем свойством, что его коорди- координаты А{)"\,4 в базисе е^ связаны с координатами А^"^я в базисе е^ соотношениями Af'f=^...tfb*..^A*l"*\ (8.19) lx...lp lx lp K[ Kq l\...lp в которых Ъ\, — элементы матрицы (Ь\,) перехода от базиса е^ к бази- базису е^, а ^ - элементы матрицы обратного перехода от е^ к е^. Число г = р + q называется рангом тензора. Замечание 1. Формулы (8.19) называют формулами преобразо- преобразования координат тензора при преобразовании базиса. Отметим, что ковариантные и контравариантные координаты век- вектора преобразуются по формулам (8.19) (при р = 1 и q = 0 в первом случае и при р = 0 и g = 1 во втором, см. п. 3 § 1 этой главы). Поэто- мувектор представляет собой тензор ранга 1 A раз ковариантный либо 1 раз контравариантный — в зависимости от выбора координат этого вектора). Отметим, что рассматривают также тензоры ранга 0. Это тензоры, имеющие лишь одну координату, причем эта координата не снабжена индексами и имеет одно и то же значение во всех системах координат. Тензоры ранга 0 обычно называются инвариантами. Замечание 2. Индексы i\,...,ip называются ковариантными, а к\,..., kq — контравариантными. Наименование объясняется тем, что 1) Контравариантный — противоположно изменяющийся.
224 тензоры [гл. 8 по каждому из упомянутых индексов преобразование координат тензо- тензора производится в полной аналогии с преобразованиями ковариантных и контравариантных координат вектора (см. формулы (8.17) и (8.18)). Для того чтобы определение тензора было корректным, нужно убе- убедиться, что последовательные переходы от базиса е^ к базису е^, а за- затем от базиса е^ к базису е^" приводят к такому же преобразованию координат тензора, что и при непосредственном переходе от е^ к е^/. Пусть (b]f), (b]ff) и (b]ff) — соответственно матрицы перехода от базиса е^ к базису е^, от базиса е^ к е^/ и от базиса е^ к е^. Так как при последовательных переходах матрицы преобразований перемножаются, то очевидны соотношения Ь\„ = Ь]„Ь\,, Ъ\ =b]'b]. (8.20) После сделанных замечаний убедимся в корректности определе- определения тензора. Пусть А^''ля, А{У'\,Я, А{),'"{я — координаты тензора А в базисах е^, е^ и е^/ соответственно. По формулам (8.19), переходя последовательно от е^ к е^, а затем к е^/, получим b" b" •' i' 1 " b" b' b' A% -;« = b]l, ... b Г,bkk\ ... bkk«, Ak)-;«. (8.22) lx ...lp lx lp «j Kq lx ...lp k' k' Подставляя в правую часть (8.22) выражения координат А{У'\,Я из (8.21) и учитывая соотношения (8.20), получим а%-$ = ШЛ... (ь%ь1А (ь^ьЧ)... (bhjbhj) Ak;-f = — hix hiphk" hkq> Ак^-кя — u.f, ... u-f,Ui ... иi s\- • lx lp K\ Kq l\...lp Таким образом, последовательные переходы от базиса е^ к бази- базису е^, а затем к базису е^/ приводят к такому же преобразованию координат тензора, как и при непосредственном переходе от е^ к е^. Корректность определения тензора установлена. Замечание 3. Любая система np+q чисел Л.1'".9 может рас- 1\ ... lp А сматриваться в данном базисе е^ как координаты некоторого тензо- тензора А типа (р, q). Чтобы убедиться в этом, определим в произвольном к' к' базисе е^' с помощью формул (8.19) систему чисел А{У'\,Я, которые будем рассматривать как координаты искомого тензора А в базисе е^. Очевидно, что при переходе от базиса е^ к базису е^ эти координаты преобразуются по формулам (8.19). Как и выше, легко убедиться, что последовательные переходы от базиса е^ к базису е^, а затем к бази- базису е^/ приводят к такому же преобразованию полученных координат, как и при непосредственном переходе от е^ к е^/. Следовательно, си- система чисел действительно представляет собой координаты некоторого тензора А типа (р, q).
§2] ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 225 2. Примеры тензоров. 1°. Нуль-тензор. Среди тензоров типа (р, q) следует выделить так называемый нуль-тензор. Это тензор, координаты которого в любом базисе равны нулю. Очевидно, соотношения (8.19) выполняются. Отметим, что если координаты тензора А равны нулю в каком- либо базисе, то, согласно (8.19), они равны нулю в любом базисе, и, следовательно, А — нуль-тензор. 2°. Символ Кронекера. Убедимся, что тензор А типа A, 1), имею- имеющий в базисе е^ координаты 5%, будет иметь в базисе е^ координа- координаты 5$. Итак, пусть А — тензор, имеющий в данном базисе е^ координа- координаты 6%. Для того чтобы найти координаты этого тензора в базисе е^, надо воспользоваться формулами (8.19), т.е. координаты тензора А в базисе е^ равны b?b\,8^. Используя свойства символа Кронекера, получим Ь%Ь\,5* = bkk Ъ1?, = 5$. Итак, в новом базисе е^ координаты тензора А действительно равны 5$ . Поэтому символ Кронекера можно рассматривать как тензор типа A, 1). 3°. Пусть Л(х, у) — билинейная форма, заданная в конечномер- конечномерном евклидовом пространстве Еп, а еь е2,..., еп — какой-либо базис в этом пространстве. Тогда векторы х и у могут быть представлены в виде х = xlei, у = y^ej. Используя линейное свойство формы Л(х, у) по каждому аргумен- аргументу, мы можем записать Л(х, у) = А(х*еи yjej) = А(е{, ej)xiyj. Обозначим A(eit e^) через а^: aij = A(ei,ej). (8.23) Тогда форма Л(х, у) может быть записана следующим образом: Л(х,у) = а^У- (8.24) Убедимся, что коэффициенты а^ матрицы формы Л(х, у) при пе- переходе к новому базису преобразуются по закону (8.19) преобразо- преобразования координат тензора типа B, 0), т.е. представляют собой тензор типа B, 0). Рассмотрим произвольный базис е^, е2>,..., еп/. Запишем в этом базисе форму Л(х, у) в виде (8.24) Л(х, у) = а^ух1'уг', причем ay? =A(eif,ejf). (8.25) Перейдем от базиса ei, е2,..., еп к новому базису е^, е&,..., еп/. Обозначая матрицу перехода от базиса е^ к базису е^ через Ь],, получим е»/ = Ь|,е», ejf = bjjfej. Подставляя эти выражения для е^ и е^/ в правую часть (8.25) и используя линейное свойство формы Л(х, у) по каждому аргументу, найдем ditjt = А(Ь|,е», bjjfej) = b\,bi,A(ei, e^). 8 Линейная алгебра
226 тензоры [гл. 8 Согласно формуле (8.23) последнее соотношение можно переписать в виде ai'j' = b\,b3,aij. Следовательно, коэффициенты а^- матрицы билинейной формы пре- преобразуются по закону (8.19) преобразования координат тензора ти- типа B, 0), и поэтому могут рассматриваться как координаты тензора такого типа. 4°. Каждому линейному оператору, заданному в конечномерном про- пространстве Еп и действующему в то же пространство, можно поставить в соответствие некоторый тензор типа A, 1), причем этот тензор будет вполне определять указанный оператор. Пусть у = Lx — линейный оператор, заданный в Еп и ei, e2, ... ..., еп — базис в Еп. Так как х = жге^, а у = yJej и L — линейный оператор, то yjej = xiL(ei). (8.26) Разложим вектор L(e^) по базису еь е2,..., еп: Ь(е{) = ajej. Подставляя полученное выражение для L(e^) в (8.26) и используя единственность разложения по базису, получим у* = а{х\ з = 1, 2,..., п. (8.27) Напомним, что соотношения (8.27) можно рассматривать как коорди- координатный способ задания линейного оператора. При этом матрицу (aj) коэффициентов а\ называют матрицей линейного оператора. Убедимся, что коэффициенты этой матрицы при переходе к новому базису преобразуются по закону (8.19) преобразования координат тен- тензора типа A, 1) и поэтому представляют собой тензор типа A, 1). Рассмотрим произвольный базис е^, е^,..., еп/. Запишем в этом базисе линейный оператор L в виде (8.27) уз' = а(,х*', з' = !'> 2',..., п'. (8.28) Перейдем теперь от базиса ei, е2,..., еп к базису е^, е2',..., еп/. Обозначая матрицу перехода (Ь\,) (или, что то же самое, (Ц,)), полу- получим 0 (см. п.З § 1 этой главы) Л _ иг г' j _ U к' х — о{,х , у — ок,у . Подставим эти выражения для хг и yi в (8.27). Получим следующие соотношения: ,, . . . ., ук Ъ\, = а\Ь\,х1 , j = 1, 2,..., п. (8.29) Нам нужно получить из (8.29) выражение для у-7. Для этой цели умножим обе части (8.29) на bJj и просуммируем по j от 1 до п. Учитывая, что Ъ3к,Ь^ = 6Jk,, получим ук 6Jk, = {Ь\,Ь3- а1)х1 . Заметим, В формуле для у-* индекс суммирования мы обозначим через к'.
§2] ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 227 что ук дэк, = у3 . Поэтому у3 = (Ь\,Ь^ а\)х1 . Сравнивая это выражение для у3 с выражением для у3 по формуле (8.28), получим следующее тождество, справедливое для любых векторов х (для любых коорди- координат Х1')\ ., , ., . , а\,х1 = (ЪЩа\)хг . Отсюда и из произвольности хъ следует, что коэффициенты а\ мат- матрицы линейного оператора преобразуются по закону а\, = (Ь\,Ъ3^ aj). Итак, коэффициенты а\ преобразуются по закону (8.19) преобра- преобразования координат тензора типа A, 1) и поэтому представляют такой тензор. 3. Основные операции над тензорами. Основными операциями над тензорами называются операции сложения и вычитания тензо- тензоров, операция умножения тензора на число, операция умножения тензоров, операция свертывания тензоров, операция перестановки индексов, операции симметрирования и альтернирования тензоров. Перейдем к определению этих операций. 1°. Сложение и вычитание тензоров. Операции сложения и вычитания определяются для тензоров одинакового типа. Пусть А и В — два тензора типа (р, q), A^"fq и B^l"fq — одноименные координаты этих тензоров в базисе е^. Суммой А + В (разностью А — В) этих тензоров называется тен- тензор, имеющий в базисе е^ координаты Ak\...kq nk\...kq ( Ak\...kq nki...k A + B [A B Чтобы данное определение операций сложения и вычитания тен- тензоров было корректным, необходимо проверить, преобразуются ли ко- координаты суммы (разности) тензоров по закону (8.19) преобразования координат тензора. Для этого представим себе, что наряду с формула- формулами (8.19) преобразования координат тензора А записаны аналогичные формулы преобразования координат тензора В. Тогда путем сложения (вычитания) таких двух формул преобразования координат тензоров А и В мы убедимся, что координаты суммы (разности) преобразуются по закону преобразования координат тензора. 2°. Умножение тензора на число. Пусть А — тензор ти- типа (р, q), имеющий в базисе е^ координаты Агх"\ q, и а — произвольное вещественное число. Произведением аА тензора А на число а называется тензор, имеющий в базисе е^ координаты аА^"\ q. То, что координаты аА^'"{я преобразуются по тензорному закону, непосредственно следует из формул (8.19). 3°. Умножение тензоров. Операция умножения тензоров опре- определяется для тензоров произвольного типа. Пусть А — тензор типа (р, q), имеющий в данном базисе е^ ко- координаты Л^1";9, а В — тензор типа (г, s), имеющий в этом же
228 тензоры [гл. 8 базисе координаты в™1'"™8. Для определения произведения D = АВ тензоров А и В составляются всевозможные произведения координат тензора А на координаты тензора В. В каждом таком произведении индексы l\,..., lr и 77ii,..., ms У координат тензора В заменяются новыми индексами. Именно, полагают 1\ = гр+ь ..., /г = гр+г и т\ = Произведением D = ЛВ тензоров А и В называется тензор ти- типа (р + г, g + 5), имеющий в базисе е^ координаты j^k\...kqkq-\-\ ...kq-\-s а к\ ...kq jjkq+X ...kq-\-s /q Of\\ i\...ipip+\...ip+r ~ i\...ip ip+\...ip+r ' V • / Чтобы убедиться, что координаты ?)bi...kqkq+i...kq+a определенные •J i l\ ... lp t"p-\-\ ••• 1>Р-\-Г L соотношением (8.30), преобразуются при переходе к другому бази- базису по закону преобразования координат тензора, т. е. действительно представляют собой координаты тензора, достаточно записать формулы преобразования (8.19) для координат Ak.x'"^q и Bkq+["'kq+s тензоров А и В и перемножить правые и левые части этих формул. В результате, обращаясь к соотношению (8.30), легко получить нужные формулы преобразования для координат D-[ ¦ q- q+["- q+s. 11 l ti... tp*p_|_i... *p_|_r Замечание. Операция умножения тензоров не обладает свой- свойством перестановочности: вообще говоря, АВ ф В А. Это объясняется тем, что порядок следования индексов у координат тензора определяет «номер» этой координаты. Таким образом, хотя численные значения выражений дк\...кч jjkq+\...kq+s jjkq+\...kq+s *k\...kq i\...ip ip+\...ip+r ip+\...ip+r i\...ip одинаковы, порядок следования индексов у этих выражений различен, и поэтому они отвечают координатам с различными «номерами». Это и означает, что АВ ф В А. 4°. Свертывание тензора. Операция свертывания применя- применяется к тензору типа (р, q), у которого р ф 0 и q ф 0 (т. е. к тензору, у которого имеется по крайней мере один верхний и один нижний индекс). Пусть А — тензор указанного выше типа. Перейдем к описанию операции свертывания. Свертывание тензора А производится по каким-либо отмеченным верхнему и нижнему индексам. При этом в результате свертывания получается тензор типа (р - 1, q - 1). Пусть, например, у каждой координаты тензора А отмечен верхний индекс с номером т и нижний индекс с номером п: дкх...кгп...кя ni{...in...ip - Произведем суммирование (свертывание) координат тензора с оди- одинаковыми выделенными индексами. Эта операция и дает следующие координаты тензора, полученного свертыванием по верхнему и нижне-
§2] ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 229 му индексам с номерами тип: (в выражении (8.31) мы использовали соглашение о суммировании). Проверим, что величины (8.31) действительно образуют координаты тензора типа (р — 1, q— 1). Для этого обратимся к формулам (8.19). Перепишем эти формулы в следующем виде, выделив интересующие нас индексы (эти индексы мы подчеркнем): *1-1к-*Р ~~ kl'" к™'" кя *{'" Ik'" {'v ii-in-ip ' \ • ) Произведем теперь суммирование в правой и левой частях (8.32) по выделенным индексам к'т и i'n. Для этого достаточно положить эти индексы равными а' и воспользоваться соглашением о суммировании. В результате мы получим некоторое равенство. Найдем выражения в левой и правой частях этого равенства. В левой части мы получим, очевидно, выражение В правой же части произведение Ь% на bl?, равно 51? , т. е. равно единице при кт = гп = а и равно нулю"при кт ф in. Таким образом, в правой части мы получим следующее выражение: к\ кт-[ кт+[ kq ix гтг_1 гп+1 гр г\...а>..лп Сравнив выражения (8.33) и (8.34), мы убедимся, что величи- величины А^'"а'* преобразуются при переходе к новому базису по закону преобразования координат тензора. Очевидно, этот тензор будет ти- типа (р- 1, q- 1). Замечание. Термин «свертывание тензоров» употребляется еще и в следующем смысле. Рассмотрим два тензора А и В, у координат первого из которых имеется по крайней мере один верхний индекс к, а у координат второ- второго — по крайней мере один нижний индекс г. Составим произведение АВ этих тензоров и затем проведем опе- операцию свертывания тензора АВ по верхнему индексу к и нижнему индексу г. Для этой операции обычно употребляется терминология: «свертывание тензоров А и В по индексам к и г». 5°. Перестановка индексов. Эта операция заключается в том, что в любом базисе индексы у каждой координаты тензора подверга- подвергаются одной и той же перестановке. Это означает, что мы иным образом «нумеруем» координаты данного тензора. Читателю предлагается про- проверить, что в результате получается тензор, отличный, вообще говоря, от данного. 6°. Симметрирование и альтернирование. Предваритель- Предварительно введем понятия симметричного и ко со симметрично го тензоров.
230 тензоры [гл. 8 Тензор А с координатами Ai^t-in...ip (8-35) называется симметричным по нижним индексам гш и in, если при перестановке этих индексов 0 координаты тензора А не меняют своего значения, т. е. Лг1..Лгп..Лп..Лр - Лг1..Лп..ЛГГ1..Лр- F.60) Соотношение (8.36) называется условием симметрии тензора А по нижним индексам с номерами тип. Тензор А называется ко со симметричным по нижним индексам гт и in, если при перестановке этих индексов справедливо соотношение жк\...кч _ жк\...кч /о оу\ Лгх..Лгп..Лп..Лр - -/iil...in...irn...ip' F.6/) Соотношение (8.37) называется условием кососимметрии тензора А по нижним индексам с номерами тип. Аналогично вводится понятие симметрии и кососимметрии тензора по двум верхним индексам. Замечание. Если условие симметрии (кососимметрии) по ниж- нижним индексам im и гп выполняется для тензора А в данной системе координат, то оно выполняется и в любой другой системе координат. Перейдем теперь к описанию операции симметрирования. Пусть А — тензор типа (р, q) с координатами (8.35). Переставим у каждой координаты нижние индексы с номерами т и п и затем построим тензор А^тп^ с координатами ±У (8-38) Операция построения тензора А^шп^ называется операцией сим- симметрирования тензора А по нижним индексам с номерами тип. Отметим, что координаты (8.38) тензора Л(т>п) обычно обознача- обозначаются символами 4t Очевидно, для тензора А^тп^ выполняется условие симметрии (8.36) по нижним индексам с номерами тип. Операция симметрирования тензора по верхним индексам с номера- номерами т и п определяется аналогично. Построенный тензор обозначается символом А(т'п\ Для координат тензора дС771'™) используется обозна- обозначение, аналогичное обозначению (8.39) координат тензора А^шпу Операция альтернирования тензора А по нижним индексам с но- номерами тип производится следующим образом. 1) Напомним, что при перестановке индексов у координат тензора, мы по- получаем координаты, вообще говоря, другого тензора.
§3] ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 23j_ У каждой координаты тензора А переставляются нижние индексы с номерами шипи затем строится тензор Л[ш>п] с координатами г -^'"i4 г г У (8-40) ...lp l\ ...ln...lm...lp J \ / Операция построения тензора А[т п] называется операцией аль- альтернирования тензора А по нижним индексам с номерами тип. Координаты (8.40) тензора Л[т>п] обычно обозначаются символами Акх"р . 1 . . (8.41) Очевидно, для тензора А[т п] выполняется условие кососиммет- рии (8.37) по нижним индексам гш и in. Операция альтернирования тензора по верхним индексам im и in определяется аналогично. Построенный тензор обозначается симво- символом А^т'п\ Для координат тензора Д[т'п] используется обозначение, аналогичное обозначению (8.41) координат тензора Л[ш>п]. В заключение отметим очевидное равенство А = А(шп} + А[тпу § 3. Метрический тензор. Основные операции векторной алгебры в тензорных обозначениях 1. Понятие метрического тензора в евклидовом пространстве. В §2 гл. 7 говорилось о том, что скалярное произведение в конечномер- конечномерном линейном пространстве может быть задано с помощью билинейной формы, полярной некоторой положительно определенной квадратичной форме. В этом параграфе мы будем считать, что в рассматриваемом конечномерном евклидовом пространстве Еп скалярное произведение задано такого типа билинейной формой Л(х, у). В п. 2 предыдущего параграфа (пример 3) мы убедились, что коэф- коэффициенты матрицы билинейной формы могут рассматриваться как ко- координаты тензора. Эти коэффициенты для билинейной формы Л(х, у), с помощью которой задается скалярное умножение в Еп, мы обозначим через gij. Таким образом, gij — координаты некоторого тензора G в базисе еь е2,..., еп. Этот тензор типа B,0) называется метри- метрическим тензором пространства Еп. Напомним, что координаты gij тензора G определяются соотношениями gij = A{e{, е,) (8.42) (см. формулу (8.23)). Заметим также, что так как форма Л(х, у) симметрична (Л(х, у) = = А(у, х)), то, согласно (8.42), gij = gji, т.е. метрический тензор G симметричен по нижним индексам i и j. Пусть х и у — произвольные векторы в Еп, хг и у-7 — координаты этих векторов в базисе еь е2,..., еп. Скалярное произведение (х, у) векторов х и у равно Л(х, у). Об- Обращаясь к выражению (8.24) для билинейной формы в данном базисе
232 тензоры [гл. 8 и используя равенство (х, у) = Л(х, у), получим следующую формулу для скалярного произведения (х, у) векторов х и у: (x,y) = gijxiy*. (8.43) В частности, скалярные произведения (е^, е^) базисных векторов е^ и е7- равны g^: (е;,е,)=^ (8.44) (это следует из равенства (е^, е^-) = A(eiy е^) и из формулы (8.42); впрочем, формулу (8.44) легко получить и непосредственно из (8.43)). Рассмотрим теперь, наряду с базисом еь е2,..., еп, взаимный ба- базис е1, е2,..., еп. Пусть х = xie1 и у = у$е? — разложения векторов х и у по векторам взаимного базиса. Тогда для скалярного произведе- произведения (х, у) получим следующую формулу: (х, у) = Л(х, у) = А(х{е\ yjej) = А(е\ ej)xiyj. Обозначая gij = A{e\ ej), (8.45) получим следующее выражение для (х, у): (x,y)=gijxiyj. (8.46) Как и в п. 2 предыдущего параграфа (см. пример 3), легко убе- убедиться, что glj представляют собой координаты тензора типа @, 2), симметричного по индексам г и j. Этот тензор типа @, 2) также называется метрическим тензором пространства Еп. Мы будем обозначать его тем же символом G, что и введенный выше метрический тензор типа B, 0): в следующем пункте мы выяс- выясним, что координаты gij и gli можно рассматривать как ковариантные и контравариантные координаты одного и того же тензора. В дальней- дальнейшем эти координаты gij и gli мы так и будем называть ковариантными и контравариантными координатами тензора G. В конце п. 2 § 1 этой главы, исследуя вопрос о построении взаимных базисов, мы ввели величины gij и gli по формулам (8.10). Сравнивая эти формулы с формулами (8.42) и (8.45), мы приходим к выводу, что эти величины представляют собой ковариантные и контравариантные координаты метрического тензора G. В этом же п. 2 § 1 мы доказали, что матрицы, элементами которых являются координаты gij и gli, взаимно обратные. Это означает, что справедливо соотношение gijgjk = SI (8.47) Таким образом, координаты gli тензора G могут быть построены по координатам gij, и наоборот (для этого надо обратиться к известному способу построения элементов обратной матрицы). 2. Операция поднятия и опускания индексов с помощью метри- метрического тензора. Метрический тензор G используется для операции поднятия и опускания индексов у координат данного тензора А. Эта операция заключается в следующем.
§3] ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 233 Пусть А — тензор типа (р, q) с координатами Аг\ 2"\ q. Для приме- примера покажем, каким образом проводится операция поднятия индекса i\. Свернем тензоры G и А по верхнему индексу j у первого тензора и по нижнему индексу i\ у второго тензора, т.е. построим тензор с координатами g%CLA^"\ q и у координат полученного тензора ин- индекс г обозначим через i\. Затем эти координаты обозначим символа- символами Аъ^к[^2'"кд. уаким образом, Лхкхк2...кя _ ixoi дкхк2...кя (& ЛЯЛ Замечание 1. Так как порядок расположения индексов у ко- координат тензора определяет «нумерацию» его координат, то, вообще говоря, при поднятии индекса нужно отмечать место среди верхних индексов, на которое будет поднят данный нижний индекс. Иногда в ряду нижних индексов нужно отметить место поднимаемого нижнего индекса. Это делается с помощью точки, которая ставится на место поднятого индекса. Поэтому координаты тензора в левой части (8.48) следовало бы записать следующим образом: А1,1^?1"^. К примеру, если первый нижний индекс поднимается на второе место среди верхних индексов, то в результате мы получим тензор Лк\г\ ко...ка • г г ' Замечание 2. Операция опускания индекса с помощью метри- метрического тензора G определяется аналогично. Например, координаты тензора, полученного путем опускания у тензора А индекса kq на последнее место в ряду нижних индексов, имеют следующий вид: Замечание 3. Операцию поднятия или опускания индекса можно применять несколько раз, причем каждый раз по отношению к различ- различным индексам данного тензора. Рассмотрим примеры поднятия и опускания индексов у тензоров. Пусть х — вектор, Х{ и хг — соответственно его ковариантные и контравариантные координаты (напомним, что вектор представляет собой тензор ранга 1). Поднимем у координат Х{ индекс г с помощью метрического тен- тензора G. В результате получим тензор с координатами giaxa. Так как ха = (х, еа), то giaxa = gia{x, еа) = (х, giaea). Согласно (8.11) giaea = ег, а (х, ег) = хг. Поэтому glOLxa = хг. Таким образом, контравариантные координаты хг вектора х можно получить как результат операции поднятия индекса у ковариантных координат Х{ этого вектора. Ковариантные координаты Х{ могут быть получены как результат операции опускания индекса у контравариантных координат хг. Выясним результат двукратного применения операции поднятия индекса у ковариантных координат gij метрического тензора G с по-
234 тензоры [гл. 8 мощью контравариантных координат glJ этого же тензора. Иными словами, выясним, что представляет собой тензор с координатами giagi0ga0- (8.49) Используя симметрию тензора G по нижним индексам и соотно- соотношение (8.47), найдем g3f3gap = gJPgpa = S3a. Подставляя найденное выражение для g3^gap B (8.49) и используя свойства символа Кроне- кера 5Ja, получим Совершенно аналогично можно убедиться в справедливости равенства Последние две формулы еще раз подчеркивают, что gij и gli естественно рассматривать как ковариантные и контравариантные ко- координаты метрического тензора G. 3. Ортонормированные базисы в Еп. Мы уже выяснили, что скалярное произведение (х, у) в Еп может быть задано с помощью метрического тензора G, координаты gij которого представляют собой элементы симметричной положительно определенной матрицы (gij). Именно, согласно (8.43), (х, у) = gijxly3. Известно, что с помощью преобразования базиса матрицу билиней- билинейной формы gijXlyJ можно привести к диагональному виду. При этом, в силу положительной определенности матрицы, после приведения матрицы (gij) к диагональному виду координаты метрического тензора будут равны нулю при г ф j и единице при г = j. Обозначая эти координаты прежним символом gij, получим ¦•-{? ^' (8.50) при г = j. Базис е^, в котором координаты gij метрического тензора удовле- удовлетворяют условию (8.50), является ортонормированным. Действительно, так как (е^, е^) = gij (см. (8.44)), то, согласно (8.50), при г = j, а это и означает, что е^ — ортонормированный базис. В гл. 4 мы выяснили, что в ортонормированном базисе скалярное произведение (х, у) векторов х и у с координатами хг и у3 может быть вычислено по формуле (х, y) = f>y, (8.51)
§3] ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 235 а квадрат длины (х, х) вектора х — по формуле (х, х) = ?И2. (8.52) г=1 Обратимся к так называемым ортогональным линейным преоб- преобразованиям, т. е. к таким линейным преобразованиям, при которых ортонормированный базис переходит в ортонормированный. Иными словами, если L — ортогональное преобразование и е^ — ортонор- ортонормированный базис, то Lei также образует ортонормированный базис. Исследуем действие преобразования L на произвольный вектор х = xlei. Обозначим через X результат действия L на х: Х = Lx. Используя свойство линейности L, найдем X = Lxlei = xl Le^. Так как Le^ — базис, то из последнего соотношения вытекает, что вектор X имеет в базисе Le^ такие же координаты, как и вектор х в базисе е^, т.е. при ортогональном преобразовании сохраняют свое значение координаты вектора. Поскольку Lei — ортонормированный базис, то скалярное про- произведение (X, Y) векторов X = Lx и Y = Ly может быть найдено по формуле (8.51), а квадрат длины (X, X) вектора X = Lx — по формуле (8.52). Мы выяснили, что при ортогональных преобразованиях сохраняют свое значение координаты векторов. Отсюда и из соотноше- соотношений (8.51) и (8.52) получаем (X, Y) = (х, у), (X, X) = (х, х). Таким образом, при ортогональных преобразованиях не меняют- меняются длины векторов и их скалярные произведения. Как известно, ортогональные преобразования L могут быть заданы с помощью ортогональной матрицы. Определитель det L такой матрицы удовлетворяет условию det L = ±1. Выберем один из ортонормированных базисов и договоримся называть этот базис правым. В этом случае будем говорить, что евклидово пространство Еп ориентировано. Все базисы в Еп, получа- получающиеся из данного ортогональными преобразованиями с определите- определителем, равным +1, назовем правыми, а все базисы, которые получаются из данного ортогональными преобразованиями с определителем, равным — 1, — левыми. Легко убедиться, что преобразование правого базиса в правый характеризуется равенством +1 определителя преоб- преобразования, а левого в левый — равенством —1 этого определителя. Обозначим через О(п) — множество всех ортогональных пре- преобразований в Еп, а через О+(п) — множество ортогональных преобразований правых базисов. Эти множества будут рассмотрены в следующей главе. Замечание. В дальнейшем мы будем называть произвольный базис ei, e2,..., еп правым (левым), если определитель матрицы пе-
236 тензоры [гл. 8 рехода от выбранного правого ортонормированного базиса к бази- базису еь е2,..., еп положителен (отрицателен). 4. Дискриминантный тензор. Рассмотрим так называемый вполне ко со симметрический тензор e^...^ типа (р, 0), т.е. такой тензор, который кососимметричен по любым двум нижним индексам. Для того чтобы этот тензор не был нулевым, необходимо, чтобы число р не превышало п, т. е. удовлетворяло условию р ^ п, ибо, если р > п, то любая координата будет иметь по меньшей мере два одинако- одинаковых индекса, при перестановке которых эта координата одновременно должна и изменить знак, и остаться неизменной. Это может быть лишь в том случае, когда указанная координата равна нулю. Следовательно, при р > п любая координата тензора равна нулю, т. е. тензор является нулевым. Особый интерес представляет вполне кососимметрический тензор, ранг р которого равен размерности п пространства. Любая координата е^...^ такого тензора может быть найдена по формуле {0, если среди индексов i\, i^,..., гп хотя бы два совпадают, (8.53) (—l)slen<Te\2...п, если все индексы различны. В формуле (8.53) signer равно 0 или +1 в зависимости от четности или нечетности перестановки <т = (гь гг,..., гп) (signer называют так- также знаком этой перестановки). Рассмотрим какую-либо правую ортонормированную систему коор- координат и положим в ней ?12...п = 1- (8-54) С помощью соотношения (8.53) в данной системе координат опреде- определяются все координаты Sixi2_in вполне кососимметрического тензора, а следовательно и сам тензор, который в дальнейшем мы будем назы- называть дискриминантным тензором. Координаты этого тензора в про- произвольном базисе ei, е2,..., еп обозначим через с^^...^- Обозначим символом В матрицу перехода от выбранного правого ортонормированного базиса к некоторому базису е^, еу,..., еп/, а че- через Ъ\, — элементы этой матрицы. Согласно (8.53) для вычисления координат с^/...^ дискриминант- ного тензора в базисе е^, еу,..., еп/ достаточно знать значение коор- координаты Ci/2'...n'- Используя формулу (8.19) преобразования координат тензора и соотношение (8.54), получим, переходя от выбранного ортонормиро- ортонормированного базиса к базису е^, еу,..., еп/, = detFj,) =detB. (8.55)
§3] ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 237 Пусть gi>j> — координаты метрического тензора в базисе е^, е2/, ... ..., еп/. Так как матрица G = (gVj') есть матрица билинейной фор- формы gifjfxl'yjf, представляющей собой скалярное произведение векто- векторов х и у с координатами хг и у-7, то при переходе от данного ортонор- мированного базиса (в котором матрица Е рассматриваемой билиней- билинейной формы является единичной) к базису е^, е2/, ..., еп/ справедлива формула G = В'ЕВ. Отсюда следует, что det G = det Bf det E'det В = 2 Обозначая det G через g, получим из последнего соотношения detJB = ±y/g:. Обращаясь к соотношениям (8.55), мы получим, что ci'2'...n' = ^yfg • Таким образом, в произвольном базисе еь е2,..., еп выражение для координаты с\2...п дискриминантного тензора имеет вид ci2...n = ±y/g, (8-56) где g — определитель матрицы (gij) метрического тензора в бази- базисе еь е2,..., еп. Отметим, что в формуле (8.56) знак плюс соответствует правому базису, а знак минус — левому. 5. Ориентированный объем. Введем в ориентированном евклидо- евклидовом пространстве Еп так называемую аффинную систему координат, определив ее как совокупность фиксированной точки О с координа- координатами @, 0,..., 0) и базиса еь е2,..., еп. Координаты любой точки М в Еп определяются в этом случае как координаты в базисе ei, е2,... ..., еп вектора ОМ. Рассмотрим в Еп занумерованную систему из п векторов х, х, ..., х (8.57) и рассмотрим всевозможные векторы ОМ, определяемые соотноше- соотношениями j 2 ОМ = c^ix + а2х + ... + апх, (8.58) при всевозможных а,{, удовлетворяющих неравенствам 0 ^ ol{ ^ 1, i= 1, 2,..., п. Множество всех точек М пространства Еп, определяемое соотно- соотношениями (8.58), образует так называемый п-мерный параллелепипед в Еп, натянутый на векторы (8.57). Ориентированным объемом V (х, х,..., х) этого параллелепипеда называется число V(x, x,...,x) = cili2...iniilli2...S^. (8.59) При этом Cixi2_in — координаты дискриминантного тензора в бази- 1 • 2 • ri- • rice еь е2,..., еп, а хп, х12,..., х1п — контравариантные координаты 1 2 п векторов х, х,..., х в этом же базисе. Термин «ориентированный объем» объясняется тем, что в случае, если векторы (8.57) образуют правый базис, ориентированный объем положителен (V > 0), а в случае левого базиса — отрицателен (V < 0).
238 тензоры [гл. 8 Отметим, что при п = 3 ориентированный объем, вычисляемый для п = 3 по формуле (8.59), представляет собой обычный объем парал- 12 3 лелепипеда, натянутого на векторы х, х, х, взятый со знаком +, если 12 3 тройка х, х, х правая, и со знаком —, если эта тройка левая. 6. Векторное произведение. С помощью дискриминантного тензо- тензора можно записать в трехмерном пространстве Е3 в тензорном виде векторное произведение. Такая запись широко используется при раз- различных вычислениях в так называемых криволинейных координатах. Пусть Cijk — координаты дискриминантного тензора в данном базисе еь е2, е3 пространства Е3. Поднимем у этого тензора пер- первый индекс г с помощью метрического тензора glm, т. е. рассмотрим тензор cljk. Тогда координаты zl вектора z= [xy] (т.е. векторного произведения векторов х и у) в базисе еь е2, ез имеют вид г* = с)кх*ук. (8.60) Так как cljkxjyk представляет собой тензор типа @, 1), то zl можно рассматривать как контравариантные координаты вектора. Поэтому, чтобы убедиться, что zl действительно представляют собой координаты векторного произведения, достаточно обратиться к какой-либо опреде- определенной системе координат и непосредственно провести проверку. Эта проверка элементарна для ортонормированного базиса и предоставля- предоставляется читателю. Соотношение (8.60) может служить основой для введения вектор- векторного произведения п — 1 вектора в Еп. Пусть х, х,..., х — какие-либо п — 1 вектор в Еп. Определим • Г1 2 п-и координаты z векторного произведения z = [хх... х J с помощью соотношений ^1 В соотношениях (8.61) c\li2_in — координаты дискриминантного 1 • 2 • п~1 тензора с поднятым первым индексом, а хч, х12,..., xlri-x — контрава- 1 2 п-\ риантные координаты векторов х, х,..., х . 7. Двойное векторное произведение. Из векторной алгебры известна следующая формула для двойного векторного произведе- произведения [a[bd]] векторов a, b и d [a[bd]] = b(ad) - d(ab). (8.62) Используя соотношение (8.60) и формулу (8.43) для скалярного произ- произведения векторов, перепишем (8.62) следующим образом: 4,ofc<4nbmd" = 6W*d' - fgMakbl. (8.63) С помощью (8.63) мы получим формулу, связывающую тензоры сгк1 и gik, которую в свою очередь используем для записи координат двойного векторного произведения.
§4] МЕТРИЧЕСКИЙ ТЕНЗОР 239 Проведем следующие преобразования в формуле (8.63). В первом слагаемом blgkiakdl в правой части (8.63) заменим Ьг на Ьт5гш О и индекс суммирования / заменим на п. Во втором слагаемом в правой части (8.63) положим dl = dn5ln и индекс суммирования / заменим на т. После этих преобразований формула (8.63) примет вид D,Оа*6™<Г = (gkn6%m - gfcro^)afc6mrf". (8.64) Так как соотношение (8.64) справедливо для любых векторов a, b и d, то оно представляет собой тождество относительно ко- координат ак, Ьт и dn этих векторов, и поэтому для любых индек- индексов г, к, т, п имеет место равенство 4/Cmn = gknStn - gkmSn- (8-65) Обозначим через zl координаты двойного векторного произведе- произведения [a[bd]]. Тогда, согласно (8.63), zl = с1к1с1кгпакbmdn. Отсюда и из (8.65) получаем следующее выражение для координат z1 двойного векторного произведения [a[bd]]: zl = (gknSU - gkmSln)akbmdn. (8.66) Формула (8.66) удобна для различных приложений. § 4. Метрический тензор псевдоевклидова пространства 1. Понятие псевдоевклидова пространства и метрического тен- тензора псевдоевклидова пространства. Рассмотрим n-мерное линейное пространство L, в котором задана невырожденная симметричная били- билинейная форма Л(х, у), полярная знакопеременной квадратичной форме. Будем называть скалярным произведением (х, у) векторов х и у значение Л(х, у) билинейной формы. Наименование «скалярное произ- произведение» условно, поскольку в рассматриваемом случае не выполняется четвертая аксиома скалярного произведения. Именно, в случае, когда билинейная форма Л(х, у) полярна знакопеременной квадратичной форме, выражение Л(х, х) в зависимости от выбора х может иметь как положительное, так и отрицательное значение и обращаться в нуль для ненулевых векторов х. Все же мы будем пользоваться термином «скалярное произведение», так как это общепринято. Сформулируем определение псевдоевклидова пространства. Определение. Псевдоевклидовым пространством называется n-мерное линейное пространство L, в котором задано скалярное произведение посредством невырожденной симметричной билинейной формы Л(х, у), полярной знакопеременной квадратичной форме. Число п называется размерностью псевдоевклидова пространства. Выделим в линейном пространстве L базис еь в2,..., еп и обо- обозначим через (gij) матрицу билинейной формы Л(х, у) в этом базисе *) Соотношение Ьг = Ьт5ггп следует из свойств символа Кронекера.
240 тензоры [гл. 8 (напомним, что gij = Л(е^, Gj)). Если хг и yi — контравариантные координаты векторов х и у, то Л(х, y) = gijxiyj. (8.67) В полной аналогии с рассуждениями п. 2 §2 этой главы доказыва- доказывается, что gij представляют собой координаты тензора G типа B, 0). Этот тензор мы будем в дальнейшем называть метрическим тензором псевдоевклидова пространства. Так как скалярное произведение (х, у) равно Л(х, у), то, соглас- согласно (8.67), имеем: (х, у) = gijXlyK Известно, что матрицу (gij) билинейной формы Л(х, у) можно привести к диагональному виду. При этом в силу невырожденности формы Л(х, у) координаты gij метрического тензора после приведения к диагональному виду будут равны нулю при г ф j и единице или ми- минус единице при г = j. Число р положительных и число q отрицатель- отрицательных диагональных элементов не зависит от способа приведения к диа- диагональному виду, причем, в силу невырожденности формы Л(х, у), р + q = п. Приведенные рассуждения поясняют обозначение Е? ч для n-мерного псевдоевклидова пространства. Естественно поставить вопрос об измерении длин векторов в псев- псевдоевклидовом пространстве. В евклидовом пространстве с метрическим тензором gij квадрат длины вектора х с координатами хг считается равным gijxlx^. Если определить квадрат длины s2(x) вектора х с помощью соотношения s2(x) =gijxixj, (8.68) то, очевидно (поскольку форма Л(х, х) знакопеременная), можно ука- указать ненулевые векторы с положительным квадратом длины, с отри- отрицательным квадратом длины и с нулевым квадратом длины. Поэтому, чтобы получить в качестве меры длины векторов лишь действительные числа, обычно за длину вектора принимают a(x) = (sgns2(x))y/|s2(x)|. (8.69) В дальнейшем мы будем использовать следующую терминологию, заимствованную из специальной теории относительности: мы будем на- называть ненулевой вектор х времениподобным, если для этого вектора сг(х) > 0, пространственноподобным, если сг(х) < 0, и изотропным, если сг(х) = 0. Справедливо следующее утверждение. Множество концов всех времениподобных (пространственнопо- добных, изотропных) векторов, начала которых совпадают с про- произвольной фиксированной точкой М псевдоевклидова простран- пространства, образует конус. Для определенности докажем утверждение, рассматривая време- ниподобные векторы. Очевидно, достаточно доказать, что если х —
§4] МЕТРИЧЕСКИЙ ТЕНЗОР 24j_ времениподобный вектор, то при любом вещественном А ф 0 вектор Лх также времениподобен. Так как координаты вектора Лх равны Ажг, то, согласно (8.68), 52(Лх) = Л252(х), т.е. sgns2(Ax) = sgn s2 (x). Отсюда и из (8.69) сле- следует, что вектор Лх будет времениподобным. Для случая времениподобных векторов утверждение доказано. Рас- Рассуждая аналогично, убедимся в справедливости утверждения для слу- случая пространственноподобных и изотропных векторов. Конус времениподобных векторов обозначается часто символом Т (от англ. time — время), а конус пространственноподобных векторов — символом S (от англ. space — пространство). 2. Галилеевы координаты. Преобразования Лоренца 0. В тео- теории псевдоевклидовых пространств важную роль играют те системы координат, в которых квадрат интервала (так обычно называют квад- квадрат длины вектора s2(x)) имеет вид - ± И2. (8.70) г=1 г=р+1 По терминологии, заимствованной из физики, такие системы коор- координат называются галилеевыми. Преобразования координат, которые сохраняют для s2(x) выраже- выражение (8.70), называются преобразованиями Лоренца. В следующем пункте мы рассмотрим вопрос о преобразованиях Ло- Лоренца пространства Е\ 3ч, называемого пространством Минковско- го 2). Это пространство представляет особый интерес для физики, ибо является пространством событий специальной теории относительности. Отметим, что обычно в пространстве Минковского нумерация ко- координат вектора начинается с нуля. Таким образом, согласно (8.70), квадрат s2(x) интервала в пространстве Е\ ^ записывается следую- следующим образом: ,2(х) = (ж°J-(^J-(^J-И2- (8-71) Для удобства в физике координата ж0 отождествляется с выраже- выражением ct, где с — скорость света, a t — временная переменная; ж1, ж2, х3 называются пространственными переменными. В пространстве Минковского конус Т времениподобных векторов распадается на две различные связные открытые компоненты Т+ (ко- (конус будущего) и Т~ (конус прошлого); конус S пространственно по- подобных векторов образует связное множество. Поясним структуру связных компонент Т+ и Т~. Для этого обра- обратимся к физической интерпретации вектора х с координатами хг, г = 0, 1, 2, 3, в пространстве Е^х ^\ этот вектор характеризуется ве- величиной At = х°/с и вектором 'г = {ж1, х2, ж3}. Таким образом, *) Гендрик-Антон Лоренц A853-1928) — нидерландский математик. ) Герман Минковский A864-1909) — немецкий математик и физик.
242 тензоры [гл. 8 рассматривая х как перемещение в Е^х Зч, можно считать, что это перемещение характеризуется временным At и пространственным А г перемещениями. Времениподобные векторы х определяются условием s2(x) > О (или <т(х) > 0). В этом случае, очевидно, |Дг|/|Д ?| < с. Если при этом Д t > 0, то для перемещения х получим неравенство 0 < |Дг|/|Д?| < < с. Такое перемещение х принадлежит по определению Т+ и может рассматриваться как перемещение материальной частицы «в будущее». Если Д t < 0, то перемещение х принадлежит Т~ и может рассматри- рассматриваться как перемещение частицы «в прошлое» (в физике так интерпре- интерпретируется движение античастиц). Очевидно, Т+ и Т~ представляют собой две связные открытые компоненты конуса Т. Проведенные рассуждения поясняют их наиме- наименования — конус будущего и конус прошлого. 3. Преобразования Лоренца пространства El Зу Рассмотрим в псевдоевклидовом пространстве Ei 3) галилееву систему координат с базисом е^. В такой системе координат квадрат интервала s2(x) имеет вид (8.71), а матрица (gij) метрического тензора имеет вид A0 0 0 \ 0-1001 /Q 7Оч 0 0-10- (872) 0 0 0-1/ Перейдем к новой галилеевой системе координат с базисом е^ и выясним условия, которым должны удовлетворять коэффициенты Ъ\, матрицы В преобразования базисных векторов. Так как е* = Ь),е{ (8.73) и так как матрица (gVj') метрического тензора в базисе е^ также имеет вид (8.72), то, используя формулы gVj' = K'^j'Sij преобразо- преобразования координат метрического тензора, получим следующую систему уравнений для определения коэффициентов Ъ\, матрицы В преобразо- преобразования базисных векторов (см. (8.73); при этом индексы гиг7 пробегают значения 0, 1, 2, 3 (см. (8.71)): 3 3 \bof) - z^ bofbof — !' °o'°pf - Z^ bofbpf = u> VV - Ь b'b' { о при i ф Соотношения (8.74) можно записать в матричной форме. Для этой цели рассмотрим наряду с матрицей В матрицу В*, которая получается из В путем изменения знака у элементов последних трех столбцов и последующего транспонирования. Очевидно, что соотношения (8.74) можно записать в следующей форме: B*B = J, (8.75)
§4] МЕТРИЧЕСКИЙ ТЕНЗОР 243 где матрица J определяется соотношением (8.72) (для сравнения на- напомним, что матрица С ортогональных преобразований евклидова про- пространства удовлетворяет соотношению С'С = /, где / — единичная матрица). Так как det Б* = - det Б, a det J = — 1, то из соотношения (8.75) следует, что det Б*Б = det Б* det Б = -(det БJ = -1, т. е. det? = ±l. (8.76) Обозначим через L совокупность всех общих преобразований Лоренца пространства Минковского. Из этих общих преобразований выделим те преобразования, которые переводят каждый вектор из Т+ в вектор, также принадлежащий Т+. Совокупность таких преоб- преобразований обычно называется преобразованиями Лоренца простран- пространства Е\ 3л и обозначается символом L^. Общие преобразования Лоренца, для которых det Б = +1, образуют класс L+ так называемых собственных преобразований Лоренца. Класс L_ несобственных преобразований Лоренца характеризу- характеризуется соотношением det Б = — 1. Примером такого преобразования мо- может служить отражение относительно трех пространственных осей: 1 / 19' 9 V Я х = —х, х = — х , х = —х. Пусть Б — матрица произвольного несобственного преобразова- преобразования Лоренца, а Р — матрица только что рассмотренного отражения. Очевидно, произведение произвольного несобственного преобразова- преобразования и рассмотренного отражения будет собственным преобразованием с матрицей В' = РВ. Так как Р2 = Р - Р = /, где / — единичная матрица, то В = Р2В = Р(РВ) = РВ'. Таким образом, всякое несобственное преобразование Лоренца является произведением некоторого собственного преобразования с матрицей В' и отражения с матрицей Р. Пересечение множеств L^ и L+ обозначают символом L$. Некоторые групповые свойства множеств L, L^, L+ и L$ будут рассмотрены в следующей главе. В заключение найдем те преобразования L$, которые не меняют координат х2 и ж3. Ясно, что это будут преобразования L$ двумерного псевдоевклидова подпространства с координатами ж0 и ж1, в котором квадрат интервала вычисляется по формуле (ж0J — (ж1J. Запишем для рассматриваемого случая формулы (8.74). Получим .77) Полагая Ь^,/Ь^, = /3, найдем из (8.77) следующие выражения для коэффициентов Ъ\, матрицы преобразования Б базисных векто-
244 тензоры [гл. 8 ров eg, ei, е2, ез в базисные векторы ео>, е^, еу, ез/: h° — 4- 1 hx — 4- & h° — 4- ^ Л1 - 4- 1 On/— it— , On/— it— , Ow— it— , Ow— it /i /32 /i /32 / 2 i /32 /i /32 В этих формулах знак выбирается из условия принадлежности преобразования Лоренца классу L$. He вникая в детали вычислений, запишем окончательные формулы преобразования координат: 0' 4^ ' ^?? *\ *'\ (8.78) Положим в соотношениях (8.78) х° = с?, хх = х, х2 = у, ж3 = z, ж0' = ct', хх' = ж', ж2' = у', х3' = z'. Тогда формулы (8.78) перепишутся следующим образом: Выясним теперь физический смысл константы /3. Допустим, что точка Р неподвижна в системе координат (tf, xf, yf, z'). Это озна- означает, что время t' меняется, а пространственные координаты х', у', z' этой точки постоянны. Исследуем вопрос о поведении точки Р относи- относительно системы (t, х, у, z). Дифференцируя последние три уравнения (8.79) и учитывая, что dx' = dy' = dz' = 0, получим 0 = J?-, О = dy, 0 = dz. Поэтому dx/dt = /Зс, dy/dt = 0, dz/dt = оУ1 ~ ^ Следовательно, всякая точка Р, неподвижная в системе коорди- координат (tf, x', yf, zf) (а следовательно, и вся эта система координат), движется относительно системы (t, x, у, z) с постоянной скоро- скоростью v = /Зс в направлении оси Ох. Итак, C = v/c, где v — скорость движения системы (tf, х', у', z') относительно системы (х, у, z, t). Отметим, что так как 0 < v < с, то 0< C < 1. Перепишем теперь следующим образом формулы (8.79): t'= *-W<?)x , х'= ~vt + x , у> = у> z' = z. (8.80) V1 - («Vc2) VI - (v2/c?) Формулы (8.80) представляют собой формулы перехода от инерциальной системы (t, x, у, z) к другой инерциальной систе- системе (tf, xf, yf, z'). Эти формулы называются формулами Лоренца. § 5. Тензор момента инерции Рассмотрим твердое тело, закрепленное в точке О. Пусть г = = ОМ — радиус-вектор точки М этого тела, v — скорость точки М. Как известно, момент импульса N определяется соотношением N = [rv] dm, где V — объем тела, dm = pdV (p — плотность тела). v
§5] ТЕНЗОР МОМЕНТА ИНЕРЦИИ 245 Обозначая через Nz контравариантные координаты вектора N и ис- используя формулу (8.60) для векторного произведения, получим = fc^rVdm (8.81) V (напомним, что сгк1 = glscski, где cski — координаты дискриминантного тензора в данном базисе пространства Е3, см. п. 6 §3 этой главы). По теореме Эйлера существует мгновенная ось вращения тела. Обозначая через со вектор мгновенной угловой скорости, получим v = [сот]. Снова обращаясь к формуле (8.60) для векторного произве- произведения, найдем , , vl = clpnuprn. (8.82) Подставляя найденное выражение vl в правую часть (8.81) и учи- учитывая независимость сир от переменных интегрирования, получим сле- следующее выражение для N1: 'dm = copJlv. (8.83) v v Тензор 4 = \cilCpnrkrndm, (8.84) v фигурирующий в правой части соотношений (8.83), называется тензо- тензором момента инерции. Преобразуем выражение (8.84) для тензора момента инерции. Для этой цели обратимся к формуле (8.65), По этой формуле имеем ciicPn = gknSp ~ gkpK- Поэтому 4 = \ (gknSt - gkpS'Jr^ dm. (8.85) 4 = \ (gknSP v Если в выражении (8.85) опустить индекс г с помощью метрическо- метрического тензора, то в результате получим часто используемую формулу для координат дважды ковариантного тензора момента инерции: r2gip-nrp)dm. (8.86) v Тензор момента инерции широко используется в механике твердого тела. Для примера запишем с помощью этого тензора выражение для кинетической энергии Т. Имеем Т = - \ v2 dm = - gijVlvj dm. v v Но поскольку vl = cpn(juprn, выражение для Т примет вид Т — * f cr-r1 ri ( )prnt jkrl dm — * (,ip(.ik I a- r1 r^ rnrl dm 2 J 3 pn kl ~ 2 J 3 pn kl V V Отсюда, согласно (8.84), найдем Т = -upujkJvk.
Глава 9 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП В этой главе будут изложены основные понятия теории групп и ука- указаны некоторые приложения этой теории. Важность теории групп определяется многочисленными ее прило- приложениями в физике. § 1. Понятие группы. Основные свойства групп 1. Законы композиции. Будем говорить, что в множестве А опре- определен закон композиции, если задано отображение Т упорядоченных пар элементов из Л в множество А. При этом элемент с из А, по- поставленный с помощью отображения Т в соответствие элементам a, b из А, называется композицией этих элементов. Композиция с элементов а и b обозначается символом аТЬ: с = аТЬ. Для композиции элементов a, b множества А используются и дру- другие формы записи. Наиболее употребительными являются аддитивная форма записи с = а + b и мультипликативная форма записи с = ab. В случае аддитивной формы записи композиции соответствующий закон композиции обычно называется сложением, а при мультиплика- мультипликативной форме — умножением. Закон композиции называется ассоциа- ассоциативным, если для любых элементов а, Ь, с множества А выполняется соотношение аТ(ЬТс) = (аТЬ)Тс. Закон композиции называется коммутативным, если для любой пары a, b e А выполняется соотношение аТЬ = ЬТа. Элемент е множества А называется нейтральным относительно закона Т, если для любого элемента а множества А выполняется соотношение аТе = а. Примерами законов композиции могут служить обычные сложение и умножение в множестве вещественных чисел. Оба эти закона ком- коммутативны. Нейтральным элементом для сложения является нуль, для умножения — единица. 2. Понятие группы. Некоторые свойства групп. Сформулируем следующее определение. Определение 1. Множество А, в котором определен закон компо- композиции Т, называется группой G, если этот закон ассоциативен, суще-
§ 1 ] ОСНОВНЫЕ СВОЙСТВА ГРУПП 247 ствует нейтральный элемент е относительно закона Т и для каждого элемента а множества А существует обратный элемент а~\ т.е. такой элемент, для которого аТа~{ = е. Если использовать мультипликативную форму записи композиции элементов, то определению 1 можно придать следующую форму. Определение 2. Множество А элементов а, Ь, с,..., в котором определен закон композиции, называемый умножением и ставящий в соответствие каждой паре элементов a, b множества А определенный элемент с = ab этого множества, называется группой G, если этот закон удовлетворяет следующим требованиям: 1°. a(bc) = (ab)c (ассоциативность). 2°. Существует элемент е множества А такой, что для любого элемента а этого множества ае = а (существование нейтрального эле- элемента). 3°. Для любого элемента а множества А существует обратный элемент а~х такой, что аа~х = е. Обычно нейтральный элемент е называется единицей группы G. Если закон композиции Т, действующий в группе G, является коммутативным, то группа G называется коммутативной или абеле- вой. Для абелевых групп часто используется аддитивная форма записи композиции элементов. В этом случае нейтральный элемент абелевой группы называется нулем. Рассмотрим примеры групп. 1) Множество Z целых чисел образует абелеву группу относи- относительно сложения. Действительно, операция сложения целых чисел представляет собой, очевидно, закон композиции. Ясно, что этот за- закон ассоциативен и коммутативен. Нейтральным элементом (нулем) является целое число нуль. Обратным элементом для целого числа а служит целое число —а. 2) Множество положительных вещественных чисел образует абеле- абелеву группу относительно умножения. Эта операция представляет собой закон композиции. Очевидно, что этот закон ассоциативен и коммутативен. Нейтральным элементом является вещественное число еди- единица. Обратным элементом для числа а > 0 ^ служит число \/а. / /^ ^ / | V х S2 3) Линейное пространство образует абе- абелеву группу относительно сложения элемен- элементов. Эта операция представляет собой закон композиции. Согласно аксиомам линейного пространства этот закон ассоциативен и ком- коммутативен. Нейтральным элементом является нулевой элемент пространства, обратным эле- рис g ^ ментом для элемента х — элемент —х. 4) Пусть BCD — равносторонний треугольник (рис. 9.1). Рассмот- Рассмотрим следующее множество А операций, совмещающих треугольник с самим собой: 1°. Поворот а на 2тг/3 вокруг центра Н, переводящий В в С.
248 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [гл. 9 2°. Поворот /3 на 4тг/3, переводящий В в D. 3°. Симметрия S\, переводящая С в D. Симметрия $2, переводящая D в В. Симметрия #з, переводящая В в С. 6°. Тождественная операция 1. Следующая таблица представляет закон композиции элементов множества А: 4° 5° 1 а Р Sx s2 S3 1 1 а /3 Si s2 S3 a a /3 1 s2 Si s2 /3 /3 1 a s3 s3 5, Si Si s2 s3 1 a 13 s2 s2 s3 Si /3 1 a s3 s3 Si s2 a /3 1 (Правило пользования этой таблицей легко понять на примере после- последовательного проведения операций S\, а затем S^'. S^Sx = /3. Приведенный закон композиции ассоциативен, но не коммутативен, существует нейтральный элемент — тождественная операция 1. Каж- Каждая операция имеет обратную (в каждой строке и столбце таблицы имеется тождественная операция). Таким образом, множество А операций с указанным законом ком- композиции представляет собой группу, очевидно, не коммутативную. 5) Группы перестановок. Взаимно однозначное отображение / произвольного множества Е на себя называется перестановкой множества Е. При этом всякий элемент а множества Е переходит в элемент /(а), обратная переста- перестановка f~x переводит /(а) в а. Перестановка /(а) = а для любого а множества Е называется тождественной перестановкой. Если множество Е состоит из элементов а, Ь, с,..., то перестанов- перестановку / этого множества записывают следующим образом: f ~ b с /(с) :::)¦ В множестве Р перестановок множества Е естественным образом определяется закон композиции: если /i и /2 — перестановки Е, то последовательное проведение /2 о f\ этих перестановок представляет собой некоторую перестановку множества Е. Легко видеть, что компо- композиция ассоциативна. Если множество Р содержит тождественную перестановку, обрат- обратную перестановку для каждой своей перестановки / и вместе с любы- любыми двумя перестановками /i, /2 их композицию f\ о /2, то, очевидно, Р представляет собой группу.
§ 1 ] ОСНОВНЫЕ СВОЙСТВА ГРУПП 249 Все перестановки множества Е образуют группу. Для конечного множества Е из п элементов эта группа называется симметричной группой Sn. Обратимся к примеру 4), в котором были рассмотрены операции совмещения равностороннего треугольника BCD с самим собой. Обо- Обозначим через Е множество вершин этого треугольника: Е = (BCD). Очевидно, группу операций, рассмотренную в примере 4), можно получить, обращаясь к следующей группе перестановок: 1 _ (В С D\ _ (В С D\ о _ (В С D\ 1 - \В С D) ' а~\С D В)' р - \D В С) ' с _ (В С D\ Q _ (В С D\ Q _ (В С D\ bx~\B D С)' b2~ \D С В)> ^~ \С В D) • 6) Рассмотрим группу Z<z, состоящую из двух элементов 0 и 1, в которой умножение определено по правилу: 0-0 = 0, 0-1 = 1, 1-0=1, 1-1=0. (9.1) Единицей группы является элемент 0. Эту группу называют группой вычетов по модулю 2. 7) Рассмотрим группу, состоящую из двух элементов: 1) тож- тождественное преобразование евклидова пространства (обозначим этот элемент через 0); 2) отражение евклидова пространства относительно начала координат (обозначим этот элемент через 1). Очевидно, умножение (т. е. последовательное проведение операций 1) и 2)) элементов 0 и 1 будет проводиться по правилу (9.1). Мы видим, что рассматриваемая группа отличается от группы Z^ (пример 6) лишь природой элементов. Групповые свойства этих двух групп одинаковы. Отметим следующие свойства групп (мы будем использовать муль- мультипликативную форму записи композиции). Теорема 9.1. Если аа~х = е, то а~ха = е. Доказательство. Пусть х — обратный элемент для элемен- элемента а~{: а~хх = е. Тогда а = ае = а(а~хх) = (аа~х)х = ех, т.е. а = ex. Следовательно, а а = а~1(ех) = (а~1е)х = а~хх = е, т.е. а~ха = е. Теорема дока- доказана. Теорема 9.2. Для любого элемента а группы справедливо соот- соотношение еа = а. Доказательство. По теореме 9.1 а~ха = е и, кроме того, аа~х = е. Поэтому еа = (аа~х)а = а(а~ха) = а, т.е. еа = а. Теорема доказана. Теорема 9.3. Если ах = е и ау = е, то х = у. Доказательство. Так как ау = е, то у — обратный элемент для а, и поэтому, согласно теореме 9.1, уа = е. Имеем далее у = уе = = у (ах) = (уа)х = ех = х. Теорема доказана.
250 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. 9 Из доказанных теорем вытекают следующие важные следствия. Следствие 1. Обратным элементом для элемента а~х слу- служит элемент а. Или, иначе, элемент а~х является как правым, так и левым обратным элементом для элемента а {т.е. аа~х = е и а~ха = е). Следствие 2. В любой группе уравнения ах = b и у а = Ъ однозначно разрешимы. Решениями этих уравнений служат соот- соответственно элементы х = а~хЬ и у = Ьа~х. Следствие 3. В группе имеется единственный нейтральный элемент (единица группы) (если ае = а и ае* = а, то е = е*). Замечание. Отметим, что обратным элементом (ab)~x для про- произведения ab служит элемент Ъ~ха~х. Действительно, используя ассоциативное свойство умножения, по- получим (ab)(b~xa~x) = a(bb~x)a~x = aea~x = аа~х = е. 3. Изоморфизм групп. Подгруппы. Примеры, рассмотренные в предыдущем пункте (см. примеры 4 и 5, примеры 6 и 7) показывают, что существуют группы, отличающиеся природой своих элементов, но обладающие одинаковыми групповыми свойствами. Такие группы естественно назвать изоморфными. Сформулируем точное определение этого понятия. Определение 1. Две группы G\ и G% называются изоморфными, если существует взаимно однозначное отображение / группы G\ на группу 6?2 такое, что для любых элементов а и b из G\ выполняется условие f(ab) = f(a)f(b). Заметим, что если е\ — единица группы G\, а е^ — единица груп- группы 6?2, то f(e\) = в2- Действительно, f(e\) = f(e\e\) = f(e\) x f(e\), и умножение на элемент, обратный к f(e\), показывает, что е^ = Отметим также, что обратное отображение f x группы G^ на группу G\ для любых элементов х и у из G^ удовлетворяет условию Кроме того, для любого а из G\ из равенства е^ = f(e\) = = f(aa~x) = f(a)f(a~x) следует, что обратным к элементу f(a) является элемент f(a~x). Таким образом, изоморфные группы, рассматриваемые абстрактно, без указания природы их элементов, с точки зрения групповых свойств неразличимы. Замечание 1. Обычно соответствие между изоморфными груп- группами G\ и 6?2, называется изоморфизмом или изоморфным отоб- отображением одной группы на другую (конечно, при этом обе группы равноправны). Замечание 2. Изоморфное отображение группы G на себя назы- называется автоморфизмом. Автоморфизмы группы определенным образом характеризуют ее симметрию.
§ 1 ] ОСНОВНЫЕ СВОЙСТВА ГРУПП 25j_ Если отдельные автоморфизмы группы рассматривать как некото- некоторые элементы, а последовательное проведение автоморфизмов — как произведение соответствующих элементов, то автоморфизмы сами об- образуют группу (единичным элементом будет тождественный автомор- автоморфизм). Эта группа называется группой автоморфизмов данной группы. Легко убедиться, что группа автоморфизмов группы Z2 (см. при- пример 6 предыдущего пункта) изоморфна этой же группе. Важную роль в теории групп играет понятие подгруппы. Определение 2. Подмножество G\ элементов группы G называется подгруппой этой группы, если выполнены условия: 1) если элемен- элементы а и b принадлежат G\, то