Текст
                    УДК 512.8
И 46
ББК 22.143
УЧЕБНИК УДОСТОЕН
ГОСУДАРСТВЕННОЙ ПРЕМИИ СССР ЗА 1980 ГОД
ИЛЬИН В. А., ЛОЗНЯК Э. Г. Линейная алгебра: Учеб.: Для вузов. —
5-е изд. — М.: ФИЗМАТЛИТ, 2002. — 320 с. — (Курс высшей математики
и математической физики). — ISBN 5-9221-0129-3 (Вып. 4).
Один из выпусков «Курса высшей математики и математической физики» под
редакцией А.Н. Тихонова, В.А. Ильина, А.Г. Свешникова. Учебник создан на ба-
базе лекций, читавшихся авторами в течение многих лет на физическом факультете
Московского государственного университета. Содержание книги составляют тео-
теории матриц и определителей, конечномерных линейных и евклидовых пространств
и линейных операторов в этих пространствах, билинейных и квадратичных форм,
тензоров, вопросы классификации поверхностей второго порядка и теории пред-
представления групп. Воспроизводится с 3-го изд. A984 г.)
4-е изд. — 1999 г.
Для студентов высших учебных заведений, обучающихся по специальностям
«Физика» и «Прикладная математика».
Ил. 1.
ISBN 5-9221-0129-3 (Вып. 4)
ISBN 5-9221-0134-X	© ФИЗМАТЛИТ, 1999, 2001, 2002


ОГЛАВЛЕНИЕ Предисловие 9 Введение 11 Глава 1. Матрицы и определители 12 § 1. Матрицы 12 1. Понятие матрицы A2). 2. Основные операции над матрицами и их свойства A3). 3. Блочные матрицы A7). § 2. Определители 19 1. Понятие определителя A9). 2. Выражение определителя непо- непосредственно через его элементы B6). 3. Теорема Лапласа B7). 4. Свойства определителей C0). 5. Примеры вычисления опреде- определителей C3). 6. Определитель суммы и произведения матриц C7). 7. Понятие обратной матрицы C9). § 3. Теорема о базисном миноре матрицы 41 1. Понятие линейной зависимости строк D1). 2. Теорема о базисном миноре D2). 3. Необходимое и достаточное условие равенства нулю определителя D4). Глава 2. Линейные пространства 46 § 1. Понятие линейного пространства 46 1. Определение линейного пространства D6). 2. Некоторые свойства произвольных линейных пространств E0). § 2. Базис и размерность линейного пространства 51 1.Понятие линейной зависимости элементов линейного простран- пространства E1). 2. Базис и координаты E3). 3. Размерность линейного пространства E5). 4. Понятие изоморфизма линейных пространств E7). § 3. Подпространства линейных пространств 58 1. Понятие подпространства и линейной оболочки E8). 2. Новое определение ранга матрицы F1). 3. Сумма и пересечение подпро- подпространств F2). 4. Разложение линейного пространства в прямую сумму подпространств F5). § 4. Преобразование координат при преобразовании базиса п-мер- ного линейного пространства 67 1. Прямое и обратное преобразование базисов F7). 2. Связь меж- между преобразованием базисов и преобразованием соответствующих координат F8). Глава 3. Системы линейных уравнений 70 § 1. Условие совместности линейной системы 70 1. Понятие системы линейных уравнений и ее решения G0). 2. Нетривиальная совместность однородной системы G3). 3. Усло- Условие совместности общей линейной системы G4). § 2. Отыскание решений линейной системы 75 1. Квадратная система линейных уравнений с определителем основ- основной матрицы, отличным от нуля G6). 2. Отыскание всех решений общей линейной системы (80). 3. Свойства совокупности решений однородной системы (82). 4. Заключительные замечания о решении линейных систем (87).
ОГЛАВЛЕНИЕ Глава 4. Евклидовы пространства 90 § 1. Вещественное евклидово пространство и его простейшие свойства 90 1. Определение вещественного евклидова пространства (90). 2. Про- Простейшие свойства произвольного евклидова пространства (93). § 2. Ортонормированный базис конечномерного евклидова прос- пространства 97 1. Понятие ортонормированного базиса и его существование (98). 2. Свойства ортонормированного базиса A00). 3. Разложение 71- мерного евклидова пространства на прямую сумму подпростран- подпространства и его ортогонального дополнения A03). 4. Изоморфизм п- мерных евклидовых пространств A03). § 3. Комплексное евклидово пространство 105 1. Определение комплексного евклидова пространства A05). 2. Неравенство Коши-Буняковского. Понятие нормы A07). 3. Ор- Ортонормированный базис и его свойства A08). § 4. Метод регуляризации для отыскания нормального решения линейной системы 110 Глава 5. Линейные операторы 117 § 1. Понятие линейного оператора. Основные свойства 117 1. Определение линейного оператора A17). 2. Действия над ли- линейными операторами. Пространство линейных операторов A17). 3. Свойства множества L (V, V) линейных операторов A18). § 2. Матричная запись линейных операторов 125 1. Матрицы линейных операторов в заданном базисе линейного про- пространства V A25). 2. Преобразование матрицы линейного опера- оператора при переходе к новому базису A27). 3. Характеристический многочлен линейного оператора A30). § 3. Собственные значения и собственные векторы линейных опе- операторов 131 § 4. Линейные и полуторалинейные формы в евклидовом прос- пространстве 134 1. Специальное представление линейной формы в евклидовом про- пространстве A34). 2. Полуторалинейные формы в евклидовом про- пространстве. Специальное представление таких форм A35). § 5. Линейные самосопряженные операторы в евклидовом прос- пространстве 138 1. Понятие сопряженного оператора A38). 2. Самосопряженные операторы. Основные свойства A39). 3. Норма линйного оператора A41). 4. Дальнейшие свойства самосопряженных операторов A43). 5. Спектральное разложение самосопряженных операторов. Теоре- Теорема Гамильтона-Кэли A49). 6. Положительные операторы. Корни га-ой степени из оператора A51). § 6. Приведение квадратичной формы к сумме квадратов 152 § 7. Унитарные и нормальные операторы 155 § 8. Канонический вид линейных операторов 160 § 9. Линейные операторы в вещественном евклидовом прос- пространстве 165 1. Общие замечания A65). 2. Ортогональные операторы A70).
ОГЛАВЛЕНИЕ Глава 6. Итерационные методы решения линейных систем и задач на собственные значения 174 § 1. Итерационные методы решения линейных систем 175 1. Метод простой итерации (метод Якоби) A75). 2. Общий неяв- неявный метод простой итерации A78). 3. Модифицированный метод простой итерации A86). 4. Метод Зейделя A88). 5. Метод верх- верхней релаксации A89). 6. Случай несимметричной матрицы А A90). 7. Итерационный метод П.Л. Чебышева A90). § 2. Решение полной проблемы собственных значений методом вращений 194 Глава 7. Билинейные и квадратичные формы 201 § 1. Билинейные формы 201 1. Понятие билинейной формы B01). 2. Представление билинейной формы в конечномерном линейном пространстве B02). 3. Преобра- Преобразование матрицы билинейной формы при переходе к новому базису. Ранг билинейной формы B04). § 2. Квадратичные формы 205 § 3. Приведение квадратичной формы к сумме квадратов 207 1. Метод Лагранжа B08). 2. Метод Якоби B10). § 4. Закон инерции квадратичных форм. Классификация квад- квадратичных форм 213 1. Закон инерции квадратичных форм B13). 2. Классификация квадратичных форм B16). 3. Критерий Сильвестра знакоопреде- знакоопределенности квадратичной формы B18). § 5. Полилинейные формы 219 § 6. Билинейные и квадратичные формы в евклидовом пространстве 221 1. Предварительные замечания B21). 2. Приведение квадратичной формы к сумме квадратов в ортогональном базисе B22). 3. Одно- Одновременное приведение двух квадратичных форм к сумме квадратов в линейном пространстве B23). 4. Экстремальные свойства квадра- квадратичной формы B24). § 7. Гиперповерхности второго порядка 227 1. Понятие гиперповерхности второго порядка B27). 2. Параллель- Параллельные переносы в евклидовом пространстве. Преобразование орто- нормированных базисов в ортонормированные B29). 3. Преобра- Преобразование общего уравнения гиперповерхности второго порядка при параллельном переносе B31). 4. Преобразование общего уравнения гиперповерхности второго порядка при переходе от ортонормиро- ванного базиса к ортонормированному B33). 5. Инварианты обще- общего уравнения гиперповерхности второго порядка B35). 6. Центр ги- гиперповерхности второго порядка B37). 7. Стандартное упрощение любого уравнения гиперповерхности второго порядка путем преоб- преобразования ортонормированного базиса B39). 8. Упрощение уравне- уравнения центральной гиперповерхности второго порядка. Классифика- Классификация центральных гиперповерхностей B39). 9. Упрощение уравне- уравнения нецентральной гиперповерхности второго порядка. Классифи- Классификация нецентральных гиперповерхностей B41).
ОГЛАВЛЕНИЕ Глава 8. Тензоры 246 § 1. Преобразование базисов и координат 246 1. Определители Грама B46). 2. Взаимные базисы. Ковариантные и контравариантные координаты векторов B47). 3. Преобразования базиса и координат B51). § 2. Понятие тензора. Основные операции над тензорами 253 1. Понятие тензора B53). 2. Примеры тензоров B55). 3. Основные операции над тензорами B57). § 3. Метрический тензор. Основные операции векторной алгеб- алгебры в тензорных обозначениях 262 1. Понятие метрического тензора в евклидовом пространстве B62). 2. Операция поднятия и опускания индексов с помощью метри- метрического тензора B64). 3. Ортонормированные базисы в Еп B65). 4. Дискриминантный тензор B67). 5. Ориентированный объем B69). 6. Векторное произведение B70). 7. Двойное векторное про- произведение B70). § 4. Метрический тензор псевдоевклидова пространства 271 1. Понятие псевдоевклидова пространства и метрического тензо- тензора псевдоевклидова пространства B71). 2. Галилеевы координаты. Преобразование Лоренца B73). 3. Преобразования Лоренца про- пространства #1 Зх B75). § 5. Тензор момента инерции 278 Глава 9. Элементы теории групп 280 § 1. Понятие группы. Основные свойства групп 280 1. Законы композиции B80). 2. Понятие группы. Некоторые свойст- свойства групп B81). 3. Изоморфизм групп. Подгруппы B85). 4. Смежные классы. Нормальные делители B86). 5. Гомоморфизфы. Фактор- Факторгруппы B87). § 2. Группы преобразований 292 1. Невырожденные линейные преобразования B92). 2. Группа ли- линейных преобразований B93). 3. Сходимость элементов в группе GL(n). Подгруппы группы GL(n) B94). 4. Группа ортогональ- ортогональных преобразований B95). 5. Некоторые дискретные и конечные подгруппы ортогональной группы B97). 6. Группа Лоренца B99). 7. Унитарные группы C02). § 3. Представления групп 303 1. Линейные представления групп. Терминология C04). 2. Матри- Матрицы линейных представлений. Эквивалентные представления C05). 3. Приводимые и неприводимые представления C05). 4. Характеры C07). 5. Примеры представлений групп C09). Предметный указатель 313
ПРЕДИСЛОВИЕ Эта книга возникла в результате переработки курса лекций, читав- читавшихся авторами в МГУ. Отметим некоторые особенности изложения. Изложение начинается с изучения матриц и определителей, причем определитель n-го порядка вводится по индукции через определитель (п — 1)-го порядка с помощью формулы разложения по первой строке. При этом легко доказывается теорема о разложении по любой строке и по любому столбцу (схема доказательства этой теоремы оказывает- оказывается совершенно аналогичной схеме доказательства теоремы Лапласа). Традиционное определение детерминанта (определителя) непосред- непосредственно через его элементы является простым следствием данного в этой книге определения. Изучению линейных систем предшествует теория линейных про- пространств и преобразований базисов и координат векторов в таких про- пространствах. При изучении линейных систем мы сразу же знакомим читателя не только с обычной, но и с матричной формой записи си- системы и вывода формул Крамера. Изучение вещественных и комплексных евклидовых пространств завершается доказательством теоремы А.Н. Тихонова об отыскании нормального решения линейной системы. При изучении линейных операторов излагаются все основные ас- аспекты спектральной теории в конечномерных евклидовых простран- пространствах. Теорема о приведении матрицы к жордановой форме доказыва- доказывается с помощью предложенного А.Ф. Филипповым короткого метода, основанного на индукции. Книга содержит специальную главу, посвященную итерационным методам, в которой с единой точки зрения рассматриваются важ- важнейшие итерационные методы решения линейных систем (явный и неявный методы простой итерации, метод Зейделя, метод верхней ре- релаксации) и устанавливаются условия сходимости этих методов. Для общего неявного метода простой итерации выясняются установлен- установленные А.А. Самарским условия получения наиболее быстрой сходимости. Приводится доказательство сходимости метода вращений для решения полной проблемы собственных значений.
10 ПРЕДИСЛОВИЕ Изложение теории билинейных и квадратичных форм завершает- завершается приведением к каноническому виду уравнений гиперповерхностей второго порядка в n-мерном пространстве. При изучении тензоров, на- наряду с традиционным материалом, излагается важная для приложе- приложений тензорная форма записи основных операций векторной алгебры. Здесь же даются понятия псевдоевклидова пространства, галилеевых координат и преобразований Лоренца. Книга завершается изложением элементов теории групп и их пред- представлений. Следует отметить, что данная книга примыкает к выпуску «Ана- «Аналитическая геометрия», хотя и может читаться независимо от него. Авторы приносят глубокую благодарность А.Н. Тихонову и А.Г. Свешникову за большое количество ценных замечаний, Ш. А. Али- Алимову, вклад которого в эту книгу далеко вышел за рамки обычного редактирования, Л.Д. Кудрявцеву, С.А. Ломову и особенно А.А. Са- Самарскому за весьма полезные критические замечания и ценные советы, Е.С. Николаеву, Д.Д. Соколову и Е.В. Шикину за большую помощь при написании некоторых разделов этой книги. 30 января 1974 г. В. Ильин, Э. Позплк
ВВЕДЕНИЕ В этой книге мы будем иметь дело с внешне различными объ- объектами: 1) с матрицами (или прямоугольными таблицами из чисел), 2) с алгебраическими формами, включающими в себя так называемые линейные, билинейные и квадратичные формы, 3) с так называемыми линейными (и, в частности, евклидовыми) пространствами и с линей- линейными преобразованиями в таких пространствах. Элементарные представления об этих объектах читатель имеет из курса аналитической геометрии. В самом деле, в курсе аналитической геометрии изучались квадратные матрицы второго и третьего поряд- порядков и отвечающие этим матрицам определители. Линейная и квадра- квадратичная формы представляют собой соответственно однородную линей- линейную и однородную квадратичную функции нескольких независимых переменных (например, координат вектора). Примером линейного про- пространства может служить совокупность всех геометрических векторов на плоскости (или в пространстве) с заданными операциями сложения этих векторов или умножения их на числа. Если для совокупности та- таких векторов задано еще и скалярное произведение, то мы придем к понятию евклидова пространства. Примером линейного преобразова- преобразования в таком пространстве может служить переход от одного декартова прямоугольного базиса к другому. Несмотря на внешнее различие, перечисленные совокупности объ- объектов тесно связаны между собой: большинство утверждений допуска- допускают равносильную формулировку для каждой из этих совокупностей. Наиболее отчетливо эта связь выявляется при изучении произвольных линейных и евклидовых пространств (и линейных преобразований в таких пространствах). Однако более конкретная, матричная трактовка результатов непо- непосредственно связана с фактическими вычислениями (и, в частости, с решением линейных систем уравнений). Именно поэтому мы начинаем наше рассмотрение с изучения матриц и неоднократно возвращаемся впоследствии к матричной трактовке результатов.
ГЛАВА 1 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ В этой главе изучаются таблицы из чисел, называемые матрицами и играющие в дальнейшем важнейшую роль. Здесь вводятся основные операции над матрицами и детально изучаются свойства так называе- называемых определителей, являющихся основной числовой характеристикой квадратных матриц. § 1. Матрицы 1. Понятие матрицы. Матрицей называется прямоугольная таблица из чисел, содержащая некоторое количество т строк и неко- некоторое количество п столбцов. Числа тип называются порядками матрицы. В случае, если т = = п, матрица называется квадратной, а число т = п — ее порядком. В дальнейшем для записи матрицы будут применяться либо сдво- сдвоенные черточки, либо круглые скобки: аи ^22 / ИЛИ аи in \ \ Oral ^т2 * * * &шп Впрочем, для краткого обозначения матрицы часто будет использо- использоваться либо одна большая латинская буква (например, А), либо символ ||а^-||, а иногда и с разъяснением: А = ||а^|| = (а^) (г = 1, 2, ..., т; j = 1,2, ..., п). Числа ац, входящие в состав данной матрицы, называются ее эле- элементами. В записи ац первый индекс г означает номер строки, а вто- второй индекс j — номер столбца. В случае квадратной матрицы din (l.i) ап2
1. МАТРИЦЫ 13 вводятся понятия главной и побочной диагоналей. Главной диагона- диагональю матрицы A.1) называется диагональ аца22- • • апп, идущая из ле- левого верхнего угла этой матрицы в правый нижний ее угол. Побоч- Побочной диагональю той же матрицы называется диагональ ania^n_i^2 • • • ... ain, идущая из левого нижнего угла в правый верхний угол. 2. Основные операции над матрицами и их свойства. Преж- Прежде всего договоримся считать две матрицы равными, если эти матрицы имеют одинаковые порядки и все их соответствующие элементы сов- совпадают. Перейдем к определению основных операций над матрицами. а) Сложение матриц. Суммой двух матриц А = ||а^|| (г = = 1, 2, ..., m; j = 1, 2, ..., п) и В = ||Ь^|| (г = 1, 2, ..., m; j = = 1, 2, ..., п) одних и тех же порядков тип называется матрица С = = \\cij\\ (г = 1, 2, ..., т; j = 1, 2, ..., п) тех же порядков шип, элементы сц которой равны Cij = a,ij + bij (г = 1, 2, ..., m; j = 1, 2, ..., п). A.2) Для обозначения суммы двух матриц используется запись С = А + В. Операция составления суммы матриц называется их сложением. Итак, по определению ат1 ат2 bin ^2 22 Ьтп (ai2 + 612) @22 + ^22) (aln + bin) (aml (am2 + bm2) ... (am bmn) Из определения суммы матриц, а точнее, из формулы A.2), непо- непосредственно вытекает, что операция сложения матриц обладает те- теми же свойствами, что и операция сложения вещественных чисел, а именно: 1) переместительным свойством: А + В = В + А; 2) сочетательным свойством: (А + В) + С = А + (В + С). Эти свойства позволяют не заботиться о порядке следования сла- слагаемых матриц при сложении двух или большего числа матриц. б) Умножение матрицы на число. Произведением матри- матрицы А = \\dij\\ (i = 1, 2, ..., m; j = 1, 2, ..., п) на вещественное чис- число Л называется матрица С = (г = 1,2,..., m; j = 1, 2, ..., п),
14 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ элементы сц которой равны Cij = Xdij (г = 1,2,..., m; J = 1,2,..., га). A.3) Для обозначения произведения матрицы на число используется за- запись С = Л А или С = АХ. Операция составления произведения мат- матрицы на число называется умножением матрицы на это число. Непосредственно из формулы A.3) ясно, что умножение матрицы на число обладает следующими свойствами: 1) сочетательным свойством относительно числового множителя: (\ц)А = А(М); 2) распределительным свойством относительно суммы матриц: \(А + В) = ХА + ХВ- 3) распределительным свойством относительно суммы чисел: (Л + + /i)A = ХА + iiA. Замечание. Разностью двух матриц А и В одинаковых поряд- порядков тип естественно назвать такую матрицу С тех же порядков т и га, которая в сумме с матрицей В дает матрицу А. Для обозначения разности двух матриц используется естественная запись: С = А — В. Очень легко убедиться в том, что разность С двух матриц А и В может быть получена по правилу С = А + (— 1)В. в) Перемножение матриц. Произведением матрицы А = = \\ciij\\ (г = 1, 2, ..., m; j = 1, 2, ..., п), имеющей порядки, соот- соответственно равные т и п, на матрицу В = ||Ь^-|| (г = 1,2,..., щ j = = 1, 2, ..., р), имеющую порядки, соответственно равные пир, назы- называется матрица С = ||с^-|| (г = 1, 2, ..., m; j = 1, 2, ..., р), имеющая порядки, соответственно равные п и р, и элементы Qj, определяемые формулой п с^ = ^2 aikhj (г = 1,2,..., ш; j = 1, 2, ..., р). A.4) к = 1 Для обозначения произведения матрицы А на матрицу В использу- используют запись С = А В. Операция составления произведения матрицы А на матрицу В называется перемножением этих матриц. Из сформулированного выше определения вытекает, что матри- матрицу А можно умножить не на всякую матрицу В: необходимо, чтобы число столбцов матрицы А было равно числу строк матрицы В. В частности, оба произведения А-ВиВ-А можно определить лишь в том случае, когда число столбцов А совпадает с числом строк В, а число строк А совпадает с числом столбцов В. При этом обе матрицы А- В и В • А будут квадратными, но порядки их будут, вообще говоря,
1. МАТРИЦЫ 15 различными. Для того чтобы оба произведения А • В и В • А не толь- только были определены, но и имели одинаковый порядок, необходимо и достаточно, чтобы обе матрицы А и В были квадратными матрицами одного и того же порядка. Формула A.4) представляет собой правило составления элементов матрицы С, являющейся произведением матрицы А на матрицу В. Это правило можно сформулировать и словесно: элемент Cij, стоя- стоящий на пересечении i-u строки и j-го столбца матрицы С = А • В, равен сумме попарных произведений соответствующих элементов i-й строки матрицы А и j-го столбца матрицы В. В качестве примера применения указанного правила приведем фор- формулу перемножения квадратных матриц второго порядка аи а12 0-21 &22 Ь12 ai2b2i) (anbi2 + ai2b22) a22b2 a22b22) Из формулы A.4) вытекают следующие свойства произведения матрицы А на матрицу В: 1) сочетательное свойство: (АВ)С = А(ВС); 2) распределительное относительно суммы матриц свойство: (А + + В)С = АС + ВС или А(В + С) = АВ + АС. Распределительное свойство сразу вытекает из формул A.4) и A.2), а для доказательства сочетательного свойства достаточно заметить, что если А = \\dij\\ (г = 1, 2, ..., m; j = 1, 2, ..., п), 5 = ||bjjfe|| (J = 1, 2, .. , n; k = 1, 2, .. , р), С = ||cw|| (к = 1, 2, .. , р; I = = 1,2,..., г), то элемент о!ц матрицы [АВ)С в силу A.4) равен а элемент d'u матрицы (АВ)С равен j i H i •> но тогда равенство о1ц = d^ вытека- вытекает из возможности изменения порядка суммирования относительно j и к. Вопрос о перестановочном свойстве произведения матрицы А на матрицу В имеет смысл ставить лишь для квадратных матриц А и В одинакового порядка (ибо, как указывалось выше, только для таких матриц Аи В оба произведения АВ и В А определены и являются мат- матрицами одинаковых порядков). Элементарные примеры показывают, что произведение двух квадратных матриц одинакового порядка не обладает, вообще говоря, перестановочным свойством. В самом де- &ВА = 10. 0 0 жит 0 1 1 ъ А = 1 0 0 1 0 в = 0 1 0 0 , то АВ =
16 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ Здесь мы укажем, однако, важные частные случаи, в которых спра- справедливо перестановочное свойство г). Среди квадратных матриц выделим класс так называемых диаго- диагональных матриц, у каждой из которых элементы, расположенные вне главной диагонали, равны нулю. Каждая диагональная матрица по- порядка п имеет вид D = О о о О A.5) где di, б?2, ..., dn — какие угодно числа. Легко видеть, что если все эти числа равны между собой, т. е. d\ — d<± — ... = dn = d, то для любой квадратной матрицы А порядка п справедливо равенство AD = DA. В самом деле, обозначим символами сц и c[j элементы, стоящие на пе- пересечении г-й строки и j-ro столбца матриц AD и DA соответственно. Тогда из равенства A.4) и из вида матрицы D получим, что т. е. Cij = Сц. Среди всех диагональных матриц A.5) с совпадающими элемента- элементами d\ = б?2 = • • • = dn особо важную роль играют две матрицы. Первая из этих матриц получается при d = 1, называется единичной матрицей n-го порядка и обозначается символом Е. Вторая матрица получается при d = 0, называется нулевой матрицей n-го порядка и обозначается символом О. Таким образом, Е = 1 О О 1 О О О = О О О О о о о В силу доказанного выше АЕ = ЕА и АО = О А. Более того, из формул A.6) очевидно, что АЕ = ЕА = АО = О А = О. A.7) Первая из формул A.7) характеризует особою роль единичной мат- матрицы Е, аналогичную той роли, которую играет число 1 при пере- перемножении вещественных чисел. Что же касается особой роли нулевой 1) Две матрицы, для произведения которых справедливо перестановочное свойство, принято называть коммутирующими.
1. МАТРИЦЫ 17 матрицы О, то ее выявляет не только вторая из формул A.7), но и элементарно проверяемое равенство 2) А + О = О + А = А. В заключение заметим, что понятие нулевой матрицы можно вво- вводить и для неквадратных матриц (нулевой называют любую матрицу, все элементы которой равны нулю). 3. Блочные матрицы. Предположим, что некоторая матрица А = \\dij\\ при помощи горизонтальных и вертикальных прямых раз- разбита на отдельные прямоугольные клетки, каждая из которых пред- представляет собой матрицу меньших размеров и называется блоком ис- исходной матрицы. В таком случае возникает возможность рассмотрения исходной матрицы А как некоторой новой (так называемой блочной) матрицы А = ||Аа/з||, элементами Аа/з которой служат указанные бло- блоки. Указанные элементы мы обозначаем большой латинской буквой, чтобы подчеркнуть, что они являются, вообще говоря, матрицами, а не числами и (как обычные числовые элементы) снабжаем двумя ин- индексами, первый из которых указывает номер «блочной» строки, а второй —номер «блочного» столбца. Например, матрицу А = аи «21 «31 a4i «51 «12 «22 «32 а42 «52 «13 «23 «зз а4з «53 аы «24 «34 а44 «54 «15 «25 «35 а4б «55 а>2б ^36 а4б можно рассматривать как блочную матрицу А = ментами которой служат следующие блоки: Аи = А21 = ^52 ^53 А21 А22 ^25 «26 «35 «36 «45 «46 «55 «56 эле- Замечательным является тот факт, что основные операции с блоч- блочными матрицами совершаются по тем же правилам, по которым они 2) Это равенство является прямым следствием формулы A.2). 2 В.А. Ильин, Э.Г. Позняк
18 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ совершаются с обычными числовыми матрицами, только в роли эле- элементов выступают блоки. В самом деле, элементарно проверяется, что если матрица А = = \\dij\\ является блочной и имеет блочные элементы Аар, то при том же разбиении на блоки матрице Л А = ЦЛа^Ц отвечают блочные эле- элементы \Аа{з 3). Столь же элементарно проверяется, что если матрицы А и В име- имеют одинаковые порядки и одинаковым образом разбиты на блоки, то сумме матриц А и В отвечает блочная матрица с элементами Са/з = = Аар + Вар (здесь Аар и Вар — блочные элементы матриц А и В). Пусть, наконец, А и В — две блочные матрицы такие, что число столбцов каждого блока Аар равно числу строк блока Вар (так что при любых а,^и7 определено произведение матриц АарВр7). Тогда произведение С = АВ представляет собой матрицу с элементами Са7, определяемыми формулой /з Для доказательства этой формулы достаточно расписать левую и пра- правую ее части в терминах обычных (числовых) элементов матриц Аи В (предоставляем это сделать читателю). В качестве примера применения блочных матриц остановимся на понятии так называемой прямой суммы квадратных матриц. Прямой суммой двух квадратных матриц А и В порядков тип соответственно называется квадратная блочная матрица С порядка А О т + п, равная С = О В . Для обозначения прямой суммы мат- матриц А и В используется запись С = А 0 В. Из определения прямой суммы матриц А и В очевидно, что эта сумма, вообще говоря, не обладает перестановочным свойством. Одна- Однако элементарно проверяется справедливость сочетательного свойства: (Аев)ес = Ае(БеС). С помощью свойств операций над блочными матрицами легко про- проверяются следующие формулы, устанавливающие связь между опера- операцией прямого суммирования и операциями обычного сложения и пе- перемножения матриц: (Ат е Ап) + (вт е вп) = (Ат + вт) е (Ап + вп), (Ат е ап) (вт е вп) = Ашвш е Апвп 3) При этом блочные элементы \Аар сами вычисляются по правилу умноже- умножения матрицы Аар на число Л.
2. ОПРЕДЕЛИТЕЛИ 19 (в этих формулах Аш и Вш — произвольные квадратные матрицы по- порядка т, а Ап и ??п — произвольные квадратные матрицы порядка п). Проверку этих формул мы предоставляем читателю. § 2. Определители Целью настоящего параграфа является построение теории опреде- определителей любого порядка п. Хотя читатель (из курса аналитической геометрии) уже знаком с определителями второго и третьего поряд- порядков, мы будем вести изложение так, чтобы избежать каких-либо ссы- ссылок. Знакомство с определителями второго и третьего порядков разве лишь облегчит восприятие излагаемого ниже материала. 1. Понятие определителя. Рассмотрим произвольную квадрат- квадратную матрицу любого порядка п: А = «12 flln «2n «21 «22 «nl an2 • • • &nn A.8) С каждой такой матрицей свяжем вполне определенную численную характеристику, называемую определителем, соответствующим этой матрице. Если порядок п матрицы A.8) равен единице, то эта матрица состоит из одного элемента flu и определителем первого порядка, со- соответствующим такой матрице, мы назовем величину этого элемента. Если далее порядок п матрицы A.8) равен двум, т. е. если эта матрица имеет вид «и а12 «21 «22 А = A.9) то определителем второго порядка, соответствующим такой матрице, назовем число, равное flu«22 ~ «12^21 и обозначаемое одним из сим- символов 4) Л = det A — Л = аи fl21 «22 . Итак, по определению «11 «12 «21 «22 — «И«22 ~ A.10) Формула A.10) представляет собой правило составления определителя второго порядка по элементам соответствующей ему матрицы. Словес- 4) В отличие от матрицы для обозначения определителя употребляют не сдво- сдвоенные, а одинарные черточки. 2*
20 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ ная формулировка этого правила такова: определитель второго поряд- порядка, соответствующий матрице A.9), равен разности произведения эле- элементов, стоящих на главной диагонали этой матрицы, и произведения элементов, стоящих на побочной ее диагонали 5). В дальнейшем изложении мы будем говорить об элементах, стро- строках или столбцах определителя, подразумевая под этими терминами соответственно элементы, строки или столбцы отвечающей этому опре- определителю матрицы. Перейдем теперь к выяснению понятия определителя любого по- порядка п , где п ^ 2. Понятие такого определителя мы введем индуктив- индуктивно, считая, что нами уже введено понятие определителя порядка п — 1, соответствующего произвольной квадратной матрице порядка п — 1. Договоримся называть минором любого элемента ац матри- матрицы n-го порядка A.8) определитель порядка п — 1, соответствующий той матрице, которая получается из матрицы A.8) в результате вычеркивания г-й строки и j-го столбца (той строки и того столбца, на пересечении которых стоит элемент ац). Минор элемента ац будем обозначать символом М ¦. В этом обозначении верхний индекс обозна- обозначает номер строки, нижний — номер столбца, а черта над М означает, что указанные строка и столбец вычеркиваются. Определителем порядка п, соответствующим матрице A.8), на- назовем число, равное ^^=1(— lI + JaiJMJ- и обозначаемое символом Д = detA = A.11) Итак, по определению Л = а12 ап2 Формула A.12) представляет собой правило составления определителя порядка п по элементам первой строки соответствующей ему матрицы 5) Напомним, что главной диагональю квадратной матрицы называется диа- диагональ, идущая из левого верхнего в правый нижний угол (т. е. в случае матри- матрицы A.9) — апогг), а побочной — диагональ, идущая из левого нижнего в правый верхний угол (т. е. в случае матрицы A.9) —
2. ОПРЕДЕЛИТЕЛИ 21 и по минорам Mj элементов первой строки, являющимся определите- определителями порядка п — 1. Заметим, что при п = 2 правило A.12) в точности совпадает с правилом A.10), ибо в этом случае миноры элементов первой строки тт1 -тт1 имеют вид: м1 = а22, ^2 = а2ь Естественно возникает вопрос, нельзя ли использовать для получе- получения величины определителя A.11) элементы и отвечающие им миноры не первой, а произвольной г-й строки матрицы A.8). Ответ на этот во- вопрос дает следующая основная теорема. Теорема 1.1. Каков бы ни был номер строки г (г = 1, 2, ..., п), для определителя п-го порядка A.11) справедлива формула 6) п Д = detA = ^(-1)* + 'а^М*, A.13) j = i называемая разложением этого определителя по г-й строке. Замечание. Подчеркнем, что в этой формуле показатель степе- степени, в которую возводится число (—1), равен сумме номеров строки и столбца, на пересечении которых стоит элемент ац. Доказательство теоремы 1.1. Формулу A.13) нужно до- доказать лишь для номеров г = 2, 3, ..., п 7) . При п = 2 (т. е. для определителя второго порядка) эту формулу нужно доказать лишь для номера г = 2, т. е. при п = 2 нужно доказать лишь формулу 2 Л = detA = ^(-1J + ^-м5 = -а21~М\ Справедливость этой последней формулы сразу вытекает из выра- 2 2 жений для миноров матрицы A.9) Мх — ai2, М2 = ац, в силу ко- которых правая часть этой формулы совпадает с правой частью A.10). Итак, при п = 2 теорема доказана. Доказательство формулы A.13) для произвольного п > 2 проведем по индукции, т. е. предположим, что для определителя порядка п — 1 справедлива формула вида A.13) разложения по любой строке, и, опираясь на это, убедимся в справедливости формулы A.13) для опре- определителя порядка п. При доказательстве нам понадобится понятие миноров матри- матрицы A.8) порядка п — 2. Определитель порядка п — 2, соответству- соответствующий той матрице, которая получается из матрицы A.8) в результате 6) По смыслу теоремы п ^ 2. 7) Ибо при г = 1 правая часть A.13) по определению равна detA.
22 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ вычеркивания двух строк с номерами i\ и %2 и двух столбцов с номе- номерами ji и j2 называется минором (п — 2)-го порядка и обозначается символом М^2. Определитель n-го порядка Л вводится формулой A.12), причем в этой формуле каждый минор Mj является определителем поряд- порядка п — 1, для которого, по предположению, справедлива формула ви- вида A.13) разложения по любой строке. Фиксировав любой номер i (i = 2, 3, ..., п), разложим в фор- формуле A.12) каждый минор М ¦ по i-й строке основного определите- определителя A.11) (в самом миноре Mj эта строка будет (г — 1)-й). В результате весь определитель Л окажется представленным в виде некоторой линейной комбинации 8) миноров (п — 2)-го порядка Mjk с несовпадающими номерами j и i, т. е. в виде 9) Для вычисления множителей 6jk заметим, что минор Mjk получается в результате разложения по (г — 1)-й строке 10) только следующих двух миноров (п — 1)-го порядка, отвечающих элементам первой строки матрицы A.8): минора Mj и минора Мк (ибо только эти два минора элементов первой строки содержат все столбцы минора Mjk ). В разложениях миноров Mj и Мк по указанной (г — 1)-й стро- ке выпишем только слагаемые, содержащие минор М jk (остальные не интересующие нас слагаемые обозначим многоточием). Учитывая при этом, что элемент aik минора Mj стоит на пересечении (г — 1)-й строки и (к — 1)-го столбца этого минора п), а элемент ац минора Мк стоит на пересечении (г — 1)-й строки и j-ro столбца этого минора 12), мы 8) Напомним, что линейной комбинацией каких-либо величин называется сум- сумма произведений этих величин на некоторые вещественные числа. 9) Так как минор Mjk совпадает с Mkj, то мы переберем все миноры (п — 2)-го порядка с данными номерами строк 1 иг, изменяя j от 1 до п и для каждого j беря все возможные к < j. 10) В матрице A.8) эта строка будет г-й. п) Ибо в миноре Mj отсутствует первая строка и j'-й столбец матрицы A.8) и j < к. 12) Ибо в миноре Мк отсутствует первая строка матрицы A.8), а единственный отсутствующий в этом миноре столбец матрицы A.8) имеет номер к > j.
2. ОПРЕДЕЛИТЕЛИ 23 получим М) = (-1)(*-1) + (*-1)а^; + .-., A.15) м\ = (-l)(i-1)+%iiMjL + ... A.16) Вставляя A.15) и A.16) в правую часть A.12) и собирая коэффици- коэффициент при Mjk, мы получим, что множитель 0jk в равенстве A.14) имеет вид Ojk = (-l)il + i + j + k)[aljaik - alkaij]. A.17) Для завершения доказательства теоремы покажем, что и правая часть A.13) равна сумме, стоящей в правой части A.14), с теми же самыми значениями A.17) для 0jk. Для этого в правой части A.13) разложим каждый минор (п — 1)-го порядка Мj по первой строке. В результате вся пра- правая часть A.13) представится в виде линейной комбинации с некото- некоторыми коэффициентами Ojk тех же самых миноров Mjk вЛ*> (L18) 3 = 1 k<j и нам остается вычислить множители Ojk и убедиться в справедливо- справедливости для них формулы A.17). Для этого заметим, что минор Mjk получается в результате разло- разложения по первой строке только следующих двух миноров (п — 1)-го порядка, отвечающих элементам г-й строки матрицы A.8): минора Мj и минора Мк (ибо только эти два минора элементов г-й строки содер- содержат все столбцы минора Mjk). В разложениях миноров Мj и Мк по первой строке выпишем толь- ко слагаемые, содержащие минор Mjk: (остальные не интересующие нас слагаемые обозначим многоточием). Учитывая при этом, что эле- элемент а±к минора М ¦ стоит на пересечении первой строки и (к — 1)-го столбца 13) этого минора, а элемент a\j минора М\ стоит на пересе- пересечении первой строки и j-ro столбца 14) этого минора, мы получим Mj = (-ly + C-Vau-Mjb + ..., A.19) Ж'к = (-l^ + JoyMJj + ... A.20) 13) Ибо j < к и в миноре М*- отсутствует j'-й столбец матрицы A.8). 14) Ибо j < /с , а у минора Mj. отсутствует лишь /с-й столбец матрицы A.8).
24 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ Вставляя A.19) и A.20) в правую часть A.13) и собирая коэффи- коэффициент при Mjk, мы получим, что Ojk в сумме A.18) определяется той же самой формулой A.17), что и в равенстве A.14). Теорема 1.1 доказана. Теорема 1.1 установила возможность разложения определителя n-го порядка по любой его строке. Естественно возникает вопрос о возможности разложения определителя n-го порядка по любому его столбцу. Положительный ответ на этот вопрос дает следующая основная теорема. Теорема 1.2. Каков бы ни был помер столбца j (j = 1, 2, ..., n), для определителя n-го порядка A.11) справедлива формула п А = detA = ^(-l)i + X-M*, A.21) г = 1 называемая разложением этого определителя по j-му столбцу. Доказательство. Достаточно доказать теорему для j = 1, т. е. установить формулу разложения по первому столбцу п Д = ?(-1)< + 1ааМ*1, A-22) ибо если формула A.22) будет установлена, то для доказательства формулы A.21) для любого j = 2, 3, ..., п достаточно, поменяв ро- ролями строки и столбцы, дословно повторить схему рассуждений тео- теоремы 1.1. Формулу A.22) установим по индукции. При п = 2 эта формула проверяется элементарно (так как при п = = 2 миноры элементов первого столбца имеют вид Мх — a^i-, Мг = = ai2, то при п = 2 правая часть A.22) совпадает с правой частью A.10)). Предположим, что формула разложения по первому столбцу A.22) верна для определителя порядка п — 1 и, опираясь на это, убедимся в справедливости этой формулы для определителя порядка п. С этой целью выделим в правой части формулы A.12) для опреде- определителя n-го порядка Л первое слагаемое ацМг , а в каждом из осталь- остальных слагаемых разложим минор (п — 1)-го порядка Mj по первому столбцу. В результате формула A.12) будет иметь вид л = а11м\ + ?х>л-м1;., (L23) j = 2 г = 2
2. ОПРЕДЕЛИТЕЛИ 25 где Oij — некоторые подлежащие определению коэффициенты. Для вы- вычисления Oij заметим, что минор M±j получается при разложении по первому столбцу только одного из миноров (п — 1)-го порядка, от- отвечающих первой строке 15), —минора М-. Запишем в разложении минора Mi (при j ^ 2) по первому столбцу только то слагаемое, кото- которое содержит минор М^ (остальные не интересующие нас слагаемые обозначим многоточием). Учитывая, что элемент од минора М j (при j ^ 2) стоит на пересечении (г — 1)-й строки и первого столбца этого минора, мы получим, что при j ^ 2 М) = (-1^-^ + 1алм\) + ... A.24) Вставляя A.24) в правую часть A.12) (из которой исключено пер- и вое слагаемое) и собирая коэффициент при M1,J мы получим, что ко- коэффициент Oij в формуле A.23) имеет вид . A.25) Остается доказать, что и правая часть A.22) равна сумме, стоящей в правой части A.23) с теми же самыми значениями A.25) для 0^. Для этого в правой части A.22) выделим первое слагаемое ацМ15 а в каждом из остальных слагаемых разложим минор (п — 1)-го по- рядка М1 по первой строке. В результате правая часть A.22) представится в виде суммы пер- первого слагаемого ацМ1 и линейной комбинации с некоторыми коэффи- коэффициентами Oij миноров (п — 2)-го порядка М^-, т. е. в виде ailM\ + j^j^OijM1^ A.26) i=2j=2 и нам остается вычислить множители Оц и убедиться в справедливости для них формулы A.25). Для этого заметим, что минор M±j получается в результате разло- разложения по первой строке только одного из миноров п — 1-го порядка, отвечающих первому столбцу, — минора Мх. Запишем в разложении минора М:(при г ^ 2) по первой строке только то слагаемое, которое содержит минор М Xj (остальные не интересующие нас слагаемые обо- обозначим многоточием). Учитывая, что элемент aij, минора Мх стоит 15) При этом минор М1 предполагается исключенным.
26 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ на пересечении первой строки и (j — 1)-го столбца этого минора, мы получим, что при г ^ 2 М\ = (-lJ'^-^oyMy + ... A.27) Вставляя A.27) в правую часть A.22), из которой исключено первое слагаемое, и собирая коэффициент при М^, мы получим, что вц в сумме A.26) определяется той же самой формулой A.25), что и в ра- равенстве A.23). Теорема 1.2 доказана. 2. Выражение определителя непосредственно через его элементы. Установим формулу, выражающую определитель n-го по- порядка непосредственно через его элементы (минуя миноры). Пусть каждое из чисел ai, «2, • •., oin принимает одно из значений 1, 2, ..., п, причем среди этих чисел нет совпадающих (в таком случае говорят, что числа ai, «2, ..., осп являются некоторой перестановкой чисел 1, 2, ..., п). Образуем из чисел ai, «2, ...,an все возможные пары aiaj и будем говорить, что пара a^aj образует беспорядок, если ai > aj при i < j. Общее число беспорядков, образованных всеми парами, которые можно составить из чисел ai, «2, ..., «П5 обозначим символом N (ai, «2, ..., «п)« С помощью метода индукции установим для определителя п-го порядка A.11) следующую формулу: Л = detA = ^2 (-1OV(ai'a2''"'an)«aiiaa22...aann A.28) ai,a2, •••,an (суммирование в этой формуле идет по всем возможным перестанов- перестановкам ai, «2, ..., ап чисел 1, 2, ..., п; число этих перестановок, очевид- очевидно, равно п!). В случае п = 2 формула A.28) элементарно проверяется (в этом случае возможны только две перестановки 1, 2 и 2, 1, и, поскольку N A, 2) = О, NB, 1) = 1, формула A.28) переходит в равенство A.10)). С целью проведения индукции предположим, что формула A.28) при п > 2 справедлива для определителя порядка (п — 1). Тогда, записав разложение определителя n-го порядка A.11) по первому столбцу 16) : п Л = detA = ^2 (-l)ai + 1aaii'M^1, A.29) ai=l 16) Индекс, по которому производится суммирование, на этот раз нам удобно обозначить буквой ot\.
2. ОПРЕДЕЛИТЕЛИ 27 мы можем, в силу предположения индукции, представить каждый ми- минор (п — 1)-го порядка Мх г в виде чип 1Л _ Г I -с I I 1 — 1 ^_^ v -/ о,а22... аапП ц.ои; (суммирование идет по всем возможным перестановкам «2, ..., ап (п — 1) чисел, в качестве которых берутся все натуральные числа от 1 до п, за исключением числа ot±). Так как из чисел ai, а2, ..., ап, кроме пар, образован- образованных из чисел OL2, ..., «п можно образовать еще только сле- следующие пары «1«2, «1«з5 • • ••> OLian, и поскольку среди чисел «2, ..., ап найдется ровно (а\ — 1) чисел, меньших числа ai, то TV (ai, «2, • •., осп) = N («2, ..., ап) + а\ — 1. Отсюда вытекает, что (—l)^^2'•••'an^)(—l)ai+ 1 = (—l)^^1''•••'an\ и, вставляя A.30) в A.29), мы в точности получим формулу A.28). Тем самым вывод формулы A.28) завершен. В заключение заметим, что в большинстве курсов линейной ал- алгебры формула A.28) положена в основу понятия определителя п-го порядка. 3. Теорема Лапласа17). В этом пункте мы установим замечатель- замечательную формулу, обобщающую формулу разложения определителя п-го порядка по какой-либо его строке. С этой целью введем в рассмотрение миноры матрицы п-го порядка A.8) двух типов. Пусть к — любой номер, меньший п, а ii, г2, ..., ik и ji, J2, • • •? jk~ произвольные номера, удовлетворяющие условиям 1 ^ i\ < i^ < ... ... < ik ^ n, 1 ^ ji < j2 < ... < jk ^ n. Миноры первого типа ^j1j2...jk являются определителями по- порядка к, соответствующими той матрице, которую образуют эле- элементы матрицы A.8), стоящие на пересечении к строк с номерами i\, ii, • • -, ik и к столбцов с номерами jb j2, ..., jk- Миноры второго типа Млгл2 -fe являются определителями поряд- порядка п — к, соответствующими той матрице, которая получается из мат- матрицы A.8) в результате вычеркивания к строк с номерами ii, г2, ..., ik и к столбцов с номерами ji, J2, • • •? jk- Миноры второго типа естественно назвать дополнительными по отношению к минорам первого типа. Теорема 1.3 (теорема Лапласа). При любом номере к, мень- 17) П.С. Лаплас — выдающийся французский астроном, математик и физик A749-1827).
28 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ тем п, и при любых фиксированных номерах строк ii, 22, ..., ik та- таких, что 1 ^ i\ < i<± < ... < ik ^ п, для определителя п-го порядка A.11) справедлива формула Д = detA = ^2 {-l)il + - + ik+jl + - + jk x 31,32, —,3k Х jlJ2---jk Jlj2...Jfc' U^-1-) называемая разложением этого определителя по к строкам ii, 22, ... ..., Zfc. Суммирование в этой формуле идет по всем возможным зна- значениям индексов ji, J2, ..., jk•> удовлетворяющим условиям 1 ^ ji < < h < • • • < h ^ n. Доказательство. Прежде всего заметим, что формула A.31) является обобщением уже доказанной нами формулы разложения определителя n-го порядка по о д н о й его строке с номером н, в которую она переходит при к = 1 (при этом минор М^ совпадает с элементом а^, а минор М^ —это введенный выше минор элемен- элемента ahjl). Таким образом, при к = 1 формула A.31) доказана. Доказатель- Доказательство этой формулы для любого к, удовлетворяющего неравенствам 1 < к < п, проведем по индукции, т. е. предположим, что форму- формула A.31) справедлива для (к — 1) строк, и, опираясь на это, убедимся в справедливости формулы A.31) для к строк. Итак, пусть 1<Кпи фиксированы какие угодно к строк матри- матрицы A.8) с номерами ii, 22, ..., U, удовлетворяющими условию 1 ^ i\ < < i<i < ... < ik ^ п. Тогда, по предположению, для (к — 1) строк с номерами ii, 22, ..., ik-i справедлива формула / \ — у ( а.) х 31,32, •••> Зк - 1 jlJ2---jk-l jlJ2---jk-l V '^ / (суммирование идет по всем возможным значениям индексов ji, ... ..., jk-i удовлетворяющим условиям 1 ^ ji < 32 <• • • < jk-i ^ п). Разложим в формуле A.32) каждый минор М^\\\jk~_\ п0 стро- строке, имеющей в матрице A.8) номер г&. В результате весь опре- определитель А будет представлен в виде некоторой линейной ком- комбинации миноров ^- 2\..-з'к~-\Зк с коэффициентами, которые мы обозначим через Q3\...jk-> т. е. для Л будет справедливо равенство 18) 18) Суммирование в этом равенстве, как и выше, идет по всем возможным зна-
2. ОПРЕДЕЛИТЕЛИ 29 Л = V^ jk6ji...jk ^-ji'jk^ и нам остается вычислить коэффициен- коэффициенты 9j1...jk и убедиться в том, что они равны On...jh = (-1)и + --- + '*+Л + "-+Лм;11;;;';. A.33) С этой целью заметим, что минор (п — к)-го порядка MJx 'Jfc получает- получается в результате разложения по строке с номером г& только следующих к миноров (п — к + 1)-го порядка: Щ'::1(^з.I9) (s = i,2,...,к), A.34) ибо каждый из остальных содержащих строку js миноров (п — к + 1)- го порядка не содержит всех строк и всех столбцов минора М^'"^. В разложении каждого минора A.34) по строке матрицы A.8) с номером ik выпишем только то слагаемое, которое содержит ми- минор М^'''^ (остальные не интересующие нас слагаемые обозначим многоточием). Учитывая при этом, что в каждом миноре A.34) эле- элемент dikjs стоит на пересечении [ik — (к — 1)]-й строки и [js — (s — l)]-ro столбца этого минора 20), мы получим -(s-l)] .Jfh-ik , Теперь нам остается учесть, что в формуле A.32) каждый ми- минор A.34) умножается на множитель и после этого суммируется по всем s от 1 до к. Имея также в виду, что (—lJ~2^~2s = 1, мы получим, что Замечая, что сумма в квадратных скобках представляет собой разло- разложение минора М^"л-к по его последней к-й строке, мы окончательно получим для Oj1...jk формулу A.33). Теорема Лапласа доказана. чениям индексов ji, ..., jj,,, удовлетворяющим условию 1 <С j\ < J2 < • • • ^ Эк ^ п- 19) Символом Mn'"?fc7,1 . . обозначается минор, отвечающий пересечению Л ---Зк 1°ез 3s ) строк с номерами ii, ..., ik - i и всех столбцов с номерами ji, ..., jki за исклю- исключением столбца с номером js, а символом A.34)—дополнительный к нему минор. 20) Это вытекает из того, что строке с номером г& предшествует (к — 1) строк, а столбцу с номером js предшествует (s — 1) столбцов минора М1 " к7б1э • ^? к которому минор A.34) является дополнительным.
30 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ Замечание. В полной аналогии с формулой A.32) записывается и выводится формула разложения определителя по каким-либо к его столбцам. 4. Свойства определителей. Ниже устанавливается ряд свойств, которыми обладает произвольный определитель n-го порядка. 1°) Свойство равноправности строк и столбцов. Транспонированием любой матрицы или определителя называется операция, в результате которой меняются местами строки и столбцы с сохранением порядка их следования. В результате транспонирования матрицы А получается матрица, называемая транспонированной по отношению к матрице А и обозначаемая символом А'. В дальнейшем мы договоримся символами \А\, \В\, \А'\ ... обозна- обозначать определители квадратных матриц А, В, А' ... соответственно. Первое свойство определителя формулируется так: при транспо- транспонировании величина определителя сохраняется, т. е. \А'\ = \А\. Это свойство непосредственно вытекает из теоремы 1.2 (достаточно лишь заметить, что разложение определителя \А\ по первому столбцу тождественно совпадает с разложением определителя \А'\ по первой строке). Доказанное свойство означает полную равноправность строк и столбцов и позволяет нам все последующие свойства устанавливать лишь для строки быть уверенными в справедливости их и для столбцов. 2°) Свойство антисимметрии при перестановке двух строк (или двух столбцов). При перестановке места- местами двух строк (или двух столбцов) определитель сохраняет свою абсолютную величину, но меняет знак на противоположный. Для определителя второго порядка это свойство проверяется элементарно (из правила A.10) сразу вытекает, что определители отличаются лишь знаком). Считая, что п > 2, рассмотрим теперь определитель n-го порядка A.11) и предположим, что в этом определителе меняются местами две строки с номерами i\ и i^. Записывая формулу Лапласа разложения по этим двум строкам, будем иметь Д= ^{-1У1 + ь+*1+ьм}1%Щ%. A.35) Л ,32 При перестановке местами строк с номерами i\ и г2 каждый опреде- определитель второго порядка ^]\\\ в силу доказанного выше меняет знак на противоположный, а все остальные величины, стоящие под знаком
2. ОПРЕДЕЛИТЕЛИ 31 суммы в A.35), совсем не зависят от элементов строк с номерами i\ и %2 и сохраняют свое значение. Тем самым свойство 2°) доказано. 3°) Линейное свойство определителя. Будем говорить, что некоторая строка (ai, a2, ..., ап) является линейной комбинацией строк (Ьь Ь2, • • -, К), (ci, с2, ..., сп), ..., (di, d2j ..., dn) с коэффици- коэффициентами Л, /i, ..., г/, если a^ = A6j + fiCj + ... + vdj для всех j = = 1,2, ..., п. Линейное свойство определителя можно сформулировать так: если в определителе п-го порядка А некоторая г-я строка (ац, а^, • •., din) является линейной комбинацией двух строк (&i, Ь2, ..., Ьп) и (ci, С2? • •-5 сп) с коэффициентами А и \i , то А = AAi + А^Л2; где А\ —определитель, у которого г-я строка равна (pi, 62, ..., bn), а все остальные строки те же, что и у А, а Л2 —определитель, у кото- которого г-я строка равна (ci, C2, ..., сп), а все остальные строки те же, что и у А. Для доказательства разложим каждый из трех определителей Л, Ai и А2 по г-й строке и заметим, что у всех трех определителей все миноры Mj элементов г-й строки одинаковы. Но отсюда следует, что формула А = AAi + /iA2 сразу вытекает из равенств aij — Xbj + + fJLCj (j = 1,2, ..., П). Конечно, линейное свойство справедливо и для случая, когда г-я строка является линейной комбинацией не двух, а нескольких строк. Кроме того, линейное свойство справедливо и для столбцов определи- определителя. Доказанные три свойства являются основными свойствами опреде- определителя, вскрывающими его природу. Следующие пять свойств являются логическими следствиями трех основных свойств. Следствие 1. Определитель с двумя одинаковыми строками (или столбцами) равен нулю. В самом деле, при перестановке двух одинаковых строк, с одной стороны, определитель А не изменится, а с другой стороны, в силу свойства 2°) изменит знак на противоположный. Таким образом, А = = - А, т. е. 2А = 0 или А = 0. Следствие 2. Умножение всех элементов некоторой строки (или некоторого столбца) определителя на число А равносильно умножению определителя на это число А. Иными словами, общий множитель всех элементов некоторой строки (или некоторого столбца) определителя можно вынести за знак этого определителя. (Это свойство вытекает из свойства 3°) при
32 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ Следствие 3. Если все элементы некоторой строки (или неко- некоторого столбца) определителя равны нулю, то и сам определитель равен нулю. (Это свойство вытекает из предыдущего при Л = 0.) Следствие 4. Если элементы двух строк (или двух столбцов) определителя пропорциональны, то определитель равен нулю. (В са- самом деле, в силу следствия 2, множитель пропорциональности мож- можно вынести за знак определителя, после чего останется определитель с двумя одинаковыми строками, который равен нулю согласно след- следствию 1). Следствие 5. Если к элементам некоторой строки (или некото- некоторого столбца) определителя прибавить соответствующие элемен- элементы другой строки (другого столбца), умноженные на произвольный множитель А, то величина определителя не изменится. В самом деле, полученный в результате указанного прибавления определитель можно, в силу свойства 3°), разбить на сумму двух опре- определителей, первый из которых совпадает с исходным, а второй равен нулю, в силу пропорциональности двух строк (или столбцов) и след- следствия 4. Замечание. Следствие 5, как и линейное свойство, допускает более общую формулировку, которую мы приведем для строк: ес- если к элементам некоторой строки определителя прибавить соот- соответствующие элементы строки, являющейся линейной комбинацией нескольких других строк этого определителя (с какими угодно коэф- коэффициентами), то величина определителя не изменится. Следствие 5 широко применяется при конкретном вычислении определителей (соответствующие примеры будут приведены в следу- следующем пункте). Прежде чем сформулировать еще одно свойство определителя, вве- введем полезное понятие алгебраического дополнения данного элемента определителя. Алгебраическим дополнением данного элемента а^ определителя п-го порядка A.11) назовем число, равное (— 1)* + JMJ- и обозначаемое символом Aij. Таким образом, алгебраическое дополнение данного элемента мо- может отличаться от минора этого элемента только знаком. С помощью понятия алгебраического дополнения теоремы 1.1 и 1.2 можно переформулировать так: сумма произведений элементов любой строки (любого столбца) определителя на соответствующие алгебраические дополнения этой строки (этого столбца) равна это- этому определителю. Соответствующие формулы разложения определителя по г-й стро-
2. ОПРЕДЕЛИТЕЛИ 33 ке и по j-му столбцу можно переписать так: п Д = ^ ctijAij (для любого г = 1,2,..., n), A.137) Л = 2_^aijAij (для любого j = 1, 2, ..., п). A-21') г = 1 Теперь мы можем сформулировать последнее свойство определи- определителя: 4°) Свойство алгебраических дополнений соседних строк (или столбцов). Сумма произведений элементов какой- либо строки (или какого-либо столбца) определителя на соответ- соответствующие алгебраические дополнения элементов любой другой стро- строки (любого другого столбца) равна нулю. Доказательство проведем для строк (для столбцов оно проводится аналогично). Записывая подробно формулу A.13') п2п заметим, что поскольку алгебраические дополнения Ац, А^, • •., А{п не зависят от элементов г-й строки ац, а^, • •., <^п, то равенство A.36) является тождеством относительно ац, а^, • •., &гп и сохраняется при замене чисел ац, а^, • •., сцп любыми другими п числами. Заменив а>и, ai2, • • •? a>in соответствующими элементами любой (отличной от г-й) k-й строки а^1, ak2, • • •? «ь5 мы получим слева в A.36) опреде- определитель с двумя одинаковыми строками, равный нулю согласно след- следствию 1. Таким образом, Ацак1 + Ai2ak2 + ... + Ainakn = 0 (для любых несовпадающих г и к). 5. Примеры вычисления определителей. При конкретном вы- вычислении определителей широко используются формулы разложения по строке или столбцу и следствие 5, позволяющее, не изменяя ве- величины определителя, прибавлять к любой его строке (или столбцу) произвольную линейную комбинацию других его строк (или столбцов). Особенно удобно использовать формулу разложения по тем строкам (или столбцам), многие элементы которых равны нулю. В частности, 3 В.А. Ильин, Э.Г. Позняк
34 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ если в данной строке отличен от нуля только один элемент, то разло- разложение по этой строке содержит только одно слагаемое и сразу сводит вопрос о вычислении определителя порядка п к вопросу о вычислении определителя порядка (п — 1) (минора, стоящего в указанном слагае- слагаемом). Если в данной строке отличны от нуля несколько элементов, отвечающих пересечению этой строки с несколькими столбцами, то, применяя к указанным столбцам следствие 5, мы можем, не изменив определителя, обратить в нуль все элементы данной строки, за исклю- исключением одного. Перейдем к конкретным примерам. Пример 1. Пусть требуется вычислить следующий определитель четвертого порядка: Л = 4 99 83 1 О 8 16 О 60 17 134 20 15 43 106 5 Вычитая из первого столбца утроенный последний столбец, будем иметь Л = 1 99 83 1 0 8 16 0 0 17 134 20 0 43 106 5 Далее естественно разложить определитель по первому столбцу. В ре- результате получим 16 0 Л = 1 • 17 134 20 43 106 5 Теперь в определителе третьего порядка вычтем из второго столбца удвоенный первый столбец. При этом будем иметь Л = 8 0 0 17 100 20 43 20 5 Разлагая, наконец, последний определитель третьего порядка по пер- первой строке, окончательно получим Л = 8- 100 20 20 50 = 8E00 - 400) = 800.
2. ОПРЕДЕЛИТЕЛИ 35 Пример 2. Вычислим так называемый треугольный определи- определитель, у которого все элементы, лежащие выше главной диагонали, равны нулю аи О ^22 О О о о а(п-1J ап2 Разлагая определитель Дп по последнему столбцу, мы получим, что он равен произведению элемента апп на треугольный определитель (п — 1)-го порядка Дп_1, равный An_i = аи О ^22 Последний определитель мы снова разложим по его последнему столб- столбцу, в результате чего убедимся в том, что он равен произведению элемента о>(п-\)(n-i) на треугольный определитель (п — 2)-го поряд- порядка Дп _ 2- Продолжая аналогичные рассуждения, мы придем к следую- следующему выражению для исходного определителя: Дп = аца22 • • • апп. Итак, треугольный определитель равен произведению элементов, стоящих на его главной диагонали. Замечание 1. Если у определителя Д равны нулю все элементы, лежащие ниже главной диагонали, то этот определитель также равен произведению элементов, лежащих на его главной диагонали (убедить- (убедиться в этом можно по схеме, изложенной выше, но примененной не к по- последним столбцам, а к последним строкам; можно и просто произвести транспонирование Д и свести этот случай к рассмотренному выше). Аналогичным способом устанавливается, что определитель, у кото- которого равны нулю все элементы, лежащие выше (или ниже) побочной диагонали, равен произведению числа (— i)n(n-1)/2 и всех элементов, лежащих на этой диагонали. Пример 3. Обобщением треугольного определителя второго по- порядка может служить определитель 2п-го порядка следующей блочной АО -лип матрицы -п п •> в которой Л, В и G —произвольные квадратные JD С матрицы n-го порядка, а О — нулевая квадратная матрица n-го по- порядка. Убедимся в том, что для указанного определителя справедлива з*
36 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ формула А О В С = \a\\c\- A.37) Привлекая теорему Лапласа, разложим определитель, стоящий в левой части A.37), по первым п строкам. Так как определитель, у ко- которого хотя бы один столбец состоит из нулей, равен нулю, то в фор- формуле разложения A.31) будет отлично от нуля только одно слагаемое, причем это слагаемое (в силу того, что (_ !)(!+ •+п) + A+-+п) = 1) будет как раз равно \А\ \С\. Замечание 2. Аналогичными рассуждениями легко убедиться в справедливости формулы А В С О \с\ A.38) (А, В, С и О имеют тот же смысл, что и выше). Для этого следует разложить определитель, стоящий в левой части A.38), по последним п строкам и учесть, что (_ ]\[(n+l) + ... + 2n] + [l + ... + n] _ /_ -|\2nBn+l)/2 _ (_1)^ Пример 4. Вычислим теперь так называемый определитель Ван- дермонда Д ь ж2, ..., хп) = 1 г2 1 Х2 2 Х<2 1 . . . Хп о х2п „П — 1 A.39) Вычитая первый столбец из всех последующих, будем иметь 1 Д (жь ж2, ..., хп) = О (х2 - О хп - X п-1 \Х п-1 Ь1 \Х2 Х1 ) ' ' ' \Хп Х1 Далее естественно произвести разложение по первой строке, в ре- 21) Напомним, что символами \А\ , \В\ , \С\ , ... мы договорились обозначать определители матриц А, В, С, ... соответственно.
2. ОПРЕДЕЛИТЕЛИ 37 зультате чего мы получим 02 - xi) \х2 xl) Оз - (хп - (х, п-1 - х п-1\ n - 1 Вычитая теперь из каждой строки предыдущую строку, умножен- умноженную на х\, получим Д Оъ ж2, ..., хп) = (хз - % ^зОз - (хп - \x2 — Ж3 2(х3 - x Далее мы можем вынести за знак определителя общий множитель пер- первого столбца, равный (х2 — х\), общий множитель второго столбца, равный (жз — xi), ..., общий множитель (п — 1)-го столбца, равный {хп — х\). В результате получим Д (жь ж2, ..., хп) = = (х2 - х1)(х3 - хх)... (хп - xi) • Д (х2, хз, • •., хп). Со стоящим в правой части определителем Д (ж2, жз, ..., хп) по- поступим точно так же, как и с Д (xi, ж2, ..., хп). В результате получим, что Д (ж2, хз, • •., хп) = (хз - х2)... (хп - х2) • Д Оз, ..., хп). Продолжая аналогичные рассуждения далее, окончательно полу- получим, что исходный определитель A.39) равен Д Oi, Х2, ..., Хп) = ...{хп - х2) ...{хп - Хп-х). 6. Определитель суммы и произведения матриц. Непосред- Непосредственно из линейного свойства определителя вытекает, что определи- определитель суммы двух квадратных матриц одного и того же порядка п
38 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ А = \\dij\\ и В = \\bij\\ равен сумме всех различных определителей порядка п, которые могут получиться, если часть строк (или столб- столбцов) брать совпадающими с соответствующими строками (или столбцами) матрицы А, а остальную часть — совпадающими с со- соответствующими строками (или столбцами) В. Докажем теперь, что определитель матрицы С, равной произведе- произведению квадратной матрицы А на квадратную матрицу В, равен про- произведению определителей матриц А и В. Пусть порядок всех трех матриц А, В и С равен п, и пусть О — нулевая квадратная матрица порядка п, а (— 1)Е следующая матрица: -1 О О -1 О О -1 В силу примера 2 из предыдущего пункта определитель матрицы (- \)Е равен числу (- 1)п. Рассмотрим следующие две блочные квадратные матрицы порядка 2п: А О (-1)Е В А С (-1)Е О В силу формул A-37) и A.38) из предыдущего пункта, определите- определители этих матриц равны А О (-1)Е В = \A\-\B\, А С (-1)Е О Таким образом,достаточно доказать равенство определителей А О (-l)S В А С {-1)Е О
2. ОПРЕДЕЛИТЕЛИ 39 Подробнее эти два определителя можно записать так: аи О>21 0>п1 -1 0 0 аи О>21 CLnl -1 0 &22 ^п2 0 -1 0 а.12 &22 ^п2 0 -1 ... а1п ... а2п ... апп ... 0 ... 0 ... -1 ... а1п U2n • • • О"пп ... 0 ... 0 0 0 0 Ьц &21 сц С21 СП1 0 0 0 0 0 bl2 Ъ22 ЬП2 С12 С22 СП2 0 0 ... 0 ... 0 ... 0 ... Ь1п ... b2n ••• Опп ... cin ... с2п ... спп ... 0 ... 0 О О -1 О о о A.40) Для того чтобы убедиться в равенстве этих двух определителей, достаточно заметить, что первые п столбцов у этих определителей сов- совпадают, а каждый столбец второго определителя A.40) с номером п + к (где к = 1, 2, ..., п), в силу формулы сц = Ylk = i aikbkj, получается в результате прибавления к (п + к)-му столбцу первого определителя A.40) линейной комбинации первых п его столбцов с коэффициентами, соответственно равными bki, ^2, • • •? bkn- Таким образом, определите- определители A.40) равны в силу следствия 5 из п. 3. В заключение заметим, что непосредственно из формулы A.37) вы- i л - - А текает, что определитель прямой суммы | А ( О В двух мат- матриц А и В равен произведению определителей этих матриц. 7. Понятие обратной матрицы. Пусть А — квадратная матрица n-го порядка, а .Е-единичная квадратная матрица того же порядка (см. п. 2 § 1). Матрица В называется правой обратной по отношению к матри- матрице А, если АВ = Е. Матрица С называется левой обратной по отношению к матрице А, если С А = Е. Так как обе матрицы А и Е являются квадратными матрицами порядка п, то матрицы В и С (при условии, что они существуют) также являются квадратными матрицами порядка п. Убедимся в том, что если обе матрицы В и С существуют, то
40 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ они совпадают между собой. В самом деле, на основании равенств A.7) (см. п. 2 §1), соотношений АВ = Е, С А = Е и сочетательного свойства произведения матриц получим С = СЕ = С{АВ) = {СА)В = ЕВ = В. Естественно, возникает вопрос об условиях на матрицу А, при вы- выполнении которых для этой матрицы существуют как левая, так и правая обратные матрицы 22). Теорема 1.4. Для того, чтобы для матрицы А существовали левая и правая обратные матрицы, необходимо и достаточно, чтобы определитель det А матрицы А был отличен от нуля. Доказательство. 1) Необходимость. Если для матрицы А существует хотя бы одна из обратных матриц, например В, то из со- соотношения А • В = Е мы получим, что det А • det В = det E — 1 23), откуда вытекает, что det А ф 0. 2) Достаточность. Пусть определитель Л = det А отличен от нуля. Обозначим, как и выше, символом Ац алгебраические допол- дополнения элементов ац матрицы А и составим матрицу В, в г-й строке которой стоят алгебраические дополнения г-го столбца матрицы А, поделенные на величину определителя Л: В = Ац Л Ai2 Л Ащ Л A21 Л А22 л А2п Л '" Л Ап2 '" Л '" Л A.41) Убедимся в том, что эта матрица В является как правой, так и левой обратной по отношению к матрице А. Достаточно доказать, что оба произведения АВ и В А являются единичной матрицей. Для этого достаточно заметить, что у обоих про- произведений любой элемент, не лежащий на главной диагонали, равен нулю, ибо после выноса множителя 1/А этот элемент равен сумме произведений элементов одной строки (или одного столбца) на соот- соответствующие алгебраические дополнения другой строки (или другого столбца). Что же касается элементов, лежащих на главной диагонали, то у обоих произведений АВ и В А все такие элементы равны едини- единице в силу того, что сумма произведений элементов и соответствующих 22) И, стало быть, эти матрицы совпадают. 23) det Е = 1 в силу примера 2 из п. 5 этого параграфа.
§ 3. ТЕОРЕМА О БАЗИСНОМ МИНОРЕ МАТРИЦЫ 41 алгебраических дополнений одной строки (одного столбца) равна опре- определителю. Теорема доказана. Замечание 1. Квадратную матрицу А, определитель det А которой отличен от нуля, принято называть невырожденной. Замечание 2. Впредь мы можем опускать термины «левая» и «правая» и говорить просто о матрице ??, обратной по отношению к невырожденной матрице А и определяемой соотношениями АВ = = В А = Е. Очевидно также, что свойство быть обратной матрицей взаимно в том смысле, что если В является обратной для А, то А яв- является обратной для В. Матрицу, обратную к матрице А, впредь мы будем обозначать символом А~ х. § 3. Теорема о базисном миноре матрицы 1. Понятие линейной зависимости строк. Выше мы уже до- договорились называть строку 24) А = (ai, a2, ..., ап) линейной комби- комбинацией строк В = (Ьь &2? • • •? ^п), • • • •> С = (ci, C2, ..., сп), если для некоторых вещественных чисел Л, ..., \± справедливы равенства aj = Xbj + ... + plcj (j = 1, 2, ..., n). A.42) Указанные п равенств A.42) удобно записать в виде одного равенства А = ХВ + ... + fiC. A.43) Всякий раз, когда будет встречаться равенство A.43), мы будем понимать его в смысле п равенств A.42). Введем теперь понятие линейной зависимости строк. Определение. Строки А = (ai, a2, ..., ап), В = (bi, &25 • • • ..., Ьп), ..., С = (ci, C2, ..., сп) назовем линейно зависимыми, если найдутся такие числа а, /3, ..., 7? не все равные нулю, что справедли- справедливы равенства aaj + Pbj + ... + jcj =0 (j = 1, 2, ..., n). A.44) n равенств A.44) удобно записать в виде одного равенства аА + РВ + ... + 7С = О, A.45) в котором О = @, 0, ..., 0) обозначает нулевую строку. 24) Каждую строку можно рассматривать как матрицу. Поэтому естественно использовать для обозначения строк большие латинские буквы.
42 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ Строки, не являющиеся линейно зависимыми, называются линейно независимыми. Можно дать и «самостоятельное» определение линей- линейной независимости строк: строки А, В, ..., С называются линейно независимыми, если равенство A.45) возможно лишь в случае, когда все числа а, C, ..., j равны нулю. Докажем следующее простое, но важное утверждение. Теорема 1.5. Для того чтобы строки А, В, ..., С были линей- линейно зависимы, необходимо и достаточно, чтобы одна из этих строк являлась линейной комбинацией остальных строк. Доказательство. 1) Необходимость. Пусть строки A, В, ..., С линейно зависимы, т. е. справедливо равенство A.45), в котором хотя бы одно из чисел а, C, ..., 7 отлично от нуля. Ради определенности допустим, что а / 0. Тогда, поделив A.45) на а и введя обозначения Л = — C/а, ..., \i = —j/a, мы можем переписать A.45) в виде А = ХВ + ... + fiC, A.46) а это и означает, что строка А является линейной комбинацией строк B, ...,С. 2) Достаточность. Пусть одна из строк (например, А) явля- является линейной комбинацией остальных строк. Тогда найдутся числа Л, ..., \i такие, что справедливо равенство A.46). Но это последнее ра- равенство можно переписать в виде (- 1)А + ХВ + ... + цС = О 25). Так как из чисел — 1, Л, ..., \i одно отлично от нуля, то последнее ра- равенство устанавливает линейную зависимость строк А, В, ..., С. Тео- Теорема доказана. Конечно, во всех проведенных выше рассуждениях термин «стро- «строки» можно заменить термином «столбцы». 2. Теорема о базисном миноре. Рассмотрим произвольную (не обязательно квадратную) матрицу А = Минором к-го порядка матрицы А будем называть определитель k-ro порядка с элементами, лежащими на пересечении любых к строк и 25) Здесь О = @, 0, ..., 0) —нулевая строка.
§ 3. ТЕОРЕМА О БАЗИСНОМ МИНОРЕ МАТРИЦЫ 43 любых к столбцов матрицы А. (Конечно, к не превосходит наименьшее из чисел т и п.) Предположим, что хотя бы один из элементов ац матрицы А отли- отличен от нуля. Тогда найдется такое целое положительное число г, что будут выполнены следующие два условия: 1) у матрицы А имеется минор r-го порядка, отличный от нуля, 2) всякий минор (г + 1)-го и более высокого порядка (если таковые существуют), равен нулю. Число г, удовлетворяющее требованиям 1) и 2), назовем рангом матрицы А 26). Тот минор r-го порядка, который отличен от нуля, на- назовем базисным минором (конечно, у матрицы А может быть несколь- несколько миноров r-го порядка, отличных от нуля). Строки и столбцы, на пересечении которых стоит базисный минор, назовем соответственно базисными строками и базисными столбцами. Докажем следующую основную теорему. Теорема 1.6 (теорема о базисном миноре). Базисные строки (ба- (базисные столбцы) линейно независимы. Любая строка (любой стол- столбец) матрицы А является линейной комбинацией базисных строк (базисных столбцов). Доказательство. Все рассуждения проведем для строк. Если бы базисные строки были линейно зависимы, то по теореме 1.5 одна из этих строк являлась бы линейной комбинацией других базис- базисных строк, и мы могли бы, не изменяя величины базисного минора, вычесть из этой строки указанную линейную комбинацию и получить строку, целиком состоящую из нулей, а это противоречило бы тому, что базисный минор отличен от нуля. Итак, базисные строки линейно независимы. Докажем теперь, что любая строка матрицы А является линейной комбинацией базисных строк. Так как при произвольных переменах строк (или столбцов) определитель сохраняет свойство равенства ну- нулю, то мы, не ограничивая общности, можем считать, что базисный минор находится в левом верхнем углу матрицы A.47), т. е. располо- расположен на первых г строках и первых г столбцах. Пусть j — любое число от 1 до п, а к — любое число от 1 до т. Убедимся в том, что определитель (г + 1)-го порядка Bц 0-12 • • • CL\r CL\j A.48) arr arj &Ш • • • &кг 0>kj 26) Ранг матрицы А, все элементы которой — нули, по определению равен нулю.
44 ГЛ. 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ равен нулю. Если j ^ г или к ^ г, то указанный определитель будет равен нулю в силу того, что у него будет два одинаковых столбца или две одинаковые строки. Если же оба числа j и к превосходят г, то A.48) является минором матрицы А порядка (г + 1), а всякий такой минор равен нулю (по определению базисного минора). Итак, определитель A.48) равен нулю при всех j от 1 до п и всех к от 1 до т. Но тогда, разложив этот определитель по последнему столбцу и обозначив не зависящие от номера j алгебраические дополнения эле- элементов этого столбца символами A\j = ci, A^j — ci-, ..., Arj = cr, Akj = cr + i, мы получим, что C2OL2J + ... + Crarj + Cr + iOLkj = 0 (для всех j = 1,2,..., n). Учитывая, что в последних равенствах ал- алгебраическое дополнение cr +1 = Akj совпадает с заведомо отличным от нуля базисным минором, мы можем поделить каждое из этих ра- равенств на сг _|_ 1. Но тогда, вводя обозначения \ - Cl \ - °2 \ - Сг Л\ — , Л2 — , • • ., Лг — , Сг _|_ 1 Сг _|_ 1 Сг _|_ 1 мы получим, что akj = Xiclij + ^2&2j + ... + Xrarj (для всех j = = 1, 2, ..., п), а это и означает, что &-я строка является линейной комбинацией первых г (базисных) строк. Теорема доказана. 3. Необходимое и достаточное условие равенства нулю определителя. Теорема 1.7. Для того чтобы определитель п-го порядка А был равен пулю, необходимо и достаточно, чтобы его строки (столбцы) были линейно зависимы. Доказательство. 1) Необходимость. Если определитель п-го порядка А равен нулю, то базисный минор его матрицы име- имеет порядок г, заведомо меньший п. Но тогда хотя бы одна из строк является не базисной. По теореме 1.6 эта строка является линейной комбинацией базисных строк. В эту линейную комбинациюмы можем
§ 3. ТЕОРЕМА О БАЗИСНОМ МИНОРЕ МАТРИЦЫ 45 включить и все оставшиеся строки, поставив перед ними нули. Итак, одна строка является линейной комбинацией остальных. Но тогда по теореме 1.5 строки определителя линейно зависимы. 2) Достаточность. Если строки Л линейно зависимы, то по те- теореме 1.5 одна строка Ai является линейной комбинацией остальных строк. Вычитая из строки Ai указанную линейную комбинацию, мы, не изменив величины Л, получим одну строку, целиком состоящую из нулей. Но тогда определитель Л равен нулю (в силу следствия 3 из п. 4 § 2). Теорема доказана.
ГЛАВА 2 ЛИНЕЙНЫЕ ПРОСТРАНСТВА Из курса аналитической геометрии читатель знаком с операцией сложения свободных векторов и с операцией умножения вектора на ве- вещественное число, а также со свойствами этих операций. В настоящей главе изучаются множества объектов любой природы, для элементов которых каким-либо способом (причем, безразлично каким) определе- определены операция сложения элементов и операция умножения элемента на вещественное число, причем указанные операции обладают теми же свойствами, что и соответствующие операции над геометрическими векторами. Такие множества, называемые линейными пространства- пространствами, обладают целым рядом общих свойств, которые и будут установ- установлены в настоящей главе. § 1. Понятие линейного пространства 1. Определение линейного пространства. Множество R эле- элементов x,y,z,... любой природы называется линейным (или аффин- аффинным) пространством, если выполнены следующие три требования. I. Имеется правило, посредством которого любым двум элементам х и у множества R ставится в соответствие третий элемент z это- этого множества, называемый суммой элементов х и у и обозначаемый символом z = х + у. П. Имеется правило, посредством которого любому элементу х мно- множества R и любому вещественному числу Л ставится в соответствие элемент и этого множества, называемый произведением элемента х на число А и обозначаемый символом и = Лх или и = хЛ. III. Указанные два правила подчинены следующим восьми аксио- аксиомам: 1°)х + у = у + х (переместительное свойство суммы); 2°) (х + у) + z = х + (у + z) (сочетательное свойство суммы); 3°) существует нулевой элемент 0 такой, что х + 0 = х для любого элемента х (особая роль нулевого элемента); 4°) для каждого элемента х существует противоположный элемент х' такой, что х + х' = 0;
§ 1. ПОНЯТИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА 47 5°) 1-х = х для любого элемента х (особая роль числового мно- множителя 1); 6°) A(/ix) = (A/i)x (сочетательное относительно числового множи- множителя свойство); 7°) (А + /i)x = Ах + /хх (распределительное относительно суммы числовых множителей свойство); 8°) А(х + у) = Ах + Ау (распределительное относительно суммы элементов свойство). Подчеркнем, что при введении понятия линейного пространства мы абстрагируемся не только от природы изучаемых объектов, но и от конкретного вида правил образования суммы элементов и произведе- произведения элемента на число (важно лишь, чтобы эти правила удовлетворяли восьми аксиомам, сформулированным в данном выше определении). Если же природа изучаемых объектов и вид правил образования суммы элементов и произведения элемента на число указаны г), то мы будем называть линейное пространство конкретным. Приведем примеры конкретных линейных пространств. Пример 1. Рассмотрим множество всех свободных векторов в трехмерном пространстве. Операции сложения указанных векторов и умножения этих векторов на числа определим так, как это было сде- сделано в аналитической геометрии (сложение векторов определим по правилу «параллелограмма»; при умножении вектора на веществен- вещественное число А длина этого вектора умножается на |А|, а направление при А > 0 остается неизменным, а при А < 0 —изменяется на противопо- противоположное) . Элементарно проверяется справедливость всех аксиом 1°)-8°) (справедливость всех аксиом, за исключением аксиомы 5°), установ- установлена в курсе аналитической геометрии 2), справедливость аксиомы 5°) не вызывает сомнений). Таким образом, множество всех свободных векторов в пространстве с так определенными операциями сложения векторов и умножения их на числа представляет собой линейное пространство, которое мы будем обозначать символом В%. Аналогичные множества векторов на плоскости и на прямой, также являющиеся линейными пространствами, мы будем обозначать соот- соответственно символами ??2 и В\. Пример 2. Рассмотрим множество {х} всех положительных 1) Разумеется, эти правила должны быть указаны так, чтобы были справед- справедливы свойства 1°)—8°), перечисленные в данном выше определении в виде аксиом. 2) См. выпуск «Аналитическая геометрия», гл.2, § 1, п. 2.
48 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА вещественных чисел. Определим сумму двух элементов х и у этого множества как произведение вещественных чисел х и у (понимаемое в обычном в теории вещественных чисел смысле). Произведение эле- элемента х множества {х} на вещественное число Л определим как воз- возведение положительного вещественного числа х в степень Л. Нулевым элементом множества {х} будет являться вещественное число 1, а про- противоположным (для данного элемента х) элементом будет являться вещественное число 1/х. Легко убедиться в справедливости всех аксиом 1°)—8°). В самом де- деле, справедливость аксиом 1°) и 2°) вытекает из переместаительного и сочетательного свойств произведения вещественных чисел; справед- справедливость аксиом 3°) и 4°) вытекает из элементарных равенств х • 1 = = ж, х • 1/х = 1 (для любого вещественного х > 0); аксиома 5°) эквивалентна равенству х1 = х; аксиомы 6°) и 7°) справедливы в си- силу того, что для любого х > 0 и любых вещественных Аи/i имеют место соотношения (жм)л = жЛм, х(л + ^) = хх • жм; наконец, справед- справедливость аксиомы 8°) следует из того, что для любых положительных х и у и для любого вещественного Л имеет место равенство (ху)х = = ххух. Итак, мы убедились, что множество {ж} с так определенными операциями сложения элементов и умножения их на числа является линейным пространством. Пример 3. Важный пример линейного пространства дает множе- множество Ап, элементами которого служат упорядоченные совокупности п произвольных вещественных чисел (xi, Ж2, ..., хп). Элементы это- этого множества мы будем обозначать одним символом х, т. е. будем писать х = (xi, Ж2, ..., жп), и при этом называть вещественные чи- числа xi, Ж2, ..., хп координатами элемента х. В анализе множество Ап обычно называют п-мерным координат- координатным пространством 3). В алгебраической трактовке множество Ап можно рассматривать как совокупность всевозможных строк, каждая из которых содержит п вещественных чисел (что мы уже и делали в §3гл.1). Операции сложения элементов множества Ап и умножения этих элементов на вещественные числа определим правилами: (жь ж2, ..., хп) + B/ь 2/2, • • -, Уп) = (xi + 2/ь х2 + 2/2, • • -, хп + 2/п), A(xi, ж2, ..., хп) = (Axi, Аж2, • • -, Ажп). Предоставляем читателю элементарную проверку справедливости всех аксиом 1°)-8°) и того факта, что нулевым элементом рассмат- 3) См. выпуск «Основы математического анализа», часть 1, гл. 14, § 1, п. 4.
§ 1. ПОНЯТИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА 49 риваемого множества является элемент 0 = @, 0, .. .,0), а противопо- противоположным для элемента (xi, Ж2, ..., хп) является элемент (— х\, — Ж2, ... • • -1 Хп. Пример 4. Рассмотрим далее множество С [а, Ь] всех функций х = = x(t), определенных и непрерывных на сегменте а ^ t ^ Ъ. Опера- Операции сложения таких функций и умножения их на вещественные числа определим обычными правилами математического анализа. Элемен- Элементарно проверяется справедливость аксиом 1°)-8°) 4), позволяющая за- заключить, что С [а, Ь] множество является линейным пространством. Пример 5. Следующим примером линейного пространства может служить множество {Рп (?)} всех алгебраических многочленов степе- степени, не превышающей натурального числа п, с операциями, определен- определенными так же, как в предыдущем примере. Заметим, что множество {Рп (?)}, если его рассматривать на сегменте а ^ t ^ 6, является под- подмножеством линейного пространства С [а, Ь], рассмотренного в при- примере 4. Замечание 1. Для разъяснения изучаемого понятия линейного пространства укажем примеры множеств, по той или иной причине не являющихся линейными пространствами: а) множество всех векторов пространства с исключением векторов, коллинеарных некоторой прямой I (ибо в пределах этого множества нельзя складывать векторы, симметричные относительно указанной прямой /); б) множество всех многочленов степени, точно равной натурально- натуральному числу п (сумма двух таких многочленов может оказаться много- многочленом степени ниже п); в) множество всех многочленов степени, не превышающей нату- натурального п, все коэффициенты которых положительны (элементы такого множества нельзя умножить на отрицательные вещественные числа). Замечание 2. Отметим, что элементы произвольного линейно- линейного пространства принято называть векторами. То обстоятельство, что часто термин «вектор» употребляется в более узком смысле, при этом не приводит к недоразумениям, а, напротив, взывая к сложившим- сложившимся геометрическим представлениям, позволяет уяснить, а зачастую и предвидеть ряд результатов, справедливых для линейных пространств произвольной природы. Замечание 3. В сформулированном нами определении линейно- 4) В частности, нулевым элементом пространства С [а, Ь] является функция, тождественно равная нулю на сегменте а <С t <C Ь. 4 В.А. Ильин, Э.Г. Позняк
50 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА го пространства числа A, /i, ... брались из множества вещественных чисел. Поэтому определенное нами пространство естественно назвать вещественным линейным пространством. При более широком подхо- подходе можно брать A, /i, ... из множества комплексных чисел. При этом мы придем к понятию комплексного линейного пространства. 2. Некоторые свойства произвольных линейных про- пространств. Из аксиом 1°)-8°) в качестве логических следствий можно получить ряд утверждений, справедливых для произвольных линей- линейных пространств. В качестве примера установим два утверждения. Теорема 2.1. В произвольном линейном пространстве существу- существует единственный нулевой элемент и для каждого элемента х суще- существует единственный противоположный элемент. Доказательство. Существование хотя бы одного нулевого эле- элемента утверждается в аксиоме 3°). Предположим, что существуют два нулевых элемента Oi и 02- Тогда, полагая в аксиоме 3°) сначала х = = Oi, 0 = О2, а затем х = 02, 0 = Oi, мы получим два равенства Oi + O2 = Oi, O2 + Oi = O2, левые части которых (в силу аксио- аксиомы 1°)) равны. Стало быть, в силу транзитивности знака « = » равны и правые части двух последних равенств, т. е. Oi = O2, и единственность нулевого элемента установлена. Существование для каждого элемента х хотя бы одного противо- противоположного элемента у утверждается в аксиоме 4°). Предположим, что для некоторого элемента х существует два противоположных элемента У1 и у2, так что x + yi = 0 и х + у2 = 0. Но тогда, в силу аксиом 3°), 2°) и 1°), У1 = У1 + 0 = У1 + (х + у2 = (у! + х) + у2 = 0 + + у2 = у2 + 0 = у2, т. е. yi = У2, и единственность для каждого элемента х противоположного элемента доказана. Теорема доказана. Теорема 2.2. В произвольном линейном пространстве 1) нулевой элемент 0 равен произведению произвольного элемен- элемента х на вещественное число 0; 2) для каждого элемента х противоположный элемент равен про- произведению этого элемента х на вещественное число — 1. Доказательство. 1) Пусть х — произвольный элемент, а у — ему противоположный. Последовательно применяя аксиомы 3°), 4°), 2°), 5°), 1°), 7°) и снова 5°) и 4°), будем иметь х-0 = х-0 + 0 = х-0 + + (х + у) = (х • 0 + х) + у = (х • 0 + х • 1) + у = х@ + 1) + у = = х • 1 + у = х + у = 0, т. е. х • 0 = 0. 2) Пусть х — произвольный элемент, у = (— 1) • х. Используя ак- аксиомы 5°), 7°), 1°) и уже доказанное равенство х • 0 = 0, получим равенство х + у = х + (- 1)х = 1 • х + (- 1)х = [1 + (- 1)]х = = 0-х = х • 0 = 0, которое и доказывает (в силу аксиомы 4°)), что у — элемент противоположный х. Теорема доказана.
§ 2. БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 51 Отметим в заключение, что аксиомы 1°)-4°) позволяют доказать существование и единственность разности любых двух элементов линейного пространства х и у, которая определяется как элемент z, удовлетворяющий условию z + у = х 5) . (Таковым элементом служит сумма z = х + (— 1)у.) § 2. Базис и размерность линейного пространства 1. Понятие линейной зависимости элементов линейного пространства. В курсе аналитической геометрии 6) было введено по- понятие линейной зависимости векторов, а в п. 1 § 3 предыдущей главы — понятие линейной зависимости строк (или, что то же самое, элементов пространства Ап, рассмотренного в примере 3 из п. 1 § 1 настоящей главы). Обобщением этих понятий является понятие линейной зависимо- зависимости элементов совершенно произвольного линейного пространства, к выяснению которого мы и переходим. Рассмотрим произвольное ве- вещественное линейное пространство R с элементами х, у, ..., z, ... Линейной комбинацией элементов х, у, ..., z пространства R мы будем называть сумму произведений этих элементов на произвольные вещественные числа, т. е. выражение вида ах + /?у + ... + jz, B.1) где а, /3, ..., 7— какие угодно вещественные числа. Определение 1. Элементы х, у, ..., z пространства R называ- называются линейно зависимыми, если найдутся такие вещественные числа а, /3, ..., 7, из которых хотя бы одно отлично от нуля, что линейная комбинация элементов х, у, ..., z с указанными числами является ну- нулевым элементом пространства R, т. е. имеет место равенство ах + /?у + ... + 7Z = 0. B.2) Элементы х, у, ..., z, не являющиеся линейно зависимыми, мы будем называть линейно независимыми. Дадим другое определение линейно независимых векторов, постро- построенное на логическом отрицании содержания определения 1. Определение 2. Элементы х, у, ..., z пространства R называют- называются линейно независимыми, если линейная комбинация B.1) является 5) Достаточно дословно повторить доказательство, данное в теории веществен- вещественных чисел (см. выпуск «Основы математического анализа», часть 1, гл. 2, § 2, п. 3). 4*
52 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА нулевым элементом пространства R лишь при условии а = /3 = ... ...=7 = 0. Теорема 2.3. Для того чтобы элементы х, у, ..., z простран- пространства R были линейно зависимы, необходимо и достаточно, чтобы один из этих элементов являлся линейной комбинацией остальных элементов. Доказательство. 1) Необходимость. Пусть элементы х, у, ..., z линейно зависимы, т. е. справедливо равенство B.2), в ко- котором хотя бы одно из чисел а, C, ..., 7 отлично от нуля. Пусть, ради определенности, а ф 0. Тогда, поделив B.2) на а и введя обозначения /3 7 Л = , ...,/i = , мы можем переписать B.2) в виде а а х = Лу + ... + /iz, B.3) а это и означает, что элемент х является линейной комбинацией эле- элементов х, у, ..., z. 2) Достаточность. Пусть один из элементов (например, х) яв- является линейной комбинацией остальных элементов. Тогда найдутся числа Л, ..., \i такие, что справедливо равенство B.3). Но это послед- последнее равенство можно переписать в виде (- 1)х + Лу + ... + fjiz = 0. B.4) Так как из чисел (—1), А, ..., \i одно отлично от нуля, то равен- равенство B.4) устанавливает линейную зависимость элементов х, у, ..., z. Теорема доказана. Справедливы два элементарных утверждения. 1. Если среди элементов х, у, ..., z имеется нулевой элемент, то эти элементы линейно зависимы. В самом деле, если, например, х = = 0, то равенство B.2) справедливо при а = 1, /3 = ... = *у = 0- 2. Если часть элементов х, у, ..., z являются линейно зависимы- зависимыми, то и все эти элементы являются линейно зависимыми. В самом деле, если, например, элементы х, у, ..., z линейно зависимы, то спра- справедливо равенство f3y + ... + 7Z = 0, в котором не все числа /?, ..., 7 равны нулю. Но тогда с теми же числами C, ..., j и с а = 0 будет справедливо равенство B.2). В заключение рассмотрим вопрос о линейной зависимости элемен- элементов пространства Ап, введенного в примере 3 п. 1 § 1. 6) См. выпуск «Аналитическая геометрия», гл.2, § 1, п.З.
§ 2. БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 53 Докажем, что п элементов указанного пространства ei = A,0, 0, ..., 0), е2 = @, 1, 0, ..., 0), е3 = @,0, 1, ...,0), B.5) еп = @, 0, 0, ..., 1) являются линейно независимыми, а совокупность п элементов B.5) и еще одного произвольного элемента х = (xi, ж2, ..., хп) про- пространства Ап уже образует линейно зависимую систему элементов. Рассмотрим линейную комбинацию элементов B.5) с какими-либо числами «1, а2, аз, ..., ап. В силу аксиом эта линейная комбинация представляет собой элемент aiei + а2е2 + ... + апеп = (аь а2, • •., «п)> который является нулевым лишь при условии а\ = а2 = ... = ап = = 0. Но это и означает линейную независимость элементов B.5). Докажем теперь, что система, состоящая из п элементов B.5) и еще одного произвольного элементах = (xi, ж2, ..., хп) простран- пространства Ап, уже является линейно зависимой. В силу теоремы 2.3 до- достаточно доказать, что элемент х = (xi, х2, ..., хп) представляет собой линейную комбинацию элементов B.5), а это очевидно, ибо в силу аксиом х = (жь ж2, ..., хп) = xiei + х2е2 + ... + хпеп. 2. Базис и координаты. Рассмотрим произвольное вещественное линейное пространство R. Определение. Совокупность линейно независимых элементов ei, в2, ..., еп пространства R называется базисом этого пространства, если для каждого элемента х пространства R найдутся вещественные числа xi, Ж2, ..., хп такие, что справедливо равенство х = xiei + ж2е2 + ... + хпеп. B.6) При этом равенство B.6) называется разложением элемента х по ба- базису ei, e2j ..., еп, а числа xi, x2j ..., хп называются координатами элемента х (относительно базиса ei, е2, ..., еп). Докажем, что каждый элемент х линейного пространства R мо- может быть разложен по базису ei,e2, ..., еп единственным спо- способом, т. е. координаты каждого элемента х относительно базиса ei, e2, ..., еп определяются однозначно.
54 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Допустим, что для некоторого элемента х наряду с разложением B.6) справедливо еще и другое разложение по тому же самому базису х = x[ei + х2е2 + ... + х'пеп. B.7) Почленное вычитание равенств B.6) и B.7) приводит нас к соотно- соотношению 7) (xi - xi)ei + (х2 - х'2)е2 + ... + (хп - х'п)еп = 0. B.8) В силу линейной независимости базисных элементов ei, е2, ..., еп, соотношение B.8) приводит к равенствам х\ — х[ = 0, ж2 — х'2 = = 0, ..., хп — х'п = 0 или х\ — х[, Х2 = х2, ..., хп = х'п. Единствен- Единственность разложения по базису доказана. Значение базиса заключается также и в том, что операции сложения элементов и умножения их на числа при задании базиса превращаются в соответствующие операции над числами — координатами этих элементов. Именно справедливо сле- следующее утверждение. Теорема 2.4. При сложении двух любых элементов линейного пространства R их координаты {относительно любого базиса про- пространства R) складываются; при умножении произвольного элемен- элемента на любое число X все координаты этого элемента умножаются на X. Доказательство. Пусть ei, е2, ..., еп — произвольный базис пространства R, х = x±ei + ж2е2 + ... + хпеп и у = yiei + у2е2 + ... ... + Упеп~ любые два элемента этого пространства. Тогда в силу аксиом 1°)-8°) х + у = (xi + у1)е1 + (х2 Ах = (Axi)ei + (Аж2)е2 + ... + (Ажп)еп. В силу единственности разложения по базису теорема доказана. Приведем примеры базисов конкретных линейных пространств. Из аналитической геометрии известно, что любые три некомпла- некомпланарных вектора образуют базис в линейном пространстве В% всех сво- свободных векторов (это пространство рассмотрено в примере 1 п. 1 § 1). Заметим далее, что совокупность п элементов B.5), рассмотренных в конце п. 1, образует базис в линейном пространстве Ап, введенном в примере 3 п. 1 § 1. 7) Возможность почленного вычитания равенств B.6) и B.7) и производимой группировки членов вытекает из аксиом 1°)—8°).
§ 2. БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 55 В самом деле, в конце предыдущего пункта доказано, что элементы B.5) линейно независимы и что любой элемент х = (xi, Ж2, ..., хп) пространства Ап представляет собой некоторую линейную комбина- комбинацию элементов B.5). Убедимся, наконец, что базис линейного пространства {ж}, введен- введенного в примере 2 п. 1 § 1, состоит из одного элемента, в качестве которо- которого можно взять любой ненулевой элемент этого пространства (т. е. любое положительное вещественное число жо, не равное 1). Достаточ- Достаточно доказать, что для любого положительного вещественного числа х найдется вещественное число Л такое, что х = Xq 8). Но это очевидно: достаточно взять Л = loga,o x. 3. Размерность линейного пространства. Как и выше, будем рассматривать произвольное вещественное линейное пространство R. Определение 1. Линейное пространство R называется п-мерным, если в нем существует п линейно независимых элементов, а любые (п + 1) элементов уже являются линейно зависимыми. При этом число п называется размерностью пространства R. Размерность пространства R обычно обозначают символом dim R. Определение 2. Линейное пространство R называется бесконеч- бесконечномерным, если в нем существует любое число линейно независимых элементов 9). В настоящей книге мы будем изучать, в основном, пространства конечной размерности п. Бесконечномерные пространства составляют предмет специального изучения. (Они изучаются в гл. 10 и 11 выпуска «Основы математического анализа», часть П.) Выясним связь между понятием размерности пространства и вве- введенным в предыдущем пункте понятием базиса. Теорема 2.5. Если R—линейное пространство размерности п, то любые п линейно независимых элементов этого пространства об- образуют его базис. Доказательство. Пусть ei, в2, ..., еп —любая система п ли- линейно независимых элементов пространства R (существование хотя бы одной такой системы вытекает из определения 1). Если х —любой элемент R, то, согласно определению 1, система (п + 1) элементов х, ei, в2, ..., еп линейно зависима, т. е. найдутся не все равные нулю числа «о, «i, «2, • • •? оьп такие, что справедливо 8) Напомним, что произведение элемента хо на число Л определяется как чи- число Xq. 9) Для обозначения того, что пространство R является бесконечномерным, используют следующую символику: dim Я = сю.
56 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА равенство + aiei + a2e2 + ... + otnen = 0. B.9) Заметим, что число «о заведомо отлично от нуля (ибо в противном случае из равенства B.9) вытекала бы линейная зависимость элемен- элементов ei, е2, ..., еп). Но тогда, поделив равенство B.9) на «о и положив Xi = , ж2 = , ..., хп = , мы получим из B.9) х = xiei + ж2е2 + ... + жпеп. B.10) Так как х — произвольный элемент R, то равенство B.10) доказывает, что система элементов ei, е2, ..., еп является базисом пространства R. Теорема доказана. Теорема 2.6. Если линейное пространство R имеет базис, сос- состоящий из п элементов, то размерность R равна п. Доказательство. Пусть система п элементов ei, е2, ..., еп яв- является базисом пространства R. Достаточно доказать, что любые (п + 1) элементов этого пространства xi, x2, ..., xn + i линейно зави- зависимы 10). Разложив каждый из этих элементов по базису, будем иметь xi = anei + ai2e2 + ... + ainen, x2 = ft2iei + a22e2 + ... + a2nen, где ац, ai2, • • -5 tt(n+i)n~HeK0T0Pbie вещественные числа. Очевидно, линейная зависимость элементов xi, x2, ..., xn + i экви- эквивалентна линейной зависимости строк матрицы л _ ™-zl a22 • • • &2n a(n+lJ ••• a(n+l)n || Но строки указанной матрицы заведомо линейно зависимы, ибо поря- порядок базисного минора этой матрицы (содержащей (п + 1) строк и п столбцов) не превосходит п, и хотя бы одна из (п + 1) ее строк не является базисной и по теореме о базисном миноре п) представляет собой линейную комбинацию базисных (а стало быть, и всех осталь- остальных) строк. Теорема доказана. 10) Ибо базисные элементы ei, ег, ..., еп образуют систему п линейно незави- независимых элементов пространства R. п) См. теорему 1.6 из п. 2 § 3 гл. 1.
§ 2. БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 57 Обращаясь к примерам, рассмотренным в конце предыдущего пункта, мы теперь можем сказать, что размерность пространства В% всех свободных векторов равна трем, размерность пространства Ап равна п, а размерность пространства {х} равна единице. Примером бесконечномерного пространства может служить линей- линейное пространство С [а, Ь] всех функций х = x(t), определенных и непрерывных на сегменте а ^ t ^ Ъ (см. пример 4 из п. 1 § 1). В самом деле, для любого номера п система (п + 1) элементов этого пространства 1, ?, ?2, ..., tn является линейно независимой (ибо в про- противном случае некоторый многочлен Со + С it + С2?2 + ... + Cntn, не все коэффициенты Со, Ci, ..., Сп которого равны нулю, оказался бы тождественно равным нулю на сегменте а ^ t ^ Ь). 4. Понятие изоморфизма линейных пространств. В этом пункте мы покажем, что различные линейные пространства одной и той же размерности п в смысле свойств, связанных со введенными в этих пространствах операциями, по существу не отличаются друг от друга. Так как в линейных пространствах введены лишь операции сло- сложения элементов и умножения элементов на числа, то естественно сформулировать следующее определение. Определение. Два произвольных вещественных линейных про- пространства R и R' называются изоморфными, если между элемента- элементами этих пространств можно установить взаимно однозначное соответ- соответствие 12) так, что если элементам х и у пространства R отвечают соответственно элементы х; и у' пространства R'\ то элементу х + у отвечает элемент х; + у;, а элементу Ах при любом вещественном А отвечает элемент Ах;. Заметим, что если линейные пространства R и R' изоморфны, то нулевому элементу R отвечает нулевой элемент R' и наоборот. (В самом деле, пусть элементу х пространства R отвечает некоторый эле- элемент х; пространства R'. Тогда элементу 0-х пространства R отвечает элемент 0 • х; пространства R'.) Отсюда следует, что если в случае изоморфизма элемен- элементам х, у, ..., z пространства R отвечают соответственно элементы х;, у;, ..., т! пространства R', то линейная комбинация ах + (Зу + ... ... + 7Z является нулевым элементом пространства R тогда и только тогда, когда линейная комбинация ах' + f3y' + ... + jz' является 12) Напомним, что соответствие между элементами двух множеств R и R' на- называется взаимно однозначным, если при этом соответствии каждому элементу R отвечает один и только один элемент R', причем каждый элемент R' отвечает од- одному и только одному элементу R.
58 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА нулевым элементом пространства R'. Но это означает, что если пространства R и R' изоморфны, то максимальное число линейно независимых элементов в каждом из этих пространств одно и то же. Иными словами, два изоморфных пространства обязаны иметь одинаковую размерность. Стало быть, пространства разной размерности не могут быть изоморфны. Докажем теперь следующее утверждение. Теорема 2.7. Любые два п-мерных вещественных линейных про- пространства R и R' изоморфны. Доказательство. Выберем в R какой-либо базис ei, в2, ..., еп, а в R' — какой-либо базис е'ь е2, ..., е^. Поставим в соответствие каждому элементу х = x±ei + ?2^2 + ... + хпеп пространства R элемент х' = х\е[ + Ж2в2 + ... + хпе'п пространства R' (т. е. мы бе- берем в качестве х' тот элемент R'', который имеет относительно базиса e'l5 е2, ..., е^ те же самые координаты, что и элемент х относительно базиса еь е2, ..., еп). Убедимся в том, что установленное соответствие является взаим- взаимно однозначным. В самом деле, каждому элементу х пространства R однозначно соответствуют координаты х\, х?,, • •., хп, которые, в свою очередь, определяют единственный элемент х' пространства R'. В силу равноправности пространств R и R', каждому элементу х' простран- пространства R', в свою очередь, соответствует единственный элемент х про- пространства R. Остается заметить, что если элементам х и у пространства R от- отвечают соответственно элементы х' и у' пространства R'', то в силу теоремы 2.4 элементу х + у отвечает элемент х; + у;, а элементу Ах отвечает элемент Лх;. Теорема доказана. Из приведенного нами рассмотрения следует, что единственной су- существенной характеристикой конечномерного линейного пространства является его размерность. § 3. Подпространства линейных пространств 1. Понятие подпространства и линейной оболочки. Пред- Предположим, что некоторое подмножество L линейного пространства R удовлетворяет следующим двум требованиям. 1°) Если элементы х и у принадлежат подмножеству L, то и сумма х + у принадлежит этому подмножеству. 2°) Если элемент х принадлежит подмножеству L, а Х—лю-
§ 3. ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 59 бое вещественное число, то и элемент Ах принадлежит подмно- подмножеству L. Убедимся в том, что подмножество L, удовлетворяющее требованиям 1°) и 2°), само является линейным пространством. До- Достаточно убедиться в справедливости для элементов подмножества L аксиом 1°)-8°) из определения линейного пространства. Все указанные аксиомы, кроме аксиом 3°) и 4°), заведомо справедливы для элемен- элементов подмножества L, поскольку они справедливы для всех элемен- элементов пространства R. Остается проверить выполнение аксиом 3°) и 4°). Пусть х — любой элемент подмножества L, а Л — любое вещественное число. Тогда в силу требования 2°) элемент Лх также принадлежит L. Остается заметить, что (в силу теоремы 2.2) этот элемент Лх при Л = 0 превращается в нулевой элемент пространства R, а при Л = — 1 превращается в противоположный для х элемент. Таким образом, под- подмножеству L принадлежит нулевой элемент и противоположный (для каждого элемента х) элемент, а это и означает, что для элементов под- подмножества L справедливы аксиомы 3°) и 4°). Тем самым полностью до- доказано, что подмножество L само является линейным пространством. Определение. Подмножество L линейного пространства R, удо- удовлетворяющее требованиям 1°) и 2°), называется линейным подпро- подпространством (или просто подпространством) пространства R. Простейшими примерами подпространств могут служить: 1) так называемое нулевое подпространство, т. е. подмножество ли- линейного пространства R, состоящее из одного нулевого элемента; 2) все пространство R (которое, конечно, можно рассматривать как подпространство). Оба эти подпространства принято называть несобственными. Укажем примеры подпространств более содержательного вида. Пример 1. Подмножество {Рп (?)} всех алгебраических многочле- многочленов степени, не превышающей натурального числа п 13), в линейном пространстве С [а, Ъ] всех функций х = ж(?), определенных и непре- непрерывных на сегменте а ^ t ^ Ъ 14) (справедливость для элементов подмножества {Рп (?)} требований 1°) и 2°) не вызывает сомнений). Пример 2. Подмножество В<± всех свободных векторов, параллель- параллельных некоторой плоскости, в линейном пространстве В% всех свободных векторов 15) (справедливость для элементов В<± требований 1°) и 2°) очевидна). 13) Это подмножество введено в примере 5 п. 1 § 1 настоящей главы. 14) Пространство С [а, Ь] введено в примере 4 п. 1 § 1 этой главы. 15) Множества В2 и Вз были введены в примере 1 п. 1 § 1 этой главы.
60 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Пример 3. Пусть х, у, ..., z — совокупность элементов некоторого линейного пространства R. Линейной оболочкой элементов х, у, ..., z будем называть совокупность всех линейных комбинаций этих эле- ментов, т. е. множество элементов вида ах + /Зу + ... + 7Z5 где а, /?, ..., 7— какие угодно вещественные числа. Договоримся обозначать линейную оболочку элементов х, у, ..., z символом L (х, у, ..., z). Для линейной оболочки произвольных элементов х, у, ..., z ли- линейного пространства R, очевидно, выполняются требования 1°) и 2°), сформулированные в начале настоящего пункта. Поэтому всякая линейная оболочка является подпространством основного линейного пространства R. Это подпространство, очевидно, содержит элементы х, у, ..., z, на которых построена линейная оболочка L (х, у, ..., z). С другой стороны, всякое подпространство, содержащее элементы х, у, ..., z, обязано содержать и все линейные комбинации этих эле- элементов. Поэтому линейная оболочка элементов х, у, ..., z является наименьшим подпространством, содержащим элементы х, у, ..., z. Конкретным примером линейной оболочки может служить линей- линейная оболочка элементов 1, ?, ?2, • •., tn линейного пространства С [а, Ь] всех функций х = х (t), определенных и непрерывных на сегменте а ^ t ^ Ъ. Эта линейная оболочка, очевидно, представляет собой мно- множество {Рп (?)} всех алгебраических многочленов степени, не превы- превышающей п. Другие примеры подпространств будут рассмотрены в п. 3 настоя- настоящего параграфа. Рассмотрим вопрос о размерности подпространства (и, в частности, линейной оболочки). Можно утверждать, что размерность любого подпространства п-мерного линейного пространства R не превосходит размерности п пространства R (ибо всякая линейно независимая система элементов подпространства является одновременно линейно независимой систе- системой элементов всего пространства R). Более точно можно утверждать, что если подпространство L не совпадает со всем п-мерным линейным пространством R, то раз- размерность L строго меньше п. Это вытекает из того, что если размерности L и R обе равны п, то всякий базис подпространства L, поскольку он состоит из п элементов, является (в силу теоремы 2.5) базисом и всего пространства R. Заметим, что если во всем пространстве R выбран базис ei, в2, ..., еп, то базисные элементы подпространства L, вообще
§ 3. ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 61 говоря, нельзя выбирать из числа элементов ei, в2, ..., еп (ибо в общем случае ни один из элементов ei, в2, ..., еп может не при- принадлежать L). Однако справедливо обратное утверждение: если эле- элементы ei, в2, ..., е/, составляют базис к-мерного подпространства п-мерного линейного пространства R, то этот базис можно до- дополнить элементами e^ + i, ..., еп пространства R так, что сово- совокупность элементов ei, ..., е&, e^ + i, ..., еп будет составлять базис всего пространства R. Докажем это утверждение. Если к < п, то найдется элемент e& + i пространства R такой, что элементы ei, в2, ..., е&, е&_|_ i линейно неза- независимы (в противном случае пространство R оказалось бы ^-мерным). Далее, если к + 1 < п, то найдется элемент е& + 2 пространства R такой, что элементы ei, в2, ..., е&, e^ + i, е& + 2 линейно независимы (в противном случае пространство R оказалось бы (к + 1)-мерным). Продолжая аналогичные рассуждения, мы докажем сформулирован- сформулированное утверждение. В заключение докажем важную теорему о размерности линейной оболочки. Теорема 2.8. Размерность линейной оболочки L (х, у, ..., z) эле- элементов х, у, ..., z равна максимальному числу линейно независимых элементов в системе элементов х, у, ..., z. В частности, если эле- элементы х, у, ..., z линейно независимы, то размерность линейной оболочки L (х, у, ..., z) равна числу элементов х, у, ..., z (а сами эти элементы образуют базис линейной оболочки L (х, у, ..., z)). Доказательство. Допустим, что среди элементов х, у, ..., z имеется г линейно независимых элементов (обозначим их через xi, X2, ..., хг), а любые (г + 1) из элементов х, у, ..., z линейно зависимы. Тогда каждый из элементов х, у, ..., z представляет со- собой некоторую линейную комбинацию элементов xi, Х2, ..., хг 16), и поскольку по определению каждый элемент линейной оболоч- оболочки L (х, у, ..., z) представляет собой некоторую линейную комбина- комбинацию элементов х, у, ..., z, то каждый элемент указанной линейной оболочки представляет собой некоторую линейную комбинацию од- одних только элементов xi, X2, ..., хг. Но это и означает, что система линейно независимых элементов xi, X2, ..., хг образует базис линей- линейной оболочки L (х, у, ..., z) и что размерность L (х, у, ..., z) равна г. Теорема доказана. 2. Новое определение ранга матрицы. В §3 гл.1 мы опреде- 16) Это устанавливается с помощью тех же самых рассуждений, которые были проведены при доказательстве теоремы 2.5.
62 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА лили ранг произвольной матрицы А как порядок ее базисного мино- минора, т. е. как число г, удовлетворяющее требованию существования у матрицы А отличного от нуля минора порядка г и отсутствия у этой матрицы отличных от нуля миноров порядка, большего г. В этом пункте мы убедимся, что ранг произвольной матрицы А равен максимальному числу линейно независимых строк (или столб- столбцов) этой матрицы. Отсюда будет следовать новое определение ранга матрицы как мак- максимального числа линейно независимых строк (или столбцов) этой матрицы 17). Проведем все рассуждения для строк (для столбцов они аналогич- аналогичны) . Рассмотрим в линейном пространстве Ап (введенном в примере 3 п. 1 § 1) линейную оболочку базисных строк произвольной, содержа- содержащей т строк и п столбцов матрицы А и предположим, что число ба- базисных строк равно г. Из теоремы 1.6 о базисном миноре вытекает, что любая строка матрицы А является элементом указанной линейной обо- оболочки, а из линейной независимости г базисных строк и из теоремы 2.8 вытекает, что размерность указанной линейной оболочки равна г. Ста- Стало быть, любые (г + 1) элементов указанной линейной оболочки (и, в частности, любые (г + 1) строк матрицы А) линейно зависимы. А это и означает, что число г представляет собой максимальное число линейно независимых строк. 3. Сумма и пересечение подпространств. Пусть L\ и L^— два произвольных подпространства одного и того же линейного простран- пространства R. Совокупность всех элементов х пространства Л, принадлежащих одновременно L\ и L2, образует подпространство пространства R 18), называемое пересечением подпространств L\ и L2. Совокупность всех элементов пространства R вида у + z, где у —элемент подпространства Li, a z —элемент подпространства Z/2, образует подпространство пространства R 19), называемое суммой подпространств L\ и L2. Пример. Пусть R — линейное пространство всех свободных век- векторов (в трехмерном пространстве), L\ — подпространство всех сво- 17) В частности, отсюда будет следовать весьма нетривиальная теорема о том, что у любой матрицы максимальное число линейно независимых строк совпадает с максимальным числом линейно независимых столбцов. 18) Ибо элементы этой совокупности удовлетворяют требованиям 1°) и 2°), сформулированным в начале п. 1. 19)С м. предыдущую сноску.
§ 3. ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 63 бодных векторов, параллельных плоскости Оху, L2 —подпространство всех свободных векторов, параллельных плоскости Oxz. Тогда суммой подпространств L\ и L2 будет являться все пространство R 20), а пе- пересечением подпространств L\ и L2 будет являться множество всех свободных векторов, параллельных оси Ох. Справедливо следующее утверждение. Теорема 2.9. Сумма размерностей произвольных подпро- подпространств L\ и L2 конечномерного линейного пространства R равна сумме размерности пересечения этих подпространств и размерно- размерности суммы этих подпространств. Доказательство. Обозначим через Lq пересечение L\ и L2, а через L — сумму L\ и L2. Считая Lq ^-мерным, выберем в нем базис еь е2, ..., ек. B.11) Используя утверждение, доказанное в п. 1, дополним базис B.11) до базиса еь ..., ек, gi, ..., g/ B.12) в подпространстве L\ и до базиса еь ..., e*,fb ..., fro B.13) в подпространстве L2. Достаточно доказать, что элементы gi, ..., g/, еь ..., ек, fi, ..., fm B.14) являются базисом суммы L подпространств L\ и L2 21). Для этого, в свою очередь, достаточно доказать, что элементы B.14) линейно неза- независимы и что любой элемент х суммы L представляет собой некоторую линейную комбинацию элементов B.14). Сначала докажем, что элементы B.14) линейно независимы. 20) В самом деле, любой вектор х пространства R представляет собой линейную комбинацию х = ш + /3j + 7^ базисных векторов i, j, k, параллельных осям Ох, Оу и Oz соответственно, причем вектор ш + /3j принадлежит Li, а вектор 7k принадлежит L,2- 21) Ибо при этом размерность L, равная I + к + т, в сумме с размерностью Lo, равной /с, будет равна сумме размерностей к + I и к + т подпространств L\ и L2-
64 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Предположим, что некоторая линейная комбинация элементов B.14) представляет собой нулевой элемент, т. е. справедливо равен- равенство /31е1 + ... + /Зкек + 7ifi + • • • + 1пЛт = О B.15) или «lgi + ... + aigi + ftei + ... + /З^е* = ~7ifi - ... - 7mfm. B.16) Так как левая часть B.16) является элементом Li, а правая часть B.16) является элементом Z/2, то как левая, так и правая часть B.16) принадлежит пересечению Lq подпространств L\ и L^. Отсюда следует, в частности, что правая часть B.16) представляет собой неко- некоторую линейную комбинацию элементов B.11), т. е. найдутся такие числа Ai, ..., А/., что -71*1 - ... - 7mfm = Aiei + ... + Хкек. B.17) В силу линейной независимости базисных элементов B.13) равенство B.17) возможно лишь в случае, когда все коэффициенты 71 •> • • •? 1т, Ai, ..., А/, равны нулю. Но при этом из B.15) мы получим, что + ... + aigi + /3iei + ... + /Зкек = 0. B.18) В силу линейной независимости базисных векторов B.12) равен- равенство B.18) возможно лишь в случае, когда все коэффициенты ai, ..., a/, /3i, ..., f5k равны нулю. Тем самым мы установили, что равенство B.15) возможно лишь в случае, когда все коэффициенты ai, ..., a/, /?i, ..., /?fc, 7ъ • • •? 1т равны нулю, а это и доказывает ли- линейную независимость элементов B.14). Остается доказать, что любой элемент х суммы L представляет со- собой некоторую линейную комбинацию элементов B.14), но это сразу следует из того, что этот элемент х представляет собой (по опреде- определению L) сумму некоторого элемента xi подпространства Li, явля- являющегося линейной комбинацией элементов B.12), и некоторого эле- элемента Х2 подпространства Z/2, являющегося линейной комбинацией элементов B.13). Теорема доказана. Возвращаясь к примеру, рассмотренному перед формулировкой те- теоремы 2.9, заметим, что в этом примере размерность каждого из под- подпространств Li и Z/2 равна двум, размерность их суммы равна трем, а размерность их пересечения равна единице.
§ 3. ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 65 4. Разложение линейного пространства в прямую сумму подпространств. Пусть R\ и R^ — два подпространства линейного n-мерного пространства R. Определение. Будем говорить, что пространство R представляет собой прямую сумму подпространств R\ и R^, если каждый элемент х пространства R может быть единственным способом представлен в виде суммы х = xi + х2 B.19) элемента xi подпространства R\ и элемента х2 подпространства R^. Тот факт, что R представляет собой прямую сумму R\ и R^ сим- символически записывают так: R = R\ 0 R2. Последнее равенство обычно называют разложением простран- пространства R в прямую сумму подпространств R\ и R^. Так пространство R всех свободных векторов (в трехмерном про- пространстве) можно разложить в прямую сумму подпространства R\ всех векторов, параллельных плоскости Оху и подпространства R^ всех векторов, параллельных оси Oz. Теорема 2.10. Для того чтобы п-мерное пространство R пред- представляло собой прямую сумму подпространств R\ и R2, достаточ- но, чтобы пересечение R\ и R^ содержало только нулевой элемент и чтобы размерность R была равна сумме размерностей подпро- подпространств R\ и R2. Доказательство. Выберем некоторый базис ei, ..., ek в под- подпространстве R\ и некоторый базис gi, ..., g/ в подпространстве i?2- Докажем, что объединение этих базисов еь ..., ek, gi, ..., g/ B.20) представляет собой базис всего пространства R. Так как по условию теоремы размерность п всего пространства R равна сумме к + I размер- размерностей R\ и i?2, то достаточно (в силу теоремы 2.5) доказать линейную независимость элементов B.20). Предположим, что некоторая линейная комбинация элементов B.20) представляет собой нулевой элемент, т. е. справедливо равен- равенство ... + акек + f3igi + ... + fogi = 0, B.21) или ... + акек = -ftgi - ... - Ag/. B.22) 5 В.А. Ильин, Э.Г. Позняк
66 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Так как левая часть B.22) является элементом ft, а правая — элементом ft, а пересечение R\ и ft содержит лишь нулевой элемент, то как левая, так и правая часть B.25) представляет собой нулевой эле- элемент, а это (на основании линейной независимости элементов каждого из базисов ei, ..., е^ и gi, ..., g/) возможно лишь при условии ai = ... = ак = О, /?i = ... = P, = 0. B.23) Тем самым мы установили, что равенство B.21) возможно лишь при условии B.23), а это и доказывает линейную независимость эле- элементов B.20) и тот факт, что элементы B.20) образуют базис всего пространства R. Пусть теперь х —любой элемент R. Разложив его по базису B.20), будем иметь х = Aiei + ... + Хкек + /iigi + ... + /ikgk или х = xi + + х2, где xi = Aiei + ... + А/, е/,—элемент ft, а х2 = /iigi + ... ... + /i/g/ —элемент ft. Остается доказать, что представление B.19) является единствен- единственным. Предположим, что, кроме B.19), справедливо и еще одно пред- представление х = х; + х2, B.24) где х^—элемент ft, а х2—элемент ft. Вычитая B.24) из B.19), по- получим, что 0 = xi — х^ + Х2 — х2, или xi — х^ = Х2 — х2. Так как в левой части последнего равенства стоит элемент ft, ав правой — элемент R2 и поскольку пересечение R\ и R2 содержит лишь нулевой элемент, то из этого равенства следует, что xi — х^ = 0, х2 — х2 =0, т. е. х.[ = xi, X2 = х2. Теорема доказана. Замечание. В случае, когда пространство R представляет собой не прямую, а обычную сумму подпространств R\ и R2, представление B.19) любого элемента х пространства R также справедливо, но не является, вообще говоря, единственным. Пусть, например, R представляет собой трехмерное пространство всех свободных векторов, R\ —подпространство всех векторов, парал- параллельных плоскости Оху, a R2 —подпространство всех векторов, парал- параллельных плоскости Oxz. В предыдущем пункте мы выяснили, что R представляет собой сумму (но, конечно, не прямую сумму) подпро- подпространств Ri и R2. Обозначим через i, j и к базисные векторы, парал- параллельные осям Ож, Оу и Oz соответственно, и разложим произвольный элемент х пространства R по базису i, j, k. Найдутся вещественные числа а, /3 и 7 такие, что х = ш + /?j + 7^, так что, с одной сторо- стороны, х = xi + Х2, где xi = ш + ^j —элемент ft, а Х2 = 7^ —эле- —элемент ft, с другой стороны, х = х^ + х2, где х^ = ^j —элемент ft, а х2 = ш + 7^ — элемент ft •
4. ПРЕОБРАЗОВАНИЕ КООРДИНАТ 67 § 4. Преобразование координат при преобразовании базиса n-мерного линейного пространства 1. Прямое и обратное преобразование базисов. Пусть ei, е2, ..., еп и е[, е2, ..., е^—два произвольных базиса п-мерного линейного пространства R. Как всякий элемент пространства R, каждый элемент е^, е2, ..., е^ может быть разложен по базису ei, е2, ..., еп. Предположим, что элементы е'ь е2, ..., е'п выражают- выражаются через ei, е2, ..., еп с помощью формул ei = а11е1 + а12е2 е2 = a2ie1 + а22е2 а1пеп, а2пеп, Это означает, что переход от первого базиса ei, e2, ..., еп ко второму базису е'ь е2, ..., е^ задается матрицей А = din ап2 B.26) Подчеркнем, что определитель Л матрицы B.26) заведомо отличен от нуля 22), ибо в противном случае в силу теоремы 1.7 строки этой матрицы (а стало быть, и базисные элементы e'l5 е2, ..., е^) оказались бы линейно зависимыми. Убедимся в том, что обратный переход от второго базиса е'ь е2, ..., е^ к первому базису ei, e2, ..., еп осуществляется с по- помощью матрицы В, обратной к матрице А. Напомним, что матрица В, обратная к матрице А, введена в п. 7 § 2 гл. 1 и имеет вид А^ An л ¦" л -422 Ап2 В = An Л Л л Л А2т Л Л B.27) где через Л обозначен определитель матрицы А, а через А^ — алгебраическое дополнение элемента а^ этого определителя. Умно- 2) Такую матрицу в п. 7 § 2 гл. 1 мы договорились называть невырожденной. 5*
68 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА жим уравнения B.25) соответственно на алгебраические дополнения Aij, A2J, ..., Anj элементов j-ro столбца определителя Л и после это- этого сложим эти уравнения. В результате получим (для любого номера j, равного 1, 2, ..., п) e'2A2j e'nAnj = aniAnj). Учитывая, что сумма произведений элементов г-го столбца на соот- соответствующие алгебраические дополнения элементов j-ro столбца рав- равна нулю при г ф j и равна определителю Л при г = j 23), получим из последнего равенства е[А^ + e'2A2j + ... + e'nAnj = е. Л, откуда е^ = -^-ei + ~^~е2 + ••• + ~^~ подробнее А А 0' = Х' 2' • • •' п) или е„. = B.28) Формулы B.28) и устанавливают, что обратный переход от бази- базиса е^, е2, ..., е^ к базису ei, в2, ..., еп осуществляется с помощью матрицы B.27), обратной к матрице А. Эту обратную к А матрицу мы кратко будем обозначать символом А~х. 2. Связь между преобразованием базисов и преобразо- преобразованием соответствующих координат. Пусть, как и выше, ба- базис ei, в2, ..., еп преобразуется в базис е^, е^, ..., е^ с помощью невы- невырожденной матрицы B.26), так что обратное преобразование базисов задается матрицей B.27). Пусть далее х — произвольный элемент рас- рассматриваемого линейного пространства R, (xi, Ж2, ..., хп) —его коор- координаты относительно первого базиса ei, в2, ..., еп, (х[, ж2, ..., х'п) — его координаты относительно второго базиса е^, е2, ..., е^, так что х = ж2е2 хпеп 23)См. свойство 4°) из п. 4 §2 гл.Д.
4. ПРЕОБРАЗОВАНИЕ КООРДИНАТ 69 Подставив в это равенство вместо элементов ei, в2, ..., еп их выраже- выражения, определяемые формулами B.28), получим х = + х'2е'2 + ... + х'пе'п = Аи ., . A2i , , -^-11 / , л-ZL Al2 Л -J-nl "А" -422 ¦л-1 Л —-— е Л п А2п , Л Gn Из последнего равенства (в силу единственности разложения по базису е'ь е2, ..., е^) сразу же вытекают формулы перехода от ко- координат (xi, Ж2, ..., хп) относительно первого базиса к координатам 2, ..., х'п) относительно второго базиса: А ¦г' — Х1 — ц А1п B.29) , _ Ап1 хп — Х\ л -Х2 АПп . . . + —— ХГ1 Формулы B.29) показывают, что переход от координат (xi, Ж2, ..., хп) к координатам (х[, ж2, ..., х'п) осуществляется с помощью матрицы Ац А12 А1п Л Л '" Л -42i -422 -42п С = ~Д" ~Д" '" "А" Л Л Л транспонированной к обратной матрице B.27). Мы приходим к следующему выводу: если переход от первого ба- базиса ко второму осуществляется с помощью невырожденной мат- матрицы А, то переход от координат произвольного элемента относи- относительно первого базиса к координатам этого элемента относительно второго базиса осуществляется с помощью матрицы (А~1)', транс- транспонированной к обратной матрице А~ 1.
ГЛАВА 3 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИИ Из элементарного курса и из курса аналитической геометрии чи- читатель знаком с системой двух линейных уравнений с двумя неиз- неизвестными и с системами двух и трех линейных уравнений с тремя ^\ тт неизвестными ) . Целью настоящей главы является изучение системы произвольного числа т линейных уравнений с произвольным числом п неизвестных. Мы сначала установим необходимое и достаточное условие суще- существования хотя бы одного решения (или, как говорят, совместности) такой системы, а затем займемся отысканием всей совокупности ее ре- решений. В § 4 гл. 4 будет рассмотрен важный для приложений случай приближенного задания всех коэффициентов системы и ее свобод- свободных членов. Для этого случая будет изложен метод регуляризации А.Н. Тихонова, позволяющий найти так называемое нормальное (т. е. наиболее близкое к началу координат) решение указанной системы с точностью, соответствующей точности задания коэффициентов и сво- свободных членов. В гл. 6 будет дано представление о численных (итерационных) ме- методах решения систем линейных уравнений. § 1. Условие совместности линейной системы 1. Понятие системы линейных уравнений и ее решения. В общем случае система т линейных уравнений с п неизвестными (или, кратко, линейная система) имеет следующий вид: + CL12X2 + ... + CL21X1 + а22^2 + . . . + а2пХп = &2, (о i\ Q>mlXl + ат2Х2 + ... + CLmnXn = Ьт. При этом через xi, Ж2, ..., xn обозначены неизвестные, подлежащие -1) См. выпуск «Аналитическая геометрия», дополнение к гл. 1.
§ 1. УСЛОВИЕ СОВМЕСТНОСТИ ЛИНЕЙНОЙ СИСТЕМЫ 71 определению (число их п не предполагается обязательно равным числу уравнений т); величины оц, а\2, ..., атп, называемые коэффициента- коэффициентами системы, и величины Ь\, 62, ..., Ъш, называемые свободными чле- членами, предполагаются известными. Каждый коэффициент системы ац имеет два индекса, первый из которых г указывает номер уравнения, а второй j — номер неизвестного, при котором стоит этот коэффициент. Система C.1) называется однородной, если все ее свободные члены Ь\, &25 • • •? Ьт равны нулю. Если хотя бы один из свободных членов Ь\, Ь<±, ..., Ът отличен от нуля, то система C.1) называется неоднородной. Система C.1) называется квадратной, если число т составляющих ее уравнений равно числу неизвестных п. Решением системы C.1) называется такая совокупность п чисел с\, С2, ..., сп, которая при подстановке в систему C.1) на место неиз- неизвестных х\, Ж2, ..., хп обращает все уравнения этой системы в тожде- тождества. Не всякая система вида C.1) имеет решения. Так, система линей- линейных уравнений Х\ + Ж2 = 1, х\ + ж2 = 2 заведомо не имеет ни одного решения (ибо если бы существовало ре- решение этой системы, то при подстановке этого решения в левых ча- частях обоих уравнений стояли бы одинаковые числа и мы получили бы, что 1 = 2). Система уравнений вида C.1) называется совместной, если она имеет хотя бы одно решение, и несовместной, если у нее не существует ни одного решения. Совместная система вида C.1) может иметь или одно решение, или несколько решений. Два решения совместной системы вида C.1) с[ ', с^ , ..., ch, и B) B) B) г с\ , с2 , ..., Сп называются различными, если нарушается хотя бы одно из равенств сA) _ J2) A) _ B) A) _ B) Совместная система вида C.1) называется определенной, если она имеет единственное решение. Совместная система вида C.1) называется неопределенной, если у нее существуют по крайней мере два различных решения. Весьма удобно записывать линейную систему C.1) в матричной форме. Для этого используем введенное в п. 2 § 1 гл. 1 понятие произ-
72 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ ведения двух матриц (таких, что число столбцов первой из этих мат- матриц равно числу строк второй из матриц). В качестве перемножаемых матриц возьмем две матрицы: матрицу А = ат1 ат2 C.2) содержащую т строк и п столбцов и составленную из коэффициентов при неизвестных (такую матрицу мы в дальнейшем будем называть основной матрицей системы C.1)) и матрицу X, содержащую п строк и 1 столбец, т. е. один столбец вида Х = XI C.3) Согласно правилу перемножения двух матриц 2) произведение АХ матрицы C.2) на матрицу C.3) представляет собой матрицу, содержа- содержащую т строк и 1 столбец, т. е. один столбец следующего вида: Х\ + CL12X2 + . . . + СЦпХп B22^2 + • • • + 0>2пХп C.4) Q>mnXn || Система равенств C.1) означает, что этот столбец C.4) совпадает со столбцом В = C.5) Таким образом, в матричной записи систему C.1) можно заменить одним эквивалентным ей матричным уравнением АХ = В, C.6) в котором матрицы А, X и В определяются соотношениями C,2), C.3) и C.5). Решение матричного уравнения C.6) заключается в отыскании 2) См. п. 2 § 1 гл. 1, формулу A.4).
§ 1. УСЛОВИЕ СОВМЕСТНОСТИ ЛИНЕЙНОЙ СИСТЕМЫ 73 такого столбца C.3), который при заданной матрице C.2) и заданном столбце правых частей C.5) обращает уравнение C.6) в тождество. В этом и в следующем параграфах мы выясним в отношении ли- линейной системы C.1) следующие три вопроса: 1) способ установления того, является система C.1) совместной или нет, 2) способ установления того, является система C.1) (в случае ее совместности) определенной или нет, 3) способ отыскания единственного решения совместной системы C.1) (в случае ее определенности) и отыскания всех ее решений (в случае ее неопределенности). 2. Нетривиальная совместность однородной системы. Начнем с рассмотрения однородной линейной системы вида C.1), т. е. системы + B12^2 + • • • + UlnXn = О, + a22^2 + • • • + CL2nXn = 0, , . + аш2х2 + ... + ашпхп = 0. Сразу же отметим, что эта система всегда совместна, ибо она все- всегда обладает так называемым тривиальным (или нулевым) решением х\ — х2 — ... — хп — 0 3). Возникает вопрос о том, при каких условиях однородная система C.7) имеет, кроме указанного тривиального решения, еще и другие решения (т. е. является «нетривиально совместной»). Этот вопрос решается довольно просто. Заметим, что существо- существование нетривиального решения системы C.7) эквивалентно линейной зависимости столбцов матрицы C.2) (ибо линейная зависимость столб- столбцов матрицы C.2) означает, что существуют числа х\, х2, ..., хп, не все равные нулю и такие, что справедливы равенства C.7)). Но в силу теоремы 1.6 о базисном миноре линейная зависимость столбцов матрицы C.2) будет иметь место тогда и только тогда, когда не все столбцы этой матрицы являются базисными, т. е. тогда и только тогда, когда порядок г базисного минора матрицы C.2) меньше числа п ее столбцов. Мы приходим к следующей теореме. Теорема 3.1. Однородная система C.7) имеет нетривиальные решения тогда и только тогда, когда ранг г матрицы C.2) меньше числа п ее столбцов. 3) Действительно, подставив в систему C.7) нули на место всех неизвестных 1, Ж2, • •., хп, мы обратим в тождества все уравнения этой системы.
74 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Следствие. Квадратная однородная система 4) имеет нетриви- нетривиальные решения тогда и только тогда, когда определитель, состав- составленный из коэффициентов при неизвестных, равен нулю. В самом деле, в случае квадратной однородной системы C.7), т. е. при т = п ранг г матрицы C.2) будет меньше числа т = п тогда и только тогда, когда определитель этой матрицы равен нулю. 3. Условие совместности общей линейной системы. Устано- Установим теперь необходимое и достаточное условие совместности общей (вообще говоря, неоднородной) системы вида C.1). С этой системой связаны две матрицы: матрица А, определяемая соотношением C.2), которую принято называть основной матрицей системы C.1) (она составлена из коэффициентов при неизвестных), и матрица а12 ... а1 ат1 ат2 C.8) которую принято называть расширенной матрицей системы C.1) (она получается из основной матрицы путем добавления к этой мат- матрице столбца C.5) свободных членов). Справедлива следующая основная теорема. Теорема 3.2 (теорема Кронекера-Капелли 5) . Для того чтобы линейная система C.1) являлась совместной, необходимо и доста- достаточно, чтобы ранг расширенной матрицы этой системы был равен рангу ее основной матрицы. Доказательство. 1) Необходимость. Пусть система C.1) совместна, т. е. существуют такие числа с\, с2, ..., сп, что справедливы равенства + а12с2 + ... + а1псп = Ьь а22с2 + ... + а2псп = b2, , v аш2с2 + ... + ашпсп = Ьш. Обозначим через г ранг основной матрицы системы C.1) и рассмот- рассмотрим линейную оболочку L г базисных столбцов этой матрицы. В си- силу теоремы 1.6 о базисном миноре любой столбец основной матрицы 4) То есть система C.7), у которой число уравнений т равно числу неизвест- неизвестных п. 5) Леопольд Кронекер A823-1891)—немецкий математик, Альфред Капел- ли A855-1910)—итальянский математик.
§ 2. ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 75 принадлежит указанной линейной оболочке L. Иными словами, лю- любой столбец расширенной матрицы C.8), кроме последнего ее столбца, принадлежит указанной линейной оболочке L. Из равенств C.9) следует, что и последний столбец расширенной матрицы C.8) принадлежит линейной оболочке L (ибо этот последний столбец в силу равенств C.9) линейно выражается через все столбцы основной матрицы и поэтому линейно выражается через ее базисные столбцы). Таким образом, все столбцы расширенной матрицы C.8) принад- принадлежат указанной линейной оболочке L. В п. 2 § 3 гл. 2 мы уже устано- установили, что размерность указанной линейной оболочки L равна L. Это означает, что любые г + 1 столбцов расширенной матрицы C.8) линей- линейно зависимы, т. е. ранг расширенной матрицы (равный максимально- максимальному числу линейно независимых столбцов этой матрицы) также равен числу г. Необходимость доказана. 2) Достаточность. Пусть ранги основной и расширенной мат- матриц совпадают. Тогда г базисных столбцов основной матрицы бу- будут являться базисными столбцами и расширенной матрицы C.8) 6). По теореме 1.6 о базисном миноре, последний столбец расширенной матрицы C.8) представляет собой некоторую линейную комбинацию указанных г базисных столбцов. Стало быть, последний столбец рас- расширенной матрицы C.8) представляет собой некоторую линейную ком- комбинацию и всех столбцов основной матрицы C.2) 7), т. е. существуют числа ci, C2, ..., сп такие, что справедливы равенства C.9). Последние равенства означают, что числа ci, C2, ..., сп представляют собой ре- решение системы C.1), т. е. эта система является совместной. Теорема полностью доказана. § 2. Отыскание решений линейной системы Теорема Кронекера—Капелли устанавливает необходимое и доста- достаточное условие совместности линейной системы, но не дает способа нахождения решений этой системы. В этом параграфе мы займемся отысканием решений линейной системы C.1). Сначала мы рассмотрим простейший случай квадрат- 6) Ибо указанные г базисных столбцов линейно независимы, а большего чем г числа линейно независимых столбцов расширенная матрица не имеет. 7) Не изменяя линейной комбинации г базисных столбцов, мы можем добавить к ней все небазисные столбцы с множителями, равными нулю.
76 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ ной системы линейных уравнений с отличным от нуля определителем основной матрицы, а затем перейдем к отысканию совокупности всех решений общей линейной системы вида C.1). 1. Квадратная система линейных уравнений с определите- определителем основной матрицы, отличным от нуля. Пусть дана квадрат- квадратная система линейных уравнений а\\Х\ + CL12X2 + ... + CLinXn = C.10) ап\Х\ + an2X2 + ... + аппхп = Ъп с отличным от нуля определителем Л основной матрицы А = аи din ^22 ап2 C.11) Докажем, что такая система имеет, и притом единственное, реше- решение, и найдем это решение. Сначала докажем, что система C.10) может иметь только одно решение (т. е. докажем единственность решения си- системы C.10) в предположении его существования). Предположим, что существуют какие-либо п чисел xi, X2, ..., хп такие, что при подстановке этих чисел в систему C.10) все уравне- уравнения этой системы обращаются в тождества (т. е. существует некото- некоторое решение системы C.10) xi, Ж2, ..., хп). Тогда, умножая тождества C.10) соответственно на алгебраические дополнения A\j^ A^j, ..., Anj элементов j-ro столбца определителя А матрицы C.11) и складывая затем получающиеся при этом тождества, мы получим (для любого номера j, равного 1, 2, ..., п) г=1 aniAnj) = bnAnj. Учитывая, что сумма произведений элементов г-ro столбца на соответ- соответствующие алгебраические дополнения элементов j-ro столбца равна нулю при г ф j и равна определителю Л матрицы C.11) при г = j 8), мы получим из последнего равенства XjA = ЪгАц + b2A2j + ... + bnAnj. C.12) 8) См. свойство 4°) из п. 4 §2 гл. 1.
2. ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 77 Обозначим символом Aj (pi) (или, более кратко, символом Aj) определитель, получающийся из определителя А основной матри- матрицы C.11) заменой его j-го столбца столбцом из свободных членов Ъ\, Ьэ, ..., Ъп (с сохранением без изменения всех остальных столб- столбцов Л). Заметим, что в правой части C.12) стоит именно определитель Aj (pi) 9), и это равенство принимает вид (j = 1,2, ..., п). C.13) Поскольку определитель Л матрицы C.11) отличен от нуля, равен- равенства C.13) эквивалентны соотношениям Xj = ^ (i = !'2'¦•¦'")¦ C.14) Итак, мы доказали, что если решение х\, Ж2, ..., хп системы C.10) с определителем А основной матрицы C.11), отличным от ну- нуля, существует, то это решение однозначно определяется форму- формулами C.14). Формулы C.14) называются формулами Крамера 10). Еще раз подчеркнем, что формулы Крамера пока получены нами в предположении существования решения и доказывают его единствен- единственность. Остается доказать существование решения системы C.10). Для это- этого в силу теоремы Кронекера—Капелли достаточно доказать, что ранг основной матрицы C.11) равен рангу расширенной матрицы 11) «11 «22 «In «2п «nl «п2 C.15) но это очевидно, ибо в силу соотношения Л ф 0, ранг основной мат- матрицы равен п, а ранг содержащей п строк расширенной матрицы C.15) больше числа п быть не может и потому равен рангу основной матрицы. 9) Чтобы убедиться в этом, достаточно записать разложение определителя Aj (pi) по элементам г-го столбца. 10) Габриель Крамер A704-1752)—швейцарский математик. 11) Существует и другой способ доказательства существования решения систе- системы C.10), заключающийся в проверке того, что числа х\, Х2, • • •, хп, определяемые формулами Крамера C.14), обращают в тождества все уравнения системы C.10).
78 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Тем самым полностью доказано, что квадратная система линей- линейных уравнений C.10) с определителем основной матрицы, отличным от нуля, имеет, и притом единственное, решение, определяемое фор- формулами Крамера C.14). Доказанное нами утверждение еще проще устанавливается матрич- матричным способом. Для того чтобы сделать это, заменим (как и в п. 1 § 1) систему C.10) эквивалентным ей матричным уравнением АХ = В, где А — основная матрица системы C.11), а X и В — столбцы, C.16) X = Х2 , в = первый из которых подлежит определению, а второй задан. Так как определитель Л матрицы А отличен от нуля, то существует обратная матрица А~ г (см. п. 7 § 2 гл. 1). Предположим, что существует решение системы C.10), т. е. су- существует столбец X, обращающий в тождество матричное уравне- уравнение C.16). Помножая указанное тождество слева на обратную мат- матрицу А~ 1, будем иметь А'1 {АХ) = А'1 В. C.17) Учтем теперь, что в силу сочетательного свойства произведения трех матриц (см. п. 2 § 1 гл. 1) и в силу соотношения А-1А = Е, где Е— единичная матрица (см. п. 7 §2 гл. 1), А (АХ) = (А~гА)Х = ЕХ = = X, так что мы получим из C.17) X = А~1В. C.18) Развертывая равенство C.18) и учитывая вид обратной матрицы 12), мы и получим для элементов столбца X формулы Крамера. Итак, мы доказали, что если решение матричного уравнения C.16) существует, то оно однозначно определяется соотношением C.18), эк- эквивалентным формулам Крамера. Легко проверить, что столбец X, определяемый соотношением C.18), в самом деле является решением матричного уравнения C.16), 2) См. формулу A.41) из п. 7 § 2 гл. 1.
2. ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 79 т. е. при подстановке в это уравнение обращает его в тождество. В самом деле, если столбец X определяется равенством C.18), то АХ = = А(А~1В) = (АА-^В = ЕВ = В. Итак, если определитель Д матрицы А отличен от нуля (т. е. если эта матрица является невырожденной), то существует, и при- притом единственное, решение матричного уравнения C.16), определяе- определяемое соотношением C.18), эквивалентным формулам Крамера. Пример. Найдем решение квадратной системы линейных уравне- уравнений xi + 2х2 + Зж3 + 4ж4 = 30, - хх + 2х2 - Зж3 + 4ж4 = 10, %2 — Х3 + Ж4 = 3, Х\ + Х2 + Хз + Х4 = Ю с отличным от нуля определителем основной матрицы Л = 1 -1 0 1 2 2 1 1 3 -3 -1 1 4 4 1 1 = -4. Поскольку 30 -1 3 1 10 1 3 4 3 4 -1 1 1 1 = -4, До = Аз = 1 2 30 4 ¦1 2 10 4 0 13 1 1 1 10 1 = -12, Л4 = 1 1 0 1 1 1 0 1 30 10 3 10 2 2 1 1 — — 3 -3 -1 1 3 3 1 1 4 4 1 1 30 10 3 10 = -16, то, в силу формул Крамера, единственное решение рассматриваемой системы имеет вид х\ — 1, х<± = 2, жз = 3, ж4 = 4. Основное значение формул Крамера состоит в том, что они дают явное выражение для решения квадратной системы линейных уравне- уравнений (с определителем, отличным от нуля) через коэффициенты урав- уравнений и свободные члены. Практическое использование формул Кра- Крамера связано с довольно громоздкими вычислениями (для решения системы п уравнений с п неизвестными приходится вычислять (п + 1) определитель n-го порядка). К этому следует добавить, что если ко- коэффициенты уравнений и свободные члены представляют собой лишь
80 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ приближенные значения каких-либо измеряемых физических вели- величин или округляются в процессе вычислений, то использование фор- формул Крамера может привести к большим ошибкам и в ряде случаев является нецелесообразным. В § 4 гл. 4 будет изложен метод регуляризации, принадлежащий А.Н. Тихонову и позволяющий находить решение линейной системы с точностью, соответствующей точности задания матрицы коэффици- коэффициентов уравнений и столбца свободных членов, а в главе б дается пред- представление о так называемых итерационных методах решения линейных систем, позволяющих решать эти системы при помощи последователь- последовательных приближений неизвестных. В заключении отметим, что в этом пункте мы исключили из рас- рассмотрения случай обращения в нуль определителя Л основной мат- матрицы системы C.10). Этот случай будет содержаться в общей теории систем т линейных уравнений с п неизвестными, излагаемой в следу- следующем пункте. 2. Отыскание всех решений общей линейной системы. Рас- Рассмотрим теперь общую систему т линейных уравнений с п неизвест- неизвестными C.1). Предположим, что эта система совместна и что ранг ее основной и расширенной матриц равен числу г. Не ограничивая общ- общности, мы можем предположить, что базисный минор основной матри- матрицы C.2) находится в левом верхнем углу этой матрицы (общий случай сводится к этому случаю посредством перестановки в системе C.1) уравнений и неизвестных). Тогда первые г строк как основной матрицы C.2), так и расши- расширенной матрицы C.8) являются базисными строками этих матриц 13), и, по теореме 1.6 о базисном миноре, каждая из строк расширенной матрицы C.8), начиная с (г + 1)-й строки, является линейной комби- комбинацией первых г строк этой матрицы. В терминах системы C.1) это означает, что каждое из уравнений этой системы, начиная с (г + 1)-го уравнения, является линейной ком- комбинацией (т. е. следствием) первых г уравнений этой системы (т. е. всякое решение первых г уравнений системы C.1) обращает в тож- тождества и все последующие уравнения этой системы). Таким образом, достаточно найти все решения лишь первых г урав- уравнений системы C.1). Рассмотрим первые г уравнений системы C.1), 13) Так как ранги основной и расширенной матриц оба равны г, то базисный минор основной матрицы будет одновременно являться базисным минором и рас- расширенной матрицы.
2. ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 81 записав их в виде а12х2 + ... + alrxr = Ь\ - a^r + 1)Xr + 1 - ... - alnxnj CL21X1 + а22^2 + ... + a2rxr = b2 - u2(r + iJV + i - ... - a2nxn, arixi + ar2^2 + ... + arrxr = br - ar(r + 1)Xr + i - ... - arnxn. C.19) Если мы придадим неизвестным xr + i,..., xn совершенно про- произвольные значения cr + i,..., сп, то система C.19) превратится в квадратную систему г линейных уравнений для г неизвестных xi, Ж2, ..., жг, причем определителем основной матрицы этой системы является отличный от нуля базисный минор матрицы C.2). В силу ре- результатов предыдущего пункта, эта система C.19) имеет единственное решение, определяемое формулами Крамера, т. е. для произвольно вы- выбранных cr + i, ..., сп существует единственная совокупность г чисел ci, C2, ..., сг, обращающих в тождества все уравнения системы C.19) и определяющихся формулами Крамера. Чтобы записать это единственное решение, договоримся обозна- обозначать символом Mj(di) определитель, получающийся из базисного ми- минора М матрицы C.2) заменой его j-ro столбца столбцом из чи- чисел di, б?2, ..., df, ..., dr (с сохранением без изменения всех остальных столбцов М). Тогда, записывая решение системы C.19) с помощью формул Крамера и пользуясь линейным свойством определителя, мы получим Cj = -—Mjibi - a»(r+ i)Cr + i - ... - aincn) = = -^[Mjibi) - cr + 1Mj(ai{r + 1)) - ... - CnMjiain)}C.20) U = 1, 2, ..., r). Формулы C.20) выражают значения неизвестных Xj = Cj (j = = 1, 2, ..., г) через коэффициенты при неизвестных, свободные члены и произвольно заданные параметры cr +1, ..., сп. Докажем, что формулы C.20) содержат любое решение системы C.1). В самом деле, пусть cj, с®, ..., с^, с^ + 1, ..., с^ — произвольное решение указанной системы. Тогда оно является решением и системы C.19). Но из системы C.19) величины cj, c\, ..., с^ определяются через величины с^ + 1, ..., с^ однозначно и именно по формулам Крамера C.20). Таким образом, при cr + i = с^ + 1, ..., сп = с^ формулы C.20) дают нам как раз рассматриваемое решение с\, с®, ..., с^, с^ + г, ..., с^. Замечание. Если ранг г основной и расширенной матриц систе- системы C.1) равен числу неизвестных п, то в этом случае соотношения 6 В.А. Ильин, Э.Г. Позняк
82 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ C.20) переходят в формулы Cj = м Ь = 1, 2, ..., п), определяющие единственное решение системы C.1). Таким об- образом, система C.1) имеет единственное решение (т. е. является определенной) при условии, что ранг г основной и расширенной ее матриц равен числу неизвестных п (и меньше числа уравнений т или равен ему). Пример. Найдем все решения линейной системы l } Нетрудно убедиться в том, что ранг как основной, так и расширенной матрицы этой системы равен двум (т. е. эта система совместна), при- причем можно считать, что базисный минор М стоит в левом верхнем углу =2. Но тогда, отбрасывая Х\ Xi + 2xi + 4: 2х\ — — Х2 х2 + с2 + . 4ж2 - + хг 2х3 5ж3 Н f х3 ! - Ж4 = + Зж4 = - 10ж4 = - бж4 = 4, 8, 20, 4. основной матрицы, т. е. М = два последних уравнения и задавая произвольно сз и с4, мы получим систему Х\ — Х2 — 4 — Сз + С4, х\ + Х2 = 8 — 2сз — Зс4, из которой в силу формул Крамера получаем значения 3 1 х\ = с\ = б - -с3 - с4, Х2 = с2 = 2 - -с3 - 2с4. C.22) Таким образом, четыре числа 3 1 \ б — -сз — с4, 2 — -сз — 2с4, сз, с4 I C.23) при произвольно заданных значениях сз и с4 образуют решение систе- системы C.21), причем строка C.23) содержит все решения этой системы. 3. Свойства совокупности решений однородной системы. Рассмотрим теперь однородную систему т линейных уравнений с п неизвестными C.7), предполагая, как и выше, что матрица C.2) имеет ранг, равный г, и что базисный минор М расположен в левом верхнем углу этой матрицы.
§ 2. ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 83 Поскольку на этот раз все bi равны нулю, вместо формул C.20) мы получим следующие формулы: M( ) '•• + CnMjidin)} (j = 1, 2, ..., Г), C.24) выражающие значения неизвестных Xj = Cj (j = 1, 2, ..., г) че- через коэффициенты при неизвестных и произвольно заданные значе- значения сг _|_ 1, ..., сп. В силу доказанного в предыдущем пункте формулы C.24) содержат любое решение однородной системы C.7). Убедимся теперь в том, что совокупность всех решений однородной системы C.7) образует линейное пространство. Пусть Хг = D1}, .., х!1}) и Х2 = (xf\ .., х!2))-два произ- вольных решения однородной системы C.7), а Л — любое веществен- вещественное число. В силу того, что каждое решение однородной системы C.7) является элементом линейного пространства Ап всех упорядоченных совокупностей п чисел, достаточно доказать, что каждая из двух со- совокупностей Х1+Х2 = также является решением однородной системы C.7). Рассмотрим любое уравнение системы C.7), например г-е уравне- уравнение, и подставим в это уравнение на место неизвестных элементы ука- указанных совокупностей. Учитывая, что Х\ и ^ — решения однородной системы, будем иметь п п Jb ' | Jb ' I / (Jb 2 1 Jb A | / УЛ) % 1 Jb A \J ч 3 = 1 ' 3 = 1 3 = 1 — X > n-rK } — 0 / 1J j ' 3 = 1 ~ ~ 3 = 1 а это и означает, что совокупности Х\ + Х<± и ХХ\ являются решениями однородной системы C.7). Итак, совокупность всех решений однородной системы C.7) обра- образует линейное пространство, которое мы обозначим символом R. Найдем размерность этого пространства R и построим в нем базис. Докажем, что в предположении о том, что ранг матрицы однород- однородной системы C.7) равен г, линейное пространство R всех решений 6*
84 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ однородной системы C.7) изоморфно линейному пространству Ап~г всех упорядоченных совокупностей (п — г) чисел 14). Поставим в соответствие каждому решению (ci,..., сг, cr + i,..., сп) однородной системы C.7) элемент (cr + i, ..., сп) пространства А^п~г\ Поскольку числа cr + i,..., cn могут быть выбраны произвольно и при каждом выборе с помощью формул C.24) однозначно определяют решение системы C.7), то установ- установленное нами соответствие является взаимно однозначным. Далее заметим, что если элементы (с;^, ..., Сп ) и (с^2^, ..., Сп ) про- пространства Ап~г отвечают элементам (с^ , ..., Сг , <4 + 1> • • •, Сп ) и (с\ , ..., Сг , 4 + 1' •••> с™ ) пространства Л, то из формул C.24) сразу же следует, что элементу (с;^ + с^2^, ..., с^1 + с^ ) отвечает элемент (#> + с^,...,^ + ^>, ^ji + 4% ..., ck4 + <?>), а элементу (Лс^^, ..., Асп ) при любом вещественном Л отвечает элемент (Aq , ..., Ас? , Ас^1^, ..., Хсп). Тем самым доказано, что установленное нами соответствие является изоморфизмом. Итак, линейное пространство R всех решений однородной системы C.7) с п неизвестными и рангом основной матрицы, рав- равным г, изоморфно пространству Ап ~ г и, стало быть, имеет размер- размерность п — г. Любая совокупность из (п — г) линейно независимых решений однородной системы C.7) образует (в силу теоремы 2.5) базис в про- пространстве R всех решений и называется фундаментальной совокуп- совокупностью решений однородной системы C.7). Для построения фундаментальной совокупности решений можно отправляться от любого базиса пространства Ап~Т. Отвечающая это- этому базису совокупность решений системы C.7), в силу изоморфизма, будет линейно независимой и поэтому будет являться фундаменталь- фундаментальной совокупностью решений. Особо выделяют фундаментальную совокупность решений систе- системы C.7), отвечающую простейшему базису ei = A, 0, 0, ..., 0), в2 = = @, 1, 0, ..., 0), ..., еп_г = @, 0, 0, ..., 1) пространства Ап~г и на- называемую нормальной фундаментальной совокупностью решений од- однородной системы C.7). При сделанных выше предположениях о ранге и расположении ба- базисного минора, в силу формул C.24), нормальная фундаментальная 14) Пространство Аш введено в примере 3 п. 1 § 1 гл. 2.
§ 2. ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 85 совокупность решений однородной системы C.7) имеет вид: М '•'•' M '0'1'---'°J' C.25) Mi(ain) Mr(ain) ]^—' *' *' iv^—' o, o,..., По определению базиса любое решение X однородной системы C.7) представимо в виде X = СгХг + С2Х2 + ... + Cn_rXn_r, C.26) где Ci, С2, • •-, Сп-Г — некоторые постоянные. Поскольку в фор- формуле C.26) содержится любое решение однородной системы C.7), то эта формула дает общее решение рассматриваемой однородной системы. Пример. Рассмотрим однородную систему уравнений Xl — Х2 + Х3 — Ж4 = 0, X! + х2 + 2ж3 + Зж4 = 0, ( v 2xi + 4х2 + 5х3 + 10x4 = 0, [ } 2xi — 4x2 + хз — 6x4 = 0, соответствующую неоднородной системе C.21), разобранной в примере в конце предыдущего пункта. Там мы выяснили, что ранг г матрицы этой системы равен двум, и взяли в качестве базисного минор, стоящий в левом верхнем углу указанной матрицы. Повторяя рассуждения, проведенные в конце предыдущего пункта, мы получим вместо формул C.22) соотношения 3 г ci = - -с3 - с4, с2 = - -с3 - 2с4, справедливые при произвольно выбранных сз и с±. С помощью этих соотношений (полагая сначала сз = 1, с^ = 0, а затем сз = 0, с^ = = 1) мы получим нормальную фундаментальную совокупность двух решений системы C.27): ,,1,о\, Х2 = (-1,-2, 0,1).
86 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Общее решение однородной системы C.27) имеет вид х = Cl (" I" i1; °) + °2 (~lj' °'1); C-28) где С\ и С2—произвольные постоянные. В заключение этого пункта установим связь между решениями неоднородной линейной системы C.1) и соответствующей ей однород- однородной системы C.7) 15) . Докажем следующие два утверждения. 1°) Сумма любого решения неоднородной системы C.1) с любым решением соответствующей однородной системы C.7) представля- представляет собой решение системы C.1). В самом деле, если ci, ..., сп — решение системы C.1), а di, ..., dn — решение соответствующей ей однородной системы C.7), то, подставив в любое (например, в г-е) уравнение системы C.1) на место неизвестных числа с\ + di, ..., сп + dn, получим j = l 3 = 1 3 = 1 что и требовалось доказать. 2°) Разность двух произвольных решений неоднородной систе- системы C.1) является решением соответствующей однородной систе- системы C.7). В самом деле, если с[, ..., ^ и с'/, ..., с^ — два произвольных реше- решения системы C.1), то, подставив в любое (например, в г-е) уравнение системы C.7) на место неизвестных числа с[ — с", ..., с'п — с^, получим цЦ - ф = 3 = 1 3 = 1 3 = 1 что и требовалось доказать. Из доказанных утверждений вытекает, что, найдя одно решение неоднородной системы C.1) и складывая его с каждым решением со- соответствующей однородной системы C.7), мы получим все решения неоднородной системы C.1). Другими словами, сумма частного решения неоднородной систе- системы C.1) и общего решения соответствующей однородной системы C.7) дает общее решение неоднородной системы C.1). 15) С теми же самыми коэффициентами при неизвестных.
§ 2. ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 87 В качестве частного решения неоднородной системы C.1) есте- естественно взять то его решение 16) fM^bj) Мг(Ъг) Л Хо = —Л—' • • • > —7Г~' 0, 0, ..., О , C.29) которое получится, если в формулах C.20) положить равными нулю все числа cr +1, ..., сп. Складывая это частное решение с общим реше- решением C.26) соответствующей однородной системы, мы получим следу- следующее выражение для общего решения неоднородной системы C.1): X = Хо + С1Х1 + С2Х2 + ... + Cn_rXn_r. C.30) В этом выражении Xq обозначает частное решение C.29), Ci, С2, ... ..., Сп - г — произвольные постоянные, а Х\, Х2, ..., Хп _ г — элементы нормальной фундаментальной совокупности решений C.25) соответствующей однородной системы. Так, для рассмотренной в конце предыдущего пункта неоднородной системы C.21) частное решение вида C.29) равно Хо = F, 2, 0, 0). Складывая это частное решение с общим решением C.28) соответ- соответствующей однородной системы C.27), мы получим следующее общее решение неоднородной системы C.21): X = F,2,0,0) + d(-|,-i, 1, о) +С2(-1,-2, 0, 1). (Здесь С\ и С2 — произвольные постоянные.) 4. Заключительные замечания о решении линейных си- систем. Развитые в предыдущих пунктах методы решения линейных систем упираются в необходимость вычисления ранга матрицы и нахо- нахождения ее базисного минора. После того, как базисный минор найден, решение сводится к технике вычисления определителей и к использо- использованию формул Крамера. Для вычисления ранга матрицы можно использовать следующее правило: при вычислении ранга матрицы следует переходить от ми- миноров меньших порядков к минорам больших порядков; при этом, ес- если уже найден отличный от нуля минор М порядка к, то требуют вычисления лишь миноры порядка (к + 1), окаймляющие 17) этот 16) При этом предполагается, как и выше, что ранги основной и расширенной матриц системы C.1) равны г и что базисный минор находится в левом верхнем углу этих матриц. 17) То есть содержащие внутри себя минор М.
ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ минор М; в случае равенства нулю всех окаймляющих миноров по- порядка (к + 1) ранг матрицы равен к 18). Укажем и другое правило вычисления ранга матрицы. Заметим, что со строками (столбцами) матрицы можно производить три эле- элементарные операции, не изменяющие ранга этой матрицы: 1) пере- перестановку двух строк (или двух столбцов), 2) умножение строки (или столбца) на любой отличный от нуля множитель, 3) прибавление к одной строке (столбцу) произвольной линейной комбинации других строк (столбцов) 19). Будем говорить, что матрица ||а^-||, содержащая т строк и п столб- столбцов, имеет диагональный вид, если равны нулю все ее элементы, от- отличные от оц, а22, • • •? агг, где r = min{m, n}. Ранг такой матрицы, очевидно, равен г. Убедимся в том, что посредством трех элементарных операций любую матрицу А = аи ... а1п C.31) можно привести к диагональному виду (что и позволяет вычислить ее ранг). В самом деле, если все элементы матрицы C.31) равны нулю, то эта матрица уже приведена к диагональному виду. Если же у матри- матрицы C.31) есть отличные от нуля элементы, то путем перестановки двух строк и двух столбцов можно добиться того, чтобы был отличен от ну- нуля элемент ац. Умножая после этого первую строку матрицы на а^1, мы превратим элемент ац в единицу. Вычитая далее из j-ro столбца матрицы (при j = 2, 3, ..., п) первый столбец, умноженный на aij, а затем вычитая из г-й строки (при г = 2, 3, ..., п) первую строку, умноженную на ац, мы получим вместо C.31) матрицу следующего 18) В самом деле, в указанном случае все строки (столбцы) матрицы принад- принадлежат линейной оболочке ее к строк (столбцов), на пересечении которых стоит минор М, а размерность указанной линейной оболочки равна к. 19) Эти три операции не изменяют ранга матрицы вследствие того, что опера- операции 1) и 2) не изменяют максимального числа линейно независимых строк (столб- (столбцов) матрицы, а операция 3) обладает тем свойством, что линейная оболочка всех строк (столбцов), имевшихся до проведения этой операции, совпадает с линейной оболочкой всех строк (столбцов), полученных после проведения этой операции.
2. ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 89 вида: 1 0 0 0 ^22 а'т2 0 ... а2п Совершая уже описанные нами операции с матрицей, взятой в рамку, и продолжая действовать аналогичным способом, мы после конечного числа шагов получим матрицу диагонального вида. Изложенные в предыдущих пунктах методы решения линейных си- систем, использующие, в конечном итоге, аппарат формул Крамера, мо- могут привести к большим погрешностям в случае, когда значения ко- коэффициентов уравнений и свободных членов заданы приближенно или когда производится округление этих значений в процессе вычислений. В первую очередь это относится к случаю, когда матрица, отвечаю- отвечающая основному определителю (или базисному минору), является пло- плохо обусловленной (т. е. когда «малым» изменениям элементов этой матрицы отвечают «большие» изменения элементов обратной матри- матрицы). Естественно, что в этом случае решение линейной системы будет неустойчивым (т. е. «малым» изменениям значений коэффициентов уравнений и свободных членов будут отвечать «большие» изменения решения). Отмеченные обстоятельства приводят к необходимости раз- разработки как других (отличных от формул Крамера) теоретических алгоритмов отыскания решения, так и численных методов решения линейных систем. В §4 гл.4 мы познакомимся с методом регуляризации А.Н. Тихо- Тихонова отыскания так называемого нормального (т. е. наиболее близкого к началу координат) решения линейной системы. В гл. 6 будут изложены основные сведения о так называемых ите- итерационных методах решения линейных систем, позволяющих решать эти системы при помощи последовательных приближений неизвест- неизвестных.
ГЛАВА 4 ЕВКЛИДОВЫ ПРОСТРАНСТВА Из курса аналитической геометрии читатель знаком с поняти- понятием скалярного произведения двух свободных векторов и с четырьмя основными свойствами указанного скалярного произведения. В насто- настоящей главе изучаются линейные пространства любой природы, для элементов которых каким-либо способом (причем безразлично каким) определено правило, ставящее в соответствие любым двум элемен- элементам число, называемое скалярным произведением этих элементов. При этом важно только, чтобы это правило обладало теми же четырьмя свойствами, что и правило составления скалярного произведения двух свободных векторов. Линейные пространства, в которых определено указанное правило, называются евклидовыми пространствами. В на- настоящей главе выясняются основные свойства произвольных евклидо- евклидовых пространств. § 1. Вещественное евклидово пространство и его простейшие свойства 1. Определение вещественного евклидова пространства. Вещественное линейное пространство R называется вещественным ев- евклидовым пространством (или просто евклидовым пространством), если выполнены следующие два требования. I. Имеется правило, посредством которого любым двум элементам этого пространства х и у ставится в соответствие вещественное число, называемое скалярным произведением этих элементов и обозначаемое символом (х, у). П. Указанное правило подчинено следующим четырем аксиомам: 1°) (х, у) = (у, х) (переместительное свойство или симметрия); 2°) (xi + Х2, у) = (xi, у) + (х2, у) (распределительное свойство); 3°) (Ах, у) = А(х, у) для любого вещественного А; 4°) (х, х) > 0, если х —ненулевой элемент; (х, х) = 0, если х — нулевой элемент. Подчеркнем, что при введении понятия евклидова пространства мы абстрагируемся не только от природы изучаемых объектов, но и
§ 1. ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 91 от конкретного вида правил образования суммы элементов, произве- произведения элемента на число и скалярного произведения элементов (важно лишь, чтобы эти правила удовлетворяли восьми аксиомам линейного пространства и четырем аксиомам скалярного произведения). Если же природа изучаемых объектов и вид перечисленных правил указаны, то евклидово пространство называется конкретным. Приведем примеры конкретных евклидовых пространств. Пример 1. Рассмотрим линейное пространство В% всех свободных векторов. Скалярное произведение любых двух векторов определим так, как это было сделано в аналитической геометрии (т. е. как про- произведение длин этих векторов на косинус угла между ними). В курсе аналитической геометрии была доказана справедливость для так опре- определенного скалярного произведения аксиом 1°)-4°) г). Стало быть, пространство В% с так определенным скалярным произведением яв- является евклидовым пространством. Пример 2. Рассмотрим бесконечномерное линейное пространство С [а, Ь] всех функций х (?), определенных и непрерывных на сегменте а ^ t ^ Ъ. Скалярное произведение двух таких функций х (t) и у (t) определим как интеграл (в пределах от а до Ь) от произведения этих функций [ x(t)y(t)dt. D.1) J а Элементарно проверяется справедливость для так определенного ска- скалярного произведения аксиом 1°)-4°). В самом деле, справедливость аксиомы 1°) очевидна; справедливость аксиом 2°) и 3°) вытекает из линейных свойств определенного интеграла; справедливость аксио- аксиомы 4°) вытекает из того, что интеграл Ja x2 (t) dt от непрерывной неотрицательной функции х2 (t) неотрицателен и обращается в нуль лишь тогда, когда эта функция тождественно равна нулю на сегмен- сегменте а ^ t ^ Ъ 2) (т. е. является нулевым элементом рассматриваемого пространства). Таким образом, пространство С [а, Ъ] с так определен- определенным скалярным произведением представляет собой бесконечномерное евклидово пространство. Пример 3. Следующий пример евклидова пространства дает n-мерное линейное пространство Ап упорядоченных совокупностей п вещественных чисел, скалярное произведение двух любых элементов х = (жь ж2, • •., хп) и у = (у1, ?/2, • • -, Уп) которого определяется ра- *) См. выпуск «Аналитическая геометрия», гл. 2, § 2, п. 3. 2) См. выпуск «Основы математического анализа», часть 1, свойства 1°) и 2°) из п. 1 §6 гл. 10.
92 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА венством (х, у) = Ж12/1 + х2у2 + • • • + хпуп. D.2) Справедливость для так определенного скалярного произведения акси- аксиомы 1°) очевидна; справедливость аксиом 2°) и 3°) легко проверяется (достаточно вспомнить определение операций сложения элементов и умножения их на числа: (жь ж2, ..., хп) + B/ь 2/2, • • -, Уп) = = (xi + 2/ь ж2 + 2/2, • • -, жп + 2/п), ж2, ..., хп) = (Ажь Аж2, ..., Ажп)); наконец, справедливость аксиомы 4°) вытекает из того, что (х, х) = = х\ + х\ + ... + х2п всегда является неотрицательным числом и обращается в нуль лишь при условии х\ — ж2 = ... = хп = 0. Рассмотренное в этом примере евклидово пространство часто обо- обозначают символом Еп. Пример 4. В том же самом линейном пространстве Ап введем скалярное произведение любых двух элементов х = (xi, ж2, ..., хп) и у = B/1, 2/2, • • •, Уп) не соотношением D.2), а другим, более общим, способом. Для этого рассмотрим квадратную матрицу порядка п А = ац ai2 ... а\п #-21 0-22 • • • &2п 0>п\ @>п2 • • • &пп D.3) Составим с помощью матрицы D.3) однородный многочлен второго порядка относительно п переменных xi, ж2, ..., хп CLikXiXk. D.4) i=lk=l Забегая вперед, отметим, что такой многочлен называется квадратич- квадратичной формой (порождаемой матрицей D.3)) 3). Квадратичная форма D.4) называется положительно определен- определенной, если она принимает строго положительные значения для всех зна- значений переменных xi, ж2, ..., жп, одновременно не равных нулю 4). 3) Квадратичные формы систематически изучаются в гл. 7 этой книги. 4) В гл. 7 этой книги будет указано необходимое и достаточное условие поло- положительной определенности квадратичной формы.
§ 1. ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 93 Так как при х\ — х<± — ... = хп = 0 квадратичная форма D.4), оче- очевидно, равна нулю, то можно сказать, что положительно определен- определенная квадратичная форма обращается в нуль лишь при условии х\ = = ж2 = ... = хп = 0. Потребуем, чтобы матрица D.3) удовлетворяла двум условиям. 1°) Порождала положительно определенную квадратичную фор- форму D.4). 2°) Была симметричной (относительно главной диагонали), т. е. удовлетворяла условию ац~ — ак% для всех г = 1, 2,..., п и & = = 1, 2, ..., п. С помощью матрицы D.3), удовлетворяющей условиям 1°) и 2°), определим скалярное произведение двух любых элементов х = = (xi, Ж2, ..., хп) и у = B/1 ? 2/2? - - -? Уп) пространства Ап соотноше- НИеМ п п (х, у) = ^2 ^2 aikxiyk. D.5) i=lk=l Легко проверить справедливость для так определенного скалярного произведения всех аксиом 1°)-4°). В самом деле, аксиомы 2°) и 3°), очевидно, справедливы при совершенно произвольной матрице D.3); справедливость аксиомы 1°) вытекает из условия симметричности мат- матрицы D.3), а справедливость аксиомы 4°) вытекает из того, что квад- квадратичная форма D.4), представляющая собой скалярное произведение (х, х), является положительно определенной. Таким образом, пространство Ап со скалярным произведением, определяемым равенством D.5), при условии симметричности матри- матрицы D.3) и положительной определенности порождаемой ею квадра- квадратичной формы, является евклидовым пространством. Если в качестве матрицы D.3) взять единичную матрицу, то соотношение D.4) перейдет в D.2), и мы получим евклидово простран- пространство Еп, рассмотренное в примере 3. 2. Простейшие свойства произвольного евклидова прост- пространства. Устанавливаемые в этом пункте свойства справедливы для совершенно произвольного евклидова пространства как конечной, так и бесконечной размерности. Теорема 4.1. Для любых двух элементов х и у произвольного евклидова пространства справедливо неравенство (х, уJ < (х, х) (у, у), D.6) называемое неравенством Коши-Буняковского. Доказательство. Для любого вещественного числа Л, в силу аксиомы 4°) скалярного произведения, справедливо неравенство (Лх —
94 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА — у, Ах — у) ^ 0. В силу аксиом 1°)-3°), последнее неравенство можно переписать в виде А2(х, х) - 2А(х, у) + (у, у) ;> 0. Необходимым и достаточным условием неотрицательности последне- последнего квадратного трехчлена является неположительность его дискрими- дискриминанта, т. е. неравенство 5) (х, уJ - (х, х)(у, у) «С 0. D.7) Из D.7) сразу же вытекает неравенство D.6). Теорема доказана. Наша очередная задача — ввести в произвольном евклидовом про- пространстве понятие нормы (или длины) каждого элемента. Для этого введем понятие линейного нормированного пространства. Определение. Линейное пространство R называется нормирован- нормированным, если выполнены следующие два требования. I. Имеется правило, посредством которого каждому элементу х пространства R ставится в соответствие вещественное число, называе- называемое нормой (или длиной) указанного элемента и обозначаемое симво- символом ||х||. П. Указанное правило подчинено следующим трем аксиомам: 1°) ||х|| > 0, если х —ненулевой элемент; ||х|| = 0, если х —нулевой элемент; 2°) ||Ах|| = |А| ||х|| для любого элемента х и любого вещественного числа А; 3°) для любых двух элементов х и у справедливо следующее нера- неравенство ||х + у|| <; ||х|| + ||у||, D.8) называемое неравенством треугольника (или неравенством Минков- ского). Теорема 4.2. Всякое евклидово пространство является нормиро- нормированным, если в нем норму любого элемента х определить равенством 11x11 — л/fx xl D 01 II II — V V э /* V / Доказательство. Достаточно доказать, что для нормы, опре- определенной соотношением D.9), справедливы аксиомы 1°)—3°) из опре- определения нормированного пространства. 5) В случае (х, х) = 0 квадратный трехчлен вырождается в линейную функ- функцию, но в этом случае элемент х является нулевым, так что (х, у) = 0 и неравен- неравенство D.7) также справедливо.
§ 1. ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 95 Справедливость для нормы аксиомы 1°) сразу вытекает из ак- аксиомы 4°) скалярного произведения. Справедливость для нормы аксиомы 2°) почти непосредственно вытекает из аксиом 1°) и 3°) ска- скалярного произведения. Остается убедиться в справедливости для нормы аксиомы 3°), т. е. неравенства D.8). Будем опираться на неравенство Коши-Буняковс- кого D.6), которое перепишем в виде |(х, у)| <; ^х)^Т). D-7') С помощью последнего неравенства, аксиом 1°)-4°) скалярного произ- произведения и определения нормы получим ||х + у|| = л/(х + У, х + у) = V(x, х) + 2(х, у) + (у, у) у (х, х) (х, х) + у/(у, у) = , х) • дДу, у) + (у, у) = , X) + у/(у, у) = ||х|| + Теорема доказана. Следствие. Во всяком евклидовом пространстве с нормой элементов, определяемой соотношением D.9), для любых двух эле- элементов х и у справедливо неравенство треугольника D.8). Заметим далее, что в любом вещественном евклидовом про- пространстве можно ввести понятие угла между двумя произвольными элементами х и у этого пространства. В полной аналогии с векторной алгеброй, мы назовем углом ср между элементами х и у тот (изменя- (изменяющийся в пределах от 0 до тг) угол, косинус которого определяется соотношением Данное нами определение угла корректно, ибо в силу неравенства Коши-Буняковского D.7;) дробь, стоящая в правой части последнего равенства, по модулю не превосходит единицы. Далее договоримся называть два произвольных элемента х и у евклидова пространства Е ортогональными, если скалярное произве- произведение этих элементов (х, у) равно нулю (в этом случае косинус угла ср между элементами х и у будет равен нулю). Снова апеллируя к векторной алгебре, назовем сумму х + у двух ортогональных элементов х и у гипотенузой прямоугольного тре- треугольника, построенного на элементах х и у.
96 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА Заметим, что во всяком евклидовом пространстве справедлива теорема Пифагора: квадрат гипотенузы равен сумме квадратов ка- катетов. В самом деле, поскольку х и у ортогональны и (х, у) = 0, то в силу аксиом и определения нормы ||х + у||2 = (х + у, х + у) = = (х, х) + 2(х, у) + (у, у) = (х, х) + (у, у) = ||х||2 + ||у||2. Этот результат обобщается и на п попарно ортогональных элемен- элементов xi, х2, ..., хп: если z = xi + х2 + ... + хп, то х2 + ... = (Xl, X] ~г Х^т, 1 Х]^ l) + (х2, + х2 + ... х2) +...+ = llxill + Хп) = \Хп, XnJ — 2 + Цх2||2 + .. ¦ + 1|х„||2 В заключение запишем норму, неравенство Коши-Буняковского и неравенство треугольника в каждом из конкретных евклидовых про- пространств, рассмотренных в предыдущем пункте. В евклидовом пространстве всех свободных векторов с обычным определением скалярного произведения норма вектора а совпадает с его длиной |а|, неравенство Коши—Буняковского приводится к виду (а, ЬJ ^ |а|2 |Ь|2 6), а неравенство треугольника — к виду |а + b| ^ ^|а| + |Ь|7). В евклидовом пространстве С [а, Ь] всех непрерывных на сегменте а ^ t ^ Ъ функций х = х (t) со скалярным произведением D.1) норма элемента х = х (t) равна у Ja x2 (t) dt, а неравенства Коши-Буняков- Коши-Буняковского и треугольника имеют вид 2 гь гь пи пи х (t) у (t) dt ^ / х2 (t) dt / у2 (t) dt, a Ja Ja j [x (t) + у (t)}2 dt^Jf x2 (t) dt + J j y2 (t) dt. Оба эти неравенства играют важную роль в различных разделах ма- математического анализа. 6) Для скалярного произведения векторов (a, b) = |a| |b| cos ip это неравен- неравенство тривиально вытекает из того, что cos2 (p <С 1. 7) Если сложить векторы а и b по правилу треугольника, то это неравенство тривиально сводится к тому, что одна сторона треугольника не превосходит суммы двух других его сторон.
2. БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 97 В евклидовом пространстве Еп упорядоченных совокупностей п вещественных чисел со скалярным произведением D.2) норма любого элемента х = (xi, Х2, ..., хп) равна \Jx = \Jx а неравенства Коши—Буняковского и треугольника имеют вид хпуп) {4 + х\ + ... + х2п) (у2, + yl + ... + V Ж? + Ж2 2/2 2/п Наконец, в евклидовом пространстве упорядоченных совокупно- совокупностей п вещественных чисел со скалярным произведением D.5) норма любого элемента х = (xi, Ж2, ..., хп) равна 8) х = \ aikXiXk, г=1к=1 а неравенства Коши-Буняковского и треугольника имеют вид (п п \ / п п \ / п п ^ гкХгУк j ^ I ^2 ^2 а^хгхк I ) i = l к = 1 \г = 1 А; = 1 \г = 1 jfe = 1 2/lfe) г=1к=1 \ п г = 1 ) п / ^ ik i к e = l \ i=lk=l § 2. Ортонормированный базис конечномерного евклидова пространства В этом параграфе будут изучаться евклидовы пространства ко- конечной размерности п. Распространение изучаемых здесь результатов 8) Напоминаем, что при этом матрица D.3) симметрична и порождает поло- положительно определенную квадратичную форму D.4). 7 В.А. Ильин, Э.Г. Позняк
98 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА на бесконечномерные евклидовы пространства выходит за рамки этой книги и является предметом специального изучения. (Такие простран- пространства изучаются в главах 10 и 11 выпуска «Основы математического анализа, часть 2».) 1. Понятие ортонормированного базиса и его существова- существование. В гл. 2 было введено понятие базиса n-мерного линейного про- пространства. В линейном пространстве все базисы являлись равноправ- равноправными, и у нас не было оснований предпочитать один базис другому. В евклидовом пространстве существуют специальные, особо удоб- удобные базисы, называемые ортонор мир о ванными базисами. Эти базисы играют ту же роль, что и декартов прямоугольный базис в аналитиче- аналитической геометрии. Перейдем к определению ортонормированного базиса. Определение. Будем говорить, что п элементов ei,e2, ..., еп n-мерного евклидова пространства Е образуют ортонор мир о ванный базис этого пространства, если эти элементы попарно ортогональны и норма каждого из этих элементов равна единице, т. е. если {1 при г = к, . П - -A U DЛ0) 0 при г ф к. Для того чтобы установить корректность сформулированного опре- определения, следует доказать, что входящие в это определение элементы ei, e2j ..., еп образуют один из базисов рассматриваемого п-мерного пространства Е, а для этого, в силу теоремы 2.5, достаточно доказать, что эти элементы ei, e2j ..., еп линейно независимы, т. е. что равен- равенство + а2е2 + ... + апеп = О D.11) возможно, лишь когда а± = а2 = ... = ап = 0. Докажем это. Пусть к — любой из номеров 1, 2, ..., п. Умно- Умножая равенство D.11) скалярно на элемент е& и пользуясь аксиомами скалярного произведения и соотношениями D.10), мы получим, что OLk = 0. Докажем теперь следующую основную теорему. Теорема 4.3. Во всяком п-мерном евклидовом пространстве Е существует ортонор мир о ванный базис. Доказательство. Согласно определению размерности в про- пространстве Е найдется п линейно независимых элементов f\, ?2 •> • • • ? fn • Докажем, что можно построить п элементов ei, e2, ..., еп, линейно выражающихся через f\, f2, ..., fn и образующих ортонормированный базис (т. е. удовлетворяющих соотношениям D.10)). Проведем доказательство возможности построения таких элемен- элементов ei, в2, ..., еп методом математической индукции.
§ 2. БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 99 Если имеется только один элемент f\, то для построения элемен- элемента ei с нормой, равной единице, достаточно нормировать элемент f\, т. е. умножить этот элемент на число [-\/(fi, fi)]~ 1, обратное его нор- норме 9) . Мы получим при этом элемент ei = [^(fi, fi)]~ 1fi с нормой, равной единице. Считая, что т — целое число, меньшее п, предположим, что нам удалось построить т элементов ei, в2, ..., еш, линейно выражающих- выражающихся через fi, f2, ..., fm, попарно ортогональных и имеющих нормы, рав- равные единице. Докажем, что к этим элементам ei, в2, ..., ет можно присоединить еще один элемент ет +1, линейно выражающийся через fi, f2, ..., fm +1, ортогональный к каждому из элементов ei, в2, ..., ет и имеющий норму, равную единице. Убедимся в том, что этот элемент em + i имеет вид ега + 1 = ^m + l[fm + l ~ (fm + Ъ ет)ет ~ (fm + Ъ em-l)em-l — ... D.12) где аш + 1 —некоторое вещественное число. В самом деле, элемент em + i линейно выражается через f 1, f2, ..., fm +1 (в силу того, что он линейно выражается через ei, в2, ..., em, fm + i, а каждый из элементов ei, в2, ..., ет линейно выражается через f\, f2, ..., fm). Отсюда сразу же следует, что при am + i 7^ 0 элемент em + i за- заведомо не является нулевым (ибо, в противном случае, являлась бы нулевым элементом некоторая линейная комбинация линейно незави- независимых элементов f\, f2, ..., fm + i, B которой, в силу D.12), отличен от нуля коэффициент при fm +1). Далее из того, что элементы ei, в2, ..., ет попарно ортогональны и имеют нормы, равные единице, и из соотношения D.12) сразу же вы- вытекает, что скалярное произведение (em +1, e^) равно нулю для любого номера к, равного 1, 2, ..., т. Для завершения индукции остается доказать, что число ат +1 мож- можно выбрать так, что норма элемента D.12) будет равна единице. Выше уже установлено, что при am + i Ф 0 элемент em + i, а, стало быть, и элемент, заключенный в D.12) в квадратные скобки, не является ну- нулевым. Стало быть, для того чтобы нормировать элемент, заключенный в квадратные скобки, следует взять число am + i обратным положитель- 9) Напомним, что среди линейно независимых элементов fi, f2, ..., fn не мо- может быть нулевого элемента, так что норма fi больше нуля. 7*
100 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА ной норме этого, заключенного в квадратные скобки, элемента. При этом норма em + i будет равна единице. Теорема доказана. Доказанная теорема приводит к следующему осуществляемому шаг за шагом алгоритму построения по данной системе п линейно незави- независимых элементов f\, f2, ..., fn системы п попарно ортогональных эле- элементов ei, е2, ..., еп, норма каждого из которых равна единице: = fз - (f3, e2)e2 - (f3j Указанный алгоритм обычно называют процессом ортогонализа- ции линейно независимых элементов f\, f2, ..., fn. Замечание. Конечно, в каждом n-мерном евклидовом простран- пространстве Е существует много ортонормированных базисов. Действительно, если, например, строить ортонормированный базис процессом ортого- нализации одних и тех же линейно независимых элементов f\, f2, ... ..., fn, то, начиная процесс ортогонализации с различных элементов f/,, мы придем к различным ортонормированным базисам. Ниже, в п. 2 § 7 гл. 7 будет рассмотрен вопрос о том, как связаны между собой различ- различные ортонормированные базисы данного евклидова пространства Е. Примером ортонормированного базиса может служить декартов прямоугольный базис евклидова пространства всех свободных векто- векторов или совокупность п элементов ei = A,0,0, ..., 0), е2 = @, 1,0, ..., 0), еп = @,0,0, ..., 1) евклидова пространства Еп всех упорядоченных совокупностей п ве- вещественных чисел со скалярным произведением D.2). 2. Свойства ортонормированного базиса. Пусть ei, е2, ..., еп —произвольный ортонормированный базис п-мерного евклидова пространства Е, а х и у —два произвольных элемента этого пространства. Найдем выражение скалярного произведения (х, у) этих элементов через их координаты относительно базиса еь е2, ..., еп.
§ 2. БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 101 Обозначим координаты элементов х и у относительно базиса еь е2, ..., еп соответственно через (жь ж2, ..., хп) и (уъ у2, ..., уп), т. е. предположим, что х = x±ei + ж2е2 + ... + хпеп, у = + ... + Уп^п- Тогда (х, у) = Oiei + ж2е2 + ... + жпеп, угег + ?/2е2 Из последнего равенства, в силу аксиом скалярного произведения и соотношений D.10), получим ( ^х^, ^ Укек ) = ^2 ^2 XiVk(ei, ек) = г = 1 к = 1 ) i = l к = 1 = Ж12/1 + Х2У2 + ... + Хпуп. Итак, окончательно, (х, у) = Ж12/1 + х2у2 + ... + хпуп. D.13) Таким образом, в ортонормированием базисе скалярное произведе- произведение двух любых элементов равно сумме произведений соответству- соответствующих координат этих элементов. Рассмотрим теперь в n-мерном евклидовом пространстве Е совер- совершенно произвольный (вообще говоря, не ортонормированный) базис fi, f2, ..., fn и найдем выражение скалярного произведения двух про- произвольных элементов х и у через координаты этих элементов относи- относительно указанного базиса. Обозначим координаты элементов х и у относительно базиса fb f2, ..., fn соответственно через (жь ж2, ..., хп) и {уи у2, ..., уп), т. е. предположим, что х = xifi + x2f2 + ... + xnfn, у = 2/ifi + y2h + • • • + УгЛп- Пользуясь аксиомами скалярного произведения, получим (х, у) = (xifi + x2h + • • • + xnfn, 2/ifi + 2/2f2 + • • • + 2/nfn) = ( ) i=l k=l J i=lk=l Таким образом, в произвольном базисе f\, f2, ..., fn скалярное про- произведение двух любых элементов х = xifi + x2f2 + ... + xnfn и у = 2/i fi + 2/2f2 + ... + 2/nfn определяется равенством п п (х, у) = ^ ^ a^Xi^, D.14)
102 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА в котором матрица \\a,ik\\ (* — 1, 2, ..., п; /с = 1, 2,..., п) имеет эле- элементы аи* = (fi, ffc). Последнее утверждение приводит к следующему результату: для того чтобы в данном базисе f\, f2, ..., fn евклидова пространства Е скалярное произведение двух любых элементов было равно сумме про- произведений соответствующих координат этих элементов, необходи- необходимо и достаточно, чтобы базис f\, f2, ..., fn был ортонормированным. В самом деле, выражение D.14) переходит в D.13) тогда и толь- только тогда, когда матрица Ца^Ц с элементами ац~ — (f^, fk) является единичной, т. е. тогда и только тогда, когда выполнены соотношения /l при г = /с, A;, tk) = < 10 при г ^ к, устанавливающие ортонормированность базиса f\, f2, ..., fn. Вернемся к рассмотрению произвольного ортонормированного ба- базиса ei, в2, ..., еп n-мерного евклидова пространства Е. Выясним смысл координат произвольного элемента х относительно указанного базиса. Обозначим координаты элемента х относительно базиса ei, в2, ..., еп через х\, Ж2, ..., хп, т. е. предположим, что х = xiei + ж2е2 + ... + хпеп. D.15) Обозначим далее через к любой из номеров 1, 2,..., п и умножим обе части D.15) скалярно на элемент е&. На основании аксиом скаляр- скалярного произведения и соотношений D.10) получим / п \ (х, ек) = I ^Xiei5 ек I = ^^(e*, ел) = хк. \i=l / i=l Таким образом, координаты произвольного элемента относитель- относительно ортонормированного базиса равны скалярным произведениям этого элемента на соответствующие базисные элементы. Поскольку скалярное произведение произвольного элемента х на элемент е, имеющий норму, равную единице, естественно назвать проекцией элемента х на элемент е, то можно сказать, что коор- координаты произвольного элемента относительно ортонормированно- ортонормированного базиса равны проекциям этого элемента на соответствующие базисные элементы. Таким образом, произвольный ортонормированный базис обладает свойствами, вполне аналогичными свойствам декартова прямоуголь- прямоугольного базиса.
§ 2. БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 103 3. Разложение n-мерного евклидова пространства на пря- прямую сумму подпространства и его ортогонального дополне- дополнения. Пусть G — произвольное подпространство n-мерного евклидова пространства Е. Совокупность F всех элементов у пространства Е, ортогональ- ортогональных каждому элементу х подпространства G, называется ортого- ортогональным дополнением подпространства G. Заметим, что ортогональное дополнение F само является подпро- подпространством Е (ибо из ортогональности каждого из элементов у± и у2 элементу х, очевидно, вытекает, что и любая линейная комбинация элементов yi и у2 ортогональна элементу х). Докажем, что всякое п-мерное евклидово пространство Е пред- представляет собой прямую сумму своего произвольного подпростран- подпространства G и его ортогонального дополнения F. Выберем в G произвольный ортонормированный базис ei, в2, ..., е&. В силу доказанного в п. 1 §3 гл.2, этот базис можно дополнить элементами f& +1, ..., fn пространства Е до базиса во всем Е. Произведя процесс ортогонализации элементов ei,..., е&, i,..., fn, мы получим ортонормированный базис ei,..., е&, ..., еп всего пространства Е. Разложив произвольный эле- элемент х пространства Е по этому базису, т. е. представив его в виде х = xie1 + ... + xkek + xk + i^k + i + ••• + хпеп, мы получим, что этот элемент х однозначно представим в виде х = х' + х", где х' = xiei + ... + хк^к —совершенно определенный элемент G, а х" = Xk + i^k + i + ••• + жпеп —совершенно определенный элемент ортогонального дополнения F (каждый элемент e^ + i,..., еп орто- ортогонален к любому из элементов ei, ..., е^, а потому ортогонален любому элементу G; поэтому и линейная комбинация Xk + i^k + i + • • • ... + хпеп ортогональна любому элементу G, т. е. является совершен- совершенно определенным элементом F). 4. Изоморфизм n-мерных евклидовых пространств. В этом пункте мы покажем, что различные евклидовы пространства одной и той же размерности п в смысле свойств, связанных со введенными в этих пространствах операциями, по существу не отличаются друг от друга. Поскольку в евклидовых пространствах введены лишь операции сложения элементов, умножения элементов на числа и скалярного пе- перемножения элементов, то естественно сформулировать следующее оп- определение. Определение. Два евклидовых пространства Е и Е' называются изоморфными, если между элементами этих пространств можно уста- установить взаимно однозначное соответствие так, что если элементам х
104 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА и у пространства Е отвечают соответственно элементы х' и у' про- пространства Е', то элементу х + у отвечает элемент х' + у', элементу Ах (при любом вещественном А) отвечает элемент Ах' и скалярное про- произведение (х, у) равно скалярному произведению (х', у'). Таким образом, евклидовы пространства Е и Е' изоморфны, если они изоморфны как линейные пространства 10) и если этот изомор- изоморфизм сохраняет величину скалярного произведения соответствующих пар элементов. Теорема 4.4. Все евклидовы пространства одной и той же раз- размерности п изоморфны между собой. Доказательство. Достаточно доказать, что любое n-мерное ев- евклидово пространство Е' изоморфно евклидову пространству Еп упо- упорядоченных совокупностей п вещественных чисел со скалярным про- произведением D.2). Согласно теореме 4.3, в евклидовом пространстве Еп существует ортонормированный базис e'l5 е2, ..., е^. Каждому элемен- элементу х' = х\е[ + Ж2в2 + ... + хпе'п пространства Е' поставим в соответ- соответствие п вещественных чисел xi, Ж2, ..., хп, т. е. вполне определенный элемент х = (xi, Ж2, ..., хп) пространства Еп. Установленное соответствие будет взаимно однозначным. Кроме того, из теоремы 2.4 вытекает, что если элементам х' = (х\, Ж2, ..., хп) и У' — B/1? 2/2, • • •? Уп) пространства Е' ll) отвечают соответственно элементы х = (xi, Ж2, ..., хп) и у = B/1,2/2? • • •? Уп) пространства Еп, то элементу х; + у' отвечает элемент х + у, а элементу Ах; отвечает элемент Ах. Остается доказать, что для соответствующих пар элементов х;, у' и х, у сохраняется величина скалярного произведения. В силу ортонормированности базиса е^, е2, ..., е^ и формулы D.13), (х;, у;) = xiyi + Х2У2 + ... + ХпУп- С другой стороны, в силу формулы D.2), определяющей скалярное произведение в пространстве Еп, (х, у) = х\у\ + ж22/2 + ... + хпуп. Теорема доказана. Доказанная теорема позволяет утверждать, что если в каком- нибудь конкретном n-мерном евклидовом пространстве Е1 доказана теорема, сформулированная в терминах операций сложения, умноже- умножения на числа и скалярного перемножения элементов, то эта теорема справедлива и в совершенно произвольном n-мерном евклидовом про- пространстве Е. 10)См. п. 4 §2 гл.2. п) Координаты этих элементов берутся относительно базиса е'1? е'2, ..., е^.
§ 3. КОМПЛЕКСНОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 105 § 3. Комплексное евклидово пространство 1. Определение комплексного евклидова пространства. В конце п. 1 § 1 гл. 2 мы уже указывали, что если в определении линей- линейного пространства числа Л, /i, ... брать не из множества вещественных чисел, а из множества всех комплексных чисел, то мы придем к поня- понятию комплексного линейного пространства. На базе комплексного линейного пространства строится комплекс- комплексное евклидово пространство, играющее фундаментальную роль в теории несамосопряженных линейных преобразований. Для введения комплексного евклидова пространства следует вве- ввести в комплексном линейном пространстве понятие скалярного произ- произведения двух его элементов, подчиненное соответствующим четырем аксиомам. Определение. Комплексное линейное пространство R называется комплексным евклидовым пространством, если выполнены следую- следующие два требования. I. Имеется правило, посредством которого любым двум элементам х и у этого пространства ставится в соответствие комплексное число, называемое скалярным произведением этих элементов и обозначаемое символом (х, у). П. Указанное правило подчинено следующим четырем аксиомам: 1°) (х, у) = (УГ^У12); 2°) (xi + х2, у) = (xi, у) + (х2, у); 3°) (Лх, у) = Л(х, у); 4°) (х, х) представляет собой вещественное неотрицательное число, обращающееся в нуль лишь в случае, когда х —нулевой элемент 13). Логическими следствиями аксиом 1°)-3°) являются следующие два соотношения: (х, Ау) = А(х, у), (х, ух + у2) = (х, yi) + (х, у2). 12) Здесь и в дальнейшем символом а обозначается число, комплексно сопря- сопряженное с а. 13) Аксиома 1°) отличается от соответствующей аксиомы 1°) вещественного евклидова пространства. Легко убедиться в том, что при переходе к комплексному пространству невозможно сохранить без изменения все три аксиомы 1°), 3°) и 4°) вещественного скалярного произведения. В самом деле, при наличии аксиом (х, у) = (у, х) и (Ах, у) = А(х, у), мы получили бы, что (х, Ау) = (Ау, х) = А(у, х) = А(х, у). Но тогда оказалось бы, что (Ах, Ах) = А2(х, х), и, стало быть, при А = г мы получили бы, что (гх, гх) = — (х, х), а это противоречило бы аксиоме 4°) о неотрицательности (у, у) для любого элемента у.
106 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА В самом деле, из аксиом 1°) и 3°) заключаем, что (х, Ау) = (Ау, х) = А(у, х) = А(х, у), а из аксиом 1°) и 2°) получим, что (х, ух + у2) = (yi + у2, х) = (уь х) + (у2, х) = (х, ух) + (х, у2). Приведем примеры конкретных комплексных евклидовых про- пространств. Пример 1. Рассмотрим совокупность С* [а, Ь] всех функций z = = z (t), определенных для значений t из сегмента а ^ t ^ Ъ и при- принимающих комплексные значения z (t) = x (t) + iy (t) такие, что ве- вещественные функции х (?) и у (t) являются непрерывными на этом сегменте. Операции сложения этих функций и умножения их на комплексные числа заимствуем из анализа. Скалярное произведение двух любых таких функций определим соотношением [z\ (?), z^ (t)) = = faZl{t)l^T)dt. Нетрудно убедиться в справедливости для так определенного ска- скалярного произведения всех аксиом 1°)-4°), из чего следует, что рас- рассматриваемая совокупность представляет собой комплексное евклидо- евклидово пространство. Пример 2. Рассмотрим комплексное линейное пространство А™, элементами которого служат упорядоченные совокупности п ком- комплексных чисел жх, Х2, • •., хп с такими же определениями операций сложения элементов и умножения их на числа, как и в случае веще- вещественного линейного пространства Ап. Скалярное произведение двух любых элементов х = (жх,Ж2,... ..., хп) и у = B/i, 2/2? • • -э 2/п) определим соотношением (х, у) = жх2/1 + х2у2 + ... + хпуп. D.16) Справедливость для так определенного скалярного произведения аксиом 1°)-3°) проверяется совершенно элементарно. Справедливость аксиомы 4°) вытекает из соотношения (х, х) = х\Х\ + ж2ж2 + ... + хпхп = |жх|2 + |ж2|2 + ... + \х 2 + + \х\2 Стало быть, пространство А™ со скалярным произведением D.16) является комплексным евклидовым пространством. Пример 3. В том же самом комплексном линейном простран- пространстве А™ можно ввести скалярное произведение не соотношением D.16),
§ 3. КОМПЛЕКСНОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 107 а более общим соотношением 14) п п (х, у) = ^2 ^2aikXiy^ D-17) i=lk=l в котором ||а^||—произвольная матрица, состоящая из комплексных чисел dik, удовлетворяющих условию а^ — а/^, такая, что квадратич- квадратичная форма Yl7=i ^Ук = 1 aikXiXk для всех комплексных xi, Ж2, ..., хп принимает вещественные неотрицательные значения и обращается в нуль лишь при условии |xi|2 + |х212 + ... + \хп\2 = 0. Предоставляем читателю проверку того, что так определенное ска- скалярное произведение удовлетворяет аксиомам 1°)-4°). 2. Неравенство Коши—Буняковского. Понятие нормы. До- Докажем, что для любых двух элементов х и у произвольного комплекс- комплексного евклидова пространства справедливо неравенство Коши-Буняко- вского 15) , х)(у, у). D.18) На основании аксиомы 4°) для любого комплексного числа Л спра- справедливо неравенство (Лх - у, Лх - у) ^ 0. D.19) Так как в силу аксиом 1°)-3°) и их логических следствий (Лх - у, Лх - у) = ЛЛ(х, х) - Л(х, у) - Л(у, х) + (у, у) = = |Л|2(х, х) - Л(х, у) - Л(х, у) + (у, у), то неравенство D.19) принимает вид |Л|2(х, х) - Л(х, у) - Л(х, у) + (у, у) ^ 0. D.20) Обозначим через ср аргумент комплексного числа (х, у) и представим это число в тригонометрической форме 16) (х, у) = |(х, у)|(cos у? + г sin у?). D.21) 14) D.17) переходит в D.16), когда матрица ||flifc|| является единичной. 15) Поскольку (х, у) является, вообще говоря, комплексным числом, то нельзя записывать неравенство Коши-Буняковского в виде D.6). 16) Понятия аргумента и тригонометрической формы комплексного числа раз- разбираются, например, в § 1 гл. 7 выпуска «Основы математического анализа», часть I.
108 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА Положим теперь комплексное число Л равным Л = t(coscp — isincp), D.22) где t —произвольное вещественное число. Из соотношений D.21) и D.22) очевидно, что |А| = |?|, Л(х, у) = Л(х, у) = ?|(х, у)|. Поэтому при выбранном нами Л неравенство D.20) переходит в неравенство i2(x, х) - 2*|(х,у)| + (у, у)^0, D.23) справедливое при любом вещественном t. Необходимым и достаточ- достаточным условием неотрицательности квадратного трехчлена, стоящего в левой части D.23), является неположительность его дискриминанта, т. е. неравенство |(х, у)|2 - (х, х)(у, у) ^ 0, эквивалентное неравен- неравенству D.18). С помощью неравенства Коши—Буняковского D.18) и рассуждений, полностью аналогичных доказательству теоремы 4.2, устанавливается, что всякое комплексное евклидово пространство является нормиро- нормированным, если в нем норму любого элемента х определить соотноше- соотношением ||х|| = y/fr~*j. D.24) В частности, во всяком комплексном евклидовом пространстве с нормой, определяемой соотношением D.24), справедливо неравенство треугольника ||х + у|| ^ ||х|| + ||у||. Замечание. Подчеркнем, что введенное для вещественного ев- евклидова пространства понятие угла ср между двумя произвольными элементами х и у теряет смысл для комплексного евклидова простран- пространства (вследствие того, что скалярное произведение (х, у) является, во- вообще говоря, комплексным числом). 3. Ортонормированный базис и его свойства. Элементы х и у произвольного комплексного евклидова пространства будем называть ортогональными, если скалярное произведение (х, у) этих элементов равно нулю. Ортонормированным базисом n-мерного комплексного евклидова пространства назовем совокупность его элементов ei, в2, ..., еп, удо- удовлетворяющих соотношениям (l при г = к, (е;, ек) = <^ D.25) 10 при г ф к (т. е. попарно ортогональных и имеющих нормы, равные единице).
§ 3. КОМПЛЕКСНОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 109 Как и в п. 1 § 2, доказывается, что эти элементы линейно независи- независимы и потому образуют базис. В полной аналогии с доказательством теоремы 4.3 (т. е. с помощью процесса ортогонализации) устанавливается существование в произ- произвольном n-мерном комплексном евклидовом пространстве ортонорми- рованного базиса. Выразим скалярное произведение двух произвольных элементов х и у n-мерного комплексного евклидова пространства через их коорди- координаты xi, ж2, ..., хп и 2/i, ?/2, • • •? Уп относительно ортонормированного базиса еь е2, ..., еп. Так как х = xiei + ж2е2 + ... + жпеп, у = у^ + у2е2 + ... + 2/пеп, то в силу аксиом 1°)—4°) и соотношений D.25) получим i = l к = Выразим далее координаты xi, ж2, ..., хп произвольного элемен- элемента х относительно ортонормированного базиса ei, е2, ..., еп. Умножая разложение этого элемента по базису х = х\Ъ\ + + ж2е2 + ... + хпеп скалярно на е/, и пользуясь соотношениями D.25), получим (для любого к, равного 1, 2, ..., п) (х, ек) = ^xiei, ek = ^^(e*, ek) = хк. г=1 Итак, как и в случае вещественного евклидова пространства, ко- координаты произвольного элемента х относительно ортонормиро- ортонормированного базиса равны скалярным произведениям этого элемента на соответствующие базисные элементы. В полной аналогии с доказательством теоремы 4.4 устанавливает- устанавливается, что все комплексные евклидовы пространства одной и той же размерности п изоморфны между собой.
по ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА § 4. Метод регуляризации для отыскания нормального решения линейной системы Снова возвратимся к рассмотрению общей линейной системы т уравнений с п неизвестными вида C.1). Эту систему кратко запишем в матричной форме 17) АХ = В. D.26) Напомним, что в этой записи символ А обозначает матрицу а= \\(iij\\ (г = 1,2,..., т; j = 1, 2, ..., п), а символы X и В обозначают столб- столбцы (или векторы) вида X = XI В = h первый из которых подлежит определению, а второй —задан. Будем рассматривать случай, когда значения элементов матрицы А и столбца свободных членов В заданы нам лишь приближенно 18). То- Тогда естественно говорить лишь о приближенных значениях искомого столбца X. Изложенные в предыдущей главе и основанные на форму- формулах Крамера алгоритмы вычисления столбца решений X в этом слу- случае могут приводить к большим погрешностям и теряют практический смысл 19) . В этом параграфе мы изложим принадлежащий А.Н. Тихоно- Тихонову алгоритм, позволяющий находить так называемое нормальное (т. е. наиболее близкое к началу координат) решение X с точно- точностью, соответствующей точности задания элементов матрицы А и столбца В 20). Введем в рассмотрение так называемые сферические нормы столб- 17) См. формулу C.6) из предыдущей главы. 18) Такая ситуация будет иметь место в случае, если эти значения получаются из физических измерений или если в процессе вычислений приходится округлять указанные значения до некоторого знака. 19) Особенно это относится к случаю так называемых «плохо обусловленных» матриц (для которых «малые» изменения элементов матрицы базисного минора ведут к «большим» изменениям элементов обратной матрицы). 20) См. Тихонов А.Н. «О некорректных задачах линейной алгебры и устой- устойчивом методе их решения»// Доклады Академии наук СССР. 1965. Т. 163, №3. С. 591-594.
4. МЕТОД РЕГУЛЯРИЗАЦИИ 111 цов В и X и матрицы А, положив их равными \ \ \ ЕЕ 4- D-27) г = 1 j = 1 Заметим, что нормы столбцов В и X определяются как обычные нормы векторов — элементов пространств Еш и соответственно Еп. Норма матрицы А согласована с нормой n-мерного столбца X в том смысле, что норма m-мерного столбца АХ, равного произведению мат- матрицы А на столбец X, удовлетворяет условию 21) \\AX\\ ^ Р||||Х||. D.28) Будем считать, что вместо точных значений элементов матрицы А = \\ctij\\ и столбца правых частей В = \\bij\\ нам заданы прибли- приближенные значения А = ||а^||, В = \\bij\\. Матрицу А (столбец В) будем называть S-приближением матри- матрицы А (столбца В), если справедливо неравенство \\А - А\\ = \ \\В - В\\ = \ . D.29) Назовем нормальным решением совместной системы D.26) то ее решение Х° = Х*2 „О , норма 11-Х1| которого является наименьшей 21) В самом деле, пользуясь определением произведения матрицы на столбец, соотношениями D.27) и неравенством Коши-Буняковского для элементов евкли- евклидова пространства Еп, будем иметь \AX\f = Е Е Е Е4 ?--Е г = 1 j = 1 j = 1
112 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА среди норм ||Х|| всех решений X этой системы. Заметим, что у всякой совместной системы D.26) (в том числе и у неопределенной) существу- существует единственное нормальное решение. Введем в рассмотрение следующую функцию п переменных xi, ж 2, ..., хп или одного столбца X = Fa(xu..., хп, А, В) = Fa(X, А, В) = \\АХ - В\\2 + а\\Х\\2, D.30) зависящую, как от параметров, от элементов матрицы А и столбца В, а также зависящую от некоторого числового параметра а. В подробной записи эта функция выглядит так: Fa(X, А,В) = ^ Е г = 1 D.300 Фактически Fa(X, А, В) является функцией от элементов X ев- евклидова пространства n-мерных столбцов Еп. Такого рода функцию, аргументом которой служат элементы некоторого линейного простран- пространства, принято называть функционалом 22) . Легко убедиться в том, что при любом фиксированном а > 0 неотрицательный функционал D.30') достигает своего минималь- минимального (во всем пространстве Еп) значения в единственной точке ж? Ха = ... пространства Еп В самом деле, дважды дифференцируя функцию D.30'), получим J 1 при к = I, | 0 при к ф I. = 2 г=1 Следовательно, второй дифференциал функции Fa имеет вид ¦ikO.ii + a k=li=l = ? ik = + a^(dxky к = 1 2) Функционалы систематически изучаются в следующей главе.
4. МЕТОД РЕГУЛЯРИЗАЦИИ 113 Из этого равенства вытекает оценка d2Fa ^ a ^2^=i(dxkJ, означаю- означающая, что функция Fa является строго выпуклой вниз. Кроме того, Fa —У + оо при ||Х|| = \/Y^k = i x\ ~^ °°- Отсюда очевидным обра- образом следует, что Fa имеет, и притом единственную, точку миниму- минимума Ха 23). Методы отыскания минимальных значений функционалов вида D.30) хорошо разработаны 24) . Докажем следующую фундаментальную теорему, сводящую вопрос о приближенном отыскании нормального решения системы D.26) к отысканию того элемента Ха = на котором достигает своего минимального значения функционал D.30). Теорема А.Н. Тихонова. Пусть матрица А и столбец В удовлетворяют условиям, обеспечивающим совместность системы D.26), Х° = — нормальное решение этой системы, А — 8-приближение матрицы А, В — 8-приближение столбца В, е{8) и а (8) — какие-либо возрастающие функции 8, стремящиеся к нулю при 8 —> 0 + 0 и такие, что 82 ^ г (8) а (8). Тогда для любого г > 0 най- найдется положительное число So = So (г, ||^°||) такое, что при любом 8 < So(s, \\Х°\\) и при любом а, удовлетворяющем условию eFY а (8), D.31) элемент Ха = , доставляющий минимум функциона- функционалу D.30), удовлетворяет неравенству \\Х" - Х°\\ : D.32) Доказательство. Рассмотрим в линейном пространстве Еш подмножество всех элементов 17= , представимых в 23) См., в частности, выпуск 1 «Основы математического анализа», часть I, гл. 14, § 7. 24) См. там же. В.А. Ильин, Э.Г. Позняк
114 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА виде U = АХ, где X = — произвольный элемент простран- пространства Еп. Совершенно очевидно, что подмножество {UA} представляет собой линейное пространство и поэтому является подпространством Ет. Обозначим через {VA} ортогональное дополнение {UA} (до всего Ет) и разложим Ет в прямую сумму подпространств {UA} и {VA} 25). Пусть Вд обозначает проекцию столбца В на подпространство {^д}, так что В = ВА + (В - ВА), где (В - Бд)-элемент {VA}. Тог- Тогда, поскольку для любого элемента X пространства Еп столбец АХ является элементом {^д}, мы получим следующее разложение: АХ - В = (АХ - ВА) + (Вл - В), в котором элементы (АХ — ВА) и (ВА — В) ортогональны друг другу и принадлежат соответственно {UA} и {Уд}. Пользуясь теоремой Пифагора (см. п. 2 § 1), мы получим (для лю- любого элемента X пространства Еп) \\АХ - ВЦ2 = \\АХ - ВА\\2 + \\В - ВА\ Из D.33) следует, в частности, неравенство ЦБ - ВА\\ ^ \\АХ - ВЦ, D.33) D.34) также справедливое для любого элемента X пространства Еп. Из D.33) и D.30) мы получим, что для любого X из Еп Fa(X, А, В) = \\В - ВА\\2 + Fa(X, А, ВА), D.35) т. е. функционалы, стоящие в левой и в правой частях D.35), имеют общий элемент Ха, доставляющий им минимум. Установим теперь для любого а, удовлетворяющего условиям D.31), следующее неравенство: Fa(Xa, i, ВА) ^ агE)С2 + а||Х°||, D.36) в котором через С обозначена величина С = 2A + ||^°||), аХ° — нормальное решение системы D.26). 25) См. п. 3 § 2 этой главы.
§ 4. МЕТОД РЕГУЛЯРИЗАЦИИ 115 Так как столбец Ха доставляет минимум функционалу, стоящему в правой части D.35), то Fa(Xa, i, ВА) ^ Fa(X°, i, ВА) = \\АХ° - ВА\\2 + а||Х°||2. D.37) Пользуясь соотношением АХ° = В и неравенством треугольника, получим \\АХ° - ВА\\ ^ \\АХ° - АХ°\\ + \\В - В\\ + \\В - ВА\\. В правой части последнего неравенства воспользуемся соотношениями D.28) и D.29), а также неравенством D.34), взятым при X = Х°. Получим \\АХ° - ВА\\ ^ ё\\Х°\\ + S + \\В - АХ°\\. D.38) Еще раз учитывая, что АХ° = 5, и снова пользуясь неравенством треугольника и соотношениями D.28) и D.29), получим, что ЦБ - iX°|| ^ ЦБ - ВЦ + ||AY0 - iX°|| ^ 5 + 6 ¦ \\Х°\\. D.39) Из D.38) и D.39) следует, что \\АХ° - ВА\\ ^ 26A + \\Х°\\) = С6, D.40) где С = 2A + ||Х°||). Для завершения доказательства оценки D.36) остается подставить D.40) в D.37) и воспользоваться неравенством D.31). Поскольку из определения функционала Fa сразу вытекает, что а • \\Ха\\2 ^ Fa(Xa, А, ВА), то из доказанного нами неравенства D.36) вытекает также следующее неравенство: \\Ха\\^\\Х°\\+?1F), D.41) в котором si (S) —у 0 при S —> 0 + 0. Из D.41) вытекает, что при всех достаточно малых S множество {Ха} точек Ха пространства Еп является ограниченным. Теперь уже нетрудно доказать теорему от противного. Предполо- Предположим, что для некоторого го > 0 существует последовательность 5п —>¦ —у 0 + 0 и отвечающая ей последовательность {ап} чисел ап, удовле- удовлетворяющих условию —lY-X^an^a{8n), D.31*) такая, что для всех номеров п \\Ха- - Х°|| ^г0. D.42)
116 ГЛ. 4. ЕВКЛИДОВЫ ПРОСТРАНСТВА Так как множество {Ха} ограничено, то в силу теоремы Больцано- Вейерштрасса из последовательности {Хап} можно выделить сходя- сходящуюся подпоследовательность. Чтобы не менять обозначений, будем считать, что вся последовательность {Хап} сходится к некоторому столбцу Х° = , т. е. \\Хап - Х°\\ -+ 0 при п оо. Убедимся в том, что - AX11 ->• 0 при п ->• оо. D.43) В самом деле, пользуясь неравенством треугольника, оценками D.28), D.29), D.36) и D.40) и соотношением D.31*), получим Ха- - АХ °\ - - ВА\\ + \\ВА - АХ°\ С5п <: 5п(\\Ха-1| + С) + + л/апеEп)С + «nll^0!!2 ^ 0 при n ^ оо. Из неравенства D.43) вытекает, что АХ° = АХ°, т. е. предельный элемент Х° является решением системы D.26), удовлетворяющим, в силу соотношения D.41), неравенству ||Х°|| ^ ||^°||- Так как по опре- определению для нормального решения Х° справедливо обратное неравен- неравенство ||Х°|| ^ ||Х0||, то ||Х0|| = ||Х°||, т. е. ХО = Х°, а это противоре- противоречит неравенству D.42), справедливому для любого номера п. Полученное противоречие завершает доказательство теоремы.
ГЛАВА 5 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В этой главе исследуются так называемые линейные отображения линейных и евклидовых пространств, т. е. такие отображения, при ко- которых образ суммы элементов равен сумме их образов и образ произ- произведения элемента на число равен произведению этого числа на образ элемента. При этом мы будем рассматривать комплексные линейные и евклидовы пространства. Результаты, относящиеся к вещественным пространствам, будут оговорены специально. § 1. Понятие линейного оператора. Основные свойства 1. Определение линейного оператора. Пусть У и Не- Нелинейные пространства, размерности которых равны соответственно п и т. Мы будем называть оператором А, действующим из V в W, отображение вида А: V —> W, сопоставляющее каждому элементу х пространства V некоторый элемент у пространства W. При этом бу- будем использовать обозначение у = А (х) или у = Ах. Определение. Оператор А, действующий из V в W, называется линейным, если для любых элементов xi u Х2 пространства V и любого комплексного числа Л выполняются соотношения: 1°) A (xi + X2) = Axi + Ax2 {свойство аддитивности опера- оператора) ; 2°) А (Лх) = Л Ах {свойство однородности оператора). Замечание 1. Если пространство W представляет собой ком- комплексную плоскость, то линейный оператор А, действующий из V в W, называется линейной формой или линейным функционалом. Замечание 2. Если пространство W совпадает с пространст- пространством V, то линейный оператор, действующий в этом случае из У в У, называют также линейным преобразованием пространства V. 2. Действия над линейными операторам. Пространство ли- линейных операторов. В множестве всех линейных операторов, дей- действующих из V в W, определим операции суммы таких операторов и умножения оператора на скаляр. Пусть А и В —два линейных оператора, действующих из V в W.
118 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Суммой этих операторов назовем линейный оператор А + В, опреде- определяемый равенством (А + В)х = Ах + Вх. E.1) Произведением линейного оператора А на скаляр Л назовем линей- линейный оператор Л А, определяемый равенством (АА)х = А(Ах). E.2) Назовем нулевым оператор, обозначаемый символом О и отобра- отображающий все элементы пространства V в нулевой элемент пространст- пространства W. Иными словами, оператор О дейетвует по правилу Ох = 0. Для каждого оператора А определим противоположный опера- оператор — А посредством соотношения -А = (- Легко проверить справедливость следующего утверждения. Множество L (У, W) всех линейных операторов, действующих из V в W, с указанными выше операциями суммы и умножения на скаляр и выбранными нулевым оператором и противоположным опе- оператором образует линейное пространство. 3. Свойства множества L (V, V) линейных операторов. Ис- Исследуем подробнее линейные операторы, действующие из У в У, т. е. изучим подробнее множество L (V, У). Назовем тождественным (или единичным) оператором линейный оператор I, действующий по правилу 1х = х (здесь х —любой эле- элемент У). Введем понятие произведения линейных операторов из множест- множества L (У, У). Произведением операторов А и В из L (У, У) называется опера- оператор АВ, действующий по правилу (АВ)х = А(Вх). E.3) Отметим, что, вообще говоря, АВ ф ВА. Справедливы следующие свойства линейных операторов L(V,V): 1°) А(АВ) = (АА)В; 2°) (А + В)С = АС + ВС; 3°) А(В + С) = АВ + АС; 4°) (АВ)С = А(ВС). из
§ 1. ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА 119 Первое из свойств 1°)-4°) следует из определения произведения линейного оператора на скаляр (см. E.2)) и определения произведения операторов (см. E.3)). Перейдем к обоснованию свойства 2°). Имеем, согласно E.1), E.2) и E.3), ((А + В)С)х = (А + В)(Сх) = А(Сх) + В(Сх) = = (АС)х + (ВС)х = (АС + ВС)х. E.4) Сравнивая левую и правую части последних соотношений, мы по- получаем равенство (А + В)С = АС + ВС. Свойство 2°) установлено. Совершенно аналогично доказывается свойство 3°). Свойство 4°) справедливо, поскольку, согласно определению (см. E.3)), произведение линейных операторов заключается в их последо- последовательном действии, и поэтому линейные операторы (АВ)С и А(ВС) совпадают и, следовательно, тождественны. Замечание 1. Свойство 4°) позволяет определить произведение АВ ... С любого конечного числа операторов из L (У, У) и, в частно- частности, n-ю степень оператора А с помощью формулы An = AA...A. п сомножителей Очевидно, справедливо соотношение An + m = AnAm. Нам понадобится понятие обратного оператора для данного опе- оператора А из L (У, У). Определение 1. Линейный оператор В из L (У, У) называется обратным для оператора А из L (У, У), если выполняется соотноше- соотношение АВ = ВА = I. Обратный оператор для оператора А обычно обозначается симво- символом А~ 1. Из определения обратного оператора А~ х следует, что для любого х Е У справедливо соотношение А Ах = х. Таким образом, если А~ 1 Ах = 0, то х = 0, т. е. если оператор А имеет обратный, то из условия Ах = 0 следует, что х = 0. Мы будем говорить, что линейный оператор А действует взаимно однозначно из У в У, если любым двум различным элементам xi и Х2 отвечают различные элементы yi = Axi и у2 = Ах2. Если оператор А действует взаимно однозначно из У в У, то отоб- отображение А: У —у У представляет собой отображение У на У, т. е. каждый элемент у Е У представляет собой образ некоторого элемен-
120 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ та х е V: У = Ах. Чтобы убедиться в этом, достаточно, очевидно, доказать, что п линейно независимых элементов xi, X2, ..., хп пространства V отоб- отображаются посредством оператора А в п линейно независимых Axi, Ax2, ..., Ахп элементов этого же пространства. Итак, пусть xi, X2, ..., хп — линейно независимые элементы V. Ес- Если линейная комбинация а\ Axi + а 2 Ах2 + ... + сипАхп представляет собой нулевой элемент пространства V: aiAxi + «2Ах2 + ... + anAxn = О, то из определения линейного оператора (см. п. 1 этого параграфа) сле- следует, что A(aiXi + a2x2 + ... + «nxn) = 0. Так как оператор А действует из V в V взаимно однозначно, то из последнего соотношения вытекает, что aiXi + «2X2 + ... + otnxn = = 0. Но элементы xi, X2, ..., хп линейно независимы. Поэтому а± = = «2 = ... = Oin — 0- Следовательно, элементы Axi, АХ2, ..., Ахп также линейно независимы. Отметим следующее утверждение. Для того чтобы линейный оператор А из L (V, V) имел обрат- обратный, необходимо и достаточно, чтобы этот оператор действовал взаимно однозначно из V в V. Убедимся, что сформулированное условие необходимо. Пусть опе- оператор А имеет обратный, но не действует взаимно однозначно из V в V. Это означает, что некоторым различным элементам xi и Х2, Х2 — — xi ф 0 из V отвечает один и тот же элемент у = Ах1 = Ах2. Но тогда А(х2 — xi) = 0, и поскольку А имеет обратный, xi — Х2 = 0. Но выше было отмечено, что xi — Х2 Ф 0. Полученное противоречие доказывает необходимость условия утверждения. Докажем достаточность этого условия. Допустим, что оператор А действует взаимно однозначно из У в У. Тогда каждому элементу у G V отвечает элемент х G V такой, что у = Ах. Поэтому имеется оператор А~ 1, обладающий тем свойством, что А-1у = А (Ах) = х. Легко убедиться, что оператор А ли- линейный. По определению А~г —обратный оператор для оператора А. Достаточность условия утверждения также доказана. Введем понятия ядра и образа линейного оператора. Определение 2. Ядром линейного оператора А называется мно- множество всех тех элементов х пространства У, для которых Ах = 0. Ядро линейного оператора А обозначается символом ker А. Если ker A = 0, то оператор А действует взаимно однозначно из V
§ 1. ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА 121 в У. Действительно, в этом случае из условия Ах = 0 вытекает х = О, а это означает, что различным xi и Х2 отвечают различные yi = Axi и у2 = Ах2 (если бы у\ = У2, то А(х2 — xi) = 0, т. е. xi = X2 и элементы xi и Х2 не были бы различны). Таким образом, согласно доказанному выше утверждению условие ker A = 0 является необходимым и достаточным для того, чтобы оператор А имел обратный. Определение 3. Образом линейного оператора А называется множество всех элементов у пространства V, представимых в ви- виде у = Ах. Образ линейного оператора А обозначается символом imA !). Замечание 2. Отметим, что если ker А = 0, то imA = У, и наоборот. Поэтому наряду с отмеченным выше условием ker A = О условие imA = V таксисе является необходимым и достаточным для того, чтобы оператор А имел обратный. Замечание 3. Очевидно, ядро ker А и образ imA —линейные подпространства пространства V. Поэтому можно рассматривать раз- размерности dim (ker А) и dim (imA) этих подпространств. Справедлива следующая теорема. Теорема 5.1. Пусть размерность dim V пространства V равна п, и пусть А —линейный оператор из L (V, V). Тогда dim (imA) + dim (ker A) = п. Доказательство. Так как ker А представляет собой подпрос- подпространство У, то можно указать такое подпространство V\ простран- пространства У, что V будет представлять собой прямую сумму V\ и ker А 2). Согласно теореме 2.10 dim V\ + dim (ker A) =n. Поэтому для доказа- доказательства теоремы достаточно убедиться, что dim Vi = dim (imA). Пусть dimVi = p, dim(imA) = g и yi, y2, ..., yn —базис в imA. Так как линейный оператор А действует взаимно однозначно из V\ в im A 3), то каждому элементу у из imA можно поставить в соот- соответствие единственный элемент х Е V\ такой, что Ах = у. Поэтому *) Символ im следует отличать от символа Im, используемого для обозначения мнимой части комплексного числа. 2) Чтобы убедиться в этом, выберем в V такой базис ei, ег, ..., ете, что пер- первые г векторов ei, ег, ..., ег образуют базис в ker А, тогда линейная оболочка векторов er + i, ..., еп представляет собой V\ (см. подробнее гл.4). 3) По аналогии с линейными операторами, действующими взаимно однозначно из У в У, можно ввести понятие линейного оператора А, действующего взаимно однозначно из линейного пространства V в линейное пространство W. Эти опе- операторы характеризуются тем, что различным элементам xi и Х2 пространства V
122 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ в V\ определены элементы xi, х2, ..., хд такие, что Ах& = у/,, к = = 1, 2, ..., q. Элементы xi, X2, ..., хд линейно независимы, ибо если «iXi + «2Х2 + . . . + Olq-Xq = О, ТО A(«iXi + «2Х2 + . . . + «gXg) = OLiYi + + «2У2 + ... + agyg = 0, а так как элементы уь у2, ..., yq линейно независимы, то ai = а2 = ... = aq = 0, т. е. и xi, х2, ..., xg линей- линейно независимы. Таким образом, в V\ имеется q линейно независимых элементов. Следовательно, р^ q (напомним, что p = dimVi). Предположим, что р > q. Добавим к линейно независи- независимым элементам xi, х2, ..., хд элементы xg + i, xg + 2, ..., хр так, что xi, х2, ..., хр образуют базис в V\. Так как р > q и g = dim(im А), то элементы Axi, Ах2, ..., Ахр, принадлежащие im А, линейно зависи- зависимы, и поэтому существуют не все равные нулю числа Ai, А2, ..., Хр такие, что AiAxi + А2Ах2 + ... + АрАхр = 0. Отсюда следует, что A(AiXi+A2x2+ ... + АрХр) = 0. Так как А действует из V\ в imA взаимно однозначно, то из последнего равенства получаем Aixi + А2х2 + ... + АрХр = 0. Но xi, х2, ..., хр —базис в V\. Поэтому Ai = А2 = ... = Хр = 0. Выше указывалось, что не все Ai, А2, ..., Хр равны нулю. Следова- Следовательно, предположение р > q ведет к противоречию. Таким образом, р = q. Теорема доказана. Имеет место также следующая теорема, в определенном отношении обратная теореме 5.1. Теорема 5.2. Пусть V\ и У2 — два таких подпространства п-мерного пространства V, что dim V\ -\- dim У2 =dimV. Тогда су- существует такой линейный оператор А из L (У, У), что V\ =im А и У2=кегА. Доказательство. Пусть dimVi = p, dimV^ = q. Выбе- Выберем в пространстве V базис ei,e2, ..., еп так, чтобы элементы ер _|_ 1, ер _|_ 2, • • •, еп принадлежали У2. Далее в пространстве V\ выбе- выберем некоторый базис gi, g2, ..., gp. Определим теперь значения линейного оператора А на базисных отвечают различные элементы yi = Axi и у2 = Ах2 пространства W. Таким свойством обладает рассматриваемый оператор А, действующий из пространства V\ в пространство imA. Действительно, если xi Е Vi, Х2 Е Vi, Х2 — xi ф О, то Х2 — xi E У\-» и поэтому Ах2 ф Axi (Axi Е гтА, Ах2 Е imA., ибо если бы Ах2 = Axi, то А(х2 — xi) = = О, т. е. Х2 — xi GkerA, что противоречило бы принадлежности Х2 — xi E У\ и условию Х2 — xi ф О (Vi и kerA составляют прямую сумму и поэтому имеют общим лишь нулевой элемент).
§ 1. ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА 123 векторах ei, в2, ..., еп пространства V следующим образом: Aei = gb Ae2 = g2, ..., Аер = gp, = 0, Аер + 2 = 0, ..., Аеп = 0. пеп, Далее, если х = x±ei + ж2е2 + ... + хрер + xp + iep+i + ... + жпеп то Ах = xigi + x2g2 + ... + Xpgp. Очевидно, оператор А линейный и обладает требуемыми свойствами. Теорема доказана. Введем понятие ранга линейного оператора А. Назовем рангом линейного оператора А число, обозначаемое сим- символом rang А и равное rang A = dim (im A). Отметим следующее очевидное следствие из теоремы 5.1 и из за- замечания 2 этого пункта. Следствие из теоремы 5.1. Для того чтобы оператор А из L (V, V) имел обратный А, необходимо и достаточно, чтобы rang A = dim V = п. Пусть А и В —линейные операторы из L (V, V). Справедлива сле- следующая теорема. Теорема 5.3. Имеют место следующие соотношения: rang AB ^ rang A, rang AB ^ rang В. Доказательство. Докажем сначала первое из отме- отмеченных соотношений. Очевидно, im AB С im A 4) . Поэтому dim(imAB)^ dim(imA), т. е. rangAB ^ rang А. Для доказательства второго соотношения воспользуемся следую- следующим очевидным включением 5): kerB Cker AB. Из этого включения следует, что dim(kerB) ^ dim(kerAB). Из последнего неравенства, в свою очередь, следует неравенство dim V — dim (ker AB) ^ dim У— dim (kerB), а из него, согласно тео- теореме 5.1, получаем dim(imAB)^ dim(imB), т. е. rangAB ^ rangB. Теорема доказана. Докажем еще одну теорему о рангах линейных операторов. Теорема 5.4. Пусть А и В— линейные операторы из L (У, V) и п —размерность V. Тогда rangAB ^ rang A + rang В — п. Доказательство. Согласно теореме 5.1, dim(imAB) + dim (ker AB) = п. E.5) 4) Символ С здесь и в дальнейшем обозначает включение, т. е. запись АС В обозначает, что А является подмножеством В. 5) Так как АВ и ВА различные, вообще говоря, операторы, то включение im AB С im В может не иметь места, и поэтому для доказательства второго соот- соотношения rang AB <C rang В требуются специальные рассуждения.
124 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Так как rang АВ = dim (imAB), то из E.5) получаем rangAB — п — dim(kerAB). E.6) Поскольку, согласно теореме 5.1, dim(kerA) + dim(kerB) = 2n — (rang A + rangB), E.7) то для доказательства теоремы достаточно установить неравенство dim(kerAB) ^ dim(kerA) + dim(kerB). E.8) Действительно, из этого неравенства и из соотношения E.6) следует неравенство rangAB ^ п - (dim(ker A) + dim(kerB)), из которого, согласно E.7), сразу же вытекает справедливость утвер- утверждения теоремы. Итак, перейдем к обоснованию неравенства E.8). Пусть dim(kerB) = q. E.9) Согласно теореме 5.3 dim (ker АВ) ^ q. Поэтому справедливо соот- соотношение dim(ker АВ) = р + q, где р ^ 0. E.10) Так как ker В CkerAB, то в подпространстве кегАВ можно вы- выбрать базис xi, X2, ..., хр + д так, что элементы xp + i, ..., хр + д об- образуют базис в ker В. При таком выборе хь х2, ..., хр + д элементы Bxi, Bx2, ..., Вхр линейно независимы (если линейная комбинация ?л = 1А*Вх* = 0,toBELiW = 0, т. е. ?л = 1А*х* С ker В, а это может быть, в силу выбора xi, X2, ..., хр, лишь при А/. = = 0, к = 1,2, ...,р). Поэтому элементы Bxi, Bx2, ..., Вхр принад- принадлежат ker А, т. е. р ^ dim (ker А). Из этого неравенства и соотношений E.9) и E.10) вытекает требуемое неравенство E.8). Теорема доказана. Следствие из теорем 5.3 и 5.4. Если rang A = n (п — размер- размерность У), то rang АВ = rang BA = rang В. Указанное следствие вытекает из неравенств rangAB ^ rangB (теорема 5.3), rangAB ^ rangB (теорема 5.4 при rang A = п). Из этих неравенств получим, что rangAB = rang В. Аналогично доказывается соотношение rang В А = rang В.
§ 2. МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ 125 § 2. Матричная запись линейных операторов 1. Матрицы линейных операторов в заданном базисе ли- линейного пространства V. Фиксируем в линейном пространстве V базис ei, в2, ..., еп. Пусть х — произвольный элемент V и п х = ^ Х^к E.11) к = 1 разложение х по данному базису. Пусть А —линейный оператор из L (V, V). Тогда из E.11) получаем п Ах = ^2хкАек. E.12) к = 1 Полагая п Аек = ^2ajkej, E.13) перепишем E.12) в следующей форме: k = l j = l 3 = 1 \к = 1 / Таким образом, если у = Ах и элемент у имеет координаты у1, у2, ..., уп, то Vj = Х>^*> 3 = 1,2,..., п. E.14) k = i Рассмотрим квадратную матрицу А с элементами а3к: А = D). Эта матрица называемся матрицей линейного оператора в задан- заданном базисе ei, в2, ..., еп. Наряду с ранее указанным способом записи линейного операто- оператора используется при заданном базисе ei, в2, ..., еп матричная фор- форма записи: у = Ах, причем, если х = (ж1, ж2, ..., жп), то у = = (у1, у2, ..., уп), где 2/J, j = 1, 2, ..., п, определяются с помощью соотношений E.14), а элементы а3к матрицы А вычисляются по фор- формулам E.13).
126 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Замечание 1. Если оператор А нулевой, то все элементы мат- матрицы А этого оператора равны нулю в любом базисе, т. е. А — нулевая матрица. Замечание 2. Если оператор А единичный, т. е. А = I, то мат- матрица этого оператора будет единичной в любом базисе. Иными слова- словами, в этом случае А = Е, где .Е-единичная матрица. В дальнейшем единичную матрицу мы будем обозначать также символом /. Мы выяснили, что каждому линейному оператору А из L (V, V) при заданном базисе линейного пространства V отвечает матрица А этого оператора. Естественно, возникает обратный вопрос — каждой ли данной матрице А при заданном базисе в V можно поставить в соответствие линейный оператор А, матрицей которого будет данная матрица. Важно также выяснить вопрос о единственности матрицы линейного оператора в заданном базисе. Справедливо следующее утверждение. Теорема 5.5. Пусть в линейном пространстве V задан базис ei, е2, ..., еп, и пусть А = (aJk) — квадратная матрица, содержа- содержащая п строк и п столбцов. Существует единственный линейный опе- оператор А, матрицей которого в заданном базисе является матрица А. Доказательство. Докажем сначала существование оператора А. Для этой цели определим значения Ае^ этого оператора на базис- базисных векторах е& с помощью соотношения E.13), полагая в этом соот- соотношении aJ k равными соответствующим элементам заданной матрицы А. Значение оператора А на произвольном векторе х Е V, разложение которого по базисным векторам ei, в2, ..., еп дается формулой E.11), определим по формуле E.12). Очевидно, построенный оператор линейный и матрицей этого опе- оператора является матрица А. Единственность оператора А, матрицей которого в базисе ei, в2, ... ..., еп является матрица А, следует из соотношений E.13): с помощью этих соотношений единственным образом определяются значения опе- оператора на базисных векторах. Замечание 3. Пусть А и В — квадратные матрицы порядка п, А и В —отвечающие им линейные операторы в заданном базисе {е^} пространства V. Из доказательства теоремы 5.5 следует, что матрице А + \В, где Л —некоторое число, отвечает линейный оператор А + ЛВ (напомним, что А, В и А + ЛВ принадлежат L (V, V)). Докажем следующую теорему. Теорема 5.6. Ранг линейного оператора А равен рангу матрицы А этого оператора: rang A = rang A. Доказательство. По определению rang A = dim (im A), а
§ 2. МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ 127 im А — линейная оболочка векторов g/,: (см. матричную форму записи оператора и определение im А). Поэтому rang А равен максимальному числу линейно независи- независимых векторов g&. Так как векторы ei, в2, ..., еп линейно независимы, то, согласно E.15), максимальное число линейно независимых векто- векторов g/, совпадает с максимальным числом линейно независимых строк (а\, а2к, ..., а^) матрицы А, т. е. с рангом А. Теорема доказана. Пусть А и В — произвольные квадратные матрицы, содержащие п строк и п столбцов. Из теорем 5.3, 5.4, 5.5 и 5.6 вытекают следующие следствия. Следствие 1. Ранг T&ngAB произведения А и В удовлетворяет соотношениям rangAB ^ rang A, rang A ^ rang В, rang A ^ rang A + rang В — п. Следствие 2. Обратный оператор А для оператора А суще- существует только тогда, когда ранг матрицы А оператора А равен п (п = = dimV). Отметим, что в этом случае существует также и обратная матрица А~х для матрицы А. 2. Преобразование матрицы линейного оператора при пе- переходе к новому базису. Пусть У— линейное пространство, А —ли- —линейный оператор из L (У, V), ei, в2, ..., еп и ei, в2, ..., ёп—два бази- базиса в У и п ек = ^2 игкеи к = 1, 2, ..., п E.16) — формулы перехода от базиса {е^} к базису {ё/,}. Обозначим через U матрицу (игк): U = D). E.17) Отметим, что rangt/ = п. Пусть А = D) и А = (а{) E.18) — матрицы оператора А в указанных базисах. Найдем связь между этими матрицами. Справедливо следующее утверждение.
128 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Теорема 5.7. Матрицы А и А оператора А в базисах {ек} и {ек} соответственно связаны соотношением А = U-1 AU, где U~ l обратная матрица 6) для матрицы U, определенной равен- равенством E.17). Доказательство. Обращаясь к понятию матрицы линейного оператора, получим, согласно E.18), п п Аек = ^2агкеи Аёк = ^ агкё{. E.19) г = 1 г = 1 Из определения линейного оператора, из формул E.16) и из второй из формул E.19) следуют соотношения Аёк = А 1^2 ulei , Аёк = \г=1 / г Поэтому справедливо равенство Подставляя в левую часть этого равенства выражение Ае^ по пер- первой из формул E.19), найдем п / п \ п / п \ Так как {ej} —базис, то из последнего соотношения вытекают ра- равенства п п ^2 и\а{ = ^2 <&{, h к = 1, 2, ..., п. E.20) г = 1 г=1 Если обратиться к матрицам А, А и U (см. E.17) и E.18)), то со- соотношения E.20) эквивалентны следующему матричному равенству: и А = Аи. Умножая обе части этого равенства слева на матрицу U~ г, получим требуемое соотношение А = U~1AU. Теорема доказана. 6) Так как rang U = га, то обратная матрица U х для матрицы U существует.
§ 2. МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ 129 Замечание 1. Обратимся к формуле А = U~1AU. Умножая обе части этого матричного равенства слева на матрицу U и справа на U~1, получим соотношение А = UAU'1, E.21) представляющее собой другую форму связи между матрицами А и А линейного оператора А в разных базисах. Замечание 2. Пусть А и В — квадратные матрицы порядка п, А и В —отвечающие им линейные операторы в заданном базисе {е&}. Как уже отмечалось (см. замечание 3 предыдущего пункта), матрице А + ХВ отвечает линейный оператор А + АВ. Выясним вид матрицы этого оператора в базисе {ё&}. Пусть А и В — матрицы операторов А и В в базисе {ёк}. Тогда, согласно E.21), имеем А = UAU~\ В = UBU-1. E.22) Матрица линейного оператора А + АВ в базисе {ёк} имеет, со- согласно E.21), следующий вид: U(A + XB)U~1. Используя распредели- распределительное свойство умножения матриц, перепишем последнюю формулу следующим образом (напомним, что эта формула представляет собой матрицу линейного оператора А + АВ в базисе {ё/,}: UAU-1 + i1) Обращаясь к соотношениям E.22), видим, что матрица операто- оператора А + АВ в базисе {ё/,} записывается следующим образом: А + ХВ. В частности, если В — единичная матрица, В = /, то В = / (см. замечание 2 предыдущего пункта и теорему 5.5) и поэтому мат- матрица линейного оператора А + AI в базисе {ё/,} имеет вид А + XI. Следствие из теоремы 5.7. detA =det A В самом деле, так как определитель произведения матриц ра- равен произведению определителей этих матриц, то из равенства А = = U~1AU следует, что detA = detCZ-Metidett/. E.23) Поскольку detU~1detU = 1, то из соотношения E.23) получаем ра- равенство det A = det А. Таким образом, определитель матрицы линей- линейного оператора не зависит от выбора базиса. Поэтому можно ввести понятие определителя det А линейного оператора А, полагая detA = deti, E.24) 9 В.А. Ильин, Э.Г. Позняк
130 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ где А — матрица линейного оператора А в любом базисе. 3. Характеристический многочлен линейного оператора. Пусть А —линейный оператор, а I — тождественный оператор из L(V,V). Определение. Многочлен относительно Л det(A - E.25) называется характеристическим многочленом оператора А. Пусть в пространстве V задан базис {е^} и А = (а^) —матрица оператора А в этом базисе. Тогда, согласно E.24), характеристический многочлен E.25) оператора А запишется следующим образом: det (А -AI) = - < А о а( о а2 — а1 Л пп а1 ... ап Л E.26) Запишем характеристический многочлен E.25), обозначая через dk коэффициент при Afe det (А - AI) = E.27) Замечание 1. Так как значение определителя det (А — AI) не зависит от выбора базиса, то коэффициенты dk характеристического многочлена в правой части E.27) также не зависят от выбора базиса. Таким образом, коэффициенты dk характеристического многочлена оператора А представляют собой инварианты — величины, значения которых не зависят от выбора базиса. В частности, коэффициент dn — \ равный, очевидно, а\ -\- а\ -\-... -\- а™, является инвариантом. Этот инвариант называется следом оператора А и обозначается символом tr А (от английского слова trace — след): trA = а\ + а\ + ... + а™. E.28)
§ 3. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ 131 Замечание 2. Уравнение det (А - AI) = 0 E.29) называется характеристическим уравнением оператора А. § 3. Собственные значения и собственные векторы линейных операторов Пусть Vi — подпространство n-мерного линейного пространства V и А —линейный оператор из L (V, V). Определение 1. Пространство V\ называется инвариантным под- подпространством оператора А, если для каждого х, принадлежаще- принадлежащего Vi, элемент Ах также принадлежит V\. Примерами инвариантных подпространств оператора А могут слу- служить ker А и im А. Определение 2. Число Л называется собственным значением оператора А, если существует ненулевой вектор х такой, что Ах = Лх. E.30) При этом вектор х называется собственным вектором оператора А, отвечающим собственному значению Л. Справедливо следующее утверждение. Теорема 5.8. Для того чтобы число А было собственным значе- значением оператора А, необходимо и достаточно, чтобы это число было корнем характеристического уравнения E.29) оператора А. Доказательство. Пусть Л — собственное значение оператора А и х — собственный вектор, отвечающий этому А (х / 0). Перепишем соотношение E.30) в следующей форме: (А - А1)х = 0. Так как х — ненулевой вектор, то из последнего равенства следует, что ker (А - AI) Ф 0, т. е. dim (ker (А - AI)) ^ 1. E.31) Поскольку, согласно теореме 5.1, dim(im(A - AI)) + dim (ker (A - AI)) = n, то из этого равенства и неравенства E.31) получаем dim(im(A - AI)) ^ п - 1. E.32) 9*
132 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ По определению, dim (im (A — AI)) равняется рангу оператора А — AI. Поэтому из неравенства E.32) следует rang (А - AI) < п. E.33) Таким образом, если А — собственное значение, то ранг матрицы А — XI оператора А — AI меньше п, т. е. det (А — AI) = 0 и, следовательно, А —корень характеристического уравнения. Пусть теперь А —корень характеристического уравнения E.29). То- Тогда справедливо неравенство E.32), а следовательно, и неравенство E.31), из которого вытекает существование для числа А такого нену- ненулевого вектора х, что (А — А1)х = 0. Последнее соотношение эквива- эквивалентно соотношению E.30). Поэтому А — собственное значение. Теоре- Теорема доказана. Следствие. Каждый линейный оператор имеет собственное зна- значение. Действительно, характеристическое уравнение всегда имеет корень (в силу основной теоремы алгебры). Справедлива следующая теорема. Теорема 5.9. Для того чтобы матрица А линейного оператора А в данном базисе {ек} была диагональной 7), необходимо и достаточ- но, чтобы базисные векторы ек были собственными векторами этого оператора. Доказательство. Пусть базисные векторы ек являются соб- собственными векторами оператора А. Тогда Аек = \кек, E.34) и поэтому матрица А оператора А имеет вид (см. соотношения E.13) и понятие матрицы линейного оператора) А = Ai 0 ... 0 \ 0 А2 ... 0 V 0 0 ... \п J E.35) т. е. является диагональной. Пусть матрица А линейного оператора А в данном базисе {ек} диагональна, т. е. имеет вид E.35). Тогда соотношения E.13) примут вид E.34), а это означает, что ек — собственные векторы оператора А. Теорема доказана. 7) Напомним, что матрица называется диагональной, если все ее элементы, расположенные не на главной диагонали, равны нулю.
§ 3. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ 133 Докажем еще одно свойство собственных векторов. Теорема 5.10. Пусть собственные значения Ai, A2, ..., Хр опера- оператора А различны. Тогда отвечающие им собственные векторы ei, в2, ..., ер линейно независимы. Доказательство. Применим индукцию. Так как ei — ненулевой вектор, то для одного вектора (р = 1) утверждение справедливо (один ненулевой вектор является линейно независимым). Пусть утверждение теоремы доказано для т векторов ei, в2, ..., еш. Присоединим к этим векторам вектор em + i и допустим, что имеет место равенство га + 1 Y, akek = 0. E.36) k = l Тогда, используя свойства линейного оператора, получим га + 1 ^ akAek = 0. E.37) k = l Так как ек— собственные векторы, то Ае& = А&е&, и поэтому ра- равенство E.37) можно переписать следующим образом: га+1 oik\kek = 0. E.38) Согласно E.36) YlT^i Xm + i&kek = 0. Вычитая это равенство из равенства E.38), найдем га = 0. E.39) По условию все А/, различны, т. е. А/. — Am +1 ф 0. Поэтому из E.39) и предположения о линейной независимости векторов ei, в2, ..., ет следует, что ot\ — ot^ — ... = am = 0- Отсюда и из F.36), а также из условия, что em + i —собственный вектор (em + i ф 0), вытекает, что аш +1 = 0. Таким образом, из равенства E.36) мы получаем, что а\ = = q/2 = ... = аш + 1 = 0. Это означает, что векторы ei, в2, ..., em + i линейно независимы. Индукция проведена, и доказательство теоремы завершено. Следствие. Если характеристический многочлен оператора А имеет п различных корней, то в некотором базисе матрица опера- оператора А имеет диагональный вид.
134 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Действительно, в рассматриваемом случае, согласно только что до- доказанной теореме, собственные векторы линейно независимы и поэто- поэтому могут быть выбраны в качестве базисных. Но тогда по теореме 5.9 в этом базисе матрица оператора А будет диагональной. § 4. Линейные и полуторалинейные формы в евклидовом пространстве 1. Специальное представление линейной формы в евкли- евклидовом пространстве. Пусть У— евклидово пространство, а С —ком- —комплексная плоскость (одномерное комплексное линейное пространство). В п. 1 § 1 этой главы мы ввели понятие линейной формы — линейного оператора, действующего из У в С В этом пункте мы полу- получим специальное представление произвольной линейной формы / из L(V,C). Лемма. Пусть f —линейная форма из L (У, С). Тогда существу- существует единственный элемент h из V такой, что /(х) = (х, h). E.40) Доказательство. Для доказательства существования элемен- элемента h выберем в У ортонормированный базис ei, в2, ..., еп. Рассмотрим элемент h, координаты hk которого в выбранном ба- базисе определяются соотношениями 8) hk=f(ek). E.41) Таким образом, h = Y^k = i Пусть х = Y^Jk = i xkek —произвольный элемент пространства У. Используя свойства линейной формы / и равенство E.41), получим Так как в ортонормированном базисе {еп} скалярное произве- произведение (х, h) векторов х = ^^=1ж^е^ и h = ^2^=ihkek равно Sfe = i xkhk, то из E.42) получаем / (х, h). Существование вектора h доказано. 8) Черта над / (е&) означает, что берется комплексно сопряженное значение этого выражения.
§ 4. ЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФОРМЫ 135 Докажем единственность этого вектора. Пусть hi и П2 — два векто- вектора таких, что с помощью этих векторов форма / (х) может быть пред- представлена в виде E.40). Очевидно, для любого х справедливо соотноше- соотношение (х, hi) = (х, Ьг), из которого следует равенство (х, П2 — hi) = 0. Полагая в этом равенстве х = Ii2 — hi и используя определение нор- нормы элемента в евклидовом пространстве, найдем ||li2 — hi|| = 0. Итак, Ii2 = hi. Лемма доказана. Замечание. Очевидно, лемма справедлива и в случае, если V — вещественное евклидово пространство, а / Е L (V, R), где R — вещест- вещественная прямая. 2. Полуторалинейные формы в евклидовом пространстве. Специальное представление таких форм. Введем понятие полу- торалинейной формы в линейном пространстве. Определение. Числовая функция В (х, у), аргументами которой являются всевозможные векторы х и у линейного пространства L, называется полуторалинейной формой, если для любых векторов х, у и z из L и любого комплексного числа Л выполняются соотношения В(х + у, z) = В(х, z) + В(у, z), В (х, у + z) = В (х, у) + В (х, z), В (Ах, у) = АВ(х,у), В(х, Ау) = АВ(х,у). Иными словами, полуторалинейная форма В (х, у) представляет собой числовую функцию двух векторных аргументов х, у, опреде- определенную на всевозможных векторах х и у линейного пространства L, линейную по первому аргументу х и антилинейную по второму аргу- аргументу у. Замечание 1. Если линейное пространство L является веще- вещественным, то полуторалинейные формы переходят в так называемые билинейные формы, т. е. формы, линейные по каждому из аргументов (четвертое из соотношений E.43) в силу вещественности А будет харак- характеризовать линейность и по второму аргументу). Билинейные формы изучаются в гл. 7. Обратимся к полуторалинейной форме, заданной в евклидовом пространстве V. Справедлива следующая теорема о специальном пред- представлении такой формы. Теорема 5.11. Пусть В (х, у) — полуторалинейная форма в ев- евклидовом пространстве V. Тогда существует единственный линей- линейный оператор А из L (V, V) такой, что В(х,у) = (х, Ау). E.44) Доказательство. Пусть у — любой фиксированный элемент
136 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ пространства У. Тогда В (х, у) представляет собой линейную форму аргумента х. Поэтому по лемме предыдущего пункта можно указать такой однозначно определенный элемент h пространства У, что Б(х, у) = (х, h). E.45) Итак, каждому у из У по правилу E.45) ставится в соответствие единственный элемент h из У. Таким образом, определен оператор А такой, что h = Ay. Линейность этого оператора элементарно следует из свойств E.43) полуторалинейной формы и из свойств скалярного произведения. Докажем единственность оператора А. Пусть Ai и А2 —два оператора таких, что с помощью этих операто- операторов форма В (х, у) может быть представлена в виде E.44). Очевидно, для любых х и у справедливо соотношение (х, Aiy) = (x, А2у), из которого следует равенство (х, А2у — Aiy) =0. Полагая в этом ра- равенстве х = А2у — Aiy и используя определение нормы элемента, найдем ||А2у - Aiy|| = 0. Таким образом, для любого у из У имеет место равенство А2у = = Aiy, т. е. А2 = Ai. Теорема доказана. Следствие. Пусть В (х, у) — полуторалинейная форма в евкли- евклидовом пространстве У. Тогда существует единственный линейный оператор А из L (У, У) такой, что В(х, у) = (Ах, у). E.46) Справедливость следствия вытекает из следующих рассуждений. Во-первых, форма В\ (х, у) = В (х, у) является полуторалинейной (это следует из того, что В (х, у) — полуторалинейная форма, и из определения такой формы). Далее, по теореме 5.11 получаем для ??i(x, у) представление в виде Вх (у, х) = (у, Ах). E.47) Так как сопряженное значение от В\ (х, у) равно В\ (х, у), то, беря сопряженное значение левой и правой частей E.47) и учитывая равен- равенство В\ (х, у) = В (х, у), получим В(х,у) = (у, Ах). E.48) Но (у, Ах) = (Ах, у) (см. гл. 4, § 3, п. 1). Поэтому из E.48) получаем равенство E.46). Следствие доказано. Замечание 2. Теорема 5.11 и следствие из этой теоремы спра- справедливы и для случая вещественного евклидова пространства. В этом
§ 5. ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 137 случае в формулировке теоремы и следствия термин «полуторалиней- ная форма» надо заменить термином «билинейная форма». См. также замечание 1. Введем понятие матрицы полуторалинейной формы в данном ба- базисе {ек}. Пусть х, у принадлежат V и х = Ylk = ixj^j, у = Ylk = iyk^k — разложение х и у по базису {е^}. Из определения полуторалинейной формы следуют соотношения ( г/*В(е,-,е*). E.49) ) j=lk=l Полагая bjk = В(е,,ек), E.50) запишем выражение E.49) для В (х, у) в следующей форме: п В(х,у) = Матрица В = {bjk) называется матрицей полуторалинейной формы В (х, у) в базисе {ек}. Справедливо следующее утверждение. Пусть полуторалинейная форма В (х, у) представлена в ви- виде E.46) В(х,у) = (Ах, у). E.46) Пусть далее элементы матрицы А оператора А в данном ортонор- мированном базисе равны ак-. Тогда в этом базисе bjk = ак-. Для до- доказательства обратимся к выражению E.50) для коэффициентов bjk полуторалинейной формы. Преобразуем правую часть E.50) с помо- помощью E.46). Получим, согласно E.13), q=l Так как базис {е^} ортонормированный, то (ед, е^) = 0, если q ф к и (е^, ek) = 1. Поэтому из всех слагаемых последней суммы отличным от нуля будет лишь то, которое получается при q = к. Таким образом, bjk = a,j. Утверждение доказано. Замечание 3. Если полуторалинейная форма представлена в ви- виде В (х, у) = (х, Ау) и элементы матрицы А оператора А в данном ортонормированном базисе равны ак, то в этом базисе bjk = Щ.
138 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ § 5. Линейные самосопряженные операторы в евклидовом пространстве 1. Понятие сопряженного оператора. Мы будем рассматри- рассматривать линейные операторы в конечномерном евклидовом простран- пространстве V. Определение 1. Оператор А* из L (V, V) называется сопряжен- сопряженным к линейному оператору А, если для любых х и у из V выполня- выполняется соотношение (Ах, у) = (х, А*у) E.51) Легко убедиться в том, что оператор А*, сопряженный к линейному оператору А, сам является линейным оператором. Это вытекает из очевидного соотношения (Ах, ayi + /?у2) = а(Ах, ух) + /?(Ах, у2) = = а(х, А*У1) + 0(х, А*у2) = (х, справедливого для любых элементов х, yi, У2 и любых комплексных чисел а и /?. Докажем следующую теорему. Теорема 5.12. Каждый линейный оператор А имеет единствен- единственный сопряженный. Доказательство. Очевидно, скалярное произведение (Ах, у) представляет собой полуторалинейную форму (см. гл. 4, § 3, п. 1 и определение полуторалинейной формы). По теореме 5.11 существу- существует единственный линейный оператор А* такой, что эта форма может быть представлена в виде (х, А*у). Таким образом, (Ах, у) =х, А*у. Следовательно, оператор А* —сопряженный к оператору А. Един- Единственность оператора А* следует из единственности представления по- луторалинейного оператора в виде E.44). Теорема доказана. В дальнейшем символ А* будет обозначать оператор, сопряженный к оператору А. Отметим следующие свойства сопряженных операторов: 1°) Г = I. 4°) (А*)* = А. 2°) (А + В)*_= А* + В*. 5°) (АВ)* = В*А*. 3°) (АА*) = АА*. Доказательства свойств 1°)-4°) элементарны, и мы предостав- предоставляем их читателю. Приведем доказательство свойства 5°). Соглас- Согласно определению произведения операторов справедливо соотношение
§ 5. ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 139 (АВ)х = А(Вх). С помощью этого равенства и определения сопря- сопряженного оператора получаем следующую цепочку соотношений: ((АВ)х, у) = (А(Вх), у) = (Вх, А*) = = (х, В*(А*у)) = (х, (В*А*)у). Таким образом, ((АВ)х, у) = (х, (В*А*)у). Иными словами, опера- оператор В* А* является сопряженным к оператору АВ. Справедливость свойства 5°) установлена. Замечание. Понятие сопряженного оператора для вещественно- вещественного пространства вводится совершенно аналогично. Выводы этого пунк- пункта и свойства сопряженных операторов справедливы и для этого слу- случая (при этом свойство 3°) формулируется так: (АА)* = АА*). 2. Самосопряженные операторы. Основные свойства. Определение 2. Линейный оператор А из L (V, V) называется самосопряженным, если справедливо равенство А* = А. Самосопряженный оператор в вещественном пространстве определя- определяется аналогично. Простейшим примером самосопряженного оператора является тождественный оператор I (см. свойство 1°) сопряженных операторов в предыдущем пункте). С помощью самосопряженных операторов можно получить специ- специальное представление произвольных линейных операторов. Именно, справедливо следующее утверждение. Теорема 5.13. Пусть А—линейный оператор, действующий в комплексном евклидовом пространстве V. Тогда справедливо пред- представление Ar = Ar + iAj, где Ar и А/ —самосопряженные опе- операторы, называемые соответственно действительной и мнимой ча- частью оператора А. Доказательство. Согласно свойствам 2°), 3°) и 4°) сопряжен- сопряженных операторов (см. предыдущий пункт этого параграфа) операторы Ar = (А + А*)/2 и А/ = (А — А*)/2г —самосопряженные. Очевидно, А = Ar + гА/. Теорема доказана. В следующей теореме выясняются условия самосопряженности произведения самосопряженных операторов. Мы будем говорить, что операторы А и В коммутируют, если АВ = В А. Теорема 5.14. Для того чтобы произведение АВ самосопряжен- самосопряженных операторов А и В было самосопряженным оператором, необхо- необходимо и достаточно, чтобы они коммутировали.
140 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Доказательство. Так как А и В — самосопряженные операто- операторы, то, согласно свойству 5°) сопряженных операторов (см. п. 1 этого параграфа), справедливы соотношения (АВ)* = В*А* = ВА. E.52) Следовательно, если АВ = ВА, то (АВ)*=АВ, т. е. опера- оператор АВ — самосопряженный. Если же АВ — самосопряженный опе- оператор, то АВ = (АВ)*, и тогда, на основании E.52), АВ = ВА. Теорема доказана. В дальнейших теоремах устанавливается ряд важных свойств са- самосопряженных операторов. Теорема 5.15. Если оператор А самосопряженный, то для любого х Е V скалярное произведение (Ах, х) — вещественное число. Доказательство. Справедливость утверждения теоремы выте- вытекает из следующего свойства скалярного произведения в комплексном евклидовом пространстве (Ах, х) = (х, Ах) и определения самосопря- самосопряженного оператора (Ах, х) = (х, Ах) 9). Теорема 5.16. Собственные значения самосопряженного опера- оператора вещественны. Доказательство. Пусть Л — собственное значение самосопря- самосопряженного оператора А. По определению собственного значения опе- оператора А (см. определение 2 § 3 этой главы) существует ненулевой вектор х такой, что Ах = Лх. Из этого соотношения следует, что веще- вещественное (в силу теоремы 5.15) скалярное произведение (Ах, х) может быть представлено в виде (Ах, х) = Л(х, х) = А||х|| 10). Так как ||х|| и (Ах, х) вещественны, то, очевидно, и А — вещественное число. Теорема доказана. В следующей теореме выясняется свойство ортогональности соб- собственных векторов самосопряженного оператора. Теорема 5.17. Если А — самосопряженный оператор, то соб- собственные векторы, отвечающие различным собственным значениям этого оператора, ортогональны. Доказательство. Пусть Ai и А2—различные собственные зна- значения (Ai ф Аг) самосопряженного оператора A, a xi и Х2 — соответст- ; Напомним, что если комплексное число равно своему сопряженному, то это число — вещественное. 10) Напомним, что символ ||х|| обозначает норму элемента х.
§ 5. ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 141 венно отвечающие им собственные векторы. Тогда имеют место соот- соотношения Axi = AiXi,Ax2 = A2X2. Поэтому скалярные произведения i, X2) и (xi, AX2) соответственно равны следующим выражениям: (Ахь х2) = Ai(xb х2), (хь Ах2) = А2(хь х2) п). Так как оператор А самосопряженный, то скалярные произведения i, X2) и (xi, AX2) равны, и поэтому из последних соотношений путем вычитания получаем равенство (А2 - Ai)(xbx2) = 0. Поскольку А2 ф Ai, то из последнего равенства следует равен- равенство нулю скалярного произведения (xi, x2), т. е. ортогональность соб- собственных векторов xi и х2. Теорема доказана. 3. Норма линейного оператора. Пусть А— линейный опера- оператор, отображающий евклидово пространство V в это же пространство. Введем понятие нормы оператора А. Определение 3. Нормой ||А|| линейного оператора А называется число, определяемое соотношением 12) ||А|| = sup ||Ax||. E.53) 11*11 = 1 Из определения нормы линейного оператора вытекает следующее очевидное неравенство: ||Ах||<||А||||х|| E.54) (для доказательства достаточно воспользоваться соотношени- ( х А ем Ах = ( А-—- 1 ||х||). Из соотношения E.54) следует, что если V 11Х11/ ||А|| =0, то оператор А является нулевым. Норму самосопряженного оператора А можно определить и другим способом. Именно, справедливо утверждение: Если А — самосопряженный оператор, то введенная выше нор- норма ||А|| оператора А равна sup||x|| = 1 |(Ax, х)|: sup |(Ax, x)| = ||А||. E.55) 11x11 = 1 11)Так как собственные значения самосопряженного оператора вещественны, то (xi, Ах2) = А2(хь х2) = А2(хь х2). 12) Напомним, что ||Ах|| = -^/(Ах, Ах). Отсюда следует, что ||Ах|| представ- представляет собой непрерывную функцию х, которая на замкнутом множестве ||х|| = 1 достигает конечного наибольшего значения.
142 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Доказательство. Для любого х из V справедливо неравенство Коши-Буняковского (см. п. 2 § 3 гл. 4) |(Ах, х)| ^ ||Ах|| ||х||. Из него и из неравенства E.54) получаем следующее неравенство: |(Ах, х)| ^ ||А|| ||х||2. Поэтому число 11 = sup |(Ax, х)| E.56) 11*11 = 1 удовлетворяет соотношению /i^||A||. E.57) / z z \ Отметим, что из равенства (Az, z) = ( А----, -—-г ) llzll2, z / 0 и V llzll llzll/ определения числа \i (см. E.56)) вытекает следующее неравенство: |(Az, z)| ^/i||z||2. E.58) Обратимся теперь к следующему очевидному тождеству: 4 Re (Ах, у) = (А(х + у), х + у) - (А(х - у), х - у) (в этом тождестве символ Re (Ax, у) обозначает действительную часть комплексного числа (Ах, у), само тождество легко вытекает из свойств скалярного произведения, см. п. 1 § 3 гл.4). Беря левую и правую части этого тождества по модулю, используя свойство модуля суммы и неравенство E.58), получим следующие соотношения 13): 4|Re(Ax, у)| ^ /,||х + у||2 + /*||х - у||2 = 2М||х||2 + ||у||2). Отсюда при ||х|| = ||у|| = 1 получаем неравенство |Re(Ax, y)| ^fi. Полагая в этом неравенстве у = Ах/||Ах|| (очевидно, ||у|| = 1) и учи- учитывая, что число (Ах, Ах) = ||Ах||2 является вещественным (поэто- (поэтому Re (Ах, Ах) = (Ах, Ах) = ||Ах||2), получим ||Ах|| ^ /i, ||x|| = 1. Отсюда, согласно неравенству E.53), найдем ||А|| ^ \i. 13) Мы использовали при этом определение нормы элемента в комплексном евклидовом пространстве.
§ 5. ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 143 Для завершения доказательства остается сравнить полученное неравенство с неравенством E.57) и воспользоваться определением числа \i (см. E.56)). 4. Дальнейшие свойства самосопряженных операторов. В этом пункте мы докажем ряд важных свойств линейных операторов, связанных с понятием нормы. Сначала мы установим необходимое и достаточное условие самосопряженности оператора. Докажем следую- следующую теорему. Теорема 5.18. Для того чтобы линейный оператор А был само- самосопряженным, необходимо и достаточно, чтобы Im (Ах, х) = 0 14). Доказательство. По теореме 5.13 произвольный линейный опе- оператор А может быть представлен в виде А = Ад + iA/, где Ад и А/ — самосопряженные операторы. Поэтому (Ах, х) = (Адх, х) + г(А/х, х), причем, согласно теореме 5.15, для любого х числа Ад и А/ — вещест- вещественные. Следовательно, эти числа соответственно равны действитель- действительной и мнимой частям комплексного числа (Ах, х): Re (Ах, х) = (Адх, х), Im (Ах, х) = (А/х, х). Допустим, что А — самосопряженный оператор. По теореме 5.15 в этом случае (Ах, х) —вещественное число, и по- поэтому Im (Ax, х) = 0. Необходимость условия теоремы доказана. Докажем достаточность условия теоремы. Пусть Im (Ах, х) = (А/х, х) = 0. Отсюда следует, что ||А/|| = = 0, т. е. А/ = О. Поэтому А = Ад, где Ад — самосопряженный оператор. Теорема доказана. В следующих утверждениях выясняются некоторые свойства соб- собственных значений самосопряженных операторов. Лемма. Любое собственное значение А произвольного линейно- линейного самосопряженного оператора А в евклидовом пространстве равно скалярному произведению (Ах, х), где х — некоторый вектор, удовле- удовлетворяющий условию ||х|| = 1: Л = (Ах, х), ||х|| = 1. E.59) 14) Символ Im(Ax, x) обозначает мнимую часть комплексного числа (Ах, х). Равенство Im (Ах, х) = 0 означает, что число (Ах, х) является вещественным.
144 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Доказательство. Так как Л — собственное значение операто- оператора А, то существует такой ненулевой вектор z, что Az = Az. E.60) Полагая х = z/||z|| (очевидно, ||z|| = 1), перепишем E.60) следу- следующим образом: Ах = Ах, ||х|| = 1. Отсюда получаем соотношения (Ах, х) = А(х, х) = А||х||2 = А, т. е. E.59) имеет место. Лемма дока- доказана. Следствие. Пусть А — самосопряженный оператор и А — любое собственное значение этого оператора. Пусть далее т = inf (Ах, х), М = sup (Ax, х). E.61) llxll = 1 ||х|| = 1 Справедливы следующие неравенства: т^Х^М. E.62) Замечание 1. Так как скалярное произведение (Ах, х) пред- представляет собой непрерывную функцию от х, то на замкнутом мно- множестве ||х|| = 1 эта функция ограничена и достигает своих точных граней т и М. Замечание 2. Согласно теореме 5.16 собственные значения са- самосопряженного оператора вещественны. Поэтому неравенства E.62) имеют смысл. Доказательство следствия. Так как любое собственное зна- значение А удовлетворяет соотношению E.59), то, очевидно, каждое соб- собственное значение заключено между точными гранями т и М скаляр- скалярного произведения (Ах, х). Поэтому неравенства E.62) справедливы. Мы докажем, что числа т и М, определенные соотношения- соотношениями E.61) являются соответственно наименьшим и наибольшим соб- собственными значениями самосопряженного оператора А. Предвари- Предварительно убедимся в справедливости следующего утверждения. Теорема 5.19. Пусть А — самосопряженный оператор и, кроме того, (Ах, х) ^ 0 для любого х. Тогда ||А|| равна наибольшему соб- собственному значению этого оператора 15). Доказательство. Мы уже отмечали (см. утверждение преды- предыдущего пункта), что ||А|| = sup||x|| = 1 |(Ах, х)|. Так как (Ах, х) ^ 0, то ||А|| = sup||x|| = 1(Ax, x). Согласно замечанию 1 этого пункта для 15) Так как собственных значений конечное число и они вещественны, то из них можно указать наибольшее.
§ 5. ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 145 некоторого хо, ||хо|| = 1, (Ахо, хо) = ||А|| = Л. Обращаясь к определению нормы и используя только что написан- написанные равенства, получим соотношения 16) - А1)хо||2 = ||Ахо||2 - 2А(Ах0, х0) + А2||х0||2 = Таким образом, (А — AI)xq = 0, или, иначе, Axq = Axq, т. е. А = = ||А||—собственное значение оператора А. То, что А —наибольшее собственное значение, вытекает из только что установленного след- следствия из леммы этого пункта. Теорема доказана. Докажем теперь, что числа т и М(см. E.61)) являются наимень- наименьшим и наибольшим собственными значениями самосопряженного опе- оператора А. Теорема 5.20. Пусть А — самосопряженный оператор, а т и М — точные грани (Ах, х) на множестве ||х|| = 1. Эти числа представляют собой наименьшее и наибольшее собственные значе- значения оператора А. Доказательство. Очевидно, достаточно доказать, что числа т и М — собственные значения оператора А. Тогда из неравенств E.62) сразу же следует, что т и М являются соответственно наименьшим и наибольшим собственными значениями. Докажем сначала, что М — собственное значение. Для этого рас- рассмотрим самосопряженный оператор В = А — ml. Так как (Вх, х) = (Ах, х) — т(х, х) ^ О, то оператор В удовлетворяет условиям теоремы 5.19, и поэтому нор- норма ||В|| этого оператора равна наибольшему собственному значению. С другой стороны, ||В|| = sup (Вх, х) = sup (Ах, х) — т = М — т. 11*11 = 1 ||х|| = 1 Таким образом, (М — т) —наибольшее собственное значение операто- оператора В. Следовательно, существует такой ненулевой вектор xq, что Вх0 = (М - т)х0. E.63) 16) Мы также воспользовались равенством ||Ахо||2 = ||А||2, которое следует из соотношений ||А|| = (Ахо, хо) ^ ||Ахо||) и ||А|| = sup||x|| _ х ||Ах||. 10 В.А. Ильин, Э.Г. Позняк
146 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Так как В = А — ml, то Bxq = Axq — mlxo = Axq — mxo. Под- Подставляя это выражение Bxq в левую часть равенства E.63), получим после несложных преобразований соотношение Axq = Mxq. Таким образом, М — собственное значение оператора А. Убедимся теперь, что число т также является собственным значе- значением оператора А. Рассмотрим самосопряженный оператор В = — А. Очевидно, что — т — sup||x|| = 1(Bx, x). Согласно только что проведенному доказа- доказательству число — т представляет собой собственное значение операто- оператора В. Так как В = — А, то т будет являться собственным значением оператора А. Теорема доказана. В следующей теореме выясняется важное свойство собственных векторов самосопряженного оператора. Теорема 5.21. У каждого самосопряженного линейного операто- оператора А, действующего в п-мерном евклидовом пространстве V, суще- существует п линейно независимых попарно ортогональных и единичных собственных векторов. Доказательство. Пусть Ai — максимальное собственное значе- значение оператора A (Ai = sup||x|| = 1(Ax, x)). Обозначим через ei соб- собственный вектор, отвечающий Ai и удовлетворяющий условию ||ei|| = = 1 (возможность его выбора следует из доказательства леммы этого пункта). Обозначим через V\ (n — 1)-мерное подпространство простран- пространства V, ортогональное к ei. Очевидно, V\ — инвариантное подпро- подпространство оператора А (т. е. если х Е Vi, то и Ах Е V\. Действительно, пусть х Е Vi (т. е. (х, ег) = 0). Тогда 17) (Ах, ех) = (х, Аех) = Ai(x, ex) = 0. Следовательно, Ах —элемент Vi, и поэтому Vi — инвариантное под- подпространство оператора А. Это дает нам право рассматривать опера- оператор А в подпространстве Vi. В этом подпространстве А будет пред- представлять собой самосопряженный оператор. Следовательно, имеется максимальное собственное значение А2 этого оператора, которое мож- но найти с помощью соотношения ) А2 = max (Ax, х). ||x=l||,x_Lei 17) Мы использовали свойство самосопряженности оператора (Ах, ej (х, Ае-[_) и то обстоятельство, что ei—собственный вектор оператора: Aei 18) Символ ei_Le2 обозначает ортогональность векторов
§ 5. ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 147 Кроме того, можно указать такой вектор е2, e2_Lei, ||е2|| = 1, что Ае2 = А2е2. Обращаясь далее к (п — 2)-мерному подпространству У2, ортого- ортогональному векторам ei и е2, и повторяя проведенные выше рассужде- рассуждения, мы построим собственный вектор ез, ||ез|| = 1, ортогональный ei и е2. Рассуждая и далее таким же образом, мы последовательно найдем п взаимно ортогональных собственных векторов ei, е2, ..., еп, удовлетворяющих условию Це^Ц = 1, i = 1, 2, ..., п. Замечание 1. Договоримся в дальнейшем нумеровать соб- собственные значения самосопряженного оператора в порядке убыва- убывания с учетом повторяющихся, т. е. кратных, собственных значений. При этом Ai ^ Л2 ^ ... ^ Лп и отвечающие им собственные векторы ei, e2, ..., еп можно считать взаимно ортогональными и удовлетворя- удовлетворяющими условию Це^Ц = 1. Таким образом, I (J при г т^ j. Замечание 2. Из рассуждений в доказательстве теоремы следует (Ах, х) соотношение Хт +1 = max x^efc, —,—Ц— • Это соотношение можно (Ах, х) также записать в виде Хт +1 = maxx^^ ——J——, где Ет — линейная оболочка векторов ei, e2, ..., еп. Справедливость замечания вытекает из того, что (х, х) = ||х||2, и поэтому (Ах, х) (х, х) причем норма элемента х/||х|| равна 1. Пусть Ет — множество всех m-мерных подпространств простран- пространства V. Справедливо следующее важное минимаксное свойство соб- собственных значений. Теорема 5.22. Пусть А — самосопряженный оператор и Ai, А2, ..., Ап — его собственные значения, занумерованные в по- порядке, указанном в замечании 1. Тогда . (Ах, х) Am + i = mm max— —. E.64) 7~п"" ^^ I ~РР ("V "V 1 Доказательство. Пусть Ет—линейная оболочка собственных векторов ei, е2, ..., еп оператора А (см. замечание 1). ю*
148 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ В силу замечания 2 (Ах, х) max — — = Am + i. х±Ет (х, XJ Поэтому для доказательства теоремы достаточно убедиться в спра- справедливости соотношения (Ах, х) (Ах, х) max — — > max — — = Am + i E.65) xi^cSm (x, x) *eEm (x, x) для любого EGSm. Перейдем к доказательству соотношения E.65). Обозначим сим- символом Е1- ортогональное дополнение подпространства Е (см. п. 3 § 2 гл.4). Из теоремы 2.10 следует, что размерность Е1- равна п — т. Следовательно, dimE1- + dimEm + i = (n - т) + (m + 1) = п + 1 > п. Это означает, в силу теоремы 2.9, что пересечение подпространств Е1- и Ет _|_ 1 содержит ненулевой элемент. Итак, существует элемент х такой, что x_LE, ||х|| = 1, х е Ет + 1, т. е. х = Ylk = i ckek- Так как ||х|| = 1 и базис ei, в2, ..., еп— ортонормированный, то в силу теоремы Пифагора (см. п. 2 § 1 гл. 4) llxll2 = га + 1 k = l Имеем далее Ах = А ХХ=а ckek = ^2™=\ ск-^ек- Поскольку е^— собственные векторы оператора А, то из последних соотношений по- получаем Ах = *5Ук = 1 ск^кек- Отсюда и из ортонормированности е/, следует справедливость соотношения га+1 = ^2 \°к\2^к- E.67) к=1 Мы занумеровали собственные значения в порядке убывания с уче- учетом возможной их кратности. Поэтому Am + i ^ A&, к = 1, 2, ..., т. Отсюда и из соотношений E.67) и E.66) получаем (Ax, x) ra + 1 = a2 c ra+l к 2Afe ^ Am + i ^2 k = i
§ 5. ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 149 Замечая, что для любого х ф 0 норма элемента х/||х|| равна 1 и ||х|| = 1, а также учитывая, что x_Li?, получим ( /V v Y ) I X X \ max——'—— = max A----, —rr ^ (Ax, x) ^ Ат + Ь х±Е (X, XJ х±Е \ ||х|| ||х||/ Итак, соотношения E.65) установлены. Теорема доказана. 5. Спектральное разложение самосопряженных операто- операторов. Теорема Гамильтона—К эли. Рассмотрим самосопряженный оператор А и собственные значения Ai ^ A2 ^ ... ^ Ап этого опера- оператора. При этом ei, в2, ..., еп— ортонормированный базис, состоящий из собственных векторов, отвечающих {А^}. Пусть х Е V. Тогда х = 2^(х, ек)ек E.68) (см. п. 3 § 2 гл. 4), а так как Ае& = А&е&, то с помощью E.68) получаем п Ах = 2_^ А/.(х, ек)ек. E.69) к = 1 Оператор Р/., определяемый соотношением Р/,х = (х, ек)ек, E.70) называется проектором на одномерное подпространство, порожденное вектором ек. Из свойств скалярного произведения сразу же следует, что Р/. — самосопряженный линейный оператор. Отметим следующие важные свойства проекторов: 1°) Pjfe = Р/с (отсюда следует, что Р™ = Р/., где т — натуральное). Доказательство этих свойств следует из соотношений fP/P-W — Р/ГР-тгЛ — Р/ (тг р» "|р» • — yirktrj)х. — irkyirjjL) — irkyjL, Vjj^j — _ , w ч _ f (x, ek)ek при к = j, - ix, е,.де,-, ек)ек " j Q При ^/ j. Заметим также, что непосредственно из определения E.70) следует, что Р& коммутирует с каждым оператором, который коммутирует с А.
150 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Из соотношений E.68), E.69) и E.70) получаем следующие выра- выражения для х и Ах: п к = 1 п Ах = ^2 л^р^х- E-72) к = 1 Из равенства E.71) следует, что оператор J^=i p& является тож- тождественным: I = Е Рь E.73) Из равенства E.72) получаем так называемое спектральное разло- разложение самосопряженного оператора: п А = У Из свойств 1°) и 2°) проекторов и из соотношения E.74) вытекает следующее выражение для А2: А2 = Очевидно, вообще для любого целого положительного s п k = l Рассмотрим произвольный полином р(Х) = J^^Li сг^г- По опреде- определению считают р (А) = 5^Г= 1 ckAk. Обращаясь к соотношению E.75), легко получить следующее выражение для р (А): т р(А) = ^2p(Xi)Pi. E.76) Докажем следующую теорему. Теорема 5.23.(теорема Гамильтона-Кэли). Если А — самосопря- самосопряженный оператор и р(Х) = det(A — AI) — характеристический мно- многочлен этого оператора, то р(А) = 0.
§ 5. ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 151 Доказательство. Действительно, если А — самосопряженный оператор и А^ — собственные значения этого оператора, то, согласно теореме 5.8, А^ является корнем характеристического уравнения, т. е. p(Xi) = 0. Отсюда и из соотношения E.76) следует, что р (А) = 0. Теорема доказана. 6. Положительные операторы. Корни га-й степени из опе- оператора. Самосопряженный оператор А называется положительным, если для любого х из V справедливо соотношение (Ах, х) ^ 0. E.77) Если оператор А — положительный и из условия (Ах, х) = 0 сле- следует, что х = 0, то А называется положительно определенным опе- оператором. Положительные и положительно определенные операторы соответ- соответственно обозначаются символами А ^ 0 и А > 0. Отметим следующее простое утверждение. Каждое собственное значение положительного (положительно определенного) оператора неотрицательно (положительно). Это утверждение следует из простых рассуждений. Пусть А — собственное значение оператора А. Тогда, согласно лем- лемме п. 4 этого параграфа, можно указать такой элемент х, ||х|| = 1, что А = (Ах, х). Отсюда и из соотношения E.77) получаем, что А ^ 0 для положи- положительных операторов и А > 0 для положительно определенных опера- операторов. Утверждение доказано. Введем понятие корня т-й степени (т — натуральное число) из оператора. Определение. Корнем т-й степени из оператора А называется оператор В такой, что Вт = А. Корень т-й степени из оператора А обозначается символом А1//т. Естественно выделить какой-либо класс операторов, для которых имела бы смысл операция нахождения корня т-й степени. Определен- Определенный ответ на этот вопрос дается следующей теоремой. Теорема 5.24. Пусть А — положительный самосопряженный оператор, А ^ 0. Тогда для любого натурального т существует по- положительный самосопряженный оператор A1//m, A1//m ^ 0. Доказательство. Обозначим через А& собственные значения оператора А, и пусть {е&} — ортонормированный базис из собственных векторов. Обозначим далее через Р/. проектор на одномерное подпро- подпространство, порожденное вектором е^. Согласно предыдущему пункту имеет место спектральное разло-
152 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ жение E.74) самосопряженного оператора А: А = E.74) k = Так как А/. ^ 0 (см. только что доказанное утверждение), то можно ввести следующий самосопряженный оператор В: В = E.78) Согласно E.70) справедливо соотношение (Pfcx, х) ;> 0, из которого следует положительность операторов Р& и положитель- положительность оператора В (см. E.78)). Из свойств 1°) и 2°) проекторов Р/, (см. п. 5 этого параграфа) вы- вытекает, что Вт = Y^k = i А/.Рk- Сравнивая это выражение для Вт с выражением E.74) для А, получим Вт = А. Выше была установлена положительность оператора В. Теорема доказана. Замечание 1. Отметим без доказательства, что существует един- единственный положительный оператор А1//т. Замечание 2. В ортонормированном базисе {е^} собственных векторов оператора А матрица оператора A1'm имеет следующий вид: \\ \/т о \ 0 \/т 0 \ о § 6. Приведение квадратичной формы к сумме квадратов В этом параграфе мы изучим вопрос о выборе такого базиса, в котором квадратичная форма (инвариантная квадратичная функция координат вектора; точно это понятие определяется ниже) имеет наи- наиболее простой вид. Квадратичные формы подробно изучаются в гл. 7. Там будут, в частности, рассмотрены различные способы приведения таких форм к сумме квадратов.
§ 6. ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ 153 Введем понятие так называемых эрмитовых форм. Определение. Полуторалинейная форма В (х, у) называется эр- эрмитовой, если для любых х и у справедливо соотношение В(х, у) = В(х,у). E.79) Согласно следствию из теоремы 5.11 любая полуторалинейная фор- форма В (х, у) (в том числе и эрмитова) может быть единственным обра- образом представлена в виде В(х, у) = (Ах, у), E.80) где А —линейный оператор. Докажем следующие два утверждения, в которых выясняются условия, при которых полуторалинейная форма является эрмитовой. Теорема 5.25. Для того чтобы полуторалинейная форма В (х, у) являлась эрмитовой, необходимо и достаточно, чтобы оператор А в представлении E.80) этой формы был самосопряженным (А = А*). Доказательство. Действительно, если А — самосопряженный оператор, то, используя свойства скалярного произведения, получим В(х, у) = (Ах, у) = (х, Ау) = (Ау, х) = В (у, х). Таким образом, выполнено соотношение E.79), т. е. фор- форма В (х, у) = (Ах, у) является эрмитовой. Если же форма В (х, у) = (Ах, у) эрмитова, то, опять обращаясь к свойствам скалярного произведения, получим равенства (Ах, у) = В(х, у) = В (у, х) = (Ау, х) = (х, Ау). Таким образом, (Ах, у) = (х, Ау), т. е. оператор А является са- самосопряженным. Теорема доказана. Теорема 5.26. Для того чтобы полуторалинейная форма В (х, у) была эрмитовой, необходимо и достаточно, чтобы функция В (х, х) была вещественной. Доказательство. Форма В (х, у) будет эрмитовой в том и толь- только в том случае, когда линейный оператор А в представлении E.80) этой формы является самосопряженным (см. теорему 5.25). Согласно же теореме 5.18, для того чтобы оператор А был самосопряженным, необходимо и достаточно, чтобы для любого х скалярное произведе- произведение (Ах, х) было вещественным. Теорема доказана. Введем теперь понятие квадратичной формы. Пусть В (х, у) —эрмитова форма.
154 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Квадратичной формой, соответствующей форме В (х, у), назы- называется функция В (х, х). Докажем следующую теорему о приведении квадратичной формы к сумме квадратов. Теорема 5.27. Пусть В (х, у) — эрмитова форма, определенная на всевозможных векторах х и у п-мерноео евклидова простран- пространства V. Тогда в этом пространстве существует такой ортонорми- рованный базис {е^} и можно указать такие вещественные числа А/., что для любого х, принадлежащего V, квадратичная форма В (х, х) может быть представлена в виде следующей суммы квадратов ко- координат ^k вектора х в базисе В(х,х) = ^А*|а|2. E.81) k = i Доказательство. Так как форма В (х, у) эрмитова, то, соглас- согласно теореме 5.25, существует самосопряженный оператор А такой, что В(х, у) = (Ах, у). E.82) Обратимся теперь к теореме 5.21. По этой теореме для операто- оператора А можно указать ортонормированный базис {е&} из собственных векторов этого оператора. Если А&—собственные значения А, а ?& — координаты вектора х в базисе {е^}, так что то, используя формулу E.12) и соотношение Ае/, = А^е/, 19) , получим следующее выражение для Ах: п Ах = V А*&е*, E.84) / ^ Из E.83), E.84) и ортонормированности базиса {е^} получим сле- следующее выражение для (Ах, х): п (Ах, х) = Y 19) Это соотношение следует из того, что А& и е& —соответственно собственные значения и собственные векторы оператора А.
§ 7. УНИТАРНЫЕ И НОРМАЛЬНЫЕ ОПЕРАТОРЫ 155 Из этого выражения и из соотношения E.82) получим E.81). Тео- Теорема доказана. Докажем теперь важную теорему об одновременном приведении двух квадратичных форм к сумме квадратов. Теорема 5.28. Пусть А (х, у) и В (х, у) — эрмитовы формы, определенные на всевозможных векторах х и у п-мерного линейного пространства V. Допустим далее, что для всех ненулевых элемен- элементов х из V имеет место неравенство В (х, х) > 0. Тогда в простран- пространстве V можно указать базис {е&} такой, что квадратичные формы А (х, х) и В (х, х) могут быть представлены в следующем виде: А(х,х) = 5>*|&|2, E.85) k = i В(х,х) = ?|Ы2, E.86) где Xk — вещественные числа, а ?& — координаты вектора х в бази- базисе {ек}. Доказательство. Так как свойства скалярного произведения и свойства эрмитовой формы В (х, у) при дополнительном требовании о том, что В (х, х) > 0 при х/0, формулируются одинаково, мы мо- можем ввести в линейном пространстве V скалярное произведение (х, у) векторов, полагая (х, у) = В(х,у). E.87) Таким образом, V представляет собой евклидово пространство со скалярным произведением E.87). По теореме 5.27 можно указать в V такой ортонормированный ба- базис {е/,} и такие вещественные числа А/., что в этом базисе квадратич- квадратичная форма А (х, х) будет представлена в виде E.85). С другой стороны, в любом ортонормированием базисе скаляр- скалярное произведение (х, х), равное, согласно E.87), В (х, х), равно сумме квадратов модулей координат вектора х. Таким образом, представле- представление В (х, х) в виде E.86) также обосновано. Теорема доказана. § 7. Унитарные и нормальные операторы В этом параграфе рассматриваются свойства важного класса опе- операторов, действующих в евклидовом пространстве V. Определение 1. Линейный оператор U из L (V, V) называется унитарным, если для любых элементов х и у из V справедливо соот-
156 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ ношение (Ux, Uy) = (x, у). E.88) В дальнейшем соотношение E.88) будем называть условием уни- унитарности оператора. Замечание 1. Из условия E.88) унитарности оператора следу- следует, что для любого унитарного оператора U справедливо равенство Отметим следующее утверждение. Если А — собственное значение унитарного оператора U, то |А| = 1. Действительно, если Л — собственное значение U, то существует та- такой элемент е, что ||е|| = 1 и Ue = Ле. Отсюда и из замечания 1 следуют соотношения |А| = ||Ае|| = ||Ue|| = ||е|| = 1. Утверждение доказано. Докажем следующую теорему. Теорема 5.29. Для того чтобы линейный оператор U, действу- действующий в евклидовом пространстве V, был унитарным, необходимо и достаточно, чтобы было выполнено соотношение U* = и. E.89) Доказательство. 1) Необходимость. Пусть оператор U унитарный, т. е. выполнено условие E.88). Обращаясь к определению сопряженного оператора U*, можно переписать это условие в следую- следующей форме 20) : (U*Ux, у) = (х, у), E.90) или, иначе, для любых х и у выполняется равенство ((U*U - 1)х, у) = 0. Фиксируя в этом равенстве любой элемент х и считая у произволь- произвольным, получим, что линейный оператор U*U — I действует по правилу (U*U - 1)х = 0. Следовательно, U*U = I. Совершенно аналогично можно убедить- убедиться, что UU* = I. Таким образом, U и U* — взаимно обратные операторы, т. е. соот- соотношение E.89) выполнено. Необходимость условия теоремы доказана. 20) Напомним, что оператор U* называется сопряженным к оператору U, если для любых z и у выполняется соотношение (z, Uy) = (U*z, у). Полагая z = Ux, получим E.90).
§ 7. УНИТАРНЫЕ И НОРМАЛЬНЫЕ ОПЕРАТОРЫ 157 2) Достаточность. Пусть выполнено условие E.89). Тогда, оче- очевидно, UU* = U*U = I. Обращаясь к определению сопряженного оператора и используя только что написанные соотношения, получим при любых х и у равенства (Ux, Uy) = (x, U*Uy) = (х, 1у) = (х, у). Таким образом, условие E.88) унитарности оператора выполнено. Следовательно, оператор U унитарный. Теорема доказана. Замечание 2. В процессе доказательства теоремы установлено, что условие E.88) унитарности оператора U и условие U*U = UU* = I E.91) эквивалентны. Таким образом, в основу определения унитарного опе- оператора можно положить условие E.91). Это условие также можно называть условием унитарности опера- оператора U. Введем понятие нормального оператора. Определение 2. Линейный оператор А называется нормальным, если справедливо соотношение А*А = АА*. E.92) Обращаясь к условию E.91) унитарности оператора и к усло- условию E.92), мы видим, что любой унитарный оператор является нор- нормальным оператором. Нам понадобится следующее вспомогательное утверждение. Лемма. Пусть А — нормальный оператор. Тогда оператор А и оператор А* имеют общий собственный элемент е такой, что \\e\\ = 1 и справедливы соотношения Ае = Ае и А*е = Ае. Доказательство. Пусть А — собственное значение оператора А, и пусть R\ = ker (А — AI). Иными словами, R\ — множество всех эле- элементов х таких, что Ах — Ах = 0. Убедимся теперь, что если х принадлежит R\, то и А*х принадле- принадлежит R\. Действительно, если Ах = Ах (т. е. х Е R\), то, поскольку А —нормальный оператор, А(А*х) = А*(Ах) = А*(Ах) = А(А*х). Иными словами, вектор А*х является собственным вектором опе- оператора А и отвечает собственному значению А, т. е. принадлежит R\.
158 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Рассматривая далее оператор А* как оператор, действующий из R\ в R\, и используя вывод следствия из теоремы 5.8 о том, что каж- каждый линейный оператор имеет собственное значение, мы можем утвер- утверждать, что в R\ существует элемент е такой, что ||е|| = 1 и справед- справедливы соотношения А*е = fie и Ае = Ае. Используя эти соотношения и условие ||е|| = 1, найдем (Ае, е) = = (Ае, е) = А||е||2 = А, (е, А*е) = (е, Ме) = Д||е||2 = Д. Так как (Ае, е) = (е, А*е), то, очевидно, А = Д. Лемма доказана. Докажем теперь следующую теорему. Теорема 5.30. Пусть А—нормальный оператор. Тогда суще- существует ортонор мир о ванный базис {е^}, состоящий из собственных элементов операторов А и А*. Доказательство. Согласно только что доказанной лемме опера- операторы А и А* имеют принадлежащий V общий собственный элемент ei, причем ||ei|| = 1. Собственные значения для операторов А и А*, со- соответствующие ei, равны соответственно Ai и Ai. Пусть Vi — ортогональное дополнение элемента ei до простран- пространства V. Иными словами, V\ —совокупность всех х, удовлетворяющих условию (х, ег) = 0. Докажем, что если х принадлежит Vi, то Ах и А*х принадле- принадлежат V\. Действительно, если (х, е1) = 0, то (Ах, ех) = (х, А*ех) = (х, Aiei) = Ai(x, ex) = 0, т. е. Ах Е V\. Аналогично, если (х, е±) = 0, то (А*х, ех) = (х, Aex) = (х, A^i) = Ai(x, ex) = 0, т. е. А*х е Vi. Таким образом, Vi —инвариантное подпространство операторов А и А*. Поэтому, по только что доказанной лемме, в подпространстве Vi существует общий собственный элемент е2 операторов А и А* такой, что Ае2 = А2е2, А*е2 = А2е2. Далее мы обозначим через V2 ортогональное дополнение элемен- элемента е2 до Vi. Рассуждая так же, как и выше, мы докажем, что в V2 есть общий собственный элемент ез операторов А и А* такой, что ||ез|| = = 1. Продолжая аналогичные рассуждения, мы, очевидно, построим в пространстве V ортонормированный базис {е^}, состоящий из соб- собственных элементов операторов А и А*. Теорема доказана. Следствие 1. Пусть А —нормальный оператор. Существует ба- базис {е/,}, в котором А имеет диагональную матрицу. Действительно, по только что доказанной теореме существует ба- базис {е&} из собственных векторов оператора А. Согласно теореме 5.9 в этом базисе матрица оператора А диагональна.
§ 7. УНИТАРНЫЕ И НОРМАЛЬНЫЕ ОПЕРАТОРЫ 159 Следствие 2. Унитарный оператор имеет полную ортонормиро- ванную систему собственных векторов. Следующая теорема является обратной для теоремы 5.30. Теорема 5.31. Если у действующего в п-мерном евклидовом про- пространстве V оператора А имеется п попарно ортогональных соб- собственных элементов ei, в2, ..., еп, то оператор А нормальный. Доказательство. Пусть {ек} — попарно ортогональные соб- собственные векторы оператора А. Тогда Аек = А^е/, и, согласно E.69), имеет место следующее представление оператора А 21): Ах = Докажем, что сопряженный оператор А* действует по правилу п А*у = Y/\k{y, ek)ek. E.93) Достаточно доказать, что для операторов А и А*, определяемых со- соотношениями E.69) и E.93), справедливо равенство (х, А*у) = (Ах, у). E.94) Подставляя в левую часть этого равенства выражение А*у по фор- формуле E.93), получим после несложных преобразований (х, А*у) = 2^(х> Л/е(у' е^)е*0 = 2^ Хк(у, ел)(х, ек) = к=1 к=1 п )к, у) = (Ах, у). Таким образом, равенство E.94) доказано, и поэтому оператор А*, действующий по правилу E.93), является сопряженным к операто- РУ А. Чтобы завершить доказательство теоремы, нужно убедиться в справедливости равенства E.92): А* А = АА*. 21) Представление E.69) справедливо для любого оператора, имеющего п по- попарно ортогональных собственных векторов.
160 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Имеем, согласно E.93) 22), п АА*х = 22 ^&(х> ек)Аек = к = 1 , ek)ek = А*Ах. Итак, для операторов А и А* справедливо равенство E.92) и, следо- следовательно, оператор А является нормальным. Теорема доказана. § 8. Канонический вид линейных операторов В этом параграфе рассматривается вопрос о выборе для заданного линейного оператора специальрого базиса, в котором матрица этого оператора имеет простейший вид, называемый жордановой формой матрицы. Введем понятие присоединенного элемента оператора А. Определение. Элемент х называется присоединенным элементом оператора А, отвечающим собственному значению А, если для некото- некоторого целого т ^ 1 выполняются соотношения (А - AI)mx ф О, (А - AI)m + 1x = 0. При этом число т называется порядком присоединяемого элемента х. Иными словами, если х — присоединенный элемент порядка т, то элемент (А — А1)тх является собственным вектором оператора А. В этом параграфе мы докажем следующую основную теорему. Теорема 5.32. Пусть А — линейный оператор, действующий в п-мерном евклидовом пространстве V. Существует базис {еП, * = 1, 2, ...,/; т = 1, 2, ..., пл; п\ + п2 + ... + щ — п, E.95) образованный из собственных и присоединенных векторов операто- оператора А, в котором действие оператора А описывается следующими соотношениями: в1к = \ке1к, к = 1,2, ...,/; э^ = А^е^ + е^, к = 1, 2, ..., /; т = 2, 3, ..., п*. E.96) 2) Мы воспользовались также соотношениями Аед, =
КАНОНИЧЕСКИЙ ВИД ЛИНЕЙНЫХ ОПЕРАТОРОВ 161 Прежде чем перейти к доказательству, сделаем ряд замечаний. Замечание 1. Очевидно, векторы е^ базиса E.95) являются соб- собственными векторами оператора А, отвечающими собственным значе- значениям А/.. Из определения присоединенных векторов и соотношений E.96) следует, что векторы е™ (к = 1, 2, ...,/; т = 2, 3, ..., Пк) являются присоединенными векторами порядка т, отвечающими собственным значениям А/, соответственно. Замечание 2. Обращаясь к формулам E.13) и E.12), мы видим, что соотношения E.96) действительно определяют действие операто- оператора А в пространстве V при заданном базисе {е™}. Замечание 3. Матрица А линейного оператора А в базисе {е™} имеет следующий «клеточный» вид: Л! О \ Л2 А = о E.97) где клетка Л/, представляет собой следующую матрицу: ( Хк 1 0 ... О \ О Л* 1 ... О 0 0 0 \ 0 0 0 1 E.98) Замечание 4. Форма E.97) матрицы А линейного оператора А называется жордановой формой матрицы этого оператора. При этом клетка Л/, обычно называется жордановой клеткой матрицы А. Отме- Отметим, что теорему 5.32 о приведении матрицы оператора к простейше- простейшему виду E.97) называют теоремой о приведении матрицы оператора к жордановой форме. Замечание 5. Жорданова форма матрицы E.97) определена с точностью до порядка расположения клеток Л/, по диагонали матри- матрицы. Этот порядок зависит от порядка нумерации собственных значе- значений Хк. Мы дадим доказательство теоремы 5.32, предложенное А.Ф. Филипповым 23). 23) Филиппов А.Ф. Краткое доказательство теоремы о приведении матрицы к жордановой форме// Вестник Московского университета. 1971. № 2. 11 В.А. Ильин, Э.Г. Позняк
162 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Доказательство теоремы 5.32. Для доказательства теоре- теоремы применим метод индукции. При п = 1 утверждение теоремы оче- очевидно. Пусть п > 1 и теорема верна для пространств размерности меньше п. Докажем, что при этом предложении она верна и для про- пространств размерности п. Этим и будет завершено доказательство тео- теоремы. Пусть Л — собственное значение оператора А. Согласно теореме 5.8 это число является корнем характеристического уравнения det (A — — AI) = 0. Следовательно, ранг г линейного оператора 24) В = А - AI E.99) меньше п, т. е. г < п. Линейный оператор В отображает пространство V на подпростран- подпространство im В. Поэтому оператор В отображает подпространство im В раз- размерности г < п в это же подпространство. По предположению индук- индукции в imB есть базис {ЬП, * = 1, 2, ...,р; т = 1,2,..., г,; г\ + г2 + ... + гр = г, E.100) в котором действие оператора В из imB в imB дается следующими соотношениями: Bh'fe = ™"\ к = 1, 2, ...,p; m = 2, 3, ..., rk. E.101) Таким образом, в этом базисе матрица В оператора В, действую- действующего из im В в im В 25), имеет следующий клеточный вид: В = / о \ м2 24) Напомним, что ранг г линейного оператора В равен размерности imB; со- согласно теореме 5.6 ранг г равен рангу матрицы этого оператора. 25) Символом В мы будем обозначать оператор В, действующий из imB в imB.
3. КАНОНИЧЕСКИЙ ВИД ЛИНЕЙНЫХ ОПЕРАТОРОВ 163 тдеМк = ( \ 0 0 0 1 0 0 0 .. 1 .. 0 .. 0 .. . 0 . 0 . 1 \ ) E.102) Пусть лишь первые mi [m\ ^ 0) собственных значений оператора В равны нулю. Так как ранг каждой клетки Мк (см. E.102)), для которой \±к — 0, равен гк — 1, а ранг клетки, для которой /i/, ф 0, равен г/., то, соглас- согласно E.100), ранг матрицы В равен 5^ = 1 rk — т\ — т — тп\. Поэтому размерность подпространства kerB равна mi 26) и кег В представ- представляет собой линейную оболочку векторов h[, hl2j ..., hjrai. Эти векто- векторы в силу линейной независимости образуют базис в kerB. Очевидно, кег В С кег В. Дополним базис h^, hl2, ..., h.lmi в кег В до базиса в кег В векторами g/,, к = 1, 2, ..., то, то = п — г — шп\ (размерность kerB по теореме 5.1 равна п — dimimB, т. е. равна п — г). Так как g/, G ker В, то Bg/e = 0. E.103) Обратимся теперь к векторам h^fc, к = 1, 2, ..., mi. Поскольку эти векторы принадлежат imB, то существуют такие векторы f^ G У, что Шк = hrk\ к = 1,2, ...,ть E.104) Докажем теперь, что векторы h%(k = 1,2, ...,р; m = 1,2, ...,rfe), gfe(* = l,2, ...,mo), ffe(* = 1,2, ..., линейно независимы. Рассмотрим следующую равную нулю линейную комбинацию f этих векторов: V rk m0 Е ^к = о. E.Ю6) к = 1 Рассмотрим действие оператора В на этот элемент f. Получим, со- к = 1 к = 26) Ранг матрицы В равен dimimB. Согласно теореме 5.1, dimimB + + dim ker В = г. Следовательно, dim ker В = mi. 11*
164 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ гласно E.101), E.103) и E.104), следующее выражение: k=l k=lm=2 k=l E.107) Соотношение E.107) представляет собой равную нулю линейную комбинацию базисных векторов {h™}, поэтому коэффициенты при этих векторах в указанной линейной комбинации равны нулю. По- Поскольку [ik = 0 при к ^ TTii, то из E.107) следует, что коэффици- коэффициенты при Ъ.гкк в точности равны 7&5 и поэтому 7& = 0- Отсюда и из соотношения E.106) получаем равенства g = Е &8* = ~ Е Е а"тК, E-108) к=1 к=1т=1 из которых следует, что вектор g, представляющий собой линейную комбинацию векторов {g^}, принадлежит kerB (напомним, что векто- векторы {gk} составляют часть базиса в kerB). С другой стороны, из E.108) вытекает, что g представляет собой линейную комбинацию векторов h™, т. е. принадлежит imB. Следо- Следовательно, g принадлежит kerB (напомним, что kerB есть пересечение imB и kerB), и поэтому g = ^Г=1 ^^1- Так как линейные оболочки наборов векторов {gk} и {Ц,} имеют общим лишь нулевой элемент (эти наборы вместе образуют базис в kerB) и, как мы установили, g принадлежит каждой из упомянутых линейных оболочек, то g = 0. Но тогда из E.108) следует, что /?& = 0 (к = 1, 2, ..., то) и акт = 0 (к = 1, 2, ..., р; т = 1, 2, ..., гк). Итак, все коэффициенты в линейной комбинации E.106) векторов E.105) равны нулю, т. е. векторы E.105) линейно независимы. Общее число векторов E.105) равно г + то + т\. Так как то = = п — г — mi (это было установлено выше, в доказательстве при вве- введении векторов gfc), то общее число векторов E.105) равно п и поэтому они образуют базис в V. Обозначим tk=K + 1 E.109) и запишем векторы этого базиса в следующей последовательности серий: {gi}; {g2J; ...; {gm0}; {Ц, ..., h^,h^ + 1}, к = 1,2,.., mi; E.110) {hk ..., h?fc}, к = mi + 1, ...,p. Рассмотрим действие оператора В на векторы базиса E.110) в про- пространстве V. Обращаясь к соотношениям E.101), E.103), E.104) и
§ 9. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 165 E.109), убедимся, что действие В в базисе E.110) дается соотноше- соотношениями Bg/e = 0, * = 1, 2, ..., mo, Bh?fc + 1 = hrk\ к = 1, 2, ...,mi и соотношениями E.101). Итак, в базисе E.110) оператор В = А — AI действует по прави- правилу E.96), указанному в формулировке теоремы 5.32. Но тогда в этом базисе и оператор А = В + AI действует по этому же правилу. Тео- Теорема доказана. § 9. Линейные операторы в вещественном евклидовом пространстве В этом параграфе мы покажем, каким образом определения и ре- результаты предыдущих параграфов переносятся на случай веществен- вещественных евклидовых пространств. 1. Общие замечания. Рассмотрим произвольное n-мерное веще- вещественное евклидово пространство V и оператор А, действующий из V в V. Понятие линейного оператора для случая вещественного линейного пространства формулируется в полной аналогии с соответствующим понятием для комплексного пространства. Определение 1. Оператор А называется линейным, если для лю- любых элементов хЕУиуЕУи любых вещественных чисел а и /3 выполняется равенство А(ах + /?у) = аАх + /?Ау. E.111) В полной аналогии с комплексным пространством вводится поня- понятие собственного значения и собственного вектора оператора. Важно заметить, что собственные значения являются корнями ха- характеристического уравнения оператора. Обратное утверждение в вещественном случае верно лишь тогда, когда соответствующий корень характеристического уравнения веще- вещественный. Только в этом случае указанный корень будет собственным значением рассматриваемого линейного оператора. В связи с этим естественно выделить какой-либо класс линейных операторов в вещественном евклидовом пространстве, все корни ха- характеристических уравнений которых вещественны. В доказанной выше теореме 5.16 было установлено, что все соб- собственные значения самосопряженного оператора вещественны. Кро- Кроме того, понятие самосопряженного оператора играло важную роль
166 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ в выводах § б настоящей главы о квадратичных формах. Естествен- Естественно поэтому перенести понятие самосопряженного оператора на случай вещественного пространства. Предварительно введем понятие оператора А*, сопряженного к оператору А. Именно оператор А* называется сопряженным к А, если для любых х и у из У выполняется равенство (Ах, у) = (х, А*у). Без затруднений на случай вещественного пространства переносит- переносится теорема 5.12 о существовании и единственности сопряженного опе- оператора. Напомним, что доказательство теоремы 5.12 опирается на понятие полуторалинейной формы. В вещественном случае вместо полуторали- нейной формы следует воспользоваться билинейной формой В (х, у). По этому поводу в п. 2 § 4 гл. 5 сделано соответствующее замечание. Напомним в связи с этим определение билинейной формы в лю- любом вещественном, не обязательно евклидовом, линейном простран- пространстве L. Пусть В — функция, сопоставляющая каждой упорядоченной паре (х, у) векторов х Е L и у Е L вещественное число В (х, у). Определение 2. Функция В (х, у) называется билинейной фор- формой, заданной на L, если для любых векторов х, у и z из L и любого вещественного числа Л выполняются соотношения: В(х + z, у) = В(х,у) + B(z,y), В(х, у + z) = В(х, у) + В(х, z), E.112) В (Ах, у) = В (х, Лу) = ХВ (х, у). Важную роль в данном параграфе будет играть специальное пред- представление билинейной формы В (х, у) в виде В(х, у) = (Ах, у), E.113) где А —некоторый линейный оператор. Соответствующая теорема (те- (теорема 5.11) об аналогичном представлении полуторалинейной формы в комплексном пространстве опиралась на выводы леммы п. 1 § 4 на- настоящей главы о специальном представлении линейной формы / (х). В конце указанного пункта отмечалось, что эта лемма верна и в веще- вещественном пространстве. Заметим только, что в доказательстве леммы выбор элементов hk нужно производить не по формуле E.41), а с по- помощью формулы hk = /(е/,), где / (х) — данная линейная форма в вещественном пространстве. В § б настоящей главы были введены эрмитовы формы. Эрми- Эрмитова форма —это полуторалинейная форма В (х, у) в комплексном пространстве, характеризующаяся соотношением В (х, у) = В (у, х) (черта над В означает, что берется комплексно сопряженное значение для В).
§ 9. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 167 В случае вещественного пространства аналогом эрмитовых форм служат симметричные билинейные формы. Такая форма характекте- ризуется соотношением В(х, у) = В(у, х). E.114) Билинейная форма В (х, у), заданная на линейном пространстве L, называется ко со симметричной, если для любых векторов х и у из L выполняется соотношение В (х, у) = — В (у, х). Очевидно, что для каждой билинейной формы функции Bi(x,y) = ^[В(х,у) + В(у, х)], Б2(х, у) = 1[В(х, у) -В(у,х)] являются соответственно симметричной и кососимметричной билиней- билинейными формами. Поскольку В (х, у) = ??i (x, у) + В<± (х, у), то мы получаем следующее утверждение. Любую билинейную форму можно представить в виде суммы симметричной и кососимметричной билинейной формы. Нетрудно видеть, что такое представление является единственным. Мы докажем следующую теорему о симметричных билинейных формах (эта теорема служит аналогом теоремы 5.25 об эрмитовых формах). Теорема 5.33. Для того чтобы билинейная форма В (х, у), задан- заданная на всевозможных векторах х и у вещественного евклидова про- пространства V', была симметричной, необходимо и достаточно, чтобы линейный оператор А, фигурирующий в представлении E.113), был самосопряженным. Доказательство. Если А — самосопряженный оператор, то, ис- используя свойства скалярного произведения, получим В(х, у) = (Ах, у) = (х, Ау) = (Ау, х) = В (у, х). Таким образом, выполняется соотношение E.114), т. е. билинейная форма В (х, у) = (Ах, у) симметричная. Если же форма В (х, у) = (Ах, у) симметричная, то справедливы соотношения (Ах, у) = В (х, у) = В (у, х) = (Ау, х). Следовательно, оператор А самосопряженный. Теорема доказана. Введем понятие матрицы линейного оператора А. Пусть ei, ei, ..., en — какой-либо базис в n-мерном вещественном линейном пространстве L. Положим Ае& = Yl7=i
168 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Тогда, как и в комплексном случае, нетрудно показать, что если х = Y^Jk = ixkek, то для компонент вектора у = Ах справедливо пред- представление у1 = ^2^ = i а\хк. Матрица А = (агк) называется матрицей линейного оператора А в базисе {е/,}. Аналогично тому, как это было сделано в § 2 настоящей главы, можно доказать, что величина det А не зависит от выбора базиса и, тем самым, корректно вводится определитель det А оператора А. Характеристическим уравнением, отвечающим оператору А, на- называется уравнение det (А — AI) = 0, а многочлен, стоящий в левой части этого уравнения, называется характеристическим многочленом оператора А. Докажем теперь теорему о корнях характеристического много- многочлена самосопряженного оператора в вещественном евклидовом про- пространстве. Теорема 5.34. Все корни характеристического многочлена само- самосопряженного линейного оператора А в евклидовом пространстве ве- вещественны. Доказательство. Пусть А = а + if3 — корень характеристиче- характеристического уравнения det (А - AI) = 0 E.115) самосопряженного оператора А. Фиксируем в V какой-либо базис {е^} и обозначим через a,jk элементы матрицы оператора А в этом базисе (отметим, что а^ — вещественные числа). Будем искать ненулевое решение следующей системы линейных од- однородных уравнений относительно ?i, ?2 ? • • • ? ?n: = 1,2,...,п, E.116) где А = а + г/3. Так как определитель системы E.116) равен det (А — AI) (на- (напомним, что определитель матрицы линейного преобразования не зависит от выбора базиса и, согласно E.115), этот определитель ра- равен нулю), то система E.116) однородных линейных уравнений имеет ненулевое решение ?/. = Xk + гукч к = 1, 2, ..., п. Подставляя это решение в правую и левую части системы E.116), учитывая при этом, что А = а + г/3, и отделяя затем веществен- вещественную и мнимую части полученных соотношений, найдем, что наборы
§ 9. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 169 (xi, X2, • •., хп) и B/i, 2/2, • •., Уп) вещественных чисел 27) удовлетворя- удовлетворяют следующей системе уравнений: E.117) ctjkyk = ayj + fixj, j = 1, 2, ..., п. Рассмотрим в данном базисе ei, в2, ..., еп векторы х и у с коорди- координатами xi, Ж2, ..., жп и 2/i, 2/2, • • •, 2/п соответственно. Тогда соотноше- соотношения E.117) можно переписать в виде Ах = ах — /?у, Ау = ау + /?х. Умножим первое из полученных соотношений скалярно на у, а вто- второе—на х. Очевидно, получим равенства (Ах, у) = а(х, у) - /?(у, у), (х, Ау) = а(х, у) + ^(х, х). Так как оператор А самосопряженный, то (Ах, у) = (х, Ау). По- Поэтому путем вычитания соотношений E.118) получим равенство /?[(х, х) + (у, у)] = 0. Но (х, х) + (у, у) ф 0 (если (х, х) + (у, у) = 0, то хк = 0 и ук = 0, к = 1, 2, ...,п; следовательно, решение ?& = хк + ^2/^ было бы нуле- нулевым, тогда как по построению это решение ненулевое. Поэтому /3 = 0, а так как /^ — мнимая часть корня Л = а + if3 характеристическо- характеристического уравнения E.115), то, очевидно, Л — вещественное число. Теорема доказана. Как и в комплексном случае, для самосопряженного оператора справедливо утверждение о существовании ортонормированного ба- базиса, состоящего из собственных векторов этого оператора (аналог те- теоремы 5.21). Докажем это утверждение. Теорема 5.35. У каждого самосопряженного линейного операто- оператора А, действующего в п-мерном вещественном евклидовом простран- пространстве V, существует ортонор мир о ванный базис из собственных век- векторов. Доказательство. Пусть Л — вещественное собственное значение оператора A, a ei —единичный собственный вектор, отвечающий это- этому собственному значению (||ei|| = 1). 27) Напомним, что не все эти числа равны нулю.
170 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Обозначим через V\ (n — 1)-мерное подпространство простран- пространства V, ортогональное к ei. Очевидно, V\ — инвариантное подпро- подпространство пространства V (т. е. если х Е Vi, то Ах Е Vi). Дей- Действительно, пусть х Е Vi; тогда (х, ег = 0). Поскольку оператор А самосопряженный и Ai —собственное значение А, получим (Ах, ег) = = (х, Аех) = Ai(x, ex) = 0. Следовательно, Ах Е Vi, и поэтому V\ — инвариантное подпро- подпространство оператора А. Поэтому мы можем рассматривать оператор А в подпространстве Vi. Ясно, что в Vi оператор А будет самосопряжен- самосопряженным. По теореме 5.34 у оператора А, действующего в Vi, имеется ве- вещественное собственное значение А2, которому отвечает собственный вектор в2 Е Vi оператора А, удовлетворяющий условию ЦегЦ = 1. Обращаясь далее к (п — 2)-мерному подпространству V2, ортого- ортогональному векторам ei и в2, и повторяя только что описанные рас- рассуждения, мы построим собственный вектор ез оператора А, ортого- ортогональный векторам ei и в2 и удовлетворяющий условию ||ез|| = 1. Рассуждая и дальше таким же образом, мы в результате найдем п взаимно ортогональных собственных векторов ei, в2, ..., еп операто- оператора А, удовлетворяющих условию ||е^|| = 1, k = 1, 2, ..., п. Очевидно, векторы {ек} образуют базис в V. Теорема доказана. Замечание. Пусть ei, в2, ..., еп— ортонормированный базис в п-мерном евклидовом пространстве V, состоящий из собственных век- векторов самосопряженного оператора А, т. е. Ае& = А^е^. Тогда мат- матрица оператора А в базисе {е&} является диагональной, причем диа- диагональные элементы имеют вид а% = А/.. Отметим, что если {е^} —произвольный ортонормированный ба- базис в вещественном евклидовом пространстве V, то матрица самосо- самосопряженного оператора А будет симметричной, т. е. А' = А. Верно и обратное утверждение, т. е. если в некотором ортонормированном ба- базисе {е&} матрица оператора является симметричной, то оператор А — самосопряженный. Этим вещественный случай отличается от комплексного, поскольку в комплексном случае оператор А является самосопряженным тогда и только тогда, когда матрица А этого оператора в ортонормированием базисе является эрмитовой, т. е. элементы а\ матрицы А удовлетворя- удовлетворяют условию а\ = а\ (черта означает комплексное сопряжение). Указанное утверждение непосредственно следует из того, что если (а^) —матрица оператора А, то матрица сопряженного оператора в вещественном случае равна (af), а в комплексном случае— (af), что легко проверяется прямым вычислением. 2. Ортогональные операторы. В комплексном евклидовом про- пространстве важную роль играют унитарные операторы, введенные в § 7.
§ 9. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 171 Аналогом унитарных операторов в вещественном евклидовом про- пространстве являются ортогональные операторы. Определение 1. Линейный оператор Р, действующий в веще- вещественном евклидовом пространстве V, называется ортогональным, ес- если для любых х и у из У выполняется равенство (Рх, Ру) = (х, у). E.119) Таким образом, ортогональный оператор сохраняет скаляр- скалярное произведение. Отсюда непосредственно следует, что если ei, в2, ..., еп — ортонормированный базис евклидова пространства V, то Pei, Ре2, ..., Реп также является ортонормированным базисом. В дальнейшем условие E.119) будем называть условием ортогонально- ортогональности оператора Р. Справедливо следующее утверждение. Теорема 5.36. Для того чтобы линейный оператор Р был ор- ортогональным, необходимо и достаточно, чтобы существовал опера- оператор Р~ х и было выполнено равенство Р* = Р1, E.120) где Р* —оператор, сопряженный к Р, а Р~ 1 — оператор, обратный к Р. Доказательство. 1) Необходимость. Пусть Р — ортогональный оператор, т. е. выполняется условие E.119). При- Применяя сопряженный оператор Р*, это условие можно записать в виде (Р*Рх, у) = (х, у). Таким образом, для любых х и у выполняется равен- равенство ((Р*Р - 1)х, у) = 0. Фиксируя в этом равенстве любой элемент х, считая у произволь- произвольным, получим, что линейный оператор Р*Р — I действует по прави- правилу (Р*Р - 1)х = 0. Следовательно, Р*Р = I; совершенно аналогично можно убедить- убедиться, что РР* = I. Таким образом, операторы Р* и Р взаимно обратны, т. е. условие E.120) выполнено. 2) Достаточность. Пусть выполнено условие E.120). Тогда, оче- очевидно, РР* = Р*Р = I. Обращаясь к определению сопряженного оператора и используя только что написанные соотношения, получим для любых х и у ра- равенства (Рх, Ру) = (х, Р*Ру) = (х, 1у) = (х, у). Мы видим, что условие E.119) выполнено, следовательно, опера- оператор Р ортогональный. Теорема доказана. Введем теперь понятие ортогональной матрицы Р.
172 ГЛ. 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Определение 2. Матрица Р называется ортогональной, если Р'Р = РР1 = /, E.121) где Р' — транспонированная матрица, а / — единичная матрица. Если ei, в2, ..., еп — ортонормированный базис в евклидовом про- пространстве V, то оператор Р является ортогональным тогда и только тогда, когда его матрица в базисе {е^} ортогональна. Непосредственно из равенства E.121) следует, что если матри- матрица Р = (pf) является ортогональной, то ei % г |0 при к ф I. Ъ — 1 V В комплексном евклидовом пространстве аналогом ортогональной матрицы является унитарная матрица. Именно, матрица U называ- называется унитарной, если выполняется соотношение U*U = UU* = /, E.122) в котором С/*— эрмитово сопряженная матрица, т. е. U* = U1', где штрих означает транспонирование, а черта — комплексное сопряжение. Нетрудно показать, что в ортонормированном базисе матрица ли- линейного оператора U является унитарной тогда и только тогда, когда оператор U является унитарным. В заключение рассмотрим для примера ортогональные преобразо- преобразования в одномерном и двумерном пространствах. В одномерном случае каждый вектор х имеет вид х = ае, где а — вещественное число и е — вектор, порождающий данное пространство. Тогда Ре = Ае, и так как (Ре, Ре) = А2(е, е) = (е, е), то А = ± 1. Таким образом, в одномерном случае существуют два ортогональ- ортогональных преобразования: Рьх = хиР_х = —х. В двумерном случае каждое ортогональное преобразование опре- определяется в произвольном ортонормированном базисе ортогональной матрицей порядка 2, т. е. матрицей Р = ( , ). Из усло- вия РР; = Р'Р = I следует а2 + Ъ2 = 1, а2 = d2, Ъ2 = с2, ас + db = 0, ab + cd = 0. Полагая а = cos(p, Ъ = — sin у?, получаем, что каждая ортогональ- ортогональная матрица порядка 2 имеет вид _ ^ I ± sin if ± cos if
§ 9. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 173 причем во второй строке в обоих случаях следует брать либо знак + , либо знак — . Отметим, что detP± = ± 1. Ортогональная матрица Р+ называется собственной, а ортогональная матрица Р_ — несобственной. Оператор Рь с матрицей Р+ в ортонормированном базисе ei, в2 осу- осуществляет поворот в плоскости ei, в2 на угол ср. Для того чтобы выяснить, как действует оператор Р_ с матри- 1 О цей Р_, введем матрицу Q = I J , совпадающую с Р_ при (р = 0, и заметим, что Р_ = QP+. Матрице Q отвечает отражение плоскости относительно оси ei, следовательно, действие оператора Р_ заключается в повороте на угол ср и последующем отражении. Заметим, что векторы iLei, P+G2 образуют, в силу ортогонально- ортогональности Р+, ортонормированный базис и в этом базисе матрица операто- оператора Р_ совпадает с Q, т. е. является диагональной. В общем случае, когда ортогональный оператор Р действует в n-мерном евклидовом пространстве, существует ортонормированный базис ei, в2, ..., еп, в котором матрица оператора Р имеет вид 1 \ -1 -1 \ В этой матрице все элементы, кроме выписанных, равны нулю. Таким образом, в некотором ортонормированном базисе действие ортогонального оператора сводится к последовательным поворотам и отражениям относительно координатных осей.
ГЛАВА б ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ И ЗАДАЧ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ В настоящей главе изучаются различные методы решения системы линейных уравнений с вещественными коэффициентами относительно неизвестных, также принимающих вещественные значения. Все используемые на практике методы решения систем линейных уравнений можно разделить на две большие группы: точные методы и итерационные методы. Под точным методом решения понимается метод, теоретически позволяющий получить точные значения неизвестных в результате проведения конечного числа арифметических операций. Примером точного метода может служить изложенный в гл. 3 метод, основан- основанный на применении формул Крамера г). Итерационные методы позволяют получить искомое решение лишь в виде предела последовательности векторов, построение которых про- производится в помощью единообразного процесса, называемого процес- процессом итераций (последовательных приближений). Итерационные мето- методы весьма удобны для использования современной вычислительной техники. Изложению наиболее употребительных итерационных методов ре- решения линейных систем посвящен § 1 настоящей главы. Итерационные методы находят широкое применение и при реше- решении другой важной вычислительной задачи линейной алгебры —так называемой полной проблемы собственных значений (так называют проблему отыскания всех собственных значений и отвечающих им соб- собственных векторов заданной матрицы 2)). В итерационных методах 1) Практически метод, основанный на формулах Крамера, обычно не приме- применяется, ибо он требует проведения очень большого числа арифметических операций и записей. Более удобным является точный метод, основанный на последователь- последовательном исключении неизвестных и называемый методом Гаусса (его изложение мож- можно найти, например, в книге Д.К. Фаддеева и В.Н. Фаддеевой «Вычислительные методы линейной алгебры», Гостехиздат, 1963, гл. 2). 2) В отличие от этой проблемы, задачу отыскания некоторых (например, наи- наибольших по модулю) собственных значений заданной матрицы называют частич-
1. МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 175 собственные значения вычисляются как пределы некоторых числовых последовательностей без предварительного определения коэффициен- коэффициентов характеристического многочлена. В § 2 настоящей главы разбирается один из самых важных (наибо- (наиболее употребительных на ЭВМ) итерационных методов решений полной проблемы собственных значений —так называемый метод вращений (или метод Якоби). Этот метод применим ко всякой симметричной (или к эрмитовой) матрице, легко реализуется на ЭВМ и всегда схо- сходится. Он устойчив по отношению к ошибкам округления результатов промежуточных вычислений и обладает тем замечательным свойст- свойством, что наличие кратных и близких друг к другу собственных значе- значений не только не замедляет его сходимости, а напротив, ускоряет ее. Метод вращений, предложенный Якоби и известный еще с середины прошлого века, долгое время не находил практического применения из-за большого объема вычислений, необходимых для его реализации. И лишь появление быстродействующих электронных вычислительных машин сделало его самым эффективным методом решения полной про- проблемы собственных значений симметричных и эрмитовых матриц. § 1. Итерационные методы решения линейных систем I. Метод простой итерации (метод Якоби). Рассмотрим квад- квадратную систему линейных уравнений с вещественными коэффициен- коэффициентами C.10) (см. п. 1 § 2 гл.З), которую запишем в матричном виде АХ = F, понимая под А основную матрицу системы А = <222 ... CL2n CLn2 « « « &ПП а под X и F векторы-столбцы вида X = из которых подлежит определению, а второй задан. (ел) F.2) XI Х2 Хп , F = Л h fn , первый ной проблемой собственных значений.
176 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ Предлагая однозначную разрешимость системы F.1), заменим мат- матричное уравнение F.1) эквивалентным ему матричным уравнени- уравнением X = X — тАХ + tF, в котором через т обозначено вещественное число, обычно называемое стационарным параметром. С помощью этого последнего уравнения составим итерационную последовательность векторов {X/,}, определив ее рекуррентным соот- соотношением Хк + 1 = Хк - тАХк +tF (к = О, 1, ...) F.3) при произвольном выборе «нулевого» приближения Xq. Метод простой итерации заключается в замене точного решения X системы F.1) к-й итерацией Х^ с достаточно большим номером к. Оценим погрешность Z^ — Х^ — X метода простой итерации. Из соотношений F.3) и F.1) сразу же вытекает следующее матрич- матричное уравнение для погрешности Z^\ Zk + 1 = (E- rA)Zk, F.4) где i? —единичная матрица порядка п. Введем в рассмотрение норму вектора в пространстве Еп и опера- операторную норму квадратной матрицы порядка п. Как обычно, назовем нормой вектора X число ||Х||, равное корню квадратному из суммы квадратов координат этого вектора. Назовем операторной нормой про- произвольной матрицы А число Щ||, равное либо точной верхней грани отношения || АХ"||/||Х|| на множестве всех ненулевых векторов X, либо (что то же самое) точной верхней грани норм || АХ"|| на множестве всех векторов X, имеющих норму, равную единице. Итак, по определению !!?*!! F.5) Напомним, что для любой симметричной матрицы А 3) оператор- операторная норма этой матрицы равна наибольшему по модулю собственному значению этой матрицы (см. п. 4 § 5 гл. 5), т. е. = max |AS|. F.6) Из F.5) вытекает следующее неравенство, справедливое для любой матрицы А и любого вектора X: \\АХ\\<:\\А\\\\Х\\. F.7) 3) Матрица А называется симметричной, если А = А'.
§ 1. МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 177 Из матричного уравнения для погрешности F.4) и из неравенства F.7) мы получим, что для любого номера к Докажем теперь следующую простую, но важную теорему. Теорема 6.1. Для того чтобы итерационная последователь- последовательность F.3) при любом выборе нулевого приближения Xq и при дан- данном значении параметра г сходилась к точному решению X систе- системы F.1), достаточно, чтобы было выполнено условие р=\\Е- тА\\ < 1. F.9) При этом последовательность F.3) сходится со скоростью геомет- геометрической прогрессии со знаменателем р. В случае, если матрица А является симметричной, условие яв- является и необходимым условием сходимости итерационной последо- последовательности F.3) при любом выборе нулевого приближения. Доказательство. Для установления достаточности усло- условия F.9) заметим, что из неравенства F.8) вытекает следующее со- соотношение: \\Zk\\<:\\E-TA\\k\\Z0\\. F.10) Из F.10) очевидно, что условие F.9) обеспечивает сходимость по- последовательности погрешностей Z^ к нулю со скоростью геометриче- геометрической прогрессии со знаменателем р. В случае, если матрица А является симметричной, будет симмет- симметричной и матрица Е — тА, а поэтому в силу F.6) условие F.9) можно переписать в эквивалентном виде р = max |1 - tXs\ < 1 F.11) S (здесь через {Xs} обозначены собственные значения матрицы А). Убедимся в том, что условие F.11) является необходимым усло- условием сходимости к нулю последовательности {Z^} при любом выборе нулевого приближения Xq. Предположим, что условие F.11) не вы- выполнено. Тогда существует собственное значение Xs, удовлетворяющее неравенству |1 — rXs\ ^ 1. Обозначим через Х^ отвечающий это- этому собственному значению собственный вектор матрицы А и выберем нулевое приближение Xq так, чтобы Zq совпало с X^s\ Тогда, после- последовательно записывая соотношение F.4) для номеров 1, 2, ..., к, мы получим, что Zk = A — rXs)kZo. Из последнего соотношения в силу неравенства |1 — rXs\ ^ 1 вытекает, что \\Zk\\ не стремится к нулю при к ->• оо. Теорема 6.1 доказана. 12 В.А. Ильин, Э.Г. Позняк
178 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ Сразу же заметим, что для практических целей недостаточно уста- установить только факт сходимости последовательности итераций. Цен- Центральной задачей численных методов является оценка скорости схо- сходимости. Очень важно знать, как наилучшим способом распорядиться стационарным параметром т для того, чтобы получить наиболее бы- быструю сходимость. Остановимся на этом вопросе подробнее. Пусть задана ^-точность, с которой нам требуется получить точное решение системы F.1). Требуется найти итерацию Хкс таким номе- номером к, для которого II 7" II г' <=¦ II 7 II ((К Л О\ Из F.9) и F.10) вытекает, что \\Zk\\ ^ рк \\Zo\\ и, стало быть, F.12) выполняется при рк ^ е, т. е. при к ^ In (l/e)/\n(l/p). Отсюда видно, что для уменьшения числа итераций к, достаточных для достижения требуемой ^-точности, следует выбрать параметр т так, чтобы получить минимум функции р = р (т) = \\Е — тА\\. Считая матрицу А симметричной и положительна определенной, мы приходим к следующей задаче оптимизации: найти минимум функции min р(т) = min \\Е — тА\\ = min {max |1 — rAs|}. Т Т Т S Решение этой и несколько более общей задачи, предложенное А.А. Самарским, излагается в следующем пункте. Там будет доказа- доказано, что указанный минимум функции р = р (г) достигается для зна- значения т = 2/G1 + 72M гДе 7i и 72 ~~ соответственно минимальное и максимальное собственные значения матрицы А, причем минимальное значение функции р (г) равно 72_ _ 72 - 7i 1 + 21 72 + 7i 72 2. Общий неявный метод простой итерации. Снова обратимся к решению линейной системы F.1), но на этот раз заменим итераци- итерационную последовательность F.3) более общей итерационной последова- последовательностью, определяемой соотношением ВХк + 1 ~ Хк + АХк = F, F.13) в котором В представляет собой некоторую «легко обратимую» квад- квадратную матрицу n-го порядка, а г — стационарный параметр. Такой
§ 1. МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 179 метод составления итерационной последовательности и называется неявным методом простой итерации. Рассмотренный в предыдущем пункте явный метод простой итерации получается из неявного метода в частном случае В = Е, где .Е-единичная матрица порядка п. Для того чтобы сформулировать в удобной для приложений форме условие сходимости общего неявного метода простой итерации, напо- напомним некоторые понятия, введенные в предыдущей главе. Напомним, что матрица А называется положительно определен- определенной, если (АХ, X) > 0 для любого ненулевого вектора X. В гл. 5 было доказано, что необходимым и достаточным условием положительной определенности симметричной матрицы А (или, что то же самое, са- самосопряженного линейного оператора А) является положительность всех собственных значений этой матрицы (этого оператора). Если матрица А является положительно определенной, то мы договоримся писать неравенство А > 0. Далее договоримся писать неравенство В > А (или А < В) в случае, если В — А > 0 (т. е. если матрица В — А является положительно определенной). Докажем следующую замечательную теорему 4). Теорема 6.2 (теорема А.А. Самарского). Пусть матрица А яв- является симметричной и выполнены условия А > 0, В > 0 (симмет- (симметричность матрицы В, вообще говоря, не предполагается). Тогда для того чтобы итерационная последовательность, опреде- определяемая соотношением BXk + l ~ Хк + АХк = F, F.13) при любом выборе нулевого приближения Xq сходилась к точному решению X системы АХ = F, достаточно, чтобы были выполнены условия 2В > тА, тА > 0. F.14) При дополнительном предположении о том, что матрица В яв- является симметричной, условия F.14) не только достаточны, но и необходимы для сходимости указанной итерационной последователь- последовательности при любом выборе нулевого приближения Xq. Доказательство. 1) Достаточность. Прежде всего оценим погрешность Zk = Xk — X. Так как X удовлетвовлетворяет уравне- уравнению АХ = F, a Xk соотношению F.13), то для Zj* получим соотно- 4) Эта теорема является частным случаем доказанного известным советским математиком А.А. Самарским значительно более общего утверждения. (Самар- (Самарский А.А. Введение в теорию разностных схем. — М.: Наука, 1971.) 12*
180 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ шение BZk + 1r Zk + AZh = 0. F.15) Установим для погрешности Zk так называемое основное энергети- энергетическое соотношение. Умножая F.15) скалярно на вектор 2{Zk + l - Zk) = 2 получим равенство о^ (РZk +1 Zk Zk + 1 Zk\ , v^7 ^fe + l ^fe\ 2r ±J , + It AZk, = 0. V r t ) \ t ) F.16) Если воспользоваться обозначением С = 2В — тА и соотношением _ Zk + i + Zk _ Zk + i — Zk _ Zk + i — Zk _ r Zk + i — Zk k ~ 2 2 ~ 2 2 ' r ' то равенство F.16) можно переписать в виде - zk zk + 1 - zk\ + (A(Zfc + i + Zk), Zk + i - Zk) = 0. т т J F.17) Далее заметим, что в силу симметрии матрицы А второе слагае- слагаемое в F.17) равно (AZk + i, Zk + i) — (AZkj Zk). Это приводит нас к основному энергетическому соотношению: i - Zk Zk + 1 - Zk\ , + {AZk + i, Zk + i) = {AZk, Zk). r t ) F.18) Для доказательства достаточности условий F.14) остается с помо- помощью основного энергетического соотношения доказать сходимость к нулю последовательности {||Z^||}. Из основного энергетического соотношения и из положи- положительной определенности матрицы С = 2В — тА вытекает, что (AZk + i, Zk + i) ^ (AZk, Zk), т. е. вытекает невозрастание последова- последовательности {(AZk, Zk)}. Из условия А > 0 вытекает, кроме того, что эта последовательность ограничена снизу нулем, а поэтому сходится. Но тогда из основного энергетического соотношения следует, что = 0. F.19) Напомним, что для положительно определенной матрицы С всегда найдется S > 0 такое, что (СХ, X) ^ 8 (X, X) для любого вектора X
§ 1. МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 181 или, что то же самое, ||Х||2 ^ A/5)(СХ, X). Последнее неравенство позволяет заключить, что из равенства нулю указанного выше преде- предела F.19) следует, что lim \\Zk + 1 - Zk\\ = 0. F.20) к—>-оо Для завершения доказательства достаточности следует воспользо- воспользоваться соотношением BZk + 1 ~ Zk + AZk = 0, Г из которого, в силу существования для положительно определенной матрицы А ограниченной обратной матрицы А~ 1, вытекает, что Zk = -A~l-^(Zk + 1 - Zk). Последнее равенство и соотношение F.20) дают право заключить, что lim/^oo \\Zk\\ = 0. Достаточность доказана. Для доказательства необходимости условий F.14) при дополни- дополнительном предположении о том, что матрица В симметрична, привле- привлечем следующую лемму. Лемма. Пусть С — некоторая симметричная матрица, а В — симметричная положительно определенная матрица. Тогда матри- матрица С является положительно определенной в том и только в том случае, когда являются положительными все собственные значения задачи СХ = ХВХ. Для доказательства леммы заметим, что так как матрица В явля- является симметричной и положительно определенной, то (в силу теоре- теоремы 5.24 из п. 6 § 5 гл. 5) существует самосопряженный положительно определенный оператор В1/2 такой, что для соответствующей ему мат- матрицы В1!2 справедливо равенство В1!2 х В1!2. Так как матрица В1!2 является положительно определенной и симметричной, то для нее су- существует ограниченная и симметричная обратная матрица, которую мы обозначим через В~Х12. Заметим далее, что с помощью замены X — В1!2 • Y и умноже- умножения слева на матрицу В~Х12 задача на собственные значения СХ — — ХВХ переходит в эквивалентную задачу на собственные значения В~Х12 • С • B~XI2Y", так что для доказательства леммы остается убе- убедиться в том, что заведомо симметричная матрица В~Х12 • С • В~Х12 является положительно определенной тогда и только тогда, когда яв- является положительно определенной матрица С. Это последнее сразу
182 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ вытекает из того, что для любых ненулевых векторов X и У, связан- связанных соотношением Y = В~Х12 • X, справедливо равенство (В~ ^2 • С - В~ */2Х, X) = (С - В~ */2Х, В~ ^2 • X) = (СУ, Y). Лемма доказана. Теперь мы можем перейти к доказательству необходимости усло- условий F.14) теоремы 6.2 при дополнительном предположении о том, что матрица В является симметричной. 2) Необходимость. Будем опираться на следующее утвержде- утверждение из доказанной выше леммы: если матрица В является симмет- симметричной и положительно определенной, а матрица С является сим- симметричной и не является положительно определенной, то задача на собственные значения СХ = ХВХ имеет хотя бы одно неположи- неположительное собственное значение Xs. Предположим, что не выполнено первое из условий F.14), т. е. не выполнено требование 2В — г А > 0. Полагая в проведенных выше рассуждениях С = 2В — г А, мы получим, что задача на собственные значения {2В — тА)Х = ХВХ имеет хотя бы одно неположительное собственное значение Xs. Обозна- Обозначим через X(s) отвечающий Xs собственный вектор и выберем нулевое приближение Xq так, чтобы было выполнено условие Zq = X^s\ Тогда, переписав уравнение для погрешности F.15) в виде BZk + i = —BZk + BВ — rA)Zk, мы получим, последовательно по- полагая к равным 0, 1, ..., Zk = (-1 + Xs)kX^s\ ... Поскольку — 1 + Xs < — 1, то очевидно, что \\Zk\\ не стремится к нулю при к —У оо. Аналогично рассматривается случай невыполнения второго усло- условия F.14), т. е. условия тА > 0. В этом случае в проведенных выше рассуждениях следует положить С — г А. Мы получим при этом, что задача г АХ = ХВХ имеет хотя бы одно неположительное собствен- собственное значение Xs с собственным вектором X^SK Выбирая нулевое при- приближение Xq так, чтобы было справедливо равенство Zq = X^ и переписывая F.15) в эквивалентном виде BZ^ + i = BZ^ — tAZ^, мы получим, что = A - \s)xW, Z2 = A - ASJX<S\ ..., Zk = A -
§ 1. МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 183 Так как А ^ 0, то очевидно, что \\Zk\\ не стремится к нулю при к —> оо. Теорема 6.2 полностью доказана. Перейдем теперь к оценке скорости сходимости общего неявного метода простой итерации. Следуя А.А. Самарскому 5) , выясним во- вопрос о выборе такого значения параметра т, которое обеспечивает наи- наиболее быструю сходимость. Предположим, что матрица В является симметричной и положи- положительно определенной. С помощью такой матрицы естественно ввести так называемое энергетическое скалярное произведение двух произ- произвольных векторов X и У, положив его равным (ВХ, Y) = (X, BY). Такое скалярное произведение будем обозначать символом (X, Y)b- С помощью матрицы В1!2 это скалярное произведение можно за- записать в виде (X, Y)B = (Б1/2Б1/2Х, Y) = (Вг/2Х, BXI2Y). С помо- помощью последнего равенства легко проверяется справедливость для вве- введенного нами скалярного произведения четырех аксиом скалярного произведения (см. п. 1 § 1 гл.4). Далее естественно ввести энергетическую норму вектора X, поло- положив ее равной л/(Х, Х)в — у/(ВХ, X). Эту энергетическую норму мы обозначим символом ||Х||#. Две различные нормы одной и той же совокупности векторов ||Х||/ и ||Х||// называют эквивалентными, если существуют такие положи- положительные постоянные 71 и 72, что справедливы неравенства Заметим, что энергетическая норма вектора X и обычная его нор- норма являются эквивалентными. В самом деле, справедливость нера- неравенства 7i11-Х"|| ^ II-^11 в? т- е- неравенства 7i(^ X) ^ (ВХ, X) выте- вытекает из положительной определенности матрицы В, а справедливость неравенства ||Х||# ^ 7211-^11? т- е- неравенства (??Х, X) ^ 7lll^ll2 вы~ текает из неравенства Коши-Буняковского и оценки F.7) (достаточно положить 7| = 11^11)- Установленная эквивалентность обычной и энергетической норм позволяет утверждать, что последовательность ||Х&|| сходится к ну- нулю тогда и только тогда, когда сходится к нулю последователь- последовательность \\Хк\\в- Для дальнейших рассуждений энергетическая норма является бо- более удобной, чем обычная норма. Докажем следующую фундаментальную теорему. 5) Самарский А.А. Введение в теорию разностных схем. —М.: Наука, 1971. Самарский А.А., Гулин А.В. Устойчивость разностных схем. — М.: Наука, 1973.
184 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ Теорема 6.3 (теорема А.А. Самарского). Пусть матрицы А и В симметричны и положительно определены, Zk обозначает погреш- погрешность общего неявного метода простой итерации. Тогда для того чтобы при р < 1 было справедливо неравенство \\Zk\\B ^ ^||^о||б? достаточно, чтобы было выполнено условие Ll?B <:А^ !±РВ. F.21) Т Т Замечание. А.А. Самарским доказано, что условие F.21) не только достаточно, но и необходимо для справедливости неравен- неравенства ||^||б ^ /^Н^оНб, но мы на этом останавливаться не будем. Доказательство теоремы 6.3. Для удобства разобьем дока- доказательство на два шага. 1°). Сначала докажем, что если симметричные и положительно определенные матрицы А и В удовлетворяют условиям Самарско- Самарского F.14), то (BZk + u Zk + 1) ^ (BZk, Zk). Умножая равенство F.15) скалярно на 2rZk + i = r(Zk + i + Zk) + + r(Zk + 1 - Zk), получим (B(Zk + 1 - Zk), Zk + 1 + Zk) + (B(Zk + 1 - Zk), Zk + 1 - Zk) + + r(AZk + 1, Zk + 1 + Zk) + r(AZk, Zk + 1 - Zk) = 0. В последнем равенстве заменим AZk на разность \ Zk) - \A{Zk + 1 - Zk). Тогда, учитывая вытекающее из симметрии матрицы А равен- ство (A(Zk + 1 - Zk),Zk + 1 + Zk) = (Zk + 1 - Zk,A(Zk + 1 + Zk)), мы получим тождество (B{Zk + l - Zk), Zk + 1 + Zk) + - ^A) (Zk + 1 - Zk), Zk + 1 + Zk) + ^ 1 + Zk), Zk + 1 + Zk) = 0. Учитывая, что (в силу условий Самарского F.14)) операторы тА и В — (т/2)А являются положительно определенными, мы получим из последнего тождества следующее неравенство: (B(Zk + 1 - Zk), Zk + 1 + Zk) ^ 0.
§ 1. МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 185 Это неравенство эквивалентно доказываемому неравен- неравенству (BZk + i, Zk + i) ^ (BZk, Zk) (в силу вытекающего из симметрии оператора В тождества {BZk + u zk) = (Zk + i, BZk)). 2°) Пусть теперь при р < 1 выполнены условия Самарского F.21). Докажем справедливость неравенства ||^||б ^ ^||^о||б- Положим Zk = pkVk- Тогда, очевидно, Zk + l - Zk = Pk + 1Vk + 1 - PkVk = pk + 1(Vk + 1 - Vk) - A - p)PkVk. Подставляя эти значения Zk и Zk + i — Zk в равенство F.15) и про- производя сокращение на рк, получим для величин Vk следующее соотно- соотношение: В к + 1 ~ к + AVk = 0, F.22) т в котором В = рВ, А — А — В. В силу условий F.21) операторы В и А удовлетворяют услови- условиям тА > О, 2В > тА. Из этих условий и из того, что уравнение F.22) для Vk совершенно идентично уравнению F.15) для Z/,, в силу первого шага для Vk вытекает следующая оценка: (BVk + i, V^ + i) ^ (BVk, Vk). Из этой оценки в свою очередь, учитывая, что В = рВ, получим нера- неравенство (BVk + u Vk + 1) ^ (BVk, Vk). Последовательное применение указанного неравенства для номе- номеров к = 0, 1, ... приводит нас к соотношению (BVk, Vk) ^ (BVo, Vo), a умножение последнего соотношения на р2к приводит к окончательной оценке 6) (BZk, Zk) ^ p2h(BZo, Zq). Тем самым неравенство ||^||б ^ ^ ^||^о||б доказано. Доказательство теоремы 6.3 завершено. В заключение применим теорему Самарского 6.3 для выяснения вопроса о выборе такого значения параметра г, при котором скорость сходимости является максимальной. Из доказанной в теореме 6.3 оцен- оценки ||^||б ^ ^||^о||б вытекает, что эта задача сводится к нахождению такого значения г, при котором достигается минимальное значение функции р = р(т). Так как обе матрицы А и В симметричны и положительно опре- определены, то существуют положительные постоянные 71 и 72 такие, что справедливы неравенства jiB ^ А ^ 72^- Будем считать, что посто- постоянные 7i и 72 B этих неравенствах нам заданы 7). Сопоставляя только 6) Мы учитываем, что Z^ 7) Постоянные 71 и 72 естественно назвать константами эквивалентности матриц А и В. Для коммутирующих матриц А и В постоянные 71 и 72 соответ- соответственно равны наименьшему и наибольшему собственным значениям задачи АХ = = хвх.
186 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ что написанные неравенства с условиями F.21), мы получим, что ми- минимальное значение р достигается при условии A — р)/т = 71 •> A + + р)/т = 72, откуда получаем оптимальное значение т = 2/G1 + 72) и минимальное значение р, равное G2 — 7i)/G2 + 7i)- Частным случаем проведенного нами рассмотрения является яв- явный метод простой итерации, изученный в п. 1. Для этого метода спра- справедливы все полученные нами результаты. В следующих трех пунктах с помощью общего неявного метода про- простой итерации и теоремы Самарского 6.2 мы рассмотрим несколько наиболее употребительных итерационных методов и установим усло- условия их сходимости. 3. Модифицированный метод простой итерации. Этот ме- метод получается из общего неявного метода простой итерации в том случае, когда стационарный параметр т равен единице, а матрица В представляет собой диагональную матрицу D, состоящую из элемен- элементов матрицы А, лежащих на главной диагонали, т. е. В = D, где аи 0 ... О О а22 ... О D = О О F.23) При этом, конечно, предполагается, что матрица А является сим- симметричной и что все ее диагональные элементы аи, а22, • • -, апп явля- являются положительными (последнее требование необходимо и достаточ- достаточно для положительной определенности диагональной матрицы В = = D). Из теоремы 6.2 сразу же вытекает, что для сходимости модифи- модифицированного метода простой итерации при любом выборе нулевого приближения достаточно, чтобы были выполнены два условия: 2D > > А, А > 0. Теорема 6.1 позволяет выразить достаточное условие сходимости модифицированного метода простой итерации и в другой форме: \\Е - D~1A\\ < I8) F.24) (под нормой матрицы, как и выше, понимается операторная норма). Таккак\\Е-В-1А\\ = Ц^^ - А)|| = \\D~1 (A - D)\\, то доста- достаточное условие сходимости F.24) можно переписать в эквивалентном виде ^l. F.25) 8) Мы учитываем, что в рассматриваемом случае вместо матрицы А следует взять матрицу А, определяемую формулой А = В~ 1А и положить В = D, т = 1.
1. МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 187 Неравенство F.25) позволяет получить различные достаточные условия сходимости модифицированного метода простой итерации. Прежде всего заметим, что если наряду с операторной нор- нормой матрицы F.2) (которую мы, как и выше, будем обозначать символом \\A\\) ввести так называемую сферическую норму это матрицы, обозначаемую символом Щ||сф и определяемую равен- Г п 11//2 ством ЩЦсф = \У27= 1 Z)?= 1 аЫ -> т05 как доказано в §4 гл.4 L J J \ (см. формулу D.28)), для любого вектора X пространства Еп будет справедливо неравенство 9) \\AX\\ ^ \\А\\сф\\Х\\. F.26) Из F.26) и F.5) сразу же вытекает, что операторная и сферическая нормы матрицы связаны соотношением \\A\\ ^ ||А||сф. Таким образом, в силу F.25) достаточное условие сходимости модифицированного метода простой итерации выражается неравен- неравенством ||?)~1(А — ?>)||сф < 1, которое в развернутой записи имеет вид Vn Vn a? I a?- < 1 Заметим далее, что при определении операторной нормы F.5) мат- матрицы А мы исходили из обычной (так называемой сферической) нормы Х\ вектора X = ... , равной ||Х|| = [^Г=1ж2] • %п Часто вводят еще две нормы вектора X: так называемую куби- кубическую норму, определяемую равенством ||Х||куб = maxi^^n |ж^|, и так называемую октаэдрическую норму, определяемую равен- равенством ЦХЦокт — Y^i = i \xi\- Если в определении F.5) операторной нор- нормы матрицы А понимать под нормой вектора соответственно его ку- кубическую или октаэдрическую норму, то соотношение F.5) приведет нас к определению соответственно кубической и октаэдрической опе- операторных норм матрицы А. Можно доказать, что кубическая и октаэдрическая операторные нормы матрицы F.2) следующим образом выражаются через элементы 9) В этом неравенстве под нормой вектора X = зываемая сферическая норма ||Х|| = [2Г=1Ж?]- понимается так на-
188 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ этой матрицы 10) : Е з = 1 окт — max 1<г<п Дословное повторение проведенных выше рассуждений с заменой сферических норм соответственно кубическими и октаэдрическими приведет нас к достаточному условию сходимости модифицирован- модифицированного метода простой итерации, выраженному соотношением F.25), в котором под нормой матрицы следует понимать соответственно ее ку- кубическую или октаэдрическую операторные нормы. Это приводит нас к следующим двум условиям, каждое из которых является достаточным для сходимости модифицированного метода простой итерации Е < 1 (для г = 1, 2, ..., га); Е CLjj < 1 (для j = 1, 2, ..., га). 4. Метод Зейделя. Представим симметричную матрицу F.2) в виде суммы трех матриц А = D + L + U, где D — диагональная матрица F.23), а!и[/ соответственно строго левая и строго правая матрицы, имеющие вид L = о &21 Q>ni 0 и = О ai2 ... CLin О О ... a2n О О 0 и удовлетворяющие условию V — U. Метод Зейделя получается из общего неявного метода простой ите- итерации в том частном случае, когда стационарный параметр т равен единице, а матрица В равна сумме D + L. Таким образом, последова- последовательные итерации в методе Зейделя определяются соотношением (D + L)(Xk + 1 - Хк) + АХк = F. 10) См., например: Крылов В.И., Бобков В.В. и Монастырный П.И. Вычис- Вычислительные методы высшей математики. — Минск: Вышэйшая школа, 1972. Т. 1. С. 111-112.
§ 1. МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 189 Докажем, что метод Зейделя сходится для любой симметричной и положительно определенной матрицы А. В силу теоремы 6.2 достаточно доказать, что для любой такой мат- матрицы А выполнено условие 2(D + L)> A. F.27) Для доказательства F.27) заметим, что для любого вектора X B(D + L)X, X) = (DX, X) + (DX, X) + (LX, X) + (LX, X) = = (DX, X) + (DX, X) + (LX, X) + (X, UX) = = (DX, X) + (AX, X). Таким образом, для доказательства неравенства F.27) достаточно убедиться в положительной определенности матрицы D, но она сразу вытекает из того, что у положительно определенной и симметричной матрицы А все элементы, лежащие на главной диагонали, являются положительными п). Сходимость метода Зейделя доказана. 5. Метод верхней релаксации. Этот метод получается из об- общего неявного метода простой итерации в том частном случае, когда т = и, В = D + ujL, а параметр и выбран так, чтобы являлось наи- наименьшим наибольшее по модулю собственное значение матрицы Е — uo(D + uoL)~ х А, осуществляющей переход от к-й итерации к (к + 1)-й. Докажем, что если матрица А является симметричной и поло- положительно определенной, то для сходимости метода верхней релак- релаксации достаточно, чтобы было выполнено условие 0 < и < 2. В силу теоремы 6.2 для сходимости достаточно выполнение усло- условий и > О, 2(D + ujL) > и А. Второе из этих условий для любого вектора X приводит к неравен- неравенству B(D + ujL)X, X) > (ujAX, X). F.28) Последнее неравенство эквивалентно каждому из неравенств в следу- следующей цепочке: BDX, X) + (ujLX, X) + (ujLX, X) > (иАХ, X), B - uj)(DX, X) + (ujDX, X) + (ujLX, X) + (X, ujUX) > (иАХ, X), B - uo)(DX, X) >0. n) Достаточно заметить, что если у вектора X k-я координата равна единице, а все остальные нулю, то (АХ, X) = а&& > 0.
190 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ Из последнего неравенства и из положительной определенности D за- заключаем, что F.28) справедливо при 2 — uj > 0, т. е. при uj < 2. Итак, доказано, что условия 0 < и < 2 обеспечивают сходимость метода верхней релаксации. 6. Случай несимметричной матрицы А. В случае несиммет- несимметричной матрицы А мы можем умножить матричное уравнение F.1) слева на матрицу А' и заменить уравнение F.1) уравнением АХ = = F, в котором F = AfF, A = А'А, так что матрица А является симметричной и (как легко убедиться) положительно определенной. 7. Итерационный метод П.Л. Чебышева 12). Всюду выше при рассмотрении общего неявного метода простой итерации мы предпо- предполагали, что итерационный параметр т принимает одно и то же посто- постоянное значение. Естественно возникает идея рассмотреть более общий случай, когда в указанном методе значения итерационного парамет- параметра зависят от номера к итерации. В таком случае последовательность итераций будет определяться не соотношением вхк + 1 - хк а более общим соотношением ВХк + 1 ~Хк Тк + 1 АХк = F. При этом, как и выше, В — некоторая легко обратимая квадратная матрица порядка п. При таком выборе итерационной последователь- последовательности для погрешности Zj~ = Х^ — X итерационной схемы получится соотношение Z Zk + AZk = 0. F.15*) Предположим, что обе матрицы Аи В симметричны и положитель- положительно определенны. Тогда, как уже отмечалось выше, найдутся положи- положительные постоянные 71 и 72 такие, что jiB ^ А ^ 72^- Будем счи- считать, что эти постоянные 71 и 72 нам заданы и еще раз напомним, что эти постоянные равны соответственно наименьшему и наибольшему собственным значениям задачи АХ = ХВХ. Оценим энергетическую норму погрешности ||Z^||^. Напомним еще раз, что для симметричной и положительно опреде- определенной матрицы В существует симметричная и положительно опреде- 12) Пафнутий Львович Чебышев A821-1894)—великий русский математик и механик.
1. МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 191 ленная матрица В1!2 такая, что В1!2 - В1!2 — В. Как и выше, догово- договоримся обозначать символом В~ 1//2 матрицу, обратную к матрице В1!2. Для оценки нормы погрешности Zk сделаем замену, положив Zk = = В~Х12 • Vfe. При такой замене соотношение для погрешности Zk пе- переходит в следующее соотношение для 14: Vk + 1 = (Е - rk + 1C)-Vk (к = 0,1, 2,...), где через С обозначена матрица вида С = В~Х12 • А • В~Х12. Убе- Убедимся в том, что квадрат обычной нормы вектора 14 равен квадрату энергетической нормы вектора Zk. В самом деле, |2 = (Vfc, Vk) = = (BZk, Zk) = \\Zk\\2B. Таким образом, для оценки энергетической нормы Zk достаточно оце- оценить обычную норму Vk- Оценим норму ||Т4||. Прежде всего заметим, что из нера- неравенств "yi(BX, X) ^ (АХ, X) ^ 72(^^5 X) с помощью замены X = = В~Х12 • Y получаются неравенства 7i(^ ^0 ^ (CY, Y) ^ 72(^5 Y). Последние неравенства эквивалентны тому, что jiE ^ С ^ 72^- По- Поскольку, кроме того, матрица С = В~ 1//2 • А • В~ Х12 симметрична, то все собственные значения этой матрицы вещественны и расположены на отрезке [71, 72]- Последовательно записывая соотношение 14 + 1 = = (Е — тк +1 -C)Vk для номеров к = 0, 1, ..., мы придем к следующему равенству: из которого сразу же вытекает, что к Ук\ П Но тогда из равенства где q Y\ 4|| = ||в вытекает, что ||^||б — tjC)\\. Следовательно, итерационный процесс сходится при условии, что последовательность {qk} стремится к нулю, причем тем быстрее, чем меньше величины qk. Поскольку каждое значение qk является функцией парамет- параметров т\, Т2, ..., Tk, возникает задача построения оптимального набора итерационных параметров из условия минимума qk для фиксирован- фиксированного к. Перейдем к решению этой задачи.
192 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ Предположим, что все собственные значения Xs матрицы С лежат на заданном сегменте [71, 72]- Учитывая симметрию матрицы С, мы приходим к следующей задаче оптимизации: найти min , т2, ..., тк) = mm {гЛ П = mm < max Поскольку все Xs лежат на отрезке [71, 72]? т0 расширяя область, по которой берется максимум, мы получим, что min qk (ri, r2, ..., 77.) min < max {tj} I 71^72 Полученная огрубленная задача имеет более простое решение. Кроме того, при решении такой задачи не используется информация о кон- конкретном расположении собственных значений Xs на отрезке [71, 72]? а учитываются лишь границы этого отрезка. Такой подход позволяет построить набор оптимальных параметров для матриц произвольной структуры. Перейдем к решению указанной огрубленной задачи оптимизации. Положим Р (t) = Yij = i(l ~ Tjt) и заметим, что полином Р (t) удовле- удовлетворяет условию нормировки Р @) = 1. С помощью замены перемен- переменной 72 + 71 1 - sPo 72 - 7i 2 где ро = , го = , мы отобразим отрезок 71 ^ t ^ 72 B 72 +7i 7i + 72 отрезок — 1 ^ S ^ 1, причем точка t = 0 переходит в точку S = So = = 1/ро > 1. При такой замене рассматриваемая задача оптимизации переходит в следующую задачу: среди всех полиномов Рк (S) степе- степени к, удовлетворяющих условию нормировки Рк {X/ро) — 1, найти такой, для которого max|s|^i |РE)| минимален. Таким полиномом, как известно, является полином Чебышева Pk(S) =Tk(S)-[Tk(S0)]-1,me Tk cos(k arccosS1) при \S\ ^ 1, -[(S + VS2 - l)k + (S - ^S2 - l)k] при \S\ > 1.
§ 1. МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 193 Так как max|s|^i \Тк (S)\ = 1, то 1 min max \Pk (t)\ = {} 7^*^7 ¦j} 71^^72 i& (oo) 1 2/of v/72 - причем = qk = ——^, где ^ = v 7fc (So) 1 + /op д/т^ + Для вычисления оптимального набора параметров будем исходить из равенства к Рк (t) = д (* -т^ = **г* j = l (мы учли, что 5 = ). Приравняем корни полиномов, стоящих Ро в левой и в правой частях этого равенства. Так как полином Рк (t) имеет корни tj = 1/tj (j = 1, 2, ..., fc), а полином Тк (S) имеет кор- корни Sj = cos ———тг (j = 1, 2, ..., fc), то учитывая, что t = , 2/c To получим — = — (j = 1, 2, ..., k; Sj определены выше). Tj To Итак, оптимальными значениями итерационных параметров будут значения т7- = _ _ , где Sj = cos —, j = 1. 2. .... к. Итерационный процесс с указанным оптимальным набором пара- параметров называется чебышевским. Мы приходим к следующей теореме. Теорема 6.4. Если матрицы А и В симметричны и положитель- положительно определены и если j\B ^ А ^ 72 ^ то чебышевский итерационный процесс сходится и для погрешности Zk после выполнения к итера- итераций справедлива оценка Ш\В * 1 + РГ л/Ъ + / Если в качестве условия окончания процесса взять для заранее за- заданной ^-точности требование ||^||б ^ ^||^о||б? т0 из теоремы 6.4 получается для числа итераций к следующая оценка: к ^ ко (г) = = ln(s/2)/ln^i. Сравнивая эту оценку с установленной выше оцен- оценкой числа итераций для метода простой итерации к ^ ко (г) = = Ins/lnpo, мы получим, при условии, что величина ? = 72/71 13 В.А. Ильин, Э.Г. Позняк
194 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ что ко (е) « \пB/е)/2у/?. Сравнение этих оценок указывает на преиму- преимущество чебышевского метода (в случае, когда величина ? = 72/7i мала). Описанный нами чебышевский метод известен еще с начала 50-х годов. Иногда его называют методом Ричардсона. Следует отметить, что мы изучили этот метод для идеального вы- вычислительного процесса с бесконечным числом знаков, в то время как на ЭВМ вычисления ведутся с конечным числом знаков, в связи с чем имеются числа, являющиеся машинной бесконечностью Моо и ма- машинным нулем. Если в процессе вычислений на ЭВМ появляется чис- число М, превосходящее М^, то происходит аварийный останов машины (авост). С точки зрения идеального вычислительного процесса значения итерационных параметров Tj можно упорядочить как угодно (любым из к\ способов). Любые две последовательности итерационных пара- параметров {tj} с точки зрения идеального вычислительного процесса эк- эквивалентны, ибо для них требуемая ^-точность достигается за одно и то же число итераций. Но при вычислении на ЭВМ различные последовательности па- параметров {tj} не эквивалентны. Для одних последовательностей зна- значений {tj} может произойти аварийный останов машины вследствие роста промежуточных значений. Для других последовательностей зна- значений {tj} аварийного останова машины не происходит, но в связи с немонотонным характером стремления к нулю погрешности Z/,, т. е. вследствие того, что норма матрицы Е — TjC перехода от (j — 1)-й итерации к j-й может быть больше единицы, для этой погрешности не справедлива установленная нами для идеальной ситуации оценка. Вследствие указанных обстоятельств возникает теоретическая про- проблема— указать такой наилучший закон упорядочения значений {tj}, при котором для чебышевского метода было бы наименьшим влияние ошибок округления. Исчерпывающее решение этой проблемы можно найти в книге А.А. Самарского «Теория разностных схем» (М.: Наука, 1977. С. 572 и далее). § 2. Решение полной проблемы собственных значений методом вращений Ради простоты сначала будем рассматривать вещественную сим- симметричную матрицу А, определяемую равенством F.2). Заметим, что отыскание всех собственных значений и собственных векторов этой
§ 2. МЕТОД ВРАЩЕНИЙ 195 матрицы сводится к отысканию такой ортогональной матрицы Т, для которой произведение D = Т'АТ F.29) представляет собой диагональную матрицу. В самом деле, если такая ортогональная матрица Т будет найдена, то диагональные элементы матрицы D будут являться собственными значениями матрицы А, а столбцы матрицы Т будут являться соответствующими собственными векторами матрицы А 13). Введем в рассмотрение сферическую норму матрицы А: ЕЕ4 1/2 сф — г = 1 з = Тогда, очевидно, для диагональных элементов матрицы А будет справедливо неравенство причем это неравенство переходит в точное равенство только в случае, когда матрица А является диагональной. Заметим теперь, что при ортогональном преобразовании мат- матрицы А (т. е. при преобразовании вида А = UAR, где U и R — ортогональные матрицы) сферическая норма этой матрицы не изменяется 14). Отсюда следует, что от всех ортогональных преобразований матрицы А преобразование F.29) отличается тем, что это преобразование делает максимальной сумму квадратов диаго- диагональных элементов преобразованной матрицы и минимальной — сумму квадратов всех внедиагональных элементов этой матрицы. Методом вращения называется итерационный метод, при котором указанная выше матрица Т находится как предел бесконечного про- произведения элементарных матриц вращения, каждая из которых имеет 13) Для доказательства этого обозначим через Ai, A2, ..., Ап диагональные эле- элементы матрицы D и положим ед. = ||ej.||, где элементы ej. столбца е& удовлетво- удовлетворяют условию: егк = 0 при к ф г 1 и е\ = 1. Тогда, очевидно, De^ = А^е^, т. е. Т'АТе^ = А^е/г, и так как Т' = Т~ , то АТе/, = А/.Тед.. Следовательно, Тед. являются собственными векторами матрицы А. 14) В самом деле, если А = UAR, а символ tr С обозначает сумму всех эле- элементов матрицы С, лежащих на ее главной диагонали, то ||A||^, =tr(AfA) = = tr (R'A'U'UAR) =tr (R'A'AR) = ||ЛД||с2ф = 2 2 = tr(ARR'A') =tr(AA') = \\А'\\2сф = \\А\\2сф. 13*
196 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ вид Тц (<р) = — simp simp COSif О 1 F.31) В целом метод вращении состоит в построении последовательности матриц A,AUA2, ...,AV,AV + 1, ..., F.32) каждая последующая из которых получается из предыдущей при по- помощи элементарного шага вида Av +1 = ТцАуТц. Если для упрощения записи опустить индекс v и рассмотреть один такой шаг А = ТцАТц, осуществляемый с помощью матрицы F.31), то для элементов ац преобразованной матрицы А мы получим следу- следующие выражения через элементы ац матрицы А: аы = aki при кфг, j, I ф i, j; аи = аи cosip + a^ sin(p при / ф г, j; aji = — ац шар + aji cos(p при I ф г, j; а,ц = ац cos(p + aij simp при I ф г, j; ац = — ац 8in(p + ац costp при I ф г, j; ац = (ац cos ср + aji sin cp) cos cp + (ац cos ср + ajj sin cp) sin cp; aji = (— ац sin cp + а^ cos у?) cos cp + (— a^- sin у? + a^j cos cp) sin у?; ajj = — (— ац sin у? + aji cos ф) sin у? + (— ац sin у? + ajj cos y?) cos (p; ац = — (а^г cos ip + aji sin y?) sin cp + (a^- cos cp + ajj sin y?) cos ср. F.33) Из соотношений F.33) и из условия симметричности матрицы А вытекает следующее легко проверяемое равенство: п п п п -j аы - 2аЬ кф1 кф1 F.34)
§ 2. МЕТОД ВРАЩЕНИЙ 197 Из этого равенства вытекает, что для максимального уменьшения суммы квадратов всех внедиагональных элементов необходимо матри- матрицу F.31) выбрать так, чтобы были выполнены два требования: 1) номера г и j выбрать так, чтобы квадрат элемента а^-, был наи- наибольшим среди квадратов всех недиагональных элементов матрицы А, т. е. выбор номеров г и j подчинить условию а2, = max a?,; кф1 2) угол поворота ср в матрице F.31) выбрать так, чтобы было спра- справедливо равенство (ctjj - an)sin2(p + 2ctij cos2(p = 0. F.35) Равенство F.35) однозначно определяет угол <р, удовлетворяющий условиям ^^, |^Kj. F.36) Это равенство позволяет вычислять cos ip и sin ip по формулам 1/2 1/2 simp = sgnp< - 1 - A + р1)-1 [ 2 L где р = 2aij/(aa - ctjj). Заметим, что если матрица F.31) выбрана так, что выполнены ука- указанные выше требования 1) и 2), то равенство F.34) переходит в сле- следующее соотношение: п п п п х х ~ 2 х х 2 о 2 /л Qrt\ у у ак1 = у у aki — Za^, (b.o7j кф\ кф1 в котором ctij представляет собой наибольший по модулю внедиаго- нальный элемент матрицы. Теперь мы можем более точно сказать, что метод вращений состоит в построении последовательности матриц F.32), каждая последующая из которых получается из предыдущей посредством ортогонального преобразования Av +1 = Тц • Av • Тц, в котором матрица Тц — Тц (ф)
198 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ выбирается так, чтобы были выполнены указанные выше два требова- требования 15). Докажем сходимость метода вращений. Обозначим символом Sy сумму квадратов всех внедиагональных элементов матрицы Av, а сим- символом o!fjiv наибольший по модулю внедиагональный элемент этой матрицы. Тогда в силу F.37) справедливо равенство . F.38) Далее, поскольку общее число внедиагональных элементов матри- матрицы Av равно п(п — 1), a o!fjiv —наибольший по модулю из этих эле- элементов, то справедливо неравенство F.39) n(n - 1) Из F.38) и F.39) вытекает неравенство ] F.40) Последовательно используя неравенство F.40), записанное для номе- номеров 0, 1, ..., v, и обозначая через Sq = Sq (А) сумму квадратов всех внедиагональных элементов основной матрицы А, мы получим, что Из неравенства F.41) сразу же следует, что lim^^oo S^+1 = 0, что и доказывает сходимость метода вращений. В качестве приближенных значений собственных чисел матрицы А берутся диагональные элементы матрицы Av, а в качестве прибли- приближенных собственных векторов матрицы А берутся столбцы матри- ЦыТ;1Л xTi2h...Tivjv. Более точные результаты получены В.В. Воеводиным 16). Для слу- случая, когда произвольная (не обязательно симметричная) матрица А 15) Номера г и j на каждом шаге выбираются такими, чтобы наибольшим по модулю являлся внедиагональный элемент матрицы Av с этими номерами. 16) Воеводин В.В. Численные методы алгебры. Теория и алгорифмы. — М.: На- Наука, 1966.
i 2. МЕТОД ВРАЩЕНИЙ 199 не имеет жордановых клеток и все ее внедиагональные элементы яв- являются величинами порядка е и малы по сравнению с числом р = — Aj|, В.В. Воеводин получил следующие оценки: а) для собственных значений оценку А^ = а а &И 0>г> + О (г3) (из указанной суммы исключаются значения р, принадлежа- принадлежащие множеству Ri тех чисел j = 1, 2, ..., п, для которых Xj = A«); б) если Т — матрица, столбцы которой являются собственными век- векторами матрицы Т и Т = Е + Н, где .Е-единичная матрица, то для элементов Ъц матрицы Н справедливы оценки О, если Xi = аЗЗ ~ + О (г2), если А^ ф Х3-. Если А — комплексная эрмитова матрица, то вместо матри- матрицы F.31) следует взять унитарную матрицу О (<р, ф) = COS if 1 sm ере simpe coscp При этом вместо равенства F.34) мы придем к равенству F.42) кф\ в котором через а обозначен аргумент комплексного числа а^-.
200 ГЛ. 6. ИТЕРАЦИОННЫЕ МЕТОДЫ Для максимального уменьшения суммы квадратов модулей внедиа- гональных элементов следует у матрицы F.42) выбрать такие номера г и j, чтобы элемент ац был наибольшим по модулю внедиагональным элементом матрицы А, а выбор углов (риф подчинить условию |aij|(cos2 (р • ега — sin2 ср • е1^ ~ а"> + (ctjj — пц) cos(psm(pe1^) = 0. Последнее условие приводит к соотношениям , + 0 *Ы , | ,ъ ф = arga^j, tg2cp = , \(р\ ^ —. an - ctjj 4 Доказательство сходимости метода вращений проводится точно так же, как и для случая вещественной матрицы.
ГЛАВА 7 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ В этой главе изучаются билинейные формы, определенные в веще- вещественном линейном пространстве, т. е. числовые функции двух вектор- векторных аргументов, линейные по каждому из этих аргументов. Подробно исследуются так называемые квадратичные формы, представляющие собой билинейпыг формы, определенные для совпадающих значений их аргументов. Рассматриваются также некоторые приложения теории билинейных и квадратичных форм. § 1. Билинейные формы 1. Понятие билинейной формы. Понятие билинейной формы в произвольном линейном пространстве было введено нами ранее в гл. 5. Однако для удобства изложения в этом пункте мы напомним некоторые определения и простейшие утверждения. Определение 1. Числовая функция А (х, у), аргументами кото- которой являются всевозможные векторы х и у вещественного линейного пространства L, называется билинейной формой, если для любых век- векторов х, у и z из L и любого вещественного числа Л выполняются следующие соотношения: А(х + z, у) = A (ic, у) + A(z, у), А (х, у + z) = А (х, у) + А (х, z), ( , А (Ах, у) = АА(х, у), [(Л) А(х, Ау) = АА(х, у). Иными словами, билинейная форма представляет собой числовую функцию А (х, у) двух векторных аргументов х и у, определенную на всевозможных векторах х и у вещественного линейного простран- пространства L и линейную по каждому из этих аргументов х). Простейшим примером билинейной формы может служить произ- произведение двух линейных форм / (х) и g (у), определенных на векторах х 1) При этом часто говорят, что билинейная форма А (х, у) задана на линейном пространстве L.
202 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ и у линейного пространства L. Определение 2. Билинейная форма А (х, у) называется симмет- симметричной (кососимметричной), если для любых векторов х и у линей- линейного пространства L выполняются соотношения А (х, у) = А (у, х) (А (х, у) = - А (у, х)). G.2) Справедливо следующее утверждение: любую билинейную форму можно представить в виде суммы симметричной и ко со симметрич- симметричной билинейных форм (см. п. 1 § 9 гл. 5). 2. Представление билинейной формы в конечномерном ли- линейном пространстве. Пусть в n-мерном линейном пространстве L задана билинейная форма В (х, у). Выясним вопрос о представлении формы В (х, у) в случае, когда в L задан определенный базис е = = (еь е2, ..., еп). Справедливо следующее утверждение. Теорема 7.1. Билинейная форма В (х, у) при заданном в п-мер- ном линейном пространстве L базисе е = (ei, в2, ..., еп) может быть однозначно представлена в следующем виде: В(х,у) = где bij = В (еи ej), G.4) а & и r]j — координаты в базисе е векторов х и у соответственно. Доказательство. Пусть х = ^Г=1^е* и У = ^7j = ir1jej ~ разложение векторов х и у по базису е. Так как форма В (х, у) линей- линейна по каждому из аргументов х и у (см. G.1)), то ( г, j = 1 Таким образом, для формы В (х, у) справедливо представле- представление G.3) с выражениями G.4) для коэффициентов Ьц. Чтобы доказать однозначность этого представления, предположим, что для В (х, у) справедливо представление G.3) с некоторыми коэф- коэффициентами Ь^. Беря в G.3) х = е^, у = е- мы сразу же получим выражения G.4) для коэффициентов Ьц. Теорема доказана.
§ 1. БИЛИНЕЙНЫЕ ФОРМЫ 203 Определение. Матрица Ьц Ь12 ... Ь1п \ В(е) = Ьп1 ЪП2 ... Ьт G.5) элементы Ьц которой определены с помощью соотношений G.4), назы- называется матрицей билинейной формы В (х, у) в данном базисе е. Замечание 1. Обратимся к вопросу о построении всех билиней- билинейных форм в данном конечномерном вещественном пространстве L. Ответ на этот вопрос следующий: любая квадратная матрица (Ьц) является в данном базисе е = (ei, в2, ..., еп) матрицей некоторой билинейной формы. Убедимся в справедливости этого утверждения. Определим в линейном пространстве L с данным базисом е = = (ei, в2, ..., еп) с помощью матрицы (Ьц) числовую функ- функцию В (х, у) двух векторных аргументов х = ЕГ= i ^e* и У = = Ej=i%ej вида Б (х, у) = E™j = i^j&%- Легко видеть, что эта функция удовлетворяет всем условиям опре- определения билинейной формы. Но тогда, согласно теореме 7.1, элемен- элементы bij заданной матрицы равны В (е^, е^), а написанная выше формула есть представление этой формы в виде G.3). Согласно сделанному замечанию естественно называть представле- представление G.3) билинейной формы В (х, у) общим видом билинейной формы в п-мерном линейном пространстве. Замечание 2. Если В (х, у) — симметричная (кососиммет- ричная) билинейная форма, то матрица G.5) этой формы в базисе е является симметричной (кососимметричной). Справедливо и обрат- обратное—если матрица G.5) билинейной формы В (х, у) симметрична (кососимметрична), то и билинейная форма является симметричной (кососимметричной). Убедимся в справедливости этого замечания. Пусть В (х, у) — симметричная (кососимметричная) билинейная форма. Полагая в соотношениях G.2) х = е^, у = е^ получим, соглас- согласно G.4), bij = bji, (Ьц = -bji), G.6) т. е. матрица G.5) является симметричной (кососимметричной). Пусть теперь матрица G.5) билинейной формы В (х, у) симмет- симметрична (кососимметрична), т. е. ее элементы удовлетворяют соотно- соотношениям G.6). Тогда из соотношения G.3) и соотношения В (х, у) = = Yllj = ibij^iVj, следует, что В (х, у) = Я(у,х), (В (х, у) =
204 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ = — В (у, х)), т. е. форма В (х, у) является симметричной (кососим- метричной). 3. Преобразование матрицы билинейной формы при пере- переходе к новому базису. Ранг билинейной формы. Рассмотрим в линейном пространстве L два базиса: е = (ei, е2, ..., еп) и / = = (fb f2, ..., fn). Пусть А(е) = (aij) и4(/) = (hj) — матрицы дан- данной билинейной формы в указанных базисах. Выясним вопрос о связи этих матриц, т. е. выясним вопрос о пре- преобразовании матрицы aij билинейной формы при переходе от базиса е к новому базису /. Справедливо следующее утверждение. Теорема 7.2. Матрицы А(е) и A(f) билинейной формы А (х, у) в базисах е = (ei, е2, ..., еп) и / = (fi, f2, ..., fn) связаны соотно- соотношением A(f)=C'A(e)C, G.7) где С = (cpq) — матрица перехода от базиса е к базису /, а С — транспонированная матрица С. Доказательство. Элементы fq нового базиса / выражаются че- через элементы ер старого базиса е с помощью матрицы С = (cpq) по формулам р = 1 Так как bik = -4(f/, ffc), то, согласно G.8), получим k. G.9) Напомним, что элементы с'и транспонированной матрицы С связаны с элементами сц матрицы С соотношениями сц = с'^. Подставляя эти соотношения в правую часть G.9), получим для bik следующее выражение: Сумма ^^iCtijCjk (по определению произведения матриц) пред- представляет собой элемент матрицы А (е) С. Отсюда следует, что выраже- выражение в правой части G.10) является элементом матрицы С1 А{е) С. Но
§ 2. КВАДРАТИЧНЫЕ ФОРМЫ 205 в левой части G.10) стоит элемент матрицы A(f). Поэтому А (/) = = С А (е) С. Теорема доказана. Следствие. Ранг матрицы А (/) равен рангу матрицы А (е). Это сразу вытекает из соотношения G.7), из того, что матрица С и, стало быть, матрица С являются невырожденными, и из теоремы о том, что ранг матрицы не изменяется при умножении ее на невыро- невырожденную матрицу. Это следствие позволяет ввести важный числовой инвариант били- билинейной формы — так называемый ранг билинейной формы. Определение 1. Рангом билинейной формы, заданной в конеч- конечномерном линейном пространстве L, называется ранг матрицы этой формы в произвольном базисе пространства L. Определение 2. Билинейная форма А (х, у), заданная в конечно- конечномерном линейном пространстве L, называется невырожденной {выро- {вырожденной) , если ее ранг равен (меньше) размерности пространства L. § 2. Квадратичные формы Пусть А (х, у) — симметричная билинейная форма, заданная на ли- линейном пространстве L. Определение 1. Квадратичной формой называется числовая функция А (х, х) одного векторного аргумента х, которая получается из билинейной формы А (х, у) при х = у. Симметричная билинейная форма А (х, у) называется полярной к квадратичной форме А (х, х). Полярная билинейная форма А (х, у) и квадратичная форма А (х, х) связаны следующим соотношением: А(х, у) = -[А(х + у, х + у) - А(х, х) - А (у, у)], которое вытекает из очевидного равенства А (х + у, х + у) = А (х, х) + А (х, у) + А (у, х) + А (у, у) и свойства симметрии формы А (х, у). Пусть в конечномерном линейном пространстве L задана симмет- симметричная билинейная форма А (х, у), полярная к квадратичной фор- форме А (х, х). Пусть, кроме того, в L указан базис е = (ei, в2, ..., еп). Согласно теореме 7.1 форму А (х, у) можно представить в ви- виде G.3) п А (к, у) = Y, "irtib, G-3) г, 3 = 1
206 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ где & и T]j —координаты в базисе е векторов х и у соответственно. При этом, в силу симметрии А (х, у), CLij = CLji G.11) (см. замечание 2 п. 2 предыдущего параграфа). Полагая в G.3) х = у (т. е. r]j = ?j), мы получим следующее пред- представление для квадратичной формы А (х, х) в конечномерном про- пространстве L с заданным базисом е: Матрица а^ называется, матрицей квадратичной формы А (х, х) в заданном базисе е. Согласно G.11) матрица (а^) является симметричной. Очевидно, каждой симметричной матрице (а^) отвечает с помощью соотношения G.12) квадратичная форма А (х, х), причем G.12) будет представле- представлением А (х, х) в пространстве L с заданным базисом е (см. также заме- замечание 3 п. 2 предыдущего параграфа). Отметим, что матрица квадратичной формы при переходе к новому базису преобразуется по формуле G.7). Поэтому ранг этой матрицы не меняется при переходе к новому базису. Обычно ранг матрицы квадратичной формы А (х, х) называется рангом квадратичной формы. Если ранг матрицы квадратичной формы равен размерности про- пространства L, то форма называется невырожденной, а в противном слу- случае — вырожденной. В дальнейшем мы будем использовать следующую терминологию. Определение 2. Квадратичная форма А (х, х) называется: 1) положительно {отрицательно) определенной, если для любого ненулевого х выполняется неравенство А (х, х) > 0 (А (х, х) < 0) (такие формы называются также знакоопределейными)] 2)знакопеременной, если существуют такие х и у, что А(х, х) >0, А (у, у) <0; 3) квазизнакоопределенной, если для всех х А (х, х) ^ 0 или А (х, х) ^ 0,
§ 3. ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ 207 но имеется отличный от нуля вектор х, для которого А(х, х) = 0. В дальнейшем мы укажем признаки, по которым можно судить о принадлежности формы А (х, х) к одному из указанных типов. Отметим следующее важное утверждение. Если А (х, у) представляет собой билинейную форму, поляр- полярную положительно определенной квадратичной форме А (х, х), то А (х, у) удовлетворяет всем аксиомам скалярного произведения век- векторов в евклидовом пространстве. Обратимся к четырем аксиомам скалярного произведения (см. п. 1 §1 гл.4). Если число, называемое скалярным произведением векторов х и у, обозначить символом А(х, у), то эти аксиомы запишутся следующим образом: 1°) А(х, у) = А(у,х). 2°) А(х + z, у) = А(х, у) + A(z, у). 3°) А (Ах, у) = АА(х, у). 4°) i(x,x)Hni (х, х) > 0 при х ф 0. Так как билинейная форма А (х, у), полярная квадратичной фор- форме А (х, х) симметрична, то аксиома 1°) выполняется. Аксиомы 2°) и 3°) в сочетании с требованием симметрии выполнены в силу определе- определения билинейной формы (см. п. 1 § 1 этой главы). Аксиома 4°) выполня- выполняется, так как квадратичная форма А (х, х) положительно определена. Замечание. Очевидно, аксиомы скалярного произведения мож- можно рассматривать как совокупность требований, определяющих били- билинейную форму, полярную положительно положительно определенной квадратичной форме. Поэтому скалярное произведение в линейных пространствах может быть задано с помощью такого вида билинейной формы. § 3. Приведение квадратичной формы к сумме квадратов В этом параграфе указаны различные методы приведения квадра- квадратичной формы к сумме квадратов, т. е. будут указаны методы выбора такого базиса / = (f\, f2, ..., fn) в линейном пространстве L, по отно- отношению к которому квадратичная форма представляется в следующем каноническом виде: А(х, х) = Air;? + \27}1 + ... + Ап^, G.13) G71, Ш, • • •, rjn) —координаты х в базисе /.
208 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ Коэффициенты (Ai, A2, ..., Ап) в выражении G.13) называются ка- каноническими коэффициентами. Подчеркнем, что мы рассматриваем квадратичные формы в про- произвольном вещественном линейном пространстве. В § б будут изучены квадратичные формы в евклидовом пространстве и будет доказана возможность приведения каждой квадратичной формы к канониче- каноническому виду даже в ортонормированном базисе. Исходя из результатов гл. 5 в том же § б настоящей главы будет получено новое доказа- доказательство теоремы о приведении квадратичной формы к каноническо- каноническому виду в произвольном (не обязательно евклидовом) вещественном линейном пространстве. Настоящий же параграф посвящен не только доказательству воз- возможности приведения квадратичной формы к каноническому виду, но и описанию двух методов такого приведения, имеющих большую прак- практическую ценность и широко встречающихся в приложениях. Так как каждому преобразованию базиса отвечает невырожденное линейное преобразование координат, а невырожденному преобразова- преобразованию координат — преобразование базиса, то вопрос о приведении фор- формы к каноническому виду можно решать путем выбора соответствую- соответствующего невырожденного преобразования координат. 1. Метод Лагранжа. Докажем следующую теорему. Теорема 7.3. Любая квадратичная форма А(х, х), заданная в п-мерном линейном пространстве L, с помощью невырожденного ли- линейного преобразования координат может быть приведена к канони- каноническому виду G.13). Доказательство. Проведем доказательство теоремы методом Лагранжа. Основная идея этого метода заключается в последователь- последовательном дополнении квадратного трехчлена по каждому аргументу до пол- полного квадрата. Будем считать, что А (х, х) ф 0 2) ив данном базисе е = = (еь е2, ..., еп) имеет вид А(х,х) = V Oijtej. G.14) Убедимся, во-первых, что с помощью невырожденного преобразо- преобразования координат форму А (х, х) можно преобразовать так, что коэф- коэффициент при квадрате первой координаты вектора х будет отличен от нуля. 2) Если форма А (х, х) = 0, то ее матрица в любом базисе состоит из нулевых элементов, и поэтому такая форма по определению имеет канонический вид.
§ 3. ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ 209 Если в данном базисе этот коэффициент отличен от нуля, то нуж- нужное невырожденное преобразование является тождественным. В случае, если ац = 0, но отличен от нуля коэффициент при квад- квадрате какой-либо другой координаты, то с помощью перенумерации ба- базисных векторов можно добиться требуемого результата. Ясно, что перенумерация является невырожденным преобразованием. Если же все коэффициенты при квадратах координат равны ну- нулю, то нужное преобразование можно получить следующим способом. Пусть, например, a\i ф 0 3). Рассмотрим следующее невырожденное преобразование координат 4): ? = 6 - &, ? = & + &> 3 = &, г = 3, 4, ..., п. После этого преобразования коэффициент при ?| будет равен 2а±2 и поэтому отличен от нуля. Итак, будем считать, что в соотношении G.14) ац ф 0. Выделим в выражении G.14) ту группу слагаемых, которые содержат ?]_. Получим (х, х) = апЙ + 2ai2fi& + ... + 2aln^n + ^ аф?5. G.15) Преобразуем выделенную группу слагаемых следующим образом: \2 + &— + ... +^п— - «и «и/ ?2 ?п an an an Очевидно, выражение G.15) можно теперь переписать так А(к, х) = an (V + 6^ + ••• +&^) + Е a*i^i' GЛ6) где a*j — коэффициенты при &?j? полученные после преобразования. Рассмотрим следующее невырожденное преобразование координат: *71 = fl + "^6 + • • • + ^^^п, 772 = 6, • • ., ^Уп = ^п- ац ац 3) Напомним, что А (х, х) ф 0, и поэтому хотя бы один коэффициент a^j отличен от нуля. 4) Определитель матрицы этого преобразования равен 2, и поэтому это пре- преобразование невырожденное. 14 В.А. Ильин, Э.Г. Позняк
210 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ С помощью этого преобразования и представления G.1) для А(х, х) получим п А(х, х) = Итак, если форма А (х, х) ф 0, то с помощью невырожденного преобразования координат эту форму можно привести к виду G.17). Обратимся теперь к квадратичной форме Х]Г j = 2 ^jViVj- Если эта форма тождественно равна нулю, то вопрос о приведении А (х, х) к каноническому виду решен. Если же форма J^ j = 2aijr1i1lj Ф 0> т0 мы можем повторить рассуждения, рассматривая преобразования ко- координат 77i, ..., ЦП-, аналогичные описанным выше, и не меняя при этом координату 771. Очевидно, такого типа преобразования коорди- координат 77i, 772, • •., rjn будут невырожденными. Ясно, что за конечное число шагов мы приведем квадратичную форму А (х, х) к каноническому виду G.13). Отметим, что нужное преобразование исходных коорди- координат ?i, ?2 ? • • • •> ?п можно получить путем перемножения найденных в процессе рассуждений невырожденных преобразований. Теорема доказана. Замечание 1. Базис, в котором квадратичная форма имеет кано- канонический вид, называется каноническим. Отметим, что канонический базис определен неоднозначно. Замечание 2. Если форма А (х, х) приведена к каноническому виду G.13), то, вообще говоря, не все канонические коэффициенты А^ отличны от нуля. Оставляя в G.13) лишь отличные от нуля А« и пере- перенумеровывая их заново, получим следующее выражение для А (х, х): А(х, х) = Ai77? + А277| + ... + ХкгЦ. G.18) Ясно, что k ^ п. Так как ранг квадратичной формы по определе- определению равен рангу ее матрицы в любом базисе, то из G.18) и условия Xi ф 0 при г = 1, 2, ..., & вытекает, что ранг формы равен к. Та- Таким образом, число отличных от нуля канонических коэффициентов равно рангу квадратичной формы. 2. Метод Якоби. При некоторых дополнительных предположе- предположениях о квадратичной форме А (х, х) можно указать явные формулы перехода от данного базиса е = (ei, в2, ..., еп) к каноническому ба- базису / = (fi, f2, ..., fn) и формулы для канонических коэффициен- коэффициентов Xi. Предварительно мы введем понятие треугольного преобразования базисных векторов.
§ 3. ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ 211 Преобразование базисных векторов ei, в2, ..., еп называется тре- треугольным, если оно имеет следующий вид: fi = еь f2 = a2ie1 + е2, f3 = a3iei + а32е2 + е3, G.19) fn = Замечание. Так как определитель матрицы треугольного преоб- преобразования G.19) отличен от нуля (равен 1), то векторы f\, f2, ..., fn образуют базис. Введем в рассмотрение угловые миноры матрицы А (е) = (а^) коэффициентов формы А (х, х) в базисе е, обозначив их символа- символами Ль Л2, ..., Ап_ь = аи, А2 = аи ап_ i5i ... ап_ . G.20) Справедливо следующее утверждение. Теорема 7.4. Пусть миноры Ai, A2, ..., Ап матрицы (а^) квадратичной формы А (х, х) отличны от нуля. Тогда суще- существует единственное треугольное преобразование базисных век- векторов ei, в2, ..., еп, с помощью которого форму А (х, х) можно привести к каноническому виду. Доказательство. Напомним, что коэффициенты ^ фор- формы А (х, х) в базисе f\, f2, ..., fn вычисляются по формулам ^ = = А(Ь,%). Если форма А (х, х) в базисе f\, f2, ..., fn имеет канонический вид, то bij = 0 при i ф j. Поэтому для доказательства теоремы достаточ- достаточно построить с помощью треугольного преобразования G.19) такой базис fi, f2, ..., fn, в котором будут выполняться соотношения A (f^, fj) = 0 при i ф j, или, что то же, при г < j G.21) (при этом, конечно, надо убедиться, что искомое преобразование един- единственно). Если обратиться к формулам G.19) для ff, то, используя линейное свойство квадратичной формы А (х, х) по каждому аргументу, легко 14*
212 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ заметить, что соотношения G.21) будут выполнены, если будут выпол- выполнены соотношения 5) A(ebfj) = 0, A(e2,fj) = 0, ..., А(е,_ьГ,-) = 0, G.22) j = 2,3, ...,п. Запишем формулы G.22) в развернутом виде. Для этого подставим в левые части этих формул выражение fj = адех + aj2e2 + ... + oijj-iej-! + е^ G.23) для fj из соотношений G.19). Используя далее свойство линейности А (х, х) по каждому аргументу и обозначение А(е^, ej) = а^, полу- получим в результате следующую линейную систему уравнений для неиз- неизвестных коэффициентов ctjk'. + aj2ai2 + ... + ajj -iclij _i + aij = 0, -1,1 + «j'2%-1,2 + ... + OLjj-iCLj-ij-i + 0>j-l,j = 0. G.24) Определитель этой системы равен Aj_i. По условию Aj-i 7^ 0- Следовательно, система G.24) имеет единственное решение. Таким об- образом, можно построить единственное треугольное преобразование ба- базисных векторов, с помощью которого форма А (х, х) приводится к каноническому виду. Теорема доказана. Приведем формулы, по которым можно вычислить коэффициен- коэффициенты а^ искомого треугольного преобразования, и формулы для кано- канонических коэффициентов Xj. Обозначим символом Aj_i5j минор матрицы (сь^-), расположен- расположенный на пересечении строк этой матрицы с номерами 1, 2, ..., j — 1 и столбцов с номерами 1,2, ...,г — 1,г + 1, ...,j. Тогда, обращаясь к системе G.24) и используя формулы Крамера, получим следующее выражение для ац: G-25) Займемся вычислением канонических коэффициентов Xj. Так как Xj = bjj = A(fj, fj), то из выражения G.23) для fj и 5) Нетрудно убедиться, что из соотношений G.21) следуют соотношения G.22).
§ 4. ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ 213 формул G.22) получаем \j = A(fj, fj) = A(ajle1 + aj2e2 + ... + ajij-1ej-1 + e,, fj) = аз^2 + ... + ajij-1ej-1 + e,) = + aj2a2j + ... + OLjj-iCLj-ij + CLjj. Подставляя выражение G.25) для <х^ в правую часть последнего со- соотношения, найдем А,- = ((- " Числитель последнего соотношения представляет собой сумму про- произведений элементов строки с номером j в определителе Aj на ал- алгебраические дополнения этих элементов в указанном определителе. Следовательно, этот числитель равен Aj. Поэтому А,- = -^-, j = 2,3,..., п. G.26) Так как А1 = A(fi, fi) = A(ei, ei) = ац = Ai, то отсюда и из G.26) получаем следующие формулы для канонических коэффициентов: Ai = Ai, A2 = ^, ..., An = -^-. G.27) § 4. Закон инерции квадратичных форм. Классификация квадратичных форм 1. Закон инерции квадратичных форм. Мы уже отмечали (см. замечание 2 п. 1 предыдущего параграфа), что ранг квадратичной формы равен числу отличных от нуля канонических коэффициентов. Таким образом, число отличных от нуля канонических коэффициен- коэффициентов не зависит от выбора невырожденного преобразования, с помощью которого форма А (х, х) приводится к каноническому виду. На самом деле при любом способе приведения формы А (х, х) к каноническо- каноническому виду не меняется число положительных и отрицательных кано- канонических коэффициентов. Это свойство называется законом инерции квадратичных форм. Прежде чем перейти к обоснованию закона инерции, сделаем неко- некоторые замечания.
214 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ Пусть форма А (х, х) в базисе е = (ei, е2, ..., еп) определяется матрицей А (е) = (а^-): где ?i, ?2, • • -5 ?,п — координаты вектора х в базисе е. Допустим, что эта форма с помощью невырожденного преобразования координат приве- приведена к каноническому виду А(х, х) = Ai/x? + A2/i2 + ... + А*/^, G-29) причем Ai, A2, ..., А/, —отличные от нуля канонические коэффициен- коэффициенты, занумерованные так, что первые q из этих коэффициентов поло- положительные, а следующие коэффициенты — отрицательные: Ai > О, А2 > 0, ..., Xq > 0, Ag + i < 0, ..., Хк < 0. Рассмотрим следующее невырожденное преобразование коорди- координат fii 6): 1 G.30) В результате этого преобразования форма А (х, х) примет вид Ц 2 \ Ц ... - nl G.31) называемый нормальным видом квадратичной формы. Итак, с помощью некоторого невырожденного преобразования ко- координат ?]_, ?2? • • .5 ?п вектора х в базисе е = (ei, e2, ..., en) ^i = «iifi + ай6 + ... + «in?n, G.32) г = 1, 2, ...,n, det(ay) 7^ 0 (это преобразование представляет собой произведение преобразований ^в//и//вг/по формулам G.30)) квадратичная форма может быть приведена к нормальному виду G.31). 6) Легко видеть, что определитель этого преобразования отличен от нуля.
§ 4. ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ 215 Докажем следующее утверждение. Теорема 7.5 (закон инерции квадратичных форм). Число сла- слагаемых с положительными (отрицательными) коэффициентами в нормальном виде квадратичной формы не зависит от способа приведения формы к этому виду. Доказательство. Пусть форма А (х, х) с помощью невыро- невырожденного преобразования координат G.32) приведена к нормально- нормальному виду G.31) и с помощью другого невырожденного преобразования координат приведена к нормальному виду Л(х, х) = (I + С! + ¦¦¦ + (р - Cp + i ----- С*- G-33) Очевидно, для доказательства теоремы достаточно убедиться в справедливости равенства р = q. Пусть р > q. Убедимся, что в этом случае имеется ненулевой век- вектор х такой, что по отношению к базисам, в которых форма А (х, х) имеет вид G.31) и G.33), координаты 771, 772, ..., rjq и (p + i, • • •? Сп этого вектора равны нулю: ГЦ = 0, /72 = 0, ..., щ = 0, Ср + 1 = 0, ..., (п = 0. G.34) Так как координаты 77i получены путем невырожденного преоб- преобразования G.32) координат ?]_,..., ?п, а координаты (г~с помо- помощью аналогичного невырожденного преобразования этих же ко- координат ?]_, ..., ?п, то соотношения G.34) можно рассматривать как систему линейных однородных уравнений относительно коорди- координат ?]_, ..., ?п искомого вектора х в базисе е = (ei, в2, ..., еп) (напри- (например, в развернутом виде соотношение 771 = 0 имеет, согласно G.32), вид an?i + «12^2 + • • • + «ln^n = 0)- Так как р > q, то число од- однородных уравнений G.34) меньше п, и поэтому система G.34) имеет ненулевое решение относительно координат ?]_, ..., ?п искомого векто- вектора х. Следовательно, если р > q, то существует ненулевой вектор х, для которого выполняются соотношения G.34). Подсчитаем значение формы А (х, х) для этого вектора х. Обра- Обращаясь к соотношениям G.31) и G.33), получим л(х,х) = -ц\+1 - ... -4 = cl + с! + --- + (I Последнее равенство может иметь место лишь в случае 77g +1 = ... ... = 77*; = 0 и d = B = • • • = Ср = 0- Таким образом, в некотором базисе все координаты (д, ^, • • • ? Сп ненулевого вектора х равны нулю (см. последние равенства и соотношения G.34)), т. е. вектор х равен нулю. Следовательно, предположение р > q ведет к противоречию.
216 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ По аналогичным соображениям ведет к противоречию и предположе- предположение р < q. Итак, р = q. Теорема доказана. 2. Классификация квадратичных форм. В п. 1 § 2 этой главы (см. определение 2) были введены понятия положительно определен- определенной, отрицательно определенной, знакопеременной и квазизнакоопре- деленной квадратичных форм. В этом пункте с помощью понятий индекса инерции, положитель- положительного и отрицательного индексов инерции квадрата формы мы ука- укажем, каким образом можно выяснить принадлежность квадратичной формы к тому или иному из перечисленных выше типов. При этом индексом инерции квадратичной формы будем называть число отлич- отличных от нуля канонических коэффициентов этой формы (т. е. ее ранг), положительным индексом инерции — число положительных канони- канонических коэффициетов, отрицательным индексом инерции — число от- отрицательных канонических коэффициентов. Ясно, что сумма положи- положительного и отрицательного индексов инерции равна индексу инерции. Итак, пусть индекс инерции, положительный и отрицательный ин- индексы инерции квадратичной формы А (х, х) соответственно равны /с, р и q (к = р + q). В предыдущем пункте было доказано, что в лю- любом каноническом базисе / = (fi, f2, ..., fn) эта форма может быть приведена к следующему нормальному виду: \ \ 1 Ц ... - 4, G.35) где 77i, 7725 • • •? Vn — координаты вектора х в базисе /. 1°) Необходимое и достаточное условие знакоопределенности квадратичной формы. Справедливо следующее утверждение. Для того чтобы квадратичная форма А (х, х), заданная в п-мерном линейном пространстве L, была знакоопределеннощ необ- необходимо и достаточно, чтобы либо положительный индекс инерции р, либо отрицательный индекс инерции q был равен размерности п про- пространства L. При этом, если р = п, то форма положительно определенная, если же q = n, то форма отрицательно определенная. Доказательство. Так как случаи положительно определенной формы и отрицательно определенной формы рассматриваются ана- аналогично, то доказательство утверждения проведем для положительно определенных форм. 1) Необходимость. Пусть форма А (х, х) положительно опре-
§ 4. ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ 217 делена. Тогда выражение G.35) примет вид А(х, х) = rft +г]1 + ... + ц\. Если при этом р < п, то из последнего выражения следует, что для ненулевого вектора х с координатами Vi = 0, щ = 0, ..., т]р = 0, т]р + 1 ф О, ..., цп ф О форма А (х, х) обращается в нуль, а это противоречит определению положительно определенной квадратичной формы. Следовательно, р = п. 2) Достаточность. Пусть р = п. Тогда соотношение G.35) име- имеет вид А (х, х) = rji + г}% + ... + rjp. Ясно, что А (х, х) ^ 0, причем, если А = 0 , то щ = щ = ... = т)п = 0, т. е. вектор х нулевой. Следовательно, А (х, х) — положительно определенная форма. Замечание. Для выяснения вопроса о знакоопределенности квадратичной формы с помощью указанного признака мы должны привести эту форму к каноническому виду. В следующем пункте мы докажем критерий Сильвестра знако- знакоопределенности квадратичной формы, с помощью которого можно вы- выяснить вопрос о знакоопределенности формы, заданной в любом базисе без приведения к каноническому виду. 2°) Необходимое и достаточное условие знакопеременности квад- квадратичной формы. Докажем следующее утверждение. Для того чтобы квадратичная форма была знакопеременной, необходимо и достаточно, чтобы как положительный, так и от- отрицательный индексы инерции этой формы были отличны от нуля. Доказательство. 1) Необходимость. Так как знакопере- знакопеременная форма принимает как положительные, так и отрицательные значения, то ее представление G.35) в нормальном виде должно со- содержать как положительные, так и отрицательные слагаемые (в про- противном случае эта форма принимала бы либо неотрицательные, либо неположительные значения). Следовательно, как положительный, так и отрицательный индексы инерции отличны от нуля. 2) Достаточность. Пусть р ф 0 и q ф 0. Тогда для вектора xi, с координатами 771 ф 0, ..., r\v ф 0, % + i = 0, ..., г\п = 0 имеем A(xi, xi) > 0, а для вектора Х2 с координатами 771 = 0, ..., г]р = = 0, г]р + 1 ф 0, ..., ?7п ф 0 имеем А(х2, хг) < 0. Следовательно, форма А (х, х) является знакопеременной. 3°) Необходимое и достаточное условие квазизнакоопределенно- квазизнакоопределенности квадратичной формы.
218 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ Справедливо следующее утверждение. Для того чтобы форма А (х, х) была квазизнакоопределенной, необходимо и достаточно, чтобы выполнялись соотношения: либо р < n, q = 0, либо р = 0, q < п. Доказательство. Мы рассмотрим случай положительно квази- знакоопределенной формы. Случай отрицательно квазизнакоопреде- ленной формы рассматривается аналогично. 1) Необходимость. Пусть форма А (х, х) положительно квази- знакоопределенная. Тогда, очевидно, q = 0 и р < п (если бы р = п, то форма была бы положительно определенной), 2) Достаточность. Если р < п, q = 0, то А (х, х) ^ 0 и для ненулевого вектора х с координатами 771 = 0, щ = 0, ..., r\v — = 0, ^ + i / 0, ...,%/ имеем А (х, х) = 0, т. е. А (х, х) — положительно квазизнакоопределенная форма. 3. Критерий Сильвестра 7) знакоопределенности квадра- квадратичной формы. Пусть форма А (х, х) в базисе е = (ei, в2, ..., еп) определяется матрицей А (е) = (а^): (х> х) = 0*11 An = аи ... air и пусть Ai = аи, А2 = СХ91 СХ99 «nl угловые миноры и определитель матрицы (а^). Справедливо следую- следующее утверждение. Теорема 7.6 (критерий Сильвестра). Для того чтобы квадратич- квадратичная форма А (х, х) была положительно определенной, необходимо и достаточно, чтобы были выполнены неравенства Ai > О, А2 > 0, ... ..., Д„>0. Для того чтобы квадратичная форма была отрицательно опре- определенной, необходимо и достаточно, чтобы знаки угловых миноров чередовались, причем Ai < 0. Доказательство. 1) Необходимость. Докажем сначала, что из условия знакоопределенности квадратичной формы А (х, х) следует Ai ф 0, i = 1, 2, ..., п. Убедимся, что предположение А/, = 0 ведет к противоречию — при этом предположении существует ненулевой вектор х, для которого А (х, х) = 0, что противоречит знакоопределенности формы. 7) Джемс Джозеф Сильвестр A814-1897)—английский математик.
§ 5. ПОЛИЛИНЕЙНЫЕ ФОРМЫ 219 Итак, пусть Д/, = 0. Рассмотрим следующую квадратную одно- однородную систему линейных уравнений: + ai2& + • • • + alk?k = 0, + «226 + . . . = 0. Так как А/,—определитель этой системы и Л/, = 0, то систе- система имеет ненулевое решение ?i, ?2, • • •? ?& (не все ^ равны 0). Умно- Умножим первое из уравнений G.36) на ?i, второе на ^2, • • •? последнее на ?й и сложим полученные соотношения. В результате получим равен- равенство ^2™ j = i0>ij?,i?,j = 0, левая часть которого представляет собой значение квадратичной формы А (х, х) для ненулевого вектора х с координатами (?]_, ?2? • • •? 6г5 05 ..., 0). Это значение равно нулю, что противоречит знакоопределенности формы. Итак, мы убедились, что Д^ ф 0, г = 1,2,..., п. Поэтому мы можем применить метод Якоби приведения формы А (х, х) к сумме квадратов (см. теорему 7.4) и воспользоваться формулами G.27) для канонических коэффициентов Л^. Если А (х, х)—положительно опре- определенная форма, то все канонические коэффициенты положительны. Но тогда из соотношений G.27) следует, что Ai > 0, Л2 > 0, ..., Лп > > 0. Если же А (х, х) —отрицательно определенная форма, то все ка- канонические коэффициенты отрицательны. Но тогда из формул G.27) следует, что знаки угловых миноров чередуются, причем Ai < 0. 2) Достаточность. Пусть выполнены условия, наложенные на угловые миноры А^ в формулировке теоремы. Так как А^ ф 0, г = = 1, 2, ..., п, то форму А можно привести к сумме квадратов методом Якоби (см. теорему 7.4), причем канонические коэффициенты \ могут быть найдены по формулам G.27). Если Ai > 0, А2 > 0, ..., Ап > 0, то из соотношений G.27) следует, что все \ > 0, т. е. форма А (х, х) положительно определенная. Если же знаки А^ чередуются и Ai < 0, то из соотношений G.27) следует, что форма А (х, х) отрицательно определенная. Теорема доказана. § 5. Полилинейные формы Определение. Полилинейной формой A (xi, X2, ..., хр) р вектор- векторных аргументов называется числовая функция, определенная на все- всевозможных векторах xi, X2, ..., хр линейного пространства L и ли- линейная по каждому из аргументов, при фиксированных значениях остальных аргументов.
220 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ Простейшим примером полилинейной формы может служить про- произведение линейных форм A (xi) А (х2)... А (хр). Полилинейная форма A (xi, X2, ..., хр) называется симметричной {кососимметричной), если для каждых двух ее аргументов х& и х/ и для любых значений этих аргументов выполняется соотношение Xjfe, ..., X/, ..., Хр) = А jfe, ..., X/, ..., Хр) = - А Ь ..., X/, ..., Xjfe, ..., Хр) Ь ..., Xfc, ..., X/, ..., Хр)). Пусть полилинейная форма A(xi, X2, ..., хр) задана в конечно- конечномерном линейном пространстве L, и пусть ei, е2, ..., еп —базис в L. Обратимся к разложению каждого вектора х^ по базисным векто- векторам еь е2, ..., еп: * = 1, 2, ..., р. G.37) Подставляя выражения для х^ по формулам G.37) в полилинейную форму A (xi, X2, ..., Хр) и используя свойство линейности этой формы по каждому аргументу, получим А(хь х2, ..., хр) = А 31,32 Л' еЬ--- eip)- G-38) Таким образом, значения полилинейной формы A (xi, х2, ..., хр) в ко- конечномерном пространстве с выделенным базисом ei, e2, ..., еп опре- определяются всевозможными значениями A (eJX, ej2, ..., eJp) этой формы на векторах eJX, ej2, ..., eJp. Докажем следующее утверждение. Теорема 7.7. Любая полилинейная ко со симметричная фор- форма A (xi, х2, ..., хп), заданная в п-мерном линейном пространстве L с выделенным базисом ei, e2, ..., еп, может быть представлена в виде ь х2, ..., xn) = а G.39) где а = А(еь е2, ..., en), a в базисе еь е2, ..., еп. .., ^п) — координаты вектора х.г
§ 6. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 221 Доказательство. Так как форма A (xi, Х2, ..., хп) является ко- сосимметричной, то для произвольной перестановки (ji, 21 •> ..., jn) ин- индексов A, 2, ..., п) имеем A(eh,eh,..., ejn) = (- где N (ji, j2, ..., jn) —число беспорядков в перестановке (ji, J2, • • -, jn)- В силу кососимметричности формы для двух одинаковых индексов jk и 2\ (jk = ji) значение A (ej4, ..., ejh, ..., ejn ..., ejn) равно нулю. Отсюда и из соотношения G.40) следует, что для рассматриваемого случая соотношение G.38) примет вид п A(xi, х2, ..., х„) = a J2 (-l)Nlh'h'"*J")tiht2i2---Snjn. 31,32, ---Jn =1 G.41) Сравнивая формулу G.41) с формулой A.28) гл. 1 для определи- определителя порядка п, мы убедимся в справедливости соотношения G.39). Теорема доказана. § 6. Билинейные и квадратичные формы в евклидовом пространстве В предыдущих параграфах мы изучали билинейные и квадратич- квадратичные формы в произвольном (не обязательно евклидовом) веществен- вещественном линейном пространстве L. В этом параграфе мы получим ряд сведений о билинейных и квадратичных формах, заданных в веще- вещественном евклидовом пространстве. При этом мы будем широко поль- пользоваться результатами § 9 гл. 5, посвященного линейным операторам. В п. 3 настоящего параграфа будет показано, каким образом тео- теория евклидовых пространств может быть применена для получения со- содержательных результатов в произвольных линейных пространствах. В частности, нами будет получено независимое доказательство теоре- теоремы о том, что каждая квадратичная форма в линейном пространстве может быть приведена к каноническому виду. 1. Предварительные замечания. В этом пункте мы напомним некоторые понятия теории линейных операторов. Пусть V — n-мерное вещественное евклидово пространство и А — линейный оператор, действующий из У в У. Оператор А* называется
222 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ сопряженным к А, если для всех х Е V и у Е V выполняется равенство (Ах, у) = (х, А*у). G.42) Оператор А называется самосопряженным, если А = А*, т. е. для всех х е V и у е V (Ах, у) = (х, Ау). G.43) Рассмотрим билинейную форму В (х, у), заданную в евклидовом пространстве V. В гл. 5 было установлено, что каждой такой фор- форме В (х, у) однозначно соответствует линейный оператор такой, что справедливо равенство В(х, у) = (Ах, у). G.44) Кроме того, в теореме 5.33 было доказано, что билинейная фор- форма В (х, у) является симметричной тогда и только тогда, когда опера- оператор А, фигурирующий в G.44), является самосопряженным. Напомним также, что в теореме 5.35 для любого самосопряженного оператора А было доказано существование ортонормированного бази- базиса из собственных векторов. Это означает, что существуют ортонор- мированная система ei, в2, ..., еп и вещественные числа Ai, A2, ..., Ап такие, что Аек = Хкек. G.45) Отметим, что в базисе {ек} матрица оператора А имеет диагональ- диагональный вид. 2. Приведение квадратичной формы к сумме квадратов в ортогональном базисе. Пусть В (х, у) — симметричная билиней- билинейная форма, заданная в вещественном евклидовом пространстве У, а В (х, х) —определяемая ею квадратичная форма. Докажем следующую теорему о приведении квадратичной фор- формы В (х, х) к сумме квадратов. Теорема 7.8. Пусть В (х, у) — симметричная билинейная форма, заданная в евклидовом пространстве V. Тогда в пространстве V су- существует такой ортонор мир о ванный базис {ек} и можно указать такие вещественные числа А/., что для любого х Е V квадратичная форма В (х, х) может быть представлена в виде следующей суммы квадратов координат ?& вектора х в базисе {ек}: п В(х,х) = ?>& G.46)
§ 6. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 223 Доказательство. Так как В (х, у) — симметричная билинейная форма, то существует самосопряженный оператор А такой, что В(х, у) = (Ах, у). G.47) По теореме 5.35 для оператора А можно указать ортонормирован- ный базис {е/,} из собственных векторов этого оператора; пусть А/. — собственные значения, отвечающие е&. Пусть вектор х имеет в базисе е& координаты ?&: п х = ?)&ел. G-48) к = 1 Тогда, очевидно, поскольку е& — собственные векторы оператора А: Ах = Из соотношений G.48) и G.49) вследствие ортонормированности базиса {е/,} получаем следующее выражение для скалярного произве- произведения А (х, х): ? G.50) к = 1 Отсюда и из соотношения G.47) получаем G.46). Теорема доказана. 3. Одновременное приведение двух квадратичных форм к сумме квадратов в линейном пространстве. Докажем теперь важную теорему об одновременном приведении двух квадратичных форм к сумме квадратов в произвольном (не обя- обязательно евклидовом) вещественном линейном пространстве. Теорема 7.9. Пусть А (х, у) и В (х, у) — симметричные били- билинейные формы, определенные в вещественном линейном простран- пространстве V. Допустим далее, что для всех х G V, х ф 0, справедливо неравенство В (х, х) > 0 (т. е. квадратичная форма В (х, х) — положительно определенная). Тогда в пространстве V можно ука- указать базис {е/,} такой, что квадратичные формы А(х, х) и В (х, х) могут быть представлены в виде ? G51) G-52)
224 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ где ^k — координаты вектора х в базисе Доказательство. Согласно замечанию в конце § 2 этой главы скалярное произведение в конечномерном вещественном пространстве может быть задано с помощью билинейной формы В (х, у), полярной к положительно определенной квадратичной форме В (х, х). Поэтому мы можем ввести в линейном пространстве V скалярное произведение (х, у) векторов х и у, полагая (х, у) = ??(х, у). G.53) Таким образом, V представляет собой евклидово пространство со скалярным произведением G.53). По теореме 7.11 можно указать такой ортонормированный базис {е^} и такие вещественные числа А/., что в этом базисе квадратичная форма А (х, х) представляется в виде G.51). С другой стороны, в любом ортонормированном базисе скалярное произведение (х, х), равное, согласно G.53), В (х, х), представляется в виде суммы квадратов координат вектора х. Таким образом, представ- представление В (х, х) в виде G.52) в базисе {е^} также обоснованно. Теорема доказана. Замечание. Из доказанной нами теоремы непосредственно сле- следует, что любую квадратичную форму в произвольном вещественном линейном пространстве можно привести к каноническому виду. Одна- Однако способ такого приведения является, вообще говоря, более сложным, чем способы, изложенные выше в § 3, поскольку он требует нахожде- нахождения всех собственных векторов некоторого самосопряженного опера- оператора (см. по этому поводу гл. 6). 4. Экстремальные свойства квадратичной формы. Рассмот- Рассмотрим произвольную дифференцируемую функцию /, определенную на некоторой гладкой поверхности S (см. определение гладкой поверх- поверхности в гл.5 части 2 «Основ математического анализа»). Будем го- говорить, что точка хо поверхности S является стационарной точкой функции /, если в точке xq производная функции / по любому направ- направлению на поверхности S равна нулю. В частности, точки экстремума функции / являются ее стационарными точками. Значение / (хо) функции / в стационарной точке xq называется стационарным значением. Иногда стационарную точку xq функции / называют ее критической точкой, а величину / (xq) — критическим значением. В этом пункте мы исследуем вопрос о стационарных и, в частности, экстремальных значениях квадратичной формы В (х, х) на сфере единичного радиуса в евклидовом пространстве У и о связи этих значений с собственными значениями самосопряженного операто- оператора А, с помощью которого симметричная билинейная форма В (х, у),
§ 6. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 225 полярная квадратичной форме В (х, х), представляется в виде В(х, у) = (Ах, у). G.54) При этом единичной сферой в V мы будем называть множество тех векторов х Е V, которые удовлетворяют уравнению (х, х) = 1 или ||х|| = 1. G.55) Для упрощения рассуждений мы воспользуемся выводами преды- предыдущего пункта о приведении квадратичной формы к сумме квадратов. Итак, пусть В (х, х) —квадратичная форма, В (х, у) —полярная этой форме билинейная форма, А — самосопряженный оператор, свя- связанный с В (х, у) соотношением G.54). По теореме 7.8 в ортонормированном базисе {е^}, состоящем из соб- собственных векторов оператора А, квадратичная форма В (х, х) имеет вид В(х,х) = ?>& G.56) к = 1 где ?& —координаты вектора х в базисе {е^}, А/, —собственные значе- значения оператора А. Мы договоримся нумеровать эти собственные зна- значения в порядке убывания: А: ^А2 ^...^Ап. G.57) Заметим, что в выбранном базисе единичная сфера, определяемая уравнением G.55), в координатах вектора х задается уравнением k = l Докажем следующую теорему. Теорема 7.10. Стационарные значения квадратичной фор- формы В (х, х) на единичной сфере G.55) равны собственным значе- значениям Xk оператора А. Эти стационарные значения достигаются, в частности, на единичных собственных векторах е& оператора А. Доказательство. Так как речь идет о стационарных значе- значениях функции В (х, х) при условии (х, х) = 1, т. е. об условном экстремуме этой функции, то мы можем воспользоваться методом неопределенных множителей Лагранжа (см. «Основы математическо- математического анализа» часть I, п. 2 § 5 гл. 15). Составим для функции В (х, х), ис- используя ее выражение G.56) в данном базисе {е^}, функцию Лагран- Лагранжа Ф (?]_, ^25 • • •? ?пM учитывая при этом, что уравнение связи имеет 15 В.А. Ильин, Э.Г. Позняк
226 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ вид G.58). Получим *= ЕА^-А^Й-lV G-59) к = 1 \к = 1 ) где Л — неопределенный множитель Лагранжа. Напомним, что если Л в G.59) выбрано так, что при условии G.58) выполняются соотношения _ = 0, к = 1, 2, ..., п, G.60) то в точках сферы G.58), отвечающих этим значениям Л, функ- функция В (х, х) (квадратичная форма В (х, х)) имеет стационарное значение. Таким образом, вопрос о стационарных значениях В (х, х) на сфе- сфере (х, х) = 1 редуцируется к исследованию системы уравнений отно- относительно неизвестных Л и координат ?]_, ?2? • • •? ?п вектора х. Отметим, что при этом ?]_, ?2? • • •? ?п будут координатами того вектора х, на ко- котором В (х, х) будет иметь стационарное значение. Так как —г- = 2(А/. — Л)?^, то интересующая нас система G.58), G.60) примет вид 2^ ек = 1, (Afe - АN = О, Л = 1, 2, ..., п. G.61) Пусть система G.61) имеет решение А = А, х = (|i,|2, ...,|п). Умножая каждое из соотношений (А& — А)^ = 0 на ^, сумми- суммируя затем полученные соотношения и учитывая, что *Y^k = i?>k = 1> получим, согласно G.56), следующее значение для А: п Таким образом, есл-м A w х = (?i, ?2, • • •? ?п)~решение систе- системы G.61), то А равно значению квадратичной формы В (х, х) па век- векторе х = (?i, ?25 • • -5 ?пM па котором эта форма имеет стационар- стационарное значение.
§ 7. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 227 Легко видеть, что решениями системы G.61) служат следующие значения неизвестных Аи^: А = А*; 6 = 0, .., &_i = 0, & = 1, a + i = 0, ..., fn = О, fe = 1, 2, ..., п. Очевидно, эти решения являются собственными значениями А/, и координатами соответствующих собственных векторов е&. Теорема до- доказана. Замечание. Мы только что выяснили, что собственные значения А& являются стационарными значениями квадратичной формы В (х, х) на сфере (х, х) = 1. Оказывается, числа Ai и Ап (при условии G.57)) являются соот- соответственно наибольшим и наименьшим значениями В (х, х) на сфе- сфере (х, х) = 1 (то, что эти значения достигаются, установлено выше). Чтобы убедиться в справедливости замечания, достаточно заме- заменить в G.56) все А/, сначала на Ап, а затем на Ai и воспользоваться соотношениями G.57) и G.58). Очевидно, получим неравенства Хп ^ В (х, х) ^ Ai. § 7. Гиперповерхности второго порядка В этом параграфе мы познакомимся с понятием и основными ти- типами гиперповерхностей второго порядка. Кроме того, будут указаны способы исследования таких поверхностей. 1. Понятие гиперповерхности второго порядка. Пусть V — n-мерное вещественное евклидово пространство. Ради геометрической наглядности будем называть векторы х этого пространства точками. Гиперповерхностью S второго порядка будем называть геомет- геометрическое место точек х, удовлетворяющих уравнению вида А(х, х) + 2Я(х) + с = 0, G.62) где А(х, х)—не равная тождественно нулю квадратичная форма, В (х) —линейная форма, а с — вещественное число. Уравнение G.62) будем называть общим уравнением гиперповерх- гиперповерхности второго порядка. Выделим в пространстве V какой-либо ортонормированный ба- базис {е&}. Координаты вектора х (точки х) в этом базисе обозначим через (xi, Ж2, ..., хп). Тогда (см. п. 2 § 1 этой главы) квадратичная 15*
228 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ форма А (х, х) может быть представлена в виде п А(х, х) = ^2 ajkXjXk, G.63) где ajk = А(е,,ек) G.64) и A (ej, е/,) —значение на векторах е^ и е& симметричной билинейной формы А (х, у), полярной квадратичной форме А (х, х). Линейная форма В (х) в указанном базисе {е^} представляется в виде 8) п fc = l Таким образом, общее уравнение гиперповерхности второго поряд- порядка в евклидовом пространстве V с выделенным базисом {е&} может быть представлено в следующей форме: ^2 ajkXjXk + 2 ^2 bk%k + С = 0. G.66) j,k = l k = 1 Договоримся о следующей терминологии. Слагаемое А (х, х) = Yl^ k = iajkxjxk будем называть группой старших членов уравнения G.62) или G.66). Группу слагаемых В (х) + с = Y7k = ibkxk + с будем называть линейной частью уравнения G.62) или G.66). Мы будем рассматривать в дальнейшем матрицы \ /аи ... а1п Ь\ \ а1п \ / ( и Б = ап\ ... апп оп V bi ••• Ьп с ) G.67) ... апп оп ••• Ьп с ) и определители det А и det В этих матриц. 8) Согласно лемме п. 1 § 4 гл. 5 линейная форма В (х) может быть представ- представлена в виде В (х) = (х, Ь), где b — постоянный вектор. Обозначая bi, 62, • • •, bn координаты вектора b и учитывая ортонормированность базиса {ед,}, мы получим представление В (х) в виде G.65).
§ 7. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 229 Исследование гиперповерхностей второго порядка мы будем прово- проводить с помощью метода, сходного с методом, применяемым в анали- аналитической геометрии при исследовании кривых и поверхностей второго порядка, заданных общими уравнениями. Идея этого метода заключается в том, что путем выбора специаль- специальной декартовой системы координат на плоскости (для кривых второго порядка) или в пространстве (для поверхностей второго порядка) до- достигается максимальное упрощение уравнения кривой или поверхно- поверхности. Затем путем исследования этого уравнения выясняются геомет- геометрические свойства кривой или поверхности. Кроме того, перечисление всех возможных типов простейших (канонических) уравнений кривых или поверхностей второго порядка позволяет дать их классификацию. Чтобы использовать этот метод в многомерном случае, мы снача- сначала должны изучить такие преобразования (отображения) п-мерного евклидова пространства, которые представляют собой аналоги преоб- преобразований декартовых прямоугольных координат в случае двух и трех измерений. Такими преобразованиями в n-мерном случае будут параллельные переносы и такие преобразования базисов, при которых ортонорми- рованный базис переходит в новый ортонормированый базис. Точные определения этих преобразований будут даны в следующем пункте. Очевидно, гиперповерхность второго порядка, рассматриваемая как геометрический объект пространства V, не изменяется, если про- производится преобразование указанного выше вида. Ниже мы убедимся, что для каждого уравнения вида G.62) (или G.66)) можно выбрать такое начало координат и выбрать такой ортонормированный базис в У, что это уравнение, записанное в координатах относительно ново- нового базиса, будет максимально простого вида, и поэтому, как и в случае двух и трех измерений, можно будет указать геометрические характе- характеристики таких поверхностей и дать им классификацию. 2. Параллельные переносы в евклидовом пространстве. Преобразования ортонормированных базисов в ортонормиро- ванные. Параллельным переносом в евклидовом пространстве мы бу- будем называть преобразование, задаваемое формулами х = х' + х, G.68) где х — фиксированная точка, называемая новым началом координат. Пусть точки х, х' и х имеют координаты, соответственно равные (жь ж2, ..., хп), (х[, 4, ..., О и (жь ж2, ..., хп). Тогда в координатах параллельный перенос определяется форму-
230 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ лами хк = х'к + хк, к = 1, 2, ..., п. G.69) Отметим, что при параллельном переносе любой фиксированный базис не изменяется. Перейдем теперь к выяснению характеристики преобразования ор- тонормированного базиса в ортонормированный. Допустим, что ортонормированный базис {е^} преобразуется в но- новый ортонормированный базис {е^}. Разложим каждый вектор е^ по векторам {е^}. Получим Обозначим буквой Р матрицу преобразования G.70): (Pll P21 ... Pnl Р\2 Р22 -.. Рп2 Pin Р2п • • • Рпп Так как базисы {е^} и {е'к} ортонормированные, то из G.70) путем скалярного умножения е^- на е^ получим (е;, е'к) = J2 РтэРши = Sjk = I1 npHJ = *' G.72) *-^л 0 при 7 Ф к. Рассмотрим теперь транспонированную матрицу Р', т. е. матрицу, полученную из Р перестановкой строк и столбцов. Очевидно, согласно G.72), РР' = р'р = /, G.73) где / — единичная матрица. Равенства G.73) показывают, что матрица Р' является обратной для матрицы Р, т. е. Р-1 = Р1. G.74) Допустим теперь, что мы рассматриваем преобразование ортонор- мированного базиса {е^} по формулам G.70), причем матрица Р этого преобразования удовлетворяет условию G.73) (или, что то же, G.74)).
§ 7. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 231 Тогда, очевидно, элементы pjk матрицы Р удовлетворяют усло- условию G.72), что, согласно этим же соотношениям G.72), эквивалентно условию ортонормированности базиса {е^}. Напомним, что в § 9 гл. 5 матрицу Р, удовлетворяющую усло- условию G.73), мы назвали ортогональной. Итак, для того чтобы преобразование G.70) было преобразовани- преобразованием ортонормированного базиса в ортонормированный, необходимо и достаточно, чтобы матрица Р этого преобразования была ортого- ортогональной. Замечание. Обращаясь к формулам E.14) преобразования ко- координат вектора при преобразовании базиса (см. п. 1 § 2 гл. 5) и учитывая, что обратная матрица для ортогональной матрицы Р есть матрица Р', получим следующие формулы преобразования координат точки х при переходе от ортонормированого базиса к ортонормиро- ванному: Х2 = Р21Х1! Хп = Pnix[ + Рп2х'2 + . . . + РппХ'п. 3. Преобразование общего уравнения гиперповерхности второго порядка при параллельном переносе. Рассмотрим параллельный перенос, который определяется как преобразование пространства V по формуле G.68) (или в координатах по форму- формуле G.69)). Левая часть G.62) после подстановки вместо х его выражения по формуле G.68) в силу линейности квадратичной формы по первому и второму аргументу 9) и свойств линейной формы примет следующий вид: А(х;, х;) + 2[А(х/, х) + ?(х')] + [А (к, х) + 2В(х) + с] = 0. Итак, общее уравнение G.62) гиперповерхности S при параллель- параллельном переносе G.68) запишется в форме А(х;, х;) + 2В' (х;) + с' = 0, G.76) 9) Квадратичная форма А (х, х) связана с симметричной билинейной фор- формой А (х, у), полярной к форме А (х, х). Билинейная форма А (х, у) линейна по аргументам х и у. Фигурирующее в дальнейшем тексте выражение А(х7, х) пред- представляет собой значение формы А (х, у) на векторах х' и х.
232 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ где линейная форма В' (х') и постоянное число с' определяются соот- соотношениями Б'(х') = А(х',х) + В(х'), с' = А (х, х) + 2Б (х) + с. G.77) G.78) Запишем полученные формулы в координатах. Пусть координаты точек х'их равны соответственно х[, х'2, ..., х'п о о о и xi, Ж2 ..., хп. 1ак как при параллельном переносе оазис |е^| не ме- меняется, то квадратичная форма А (х', х') запишется следующим обра- образом: А (х' хМ = \ Q кх'х' G 79) (отметим, что коэффициенты а^ = A(ej, e^) не меняются, так как не меняются базисные векторы е&). Следовательно, мы можем сделать важный вывод: при параллель- параллельном переносе группа старших членов сохраняет свой вид. Займемся теперь формулами G.77) и G.78). Так как п I п /i ^Х , XJ — 2_^ I 2-^ аЗкХ3 | Хк-> к = 1 \j = l А; = 1 п /О О ^—V О О Л(Х, X) = 2^ CLjkXjXk, j,k = l В(х) = ^6ftSft, то формула G.77) примет вид Ьк а формула G.78) запишется следующим образом: п с' = > CLthXiXh + 2 G.80) с. G.81) k =
§ 7. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 233 Таким образом, уравнение G.76) в координатах будет иметь следу- следующий вид: п п J2 ajkx'jX'k + 2 J2 Кх'к + с' = 0. G.82) j,k = l к = 1 Нам понадобится несколько иное, чем G.81), выражение для с'. Запишем G.81) в следующей форме: к = 1 Ък к + с- Учитывая, что коэффициенты Ъ'к выражаются, как это следует из G.80), по формулам Ь'к = мы получим из G.83) нужное нам выражение для с': п с = 2_^^к + ^/г)ж/г + с- G.85) к = 1 4. Преобразование общего уравнения гиперповерхности второго порядка при переходе от ортонормированного базиса к ортонормированному. Пусть ортонормированный базис {е&} пре- преобразуется в новый ортонормированный базис {ej.} по формулам G.70) и Р — ортогональная матрица этого преобразования (см. G.71)). Тогда, согласно замечанию в п. 2 этого параграфа, координаты Xk и х'к точ- точки в базисах {е&} и {е^} связаны соотношениями G.75). Подставляя выражение для Xk из G.75) в левую часть уравнения G.66) и учиты- учитывая, что вследствие однородности соотношений G.75) группа старших членов и линейная часть уравнения G.66) преобразуются автономно, получим следующее выражение для общего уравнения гиперповерх- гиперповерхности второго порядка в координатах х'к точек в преобразованном базисе{е'Л: п п ? a'jkx'jX'k + 2 ? Ъ'кх'к + с' = 0. G.86) Согласно отмеченной выше автономности преобразования группы старших членов, справедливы равенства / j ^ik^i^k — / v ^jk^j^k? / v ^/с^/с ~~ / v "кхк-> С — С.
234 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ Обращаясь к первой из формул G.87), мы видим, что для опре- определения коэффициентов а'-к можно воспользоваться правилом преоб- преобразования коэффициентов квадратичной формы при переходе к ново- новому базису. Именно, если обозначим буквой А' матрицу квадратичной формы А (х, х) в базисе {е^}, то, согласно теореме 7.2 и соотноше- соотношению Р' = Р~ г, получим следующую связь между матрицами А и А' формы А (х, х) в базисах {е^} и {е^}: А1 = Р~ХАР G.88) (напомним, что Р — матрица ортогонального преобразования). Будем рассматривать теперь матрицу А' как матрицу некоторого линейного оператора А в базисе {е^} 10), а матрицу Р~ 1 как матрицу перехода от базиса {ек} к базису {е'к}. Тогда, согласно теореме 5.7 (см. п. 2 § 2 гл. 5), матрицу А можно рассматривать как матрицу этого линейного оператора А в базисе {е^}. Иными словами, матрица квадратичной формы при преобразова- преобразовании ортонормированного базиса в ортонормированный изменяется как матрица некоторого линейного оператора. Этот вывод мы используем в следующем пункте. Замечание. Отметим, что оператор А, матрица которого в ор- тонормированном базисе совпадает с матрицей квадратичной фор- формы А (х, х), самосопряженный. Для доказательства проведем следующие рассуждения. Пусть А (х, х) — квадратичная форма и А (х, у) — симметричная билинейная форма, полярная форме А (х, х). Согласно теореме 7.8, билинейная форма А (х, у) может быть представлена в виде А(х, у) = (Ах, у), где А — самосопряженный оператор. Поэтому квадратичная форма А (х, х) может быть представлена в виде А (х, х) = (Ах, х). Докажем, что в ортонормированном базисе {е^} матрицы операто- оператора А и квадратичной формы совпадают. Этим будет доказано утвер- утверждение замечания. Пусть ctjk—элементы матрицы формы А (х, х) и djk—элементы матрицы оператора А в базисе {е^}. Согласно п. 2 § 1 этой главы а^ — 10) Согласно теореме 5.5 (см. п. 1 § 2 гл. 5) любая квадратная матрица из п строк и п столбцов может рассматриваться как матрица некоторого линейного оператора, действующего в n-мерном пространстве.
§ 7. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 235 = A(ej, е/,), а элементы djk, согласно п. 1 § 2 гл.5, формуле E.13), могут быть найдены из равенств Aej = Y^=i ®jpep- Умножим обе части последнего соотношения скалярно на е&. Тогда, учитывая ортонормированность базиса{е^}, получим (Ае^, е^) = а^. Так как A(ej, е^) = (Ае^, е^), то а^ = а^. Утверждение замечания доказано. 5. Инварианты общего уравнения гиперповерхности вто- второго порядка. Назовем инвариантом общего уравнения G.62) (или G.66)) гиперповерхности второго порядка относительно параллельных переносов и преобразований ортогональных базисов в ортогональные такую функцию / (оц, ai2, ..., ann, &i, 62, ..., bn, с) коэффициентов этого уравнения, значение которой не меняется при указанных пре- преобразованиях пространства. Докажем следующее утверждение. Теорема 7.11. Инвариантами общего уравнения G.62) (или G.66)) гиперповерхности второго порядка являются коэффициен- коэффициенты характеристического многочлена матрицы А квадратичной фор- формы А (х, х) и определитель det В матрицы В в соотношении G.67). В частности, инвариантами являются det А и след an + ^22 + • • • • • • + йпп матрицы А. Доказательство. Очевидно, инвариантность перечисленных в условии теоремы величин достаточно доказать отдельно для парал- параллельного переноса и преобразования ортонормированного базиса в ор- тонормированный. Рассмотрим сначала параллельный перенос. В п. 3 этого параграфа мы установили, что при этом преобразовании группа старших членов сохраняет свой вид (см. формулу G.79)). Поэтому не меняется матри- матрица А, а следовательно, и характеристический многочлен этой матрицы. Докажем инвариантность det В. При параллельном переносе G.68) (или G.69)) матрица преобразу- преобразуется в матрицу В'', определитель которой, согласно G.82), имеет вид а1п Ь[ det В' = О"п1 • • • апп Ъ[ ... Ъ'п G.89) где величины Ъ'к и с' определяются по формулам G.84) и G.85). Вычтем из элементов последней (п + 1)-й строки определите- определителя G.89) элементы первой строки, умноженные на xi, затем элементы о второй строки, умноженные на х<± и т. д., наконец, элементы n-и стро- строки, умноженные на хп. Так как при таких преобразованиях определи-
236 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ тель не меняется, то, используя G.84) и G.85), получим соотношение и ... а1п Ь[ det В' = a>ni bL G.90) Вычтем теперь из элементов последнего (п + 1)-го столбца опреде- определителя G.90) элементы первого столбца, умноженные на xi, затем эле- элементы второго столбца, умноженные на Ж2, и т. д., наконец, элементы n-го столбца, умноженные на хп. Так как при таких преобразованиях определитель не меняется, то, используя соотношение ctjk — ctkj, вы- вытекающее из симметричности формы А (х, у), и формулу G.84), мы получим в результате det В. Итак, равенство det В' = det В дока- доказано. Следовательно, det В инвариантен относительно параллельных переносов. Рассмотрим теперь преобразование ортонормированного базиса в ортонормированный. Во-первых, убедимся, что коэффициенты характеристического многочлена матрицы А квадратичной формы являются инварианта- инвариантами рассматриваемого преобразования. В предыдущем пункте мы установили, что при переходе к ново- новому ортонормированному базису матрица А изменяется как матрица некоторого линейного оператора. Но в таком случае, как следует из замечания 1 п. 3 § 2 гл. 5, коэффициенты характеристического много- многочлена этой матрицы не меняются при переходе к другому базису. В частности, определитель det А и след ац + ^22 + ... + апп матри- матрицы А, как коэффициенты характеристического многочлена, являются инвариантами. Нам остается доказать инвариантность определителя det В при преобразовании ортонормированного базиса в ортонормированный. Приступим к этому доказательству. Применим следующий прием. Введем обозначения bk = Q>k,n + i, к = 1, 2, ..., п, с = an + i,n + i- Тогда уравнение G.66) гиперповерх- гиперповерхности можно записать следующим образом: п+1 ^2 ajkxjXk = 0, G.91) j,k = l где хп + 1 = 1.
§ 7. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 237 Рассмотрим преобразование переменных xi, Ж2, ..., хп, жп + 1 в пе- переменные х[, ж2, ..., х'п, х'п + 1, при котором первые п переменных пре- преобразуются по формулам G.75), а переменная хп + \ преобразуется по формуле хп + 1 = х'п + 1. Ясно, что это преобразование переменных можно рассматривать как преобразование координат при преобразовании ортонормирован- ного базиса ei, в2, ..., en, en + i (n + 1)-мерного евклидова простран- пространства, причем матрица Р этого преобразования имеет вид Рп ... Pni 0 \ ' о ' G'92) Рпп и ... О 1) Легко видеть, что матрица Р удовлетворяет условию Р' = Р~г и поэтому является ортогональной. Но тогда, согласно п. 2 этого пара- параграфа, ортонормированный базис ei, в2, ..., en, en + i преобразуется с помощью матрицы Р в ортонормированный базис. Выше было выяс- выяснено, что при таком преобразовании матрицы В квадратичной формы определитель det В этой матрицы представляет собой инвариант. Те- Теорема доказана. Замечание. Из рассуждений в доказательстве теоремы следует, что инвариантами общего уравнения гиперповерхности второго поряд- порядка будут также величины rang А и rang В. 6. Центр гиперповерхности второго порядка. Попытаем- Попытаемся найти такой параллельный перенос, при котором общее уравне- уравнение G.76) не содержало бы слагаемого 2В' (х;) (или, если обратиться к уравнению G.82), то слагаемых 2 J^=1 Ъ'кх'к). Иными словами, будем искать параллельный перенос (т. е. коор- о о о о ч динаты xi, Ж2, ..., хп точки х), при котором обратятся в нуль все ко- коэффициенты Ъ'к. Обращаясь к формулам G.84), найдем, что искомые о о о о координаты xi, Ж2, ..., хп точки х представляют собой решение сле- следующей системы линейных уравнений: п ajkxj + bk, к = 1, 2, ..., п. G.93) Уравнения G.93) называются уравнениями центра гиперповерхно- гиперповерхности второго порядка, а точка х с координатами (xi, Ж2, ..., хп), где / О О О (xi, Ж2, ..., хп) —решение системы G.93), называется центром этой по- поверхности.
238 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ Поясним наименование «центр» гиперповерхности. Пусть начало о координат помещено в центр х, т. е. произведен искомый параллель- параллельный перенос. Тогда уравнение поверхности S примет вид п 'b + с' = 0. G.94) Пусть точка х с координатами х[, х'2, ..., х'п расположена на S. Это означает, что ее координаты удовлетворяют уравнению G.94). Оче- Очевидно, точка —х с координатами — х[, — х'2, ..., — х'п, симметричная точке х относительно точки х, также расположена на 5, ибо ее коор- координаты тоже удовлетворяют уравнению G.94). Таким образом, если у гиперповерхности S есть центр, то относи- относительно центра точки S располагаются симметрично парами. Замечание 1. Если гиперповерхность S второго порядка име- имеет центр, то инварианты det A, det В и свободный член с' в уравне- уравнении G.94) связаны соотношением det В = det А. G.95) Действительно, для уравнения G.94) получим аи ... а1п 0 det В = ani • • • аПп U О ... О с1 Из последней формулы и вытекает G.95). Наличие центра у гиперповерхности второго порядка связано с раз- разрешимостью уравнений центра G.93). Если уравнения центра имеют единственное решение, то гипер- гиперповерхность S будем называть центральной. Так как определитель системы G.93) равен det А, а необходимым и достаточным условием существования единственного решения этой системы является отличие от нуля ее определителя, то мы можем сде- сделать следующий вывод: для того чтобы гиперповерхность S была центральной, необходимо и достаточно, чтобы det A / 0. Замечание 2. Если начало координат перенесено в центр цен- центральной гиперповерхности S, то уравнение этой гиперповерхности будет иметь вид А d6tB - G.96)
§ 7. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 239 Действительно, после переноса начала в центр уравнение гиперпо- гиперповерхности примет вид G.94). Так как для центральной гиперповерх- гиперповерхности det А ф О, то из формулы G.95) найдем с' = det В/ det A. Подставляя это выражение для с' в формулу G.94), мы и получим уравнение G.96). 7. Стандартное упрощение любого уравнения гиперповерх- гиперповерхности второго порядка путем преобразования ортонормиро- ванного базиса. По теореме 7.8 существует такой ортонормирован- ный базис, в котором квадратичная форма А (х, х) записывается в виде суммы квадратов. Обозначим этот базис через {е^}, а коорди- координаты точки х в этом базисе обозначим через х[, х'2, ..., х'п. Кроме то- того, буквами Ai, Л2, ..., Лп обозначим собственные значения самосопря- самосопряженного оператора А, матрица которого в ортонормированном базисе совпадает с матрицей квадратичной формы А (х, х) (см. замечание в п. 4 этого параграфа). Используя теперь выводы теоремы 7.8, запишем квадратичную форму А (х, х) в координатах (х[, х'2, ..., х'п) точки х в базисе сле- следующим образом: к = 1 Итак, перейдем от базиса {е^} к базису {е^}. Так как формулы преобразования координат точек при таком преобразовании линейны и однородны (см. замечание п. 2 этого параграфа, формулы G.75)), то группа старших членов и линейная часть уравнения гиперповерхно- гиперповерхности S преобразуются автономно. На основании этого и в силу G.97) уравнение гиперповерхности S в базисе {е^} будет иметь следующий вид "): П П Y, W + 2 Yl b'kxk + с = 0. G.98) к=1 к=1 Приведение любого уравнения гиперповерхности S второго поряд- порядка к виду G.98) будем называть стандартным упрощением этого уравнения (путем преобразования ортонормированного базиса). 8. Упрощение уравнения центральной гиперповерхности второго порядка. Классификация центральных гиперповерх- гиперповерхностей. Выводы, сделанные в предыдущих двух пунктах, позволяют решить вопрос о классификации всех центральных гиперповерхностей 11) Напомним, что при переходе от ортонормированного базиса к ортонорми- рованному свободный член с в уравнении поверхности S не меняется (см. третью из формул G.87)).
240 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ второго порядка. Решение этого вопроса мы проведем по следующей схеме. Во-первых, путем переноса начала координат в центр гиперпо- гиперповерхности G.66) мы приведем ее уравнение к виду G.96). После это- этого произведем стандартное упрощение уравнения G.96). В результате, очевидно, мы получим, согласно G.98), следующее уравнение цен- центральной поверхности второго порядка: в котором А/. — собственные числа матрицы А квадратичной фор- формы А (х, х) в уравнении G.62), а х'1 — координаты точки х в окон- окончательном ортонормированием базисе {е'к}. Отметим, во-первых, что все собственные числа А&, к = 1, 2, ... ..., п, отличны от нуля. Действительно, подсчитывая det А для уравнения G.99), получим det А = Ai А2 ... Ап, а так как для центральной поверхности det А ф 0, то очевидно, что все А/, ф 0. Договоримся далее все положительные собственные числа мат- матрицы А нумеровать первыми индексами, а отрицательные — последующими. Таким образом, найдется такой номер р, что Ai > 0, А2 > 0, ..., Ар > 0, Ap + i < 0, Ар + 2 < 0, ..., Ап < 0. Введем теперь следующие обозначения: det A если sgn — т^ О, то положим ciei] .о det A /с = -о при к = 1, 2, det В G.100) det A det В 1 Xk = ту при к = р + 1, ..., п; 2 аь к det A если sgn — = 0, то положим к = — при к = 1, 2, ..., р, пк г G.101) ^ = 7Т при к = р + 1, ..., п. Ч Ч Тогда, очевидно, уравнение G.99) может быть переписано следую- следующим образом (при этом мы заменим обозначение координат х'1 на^): 4
§ 7. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 241 Уравнение G.102) называется каноническим уравнением централь- центральной гиперповерхности второго порядка. Величины CLk, k = 1, 2, ..., п, называются полуосями центральной гиперповерхности второго порядка. Они могут быть вычислены по формулам G.100) и G.101). С помощью канонического уравнения G.102) дадим следующую классификацию центральных гиперповерхностей. 1°) р = n, sgn- = — 1. В этом случае гиперповерхность S det А называется (п — 1)-мерным эллипсоидом. Канонические уравнение такого эллипсоида обычно записывают в виде 4 +... + 4 = !• G-103) а{ а?п Если а\ — CL2 = ... = ап, то (п — 1)-мерный эллипсоид представ- представляет собой сферу радиуса R в n-мерном пространстве. det В Замечание 1. В случае р = 0, sgn- = 1 мы также det А получаем (п — 1)-мерный эллипсоид. Очевидно, в этом случае уравне- уравнение G.102) может быть записано в виде G.103). 2°) р = n, sgn- = 1. Гиперповерхность является мнимой и det A называется мнимым эллипсоидом. Замечание 2. Очевидно, в случае р = 0, sgn- = — 1 мы det A также получаем мнимый эллипсоид. 3°) 0 < р < n, sgn- ф 0. Центральные гиперповерхности det A называются в этом случае гиперболоидами. Геометрические характеристики гиперболоида зависят от соотно- det В шения чисел р и п и значения sgn . F ь det A 4°) sgn- = 0. Центральные гиперповерхности называются в det A этом случае вырожденными. Среди вырожденных гиперповерхностей отметим так называемый вырожденный эллипсоид, отвечающий зна- значениям р = 0 и р = п. 9. Упрощение уравнения нецентральной гиперповерхности второго порядка. Классификация нецентральных гиперпо- гиперповерхностей. Пусть гиперповерхность 5, заданная уравнением G.62), не является центральной, т. е. det A = 0. G.104) Произведем стандартное упрощение уравнения G.62). В резуль- 16 В.А. Ильин, Э.Г. Позняк
242 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ тате это уравнение примет вид G.98). Подсчитаем det А, используя G.98) (это возможно, так как det A — инвариант). Получим, учиты- учитывая G.104), det А = А1А2 ... Ап = 0. Таким образом, по крайней мере одно собственное значение А/, мат- матрицы А равно нулю. Подчеркнем, что не все собственные значения равны нулю, ибо иначе квадратичная форма А (х, х) была бы тожде- тождественно равной нулю, мы же предполагаем (см. п. 1 § 1 этой главы), что эта форма ненулевая. Оставим в выражении G.98) лишь те слагаемые в первой сумме, которые отвечают ненулевым собственным значениям, а затем произ- произведем такую перенумерацию базисных векторов, чтобы первым р ба- базисным векторам e'l5 ..., е'р отвечали все ненулевые собственные зна- значения Ai, A2, ..., Ар (отметим, что р = rang А). Очевидно, после этого уравнение G.98) может быть переписано следующим образом: ? \кх'к2 + 2 ? Ъ'кх'к + Е b'kx'k + с = 0 G.105) к=1 к=1 к=р+1 (здесь 0 < р < n, Ai ф 0,..., Ар ф 0; кроме того, мы специально выделили первые р слагаемых второй суммы в уравнении G.98)). Проведем теперь следующие преобразования. 1°) Для каждого номера к, 1 ^ к ^ р, объединим слагаемые с этим номером из первой и второй суммы в G.105) и затем проделаем следующие преобразования (при этом мы учитываем, что А/, ф 0): \кх'к2 + 2b'kx'k = Aft 42 + 2f 4 + %" - T- " 61 &;2_ = 2 Очевидно, после этих преобразований G.105) запишется следую- следующим образом: Е Xk U + Г") + 2 ? b'"x'k +c' = 0, G.106) к=\ ^ к' к=р+1 где постоянная с' определяется равенством р У2 с> = с ~ Е \ • fc = i Хк
§ 7. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 243 Осуществим теперь параллельный перенос по формулам х'к = х'к + Л* = *' 2' '' •' Р; ж* = х'к, к = р+ 1, ..., п. Лк В результате уравнение G.106) перейдет в уравнение J Xkxf + 2 J2 b'kx'k + с' = 0, G.108) к=1 к=р+1 причем с' определяется по формуле G.107). 2°) Будем искать теперь такое преобразование ортонормированно- го базиса {е^}, при котором первые р базисных векторов е[, ..., е'р не меняются, за счет же изменения базисных векторов е^+1, ..., е^ по- попытаемся преобразовать слагаемое 2^У^ = р_^_1Ь/кхк к виду 2/лж"', где х'^ — п-я координата в новом базисе. Отметим, что при такого вида преобразованиях свободный член с' не меняется. Заметим, во-первых, что если все коэффициенты Ъ'к в G.108) равны нулю, то цель преобразования п. 2° достигнута — слагаемое 2 J^ = p + 1 Ь'кх'к имеет вид 2/их'", где /а = 0. Итак, будем считать, что по крайней мере один из коэффициен- коэффициентов Ъ'к в сумме ^1к = р + 1 Ь'кх'к отличен от нуля. Тогда мы можем рас- рассматривать эту сумму как некоторую линейную форму В" (х), задан- заданную в подпространстве V", которое представляет собой линейную обо- оболочку векторов е^+1? ..., е^. Согласно лемме п. 1 § 4 гл. 5 эта форма в указанном подпространстве может быть представлена в виде В" (х) = = (h, x), где h —некоторый вектор подпространства V". Если мы те- теперь в подпространстве V" направим единичный вектор е" по векто- вектору h, так что h = /ie", а векторы е^+1, ..., е^ _ х выберем так, чтобы система е^+1, ..., е"_15 е" была базисом в V", то, очевидно, в этом базисе В" (х) = (h, х) = /i(e", х) = /лж"', поскольку (е", х) = ж"'. Таким образом, выбирая в V" базис описанным выше способом, мы преобразуем J^ = p+i Ь'кх'к к виду \1Х1Ц. Итак, можно указать такое преобразование базиса е^, ..., е^ в ор- тонормированный базис е7/, ..., е^ (при этом преобразовании векто- векторы е^, ..., ер остаются неизменными), что уравнение G.108) примет вид (при этом мы заменим обозначение координат х'к на хк) v ^2 Хкх1 + 2^п + с' = 0. G.109) к = 1 Отметим, что в уравнении G.109) не исключается случай \± = 0. 16*
244 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ Уравнение G.109) называется каноническим уравнением нецен- нецентральной гиперповерхности второго порядка. С помощью канонического уравнения G.109) дадим следующую классификацию нецентральных гиперповерхностей. Возможны следу- следующие случаи. 1°) 1л ф 0, р = rangA = п - 1. В этом случае последние два слагаемых в уравнении G.109) запи- ( с' \ шем в виде 2\±хп + с' = 2\± ( хп + — I и сделаем параллельный пере- перенос по направлению оси хп на величину — с1 J2\±. Чтобы не осложнять запись, не будем при этом менять обозначение координат. В результате каноническое уравнение G.109) примет вид \\х\ + ... + \п_1х1п_1 + 2/ахп = 0. G.110) Гиперповерхности второго порядка, каноническое уравнение кото- которых имеет вид G.110), называются параболоидами. 2°) \i = 0, р = rangA < п. В этом случае каноническое уравнение G.109) перепишется так: Xixl + ... + \рх2р + с' = 0. G-111) Очевидно, в подпространстве, являющемся линейной оболочкой векторов е^, ..., е'р, уравнение G.111) представляет собой канониче- каноническое уравнение центральной поверхности S' второго порядка. Чтобы получить представление о гиперповерхности S во всем пространстве, нужно в каждой точке поверхности S' поместить плоскость, парал- параллельную плоскости V" (линейная оболочка векторов е^ + 1, ..., е^). Геометрическое место таких плоскостей образует поверхность S. Таким образом, поверхность S представляет собой центральный цилиндр с направляющей поверхностью 5;, определяемой уравне- уравнением G.111), и образующими плоскостями, параллельными плоско- плоскости V". 3°) /а ф 0, р = rangA < п - 1. Поступая так же, как и в случае 1°), мы приведем каноническое уравнение G.109) к виду \хх\ + ... + \рх1 + 2/ахп = 0. G.112)
§ 7. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 245 Очевидно, что в подпространстве, представляющем собой линей- линейную оболочку векторов е[, ..., е'р, ..., е^, уравнение G.112) опреде- определяет параболоид S' (см. случай 1°)). Чтобы получить представле- представление о строении гиперповерхности S во всем пространстве, нужно в каждой точке S' поместить плоскость, параллельную плоскости V" (линейная оболочка векторов е^ + 1, ..., е'п_1). Геометрическое место таких плоскостей образует поверхность S. Таким образом, поверх- поверхность S представляет собой параболоидальный цилиндр с направля- направляющей поверхностью S1, определяемой уравнением G.112), и образую- образующими плоскостями, параллельными плоскости V".
ГЛАВА 8 ТЕНЗОРЫ В этой главе рассматриваются важные объекты, называемые тен- тензорами и характеризующиеся в каждом базисе совокупностью коорди- координат, специальным образом преобразующихся при переходе от одного базиса к другому. Тензоры широко используются в геометрии, физике и механике. Понятие тензора возникает при изучении различных ани- анизотропных явлений (например, при изучении распределения скоростей распространения света в кристалле в зависимости от направления его распространения). § 1. Преобразование базисов и координат В данном параграфе, носящем вспомогательный характер, мы рас- рассмотрим законы преобразования координат в произвольном веще- вещественном евклидовом пространстве Еп. Возникающие при этом наво- наводящие соображения делают более прозрачным понятие тензора, вво- вводимого в следующем параграфе. 1. Определители Грама х) . В этом пункте мы укажем способ, с помощью которого можно выяснить вопрос о линейной зависимости системы векторов ei, е2, ..., ек в евклидовом пространстве. Введем для этого так называемый определитель Грама указанной системы векторов. Определителем Грама системы векторов ei, е2, ..., ек называется следующий определитель: (еь ех) (еь е2) ... (еь ек) (е2, ех) (е2, е2) ... (е2, ек) ек, ei) (е/,, е2) ... (ек, ек) Справедливо утверждение. Теорема 8.1. Для того чтобы система векторов ei, e2, ..., *) Иорген Грам A850-1916) —датский математик.
§ 1. ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 247 евклидова пространства Еп была линейно зависимой, необходимо и достаточно, чтобы определитель Грама (8.1) этой системы был ра- равен нулю. Доказательство. 1) Необходимость. Пусть векто- векторы ei, е2, ..., ек линейно зависимы. Тогда один из них, например ек, является линейной комбинацией остальных: ek = aie1 + а2е2 + ... + ak-iek-i. Умножая написанное соотношение скалярно на е^, i = 1, 2, ...,&, мы получим, что последняя строка определителя Грама (8.1) являет- является линейной комбинацией первых к — 1 строк. По теореме 1.7 этот определитель равен нулю. Необходимость условия доказана. 2) Достаточность. Предположим, что определитель Грама (8.1) равен нулю. Тогда его столбцы линейно зависимы, т. е. существуют не все равные нулю числа /?i, f32, • •., /Зк такие, что для i = 1, 2, ..., к выполняются соотношения /?1(е<, ei) + /?2(е<, е2) + ... + /^(еь ек) = 0. Переписывая эти соотношения в виде (еи ^iei + f32e2 + ... + /Зкек) = 0, i = 1, 2, ..., fc, убеждаемся, что вектор /?iei + fi2e2 + ... + Pkek ортогонален всем век- векторам ei, в2,..., е/,, т. е. ортогонален линейной оболочке L этих векто- векторов. Так как этот вектор принадлежит L, то он равен нулю. Поскольку не все /3i равны нулю, то это означает, что векторы ei, е2,..., е/, ли- линейно зависимы. Теорема доказана. Следствие. Если векторы ei, е2,..., е/, линейно независимы, то определитель Грама этих векторов отличен от нуля. Докажем, что в указанном случае определитель Грама по- положителен. Пусть L — линейная оболочка векторов ei, е2,..., е&. Очевидно, ei, е2,..., е/, —базис в L. Рассмотрим билинейную симмет- симметричную форму А (х, у), представляющую собой скалярное произве- произведение (х, у): А (х, у) = (х, у). Соответствующая квадратичная фор- форма А (х, х) = (х, х) будет, очевидно, знакоопределенной, и поэтому, согласно теореме 7.6 (критерию Сильвестра), определитель det(a^) ее матрицы (aij) в базисе ei, e2,..., е/, положителен. Но этот опре- определитель и представляет собой определитель Грама (8.1) систе- системы еь е2,..., ек, ибо ац = (е;, е^). 2. Взаимные базисы. Ковариантные и контравариантные координаты векторов. Пусть ei, e2,..., еп — базис в евклидовом
248 ГЛ. 8. ТЕНЗОРЫ пространстве Еп. Базис е1, е2,..., еп называется взаимным для ба- базиса е^, г = 1, 2, ...,п, если выполняются соотношения (^)^ (; ^' (8.2) [О при г ф j. при г, j = 1, 2, ..., п. Символ Sj называется символом Кропекера. Возникает вопрос о существовании и единственности взаимного ба- базиса. Ответ на этот вопрос утвердительный: для любого данного ба- базиса е1, е2,..., еп существует единственный взаимный базис. Для доказательства поступим следующим образом. Пусть х{, х2, ..., xJn — координаты искомых векторов eJ в базисе е^: ej = х{е± + х{е2 + ... + <en, j = 1, 2, ..., п. (8.3) Умножая скалярно обе части последних равенств на е^, получим, используя (8.2), х{(еи ех) + xJ2(ei, e2) + ... + х3п(еи еп) = 5\, г, j = 1, 2, ..., п. (8.4) Соотношения (8.4) при фиксированном j можно рассматривать как квадратную систему линейных уравнений относительно неизвестных координат х{, xJ2, ..., xJn вектора eJ в базисе е^. Так как определи- определитель системы (8.4) представляет собой определитель Грама базисных векторов ei, в2, ..., еп, он, согласно следствию из теоремы 8.1, от- отличен от нуля, и поэтому система (8.4) имеет единственное реше- решение х{, xJ2, ..., xJn, которое будет ненулевым, поскольку эта система неоднородная. Затем с помощью соотношений (8.3) строятся векто- векторы eJ, которые, очевидно, удовлетворяют соотношениям (8.2). Мы должны еще убедиться, что векторы е1, е2, ..., еп образуют базис. Пусть некоторая линейная комбинация этих векторов равна нулю: aie1 + а2е2 + ... + апеп = 0. Умножая скалярно последнее равенство последовательно на ei, в2, ..., еп и используя (8.2), получим а\ = 0, а2 = 0, ..., ап = = 0. Следовательно, векторы е1, е2, ..., еп линейно независимы, т. е. образуют базис. Итак, взаимный базис eJ и для базиса е^, существует и определя- определяется единственным образом. Замечание 1.В силу симметрии соотношений (8.2) относительно е^ и ej, взаимным базисом для базиса eJ будет базис е^ . Поэтому в дальнейшем мы будем говорить о взаимных базисах е^, eJ.
§ 1. ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 249 Замечание 2. Если базис ei, е2, ..., еп ортонормированный, то взаимный базис eJ совпадает с данным базисом. Действительно, по- полагая в этом случае eJ = ej, мы убедимся, что соотношения (8.2) выполняются. Используя свойство единственности взаимного базиса, мы убедимся в справедливости замечания. Пусть е^, eJ — взаимные базисы, а х — произвольный вектор про- пространства. Разлагая вектор х по базисным векторам е^ и eJ, получим х = xie1 + х2е2 + ... + жпеп, ( , 1 9 г, (О'О) х = х ei + х е2 + ... + х еп. v y Координаты (xi, Ж2, ..., жп) вектора х в базисе eJ называют- называются ко вариантными кооординатами вектора х, а координаты (ж1, ж2, ..., жп) этого вектора в базисе е^, называются контравариантны- ми координатами вектора х. Эти наименования будут разъяснены в следующем пункте. Для сокращения записи формул, в которых фигурируют однотип- однотипные слагаемые (примерами таких формул могут служить соотноше- соотношения (8.5)), мы будем пользоваться в дальнейшем соглашением о сум- суммировании. Это соглашение заключается в следующем. Пусть имеется выражение, составленное из сомножителей, которые снабжены конеч- конечным числом индексов, часть из которых нижние, а другая часть — верхние. При этом договариваются все нижние индексы обозначать различными символами. Верхние индексы также договариваются обо- обозначать различными символами. Если в этом выражении встречаются два одинаковых индекса, из которых один верхний, а другой нижний, то считают, что по этим индексам производится суммирование, т. е. индексам последовательно даются значения 1, 2, ..., п, а затем скла- складываются полученные слагаемые. Например, xiei = xie1 + ж2е2 + ... + жпеп, 8\ = 8\ + 8\ + ... + 5JJ, gijXlxJ = (gljx1xJ) + (g2jx2xJ) + ... + (gnjxnxJ) = 2 + ... + glnx1xn) + 1 + g22X2x2 + ... + g2nx2xn) + ... + + (gn^x1 + gn2Xnx2 + ... + gnnxnxn). С помощью соглашения о суммировании формулы (8.5) записыва- записываются следующим компактным образом: х = Xie\ х = хгег. (8.6)
250 ГЛ. 8. ТЕНЗОРЫ Замечание 3. Верхние и нижние одинаковые индексы, о кото- которых говорилось в соглашении о суммировании, обычно называются ин- индексами суммирования. Ясно, что индексы суммирования могут обо- обозначаться любыми одинаковыми символами. При этом не изменятся выражения, в которых они фигурируют. Например, ж^ег и XjeJ пред- представляют собой одно и то же выражение. Получим теперь явное выра- выражение для ковариантных и контравариантных координат вектора х. Для этого умножим скалярно первое из равенств (8.6) на а^е^, а второе — на х^3. Учитывая затем соотношения (8.2), найдем (х, е^) = Xi(el, ej) = XiSj = Xj, (x, eJ) = жг(е^, eJ) = x%<)\ — xJ. Итак, Xj = (x, еД xj = (x, ej). (8.7) С помощью соотношений (8.7) запишем формулы (8.6) следующем виде: х = (х, ei)ei, х = (х, е*)е*. (8.8) Соотношения (8.8) называются формулами Гиббса 2). Обратимся еще раз к вопросу о построении взаимных базисов. С помощью формул (8.8) имеем е< = (е*, е>>,-, е< = (е<, ej)^. (8.9) Введем обозначения С помощью этих обозначений перепишем соотношения (8.9) следу- следующим образом: е* = gijej, et = g^. (8.11) Итак, для построения базиса ег по базису е^ достаточно знать матрицу (дг^), а для построения базиса е^ по базису ег достаточно знать матрицу (gij). Докажем, что указанные матрицы взаимно обратны. Отметим, что так как элементы обратной матрицы могут быть вычислены через эле- элементы данной матрицы, то ясно, что с помощью соотношений (8.11) решается вопрос о построении взаимных базисов. 2) Д.У. Гиббс A839-1903)—американский физик-теоретик.
§ 1. ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 251 Итак, установим, что матрицы (дг^) и (gij) взаимно обратны. Умножая первое из равенств (8.11) скалярно на е&, получим (ег, е&) = gli(ej, е&). Из этого соотношения, учитывая (8.2) и (8.10), найдем 10 при г ^ fc. Таким образом, произведение матриц (дг^) и (д^) представляет со- собой единичную матрицу. Следовательно, матрицы (дг^) и (gij) взаимно обратны. 3. Преобразования базиса и координат. Пусть е^ и ег — заданные взаимные базисы, а е^ и ег —некоторые новые вза- взаимные базисы, элементы которых мы обозначим штрихованными индексами. Фактически это означает, что мы вводим новый нату- натуральный ряд V, 2', 3', ... и считаем, что индекс г' принимает значе- значения V, 2', ..., п'. Таким образом, индексы гиг' независимо принимают различные значения: г = 1, 2, ..., п, г; = 1', 2;, ..., п;. Используя введенное в предыдущем пункте соглашение о сумми- суммировании, запишем формулы преобразования базисных векторов. В ре- результате получим: 1) формулы перехода от старого базиса е^ к новому базису е^ и формулы обратного перехода ег, = Ь\,ег, е; = Ь\ е?, г = 1, 2, ..., п, г' = 1;, 2;, ..., п'', (8.12) 2) формулы перехода от старого базиса ег к новому ег и формулы обратного перехода е* = Це\ е* = Ц,е\ г = 1, 2, ..., n, i' = 1', 2;, ..., п'. (8.13) Так как преобразования (8.12) (равно как и преобразования (8.13)) взаимно обратны, то матрицы (Ъ\,) и (Ъ\ ) (равно как и матрицы (Ъ\,) и {Ь\)) взаимно обратны. Докажем, что матрицы {Ь\,) (Ь\,) тождественны. Тем самым будет доказана тождественность и матриц (Ъ\ ) и (Ь\). Для доказательства умножим скалярно первое из равенств (8.12) на е&, а второе из ра- равенств (8.13)—на е&/. Учитывая соотношения (8.2), получим (eir,ek) = bi,(eir,ek) = Ъ\,Ь\ = Ъ\, (е*,ек.) = Ц,(е*',ек,) = Ц,б(, = %.
252 ГЛ. 8. ТЕНЗОРЫ Из этих соотношений при к = г, к' = г' получим Ь\, = (еу,е% (8.14) Ц, = (е<',е*), (8.15) Поскольку правые части соотношений (8.14) и (8.15) равны, то рав- равны и левые части. Иными словами, Ъ\, = Ъ\,, а это и означает тожде- тождественность матриц (Ъ\,) и (Ь\,). Отметим, что элементы Ь\, матрицы (Ъ\,) могут быть вычислены по формулам (8.14). Итак, справедливо утверждение. Для перехода от базиса е^, ег к базису е^, ег достаточно знать лишь матрицу (Ь\,) перехода от базиса е^ к базису еу {матрица (Ь\ ) вычисляется по матрице (Ь\,)). Приведем полную сводку формул преобразований базисных векторов: е* = Ь\,еи ег = bfe*/, e*' = bfe% ef = Ь}/е*'. (8.16) Перейдем к выводу формул преобразования координат вектора х при переходе к новому базису. Пусть Xi> — ковариантные координаты х в базисе е^, ег . Тогда, со- согласно (8.7), имеем ху — (х, е^). Подставляя в правую часть этого соотношения выражение для е^ из формул (8.16), найдем ху — = (х,Ь|,е<) = ЬИх,е4) = bj/Xj. Мы приходим к следующему выводу: формулы преобразования ковариантных координат вектора х при переходе к новому базису имеют вид ху = Ь\,хг. (8.17) Следовательно, при переходе к новому базису ковариантные коор- координаты вектора х преобразуются с помощью матрицы {Ь\,) прямого перехода от старого базиса к новому. Это согласование преобразований и объясняет наименование кова- ковариантные 3) координаты вектора. Рассмотрим теперь преобразование контравариантных координат вектора х. Подставляя в правую часть соотношения хг = (х, ег ) выражение для ег из формул (8.16), получим после преобразований х1' = Щх\ (8.18) 3) Ковариантный — согласованно изменяющийся.
§ 2. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 253 Мы видим, что при переходе к новому базису контравариант- ные координаты вектора х преобразуются с помощью матрицы (Ь\ ) обратного перехода от нового базиса к старому. Это несогласование преобразований и объясняет термин контрава- риантные 4) координаты вектора. § 2. Понятие тензора. Основные операции над тензорами 1. Понятие тензора. В этом параграфе мы рассматриваем произ- произвольное (не обязательно евклидово) вещественное n-мерное линейное пространство Ln. Определение. Тензором А типа (р, q) (p раз ковариантным и q раз контравариантным) называется геометрический объект, кото- который: 1) в каждом базисе е^ линейного пространства Ln определяется npJrq координатами А^"\ q (индексы ii, ..., ip, fci, ..., kq независимо принимают значения 1, 2, ..., п); 2) обладает тем свойством, что его координаты А^"\,4 в базисе е^ связаны с координатами А^"\ q в ба- базисе е^ соотношениями A^rf," = № ... tinf ... bJ'A*1-,*9, (8.19) гг..лр гг гр к\ Kq i\...iv •> \ / в которых Ь\, — элементы матрицы {Ь\,) перехода от базиса е^ к бази- базису е^/, а Ъ^ — элементы матрицы обратного перехода от е^ к е^. Число г = р + q называется рангом тензора. Замечание 1. Формулы (8.19) называют формулами преобразо- преобразования координат тензора при преобразовании базиса. Отметим, что ковариантные и контравариантные координаты век- вектора преобразуются по формулам (8.19) (при р = 1ид = 0в первом случае и при р = 0ид = 1во втором, см. п. 3 § 1 этой главы). Поэто- Поэтому ее/опор представляет собой тензор ранга 1 A раз ковариантный либо 1 раз контравариантный — в зависимости от выбора координат этого вектора). Отметим, что рассматривают также тензоры ранга 0. Это тензоры, имеющие лишь одну координату, причем эта координата не снабжена индексами и имеет одно и то же значение во всех системах координат. Тензоры ранга 0 обычно называются инвариантами. Замечание 2. Индексы ii, ..., ip называются ковариантными, а fci, ..., kq — контравариантными. Наименование объясняется тем, что 4) Контравариантный — противоположно изменяющийся.
254 ГЛ. 8. ТЕНЗОРЫ по каждому из упомянутых индексов преобразование координат тензо- тензора производится в полной аналогии с преобразованиями ковариантных и контравариантных координат вектора (см. формулы (8.17) и (8.18)). Для того чтобы определение тензора было корректным, нужно убе- убедиться, что последовательные переходы от базиса е^ к базису е^, а за- затем от базиса е^ к базису е^/ приводят к такому же преобразованию координат тензора, что и при непосредственном переходе от е^ к е^/. Пусть (Ь\,), (Ь\„) и (Ъ\п) — соответственно матрицы перехода от ба- базиса е^ к базису е^, от базиса е^ к е^/ и от базиса е^ к е^/. Так как при последовательных переходах матрицы преобразований перемножают- перемножаются, то очевидны соотношения Ь1„ = 4'К>, С = 4'$. (8-20) После сделанных замечаний убедимся в корректности определения тензора. Пусть А^"\ g, А^ "\,я, А^, '"^ —координаты тензора А в ба- базисах е^, е^ и ei" соответственно. По формулам (8.19), переходя по- последовательно от е^ к е^, а затем к е^/, получим А*Г** = Щ ... ЩЬ% ... bJ'A*1-*', (8.21) г1...г гг гр к\ кд г\..лр \ / к' к' Подставляя в правую часть (8.22) выражения координат А{}'"{lq из (8.21) и учитывая соотношения (8.20), получим ъ'.А (ък'}ък'А... р гр) V ki kiJ Таким образом, последовательные переходы от базиса е^ к базису е^, а затем к базису е^/ приводят к такому же преобразованию координат тензора, как и при непосредственном переходе от е^ к е^/. Коррект- Корректность определения тензора установлена. Замечание 3. Любая система np + g чисел А-1'"-4 может рас- i\ ...ip ± сматриваться в данном базисе е^ как координаты некоторого тензо- тензора А типа (р, q). Чтобы убедиться в этом, определим в произвольном к' к' базисе е^/ с помощью формул (8.19) систему чисел А^ '{,q•> которые будем рассматривать как координаты искомого тензора А в базисе е^. Очевидно, что при переходе от базиса е^ к базису е^ эти координаты
§ 2. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 255 преобразуются по формулам (8.19). Как и выше, легко убедиться, что последовательные переходы от базиса е^ к базису е^, а затем к бази- базису ei" приводят к такому же преобразованию полученных координат, как и при непосредственном переходе от е^ к е^/. Следовательно, си- система чисел действительно представляет собой координаты некоторого тензора А типа (р, q). 2. Примеры тензоров. 1°) Нуль-тензор. Среди тензоров типа (р, q) следует выделить так называемый нуль-тензор. Это тензор, координаты которого в любом базисе равны нулю. Очевидно, соотношения (8.19) выполняются. Отметим, что если координаты тензора А равны нулю в каком- либо базисе, то, согласно (8.19), они равны нулю в любом базисе, и, следовательно, А —нуль-тензор. 2°) Символ Кронекера. Убедимся, что тензор А типа A, 1), име- имеющий в базисе е^ координаты Sf, будет иметь в базисе е^ координа- координаты sf!. Итак, пусть А —тензор, имеющий в данном базисе е^ координа- координаты 5f. Для того чтобы найти координаты этого тензора в базисе е^, надо воспользоваться формулами (8.19), т. е. координаты тензора А в базисе е^ равны b\ b\,Sf. Используя свойства символа Кронекера, получим Ь% Ь\, 5f = b% b\, — 5f,'. Итак, в новом базисе е^ координаты тензора А действительно рав- равны Sf, . Поэтому символ Кронекера можно рассматривать как тензор типа A, 1). 3°) Пусть А (х, у) — билинейная форма, заданная в конечномер- конечномерном евклидовом пространстве Еп, a ei, в2, ..., еп — какой-либо базис в этом пространстве. Тогда векторы х и у могут быть представлены в виде х = жге;, у = yjej. Используя линейное свойство формы А (х, у) по каждому аргумен- аргументу, мы можем записать А(х, у) = А(хгеи yJej) = А(еь ej)xlyJ. Обозначим A(ei, ej) через ац\ ctij = А(еие,). (8.23) Тогда форма А (х, у) может быть записана следующим образом: А(х, у) = оужУ- (8.24) Убедимся, что коэффициенты ац матрицы формы А (х, у) при пе- переходе к новому базису преобразуются по закону (8.19) преобразова- преобразования координат тензора типа B, 0), т. е. представляют собой тензор типа B, 0).
256 ГЛ. 8. ТЕНЗОРЫ Рассмотрим произвольный базис е^, в2', ..., еп/. Запишем в этом базисе форму А (х, у) в виде (8.24) А (х, у) = ауухг у1 , причем aifj, = A(ei4 er). (8.25) Перейдем от базиса ei, в2, ..., еп к новому базису ei>, в2', ..., еп/. Обозначая матрицу перехода от базиса е^ к базису е^ через Ь\,, полу- получим е^ = b\,ei, eji = b^ej. Подставляя эти выражения для е^ и е^ в правую часть (8.25) и используя линейное свойство формы А (х, у) по каждому аргументу, найдем а?? = А{Ь\,е^ bi,ej) = Ь1,Ь^,А(е^ е^). Согласно формуле (8.23) последнее соотношение можно переписать в виде di>j> = b\,bJ-,aij. Следовательно, коэффициенты ац матрицы билинейной формы преобразуются по закону (8.19) преобразования координат тензора ти- типа B, 0), и поэтому могут рассматриваться как координаты тензора такого типа. 4°) Каждому линейному оператору, заданному в конечномерном пространстве Еп и действующему в то же пространство, можно поста- поставить в соответствие некоторый тензор типа A, 1), причем этот тензор будет вполне определять указанный оператор. Пусть у = Lx —линейный оператор, заданный в Еп и ei, в2, ... ..., еп —базис в Еп. Так как х = жге^, а у = y^ej и L — линейный оператор, то yiej =xiL{ei). (8.26) Разложим вектор L (е^) по базису ei, в2, ..., еп: Подставляя полученное выражение для L (е^) в (8.26) и используя единственность разложения по базису, получим yj = a\x\ j = 1,2, ..., п. (8.27) Напомним, что соотношения (8.27) можно рассматривать как коорди- координатный способ задания линейного оператора. При этом матрицу (aj) коэффициентов а\ называют матрицей линейного оператора. Убедимся, что коэффициенты этой матрицы при переходе к ново- новому базису преобразуются по закону (8.19) преобразования координат тензора типа A, 1) и поэтому представляют собой тензор типа A, 1). Рассмотрим произвольный базис е^, в2', ..., еп/. Запишем в этом базисе линейный оператор L в виде (8.27) / = 4^i f = 1'>2', ..., п'. (8.28)
§ 2. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 257 Перейдем теперь от базиса ei, в2, ..., еп к базису е^, в2', ..., еп/. Обозначая матрицу перехода (Ь\,) (или, что то же самое, {Ъ3-,)), полу- получим 5) (см. п. 3 § 1 этой главы) х — ovx , ^/ — ок,у . Подставим эти выражения для хг и у3 в (8.27). Получим следующие соотношения: yk'b{, =4Н'^, 3 = 1,2,..., п. (8.29) Нам нужно получить из (8.29) выражение для у3 . Для этой цели умножим обе части (8.29) на Ъ3- и просуммируем по j от 1 до п. Учи- Учитывая, что Ъ3к,Ъ3- = 83к,, получим ук 83к, = (Ь\,Щ а\)хг . Заметим, что ук S3k, = у3 . Поэтому у3 = {Ъ\,Ъ3- а\)хг . Сравнивая это выражение для у3 с выражением для у3 по формуле (8.28), получим следующее тождество, справедливое для любых векторов х (для любых коорди- координат х1 ): пз' г _ (гл h3' п3}^' ai> х — \°i'°j ai)x • Отсюда и из произвольности хг следует, что коэффициенты а\ мат- матрицы линейного оператора преобразуются по закону а\, — {Ъ\,Ъ3- а\). Итак, коэффициенты а\ преобразуются по закону (8.19) преобра- зоваия координат тензора типа A, 1) и поэтому представляют такой тензор. 3. Основные операции над тензорами. Основными операция- операциями над тензорами называются операции сложения и вычитания тен- тензоров, операция умножения тензора на число, операция умножения тензоров, операция свертывания тензоров, операция перестановки индексов, операции симметрирования и альтернирования тензоров. Перейдем к определению этих операций. 1°) Сложение и вычитание тензоров. Операции ел ожения и вычитания определяются для тензоров одинакового типа. Пусть А и В — два тензора типа (р, q), А^"\ч и В^"\ч— одноименные координаты этих тензоров в базисе е^. Суммой А + В {разностью А — В) этих тензоров называется тен- тензор, имеющий в базисе е^ координаты дк-L...kq -Rk1...kq ( дк-L...kq Ah...ip + Bh...ip [Ah...ip 5) В формуле для yi индекс суммирования мы обозначим через к'. 17 В.А. Ильин, Э.Г. Позняк
258 ГЛ. 8. ТЕНЗОРЫ Чтобы данное определение операций сложения и вычитания тензо- тензоров было корректным, необходимо проверить, преобразуются ли коор- координаты суммы (разности) тензоров по закону (8.19) преобразования координат тензора. Для этого представим себе, что наряду с фор- формулами (8.19) преобразования координат тензора А записаны анало- аналогичные формулы преобразования координат тензора В. Тогда путем сложения (вычитания) таких двух формул преобразования коорди- координат тензоров А и В мы убедимся, что координаты суммы (разности) преобразуются по закону преобразования координат тензора. 2°) Умножение тензора на число. Пусть А — тензор ти- типа (р, q), имеющий в базисе е^ координаты А^"\ д, и а — произвольное вещественное число. Произведением а А тензора А на число а называется тензор, име- имеющий в базисе е^ координаты аА^"\ q. То, что координаты аА^"Л q преобразуются по тензорному закону, непосредственно усматривается из формул (8.19). 3°) Умножение тензоров. Операция умножения тензоров определяется для тензоров произвольного типа. Пусть А — тензор типа (р, q), имеющий в данном базисе е^ коор- координаты А^"\ч, а В — тензор типа (г, s), имеющий в этом же бази- базисе координаты В™1'"™3. Для определения произведения D = АВ тензоров А и В составляются всевозможные произведения координат тензора А на координаты тензора В. В каждом таком произведении индексы /]_, ..., 1Г и ?7ii, • • •? ms У координат тензора В заменяются но- новыми индексами. Именно, полагают l\ = ip + i, ..., lr — ip + r и ^i = • • • i ™s — kq + s • Произведением D = АВ тензоров А и В называется тензор ти- па (р + г, q + s), имеющий в базисе е^ координаты Т-\к\ ...kqkq _)- 1 ...kq -|- s a k\ ...kq T^kq -\- 1 ...kq _)- s L>h...ipip + 1...ip+r - Ah...ip *i i Чтобы убедиться, что координаты D^1"^ ^ 9 + 1"У g + s, определенные соотношением (8.30), преобразуются при переходе к другому базису по закону преобразования координат тензора, т. е. действительно пред- представляют собой координаты тензора, достаточно записать формулы преобразования (8.19) для координат А^"\ q и Biq+^'"i q+rs тензоров А и В и перемножить правые и левые части этих формул. В результа- результате, обращаясь к соотношению (8.30), легко получить нужные формулы кл к к _|_ к _|_ преобразования для координат D^ "\ \ ^ 'V q+^s. Замечание. Операция умножения тензоров не обладает свойст- свойством перестановочности: вообще говоря, АВ ф В А. Это объясняется
§ 2. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 259 тем, что порядок следования индексов у координат тензора определяет «номер» этой координаты. Таким образом, хотя численное значение выражений и и и и и и и и ЛП..лр ^ip + 1...ip + r И *>ip + 1...ip + r Лп..лр одинаково, порядок следования индексов у этих выражений различен, и поэтому они отвечают координатам с различными «номерами». Это и означает, что АВ ф В А. 4°) Свертывание тензора. Операция свертывания применя- применяется к тензору типа (р, q), у которого р ф 0 и q ф 0 (т. е. к тензо- тензору, у которого имеется по крайней мере один верхний и один нижний индекс). Пусть А — тензор указанного выше типа. Перейдем к описанию опе- операции свертывания. Свертывание тензора А производится по каким-либо отмеченным верхнему и нижнему индексам. При этом в результате свертывания получается тензор типа (р — 1, q — 1). Пусть, например, у каждой координаты тензора А отмечен верхний индекс с номером т и нижний индекс с номером п: Произведем суммирование (свертывание) координат тензора с оди- одинаковыми выделенными индексами. Эта операция и дает следующие координаты тензора, полученного свертыванием по верхнему и ниж- нижнему индексам с номерами тип: At/It (8-31) (в выражении (8.31) мы использовали соглашение о суммировании). Проверим, что величины (8.31) действительно образуют координа- координаты тензора типа (р — 1, q — 1). Для этого обратимся к формулам (8.19). Перепишем эти формулы в следующем виде, выделив интересующие нас индексы (эти индексы мы подчеркнем): .к i.../^_™...?; q _ ^'г jkjn_ hk'<ihii tfn i^'p дк1...кт...кд /^ „^ <t*-AI л Al Al Or, . . . Or, . . . Or, U-I . . . U-I . . . U-I l±- ¦ ¦ . IO.OZI I \...L n .. Л p K~L rim Kq 11 In I p l\ .. Лп • • Лр v / Произведем теперь суммирование в правой и левой частях (8.32) по выделенным индексам к'т и ifn. Для этого достаточно положить эти индексы равными а' и воспользоваться соглашением о суммировании. В результате мы получим некоторое равенство. Найдем выражения в 17*
260 ГЛ. 8. ТЕНЗОРЫ левой и правой частях этого равенства В левой части мы получим, очевидно, выражение В правой же части произведение Ь% на Ъг?, равно 5^ , т. е. равно единице при кт = гп = а и равно нулю при кт ф гп. Таким образом, в правой части мы получим следующее выражение: $1...ь2га?;-°;;;?;. (8.34) Сравнив выражения (8.33) и (8.34), мы убедимся, что величи- величины Aii'"a'"i q преобразуются при переходе к новому базису по зако- закону преобразования координат тензора. Очевидно, этот тензор будет типа (р — 1, q — 1). Замечание. Термин «свертывание тензоров» употребляется еще и в следующем смысле. Рассмотрим два тензора А и В, у координат первого из которых имеется по крайней мере один верхний индекс к, а у координат второ- второго—по крайней мере один нижний индекс г. Составим произведение АВ этих тензоров и затем проведем опе- операцию свертывания тензора АВ по верхнему индексу к и нижнему индексу г. Для этой операции обычно употребляется терминология: «свертывание тензоров А и В по индексам к и г». 5°) Перестановка индексов. Эта операция заключается в том, что в любом базисе индексы у каждой координаты тензора под- подвергаются одной и той же перестановке. Это означает, что мы иным образом «нумеруем» координаты данного тензора. Читателю предла- предлагается проверить, что в результате получается тензор (отличный, во- вообще говоря, от данного). 6°) Симметрирование и альтернирование. Предвари- Предварительно введем понятия симметричного и кососимметричного тензо- тензоров. Тензор А с координатами Ail'"iq i i (8-35) называется симметричным по нижним индексам гш и гп, если при перестановке этих индексов 6) координаты тензора А не меняют своего значения, т. е. кк кк 6) Напомним, что при перестановке индексов у координат тензора, мы полу- получаем координаты, вообще говоря, другого тензора.
§ 2. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 261 Соотношение (8.36) называется условием симметрии тензора А по нижним индексам с номерами тип. Тензор А называется кососимметричным по нижним индексам гш и гп, если при перестановке этих индексов справедливо соотношение дкг...кд дкг...кд /ft о^\ Л," A A А "Л», А А А • lO.OM Соотношение (8.37) называется условием кососимметрии тензора А по нижним индексам с номерами тип. Аналогично вводится понятие симметрии и кососимметрии тензора по двум верхним индексам. Замечание. Если условие симметрии (кососимметрии) по ниж- нижним индексам гт и гп выполняется для тензора А в данной системе координат, то оно выполняется и в любой другой системе координат. Перейдем теперь к описанию операции симметрирования. Пусть А — тензор типа (р, q) с координатами (8.35). Переставим у каждой координаты нижние индексы с номерами т и п и затем по- построим тензор А(ш^ п) с координатами '"q г г V (8'38) Операция построения тензора ^4(m,n) называется операцией сим- симметрирования тензора А по нижним индексам с номерами тип. Отметим, что координаты (8.38) тензора ^4(m,n) обычно обознача- обозначаются символами Ail'.'.'.(L...in)...ip- (8-39) Очевидно, для тензора ^4(m,n) выполняется условие симметрии (8.36) по нижним индексам с номерами тип. Операция симметрирования тензора по верхним индексам с номе- номерами тип определяется аналогично. Построенный тензор обозначает- обозначается символом А^т'п). Для координат тензора А^т'п) используется обо- обозначение, аналогичное обозначению (8.39) координат тензора -4(m?n). Операция альтернирования тензора А по нижним индексам с но- номерами тип производится следующим образом. У каждой координаты тензора А переставляются нижние индексы с номерами т и п и затем строится тензор А[т? п] с координатами а т\>\ ... rv q /t *^ 1 • • • *^q i1...im...in...ip гг..лп..Am... Операция построения тензора ^4[m,n] называется операцией аль- альтернирования тензора А по нижним индексам с номерами тип.
262 ГЛ. 8. ТЕНЗОРЫ Координаты (8.40) тензора ^4[m,n] обычно обозначаются символами Очевидно, для тензора ^4[m,n] выполняется условие кососиммет- рии (8.37) по нижним индексам im и гп. Операция альтернирования тензора по верхним индексам im и in определяется аналогично. Построенный тензор обозначается симво- символом А^т'п\ Для координат тензора ^-т^п\ используется обозначение, аналогичное обозначению (8.41) координат тензора A[mn]. В заключение отметим очевидное равенство А = А(т,п) + А[т,п]- § 3. Метрический тензор. Основные операции векторной алгебры в тензорных обозначениях 1. Понятие метрического тензора в евклидовом простран- пространстве. В § 2 гл. 7 говорилось о том, что скалярное произведение в ко- конечномерном линейном пространстве может быть задано с помощью билинейной формы, полярной некоторой положительно определенной квадратичной форме. В этом параграфе мы будем считать, что в рас- рассматриваемом конечномерном евклидовом пространстве Еп скалярное произведение задано такого типа билинейной формой А (х, у). В п. 2 предыдущего параграфа (пример 3) мы убедились, что коэффициенты матрицы билинейной формы могут рассматриваться как координаты тензора. Эти коэффициенты для билинейной фор- формы А (х, у), с помощью которой задается скалярное умножение в Еп, мы обозначим через дц. Таким образом, д^-— координаты некоторого тензора G в базисе ei, в2, ..., еп. Этот тензор типа B, 0) называется метрическим тензором пространства Еп. Напомним, что координа- координаты gij тензора G определяются соотношениями дц=А{виъ) (8.42) (см. формулу (8.23)). Заметим также, что так как форма А (х, у) симметрична (А (х, у) = А (у, х)), то, согласно (8.42), д^ — д^ т. е. метрический тензор G симметричен по нижним индексам i и j. Пусть х и у — произвольные векторы в Еп, хг и у3 — координаты этих векторов в базисе ei, в2, ..., еп.
§ 3. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 263 Скалярное произведение (х, у) векторов х и у равно А (х, у). Обра- Обращаясь к выражению (8.24) для билинейной формы в данном базисе и используя равенство (х, у) = А (х, у), получим следующую формулу для скалярного произведения (х, у) векторов х и у: (х, у) = дух*у*. (8.43) В частности, скалярные произведения (е^, ej) базисных векторов е^ и ej равны gij-. (е;, е^) = дц (8.44) (это следует из равенства (е^, ej) = А(е^, ej) и из формулы (8.42); впрочем, формулу (8.44) легко получить и непосредственно из (8.43)). Рассмотрим теперь, наряду с базисом ei, в2, ..., еп, взаимный ба- базис е1, е2, ..., еп. Пусть х = ж^ег и у = yjeJ— разложения векторов х и у по векторам взаимного базиса. Тогда для скалярного произведе- произведения (х, у) получим следующую формулу: (х, у) = А(х, у) = A(Xie\ Vjej) = А(е\ ej)xiyj. Обозначая 9ij = А(е\е*), (8.45) получим следующее выражение для (х, у): (х, у) = д»хщ. (8.46) Как и в п. 2 предыдущего параграфа (см. пример 3), легко убе- убедиться, что дгз представляют собой координаты тензора типа @, 2), симметричного по индексам i и j. Этот тензор типа @, 2) также назы- называется метрическим тензором пространства Еп. Мы будем обозначать его тем же символом G, что и введенный вы- выше метрический тензор типа B, 0): в следующем пункте мы выясним, что координаты дц и gli можно рассматривать как ковариантные и контравариантные координаты одного и того же тензора. В дальней- дальнейшем эти координаты дц и д1^ мы так и будем называть ковариантными и контравариантными координатами тензора G. В конце п. 2 § 1 этой главы, исследуя вопрос о построении взаимных базисов, мы ввели величины д^ и д%3 по формулам (8.10). Сравнивая эти формулы с формулами (8.42) и (8.45), мы приходим к выводу, что эти величины представляют собой ковариантные и контравариантные
264 ГЛ. 8. ТЕНЗОРЫ координаты метрического тензора G. В этом же п. 2 § 1 мы доказа- доказали, что матрицы, элементами которых являются координаты дц и дг\ взаимно обратные. Это означает, что справедливо соотношение 9ij9jk = 51 (8.47) Таким образом, координаты gli тензора G могут быть построены по координатам дц, и наоборот (для этого надо обратиться к известному способу построения элементов обратной матрицы). 2. Операция поднятия и опускания индексов с помощью метрического тензора. Метрический тензор G используется для операции поднятия и опускания индексов у координат данного тен- тензора А. Эта операция заключается в следующем. Пусть А — тензор типа (р, q) с координатами А^^"\ q. Для при- примера покажем, каким образом проводится операция поднятия индек- индекса i\. Свернем тензоры G и А по верхнему индексу j у первого тензора и по нижнему индексу i\ у второго тензора, т. е. построим тензор с координатами дга А^"г q и у координат полученного тензора ин- индекс г обозначим через %\. Затем эти координаты обозначим символа- символами Аг^ 1i2'" q- Таким образом, A1k1k2...kq _ iia дк1к2...кд /о до\ Замечание 1. Так как порядок расположения индексов у ко- координат тензора определяет «нумерацию» его координат, то, вообще говоря, при поднятии индекса нужно отмечать место среди верхних индексов, на которое будет поднят данный нижний индекс. Иногда в ряду нижних индексов нужно отметить место поднимаемого нижнего индекса. Это делается с помощью точки, которая ставится на место поднятого индекса. Поэтому координаты тензора в левой части (8.48) следовало бы записать следующим образом: А1^ 1i2'" q. К примеру, если первый нижний индекс поднимается на второе ме- место среди верхних индексов, то в результате мы получим тензор с ко- A.k\i\k2...kQ ординатами Ai2 i q. Замечание 2. Операция опускания индекса с помощью метри- метрического тензора G определяется аналогично. Например, координаты тензора, полученного путем опускания у тензора А индекса kq на по- последнее место в ряду нижних индексов, имеют следующий вид:
§ 3. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 265 Замечание 3. Операцию поднятия или опускания индекса мож- можно применять несколько раз, причем каждый раз по отношению к раз- различным индексам данного тензора. Рассмотрим примеры поднятия и опускания индексов у тензоров. Пусть х —вектор, х\ и хг — соответственно его ковариантные и кон- травариантные координаты (напомним, что вектор представляет собой тензор ранга 1). Поднимем у координат Х{ индекс i с помощью метрического тен- тензора G. В результате получим тензор с координатами дгаха. Так как ха = (х, ej, то giaxa = #ia(x, ej = (х, giaea). Согласно (8.11) дгаеа = ег, а (х, ег) = хг. Поэтому дгаха = хг. Таким образом, контравариантные координаты хг вектора х можно получить как результат операции поднятия индекса у ковариантных координат Хг этого вектора. Ковариантные координаты х\ могут быть получены как результат операции опускания индекса у контравариантных координат хг. Выясним результат двукратного применения операции поднятия индекса у ковариантных координат д^ метрического тензора G с по- помощью контравариантных координат дгз этого же тензора. Иными сло- словами, выясним, что представляет собой тензор с координатами «ГЛа/З- (8-49) Используя симметрию тензора G по нижним индексам и соотно- соотношение (8.47), найдем g^gaj3 — 9^9р<* — <%• Подставляя найденное выражение для д^дар в (8.49) и используя свойства символа Кроне- кера (%, получим ij0 ij Совершенно аналогично можно убедиться в справедливости равенства Последние две формулы еще раз подчеркивают, что дц и д1^ есте- естественно рассматривать как ковариантные и контравариантные коор- координаты метрического тензора G. 3. Ортонормированные базисы в Еп. Мы уже выяснили, что скалярное произведение (х, у) в Еп может быть задано с помощью метрического тензора G, координаты д^ которого представляют собой элементы симметричной положительно определенной матрицы (gij). Именно, согласно (8.43), (х, у) = дцх1у*.
266 ГЛ. 8. ТЕНЗОРЫ Известно, что с помощью преобразования базиса матрицу билиней- билинейной формы gijXly3 можно привести к диагональному виду. При этом, в силу положительной определенности матрицы, после приведения мат- матрицы (gij) к диагональному виду координаты метрического тензора будут равны нулю при г ф j и единице при г = j. Обозначая эти координаты прежним символом д^, получим : ГО иригфз, [1 при г = j. Базис е^, в котором координаты дц метрического тензора удовле- удовлетворяют условию (8.50), является ортонормированным. Действитель- Действительно, так как (е^, ej) = дц (см. (8.44)), то, согласно (8.50), JO при i ф j, 1 1 при i = j, а это и означает, что е^ — ортонормированный базис. В гл. 4 мы выяснили, что в ортонормированием базисе скалярное произведение (х, у) векторов х и у с координатами хг и у3 может быть вычислено по формуле п (х,у) = 5>У, (8-51) а квадрат длины (х, х) вектора х —по формуле п (х, х) = ^(ж*J. (8-52) Обратимся к так называемым ортогональным линейным преобра- преобразованиям, т. е. к таким линейным преобразованиям, при которых орто- ортонормированный базис переходит в ортонормированный. Иными слова- словами, если L — ортогональное преобразование и е^ — ортонормированный базис, то Lei также образует ортонормированный базис. Исследуем действие преобразования L на произвольный век- вектор х = xlei. Обозначим через X результат действия L на х: X = Lx. Используя свойство линейности L, найдем
§ 3. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 267 Так как Le^ —базис, то из последнего соотношения вытекает, что вектор X имеет в базисе Lei такие же координаты, как и вектор х в базисе е^, т. е. при ортогональном преобразовании сохраняют свое значение координаты вектора. Поскольку Lei ~ ортонормированный базис, то скалярное произве- произведение (X, Y) векторов X = Lx и Y = Ly может быть найдено по формуле (8.51), а квадрат длины (X, X) вектора X = Lx —по фор- формуле (8.52). Мы выяснили, что при ортогональных преобразованиях сохраняют свое значение координаты векторов. Отсюда и из соотно- соотношений (8.51) и (8.52) получаем (X, Y) = (х, у), (X, X) = (х, х). Таким образом, при ортогональных преобразованиях не меняются длины векторов и их скалярные произведения. Как известно, ортогональные преобразования L могут быть заданы с помощью ортогональной матрицы. Определитель det L такой матри- матрицы удовлетворяет условию det L = =Ь 1. Выберем один из ортонормированных базисов и договоримся называть этот базис правым. В этом случае будем говорить, что евклидово пространство Еп ориентировано. Все базисы в Еп, полу- получающиеся из данного ортогональными преобразованиями с определи- определителем, равным + 1, назовем правыми, а все базисы, которые получа- получаются из данного ортогональными преобразованиями с определителем, равным — 1, — левыми. Легко убедиться, что преобразование правого базиса в правый характеризуется равенством + 1 определителя преоб- преобразования, а левого в левый — равенством — 1 этого определителя. Обозначим через О (п) — множество всех ортогональных пре- преобразований в Еп, а через О+ (п) — множество ортогональных преобразований правых базисов. Эти множества будут рассмотрены в следующей главе. Замечание. В дальнейшем мы будем называть произвольный ба- базис ei, в2, ..., еп правым {левым), если определитель матрицы пере- перехода от выбранного ортонормированного базиса к базису ei, в2, ..., еп положителен (отрицателен). 4. Дискриминантный тензор. Рассмотрим так называемый вполне ко со симметрический тензор ?iii2...ip типа (р, 0), т. е. такой тензор, который кососимметричен по любым двум нижним индексам. Для того чтобы этот тензор не был нулевым, необходимо, чтобы число р не превышало п, т. е. удовлетворяло условию р ^ п, ибо, если р > п, то любая координата будет иметь по меньшей мере два одинако- одинаковых индекса, при перестановке которых эта координата одновременно должна и изменить знак, и остаться неизменной. Это может быть лишь
268 ГЛ. 8. ТЕНЗОРЫ в том случае, когда указанная координата равна нулю. Следовательно, при р > п любая координата тензора равна нулю, т. е. тензор является нулевым. Особый интерес представляет вполне кососимметрический тензор, ранг р которого равен размерности п пространства. Любая координата Si1i2...in такого тензора может быть найдена по формуле {О, если среди индексов ii, г2, ..., гп хотя бы два совпадают, (_ l)slgno"s12...n, если все индексы различны. (8.53) В формуле (8.53) signer равно 0 или +1 в зависимости от четно- четности или нечетности перестановки а — (ii, г2, ..., гп) (signer называют также знаком этой перестановки). Рассмотрим какую-либо правую ортонормированную систему ко- координат и положим в ней --12...п = 1. (8.54) С помощью соотношения (8.53) в данной системе координат определя- определяются все координаты ?iii2...in вполне кососимметрического тензора, а следовательно и сам тензор, который в дальнейшем мы будем назы- называть дискриминантным тензором. Координаты этого тензора в про- произвольном базисе ei, е2, ..., еп обозначим через с^...^. Обозначим символом В матрицу перехода от выбранного право- правого ортонормированного базиса к некоторому базису е^, е2/, ..., en/, a через Ъ\, — элементы этой матрицы. Согласно (8.53) для вычисления координат су у ...^ дискриминант- ного тензора в базисе е^, е2/, ..., еп/ достаточно знать значение коор- координаты Ci'2'...n1- Используя формулу (8.19) преобразования координат тензора и соотношение (8.54), получим, переходя от выбранного ортонормиро- ортонормированного базиса к базису е^, е2/, ..., еп/, ci'2'...n' = K)b%...b%eilh...in = = si2...n 5Z (-lfea<rb?,b$...b% = = det(^) = det B. (8.55) Пусть gvj/ — координаты метрического тензора в базисе е^, е2/, ..., еп/. Так как матрица G = (girjf) есть матрица билинейной
§ 3. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 269 формы gi'jix1 yi , представляющей собой скалярное произведение век- векторов х и у с координатами хг и yi , то при переходе от данно- данного ортонормированного базиса (в котором матрица Е рассматривае- рассматриваемой билинейной формы является единичной) к базису е^, в2', ..., еп/ справедлива формула G = В'ЕВ. Отсюда следует, что det G = = det Б'det Edet В = (det ВJ. Обозначая det G через g, получим из последнего соотношения det В = ±у/д. Обращаясь к соотношениям (8.55), мы получим, что ci'2'...n' = =Ь у/д. Таким образом, в произвольном базисе ei, в2, ..., еп выражение для координаты Ci2...n дискриминантного тензора имеет вид С12...П = ±л/#> (8'56) где g — определитель матрицы {gij) метрического тензора в бази- базисе еь е2, ..., еп. Отметим, что в формуле (8.56) знак плюс соответствует правому базису, а знак минус — левому. 5. Ориентированный объем. Введем в ориентированном евкли- евклидовом пространстве Еп так называемую аффинную систему коорди- координат, определив ее как совокупность фиксированной точки О с ко- координатами @, 0, ..., 0) и базиса ei, в2, ..., еп. Координаты любой точки М в Еп определяются в этом случае как координаты в бази- базисе еь е2, ..., еп вектора ОМ. Рассмотрим в Еп занумерованную систему из п векторов х, х, ..., х (8.57) и рассмотрим всевозможные векторы ОМ, определяемые соотно- соотношениями 12 ОМ = ахх + а2х + ... + апх, (8.58) при всевозможных oti, удовлетворяющих неравенствам 0 ^ oti ^ 1, г — = 1, 2, ...,п. Множество всех точек М пространства Еп, определяемое соотно- соотношениями (8.58), образует так называемый п-мерный параллелепипед в Еп, натянутый на векторы (8.57). Ориентированным объемом V (х, х, ..., х) этого параллелепипеда называется число 1.2\ п У(х, х, ...,х) = cili2...inxilxi2...xin. (8.59) При этом Ci1i2...in—координаты дискриминантного тензора в бази- 1 2 п се ei, е2, ..., еп, а х11, хг<2, ..., хЪп — контравариантные координаты
270 ГЛ. 8. ТЕНЗОРЫ 1 2 п векторов х, х, ..., х в этом же оазисе. Термин «ориентированный объем» объясняется тем, что в случае, если векторы (8.57) образуют правый базис, ориентированный объем положителен (V > 0), а в случае левого базиса — отрицателен (V < 0). Отметим, что при п = 3 ориентированный объем, вычисляемый для п = 3 по формуле (8.59), представляет собой обычный объем 12 3 параллелепипеда, натянутого на векторы х, х, х, взятый со знаком + , 12 3 если тройка х, х, х правая, и со знаком —, если эта тройка левая. 6. Векторное произведение. С помощью дискриминантного тен- тензора можно записать в трехмерном пространстве Е3 в тензорном виде векторное произведение. Такая запись широко используется при раз- различных вычислениях в так называемых криволинейных координатах. Пусть Cijk — координаты дискриминантного тензора в данном ба- базисе ei, в2, ез пространства Е3. Поднимем у этого тензора первый индекс г с помощью метрического тензора д1т, т. е. рассмотрим тен- тензор сг-к. Тогда координаты zl вектора z = [ху] (т. е. векторного про- произведения векторов х и у) в базисе ei, в2, ез имеют вид z* = с)кх*ук. (8.60) Так как сг-кх^ук представляет собой тензор типа @, 1), то zl можно рассматривать как контравариантные координаты вектора. Поэтому, чтобы убедиться, что z1 действительно представляют собой коорди- координаты векторного произведения, достаточно обратиться к какой-либо определенной системе координат и непосредственно провести провер- проверку. Эта проверка элементарна для ортонормированного базиса и предо- предоставляется читателю. Соотношение (8.60) может служить основой для введения вектор- векторного произведения п — 1 вектора в Еп. Пусть х, х, ..., х —какие-либо п — 1 вектор в Еп. Определим г Г12 п~11 координаты z векторного произведения z = хх ... х с помощью соотношений В соотношениях (8.61) c\xi2 i —координаты дискриминантно- 12 п-1 го тензора с поднятым первым индексом, а жг1, жг2, ..., хЪп -г — 12 п-1 контравариантные координаты векторов х, х, ..., х . 7. Двойное векторное произведение. Из векторной алгебры известна следующая формула для двойного векторного произведе-
§ 4. МЕТРИЧЕСКИЙ ТЕНЗОР 271 ния [a[bd]] векторов a, b и d [a[bd]] = b(ad) - d(ab). (8.62) Используя соотношение (8.60) и формулу (8.43) для скалярного про- произведения векторов, перепишем (8.62) следующим образом: dklakJmnbndn = Ь{дыаЧ1 - <ГдыакЬ?. (8.63) С помощью (8.63) мы получим формулу, связывающую тензоры сгы и gik, которую в свою очередь используем для записи координат двой- двойного векторного произведения. Проведем следующие преобразования в формуле (8.63). В первом слагаемом blgkiakdl в правой части (8.63) заменим Ьг на Ьш8гт 7) и индекс суммирования I заменим на п. Во втором слагаемом в правой части (8.63) положим dl = dn8ln и индекс суммирования I заменим на т. После этих преобразований формула (8.63) примет вид (cilClmn)akbmdn = (дкпб1 - gkm5l)akbmdn. (8.64) Так как соотношение (8.64) справедливо для любых векторов a, b и d, то оно представляет собой тождество относительно координат ак, Ът и dn этих векторов, и поэтому для любых индек- индексов г, &, m, n имеет место равенство 4/4п = 9knSin - gkmSn. (8.65) Обозначим через z1 координаты двойного векторного произведе- произведения [a[bd]]. Тогда, согласно (8.63), z1 — clklclkmakbmdn. Отсюда и из (8.65) получаем следующее выражение для координат z1 двойного век- векторного произведения [a[bd]]: *' = (Jkntln - gkmSi)akbmdn. (8.66) Формула (8.66) удобна для различных приложений. § 4. Метрический тензор псевдоевклидова пространства 1. Понятие псевдоевклидова пространства и метрическо- метрического тензора псевдоевклидова пространства. Рассмотрим п-мерное 7) Соотношение Ьг = Ьш8гш следует из свойств символа Кронекера.
272 ГЛ. 8. ТЕНЗОРЫ линейное пространство L, в котором задана невырожденная симмет- симметричная билинейная форма А (х, у), полярная знакопеременной квад- квадратичной форме. Будем называть скалярным произведением (х, у) векторов х и у значение А (х, у) билинейной формы. Наименование «скалярное про- произведение» условно, поскольку в рассматриваемом случае не выполня- выполняется четвертая аксиома скалярного произведения. Именно, в случае, когда билинейная форма А (х, у) полярна знакопеременной квадра- квадратичной форме, выражение А (х, х) в зависимости от выбора х может иметь как положительное, так и отрицательное значение и обращать- обращаться в нуль для ненулевых векторов х. Все же мы будем пользоваться термином «скалярное произведение», так как это общепринято. Сформулируем определение псевдоевклидова пространства. Определение. Псевдоевклидовым пространством называется n-мерное линейное пространство L, в котором задано скалярное произ- произведение посредством невырожденной симметричной билинейной фор- формы А (х, у), полярной знакопеременной квадратичной форме. Число п называется размерностью псевдоевклидова пространства. Выделим в линейном пространстве L базис ei, в2, ..., еп и обо- обозначим через (gij) матрицу билинейной формы А (х, у) в этом базисе (напомним, что д^ = А (е^, е^)). Если хг и у3 —контравариантные ко- координаты векторов х и у, то А(х, у) = дцх'у*. (8.67) В полной аналогии с рассуждениями п. 2 § 2 этой главы доказыва- доказывается, что д^ представляют собой координаты тензора G типа B, 0). Этот тензор мы будем в дальнейшем называть метрическим тензо- тензором псевдоевклидова пространства. Так как скалярное произведение (х, у) равно А (х, у), то, соглас- согласно (8.67), имеем: (х, у) = д^хгу3. Известно, что матрицу (gij) билинейной формы А (х, у) можно привести к диагональному виду. При этом в силу невырожденности формы А (х, у) координаты дц метрического тензора после приведе- приведения к диагональному виду будут равны нулю при г ф j'и единице или минус единице при г = j. Число р положительных и число q отрицательных диагональных элементов не зависит от способа приве- приведения к диагональному виду, причем, в силу невырожденности фор- формы А (х, у), р + g = п. Приведенные рассуждения поясняют обозначение Е? ч для n-мерного псевдоевклидова пространства. Естественно поставить вопрос об измерении длин векторов в псев- псевдоевклидовом пространстве.
§ 4. МЕТРИЧЕСКИЙ ТЕНЗОР 273 В евклидовом пространстве с метрическим тензором дц квадрат длины вектора х с координатами хг считается равным д^хгхК Если определить квадрат длины s2 (x) вектора х с помощью соотношения s2(x) = дцх*х>, (8.68) то, очевидно (поскольку форма А (х, х) знакопеременная), что мож- можно указать ненулевые векторы с положительным квадратом длины, с отрицательным квадратом длины и с нулевым квадратом длины. Поэтому, чтобы получить в качестве меры длины векторов лишь дей- действительные числа, обычно за длину вектора принимают <т(х) = (sgns2(x))V|s2(x)|. (8.69) В дальнейшем мы будем использовать следующую терминоло- терминологию, заимствованную из специальной теории относительности: мы бу- будем называть ненулевой вектор х времениподобным, если для это- этого вектора а (х) > 0, пространственноподобным, если а (х) < 0, и изотропным, если а (х) = 0. Справедливо следующее утверждение. Множество концов всех времениподобных (пространственнопо- (пространственноподобных, изотропных) векторов, начала которых совпадают с про- произвольной фиксированной точкой М псевдоевклидова пространства, образует конус. Для определенности докажем утверждение, рассматривая време- ниподобные векторы. Очевидно, достаточно доказать, что если х — времениподобный вектор, то при любом вещественном А / 0 век- вектор Лх также времениподобен. Так как координаты вектора Лх равны Ххг, то, согласно (8.68), s2 (Лх) = Л2з2(х), т. е. sgns2^x) = sgns2(x). Отсюда и из (8.69) следует, что вектор Лх будет времениподобным. Для случая времениподобных векторов утверждение доказано. Рас- Рассуждая аналогично, убедимся в справедливости утверждения для слу- случая пространственноподобных и изотропных векторов. Конус времениподобных векторов обозначается часто символом Т (от англ. time —время), а конус пространственноподобных векторов — символом S (от англ. space —пространство). 2. Галилеевы координаты. Преобразования Лоренца 8) . В теории псевдоевклидовых пространств важную роль играют те систе- системы координат, в которых квадрат интервала (так обычно называют 8) Гендрик-Антон Лоренц A853-1928)—нидерландский математик. 18 В.А. Ильин, Э.Г. Позняк
274 ГЛ. 8. ТЕНЗОРЫ квадрат длины вектора s2 (х)) имеет вид S2(x) = f>*J - it (a:*J- (8-70) г=1 г По терминологии, заимствованной из физики, такие системы коор- координат называются галилеевыми. Преобразования координат, которые сохраняют для s2 (x) выраже- выражение (8.70), называются преобразованиями Лоренца. В следующем пункте мы рассмотрим вопрос о преобразованиях Лоренца пространства Efx Зч, называемого пространством Минков- ского 9). Это пространство представляет особый интерес для физики, ибо является пространством событий специальной теории относитель- относительности. Отметим, что обычно в пространстве Минковского нумерация ко- координат вектора начинается с нуля. Таким образом, согласно (8.70), квадрат s2 (x) интервала в пространстве Efx ^ записывается следую- следующим образом: s2(x) = (ж0J - (ж1J - (ж2J - (ж3J. (8.71) Для удобства в физике координата ж0 отождествляется с выраже- выражением с?, где с —скорость света, a t — временная переменная; ж1, ж2, ж3 называются пространственными переменными. В пространстве Минковского конус Т времениподобных векторов распадается на две различные связные открытые компоненты Т+ (ко- (конус будущего) иТ" (конус прошлого); конус S пространственно по- подобных векторов образует связное множество. Поясним структуру связных компонент Т+ иТ". Для этого обра- обратимся к физической интерпретации вектора х с координатами жг, г = = 0, 1, 2, 3, в пространстве Efx 3y. этот вектор характеризуется ве- величиной At = ж°/с и вектором Аг = {ж1, ж2, ж3}. Таким образом, рассматривая х как перемещение в Ef^ Зч, можно считать, что это пе- перемещение характеризуется временным At и пространственным А г перемещениями. Времениподобные векторы х определяются условием s (х) > 0. В этом случае, очевидно, |Дг|/|Д?| < с. Если при этом At > 0, то для перемещения х получим неравенство 0 < |Дг|/|Д?| < с. Такое пере- перемещение х принадлежит по определению Т+ и может рассматривать- рассматриваться как перемещение материальной частицы «в будущее». Если Д t < 9) Герман Минковский A864-1909)—немецкий математик и физик.
§ 4. МЕТРИЧЕСКИЙ ТЕНЗОР 275 < 0, то перемещение х принадлежит Т~ и может рассматриваться как перемещение частицы «в прошлое» (в физике так интерпретируется движение античастиц). Очевидно, Т+ иТ" представляют собой две связные открытые ком- компоненты конуса Т. Проведенные рассуждения поясняют их наимено- наименования—конус будущего и конус прошлого. 3. Преобразования Лоренца пространства El 3y Рассмотрим в псевдоевклидовом пространстве Ef± Зч галилееву систему координат с базисом е^. В такой системе координат квадрат интервала s2 (x) име- имеет вид (8.71), а матрица {gij) метрического тензора имеет вид J = 10 0 0 0-100 0 0-10 0 0 0-1 3.72) Перейдем к новой галилеевой системе координат с базисом е^ и выясним условия, которым должны удовлетворять коэффициенты Ь\, матрицы В преобразования базисных векторов. Так как е* = 4 е* (8.73) и так как матрица (gi>j>) метрического тензора в базисе е^ также име- имеет вид (8.72), то, используя формулы д^ у — b\,bJ-,gij преобразования координат метрического тензора, получим следующую систему урав- уравнений для определения коэффициентов Ъ\, матрицы В преобразования базисных векторов (см. (8.73); при этом индексы г и г' пробегают зна- значения 0, 1, 2, 3 (см. (8.71)): КJ ~ Е 3 Е W = 0, (8.74) а=1 w = f"!при^; = ^у,/?'= 1,2,з. a = i ( 0 при7'/ /?', Соотношения (8.74) можно записать в матричной форме. Для этой цели рассмотрим наряду с матрицей В матрицу 5*, которая получает- получается из В путем изменения знака у элементов последних трех столбцов и последующего транспонирования. Очевидно, что соотношения (8.74) можно записать в следующей форме: В*В = J, (8.75) 18*
276 ГЛ. 8. ТЕНЗОРЫ где матрица J определяется соотношением (8.72) (для сравнения напо- напомним, что матрица С ортогональных преобразований евклидова про- пространства удовлетворяет соотношению С С = /, где / — единичная матрица). Так как det В* = — det В, a det J = — 1, то из соотношения (8.75) следует, что det В*В = det Б* det В = - (det ВJ = - 1, т. е. det В = ±1. (8.76) Обозначим через L совокупность всех общих преобразований Ло- Лоренца пространства Минковского. Из этих общих преобразований выделим те преобразования, которые переводят каждый вектор из Т+ в вектор, также принадлежащий Т+. Совокупность таких преоб- преобразований обычно называется преобразованиями Лоренца простран- пространства Ef^ Зч и обозначается символом L^. Общие преобразования Лоренца, для которых det В = + 1, обра- образуют класс L+ так называемых собственных преобразований Лоренца. Класс L_ несобственных преобразований Лоренца характеризуется соотношением det В = — 1. Примером такого преобразования может служить отражение относительно трех пространственных осей: х1 = 19' 9 Ч7 Ч JU , JU JU , JU JU . Пусть В — матрица произвольного несобственного преобразования Лоренца, а Р — матрица только что рассмотренного отражения. Оче- Очевидно, произведение произвольного несобственного преобразования и рассмотренного отражения будет собственным преобразованием с мат- матрицей В' = РВ. Так как Р2 = Р • Р = /, где / — единичная матрица, то В = Р2В = Р(РВ) = РВ'. Таким образом, всякое несобственное преобразование Лоренца яв- является произведением некоторого собственного преобразования с матрицей В' и отражения с матрицей Р. Пересечение множеств L^ и L+ обозначают символом L+. Некоторые групповые свойства множеств L, L^, L+ и L+ будут рас- рассмотрены в следующей главе. В заключение найдем те преобразования L+, которые не меняют координат х2 их3. Ясно, что это будут преобразования L+ двумерного псевдоевклидова подпространства с координатами х° и х1, в котором квадрат интервала вычисляется по формуле (ж0J — (ж1J. Запишем для рассматриваемого случая формулы (8.74). Получим (ь°0,J - Ш2 = 1, b°0,b°v - Ъ1,Ъ\, = 0, (8.77) (Ь?,J - (К,J = -1.
i 4. МЕТРИЧЕСКИЙ ТЕНЗОР 277 Полагая Ь^/Щ, = /?, найдем из (8.77) следующие выражения для коэффициентов^, матрицы преобразования В базисных векто- векторов eg, ei, в2, ез в базисные векторы ее, е^, в2', ез^: 1 В этих формулах знак выбирается из условия принадлежности пре- преобразования Лоренца классу L+. Не вникая в детали вычислений, за- запишем окончательные формулы преобразования координат: ж1 - /Зх° 0/ _ х° - /Зх1 X — X1' = х1 = х1 х3' = ж3. $.78) Положим в соотношениях (8.78) х° = с?, х1 = ж, х2 = 2/, ж3 = = z, х ° = = ct', ж1 = ж;, ж2 = у', х3 — zl. Тогда формулы (8.78) перепишутся следующим образом: t — ^х , — Set + ж t' = X = = у, z = z. 3.79) Выясним теперь физический смысл константы р. Допустим, что точка Р неподвижна в системе координат (t', х', 2/, z7). Это озна- означает, что время t' меняется, а пространственные координаты х', у', z; этой точки постоянны. Исследуем вопрос о поведении точки Р отно- относительно системы (?, ж, 2/, г). Дифференцируя последние три урав- уравнения (8.79) и учитывая, что dx' = dy' = бЬ7 = 0, получим 0 = -f3cdt + dx dx dy dz -, 0 = dy, 0 = cb. Поэтому — = /?с, — = 0, — = = 0. Следовательно, всякая точка Р, неподвижная в системе коорди- координат (t', ж;, 2/', z') (а следовательно, и вся эта система координат), движется относительно системы (?, ж, у, z) с постоянной скоро- скоростью v = (Зс в направлении оси Ох. Итак, /3 = v/c, где ^ — скорость движения системы (tf, х'', ^у7, z;) относительно системы (ж, 2/, 2, ?). Отметим, что так как 0 < v < с, то 0</?< 1. Перепишем теперь следующим образом формулы (8.79): f = (8.80)
278 ГЛ. 8. ТЕНЗОРЫ Формулы (8.80) представляют собой формулы перехода от инер- циальной системы (?, ж, у, z) к другой инерциальной систе- системе (?', ж', у', z'). Эти формулы называются формулами Лоренца. § 5. Тензор момента инерции Рассмотрим твердое тело, закрепленное в точке О. Пусть г = = ОМ — радиус-вектор точки М этого тела, v — скорость точки М. Как известно, момент импульса N определяется соотношени- соотношением N = Jv[rv]dm, где У —объем тела, dm = pdV (p — плотность тела). Обозначая через N1 контравариантные координаты вектора N и используя формулу (8.60) для векторного произведения, получим N* = / c\xrkvl dm (8.81) (напомним, что сгк1 = glscsku гДе cski —координаты дискриминантного тензора в данном базисе пространства Е3, см. п. 6 § 3 этой главы). По теореме Эйлера существует мгновенная ось вращения тела. Обозначая через и вектор мгновенной угловой скорости, получим v = [cjr]. Снова обращаясь к формуле (8.60) для векторного произ- произведения, найдем vl = clpnojPrn. (8.82) Подставляя найденное выражение vl в правую часть (8.81) и учи- учитывая независимость ujp от переменных интегрирования, получим сле- следующее выражение для Д^г: \cl r*rnup dm = ojp сгыс[vnr rn dm = up J%. (8.83) Тензор Jp = / сысрпгкгПAт' (8-84) фигурирующий в правой части соотношений (8.83), называется тен- тензором момента инерции. Преобразуем выражение (8.84) для тензора момента инерции. Для этой цели обратимся к формуле (8.65), По этой формуле имеем сысрп = 9кпдгр - 9кр5гп. Поэтому 4 = / (9knSt - gkX)rnrkdm. (8.85)
§ 5. ТЕНЗОР МОМЕНТА ИНЕРЦИИ 279 Если в выражении (8.85) опустить индекс г с помощью метрическо- метрического тензора, то в результате получим часто используемую формулу для координат дважды ковариантного тензора момента инерции: Jip = / (r2giP - гггр) dm. (8.86) Jv Тензор момента инерции широко используется в механике твердого тела. Для примера запишем с помощью этого тензора выражение для кинетической энергии Т. Имеем Т = — v2 dm = — g%jVlv^ dm. 2 Jv 2 Jv Но поскольку v% = clvnujvrn¦, выражение для Т примет вид ^^^dm = ^pujk 1^д^рп^к1гпг1 dm. Отсюда, согласно (8.84), найдем Т = ^ujpujk Jvk.
ГЛАВА 9 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП В этой главе будут изложены основные понятия теории групп и указаны некоторые приложения этой теории. Важность теории групп определяется многочисленными ее прило- приложениями в физике. § 1. Понятие группы. Основные свойства групп 1. Законы композиции. Будем говорить, что в множестве А определен закон композиции, если задано отображение Т упоря- упорядоченных пар элементов из А в множество А. При этом элемент с из А, поставленный с помощью отображения Т в соответствие элемен- элементам а, Ъ из А, называется композицией этих элементов. Композиция с элементов а и Ъ обозначается символом аТЬ: с = аТЬ. Для композиции элементов а, Ъ множества А используются и дру- другие формы записи. Наиболее употребительными являются аддитивная форма записи с = а + Ъ и мультипликативная форма записи с = аЪ. В случае аддитивной формы записи композиции соответствующий закон композиции обычно называется сложением, а при мультиплика- мультипликативной форме — умножением. Закон композиции называется ассоциа- ассоциативным, если для любых элементов а, Ъ, с множества А выполняется соотношение аТ(ЬТс) = (аТЬ)Тс. Закон композиции называется коммутативным, если для любой пары а, Ъ G А выполняется соотношение аТЬ = ЬТа. Элемент е множества А называется нейтральным относительно за- закона Т, если для любого элемента а множества А выполняется соот- соотношение аТе = а. Примерами законов композиции могут служить обычные сложение и умножение в множестве вещественных чисел. Оба эти закона ком- коммутативны. Нейтральным элементом для сложения является нуль, для
§ 1. ОСНОВНЫЕ СВОЙСТВА ГРУПП 281 умножения — единица. 2. Понятие группы. Некоторые свойства групп. Сформули- Сформулируем следующее определение. Определение 1. Множество А, в котором определен закон компо- композиции Т, называется группой G, если этот закон ассоциативен, суще- существует нейтральный элемент е относительно закона Т и для каждого элемента а множества А существует обратный элемент а~ *, т. е. такой элемент, для которого аТа~ х — е. Если использовать мультипликативную форму записи композиции элементов, то определению 1 можно придать следующую форму. Определение 2. Множество А элементов а, Ь, с, ..., в котором определен закон композиции, называемый умножением и ставящий в соответствие каждой паре элементов а, Ъ множества А определенный элемент с = аЪ этого множества, называется группой G, если этот закон удовлетворяет следующим требованиям: 1°) а{Ъс) = {аЪ)с (ассоциативность). 2°) Существует элемент е множества А такой, что для любого эле- элемента а этого множества ае = а (существование нейтрального эле- элемента) . 3°) Для любого элемента а множества А существует обратный эле- элемент а~ 1 такой, что аа~ 1 = е. Обычно нейтральный элемент е называется единицей группы G. Если закон композиции Т, действующий в группе G, является ком- коммутативным, то группа G называется коммутативной или абелевой. Для абелевых групп часто используется аддитивная форма записи композиции элементов. В этом случае нейтральный элемент абелевой группы называется нулем. Рассмотрим примеры групп. 1) Множество Z целых чисел образует абелеву группу относительно сложения. Действительно, операция сложения целых чисел представляет со- собой, очевидно, закон композиции. Ясно, что этот закон ассоциати- ассоциативен и коммутативен. Нейтральным элементом (нулем) является целое число нуль. Обратным элементом для целого числа а служит целое число — а. 2) Множество положительных вещественных чисел образует абеле- абелеву группу относительно умножения. Эта операция представляет собой закон композиции. Очевидно, что этот закон ассоциативен и коммута- коммутативен. Нейтральным элементом является вещественное число единица. Обратным элементом для числа а > 0 служит число 1/а. 3) Линейное пространство образует абелеву группу относитель- относительно сложения элементов. Эта операция представляет собой закон
282 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП композиции. Согласно аксиомам линейного пространства этот закон ассоциативен и коммутативен. Нейтральным элементом является ну- нулевой элемент пространства, обратным элементом для элемента х — элемент — х. 4) Пусть BCD — равносторонний треугольник (см. рис. 9.1). Рас- Рассмотрим следующее множество А операций, совмещающих треуголь- треугольник с самим собой: 1°) Поворот а на 2тг/3 вокруг цен- центра Н, переводящий В в С. 2°) Поворот /? на 4тг/3, переводящий В в D. 3°) Симметрия Si, переводящая С в D. 4°) Симметрия S2, переводящая D в В. 5°) Симметрия S3, переводящая В в С. 6°) Тождественная операция 1. Следующая таблица представляет за- рис кон композиции элементов множества А: 1 а р Si 52 53 1 1 а Р Si 52 53 а а 1 52 Si 52 Р 1 а 53 53 Si Si Si 52 53 1 а Р 52 52 53 Si Р 1 а 53 53 Si 52 а Р 1 (Правило пользования этой таблицей легко усматривается на примере последовательного проведения операций Si, а затем S2: S2S1 = /3. Приведенный закон композиции ассоциативен, но не коммутативен, существует нейтральный элемент — тождественная операция 1. Каж- Каждая операция имеет обратную (в каждой строке и столбце таблицы имеется тождественная операция). Таким образом, множество А операций с указанным законом ком- композиции представляет собой группу, очевидно, не коммутативную. 5) Группы перестановок.
§ 1. ОСНОВНЫЕ СВОЙСТВА ГРУПП 283 Взаимно однозначное отображение / произвольного множества Е на себя называется перестановкой множества Е. При этом всякий элемент а множества Е переходит в элемент / (а), обратная переста- перестановка /~1 переводит / (а) в а. Перестановка / (а) = а для любого а множества Е называется тождественной перестановкой. Если множество Е состоит из элементов а, 6, с, ..., то перестанов- перестановку / этого множества записывают следующим образом: (а Ъ с f(a) f(b) f(c) .. В множестве Р перестановок множества Е естественным образом определяется закон композиции: если Д и /2 — перестановки Е, то по- последовательное проведение Д о Д этих перестановок представляет со- собой некоторую перестановку множества Е. Легко видеть, что компо- композиция ассоциативна. Если множество Р содержит тождественную перестановку, обрат- обратную перестановку для каждой своей перестановки / и вместе с любыми двумя перестановками Д, Д их композицию Д о Д, то, очевидно, Р представляет собой группу. Все перестановки множества Е образуют группу. Для конечного множества Е из п элементов эта группа называется симметричной группой Sn. Обратимся к примеру 4), в котором были рассмотрены операции совмещения равностороннего треугольника BCD с самим собой. Обо- Обозначим через Е множество вершин этого треугольника: Е = (BCD). Очевидно, группу операций , рассмотренную в примере 4), можно получить, обращаясь к следующей группе перестановок: а = s2 = 6) Рассмотрим группу Z2, состоящую из двух элементов 0 и 1, в которой умножение определено по правилу: 0-0 = 0, 0-1 = 1, 1-0 = 1, 1-1 = 0. (9.1) Единицей группы является элемент 0. 1 — _L — Si = в u \ В С с с D D D D С
284 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП Эту группу называют группой вычетов по модулю 2. 7) Рассмотрим группу, состоящую из двух элементов: 1) тожде- тождественное преобразование евклидова пространства (обозначим этот эле- элемент 0); 2) отражение евклидова пространства относительно начала координат (обозначим этот элемент 1). Очевидно, умножение (т. е. последовательное проведение операций 1) и 2)) элементов 0 и 1 будет проводиться по правилу (9.1). Мы видим, что рассматриваемая группа отличается от группы Z^ (пример 6) лишь природой элементов. Групповые свойства этих двух групп одинаковы. Отметим следующие свойства групп (мы будем использовать муль- мультипликативную форму записи композиции). Теорема 9.1. Если аоГ1 — е, то а~ха — е. Доказательство. Пусть х —обратный элемент для элемен- -,-1. та а а хх = е. Тогда а = ае = а(а гх) = (аа 1)ж = еж, т. е. а = еж. Следователь- Следовательно, а~ха — а (еж) = (а~1е)х = а~хх — е, т. е. еа = а. Теорема доказана. Теорема 9.2. Для любого элемента а группы справедливо соот- соотношение еа = а. Доказательство. По теореме 9.1 а а = ей, кроме того, аоГ1 — е. Поэтому еа = (аа~1)а = а(а~1а) = а, т. е. еа = а. Теорема доказана. Теорема 9.3. Если ах = е и ау = е, то х = у. Доказательство. Так как ау = е, то у — обратный элемент для а, и поэтому, согласно теореме 9.1, у а = е. Имеем далее у = — уе — у (ах) = (з/а)ж = еж = ж. Теорема доказана. Из доказанных теорем вытекают следующие важные следствия. Следствие 1. Обратным элементом для элемента а служит элемент а. Или, иначе, элемент а~ 1 является как правым, так и ле- левым обратным элементом для элемента а (т. е. аа~ 1 = е и а~ 1а = = е). Следствие 2. В любой группе уравнения ах = Ъ и у а = Ъ од- однозначно разрешимы. Решениями этих уравнений служат соответ- соответственно элементы х = а~хЬ и у = Ьа~х. Следствие 3. В группе имеется единственный нейтральный эле- элемент (единица группы) (если ае — а и ае*, то е = е*). Замечание. Отметим, что обратным элементом (ab)~ г для про- произведения ab служит элемент Ь~1а~1. Действительно, используя ассоциативное свойство умножения, по- получим (аЬ)(Ь~1а~1) = а(ЬЬ~1)а~1 = аеа~х — аа~х — е.
§ 1. ОСНОВНЫЕ СВОЙСТВА ГРУПП 285 3. Изоморфизм групп. Подгруппы. Примеры, рассмотренные в предыдущем пункте (см. примеры 4 и 5, примеры б и 7) показыва- показывают, что существуют группы, отличающиеся природой своих элементов, но обладающие одинаковыми групповыми свойствами. Такие группы естественно назвать изоморфными. Сформулируем точное определение этого понятия. Определение 1. Две группы G\ и G2 называются изоморфными, если существует взаимно однозначное отображение / группы G\ на группу G2 такое, что для любых элементов а и Ъ из G\ выполняется условие / (ab) = / (а)/ (Ь). Заметим, что если е\— единица группы Gi, а е2 — единица груп- группы G2, то /(ei) = е2. Действительно, /(ei) = f (е\е\) — /(ei) x х / (ei), и умножение на элемент, обратный к / (ei), показывает, что е2 = /(ei). Отметим также, что обратное отображение j~x группы G2 на группу G\ для любых элементов х и у из G2 удовлетворяет условию ГЧху) = Г1(х)Г1(у). Кроме того, для любого а из G\ из равенства е2 = /(ei) = = f(aa~1) = f (a)f (a~1) следует, что обратным к элементу f (а) является элемент / (а~ 1). Таким образом, изоморфные группы, рассматриваемые абстракт- абстрактно, без указания природы их элементов, с точки зрения групповых свойств неразличимы. Замечание 1. Обычно соответствие между изоморфными груп- группами G\ и (?2, называется изоморфизмом или изоморфным отобра- отображением одной группы на другую (конечно, при этом обе группы равноправны). Замечание 2. Изоморфное отображение группы G на себя на- называется автоморфизмом. Автоморфизмы группы определенным образом характеризуют ее симметрию. Если отдельные автоморфизмы группы рассматривать как некото- некоторые элементы, а последовательное проведение автоморфизмов — как произведение соответствующих элементов, то автоморфизмы сами об- образуют группу (единичным элементом будет тождественный автомор- автоморфизм). Эта группа называется группой автоморфизмов данной группы. Легко убедиться, что группа автоморфизмов группы Z^ (см. при- пример б предыдущего пункта) изоморфна этой же группе. Важную роль в теории групп играет понятие подгруппы.
286 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП Определение 2. Подмножество G\ элементов группы G называет- называется подгруппой этой группы, если выполнены условия: 1) если элемен- элементы а и Ъ принадлежат G\, то и аЪ принадлежит G\, 2) если элемент а принадлежит G\, то и обратный элемент а~ г также принадлежит G\. Подгруппа G\ группы G, рассматриваемая как самостоятельное множество, в котором определена операция умножения по закону ком- композиции из объемлющей группы G, представляет собой группу. Проверка этого утверждения не представляет затруднений. Простейшей подгруппой любой группы является ее единичный эле- элемент. Другим примером может служить подгруппа G\ всех четных чисел в группе G относительно сложения всех целых чисел. 4. Смежные классы. Нормальные делители. Пусть Н\ и Н<± — произвольные подмножества группы G. Произведением подмножеств И\ и Н^ назовем подмножество Яз, состоящее из всех элементов вида h\ h^, где h\ G П\, /i2 ? Н^. Для произведения подмножеств используется обозначение #з = #1#2. (9.2) Рассмотрим случай, когда Hi состоит из одного элемента h. Тогда, согласно (9.2), произведение Hi и Н<± можно записать в виде ЪН^. Отметим, что если подмножества Hi и Н<± являются подгруппами группы G, то их произведение Н1Н2, вообще говоря, не является подгруппой. Пусть Н — подгруппа группы G, а —элемент группы G. Множе- Множество аН называется левым смежным классом, а множество На — правым смежным классом подгруппы Н в G. Конечно, при выборе другого элемента вместо а, правые и левые классы подгруппы Н в G, вообще говоря, изменяются. Отметим следующие свойства смежных классов (эти свойства фор- формулируются лишь для левых смежных классов, для правых смежных классов они формулируются аналогично). 1°) Если a G Я, то аН = Н. 2°) Смежные классы аН и ЪН совпадают, если а Ъ G Н. 3°) Два смежных класса одной подгруппы Н либо совпадают, либо не имеют общих элементов. 4°) Если аН — смежный класс, то a G аН. Первое из отмеченных свойств очевидно. Убедимся в справедливо- справедливости свойства 2°). Так как, согласно 1°), а~1ЬН = Я, то, поскольку аа~х — е, имеем ЪН = (аа~1)ЬН = а(а~1Ь)Н = аН. Тем самым свойство 2°) установлено. Перейдем к доказательству третьего свойства. Очевидно, достаточ- достаточно доказать, что если смежные классы аН и ЪН имеют общий элемент,
§ 1. ОСНОВНЫЕ СВОЙСТВА ГРУПП 287 то они совпадают. Пусть элементы hi Е Н и h2 G Н такие, что ahx = bh2. (9.3) (равенство (9.3) означает, что классы аН и ЪН имеют общий эле- элемент). Поскольку Н — подгруппа группы G, то элемент hih^1 при- принадлежит Н. Отсюда и из (9.3) получаем агЧ = /ц/i^1 еН. Следовательно, согласно свойству 2°), аН = ЪН. Свойство 3°) доказано. Свойство 4°) следует из того, что подгруппа Н содержит единич- единичный элемент е, и поэтому ае = a Е аН. Пусть Н — подгруппа G, для которой все левые смежные классы одновременно являются правыми смежными классами. В этом случае для любого элемента а должно иметь место соотношение аН = На. (9.4) Действительно, согласно свойству 4°), элемент a G аН. С другой стороны, класс аН является одновременно некоторым классом НЬ, который, очевидно (в силу того, что a G НЬ), совпадает с множе- множеством На. Подгруппа Н, для которой все левые смежные классы являют- являются правыми смежными классами, называется нормальным делителем группы G. Справедливо следующее утверждение. Если Н — нормальный делитель группы G, то произведение смежных классов представляет собой таксисе смежный класс. Действительно, пусть аН и ЪН — смежные классы. Тогда, по опре- определению произведения смежных классов как подмножеств группы G, с учетом (9.4) получим аНЪН = а(НЪ)Н = а(ЪН)Н = (ab)(HH) = (ab)H, т. е. произведение смежных классов аНЪН есть смежный класс {аЪ)Н. 5. Гомоморфизмы. Фактор-группы. Пусть G — группа с элементами а, 6, с, ... и G — некоторое множе- множество, в котором определен закон композиции его элементов а,Ъ, с, ... Мы будем использовать мультипликативную форму записи компо- композиции: с = afr, a элемент с будем называть произведением элемен- элементов а и Ъ.
288 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП Определение 1. Отображение / группы G на множество G г): f:G^G (9.5) называется гомоморфизмом, если для любых элементов a Е G и Ъ Е G выполняется соотношение f(ab) = f(a)f(b), (9.6) где / (а), / (Ь) и / (аЪ) —образы элементов а,Ьи ab при отображении /. При этом G называется гомоморфным образом G. В случае, если G является подмножеством G, для гомоморфизма (9.5) употребляется наименование эндоморфизм. Замечание, Если задано гомоморфное отображение (гомомор- (гомоморфизм) группы G на множество G, то все элементы группы разбива- разбиваются на непересекающиеся классы: в один класс объединяются все те элементы G, которые отображаются в один и тот же элемент множе- множества G. Справедливо следующее утверждение. Теорема 9.4. Гомоморфный образ группы является группой. Доказательство. Пусть а, 6, с, ... — элементы гомоморфного образа G группы G при гомоморфизме /. Это означает, что в группе G можно указать такие элементы а, 6, с, ..., что а = / (а), Ъ = f (Ь), с = = /(с), ... Тогда в множестве G умножение элементов согласовано с прави- правилом (9.6). Проверим, что эта операция умножения удовлетворяет требовани- требованиям 1°), 2°) и 3°) определения 2 группы (см. п. 2 этого параграфа). 1°) Ассоциативность умножения. Составим два произведения а{Ъс) и (аЪ)с. Имеем, согласно правилу (9.6), а(Ьс) = /(а) (/(&)/(с)) = f(a)f(bc) = f (abc), {al)c = (/ (а) / (Ь)) / (с) = f(ab)f(c) = f (abc). Сопоставляя эти соотношения, получим а{Ъс) = (аЪ)с. Следовательно, ассоциативность умножения элементов выполняется. 2°) Существование единицы. Обозначим символом ё элемент / (е), где е —единица группы G: 1) Под отображением / группы G на множество G понимается такое соответ- соответствие между элементами множеств G n G, при котором каждому элементу а Е G ставится в соответствие лишь один элемент йЕСи каждый элемент а Е G являет- является образом по крайней мере одного элемента из G. Символически отображение G на G записывается с помощью соотношения (9.5)).
§ 1. ОСНОВНЫЕ СВОЙСТВА ГРУПП 289 Для любого элемента а множества G имеем, согласно правилу (9.6), аё = / (а) / (е) = / (ае) = / (а) = а. Следовательно, элемент а действительно играет роль единицы. 3°) Существование обратного элемента. Обозначим символом оГ х элемент /(а), где а—обратный элемент для элемента а в груп- группе G. Имеем, согласно (9.6), аоГ1 — f(a)f(a~1) = f(aa~1) = / (е) = = ё. Следовательно, элемент оГ х играет роль обратного элемента для элемента а. Итак, для операции умножения элементов G выполнены требова- требования 1°), 2°), 3°) определения 2 группы. Поэтому G — группа. Теорема доказана. Пусть i? — нормальный делитель группы G. Определим следую- следующее отображение / группы G на множество G смежных классов по нормальному делителю Н: если а принадлежит G, то этому элементу поставим в соответствие тот класс смежности, которому принадлежит указанный элемент. Согласно свойству 3°) смежных классов (см. пре- предыдущий пункт) каждому элементу группы G при таком отображении отвечает только один класс, т. е. налицо действительно отображение / группы G на множество классов смежности по нормальному делите- делителю Н. Докажем следующую теорему. Теорема 9.5. Указанное выше отображение / группы G на смеж- смежные классы по нормальному делителю Н, при определении умноже- умножения классов смежности как подмножеств группы G, представляет собой гомоморфизм. Доказательство. В конце предыдущего пункта мы доказали утверждение о том, что если аН и ЪН — смежные классы, то про- произведение аНЪН этих классов как подмножеств G есть смежный класс (ab)H. Следовательно, с помощью рассматриваемого отображе- отображения / произведению элементов аЪ ставится в соответствие смежный класс (ab)H, равный произведению смежных классов аН и ЪН. Поэто- Поэтому / — гомоморфизм. Теорема доказана. Следствие. Множество смежных классов группы G по нормаль- нормальному делителю Н с операцией умножения этих классов как подмно- подмножеств G образует группу. Эта группа называется фактор-группой группы G по нормальному делителю Н и обозначается символом G/H. Справедливость следствия вытекает из теоремы 9.4. Замечание. Очевидно, отображение / группы G на множество смежных классов по нормальному делителю Н представляет собой го- 19 В.А. Ильин, Э.Г. Позняк
290 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП моморфизм этой группы на фактор-группу G/H. Рассмотрим следующий пример. Пусть Rn — n-мерное линейное координатное пространство, кото- которое, как отмечалось в примере 3 п. 2 этого параграфа, является абелевой (т. е. коммутативной) группой относительно сложения эле- элементов (напомним, что точками х этого пространства являются упоря- упорядоченные совокупности из п вещественных чисел (xi, ..., жп), причем сложение элементов (xi, ..., хп) и (?/i, ..., уп) производится по прави- правилу (xi + ?/i, ..., хп + уп)). По определению прямого произведения, Rn представляет собой прямое произведение одномерных пространств: Rn = 4)Хй|2)х...хД{п). Так как, например, R\n\ представляет собой абелеву подгруп- подгруппу, то, очевидно, Щп\ — нормальный делитель группы Rn. Смежным классом элемента а из Rn служит прямая, проходящая через точ- точку а параллельно прямой R)ny а фактор-группа Rn/R}^ изоморфна (п — 1)-мерному подпространству Rn~1: й"-1=Д|1)хй|2)х...хД{„_1). (9.7) Отметим, что обозначение фактор-группы Rn/'Щп\ определенным образом объясняется с помощью соотношения RTllR\n) = R\l) Х ДB) X • • • X R\n)lR\n) = R\l) X R\2) X ' ' ' Х R\n- 1)' (9.8) которое следует из (9.7). Отметим, что в формуле (9.8) последний знак равенства нужно рассматривать как изоморфизм между соответст- соответствующими группами. Мы доказали, что по нормальному делителю Н определяется го- гомоморфизм группы G на фактор-группу G/H. Справедливо обратное утверждение: если задан гомоморфизм группы G на множество G, то по этому гомоморфизму определяется такой нормальный делитель Н, что группа G 2) и фактор-группа G/H изоморфны. Докажем две теоремы, относящиеся к этому утверждению. Теорема 9.6. Пусть f — гомоморфизм группы G па G, и пусть Н—множество тех элементов группы G, которые при го- гомоморфизме / отображаются в элемент / (е), где е —единица груп- группы G. Тогда Н —нормальный делитель группы G. 2) Согласно теореме 9.4 гомоморфный образ группы представляет собой группу.
§ 1. ОСНОВНЫЕ СВОЙСТВА ГРУПП 291 Доказательство. Достаточно доказать, что Я — подгруппа группы G и каждый левый смежный класс по этой подгруппе является одновременно и правым смежным классом. Убедимся, во-первых, что Я — подгруппа группы G. Для этого сле- следует доказать, что если a G Я и 5 G Я, то а& G Я, а также что если а е Я, то и оГ1 е Я. Пусть a Е Я и Ъ Е Я. Так как / — гомоморфизм, то / (ab) = = f(a)f(b) = f(e)f(e). Но / (е) играет роль единицы в группе G (см. теорему 9.4). Поэтому / (e)f (е) = / (е), т. е. / (ab) = / (е). Следовательно, ab G Я. Далее пусть a Е Я, т. е. / (а) = / (е). Тогда, если а~х —обратный элемент для а, то аа~ х = е, т. е. аа~ х Е Я. Так как / — гомоморфизм, то/(е) = /(аа-1) = f (a) /(a) =jf(e)/(a) = /(а). Поэто- му / (а~ х) = / (е) и, следовательно, оГ1 G Я. Докажем теперь, что каждый левый смежный класс является од- одновременно и правым смежным классом. Пусть а — произвольный элемент группы G. Докажем, что множе- множество А элементов группы G, отображающихся при гомоморфизме / в элемент / (а), есть одновременно левый и правый смежные классы аН и На. Этим и будет завершено доказательство теоремы. Пусть a' G Н. Рассмотрим уравнение 3) ах = а'. (9.9) Так как / — гомоморфизм и / (af) = /(а), то из этого уравнения получаем / (ах) = / (а) / (ж) = / (а') = /(а), т. е. f (х) = /(е). Поэтому х G Я. Но тогда, согласно (9.9), а; = ах, т. е. а; G аН. Обращаясь далее к уравнению ха = а' и проводя аналогичные рассуждения, мы убедимся, что х G Я. Но тогда а; = жа, т. е. a' G G Яа. Таким образом, А = аЯ = На. Теорема доказана. Теорема 9.7 (теорема о гомоморфизмах групп). Пусть / — гомоморфизм группы G на G и Я — тот нормальный делитель груп- группы G, элементам которого соответствует при гомоморфизме / еди- единица группы G 4). Тогда группа G и фактор-группа G/H изоморфны. Доказательство. Установим взаимно однозначное соответствие между элементами группы G и смежными классами по нормальному делителю Я: элементу а группы G поставим в соответствие тот смеж- смежный класс, который с помощью / отображается в а. Очевидно, что это 3) В силу следствия 2 из теоремы 9.3 это уравнение разрешимо. Решением будет элемент х = а~1а'. 4) По теореме 9.4G представляет собой группу. 19*
292 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП соответствие взаимно однозначно, ибо, согласно свойству 3°) смеж- смежных классов (см. п. 4 этого параграфа), эти классы не пересекаются. Если определить умножение этих классов как подмножеств группы G и воспользоваться утверждением, доказанным в конце предыдущего пункта, то легко видеть, что установленное только что взаимно одно- однозначное соответствие есть изоморфизм. Но классы смежности и есть элементы фактор-группы. Теорема доказана. § 2. Группы преобразований В этом параграфе изучаются группы невырожденных линейных преобразований линейного, и в частности евклидова, пространства. 1. Невырожденные линейные преобразования. В п. 1 § 1 гл. 5 было введено понятие линейного оператора. Напомним, что ли- линейным оператором А называлось такое отображение линейного про- пространства V в линейное пространство W, при котором образ суммы элементов равен сумме их образов и образ произведения элемента на число равен произведению этого числа на образ элемента. Мы будем рассматривать так называемые невырожденные линей- линейные операторы, отображающие данное конечномерное линейное про- пространство V в это же пространство. При этом линейный оператор А называется невырожденным, если det А / 0 5). Отметим следующее важное свойство невырожденных операто- операторов: каждый такой оператор отображает пространство V на себя взаимно однозначно. Иными словами, если А — невырожденный оператор, то каждо- каждому элементу х Е V соответствует только один элемент у Е V, который может быть найден по формуле У = Ах, (9.10) и если у —любой фиксированный элемент пространства V, то суще- существует только один элемент х такой, что у = Ах. Для доказательства второй части сформулированного утвержде- утверждения обратимся к матричной записи действия линейного оператора. Итак, если А = (а^) —матрица оператора А в данном базисе и эле- элементы х и у имеют соответственно координаты х1, ..., хп и у1, ..., уп, 5) Напомним, что det А был введен в п. 2 § 2 гл. 5 как определитель матрицы линейного оператора в данном базисе. Там же было доказано, что значение det A не зависит от выбора базиса.
§ 2. ГРУППЫ ПРЕОБРАЗОВАНИЙ 293 то, согласно формуле E.14) (см. п. 1 § 2 гл.5), соотношение (9.10) пе- перепишется в виде , фр репишется в виде yj = и поэтому координаты хк можно рассматривать как неизвестные при заданных координатах уК Так как оператор А невырожденный, т. е. det A / 0, система уравнений (9.11) имеет единственное решение для неизвестных хк. Это и означает, что для каждого фиксированного эле- элемента у Е V существует только один элемент х такой, что у = Ах. Итак, результат действия невырожденного линейного оператора можно рассматривать как отображение линейного пространства V на себя. Поэтому при заданном невырожденном операторе мы можем го- говорить о невырожденном линейном преобразовании пространства V, или, короче, о линейном преобразовании пространства V. 2. Группа линейных преобразований. Пусть V — n-мерное ли- линейное пространство с элементами х, у, z, ... и GL (п) — множество всех невырожденных линейных преобразований этого пространства. Определим в GL (п) закон композиции, который в дальнейшем бу- будем называть умножением. Мы определим умножение линейных пре- преобразований из GL (п) так же, как было определено в п. 2 § 1 гл. 5 умножение линейных операторов. Именно, произведением АВ линейных преобразований А и В из множества GL (п) мы назовем линейный оператор, действующий по правилу (АВ)х = А(Вх). (9.12) Отметим, что, вообще говоря, АВ ф ВА. Для того чтобы указанное произведение действительно было за- законом композиции (см. п. 1 § 1 этой главы), достаточно доказать, что преобразование АВ является невырожденным, а это следует из то- того, что матрица линейного преобразования АВ равна произведению матриц преобразований А и В, а следовательно, det (АВ) = det A x х det В ф 0, ибо det А ф 0 и det В ф 0. Докажем теперь следующую теорему. Теорема 9.8. Множество GL (п) невырожденных линейных пре- преобразований линейного п-мерного пространства V с введенной выше операцией умножения представляет собой группу {называемую груп- группой линейных преобразований линейного пространства V). Доказательство. Проверим требования 1°), 2°), 3°) определе- определения 2 группы (см. п. 2 § 1 этой главы).
294 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП 1°) Ассоциативность умножения, т. е. равенство А(ВС) = (АВ)С справедливо, поскольку, согласно F.12), произведение линейных пре- преобразований заключается в их последовательном действии, и поэто- поэтому линейные преобразования А(ВС) и (АВ)С совпадают с линейным преобразованием ABC и, следовательно, тождественны. 2°) Существование единицы. Обозначим символом I тождествен- тождественное преобразование. Это преобразование невырожденное, так как det 1=1. Очевидно, для любого преобразования А из GL(n) спра- справедливо равенство AI = IA = А. Следовательно, линейное преобразование I играет роль единицы. 3°) Существование обратного элемента. Пусть А —любое фикси- фиксированное невырожденное линейное преобразование. Обратимся к коор- координатной записи (9.11) этого преобразования. Так как det А ф 0, то из системы (9.11) можно по заданному у (по заданным координатам у3) единственным образом определить х (координаты хк). Следовательно, определено обратное преобразование А, которое, очевидно, будет линейным (это следует из (9.11)); кроме того, по самому определению А А = I. Поэтому линейный оператор А играет роль обратного элемента для А. Итак, для операции умножения элементов из GL (п) выполнены требования 1°), 2°), 3°) определения 2 группы. Поэтому GL(n) — группа. Теорема доказана. 3. Сходимость элементов в группе GL(n). Подгруппы группы GL (п). В этом и дальнейших пунктах этого параграфа мы будем рассматривать группу GL (п) в n-мерном евклидовом простран- пространстве V. Введем понятие сходимости в группе GL (п). Определение. Последовательность элементов {Ап} из GL (п) на- называется сходящейся к элементу A Е GL (п), если для любого х из V последовательность {Апх} сходится к Ах 6) . Понятие сходимости в GL (п) мы используем ниже при введении так называемых компактных групп. Рассматривают следующие типы подгрупп группы GL (п). 1°) Конечные подгруппы, т. е. подгруппы, содержащие конечное число элементов. 6) Последовательность {Апх} представляет собой последовательность точек пространства V. Поэтому сходимость последовательности {Апх} понимается в обычном смысле.
§ 2. ГРУППЫ ПРЕОБРАЗОВАНИЙ 295 Примером конечной подгруппы может служить подгруппа отра- отражений относительно начала координат, содержащая два элемента — тождественное преобразование и отражение относительно начала (см. пример 7 п. 2 § 1 этой главы). 2°) Дискретные подгруппы, т. е. подгруппы, содержащие счетное число элементов. Примером такой подгруппы может служить подгруппа поворотов плоскости около начала координат на углы kcp, k = 0, ±1, ±2, ..., где ср — угол, несоизмеримый с тг. 3°) Непрерывные подгруппы, т. е. подгруппы, содержащие более чем счетное число элементов. Подгруппа всех поворотов трехмерного пространства вокруг фик- фиксированной оси представляет собой пример непрерывной подгруппы. Среди непрерывных подгрупп группы GL (п) выделяются так на- называемые компактные подгруппы, т. е. подгруппы, у которых из лю- любого бесконечного множества ее элементов можно выделить последо- последовательность, сходящуюся к элементу этой подгруппы. 4. Группа ортогональных преобразований. В группе GL (п) выделяется специальная подгруппа так называемых ортогональных преобразований. Эти преобразования, рассматриваемые как отдельное множество, образуют группу, называемую ортогональной группой. Введем понятие ортогональных преобразований. Напомним, что мы рассматриваем невырожденные линейные пре- преобразования. Понятие такого преобразования равнозначно поня- понятию невырожденного оператора, т. е. оператора А, для которого det A/0. Напомним теперь введенное в § 9 гл. 5 понятие ортогонального опе- оператора, действующего в вещественном евклидовом пространстве V. Именно, линейный оператор Р мы назвали ортогональным, если для любых х и у из У справедливо соотношение (Рх, Ру) = (х, у). (9.13) Результат действия ортогонального оператора Р будем называть ортогональным преобразованием Р. В теореме 5.36 было доказано, что оператор Р является ортогональ- ортогональным тогда и только тогда, когда существует обратный оператор Р~ 1 и выполняется равенство Р-1 = Р*. (9.14) В этом равенстве Р* —оператор, сопряженный к Р.
296 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП Таким образом, если преобразование Р является ортогональным, то у этого преобразования есть обратное Р~ 1. Отсюда следует, что ка- каждое ортогональное преобразование является невырожденным. Дей- Действительно, поскольку РР~ 1 = I, где I — тождественное преобразова- преобразование, то det P-det P = det 1 = 1, т. е. det Р / 0. Следовательно, ортогональное преобразование Р невы- невырожденное. Отметим следующее важное свойство ортогональных преобразова- преобразований. Теорема 9.9. Множество всех ортогональных преобразований ев- евклидова пространства V с обычной операцией умножения линейных преобразований образует группу, называемую ортогональной группой и обозначаемую символом О (п). Доказательство. Достаточно доказать, что произведение ор- ортогональных преобразований представляет собой ортогональное пре- преобразование. Существование обратного преобразования (обратного элемента) для данного ортогонального преобразования доказано в те- теореме 5.36 (см. также только что сделанное замечание). Итак, пусть Pi и Р2 —ортогональные преобразования. Рассмотрим произведение Р1Р2. Согласно теореме 5.36 нам достаточно доказать соотношение (Р1Р2)(Р1Р2)* = I. (9.15) В п. 1 § 5 гл. 5 (см. свойство 5°) сопряженных операторов) мы уста- установили, что (Р1Р2)* = Р^Р*- Используя это соотношение и ортого- ортогональность преобразований Pi и Р2, получим (PiP2)(PiP2)* = (PiP2)(P;P*) = = Pi(P2P;)P* = PilPt = PiPJ = I. Таким образом, соотношение (9.15) доказано. Теорема доказана. Замечание 1. Очевидно, ортогональная группа является под- подгруппой группы GL (п). Замечание 2. Значение определителя det P ортогонального преобразования Р удовлетворяет соотношению (det РJ = 1. (9.16) Таким образом, det P = ±1. (9.17)
§ 2. ГРУППЫ ПРЕОБРАЗОВАНИЙ 297 Для доказательства (9.16) заметим, что для матрицы Р преобразо- преобразования Р справедливо соотношение РР' = /, (9.18) где Р' — транспонированная матрица, полученная из Р перестановкой строк и столбцов, а / — единичная матрица. Так как det Р = det P' (при перестановке строк и столбцов опре- определитель не меняется) и det / = 1, то из соотношения (9.18) следует, что (det РJ = 1, т. е. det P = =Ы. Поскольку, по определению, det P вводится как определитель матрицы Р в любом базисе, то соотноше- соотношения (9.16) и (9.17) доказаны. Соотношение (9.17) для определителя ортогонального преобразо- преобразования служит основой для разделения всех таких преобразований на два класса. В первый класс мы отнесем все ортогональные преобразования, для которых det Р = + 1. Эти преобразования в дальнейшем будем называть собственными. Во второй класс отнесем все ортогональные преобразования, для которых det P = — 1. Такие преобразования будем называть несоб- несобственными. Множество всех собственных ортогональных преобразований об- образует группу, называемую собственной ортогональной группой. Эта группа обозначается символом 50 (п). Можно доказать, что каждая группа 50 (п) компактна. 5. Некоторые дискретные и конечные подгруппы ортого- ортогональной группы. В этом пункте мы не будем стремиться к полноте изложения. На отдельных примерах мы постараемся выяснить харак- характеристики некоторых подгрупп ортогональной группы. Отметим, что конечные и дискретные подгруппы группы О C) име- имеют важное значение в кристаллографии. 1°) Рассмотрим двумерную ортогональную группу 0B). В этой группе можно выделить дискретную подгруппу поворотов на угол kip, к = О, =Ь 1, ± 2, ... Обозначим буквой а элемент этой подгруппы, отвечающий значе- значению к = + 1. Тогда, очевидно, элемент а/., отвечающий повороту на угол к(р при к > 0 равен а/. = а • а.. .а. Это соотношение можно со- к раз кращенно записать в следующей форме: ак = ак, к = 1, 2, ... Если обозначить символом а~1 элемент, обратный элементу а (а—элемент, отвечающий повороту на угол —ф), и единицу рас-
298 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП сматриваемой подгруппы обозначить ао, то, очевидно, любой эле- элемент ctk при отрицательном, положительном и нулевом значении к можно записать в виде ак = ак, к = 0, ±1, ±2, ... (9.19) Группы, элементы а/, которых могут быть представлены в виде (9.19), называются циклическими. Очевидно, что циклические группы являются дискретными. Отметим два типа циклических подгрупп поворотов: 1) если if ф 27rp/q, где р и q — целые числа (т. е. угол несоизмерим с тг), то все элементы а/, различны. 2) если ер = 2тгр/д, где р и q — взаимно простые числа, то справед- справедливо соотношение а^ + д = а/., то есть aq = а0. Группы, для которых выполняется последнее соотношение, назы- называются циклическими группами порядка q. 2°) Обратимся теперь к так называемым подгруппам зеркальной симметрии. Каждая подгруппа зеркальной симметрии состоит из двух элемен- элементов: единица (тождественное преобразование) и отражение либо отно- относительно какой-либо плоскости, либо относительно начала координат. Убедиться в том, что тождественное преобразование и отражение образуют группу, весьма просто — достаточно заметить, что два по- последовательных отражения дают тождественное преобразование (см. пример 7 п. 2 § 1 этой главы). Рассмотрим, например, подгруппу {I, P} группы О C), состоящую из единицы I и отражения Р трехмерного пространства относитель- относительно начала координат. В ортонормированием базисе матрица Р этого / \ -10 0 преобразования имеет вид Р = 0-1 0 \ и и — 1 Так как определитель det Р = — 1, то подгруппа {I, P} является несобственной. В примере 7 п. 2 § 1 этой главы отмечалось, что под- подгруппа {I, P} изоморфна группе Z^ вычетов по модулю 2. Докажем следующее утверждение. Рассматриваемая подгруппа {I, P} представляет собой нормаль- нормальный делитель группы О C). Нам требуется доказать, что для любого элемента а из О C) спра- справедливы соотношения о! = 1а, аР = Ра (9.20)
§ 2. ГРУППЫ ПРЕОБРАЗОВАНИЙ 299 (эти соотношения показывают, что левый и правый смежные классы подгруппы {I, P} совпадают, что является признаком нормального де- делителя) . Первое из соотношений (9.20) очевидно. Для доказательства второго соотношения воспользуемся следую- следующими очевидными свойствами отражения Р: РР = I, РаР = а, ае 0C). Умножая соотношение РаР слева на Р и пользуясь равен- равенством РР = I, получим второе соотношение (9.20). Докажем теперь следующее утверждение. Подгруппа SO C) собственных ортогональных преобразований группы О C) изоморфна фактор-группе группы О C) по нормально- нормальному делителю {I, P}. Доказательство. Смежный класс элемента a Е 50C) по под- подгруппе {I, P} имеет вид {а, Ра}, причем Ра — несобственное преобра- преобразование (произведение собственного преобразования а и несобственно- несобственного преобразования Р дает несобственное преобразование). Если а' — несобственное преобразование, то смежный класс {а', Ра7} приводится к виду {а, Ра}, где а = Ра'— собственное преоб- преобразование и Ра = Р(Ра') = (РР)а' = а'. Таким образом, фактор-группа О C/{I, P}) состоит из смежных классов вида {а, Ра}, где а — собственное преобразование. Очевид- Очевидно, что соответствие а •<->¦ {а, Ра} есть изоморфизм между группами SO C) и О C)/{I, P}. Утверждение доказано. 6. Группа Лоренца. В п. 1 § 4 гл. 8 мы ввели понятие псевдоев- псевдоевклидова пространства Е? ч, т. е. линейного пространства, в котором задано скалярное произведение (х, у), равное невырожденной симмет- симметричной билинейной форме А (х, у), полярной знакопеременной квад- квадратичной форме А (х, х): (х, х) = А(к, х). (9.21) В п. 2 § 4 гл. 8 было отмечено, что в так называемой галилеевой системе координат квадрат интервала s2 (х) = (х, х) (9.22) (так обычно называется квадрат длины вектора х с координата- координатами (xi, X2, • •., хп)) имеет вид р п г=1 i=p+l
300 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП Введем понятие преобразования Лоренца псевдоевклидова про- пространства Е? ч. Определение. Линейное преобразование Р псевдоевклидова про- пространства Е? ч называется преобразованием Лоренца, если для лю- любых х и у из Е? ч справедливо соотношение (Рх, Ру) = (х, у), (9.24) где (х, у)—скалярное произведение, определенное соотношени- соотношением (9.21). Равенство (9.24) называется условием лоренцовости преобразо- преобразования. Отметим, что при преобразовании Лоренца сохраняется квадрат интервала s2 (x), определенный соотношением (9.22) (или (9.23)). Так же, как в п. 4 этого параграфа, можно доказать, что определи- определитель det P преобразования Лоренца отличен от нуля, и поэтому для каждого преобразования Лоренца Р существует обратное преобразо- преобразование Р~ 1. Кроме того, по самому смыслу определения преобразования Лорен- Лоренца, произведение таких преобразований дает в результате преобразо- преобразование Лоренца. Таким образом, справедливо следующее утверждение. Множество всех преобразований Лоренца псевдоевклидова про- пространства EV ч с обычной операцией умножения линейных преобра- преобразований (линейных операторов) образует группу, называемую общей группой Лоренца псевдоевклидова пространства Е? ч и обозначае- обозначаемую символом L (n; р, q). Мы выделим специальный класс псевдоевклидовых пространств Е?х п_1\ (сюда включается интересное с физической точки зрения пространство Et Зч). Группа Лоренца для пространств Е?х п_1\ обозначается че- через L (п). В п. 1 § 4 гл. 8 (формула (8.69)) было введено понятие длины а (х) вектора х, которая вычисляется по формуле а(х) = (signs2 (x))V|s2(x)|. С помощью этой формулы все ненулевые векторы псевдоевкли- псевдоевклидова пространства разделяются на времениподобные (а (х) > 0), пространственноподобные (а (х) < 0) и изотропные (а (х) = 0). Было доказано, что множество концов времениподобных (простран- ственноподобных, изотропных) векторов, начала которых совпадают с произвольной фиксированной точкой, образует конус Т (конус про- странственноподобных векторов обозначается буквой S). Конус Т по
§ 2. ГРУППЫ ПРЕОБРАЗОВАНИЙ 301 соглашению 7) разделяется на две связные компоненты Т+ иГ" (ко- (конус будущего и конус прошлого) так, что каждая из этих компонент вместе с вектором х содержит любой вектор Лх, где Л > 0. Описанное разделение векторов в псевдоевклидовом простран- пространстве дает возможность выделить из группы Лоренца L (п) некоторые подгруппы. Именно, подгруппа группы L (п), преобразования которой перево- переводят любой времениподобный вектор снова во времениподобный век- вектор, называется полной группой Лоренца. Для нее используется обо- обозначение L^ (п). Выделяется еще одна подгруппа группы L (п). В эту подгруппу входят преобразования, определитель матрицы которых положителен. Эта подгруппа обозначается L+ (n) и называется собственной группой Лоренца. Собственные преобразования Лоренца, которые принадлежат под- подгруппе L^ (n), также образуют подгруппу. Ее часто называют группой Лоренца и обозначают символом L+ (п). В заключение этого пункта мы отметим, что группы Лоренца, в отличие от ортогональных групп, некомпактны ). Для примера докажем некомпактность группы L+ B). В п. 3 § 4 гл. 8 мы полностью описали эту группу. Напомним, что если в Е?г ^ введена система координат (ж, у) так, что квадрат интер- интервала задается формулой s2 = х2 - у2, (9.25) то преобразования Лоренца из группы L+ B) пространства Е2 2Х ^ за- 7) В п. 2 § 4 гл. 8 для пространства Минковского Ef± s, указано, как разделя- разделяется конус Т на связные компоненты Т+ и Т~, и дается физическая интерпретация этих компонент. 8) В п. 3 этого параграфа было введено понятие сходимости элементов в груп- группу GL (п) в n-мерном евклидовом пространстве и связанное с понятием сходимости понятие компактной группы. Эти понятия легко переносятся на случай группы в произвольном конечномер- конечномерном линейном пространстве V. Сначала вводится понятие сходимости точек в V (например, можно выбрать в V систему координат и рассматривать сходимость последовательности векторов {хт} как сходимость последовательностей коорди- координат этих векторов). После этого в полной аналогии с определением сходимости в случае группы GL (п) в евклидовом пространстве вводится понятие сходимости в группе, заданной в линейном пространстве, и определяется понятие компактной группы в таком пространстве.
302 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП даются формулами пг — Rn 11 — Rnr (9.26) Рассмотрим в плоскости (ж, у) вектор х с координатами @, 1). По фор- формуле (9.26) этот вектор перейдет в вектор х^ с координатами (9.27) Обратимся теперь к последовательности преобразований Лорен- Лоренца (9.26), определяемой значениями /?п из соотношения 1-/J2 = I, п = 1,2,... (9.28) Согласно (9.27) и (9.28) вектор х перейдет при действии указанной последовательности преобразований Лоренца в следующую последова- последовательность векторов {хп} с координатами (-у/п - 1, Vn). (9.29) Таким образом, из бесконечной последовательности преобразова- преобразований Лоренца в группе L+ B), определенной соотношениями (9.26), для значений /3 из равенств (9.28) нельзя выделить сходящуюся последо- последовательность (напомним, что последовательность элементов Ап груп- группы называется сходящейся к элементу А, если для любого х после- последовательность {Апх} сходится к Ах), ибо последовательность (9.29) неограниченная. Геометрическая иллюстрация некомпактности группы L+ B) за- заключается в следующем. Согласно (9.25) окружность радиуса единица в псевдоевклидовой плоскости будет гиперболой х2 — у2 = 1, являющейся некомпактным множеством. При действии рассмотренной выше последовательности преобразований из группы L+ B) заданная точка на этой окружности преобразуется в бесконечно большую последовательность точек на ука- указанной выше гиперболе, а из бесконечно большой последовательности точек нельзя выделить сходящуюся последовательность. 7. Унитарные группы. В этом пункте мы обратимся к ком- комплексному линейному пространству. В полной аналогии с п. 2 этого параграфа можно рассматривать группы линейных преобразований такого пространства. Так как комплексное число определяется двумя
§ 3. ПРЕДСТАВЛЕНИЯ ГРУПП 303 вещественными числами (действительной и мнимой частью), то пол- полная линейная группа GL (п) преобразований n-мерного комплексного линейного пространства изоморфна полной линейной группе преобра- преобразований вещественного 2п-мерного пространства GL Bп) (вместо это- этого символа часто пишут GL Bп, Л), подчеркивая тем самым, что речь идет о группе преобразований вещественного пространства). В полной линейной группе преобразований комплексного евклидо- евклидова пространства по аналогии с вещественным евклидовым простран- пространством рассматриваются так называемые унитарные группы U (п), яв- являющиеся аналогом ортогональных групп (напомним, что в § 7 гл. 5 унитарные преобразования (унитарные операторы) определялись как линейные преобразования, сохраняющие скалярное произведение; та- таким же образом в вещественном случае определялись и ортогональные преобразования). Как и в вещественном случае, в группе U (п) унитарных преоб- преобразований выделяется подгруппа SU (п), для которой определители унитарных преобразований равны единице. § 3. Представления групп В предыдущем параграфе мы рассматривали группы линейных преобразований линейного пространства. Таким образом, линейные преобразования исследовались с точки зрения их групповых свойств. При этом не игнорируются геометрические и другие свойства линей- линейных преобразований. В этом параграфе нас будет интересовать в определенном смысле обратный вопрос — в какой мере свойства абстрактно заданной группы могут быть охарактеризованы посредством групп линейных преобра- преобразований. Один из способов решения этого вопроса заключается в гомоморф- гомоморфном (и в частности, изоморфном) отображении абстрактной группы на подгруппу (или на всю группу) линейных преобразований. Таким образом, возникает понятие представления данной группы с помощью подгруппы группы линейных преобразований 9). Изучение различных представлений данной группы позволяет вы- выявить важные свойства группы, нужные для различных приложений. Во многих разделах физики (кристаллография, теория относитель- 9) Конечно, можно рассматривать и более общий вопрос о представлении дан- данной группы путем отображения ее на какую-либо группу преобразований.
304 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП ности, квантовая механика и т. д.) требуется построение представлений различных групп (конечных и дискретных подгрупп группы GL C), групп О C), L C), U C), SU C) и т. д.). Эти построения выходят дале- далеко за рамки начальных понятий теории групп и не могут рассматри- рассматриваться в данном руководстве. Мы ограничимся некоторыми понятиями, используемыми в теории представлений, и примерами. 1. Линейные представления групп. Терминология. Определение. Линейным представлением группы G в конечно- конечномерном евклидовом пространстве Еп называется такое отображение /, посредством которого каждому элементу а этой группы ставится в со- соответствие линейное преобразование Та пространства Еп так, что для любых а\ и а2 из G выполняется соотношение T(aiCL2) = TaiTa2. Таким образом, линейное представление группы G в конечно- конечномерном евклидовом пространстве Еп есть гомоморфизм этой груп- группы на некоторое подмножество линейных преобразований этого пространства. Используется следующая терминология: пространство Еп называ- называется пространством представления, размерность п этого простран- пространства называется размерностью представления, базис в простран- пространстве Еп называется базисом представления. Заметим, что гомоморфный образ / (G) группы G также называ- называется представлением этой группы в пространстве представлений. В дальнейшем для краткости n-мерные линейные представления группы мы будем называть просто представлениями этой группы. Для обозначения представления группы G используется сим- символ D (G); различные представления данной группы отмечаются ин- индексом (например, D^) (G)). Символом D^) (g) будем обозначать линейное преобразование (линейный оператор), отвечающее элемен- элементу g Е G в представлении D^) (G). Тривиальным представлением группы G называется гомоморфное отображение G в единичный элемент группы GL (п). Если отображение / группы G на подгруппу GL (п) является изо- изоморфизмом, то представление называется точным. Очевидно, что не у всякой группы есть точное n-мерное представ- представление для заданного п. Например, у группы О A0), конечно, не может быть точного одномерного представления (это следует, в частности, из того, что группа О A) абелева, а группа О A0) —не абелева). Отметим, что при гомоморфном отображении / группы G в GL (п) получающееся представление группы изоморфно фактор- факторгруппе G/kern/, где kern/ —так называемое ядро гомоморфизма /, т. е. то множество элементов G, которое при гомоморфизме / отобра-
§ 3. ПРЕДСТАВЛЕНИЯ ГРУПП 305 жается в единицу группы GL (п). 2. Матрицы линейных линейных представлений. Эквива- Эквивалентные представления. Рассмотрим представление D^) (G) груп- группы G. В этом представлении каждому элементу д из G отвечает ли- линейное преобразование D^) (g). Матрицу этого линейного преобразо- преобразования в базисе представления D^) (G) мы будем обозначать D^1- (д) или D\? (g). В зависимости от выбора базиса в пространстве представлений бу- будет меняться и матрица D^ (g), отвечающая элементу д. Естественно поэтому возникает вопрос об эквивалентных представлениях группы в одном и том же пространстве. Сформулируем определение эквива- эквивалентности представлений. Определение. Представления D^1) (G) и D^2) (G) группы G в одном и том же пространстве Еп называются эквивалентными, если существует такое невырожденное линейное преобразование С пространства Еп, что для каждого элемента g Е G справедливо со- соотношение D^ (g) = С~ХВ^ (g)C. Понятие эквивалентности играет важную роль в теории представ- представлений, главным образом в перечислении и классификации представ- представлений. Выбор базиса в пространстве представлений важен еще и потому, что в каком-либо базисе матрицы, отвечающие элементам группы, мо- могут иметь стандартный, достаточно простой вид, который позволяет сделать важные заключения об исследуемом представлении. В сле- следующем пункте мы дадим некоторую классификацию представлений, опираясь на специальный вид матриц. 3. Приводимые и неприводимые представления. В этом пункте мы обсудим вопрос о том, при каких условиях данное пред- представление D (G), заданное в пространстве Еп, индуцирует в подпро- подпространстве Е' этого пространства представление D (G). Этот вопрос тесно связан с вопросом об описании данного пред- представления с помощью более простых представлений, которые имеют меньшую размерность, чем заданное. С решением поставленного вопроса тесно связано понятие инвари- инвариантного подпространства линейного преобразования (линейного опе- оператора) . Напомним, что подпространство Е' называется инвариантным под- подпространством линейного оператора А, если для каждого элемента х из Е' элемент Ах принадлежит Е' (см. § 3 гл. 5). Иными словами, под- подпространство Е' инвариантно, если действие оператора А на элемен- элементы этого подпространства не выводит их из этого подпространства. 20 В.А. Ильин, Э.Г. Позняк
306 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП Отметим, что само пространство Еп и нулевой элемент пространства являются инвариантными подпространствами любого линейного опе- оператора. Можно ввести понятие инвариантного подпространства для пред- представления D(G). Именно, подпространство Е' называется инвари- инвариантным для представления D (G), если оно инвариантно для всякого оператора из D (G). Очевидно, что на инвариантном подпространстве представле- представления D (G) индуцируется некоторое представление D (G). Следует от- отметить, что представление D (G) не сводится к представлению D (G), если инвариантное подпространство Е' не совпадает с Еп. Поясним теперь понятие приводимого представления. Пусть, на- например, все матрицы некоторого трехмерного представления D (G) имеют вид \ ОЬ\\ Q-12 • Q-13 (9.30) О 0 : а33 / где^1, ^2, Аз и О соответственно обозначают матрицы f а^ а^ J, ( &23 )' (аз3)' @> 0)- Легко проверить, что произведение матриц ви- да (9.30) подчиняется закону А[А'{ О : А" V О т. е. произведение матриц вида (9.30) есть матрица вида (9.30). Более того, при умножении матриц этого вида изолированно перемножаются матрицы А[ и А![ и матрицы А'3 и А'%. Таким образом, мы видим, что матрица А\ = ( ^1: ^12 ) об- образует двумерное представление рассматриваемой группы, а матри- матрица А^ = (азз) образует одномерное представление этой же группы. В таких случаях говорят, что представление D (G) приводимо. Если все матрицы (речь идет о квадратных матрицах порядка п) операторов представления имеют вид (9.31)
§ 3. ПРЕДСТАВЛЕНИЯ ГРУПП 307 где А\ и Аъ — квадратные матрицы, вообще говоря, разных порядков, то ясно, что матрицы А\ и А<± образуют представления, сумма размер- размерностей которых равна п. В этом случае представление называется вполне приводимым. От- Отметим, что операторы, матрицы которых имеют вид (9.31), факти- фактически редуцируются к двум операторам, действующим независимо в двух инвариантных подпространствах. Заметим также, что представление, индуцируемое на инвариант- инвариантном подпространстве данным представлением D (G), называется ча- частью представления D (G). В заключение этого пункта сформулируем понятие неприводимого представления. Представление D (G) группы G называется неприводимым, если у этого представления существуют лишь два инвариантных подпро- подпространства: Еп и О. В противном случае представление называется приводимым. Роль неприводимых представлений заключается в том, что любое представление может быть выражено через неприводимые. 4. Характеры. В теории представлений групп, и в особенности в теории представлений конечных групп, полезную роль играют инва- инварианты линейных преобразований, образующих представление. Важ- Важность инвариантов ясна еще и потому, что они не зависят от выбора базиса представления и поэтому в определенном смысле характеризу- характеризуют представление. Пусть D (G) — n-мерное представление группы G и Dl- (g) — матрица оператора, отвечающего элементу д из G. Характером элемента д Е G в представлении D (G) называется число X Ы = D) (д) = D{ (д) + D\ (д) + ... + Dnn (g). Таким образом, характер элемента д есть след матрицы опера- оператора D (g). Так как след матрицы линейного оператора представляет собой ин- инвариант (см. п. 3 § 2 гл.5), то характер любого элемента не зависит от базиса представления и поэтому является инвариантом. Итак, каждому элементу g G G представления D (G) отвечает чис- число—характер этого элемента. Поскольку у различных элементов могут быть одинаковые харак- характеры, то следует выяснить вопрос о том, каким элементам группы отвечают одинаковые характеры. Для решения этого вопроса введем понятие сопряженных элементов и классов сопряженных элементов в данной группе G. 20*
308 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП Элемент Ъ Е G называется сопряженным элементу a Е G, если существует такой элемент и Е G, что uavT1 = Ь. (9.32) Отметим следующие свойства сопряженных элементов. 1) Каждый элемент а сопряжен самому себе. Действительно, если е — единица группы, то, очевидно, справедливо соотношение еае~1 = = а, которое и означает, что а — элемент, сопряженный а. 2) Если элемент Ъ сопряжен элементу а, то элемент а сопряжен элементу Ъ. Это свойство сразу же вытекает из (9.32). Действитель- Действительно, умножая обе части (9.32) слева на и~ х и справа на и, получим и~гЬи = а. Замечая, что обратным элементом для элемента и~г яв- является элемент и, мы убедимся в справедливости сформулированного свойства. 3) Если Ъ — сопряженный элемент для а и с — сопряженный эле- элемент для 6, то с — сопряженный элемент для а. Действительно, так как с = vbv~1 и Ъ = иаи-1, то, очевидно, с = vuau~1v~1. (9.33) Так как обратным элементом для элемента vu является эле- элемент и~ xv~ 1, то из (9.33) следует, что элемент с сопряжен элементу а. Объединим в один класс все те элементы группы, которые сопряже- сопряжены данному элементу а. Таким образом, согласно свойству 3), каждый элемент класса сопряжен любому элементу этого класса. Очевидно, два таких класса либо совпадают, либо не имеют общих элементов. Вернемся теперь к представлениям групп. Пусть а и Ъ — сопряженные элементы, т. е. справедливо соотноше- соотношение (9.32): Ь = иаи~х. (9.32) Обратимся к операторам D(a), D(b), D (и) и D^1). Согласно определению представления группы оператор D (и~1) является обрат- обратным для оператора D (и), т. е. D (и~ х) = (D (и))~ 1. Обращаясь опять к определению представления, получим, согласно (9.32), соотношение D (Ь) = D (и) D (a) (D (и))-1. Перейдем теперь к матрицам операторов, фигурирующих в послед- последнем соотношении. Мы видим, что матрицу оператора D (Ь) можно рас- рассматривать как матрицу оператора D (а) при переходе к новому бази- базису с матрицей перехода D (и) (см. п. 2 § 2 гл. 5). Поскольку при таких преобразованиях след матрицы инвариантен и по определению равен характеру элемента, мы можем заключить, что % (а) — х (&)•
3. ПРЕДСТАВЛЕНИЯ ГРУПП 309 Итак, характеры всех элементов, принадлежащих одному классу сопряженных элементов, равны друг другу. Очевидно также, что характеры элементов для эквивалентных представлений совпадают. Понятие характера в теории представлений используется обычно следующим образом. Пусть данная группа G может быть разбита на конечное число раз- различных классов сопряженных элементов К\, К<±, ..., Kv. Тогда каж- каждому элементу класса Ki в данном представлении D (G) (и в любом эк- эквивалентном ему представлении) отвечает один и тот же характер Хг- Поэтому представление D (G) можно описать с помощью набора ха- характеров %i, %2? • • •? Xv-> который можно рассматривать как координа- координаты вектора в евклидовом пространстве размерности v. Таким образом, различным представлениям будут отвечать различные векторы. Указанный геометрический подход позволяет во многих случаях решать важные вопросы теории представлений групп. 5. Примеры представлений групп. Пример 1. Пусть G — группа симметрии трехмерного простран- пространства, состоящая из двух элементов: тождественного преобразования I (единица группы) и отражения Р относительно начала координат. Та- Таким образом, G = {I, P}. Умножение элементов группы задается следующей таблицей: (9.34) 1) Одномерное представление группы G. Выберем в пространстве Е1 базис ei и рассмотрим матрицу линейного невырожденного преобразования А^1) в этом пространстве: А^1) = A). Очевидно, преобразование А^1) образует подгруппу в груп- группе GL A) линейных преобразований пространства Е1, причем умноже- умножение в этой подгруппе задается таблицей р I I р р р I А« Очевидно, что мы получим одномерное представление пы G с помощью соотношений D^ (I) = A^1), D^ (P) (G) груп- груп^) (эти
310 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП соотношения задают гомоморфизм группы G в GL A), а следовательно и ее представление). 2) Двумерное представление группы G. Выберем в Е2 какой-либо базис ei, в2 и рассмотрим в этом ба- базисе матрицы А^ и ??B) линейных невырожденных преобразований А™ = —невырожден- —невырожден1 0 0 1 (так как det А^2) = 1 и det В^2) = — 1, то ные преобразования). Преобразования А^2) и В^2) образуют подгруппу в группе GLB). Непосредственной проверкой (путем перемножения матриц А^ и В^) убеждаемся, что умножение операторов А^2) и В^2^ задается та- таблицей (9.35) ^ (G) группы G с помо- помо(9.36) Действительно, сравнивая таблицы (9.34) и (9.35), мы видим, что (9.36) определяет изоморфизм группы G на подгруппу {А^2), В^2)} группы GL B), а следовательно и представление этой группы. А*2) АB) А*2) в<2) в<2) в<2) АB) Мы получим двумерное представление щью соотношений 3) Трехмерное представление группы G. Рассмотрим в Е3 линейное преобразование задаваемое матрицей 10 0 =@10 V о о 1 Это преобразование образует подгруппу в группе GL C) с законом умножения АC)АC) = А^3\ Как и в случае одномерного представления, мы получаем трехмер- трехмерное представление D^ (G) с помощью соотношений:
3. ПРЕДСТАВЛЕНИЯ ГРУПП 311 4) Четырехмерное представление группы G. Рассмотрим в Е4 линейные преобразования матрицами 1 0 0 \ о 0 1 0 0 0 0 1 0 0 0 0 1 \ 1 , задаваемые / V 0 1 0 0 1 0 0 0 0 0 0 1 0 0 1 0 \ / Преобразования А^4) и В^4) образуют подгруппу в группе GL D) с законом умножения, задаваемым таблицей, аналогичной табли- таблице (9.35) (с заменой индекса 2 на индекс 4). Очевидно, что мы по- получаем четырехмерное представление D^ (G) группы G с помощью соотношений = ВD)_ Замечание. Нетрудно видеть, что матрицы А^ и В^ можно записать в виде О о О о Поэтому представление D^ (G) можно условно записать в ви- виде D^(G) = D^(G) + D^(G) = 2D^(G). Совершенно анало- аналогично можно условно записать D^3) (G) в виде D^3^ (G) = 3D^ (G). Используя это замечание, читатель без труда построит представле- представление группы G любой конечной размерности. Пример 2. В п.5 §2 этой главы мы доказали, что только что рассмотренная группа симметрии G = {I, P} трехмерного простран- пространства представляет собой нормальный делитель группы О C) (группа ортогональных преобразований пространства i?3). В том же пункте мы доказали, что подгруппа 50 C) собственных ортогональных пре- преобразований группы О C) изоморфна фактор-группе группы О C) по нормальному делителю {I, P}. Так как группа гомоморфно отображается на каждую свою фактор-группу, то О C) гомоморфноотображается на группу 50 C).
312 ГЛ. 9. ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП Как мы видели в п. 5 § 3 этой главы, указанный гомоморфизм осуще- осуществляется следующим образом. Если а — собственное преобразование из О C), то ему из 50 C) ста- ставится в соответствие это же самое преобразование. Если а' — несобственное преобразование, то ему ставится в соответ- соответствие собственное преобразование Ра'. Таким образом, мы получаем трехмерное представление DO C) группы ортогональных преобразований посредством группы 50 C) собственных ортогональных преобразований.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Автоморфизм групп 285 Алгебраическое дополнение 32 Альтернирование тензора 261 Ассоциативный закон композиции 280 Аффинная система координат 269 Аффинное пространство 46 Базис 53 — взаимный 248 — представления 304 Базисные столбцы 43 — строки 43 Базисный минор 43 Бесконечномерное линейное пространство 55 Беспорядок 26 Билинейная форма 167, 201 вырожденная 206 кососимметричная 167, 203 невырожденная 206 симметричная 167, 203 Блок матрицы 17 Блочная матрица 17 Буняковского-Коши неравенство 93, 107 Вандермонда определитель 36 Вектор 49 Верхней релаксации метод 189 Вещественное евклидово пространство 90 Времениподобный вектор 273 Галилеевы системы 274 Гамильтона-Кэли теорема 150 Гиббса формулы 250 Гиперболоид 241 Гиперповерхность второго порядка 227 центральная 238 Главная диагональ 13 Гомоморфизм групп 288 Грама определитель 246 Группа 281 Группа абелева 281 — коммутативная 281 — линейных преобразований 293 — Лоренца 299, 300 — ортогональных преобразований 295 — перестановок 282 — симметрическая 283 — собственных ортогональных преобразований 297 Группы унитарные 303 — циклические 298 Диагональ матрицы главная 13 побочная 13 Диагональная матрица 16 Дополнительный минор 27 Евклидово пространство вещественное 90 комплексное 105 Единица группы 281 Единичная матрица 16 Единичный оператор 118 Жорданова клетка 161 — форма матрицы 161 Закон инерции квадратичной формы 215 — композиции 280 Зейделя метод 188 Изоморфизм групп 285 — евклидовых пространств 103 — линейных пространств 57 Инвариант 253 — уравнения гиперповерхности 235 Инвариантное подпространство оператора 131 Индекс инерции 216 отрицательный 216 положительный 216 Инерции закон 215 Канонические коэффициенты 208 Канонический базис 210
314 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ — вид квадратичной формы 207, 208 Каноническое уравнение нецентральной гиперповерхности второго порядка 244 центральной гиперповерхности второго порядка 241 Капелли-Кронекера теорема 74 Квадратичная форма 153, 205 вырожденная 206 знакоопределенная 206 знакопеременная 206 квазизнакоопределенная 206 невырожденная 206 отрицательно определенная 206 положительно определенная 206 Квадратная матрица 12 — система 71, 76 Коммутативный закон композиции 280 Коммутирующие матрицы 16 — операторы 139 Комплексное евклидово пространство 105 Композиция 280 Координаты ковариантные 249 — контравариантные 249 Корень из оператора 151 Кососимметричная билинейная форма 167, 203 Коши-Буняковского неравенство 93, 107 Коэффициенты линейной системы 71 Крамера формулы 77 Критерий Сильвестра 218 Критическая точка 224 Критическое значение 224 Кронекер 248 Кронекера символ 248 Кронекера-Капелли теорема 74 Кубическая норма 187 Кэли-Гамильтона теорема 150 Лагранжа метод 208 Лаплас 27 Лапласа теорема 27 Линейная зависимость строк 41 элементов линейного пространства 51 — комбинация строк 31 элементов линейного пространства 51 — независимость строк 41 элементов линейного пространства 51 — оболочка 60 — система 71 — форма 117 Линейное представление группы 304 — преобразование 117 — пространство бесконечномерное 55 Линейное пространство вещественное 46, 50 комплексное 50 Линейные пространства изоморфные 57 Линейный оператор 117, 165 — функционал 117 Лоренца группа 299, 300 — преобразования 276, 300 — формулы 278 Матрица 12 — билинейной формы 203 — блочная 17 — диагональная 16 — единичная 16 — квадратичной формы 206 — квадратная 12 — линейного оператора 125 — невырожденная 41 — нулевая 17 — обратная 40, 41 — ортогональная 172 несобственная 173 собственная 173 — полуторалинейной формы 137 — транспонированная 30 — унитарная 172 Матрицы коммутирующие 16 — порядок 12 Метод верхней релаксации 189 — Зейделя 188 — Лагранжа 208 — регуляризации Тихонова 110
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 315 — Якоби 175, 210 Метрический тензор евклидова про- пространства 262 псевдоевклидова пространства 272 Минимаксное свойство собственных значений 147 Минковского неравенство 94 — пространство 274 Минор 20, 27 — базисный 43 — второго типа 27 — дополнительный 27 —первого типа 27 Многочлен характеристический 130, 168 Невырожденная матрица 41 Нейтральный элемент композиции 280 Неоднородная система 71 Неопределенная система 72 Неравенство Коши-Буняковского 93 — Минковского 94 Неравенство треугольника 94 Несобственное подпространство 59 Несовместная система 71 Нетривиально совместная система 73 Норма 94 — кубическая 187 — линейного оператора 141 — матрицы операторная 176, 187 — октаэдрическая 187 — сферическая 110, 187 — энергетическая 183 Нормальная фундаментальная совокупность решений 84 Нормальное решение 111 Нормальный делитель группы 287 — оператор Нормированное пространство 108 Нормы эквивалентные 183 Нулевая матрица 16 Нулевой оператор 118 Образ оператора 121 Обратная матрица 39, 41 Обратный оператор 119 Однородная система 82 Октаэдрическая норма 187 Оператор линейный 117,165 — нормальный 157 — нулевой 118 — обратный 119 — ортогональный 171 — положительно определенный 151 — положительный 151 — противоположный 118 — самосопряженный 139 — сопряженный 138 — тождественный 118 — унитарный 155 Операторная норма матрицы 176, 187 Операторы коммутирующие 139 Определенная система 71 Определитель 19 — Вандермонда 36 — Грама 246 — линейного оператора 129 — произведения матриц 38 — треугольная 35 Определителя свойство антисимметрии 30 линейное 31 равноправности строк и столбцов 30 Ориентированный объем 270 Ортогонализации процесс 100 Ортогональная матрица 172 несобственная 173 собственная 173 Ортогональное дополнение 103 Ортогональные элементы 108 Ортогональный оператор 171 Ортонормированный базис 98, 108 Основная матрица линейной системы 72 Параболоид 244 Параболоидальный цилиндр 245 Параллельный перенос 229 Перемножение матриц 14 Пересечение подпространств 62 Перестановка 26, 283 Пифагора теорема 96
316 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Побочная диагональ 13 Погрешность метода итераций 176, 180 Подгруппа 286 — дискретная 295 — компактная 294 — конечная 294 — непрерывная 295 Подпространство 59 Полилинейная форма 219 Положительно определенный оператор 151 Положительный оператор 151 Полуоси центральной гиперповерх- гиперповерхности второго порядка 241 Полуторалинейная форма 135 Порядок матрицы 12 Представление группы 303 вполне приводимое 307 линейное 304 неприводимое 307 приводимое 306, 307 точное 304 тривиальное 304 Представления групп эквивалентные 305 Преобразования Лоренца 276, 300 Присоединенный элемент 160 Проектор 149 Произведение матриц 14 — матрицы на число 13, 14 — оператора на число 118 — тензора на число 258 — тензоров 258 Простой итерации метод 175 модифицированный 186 общий неявный 178 Пространственноподобный вектор 273 Пространсво аффинное 46 — евклидово вещественное 90 комплексное 105 — линейное 46, 49 — нормированное 94, 108 — представления 304 Противоположный элемент 46, 50 Процесс ортогонализации 100 Прямая сумма квадратных матриц 18 подпространств 65 Псевдоевклидово пространство 272 Разложение определителя по столбцу 24 строкам 28 строке 21 Размерность представления 304 — пространства линейного 55 псевдоевклидова 272 Ранг матрицы 43, 62 — оператора 123 — формы билинейной 205 квадратичной 206 Расширенная матрица линейной системы 74 Регуляризации метод Тихонова 110 Решение системы 71 нетривиальное 74 тривиальное 73 Ричардсона метод 194 Самарского теорема 179, 184 Самосопряженный оператор 139 Свертывание тензора 259 Свободные члены линейной системы 71 Сильвестра критерий 218 Симметрирование тензора 261 Симметричная билинейная форма 167, 203 Система координат аффинная 269 — уравнений квадратная 71 линейная 71 неоднородная 71 неопределенная 72 несовместная 71 нетривиально совместная 73 однородная 71, 73, 82 определенная 71 совместная 71 Скалярное произведение 90, 105 След оператора 130 Сложение матриц 13 Смежный класс подгруппы 286
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 317 Собственное значение 131 Собственный вектор 131 Совместная система 71 Сопряженный оператор 138 — элемент группы 308 Спектральное разложение оператора 150 Стационарная точка 224 Стационарное значение 224 Столбцы базисные 43 Строки базисные 43 Сумма матриц 13 — операторов 118 — прямая квадратных матриц 18 — подпространств 62, 63 — тензоров 257 Сферическая норма 110, 187 Тензор 253 — вполне кососимметричный 267 — кососимметричный 261 — метрический 262, 272 — момента инерции 278 — симметричный 260 Теорема Гамильтона-Кэли 150 — Кронекера-Капелли 74 — Лапласа 27 — о базисном миноре 43 — Пифагора 96 — Самарского 179, 184 — Тихонова 113 Тождественный оператор 118 Транспонированная матрица 30 Треугольное преобразование 210 Треугольный определитель 35 Тривиальное решение 73 Унитарная матрица 172 Унитарные группы 303 Унитарный оператор 155 Уравнение гиперповерхности второго порядка 227 — характеристическое 131, 168 — центра гиперповерхности второго порядка 237 Фактор-группа 289 Форма билинейная 166, 201 вырожденная 206 кососимметричная 167, 203 невырожденная 206 симметричная 167, 203 — квадратичная 153, 205 — линейная 117 — полилинейная 219 — полуторалинейная 135 — эрмитова 153 Формулы Крамера 77 — Лоренца 278 Фундаментальная совокупность решений 84 Характер 307 Характеристический многочлен 130, 168 Характеристическое уравнение 131, 168 Центр гиперповерхности второго порядка 237 Центральная гиперповерхность 238 вырожденная 241 Циклическая группа 298 Цилиндр параболоидальный 245 — центральный 244 Чебышева метод 190 Эквивалентные нормы 183 Элементы матрицы 12 Эллипсоид 241 — вырожденный 241 — мнимый 241 Эндоморфизм 288 Энергетическая норма 183 Энергетическое скалярное произведение 183 Эрмитова форма 153 Ядро оператора 120 Якоби метод 175, 210
Учебное издание ИЛЬИН Владимир Александрович ПОЗНЯК Эдуард Генрихович ЛИНЕЙНАЯ АЛГЕБРА Серия «Курс высшей математики и математической физики» Редакторы: М. М. Горячая, Н. Б. Бартошевич-Жагель Оригинал-макет: А. Л. Жигарев ЛР № 071930 от 06.07.99. Подписано в печать 09.04.01. Формат 60x90 Vie- Бумага офсетная. Печать офсетная. Усл. печ. л. 20. Уч.-изд. л. 19,46. Тираж 5000 экз. Заказ № Издательская фирма «Физико-математическая литература» МАИК «Наука/Интерпериодика» 117864 Москва, Профсоюзная, 90 Отпечатано с готовых диапозитивов в ФГУП «Ивановская областная типография» 153008, г. Иваново, ул. Типографская, 6 ISBN 5-9221-0129-3 785922 01295