Текст
                    

КУРС ВЫСШЕЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ В А ИЛЬИН, Э. Г ПОЗНЯК ЛИНЕЙНАЯ АЛГЕБРА ИЗДАНИЕ ЧЕТВЕРТОЕ Допущено Министерством общего и профессионального образования Российской Федерации в качестве учебника для студентов высших учебных заведений обучающихся по специальностям «Физика» и «Прикладная математика» МОСКВА НАУКА • ФИЗМАТЛИТ 1999
УДК 512.8 ББК 22.143 Издание осуществлено при. содействии ООО «Фирма "Издательство АСТ» И 46 УЧЕБНИК УДОСТОЕН ГОСУДАРСТВЕННОЙ ПРЕМИИ СССР ЗА 1980 ГОД КУРС ВБ1СШЕЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ Под редакцией А. Н.ТИХОНОВА, В.А.ИЛЬИНА, А. Г. СВЕШНИКОВА ВЫПУСК4 ИЛЬИН В.А., ПОЗНЯК Э.Г. Линейная алгебра: Учеб. Для вузов — 4-е изд. — М. Наука. Физматлит, 1999 — 296 с. — (Курс высшей математики и мат. физики) — ISBN 5-02-015235-8 (Вып 4) Один из выпусков «Курса высшей математики и математической физики» под редакцией А.Н. Тихонова, В А Ильина, А Г. Свешникова Учебник создан на базе лекций, читавшихся авторами в течение многих лет на физическом факультете Московского государственного университета Содержание книги составляют теория матриц и определителей, конечномерных линейных и евклидовых пространств и линейных операторов в этих пространствах, билинейных и квадратичных форм, тензоров, вопросы классификации поверхностей второго порядка и теории представления групп Воспроизводится с 3-го изд (1984 г). Для студентов высших учебных заведений, обучающихся по специальностям «Физика» и «Прикладная математика» Ил 1 ТП-98-П-169 О В А Ильин, ЭГПозняк, 1998 8> Наука Физматлит, оформление, 1998 ISBN 5-02-015230-7 ISBN 5-02-015235-8 (Вып.4)
ОГЛАВЛЕНИЕ Предисловие к четвертому изданию 7 Предисловие к первому изданию 7 Введение 9 Глава 1. Матрицы и определители 10 § 1. Матрицы 10 1. Понятие матрицы (10).2. Основные операции пад матрицами и их свойства (11). 3. Блочные матрицы (15). § 2. Определители 16 1. Понятие определителя (17). 2. Выражение определителя непосредственно через его элементы (23). 3. Теорема Лапласа (24). 4. Свойства определителей (27). 5. Примеры вычисления определителей (30). 6. Определитель суммы и произведения матриц (34). 7. Понятие обратной матрицы (36). § 3. Теорема о базисном миноре матрицы 37 1. Понятие линейной зависимости строк (37). 2. Теорема о базисном миноре (38). 3. Необходимое и достаточное условие равенства пулю определителя (40). Глава 2. Линейные пространства 41 § 1. Понятие линейного пространства. 41 1. Определение линейного пространства (41). 2. Некоторые свойства произвольных линейных пространств (44). § 2. Базис и размерность линейного пространства 46 1. Понятие линейной зависимости элементов линейного пространства (46). 2. Базис и координаты (48). 3. Размерность линейного пространства (49). 4. Понятие изоморфизма линейных пространств (51). § 3. Подпространства линейных пространств 53 1. Понятие подпространства и линейной оболочки (53). 2. Новое определение ранга матрицы (56). 3. Сумма и пересечение подпространств (56). 4. Разложение линейного пространства в прямую сумму подпространств (58). § 4. Преобразование координат при преобразовании базиса п-мерпого линейного пространства 60 1. Прямое и обратное преобразование базисов (60). 2. Связь между преобразованием базисов и преобразованием соответствующих координат (62). Глава 3. Системы линейных уравнений 64 § 1. Условие совместности линейной системы 64 1. Понятие системы линейных уравнений и ее решения (64). 2. Нетривиальная совместность однородной системы (67). 3. Условие совместности общей линейной системы (68). § 2. Отыскание решений линейной системы 69 1. Квадратная система линейных уравнений с определителем осповпой матрицы, отличным от нуля (69). 2. Отыскание всех решений общей линейной системы (73). 3. Свойства совокупности решений однородной системы (75). 4. Заключительные замечания о решении линейных систем (80).
ОГЛАВЛЕНИЕ Глава 4. Евклидовы пространства 82 § 1. Вещественное евклидово пространство и его простейшие свойства 82 1. Определение вещественного евклидова пространства (82). 2. Простейшие свойства произвольного евклидова пространства (85). § 2. Ортонормированный базис конечномерного евклидова пространства 89 1. Понятие ортонормпрованного базиса и его существование (89), 2. Свойства ортонормпрованного базиса (92). 3. Разложение n-мерного евклидова пространства на прямую сумму подпространства и его ортогонального дополнения (94). 4. Изоморфизм n-мерных евклидовых пространств (94). § 3. Комплексное евклидово пространство 95 1. Определение комплексного евклидова пространства (95). 2. Неравенство Коши — Буняковского. Понятие нормы (98). 3. Ортонормированный базис и его свойства (99). § 4. Метод регуляризации для отыскания нормального решения линейной системы 100 Глава 5. Линейные операторы 107 § 1. Понятие линейного оператора. Основные свойства 107 1. Определение линейного оператора (107). 2. Действия над линейными операторами. Пространство линейных операторов (107). 3. Свойства множества L (V, V) линейных операторов (108). §2. Матричная заннсь линейных операторов 114 1. Матрицы линейных операторов в заданном базисе линейного пространства V (114). 2. Преобразование матрицы линейного оператора при переходе к новому базису (117). 3. Характеристический многочлен линейного оператора (119). § 3. Собственные значения в собственные векторы линейных операторов 120 § 4. Линейные и нолуторалинейные формы в евклидовом пространстве 123 1. Специальное представление линейной формы в евклидовом пространстве (123). 2. Полуторалинейные формы в евклидовом пространстве. Специальное представление таких форм (124). § 5. Линейные самосопряженные операторы в евклидовом пространстве 126 1. Понятие сопряженного оператора (126). 2. Самосопряженные операторы. Основные свойства (128). 3. Норма линейного оператора (129). 4. Дальнейшие свойства самосопряженных операторов (131). 5. Спектральное разложение самосопряженных операторов. Теорема Гамильтона — Кэли (137). 6. Положительные операторы. Корин n-й стененн из оператора (138). § 6. Приведение квадратичной формы к сумме квадратов 140 § 7. Унитарные и нормальные операторы 143 § 8. Канонический вид линейных операторов 147 § 9. Линейные операторы в вещественном евклидовом пространстве 151 1. Общие замечания (151). 2. Ортогональные операторы (157). Глава 6. Итерационные методы решения линейных систем и задач на собственные значения 160 § 1. Итерационные методы решения линейных систем 161 1. Метод простой итерации (метод Якоби) (161). 2, Общий неявный метод простой итерации (164). 3. Модифицированный метод простой итерации (171). 4. Метод Зейделя (174). 5. Метод верхней релаксации (174). 6. Случай несимметричной матрицы А (175). 7. Итерационный метод И. Л. Чебышева (175). § 2. Решение нолиой проблемы собственных значений методом вращений 180
ОГЛАВЛЕНИЕ Глава 7. Билинейные и квадратичные формы 186 § 1. Билинейные формы 186 1. Понятие билинейной формы (186). 2. Представление билинейной формы в конечномерном линейном пространстве (187). 3. Преобразование матрицы билинейной формы при переходе к новому базису. Ранг билинейной формы (188). § 2. Квадратичные формы 190 § 3. Приведение квадратичной формы к сумме квадратов 192 1. Метод Лагранжа (193). 2. Метод Якоби (195). § 4. Закон инерции квадратичных форм. Классификация квадратичных форм 198 1. Закон инерции квадратичных форм (198). 2. Классификация квадратичных форм (200). 3. Критерий Сильвестра знакоопределенности квадратичной формы (202). § 5. Полилинейные формы 203 § 6. Билинейные и квадратичные формы в евклидовом пространстве. 205 1. Предварительные замечания (205). 2. Приведение квадратичной формы к сумме квадратов в ортогональном базисе (206). 3. Одновременное приведение двух квадратичных форм к сумме квадратов в линейном пространстве (207). 4, Экстремальные свойства квадратичной формы (208). § 7. Гиперповерхности второго порядка. 211 1. Понятие гиперповерхности второго порядка (211). 2. Параллельные переносы в евклидовом пространстве. Преобразование ортонормированных базисов в Ортонормированные (213). 3. Преобразование общего уравнения гиперповерхности второго норядка при параллельном переносе (214). 4. Преобразование общего уравнения гиперповерхности второго норядка при переходе от ортонормированного базиса к ортонормпроваиному (216). 5. Инварианты общего уравнения гиперповерхности второго норядка (218). 6. Центр гиперповерхности второго норядка (220) 7. Стандартное упрощение любого уравнения гиперповерхности второго норядка путем преобразования ортонормированного базиса (221). 8. Упрощение уравнения центральной гиперповерхности второго норядка. Классификация центральных гиперповерхностей (222). 9. Упрощение уравнения нецентральной гиперповерхности второго норядка. Классификация нецентральных гиперповерхностей (224). Глава 8. Тензоры 228 § 1. Преобразование базисов и координат 228 1. Определители Грама (228). 2. Взаимные базисы. Ковариантные и коитравариантные координаты векторов (229). 3. Преобразования базиса и координат (232). § 2. Понятие тензора. Основные операции над тензорами 234 1. Понятие тензора (234). 2. Примеры тензоров (236). 3. Основные операции над тензорами (239). § 3. Метрический тензор. Основные операции векторной алгебры в тензорных обозначениях 243 1. Понятие метрического тензора в евклидовом пространстве (243). 2. Операция поднятия и опускания индексов с помощью метрического тензора (245). 3. Ортонормированные базисы в J" (247). 4. Дискриминантный тензор (248), 5. Ориентированный объем (250). 6. Векторное произведение (251). 7. .Двойное векторное произведение (252). § 4. Метрический тензор нсевдоевклидова пространства. 252 1. Понятие нсевдоевклидова пространства и метрического тензора нсевдоевклидова пространства (252). 2. Галилеевы коор-
ОГЛАВЛЕНИЕ динаты. Преобразования Лоренца (254). 3. Преобразования Лоренца пространства Е4(13) (255). §5. Тензор момента инерции 258 Глава 9. Элементы теории групп 260 § 1. Понятие группы. Основные свойства групп 260 1. Законы композиции (260). 2. Понятие группы. Некоторые свойства групп (261). 3. Изоморфизм групп. Подгруппы (264). 4, Смежные классы. Нормальные делители (265). 5. Гомоморфизмы. Фактор-группы (267). § 2. Группы преобразований 271 1. Невырожденные линейные преобразования (271). 2. Группа линейных преобразований (272). 3. Сходимость элементов в группе GL(n). Подгруппы группы GL(n) (273). 4. Группа ортогональных преобразований (274). 5. Некоторые дискретные и коненные нодгрупны ортогональной группы (276). 6. Группа Лоренца (278). 7. Унитарные группы (281). § 3. Представления групп 281 1. Линейные представления групп. Терминология (282). 2. Матрицы линейных представлений. Эквивалентные представления (283). 3. Приводимые и неприводимые представления (284). 4. Характеры (285). 5. Примеры представлений групп (287). Алфавитный указатель 290
ПРЕДИСЛОВИЕ К ЧЕТВЕРТОМУ ИЗДАНИЮ Книга написана с учетом опыта чтения лекций на физическом факультете, а также на факультете вычислительной математики и кибернетики Московского государственного университета. От других руководств по линейной алгебре ее отличает более полное изложение теории линейных операторов, наличие специальной главы, посвященной итерационным методам решения линейных систем, наличие доказательства сходимости метода вращении для решения полной проблемы собственных значений, изложение метода регуляризации А. Н. Тихонова для отыскания нормального решения линейной системы. Четвертое издание перепечатывается с текста третьего издания, в котором исправлено несколько замеченных опечаток. Июнь 1998 г. В. А. Ильин ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ Эта книга возникла в результате переработки курса лекций, читавшихся авторами в Московском государственном университете. Отметим некоторые особенности изложения. Изложение начинается с изучения матриц и определителей, причем определитель п-го порядка вводится по индукции через определитель (n-l)-ro порядка с помощью формулы разложения по первой строке. Нри этом легко доказывается теорема о разложении по любой строке и по любому столбцу (схема доказательства этой теоремы оказывается совершенно аналогичной схеме доказательства теоремы Лапласа). Традиционное определение детерминанта (определителя) непосредственно через его элементы является простым следствием данного в этой книге определения. Изучению линейпых систем предшествует теория линейных пространств и преобразований базисов и координат векторов в таких пространствах. Нри изучении линейных систем мы сразу же знакомим читателя не только с обычной, но и с матричной формой записи системы и вывода формул Крамера.
8 ПРЕДИСЛОВИЕ Изучение вещественных и комплексных евклидовых пространств завершается доказательством теоремы А. Н. Тихонова об отыскании нормального решения линейной системы. Нри изучении линейных операторов излагаются все основные аспекты спектральной теории в конечномерных евклидовых пространствах. Теорема о приведении матрицы к жордановой форме доказывается с помощью предложенного А. Ф. Филипповым короткого метода, основанного на индукции. Книга содержит специальную главу, посвященную итерационным методам, в которой с единой точки зрения рассматриваются важнейшие итерационные методы решения линейных систем (явный и неявный методы простой итерации, метод Зейделя, метод верхней релаксации) и устанавливаются условия сходимости этих методов. Для общего неявного метода простой итерации выясняются установленные А. А. Самарским условия получения наиболее быстрой сходимости. Приводится доказательство сходимости метода вращении для решения полной проблемы собственных значений. Изложение теории билинейных и квадратичных форм завершается приведением к каноническому виду уравнений гиперповерхностей второго порядка в n-мерном пространстве. Нри изучении тензоров, наряду с традиционным материалом, излагается важная для приложений тензорная форма заниси основных операций векторной алгебры. Здесь же даются понятия псевдоевклидова пространства, галплеевых координат и преобразования Лоренца. Книга завершается изложением элементов теории групп и их представлений. Следует отметить, что данная книга примыкает к «Аналитической геометрии», хотя может читаться и независимо от нее. Авторы приносят глубокую благодарность А. Н. Тихонову и А. Г. Свешникову за большое количество ценных замечаний, Ш. А. Алимову, вклад которого в эту книгу далеко вышел за рамки обычного редактирования, Л. Д. Кудрявцеву, С. А. Ломову и особенно А. А. Самарскому за весьма полезные критические замечания и ценные советы, Е. С. Николаеву, Д. Д. Соколову и Е. В. Шикину за большую помощь при написании некоторых разделов этой книги. Январь 1974 г. В. Ильин, Э. Позняк
ВВЕДЕНИЕ В этой книге мы будем иметь дело с внешне различными объектами: 1) с матрицами (или прямоугольными таблицами из чисел), 2) с алгебраическими формами, включающими в себя так называемые линейные, билинейные и квадратичные формы, 3) с так называемыми линейными (и, в частности, с евклидовыми) пространствами и с линейными преобразованиями в таких пространствах. Элементарные представления об этих объектах читатель имеет из курса аналитической геометрии. В самом деле, в курсе аналитической геометрии изучались квадратные матрицы второго и третьего порядков и отвечающие этим матрицам определители. Линейная и квадратичная формы представляют собой соответственно однородную линейную и однородную квадратичную функции нескольких независимых переменных (нанример, координат вектора). Примером линейного пространства может служить совокупность всех геометрических векторов на плоскости (или в пространстве) с заданными операциями сложения этих векторов и умножения их на числа. Если для совокупности таких векторов задано еще и скалярное произведение, то мы придем к понятию евклидова пространства. Примером линейного преобразования в таком пространстве может служить переход от одного декартова прямоугольного базиса к другому. Песмотря на внешнее различие, перечисленные совокупности объектов тесно связаны между собой, большинство утверждений допускает равносильную формулировку для каждой из этих совокупностей. Панболее отчетливо эта связь выявляется при изучении произвольных линейных и евклидовых пространств (и линейных преобразований в таких пространствах). Однако более конкретная матричная трактовка результатов непосредственно связана с фактическими вычислениями (и, в частности, с решением линейных систем уравнений). Именно поэтому мы начинаем наше рассмотрение с изучения матриц и неоднократно возвращаемся впоследствии к матричной трактовке результатов.
ГЛАВА I МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ В этой главе изучаются таблицы из чисел, называемые мат- рицами и играющие в дальнейшем важнейшую роль. Здесь вводятся основные операции над матрицами и детально изучаются свойства так называемых определителей, являющихся основной числовой характеристикой квадратных матриц. „ § 1. Матрицы 1. Понятие матрицы. Матрицей называется прямоуголь- ная таблица из чисел, содержащая некоторое количество т строк и некоторое количество п столбцов. Числа тип называются порядками матрицы. В слу- чае, если т = п, матрица называется квадратной, а число т = п — ее порядком. В дальнейшем для записи матрицы будут применяться либо сдвоенные черточки, либо круглые скобки: Оц а12 • • • O21 О22 . . . Оап ИЛИ aml Отг • • • атп " Оц а12 • • • ащ Д21 а22 • • • а2П Omi Ота • • • Оттг Впрочем, для краткого обозначения матрицы часто будет ис- пользоваться либо одна большая латинская буква (например, А), либо символ а иногда и с разъяснением: А = |lazЛ = = (al}) (i = 1, 2.т-, i = 1, 2, ..., п). Числа ai}, входящие в состав данной матрицы, называются ее элементами. В записи (ц} первый индекс I означает но- мер строки, а второй индекс / — номер столбца. В случае квадратной матрицы Ои Ой • •• ат 021 О22 . . . Огл (М) 0д1 ола ,,. апп


S 13 МАТрИЦЫ 11 вводятся понятия главной и побочной диагоналей. Главной диагональю матрицы (1.1) называется диагональ апам ... ... апп, идущая из левого верхнего угла этой матрицы в правый нижний ее угол. Побочной диагональю той же матри- цы называется диагональ ал1а(Я_1) 2... а^, идущая из левого нижнего угла в правый верхний угол. 2. Основные операции над матрицами и их свойства. Прежде всего договоримся считать две матрицы равными, если эти матрицы имеют одинаковые порядки и все их соответствующие элементы совпадают. Перейдем к определению основных операций над матрицами. а) Сложение матриц. Суммой двух матриц Л = Ва„| (i = 1, 2, ..., m; j = 1, 2.п) и В = ||ЬМ|| (I = = 1,2, ..., т; j = 1, 2, ..., п) одних и тех же порядков тип называется матрица С = ||со|| (i = 1, 2, ..., т\ j — 1, 2, ..., п) тех же порядков тип, элементы которой равны Сц — atj + bi, (i ~ 1, 2, ..., т\ j = 1, 2, .... п). (1.2) Для обозначения суммы двух матриц используется запись С = = А + В. Операция составления суммы матриц называется их сложением. Итак, по определению Он а21 °12 °22 . fljn + bn bu b12 ... b22 ... bin b2n = ат1 атг • • атп bmi Ьтг • • • bmn (а 11 + ^11) (а12 + bi2) • « » (ain 4- bin) = (а 21 + ^21) (а22 + b22) .. . (а2П + b2n) (flmi + ^ml) (атг 4* Ьтг) • « • (amn “Ь Ьщп) Из определения суммы матриц, а точнее из формулы (1.2) непосредственно вытекает, что операция сложения матриц обла- дает теми же свойствами, что и операция сложения вещественных чисел, а именно: 1) переместительным свойством: А + В = В + А, 2) сочетательным свойством: (А 4- В) 4- С = А + (В 4- С). Эти свойства позволяют не заботиться о порядке следования слагаемых матриц при сложении двух или большего числа матриц. б) Умножение матрицы на число. Произ- ведением матрицы Л = ||al}J (i = 1, 2, ..., т\ j — — 1, 2, ..., п) на вещественное число X называется матрица С = ||С(;|| (i = 1, 2, .... т; j = 1, 2, .... п), элементы сц которой равны Си = fail] (i = 1, 2, ..., т\ j = 1, 2, ..., п). (1.3)
12 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 Для обозначения произведения матрицы на число использу- ется запись С = ХЛ или С — ДХ. Операция составления произ- ведения матрицы на число называется умножением матрицы на это число. Непосредственно из формулы (1.3) ясно, что умножение мат- рицы на число обладает следующими свойствами: 1) сочетательным свойством относительно числового множи- теля: (Ху) А = X (|1Д); 2) распределительным свойством относительно суммы матриц: X (Д + В) = ХД + ХВ; 3) распределительным свойством относительно суммы чисел: (X 4* ц) А = ХД уД. Замечание. Разностью двух матриц А и В одинаковых порядков /пип естественно назвать такую матрицу С тех же порядков тип, которая в сумме с матрицей В дает матрицу Д. Для обозначения разности двух матриц используется естественная запись: С = А — В. Очень легко убедиться в том, что разность С двух матриц А и В может быть получена по правилу С = А 4- (—1)-В. в) Перемножен и.е матриц. Произведением матрицы А — ||af>|| (i — 1, 2, ..., т; / = 1, 2, ..., л), имеющей порядки, соответственно равные т и п, на матрицу В = |Ь17|| (t = 1, 2, .... п\ j = 1, 2, .... р), имеющую порядки, соответ- ственно равные л и р, называется матрица С = ||см11(‘ — Ь 2, ... ..., /л; / = 1, 2, ..., р), имеющая порядки, соответственно рав- ные т и р, и элементы ctJ, определяемые формулой athbhi (t=l,2......... / = 1, 2, ..., р). (1.4) *=i Для обозначения произведения матрицы А на матрицу В используют запись С — A-В. Операция составления произведения матрицы А на матрицу В называется перемножением этих матриц. Из сформулированного выше определения вытекает, что мат- рицу А можно умножить не на всякую матрицу В: необходимо, чтобы число столбцов матрицы А было равно числу строк мат- рицы В. В частности, оба.произведения А’В и В-А можно определить лишь в том случае, когда число столбцов А совпадает с числом строк В, а число строк А совпадает с числом столбцов В. При этом обе матрицы А-В и В-А будут квадратными, но порядки их будут, вообще говоря, различными. Для того чтобы оба произве- дения А‘В и В-А не только были определены, но и имели оди- наковый порядок, необходимо и достаточно, чтобы обе матрицы А и В были квадратными матрицами одного и того же порядка.


§ МАТРИЦЫ 13 Формула (1.4) представляет собой правило составления эле- ментов матрицы С, являющейся произведением матрицы А на матрицу В. Это правило можно сформулировать и словесно: элемент ct], стоящий на пересечении i-й строки и j-го столбца матрицы С = А-В, равен сумме попарных произведений соответ' ствующих элементов i-й строки матрицы А и j-го столбца мат- рицы В. В качестве примера применения указанного правила приведем формулу перемножения квадратных матриц второго порядка II аи 012 II II&11 ^13 II _ | (а11*11 + 012 ^21) (а11^12 + aub2i) II II а21 а22 И II ^21 ^22II II (а21^11 4" а22 ^21) (а21^12 + а22^2г) II Из формулы (1.4) вытекают следующие свойства произведения матрицы А на матрицу В: 1) сочетательное свойство» (АВ) С = А (ВС); 2) распределительное относительно суммы матриц свойство: (Д + В) С = АС + ВС или А (В + С) = АВ + АС. Распределительное свойство сразу вытекает из формул (1.4) и (1.2), а для доказательства сочетательного свойства достаточно заметить, что если А = ||агу|| (i = 1, 2, т; / = 1, 2, ..., п), в = ИЫ (/ “ 1. 2 п; k = 1, 2.........................р), С = |Ы| (Л = » 1, 2, ...» р; I = 1, 2, г), то элемент dlt матрицы (АВ) С Р / Л \ в силу (1.4) равен du = 2 2. onb/ki'Cki, а элемент d'n матрицы A=S 1 \/ = 1 / П / Р \ А (ВС) равен = S att I £ Ъу£м\, но тогда равенство du= / = 1 \*=1 } = d’u вытекает из возможности изменения порядка суммирования относительно J и k. Вопрос о перестановочном свойстве произведения матрицы А на матрицу В имеет смысл ставить лишь для квадратных матриц А и В одинакового порядка (ибо, как указывалось выше, только для таких матриц А и В оба произведения АВ и ВА определены и являются матрицами одинаковых порядков). Элементарные при- меры показывают, что произведение двух квадратных матриц одинакового порядка не обладает, вообще говоря, перестановочным свойством. В самом деле, если положить А = q|, В = | j 111 011 110 01| то Ав = |оо|’ а ВА “Io Здесь мы укажем, однако, важные частные случаи, в которых справедливо перестановочное свойство *). *) Две матрицы, для произведения которых справедливо перестановочное свойство, принято называть коммутирующими.
14 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 Среди квадратных матриц выделим класс так называемых диагональных матриц, у каждой из которых элементы, расположенные вне главной диагонали, равны нулю. Каждая диа- гональная матрица порядка п имеет вид di 0 ... О О d2 ... О (1.5) О 0 ... dn где du dit .... dn — какие угодно числа. Легко видеть, что если все эти числа равны между собой, т. е. di = dt = ... = dn = d, то для любой квадратной матрицы А порядка п справедливо ра- венство AD = DA. В самом деле, обозначим символами Сц и с'ц элементы, стоящие на пересечении t-й строки и /-го столбца матриц AD и DA соответственно. Тогда из равенства (1.4) и из вида матрицы D получим, что ctj = aitdt — aijd, с'ц = di<it[ = dai/, (1.6) т. e. сц = c't /. Среди всех диагональных матриц (1.5) с совпадающими эле- ментами di = dz = ... = dn = d особо важную роль играют две матрицы. Первая из этих матриц получается при d — 1, называ- ется единичной матрицей n-го порядка и обозначается символом Е. Вторая матрица получается при d = 0, называется нулевой матрицей n-го порядка и обозначается символом О. Таким образом, В силу доказанного выше АЕ = ЕА и АО — ОА. Более того, из формул (1.6) очевидно, что АЕ = ЕА = А, АО = ОА = О. (1.7) Первая из формул (1.7) характеризует особою роль единичной матрицы Е, аналогичную той роли, которую играет число 1 при перемножении вещественных чисел. Что же касается особой роли нулевой матрицы О, то ее выявляет не только вторая из формул (1.7), но и элементарно проверяемое равенство *) А + О = О -f- + А = А. В заключение заметим, что понятие нулевой матрицы можно вводить и для неквадратных матриц (нулевой называют любую матрицу, все элементы которой равны нулю). *) Это равенство является прямым следствием формулы (1.2),


S 13 МАТРИЦЫ 15 3. Блочные матрицы. Предположим, что некоторая матрица Л = Иг/|| при помощи горизонтальных и вертикальных прямых разбита на отдельные прямоугольные клетки, каждая из которых представляет собой матрицу меньших размеров и называется блоком исходной матрицы. В таком случае возникает возмож- ность рассмотрения исходной матрицы А как некоторой новой (так называемой блочной) матрицы А = |Ла0||, элементами Лар которой служат указанные блоки. Указанные элементы мы обозначаем большой латинской буквой, чтобы подчеркнуть, что они являются, вообще говор я, матрицами, а не числами и (как обыч- ные числовые элементы) снабжаем двумя индексами, первый из которых указывает номер «блочной» строки, а второй — номер «блочного» столбца. Например, матрицу «11 <*12 А 22 <*13 <*33 <*14 <*34 I <*15 ( <*25 <*16 <*26 Л — <*31 <*32 <*эз <»Э4 1 <*35 ^36 • <*41 <*42 <*43 <*44 • <*45 <*45 <*51 <*52 <*53 <*54 <*53 <*56 « Mil ^12)1 можно рассматривать как блочную матрицу Л = Ц эле- ментами которой служат следующие блоки: а- [ _|| <*11 <*и <*хз 11 II Оц «зз <*23 <*31 <*32 <*33 <*34 II Ц <*35 <*36 Л21= <*41 «42 <*43 <*44 Л 22 = <*45 <»46 • <*51 <*52 <*53 <*54 II II <*55 <*56 Замечательным является тот факт, что основные операции с блочными матрицами совершаются по тем же правилам, по кото- рым они совершаются с обычными числовыми матрицами, только в роли элементов выступают блоки. В самом деле, элементарно проверяется, что если матрица Л = ||М является блочной и имеет блочные элементы Ла0, то при том же разбиении на блоки матрице ХЛ — отвечают блочные элементы ХЛа0 *). Столь же элементарно проверяется, что если матрицы Л и В имеют одинаковые порядки и одинаковым образом разбиты на блоки, то сумме матриц Л и В отвечает блочная матрица с эле- *) При этом блочные элементы сами вычисляются по правилу умно- жения матрицы Аар на число X.
16 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 ментами Са^ = Ла? + Ba(i (здесь ЛаР и Ва& — блочные элементы матриц Л и В). Пусть, наконец, Л и В — две блочные матрицы такие, что число столбцов каждого блока Лар равно числу строк блока BPv (так что при' любых а, 0 и у определено произведение матриц ЛарВ^). Тогда произведение С = АВ представляет собой ма- трицу с элементами Са1?, определяемыми формулой Сду = 2 ларВру. Для доказательства этой формулы достаточно расписать левую и правую ее части в терминах обычных (числовых) элементов мат- риц Л и В (предоставляем это сделать читателю). В качестве примера применения блочных матриц остановимся на понятии так называемой прямой суммы квадратных матриц. Прямой суммой двух квадратных матриц Л и В по- рядков тип соответственно называется квадратная блочная матрица С порядка т 4- п, равная С = |р °в I. Для обозначения прямой суммы матриц Л и В используется запись С = Л ф В. Из определения прямой суммы матриц Л и В очевидно, что эта сумма, вообще говоря, не обладает перестановочным свойст- вом. Однако элементарно проверяется справедливость сочета- тельного свойства: (Л ф В) ф С — А ф (В ф С). С помощью свойств операций над блочными матрицами легко проверяются следующие формулы, устанавливающие связь между операцией прямого суммирования и операциями обычного сложе- ния и перемножения матриц: (Лт ф А„) + (Вот ф Вя) = (Ап -J- Вт) ф (Л„ 4” Вп), (Ат ф Лп) (Вот ф Вп) = АтВт ф АпВп (в этих формулах Ат и Вт — произвольные квадратные матрицы порядка т, а Ап и Вп — произвольные квадратные матрицы порядка л). Проверку этих формул мы предоставляем читателю. § 2. Определители Целью настоящего параграфа является построение теории определителей любого порядка п. Хотя читатель (из курса ана- литической геометрии) уже знаком с определителями второго и третьего порядков, мы будем вести изложение так, чтобы избег- нуть каких-либо ссылок. Знакомство с определителями второго и третьего порядков разве лишь облегчит восприятие излагае- мого ниже материала.


5 2] ОПРЕДЕЛИТЕЛИ 17 1. Понятие определителя. Рассмотрим произвольную квадрат- ную матрицу любого порядка п: «11 «12 ... «1л «21 «22 ... «2Л • аП1 аП2 • • • «лл (1-8) С каждой такой матрицей свяжем вполне определенную числен- ную характеристику, называемую определителем, соответствую- щим этой матрице. Если порядок п матрицы (1.8) равен единице, то эта матрица состоит из одного элемента ап и определителем первого порядка, соответствующим такой матрице, мы назовем величину этого элемента. Если далее порядок п матрицы (1.8) равен двум, т. е. если эта матрица имеет вид Д = || «н Ом «12 II агг II (1.9) то определителем второго порядка, соответствующим такой мат- рице, назовем число, равное апа22—aiaa2i и обозначаемое одним из символов* *) A = det/l = |^u Итак, по определению Д=det А=1011 “и I =s оца22 — о12а21. (1.10) I °21 °22 I Формула (1.10) представляет собой правило составления опреде- лителя второго порядка по элементам соответствующей ему матрицы. Словесная формулировка этого правила такова: опре- делитель второго порядка, соответствующий матрице (1.9), равен разности произведения элементов, стоящих на главной диаго- нали этой матрицы, и произведения элементов, стоящих на по- бочной ее диагонали **), В дальнейшем изложении мы будем говорить об элементах, строках или столбцах определителя, подразумевая под этими тер- минами соответственно элементы, строки или столбцы отвечающей этому определителю матрицы. *) В отличие от матрицы для обозначения определителя употребляют не сдвоенные, а одинарные черточки. * *) Напомним, что главной диагональю квадратной матрицы назы- вается диагональ, идущая из левого верхнего в правый нижний угол (т. е. в слу- чае матрицы (1.9) aua22), а побочной — диагональ, идущая из левого нижнего в правый верхний угол (т. е. в случае матрицы (1 9) ааа1г).
18 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 Перейдем теперь к выяснению понятия определителя л ю - бого порядкам, где п 2. Понятие такого определителя мы введем индуктивно, считая, что нами уже введено понятие оп- ределителя порядка п — 1, соответствующего произвольной квад- ратной матрице порядка п — 1. Договоримся называть минором любого элемента at] матрицы п-го порядка (1.8) определитель порядка п — 1, соот- ветствующий той матрице, которая получается из матрицы (1.8) в результате вычеркивания i-й строки и j-го столбца (той строки и того столбца, на пересечении которых стоит элемент ао). Минор элемента alt будем обозначать символом Л!}. В этом обо- значении верхний индекс обозначает номер строки, нижний — номер столбца, а черта над М означает, что указанные строка и столбец вычеркиваются. Определителем порядка п, соответствующим матрице (1.8),назовем число, равное £ (—1) +/ai, М} и обозначаемое z=i символом а11 а12 • • • а1П А = det А = °21 °22 • • • а2П (1-П) ат ап2 • • • апп Итак, по определению А = det А — °и «и • • • «in °21 а22 • • • а2П аП1 аП2 • • • апп = 2 (-1)'+Ч< /=1 (М2) Формула (1.12) представляет собой правило составления опреде- лителя порядка п по элементам первой строки соответствующей ему матрицы и по минорам Af) элементов первой строки, являю- щимся определителями порядка п — 1. Заметим, что при л = 2 правило (1.12) в точности совпадает с правилом (1.10), ибо в этом случае миноры элементов первой строки имеют вид: М\ — Дгг, М? = агь Естественно возникает вопрос, нельзя ли использовать для получения величины определителя (1.11) элементы и отвечающие им миноры не первой, а произвольной i-й строки матрицы (1.8). Ответ на этот вопрос дает следующая основная теорема.


ОПРЕДЕЛИТЕЛИ 19 5 21 Теорема 1.1. Каков бы ни был номер строки i (i = 1, 2, ... п), для определителя п-го порядка (1.11) справедлива формула *) A = deM= £ (—1)'+'а0М/, (1.13) /=1 называемая разложением этого определителя по i-й строке. Замечание. Подчеркнем, что в этой формуле показатель степени, в которую возводится число (—1), равен сумме номеров строки и столбца, на пересечении которых стоит элемент atf. Доказательство теоремы 1.1. Формулу (1.13) нужно доказать лишь для номеров i = 2, 3, ..., п **). При п = 2 (т. е. для определителя второго порядка) эту формулу нуж- но доказать лишь для номера i = 2, т. е. при п = 2 нужно до- казать лишь формулу 2 _ _ А = det Л = Д (— 1)2+/ а2/М/ = — апМ\ + а^. Справедливость этой последней формулы сразу вытекает из выражений для миноров матрицы (1.9) Л4? = а^, Мз = ап» в силу которых правая часть этой формулы совпадает с правой частью (1.10). Итак, при п = 2 теорема доказана. Доказательство формулы (1.13) для произвольного п > 2 проведем по индукции, т. е. предположим, что для определителя порядка п — 1 справедлива формула вида (4.13) разложения по любой строке, и, опираясь на это, убедимся в справедливости фор- мулы (1.13) для определителя порядка п. При доказательстве нам понадобится понятие миноров матрицы (1.8) порядка п — 2. Определитель порядка п — 2, соответству- ющий той матрице, которая получается из матрицы (1.8) в резуль- тате вычеркивания двух строк с номерами и i2 и двух столб- цов с номерами и /2, называется минором (п — 2)-г о порядка и обозначается символом М'^\. Определитель /гго порядка А вводится формулой (1.12), при- чем в этой формуле каждый минор М * является определителем порядка п — 1, для которого по предположению справедлива фор- мула вида (1.13) разложения по любой строке. Фиксировав любой номер i (1 = 2, 3, ..., п), разложим в фор- муле (1.12) каждый минор Л4* по i-й строке основного определи- теля (1.11) (в самом миноре М} эта строка будет (i — 1)-й). *) По смыслу теоремы п > 2. ♦*) Ибо при i = 1 правая часть (1.13) по определению равна det А.
20 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 В результате весь определитель Д окажется представленным в виде некоторой линейной комбинации *) миноров (п — 2)-го порядка М}‘к с несовпадающими номерами / и k, т. е. в виде jS МЭД. (1.14) Для вычисления множителей Qjk заметим, что минор М1/к полу- чается в результате разложения по (t — 1)-й строке ♦♦*) только следующих двух миноров (п — 1)-го порядка^отвечающих элемен- там первой строки матрицы (1.8): минора М} и минора ~Мк (ибо только эти два минора элементов первой строки содержат все столбцы минора Л4/{). В разложениях миноров М] и Мк по указанной (i — 1)-й строке выпишем только слагаемые, содержащие минор М'к (ос- тальные не интересующие нас слагаемые обозначим многоточием). Учитывая при этом, что элемент а1к минора М} стоит на пересе- чении (i — 1)-й строки и (k — 1)-го столбца этого минора ****), а элемент ait минора 44* стоит на пересечении (i — 1)-й строки и /-го столбца этого минора *♦***), мы получим М}= + + (1,15) Ml = (-l)(t-1)+/az/M;L + ... (1.16) Вставляя (1.15) и (1.16) в правую часть (1.12) и собирая коэф- фициент при М\‘к, мы получим, что множитель Qjk в равенстве (1.14) имеет вид еЛ==(— l)(I + ‘ + /+A)[ai/Z(ft —(1.17) Для завершения доказательства теоремы покажем, что и пра- вая часть (1.13) равна сумме, стоящей в правой части (1.14), с теми же самыми значениями (1.17) для Q/k. Для этого в правой части (1.13) разложим каждый минор (п — 1)-го порядка М‘ п о первой строке. В результате *) Напомним, что линейной комбинацией каких-либо величин назы- вается сумма произведений этих величин на некоторые вещественные числа. **) Так как минор совпадает с Мщ, то мы переберем все миноры (п — 2)-го порядка с данными номерами строк 1 и I, изменяя / от 1 до п и для каждого j беря все возможные k < /. ***) В матрице (1.8) эта строка будет Лй. ♦ »*♦) ибо в миноре Mlj отсутствуют первая строка и /-й столбец матрицы (1.8) и / < k. __ ****♦) Ибо в миноре отсутствует первая строка матрицы (1.8), а един- ственный отсутствующий в этом миноре столбец матрицы (1,8) имеет номер k > /,


ОПРЕДЕЛИТЕЛИ 21 § 21 вся правая часть (1.13) представится в виде линейной комбинации с некоторыми коэффициентами 0;* тех же самых миноров Л7*£ Е S i/Л (1.18) / = 1Л</ и нам остается вычислить множители 0rt и убедиться в справед- ливости для них формулы (1.17). _ Для этого заметим, что минор /И}* получается в результате разложения по первой строке только следующих двух миноров (п — 1)-го порядка, отвечающих элементам i-й строки матрицы (1.8): минора М'/ и минора Мк (ибо только эти два минора эле- ментов i-й строки содержат все столбцы минора М/к). В разложениях миноров М‘ и М1к по первой строке выпишем только слагаемые, содержащие минор (остальные не интере- сующие нас слагаемые обозначим многоточием). Учитывая при этом, что элемент а\к минора М\ стоит на пересечении первой строки и (k — 1)-го столбца *) этого минора, а элемент а1} минора /И* стоит на пересечении первой строки и /-го столбца **) этого минора, мы получим M< = (-l)1 + (A-1>aIft.^+..., (1.19) Л^ = (-1),+/а1/.ЛТХ + ... (1.20) Вставляя (1.19) и (1.20) в правую часть (1.13) и собирая коэф- фициент при М]ь, мы получим, что 07* в сумме (1.18) определяется той же самой формулой (1.17), что и в равенстве (1.14). Теорема 1.1 доказана. Теорема 1.1 установила возможность разложения определи- теля л-го порядка по любой его строке. Естественно возникает вопрос о возможности разложения определителя n-го порядка по любому его столбцу. Положительный ответ на этот вопрос дает следующая основная теорема. Теорема 1.2. Каков бы ни был номер столбца j (j = 1, 2, ... ..., п), для определителя п-го порядка (1.11) справедлива формула A = det4= £ (—l/+/a0M<, (1.21) 1 = 1 *) Ибо j < k и в миноре М‘ отсутствует /-й столбец матрицы (1.8). ••) Ибо j < k, а у минора М1к отсутствует лишь А-й столбец матрицы (1.8).
22 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 называемая р аз л о ж е н ие м этого определителя по j'M у столбцу. Доказательство. Достаточно доказать теорему для 1,т. е. установить формулу разложения по первому столбцу д = Д(-1)'+’ап7Й{, (1.22) ибо если формула (1.22) будет установлена, то для доказательства формулы (1.21) для любого / = 2, 3, .... п достаточно, поменяв ролями строки и столбцы, дословно повторить схему рассуждений теоремы 1.1. Формулу (1.22) установим по индукции. При п = 2 эта формула проверяется элементарно (так как при п = 2 миноры элементов первого столбца имеют вид М{ = а2г, Л4? = П12, то при п = 2 правая часть (1.22) совпадает с правой частью (1.10)). Предположим, что формула разложения по первому столбцу (1.22) верна для определителя порядка п — 1 и, опираясь на это, убедимся в справедливости этой формулы для определителя по- рядка п. С этой целью выделим в правой части формулы (1.12) для опре- делителя п-го порядка Д первое слагаемое ацМ[, а в каждом из остальных слагаемых разложим минор (п — 1)-го порядка М\ по первому столбцу. В результате формула (1.12) будет иметь вид Д = а„М|+ S S (1.23) /=2 < = 2 где 6О — некоторые подлежащие определению коэффициенты. Для вычисления в4/ заметим, что минор М}) получается при раз- ложении по первому столбцу только одного из миноров (п — 1)-го порядка, отвечающих первой строке *), — минора М}. Запишем в разложении минора М\ (при j > 2) по первому столбцу только то слагаемое, которое содержит минор Mj) (остальные не интере- сующие нас слагаемые обозначим многоточием). Учитывая, что элемент ац минора М} (при / 2) стоит на пересечении (i — 1)-й строки и первого столбца этого минора, мы получим, что при i 2 M} = (-l)(Z-1) + Ian^ + ... (1.24) *) При этом минор М| предполагается исключенным.


$2] ОПРЕДЕЛИТЕЛИ 23 Вставляя (1.24) в правую часть (1.12) (из которой исключено первое слагаемое) и собирая коэффициент при УИ‘/, мы получим, что коэффициент вц в формуле (1.23) имеет вид O0 = (-l)' + /+,auail- (1.25) Остается доказать, что и правая часть (1.22) равна сумме, стоящей в правой части (1.23) с теми же самыми значениями (1.25) для 0iy. Для этого в правой части (1.22) выделим первое слагаемое ацЛТ}, а в каждому остальных слагаемых разложим минор (п — 1)-го порядка М{ по первой строке. В результате права_я_ часть (1.22) представится в виде суммы первого слагаемого ацМ} и линейной комбинации с некоторыми коэффициентами Of/ миноров (п, — 2)-го порядка Мц, т. е. в виде п п + S S QifMi1!, (1.26) (=2/=2 и нам остается вычислить множители 9^ и убедиться в справед- ливости для них формулы (1.25). __ Для этого заметим, что минор М\\ получается в результате разложения по первой строке только одного из миноров п — 1-го порядка, отвечающих первому столбцу, — минора М‘. Запишем в разложении минора Л1{ (при i 2)_по первой строке только то слагаемое, которое содержит минор Mt‘ (остальные не интересу- ющие нас слагаемые обозначим многоточием). Учитывая, что эле- мент alf минора М‘ стоит на пересечении первой строки и (/ — 1)-го столбца этого минора, мы получим, что при I ^2 Adj = (-—l)1+(/-l)ai/AtJ/ +... (1.27) Вставляя (1.27) в правую часть (1.22), из которой исключено первое слагаемое, и собирая коэффициент при Mj), мы получим, что во в сумме (1.26) определяется той же самой формулой (1.25), что и в равенстве (1.23). Теорема 1.2 доказана. 2. Выражение определителя непосредственно через его эле- менты. Установим формулу, выражающую определитель /г-го по- рядка непосредственно через его элементы (минуя миноры). Пусть каждое из чисел ап сс2, .... ап принимает одно из зна- чений 1, 2, .... п, причем среди этих чисел нет совпадающих (в таком случае говорят, что числа ах, а2, ..., ап являются не- которой перестановкой чисел 1, 2, ..., п). Образуем из чисел alt а2, .... ап все возможные пары а£ау и будем говорить, что пара а,а; образует беспорядок, если а; > а7- при i < /. Общее число беспорядков, образованных всеми парами, ко- торые можно составить из чисел ах, а2....ап, обозначим сим- волом N (а1( а2, .... ап).
24 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ ГГЛ. I С помощью метода индукции установим для определителя п-го порядка (1.11) следующую формулу: А = det А = S (- 1)" (“х’ ............“п) ^1^2... аап (1.28) «2. • . ап (суммирование в этой формуле идет по всем возможным переста- новкам ах, а2, .... ап чисел 1, 2, .... п; число этих переста- новок, очевидно, равно nl). В случае п = 2 формула (1.28) элементарно проверяется (в этом случае возможны только две перестановки 1,2 и 2, 1, и, поскольку N (1, 2) — О, N (2, 1) = 1, формула (1.28) переходит в равенство (1.10)). С целью проведения индукции предположим, что формула (1.28) при п > 2 справедлива для определителя порядка (п — 1). Тогда, записав разложение определителя л-го порядка (1.11) по первому столбцу *): A = detA = S (—l)“* + 1«aiiM?, (1.29) а, = 1 мы можем, в силу предположения индукции, представить каждый минор (л — 1)-го порядка Л1“* в виде М?* = S (-1)"(“а............а^ааг2...аапП (1.30) а* . . . ......п (суммирование идет по всем возможным перестановкам а2, .... ап (л — 1) чисел, в качестве которых берутся все натуральные числа от 1 до л, за исключением числа ах). Так как из чисел ах, а2, ..., ап, кроме пар, образованных из чисел а2, .... ап, можно образовать еще только следующие пары aia2, аха3, ..., ахап, и поскольку среди чисел а2, ..., ап найдется ровно (<хх — 1) чисел, меньших числа ах, то N (ах, а2, .... ап) = N (а2, .... а„) + ах — 1. Отсюда вытекает, что (—1) ' * '(—1) =(—1) k 1 2 , и, вставляя (1.30) в (1.29), мы в точности получим формулу (1.28). Тем самым вывод формулы (1.28) завершен. В заключение заметим, что в большинстве курсов линейной алгебры формула (1.28) положена в основу понятия определителя n-го порядка. 3. Теорема Лапласа * **). В этом пункте мы установим заме- чательную формулу, обобщающую формулу разложения определи- теля n-го порядка по какой-либо его строке. С этой целью введем в рассмотрение миноры матрицы п-го порядка (1.8) двух типов. ♦) Индекс, по которому производится суммирование, на этот раз нам удобно обозначить буквой а1. **)П. С Лаплас — выдающийся французский астроном, математик и фи- зик (1749-1827).


ОПРЕДЕЛИТЕЛИ 25 $ 2] Пусть k — любой номер, меньший п, a й. i2, ih и h, ]‘г, ...» ih — произвольные номера, удовлетворяющие условиям 1 « /х < 1г < < ih < «. 1 < А < /, < ... < jh С п. Миноры первого типа Af/j’’’’ Д являются определителями порядка k, соответствующими той матрице, которую образуют элементы матрицы (1.8), стоящие на пересечении k строк с номе- рами и, is, .... ih и k столбцов с номерами /1( /2. jh. Миноры второго типа являются определите- лями порядка п — k, соответствующими той матрице, которая получается из матрицы (1.8) в результате вычеркивания k строк с номерами й> i2, ..., ih и k столбцов с номерами Д, /2, .... /\. Миноры второго типа естественно назвать дополнитель- ными по отношению к минорам первого типа. Теорема 1.3 (теорема Лапласа). При любом номере k, меньшем п, и при любых фиксированных номерах строк ilt i2, ... ..., ik таких, что 1 < й < t2 < ... < ц < п, для определителя п-го порядка (1.11) справедлива формула 4 = det4= S (—l)’i+---+4+4+•••+/* х >!• ...4 хм'й:::^й:::£ а.зо называемая разложением этого определителя по /гетронам й, i2, .... ih. Суммирование в этой формуле идет по всем возможным значениям индексов ]г, ..., jh, удовлет- воряющим условиям 1 < /1 < /а < ... < jh < п. Доказательство. Прежде всего заметим, что формула (1.31) является обобщением уже доказанной нами формулы раз- ложения определителя п-го порядка по о д н о й его строке с но- мером й, в которую она переходит при k = 1 (при этом минор М‘‘ совпадает с элементом alt/l, а минор — это введенный выше минор элемента а/1Л). Таким образом, при k= 1 формула (1.31) доказана. Доказа- тельство этой формулы для любого k, удовлетворяющего неравен- ствам 1 < k < п, проведем по индукции, т. е. предположим, что формула (1.31) справедлива для (k— 1) строк, и, опираясь на это, убедимся в справедливости формулы (1.31) для k строк. Итак, пусть 1 < k < п и фиксированы какие угодно k строк матрицы (1.8) с номерами й. i2, й. удовлетворяющими усло- вию 1 < й < ’а < ••• < й < п- Тогда по предположению для (k — 1) строк с номерами й, •••> й-i справедлива формула Д = 2 (_1)‘1+ •••+4-1+4+ •••+й_1Х 4* • • < 4-1 а .32)
26 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 (суммирование идет по всем возможным значениям индексов /х, •••. /к-i» удовлетворяющим условиям 1 < Д < /2 < ... - < /а-i С «)• _ Разложим в формуле (1.32) каждый минор по строке, имеющей в матрице (1.8) номер ц. В результате весь опре- делитель А будет представлен в виде некоторой линейной ком- бинации миноров (И/J •••/л’?* с коэффициентами, которые мы обозначим через 0/j.../л, т. е. для А будет справедливо равен- ство *) А = 0/1... ’ /*, и нам остается вычис- h....4 лить коэффициенты 0^.,. и убедиться в том, что они равны \=(-1/‘+' +,‘+,‘+ +'*л»£;::() ,зз> С этой целью заметим, что минор (п — fe)-ro порядка МС^ получается в результате разложения по строке с номером ik только следующих k миноров (п — k + 1)-го порядка: (s=l, 2, ... А), (1.34) ибо каждый из остальных содержащих строку is миноров (п — — k + 1)-го порядка не содержит всех строк и всех столбцов минора М* В разложении каждого минора (1.34) по строке матрицы (1.8) с номером 4 выпишем только то слагаемое, которое содержит минор (остальные не интересующие нас слагаемые обоз- начим многоточием). Учитывая при этом, что в каждом миноре (1.34) элемент aikjs стоит на пересечении (4 — (k — 1) ]-й строки и 1/4 — (s—1) ]-го столбца этого минора***), мы получим A’/i-../* (беэ/,) — (— О a44M/i---4 + --- *) Суммирование в этом равенстве, как и выше, идет по всем возможным значениям индексов /х,.... /а, удовлетворяющим условию 1 /х </» < ..•’С/а3^ л. **) Символом 'Ь-^без / > обозначается минор, отвечающий пере- сечению строк с номерами it...ja_i и всех столбцов с номерами ц, /2,..., /а, за исключением столбца с номером /„ а символом (1.34) дополнительный к нему минор. ***) Это вытекает из того,что строке с номером 4 предшествует (k — 1) строк, а столбцу с номером/( предшествует (s—1) столбцов минора /*_1(без / >• к которому минор (1.34) является дополнительным.


ОПРЕДЕЛИТЕЛИ 27 $ 31 Теперь нам остается учесть, что в формуле (1.32) каждый минор (1.34) умножается на множитель и после этого суммируется по всем s от 1 до k. Имея также в виду, ЧТО (—I)2-2*-2s =1, МЫ получим, ЧТО д _ / п'1+---+'а + '1+ •••+/* Гу , i/'+Sjx'l---fi_l 1 —[s“l( 1} ••• Z* <6e3/s)J ' Замечая, что сумма в квадратных скобках представляет собой разложение минора по его последней &-й строке, мы окончательно получим для 0/ ... ,k формулу (1.33). Теорема Лап- ласа доказана. Замечание. В полной аналогии с формулой (1.32) запи- сывается и выводится формула разложения определителя по каким-либо k его столбцам. 4. Свойства определителей. Ниже устанавливается ряд свойств, которыми обладает произвольный определитель п-го порядка. 1.Свойство равноправности строк и столбцов. Транспонированием любой матрицы или определителя называется операция, в результате которой меняются местами строки и столбцы с сохранением порядка их следования. В результате транспонирования матрицы А получа- ется матрица, называемая транспонированной по отношению к матрице Ли обозначаемая символом А'. В дальнейшем мы договоримся символами IА |, | В |, |Л'|... обозначать определители квадратных матриц А, В, А' ... соот- ветственно. Первое свойство определителя формулируется так: при тран- спонировании величина определителя сохраняется, т. е. 1Л'| = = |Л|. Это свойство непосредственно вытекает из теоремы 1.2 (доста- точно лишь заметить, что разложение определителя | А | по пер- вому столбцу тождественно совпадает с разложением определи- теля | Л' | по первой строке). Доказанное свойство означает полную равноправность строк и столбцов и позволяет нам все последующие свойства устанавли- вать лишь для строк и быть уверенными в справедливости их и для столбцов. 2°. Свойство антисимметрии при пере- становке двух строк (или двух столбцов). При перестановке местами двух строк (или двух столбцов) опре- делитель сохраняет свою абсолютную величину, но меняет знак на прот ивоположный.
28 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ (ГЛ. I Для определителя второго порядка это свойство проверяется элементарно (из правила (1.10) сразу вытекает, что определители I aU a12 I |а21 Ям I . „ I и I I отличаются лишь знаком). I “al яаа | |ац ais | ' Считая, что п > 2, рассмотрим теперь определитель n-го по- рядка (1.11) и предположим, что в этом определителе меняются местами две строки с номерами ii и ia. Записывая формулу Лап- ласа разложения по этим двум строкам, будем иметь а= S (- 1У‘+'’+л+М:Ж2. (1.35) /1. it При перестановке местами строк с номерами и /г каждый оп- ределитель второго порядка в силу доказанного выше ме- няет знак на противоположный, а все остальные величины, стоя- щие под знаком суммы в (1.35), совсем не зависят от элементов строк с номерами t‘i и 1г и сохраняют свое значение. Тем самым свойство 2° доказано. 3°. Линейное свойство определителя. Бу- дем говорить, что некоторая строка (аъ а2, ..., а„) является линейной комбинацией строк (bu Ь2, ..., Ьп), (q, ca, ..., сп), ..., (di, d2, ..., dn) с коэффициентами Л, р..v, если as = ‘kbj + pcj + ... + vd} для всех j — 1, 2, .... п. Линейное свойство определителя можно сформулировать так: если в определителе п-го порядка Д некоторая i-я строка (аа, а/а, •••> ain) является линейной комбинацией двух строк (Ьи Ь2, .... Ьп) и (ct, сг, .... сп) с коэффициентами X и р, то Д = = ХДх + рД2, где Дх — определитель, у которого i-я строка равна (bi, Ь2, .... bn), а все остальные строки те же, что и у Д, а Да — определитель, у которого i-я строка равна (си с2, ... ..., сп), а все остальные строки те же, что и у Д. Для доказательства разложим каждый из трех определителей Д, Да и Да по i-й строке и заметим, что у всех трех определите- лей все миноры Л4/ элементов t-й строки одинаковы. Но отсюда следует, что формула Д = ХДа + рДа сразу вытекает из равенств аи — Щ + цс; (/ = 1, 2, ..., n). Конечно, линейное свойство справедливо и для случая, когда t-я строка является линейной комбинацией не двух, а нескольких строк. Кроме того, линейное свойство справедливо и для столб- цов определителя. Доказанные три свойства являются основными свойст- вами определителя, вскрывающими его природу. Следующие пять свойств являются логическими следствиями трех основных свойств. Следствие 1. Определитель с двумя одинаковыми строками (или столбцами) равен нулю. (В самом деле, при перестановке двух одинаковых строк, с одной стороны, определитель Д не из-


S 2] ОПРЕДЕЛИТЕЛИ 29 менится, а с другой стороны, в силу свойства 2° изменит знак на противоположный. Таким образом, А = —А, т. е. 2А = 0 или Следствие 2. Умножение всех элементов некоторой строки (или некоторого столбца) определителя на число X равносильно умножению определителя на это число X. Иными словами, общий множитель всех элементов некоторой строки (или некоторого столбца) определителя можно вынести за знак этого определителя. (Это свойство вытекает из свойства 3° при р = 0.) Следствие 3. Если все элементы некоторой строки (или некоторого столбца) определителя равны нулю, то и сам опреде- литель равен нулю. (Это свойство вытекает из предыдущего при Х = 0.) Следствие 4. Если элементы двух строк (или двух столбцов) определителя пропорциональны, то определитель равен нулю. (В самом деле, в силу следствия 2 множитель пропорциональности можно вынести за знак определителя, после чего останется опре- делитель с двумя одинаковыми строками, который равен нулю согласно следствию 1). Следствие 5. Если к элементам некоторой строки (или не- которого столбца) определителя прибавить соответствующие эле- менты другой строки (другого столбца), умноженные на произ- вольный множитель X, то величина определителя не изменится. (В самом деле, полученный в результате указанного прибавле- ния определитель можно в силу свойства 3° разбить на сумму двух определителей, первый из которых совпадает с исходным, а второй равен нулю в силу пропорциональности двух строк (или столбцов) и следствия 4.) Замечание. Следствие 5, как и линейное свойство, допу- скает более общую формулировку, которую мы приведем для строк: если к элементам некоторой строки определителя приба- вить соответствующие элементы строки, являющейся линейной комбинацией нескольких других строк этого определителя (с каки- ми угодно коэффициентами), то величина определителя не из- менится. Следствие 5 широко применяется при конкретном вычислении определителей (соответствующие примеры будут приведены в сле- дующем пункте). Прежде чем сформулировать еще одно свойство определителя, введем полезное понятие алгебраического дополнения данного элемента определителя. Алгебраическим дополнением данного эле- мента at) определителя п-го порядка (1.11) назовем число, равное (—I)z+/ Л4; и обозначаемое символом Ац. Таким образом, алгебраическое дополнение данного элемента может отличаться от минора этого элемента только знаком.
30 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 С помощью понятия алгебраического дополнения теоремы 1.1 и 1.2 можно переформулировать так: сумма произведений элемен- тов любой строки (любого столбца) определителя на соответству- ющие алгебраические дополнения этой строки (этого столбца) равна этому определителю. Соответствующие формулы разложения определителя по i-й строке и по /-му столбцу можно переписать так: п Д==2 ацАц (Для любого i=sl, 2, п), (1-13') /=1 п Д=£ aijAtj (для любого /=1, 2, л). (1.21') Теперь мы можем сформулировать последнее свойство опреде- лителя: 4°. Свойство алгебраических дополнений соседних строк (или столбцов). Сумма произве- дений элементов какой-либо строки (или какого-либо столбца) определителя на соответствующие алгебраические дополнения элементов любой другой строки (любого другого столбца) равна нулю. Доказательство проведем для строк (для столбцов оно прово- дится аналогично). Записывая подробно формулу (1.13') аИ аП • • • а1л а31 °22 • • • °2П — АаОц + Al2ai2 Ainain, (1.36) ат апз • • • апп заметим, что поскольку алгебраические дополнения Д/ь А1г, ... .... Ain не зависят от элементов i-й строки аа, а12, ...» ain, то равенство (1.36) является тождеством относительно ап, ai2, ..., а1П и сохраняется при замене чисел Ан» агг> .... а/п любыми другими п числами. Заменив ai2, ai2, ..., ain соответствующими элементами любой (отличной от i-й) k-и строки ahl, ап2, ..., akn, мы получим слева в (1.36) определитель с двумя одинаковыми строками, равный нулю согласно следствию 1. Таким образом, An^ki + AigO/a -j- ... 4~ А1паЛп = 0 (для любых несовпадающих i и k). 5. Примеры вычисления определителей. При конкретном вы- числении определителей широко используются формулы разло- жения по строке или столбцу и следствие 5, позволяющее, не изменяя величины определителя, прибавлять к любой его строке (или столбцу) произвольную линейную комбинацию других его


ОПРЕДЕЛИТЕЛИ 31 S 23 строк (или столбцов). Особенно удобно использовать формулу разложения по тем строкам (или столбцам), многие элементы ко- торых равны нулю. В частности, если в данной строке отличен от нуля только один элемент, то разложение по этой строке со- держит только одно слагаемое и сразу сводит вопрос о вычислении определителя порядка п к вопросу о вычислении определителя порядка (п — 1) (минора, стоящего в указанном слагаемом). Если в данной строке отличны от нуля несколько элементов, отвечающих пересечению этой строки с несколькими столбцами, то, применяя к указанным столбцам следствие 5, мы можем, не изменив определителя, обратить в нуль все элементы данной строки, за исключением одного. Перейдем к конкретным примерам. Пример 1. Пусть требуется вычислить следующий опре- делитель четвертого порядка: 4 99 83 1 0 8 16 0 д = 60 17 134 20 • 15 43 106 5 * Вычитая из первого столбца утроенный последний столбец, будем иметь 1 99 83 1 д = 0 0 8 17 16 134 0 20 0 43 106 5 Далее естественно разложить определитель по первому столбцу. В результате получим Д== 1- 8 17 43 16 О 134 20 106 5 Теперь в определителе третьего порядка вычтем из второго столбца удвоенный первый столбец. При этом будем иметь 8 17 43 Д = 0 0 100 20 20 5 Разлагая, наконец, последний определитель третьего порядка по первой строке, окончательно получим Д = 8-1 ’°0 “ | = 8 (500 - 400) = 800. I л\) OU I
32 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 Пример2, Вычислим так называемый треугольный определитель, у которого все элементы, лежащие выше главной диагонали, равны нулю 011 С21 Ап = 1 О ... О о а22 , .. О О а(п~ 1)2 • • -а(п— I) (л— I, О ви2. Лжл-ч апп Разлагая определитель Дп по последнему столбцу, мы получим, что он равен произведению элемента апп на треугольный опреде- литель (п — 1)-го порядка Дп_ь равный Д «И а21 О О а22 а(п-1) а(п — 1) 2 "• а(п —1) (п —1) Последний определитель мы снова разложим по его последнему столбцу, в результате чего убедимся в том, что он равен произ- ведению элемента a(n.n (n-i) на треугольный определитель (п — 2)-го порядка Дп_2. Продолжая аналогичные рассуждения, мы придем к следующему выражению для исходного определи- теля. Дп ^11^22 ••• &ПП‘ Итак, треугольный определитель равен произведению элементов, стоящих на его главной диагонали. Замечание 1. Если у определителя Д равны нулю все элементы, лежащие ниже главной диагонали, то этот определи- тель также равен произведению элементов, лежащих на его глав- ной диагонали (убедиться в этом можно по схеме, изложенной выше но примененной не к последним столбцам, а к последним строкам можно и просто произвести транспонирование Д и свести этот случай к рассмотренному выше). Аналогичным способом устанавливается, что определитель, у которого равны нулю все элементы, лежащие выше (или ниже) побочной диагонали, равен произведению числа (—ipO’-D/a и всех элементов, лежащих на этой диагонали. Пример 3. Обобщением треугольного определителя вто рого порядка может служить определитель 2п-го порядка следую- II Д 0| В С ’ в К0Т0Р°й А’ В и С — произволь- ные квадратные матрицы n-го порядка, а О — нулевая квадратная матрица n-го порядка. Убедимся в том, что для указанного


S 21 ОПРЕДЕЛИТЕЛИ 33 определителя справедлива формула (1.37) Привлекая теорему Лапласа, разложим определитель, стоящий в левой части(1.37), по первым п строкам. Так как определитель, у которого хотя бы один столбец состоит из нулей, равен нулю, то в формуле разложения (1.31) будет отлично от нуля только одно слагаемое, причем это слагаемое (в силу того, что (—l)(i+.. +'i)+(i+.. +'i)= 1) будет как раз равно | А | | С |. Замечание 2. Аналогичными рассуждениями легко убе- диться в справедливости формулы | Ас В | = (- 1)"|В||С| (1.38) (А, В, С и О имеют тот же смысл, что и выше). Для этого следует разложить определитель, стоящий в левой части (1.38), по последним п строкам и учесть, что (__1)[(п+1)+... +2п]+[1+... +ч] — (_1)2п (2п+1)/2 _ (_ Пример 4. Вычислим теперь так называемый опреде- литель Вандермонда 1 I ... 1 xi хг ... хп А (хъ х2 хп) = *? *2 ... 4 (1.39) „п — 1 — 1 -Л — 1 Х1 х2 • • • хп Вычитая первый столбец из всех последующих, будем иметь 1 xi 0 (Х2 ~ *1) « • • • • • 0 (хп ~ х1) А(хь х2, ..., хп) = Х1 (х*_х*) • • • (хп - *1) *Г‘ (хГ1 Далее естественно произвести разложение по первой строке, в результате чего мы получим А (х1( х2, ... , хп) = (*2~ *1) («3 —*1) ... (Хп— Xj) -А) Й - *?) ... ~ *1) (хГ1-*?’*) (х^’-*?“’) ... (хГ1-^-1) *) Напомним, что символами I А |, | В |, | С |,... мы договорились обозна- чать определители матриц А, В, С,... соответственно. 2 Зак 459
34 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 Вычитая теперь из каждой строки предыдущую строку, умно- женную на xlt получим Д(хь х2,. • Лп) = (х2 — Хх) х2(ха — Хх) (Xj — Хх) х3(х3 — Хх) (Х„ — Хх) ХЯ(Х„ — Хх) Х?“2(Х2--Х1) *з“2(хз-х1) ... х^-2(х„_х,) Далее мы можем вынести за знак определителя общий множитель первого столбца, равный (х2 — -Ч). общий множитель второго столбца, равный (х3 — Хх), .... общий множитель (п — 1)-го столбца, равный (хп — xj. В результате получим A (Xi, хг, .... хп) = = (х2 — Х1) (х8 — Хх) ... (хп — Хх). Д (х2, х3, .... хп). Со стоящим в правой части определителем А (х2, х3, ..., хп) поступим точно так же, как и с Д (хи х2, ..., хп). В результате получим, что Д (х2, х3...хп) = (х3 — х2) ... (хп — х2)-Д (х3, ..., хп). Продолжая аналогичные рассуждения далее, окончательно получим, что исходный определитель (1.39) равен Д (Хх, х2, ..., х„) = = (х2 — Хх) (х3 — Хх) ... (хп — Хх) (х3 — х2) ... (х„ — х2) ... • •• (хп — Хп_х). 6. Определитель суммы и произведения матриц. Непосред- ственно из линейного свойства определителя вытекает, что опре- делитель суммы двух квадратных, матриц одного и того же по- рядка п А = || at) || и В = || bjj || равен сумме всех различных опреде- лителей порядка п, которые могут получиться, если часть строк (или столбцов) брать совпадающими с соответствующими стро- ками (или столбцами) матрицы А, а остальную часть — совпада- ющими с соответствующими строками (или столбцами) В. Докажем теперь, что определитель матрицы С, равной про- изведению квадратной матрицы А на квадратную матрицу В, равен произведению определителей матриц А и В. Пусть порядок всех трех матриц А, В и С равен п, и* пусть О — нулевая квадратная матрица порядка п, а (—1) £ следующая матрица: — 1 о ... о я о о ... —1


$ 2] ОПРЕДЕЛИТЕЛИ 35 В силу примера 2 из предыдущего пункта определитель матрицы (—1) Е равен числу (—1)п. Рассмотрим следующие две блочные квадратные матрицы порядка 2л: 1<л£ Л » 1Л. о!- В силу формул (1.37) и (1.38) из предыдущего пункта опреде- лители этих матриц равны ?|-М|-|В|. |41>е о|=(-1Г|(-1)£||С|=|С|. Таким образом, достаточно доказать равенство определителей I А О| I л СI |(-1)£ в| И |(— 1)£ о|. Подробнее эти два определителя можно записать так: 011 012 «1л 0 0 • . • 0 «21 агг ... Ojn 0 0 • • • 0 °П2 • • • Опп 0 0 • • • 0 —1 0 0 *11 *12 • • • *1П 0 —1 0 *21 *22 • • • *2П 0 0 —1 *П1 *П2 • • • *пп Оц O1S • • • ащ он 0Ц • • • Qn °21 °22 • • • огп 021 С«2 • • • Сап °П1 ап2 • • • аПП 0п1 сп2 • спп —10 ... 0 0 0 . .. о • 0 —1 ... 0 0 0 . . . 0 0 0 —1 0 0 . . . 0 (1.40) Для того чтобы убедиться в равенстве этих двух определите- лей, достаточно заметить, что первые п столбцов у этих определи- телей совпадают, а каждый столбец второго определителя (1.40) с номером л + k (где k — 1, 2.....л) в силу формулы с1} = п = S Qikbki, получается в результате прибавления к (п + Л)-му столбцу первого определителя (1.40) линейной комбинации пер- вых л его столбцов с коэффициентами, соответственно равными
36 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 Ьм, .... Ькп. Таким образом, определители (1.40) равны в силу следствия 5 из п. 3. В заключение заметим, что непосредственно из формулы (1.37) вытекает, IА 01 что определитель прямой суммы | А ф В | = двух матриц А и В равен IО В I произведению определителей этих матриц. 7. Понятие обратной матрицы. Пусть А — квадратная ма- трица п-го порядка, а Е — единичная квадратная матрица того же порядка (см. п. 2 § 1). Матрица В называется правой обратной по отно- шению к матрице А, если АВ — Е. Матрица С называется левой обратной по отноше- нию к матрице А, если С А — Е. Так как обе матрицы А и Е являются квадратными матрицами порядка п, то матрицы В и С (при условии, что они существуют) также являются квадратными матрицами порядка п. Убедимся в том, что если обе матрицы В и С существуют, то они совпадают между собой. В самом деле, на основании равенств (1.7) (см. п. 2 § 1), соотношений АВ = Е, С А — Е и сочетатель- ного свойства произведения матриц, получим С = СЕ = С (АВ) = (СА) В = ЕВ = В. Естественно возникает вопрос об условиях на матрицу А, при выполнении которых для этой матрицы существуют как ле- вая, так и правая обратные матрицы * **)). Теорема 1.4. Для того чтобы для матрицы А существовали левая и правая обратные матрицы, необходимо и достаточно, чтобы определитель det А матрицы А был отличен от нуля. До казательств о. ^Необходимость. Если для матрицы А существует хотя бы одна из обратных матриц, напри- мер В, то из соотношения А-В = Е мы получим, что det A -det В= — det Е — 1 ♦*), откуда вытекает, что det А =/= 0. 2) Достаточность. Пусть определитель Д « det А отличен от нуля. Обозначим, как и выше, символом AtJ алгебраи- ческие дополнения элементов ai} матрицы А и составим матрицу В, в i-fi строке которой стоят алгебраические дополнения i-ro столбца матрицы А, поделенные на величину определителя. Д: Ап1 Д Апг Д All ^21 д д Au Att Д Д (1-41) Л1П Лап Лпп Д Д • • • Д *) И, стало быть, эти матрицы совпадают. **) det Е = 1 в силу примера 2 из п. 5 этого параграфа.


$ 31 ТЕОРЕМА О БАЗИСНОМ МИНОРЕ МАТРИЦЫ 37 Убедимся в том, что эта матрица В является как правой, так и левой обратной по отношению к матрице А. Достаточно доказать, что оба произведения АВ и ВА явля- ются единичной матрицей. Для этого достаточно заметить, что у обоих произведений любой элемент, не лежащий на главной диагонали, равен нулю, ибо после выноса множителя 1/Д этот элемент равен сумме произведений элементов одной строки (или одного столбца) на соответствующие алгебраические дополнения другой строки (или другого столбца). Что же касается элементов, лежащих на главной диагонали, то у обоих произведений АВ и ВА все такие элементы равны единице в силу того, что сумма произведений элементов и соответствующих алгебраических до- полнений одной строки (одного столбца) равна определителю. Теорема доказана. Замечание 1. Квадратную матрицу А, определитель det А которой отличен от нуля, принято называть невырож- денной. Замечание 2. Впредь мы можем опускать термины «левая» и «правая» и говорить просто о матрице В, обратной по отношению кневы рожденной матрице А и опреде- ляемой соотношениями АВ = В А — Е. Очевидно также, что свойство быть обратной матрицей взаимно в том смысле, что если В является обратной для А, то А является обратной для В. Ма- трицу, обратную к матрице А, впредь мы будем обозначать сим- волом Л"1. § 3< Теорема о базисном миноре матрицы 1. Понятие линейной зависимости строк. Выше мы уже до- говорились называть строку *) А = (а1( а2, .... ап) линейной комбинацией строк В = (bi, b2, .... Ьп)...С — (с1г с2, ..., сп), если для некоторых вещественных чисел Л, ..., р справедливы равенства Oj = “kbj + ... + рсу (/ = 1, 2, ..., п). (1-42) Указанные п равенств (1.42) удобно записать в виде одного ра- венства А — кВ + ... + рС. (1.43) Всякий раз, когда будет встречаться равенство (1.43), мы будем понимать его в смысле п равенств (1.42). Введем теперь понятие линейной зависимости строк. Определение. Строки А = (аъ а2, .... ап), В = (Ьи Ь2, ... .... Ьп), .... С = (fj, с2, .... сп) назовем линейно з а в и с и - м ы м и, если найдутся такие числа а, р, ..., у, не все равные нулю, что справедливы равенства аа} + pfy + ... + ycj = 0 (/= 1, 2, ..., п). (1.44) *) Каждую строку можно рассматривать как матрицу. Поэтому естественно использовать для обозначения строк большие латинские буквы.
33 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ 1 п равенств (1.44) удобно записать в виде одного равенства аА 4* рВ 4* ... 4* уС = О, (1-45) в котором О = (0, 0, 0) обозначает нулевую строку. Строки, не являющиеся линейно зависимыми, называются линейно независимыми. Можно дать и «самостоя- тельное» определение линейной независимости строк: строки А, В, ..., С называются линейно независимыми, если равенство (1.45) возможно лишь в случае, когда все числа а, Р, ..., у равны нулю. Докажем следующее простое, но важное утверждение. Теорема 1.5. Для того чтобы строки А, В, ..., С были ли- нейно зависимы, необходимо и достаточно, чтобы одна из этих строк являлась линейной комбинацией остальных строк. Доказательство. 1) Необходимость. Пусть строки А, В, ..., С линейно зависимы, т. е. справедливо равен- ство (1.45), в котором хотя бы одно из чисел а, р, ..., у отлично от нуля. Ради определенности допустим, что а =/= 0. Тогда поде- лив (1.45) на а и введя обозначения % = —р/а, ..., р = —у/а, мы можем переписать (1.45) в виде А — КВ 4* ... 4* рС, (1-46) а это и означает, что строка А является линейной комбинацией строк В, ..., С. 2) Достаточность. Пусть одна из строк (например, А) является линейной комбинацией остальных строк. Тогда най- дутся числа X, ..., р такие, что справедливо равенство (1.46). Но это последнее равенство можно переписать в виде (— 1) А 4- КВ 4- ... 4- рС = О *). Так как из чисел —1, X, ..., р одно отлично от нуля, то послед- нее равенство устанавливает линейную зависимость строк А, В, ..., С. Теорема доказана. Конечно, во всех проведенных выше рассуждениях термин «строки» можно заменить термином «столбцы». 2. Теорема о базисном миноре. Рассмотрим произвольную (не обязательно квадратную) матрицу л= а11 <*12 а21 °22 °1П (1.47) °т| ^тг • • • атп Минором k-ro порядка матрицы А будем называть определитель k-ro порядка с элементами, лежащими на пересе- *) Здесь О = (0, 0,...» 0) — нулевая строка.


§ З] ТЕОРЕМА О БАЗИСНОМ МИНОРЕ МАТРИЦЫ 39 чении любых k строк и любых k столбцов матрицы А. (Конечно, k не превосходит наименьшее из чисел тип.) Предположим, что хотя бы один из элементов ai} матрицы А отличен от нуля. Тогда найдется такое целое положительное чис- ло г, что будут выполнены следующие два условия: 1) у мат- рицы А имеется минор r-го порядка, отличный от нуля, 2) вся- кий минор (г + 1)-го и более высокого порядка (если таковые существуют), равен нулю. Число г, удовлетворяющее требованиям 1) и 2), назовем ран- гом матрицы А *). Тот минор r-го порядка, который отличен от нуля, назовем базисным минором (конечно, у мат- рицы А может быть несколько миноров r-го порядка, отличных от нуля). Строки и столбцы, на пересечении которых стоит базис- ный минор, назовем соответственно базисными стро- ками и базисными столбцами. Докажем следующую основную теорему. Теорема 1.6 (теорема о базисном миноре). Базисные строки (базисные столбцы) линейно независимы. Любая строка (лю- бой столбец) матрицы А является линейной комбинацией базис- ных строк (базисных столбцов). Доказательство. Все рассуждения проведем для строк. Если бы базисные строки были линейно зависимы, то по те- ореме 1.5 одна из этих строк являлась бы линейной комбинацией других базисных строк, и мы могли бы, не изменяя величины базис- ного минора, вычесть из этой строки указанную линейную комби- нацию и получить строку, целиком состоящую из нулей, а это противоречило бы тому, что базисный минор отличен от нуля. Итак, базисные строки линейно независимы. Докажем теперь, что любая строка матрицы А является ли- нейной комбинацией базисных строк. Так как при произвольных переменах строк (или столбцов) определитель сохраняет свойство равенства нулю, то мы, не ограничивая общности, можем счи- тать, что базисный минор находится в левом верхнем углу матрицы (1.47), т. е. расположен на первых г строках и первых г столбцах. Пусть / — любое число от 1 до п, a k — любое число от 1 до т. Убедимся в том, что определитель (г + 1)-го порядка «и Он 01Г 01/ fl21 Он •. . &2J (1.48) «П ап • • • Огг OrJ 0*1 akt • а • О*г о*/ *) Ранг матрицы А, все элементы которой — нули, по определению равен нулю.
40 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 равен нулю. Если / < г или k < г, то указанный определитель будет равен нулю в силу того, что у него будет два одинаковых столбца или две одинаковые строки. Если же оба числа / и k превосходят г, то (1.48) является ми- нором матрицы А порядка (г + 1), а всякий такой минор равен нулю (по определению базисного минора). Итак, определитель (1.48) равен нулю при всех / от 1 до п и всех k от 1 до т. Но тогда, разложив этот определитель по последнему столбцу и обозначив не зависящие от номера j алгебраические дополнения элементов этого столбца символами А1} = с1( Аг} = сг....Аг} — — Ahj = сг+1, мы получим, что ciau + с2а2/ + • • • + cTari 4- cr+1aft( = 0 (для всех j — 1, 2, ..., п). Учитывая, что в последних равенст- вах алгебраическое дополнение сг+1 = Аь} совпадает с заведомо отличным от нуля базисным минором, мы можем поделить каждое из этих равенств на сг+1. Но тогда, вводя обозначения мы получим, что ак) = Му + + ... + ктаг} (для всех /= 1, 2, ..., п), а это и означает, что k-я строка является ли- нейной комбинацией первых г (базисных) строк. Теорема дока- зана. 3. Необходимое и достаточное условие равенства нулю опре- делителя. Теорема 1.7. Для того, чтобы определитель п-го порядка Д был равен нулю, необходимо и достаточно, чтобы его строки (столбцы) были линейно зависимы. Доказательство. 1) Необходимость. Если определитель n-го порядка Д равен нулю, то базисный минор его матрицы имеет порядок г, заведомо меньший п. Но тогда хотя бы одна из строк является не базисной. По теореме 1.6 эта строка является линейной комбинацией базисных строк. В эту линейную комбинацию мы можем включить и все оставши- еся строки, поставив перед ними нули. Итак, одна строка является линейной комбинацией остальных. Но тогда по теореме 1.5 строки определителя линейно зависимы. 2) Достаточность. Если строки Д линейно зависимы, то по теореме 1.5 одна строка At является линейной комбинацией остальных строк. Вычитая из строки Л, указанную линейную комбинацию, мы, не изменив величины Д, получим одну строку, целиком состоящую из нулей. Но тогда определитель Д равен нулю (в силу следствия 3 из п. 4 § 2). Теорема доказана.

I
ГЛАВА 2 ЛИНЕЙНЫЕ ПРОСТРАНСТВА Из курса аналитической геометрии читатель знаком с опе- рацией сложения свободных векторов и с операцией умножения вектора на вещественное число, а также со свойствами этих опе- раций. В настоящей главе изучаются множества объектов любой природы, для элементов которых каким-либо способом (причем, безразлично каким) определены операция сложения элементов и операция умножения элемента на вещественное число, причем указанные операции обладают теми же свойствами, что и соответ- ствующие операции над геометрическими векторами. Такие мно- жества, называемые линейными пространствами, обладают целым рядом общих свойств, которые и будут установ- лены в настоящей главе. § 1. Понятие линейного пространства 1. Определение линейного пространства. Множество R эле- ментов х, у, Z, ... любой природы называется линейным (или аффинным) пространством, если выполнены следующие три требования-. I. Имеется правило, посредством которого любым двум эле- ментам х и у множества R ставится в соответствие третий элемент z этого множества, называемый суммой элементов х и у и обозначаемый символом z = X + у. II Имеется правило, посредством которого любому элементу х множества R и любому вещественному числу X ставится в соот- ветствие элемент и этого множества, называемый произве- дением элемента х на число К и обозначаемый символом и — ‘кх или и = x'k. III. Указанные два правила подчинены следующим восьми аксиомам: Г. х + у = у + х (переместительное свойство суммы); 2°. (х + у) + z = х+ (у + z) (сочетательное свойство суммы); 3°. существует нулевой элемент 0 такой, что х + 0 = х для любого элемента х (особая роль нулевого элемента); 4°. для каждого элемента х существует противопо- ложный элемент х' такой, что х 4- х' = 0;
42 ЛИНЕЙНЫЕ пространства [ГЛ. 2 5°. 1-х = х для любого элемента х (особая роль числового множителя 1); 6°. X (fix) = (Хц) х (сочетательное относительно числового мно- жителя свойство); 7°. (% + р) х = Хж+ цх (распределительное относительно суммы числовых множителей свойство); 8°. X (х 4-у) = Хх + Ху (распределительное относительно суммы элементов свойство). Подчеркнем, что при введении понятия линейного простран- ства мы абстрагируемся не только от природы изучаемых объек- тов, но и от конкретного вида правил образования суммы эле- ментов и произведения элемента на число (важно лишь, чтобы эти правила удовлетворяли восьми аксиомам, сформулированным в данном выше определении). Если же природа изучаемых объектов и вид правил образо- вания суммы элементов и произведения элемента на число ука- заны *), то мы будем называть линейное пространство кон- кретным. Приведем примеры конкретных линейных пространств. Пример 1. Рассмотрим множество всех свободных векто- ров в трехмерном пространстве. Операции сложения указанных векторов и умножения этих векторов на числа определим так, как это было сделано в аналитической геометрии (сложение век- торов определим по правилу «параллелограмма»; при умножении вектора на вещественное число X длина этого вектора умножается на |Х|, а направление при X > 0 остается неизменным, а при X < 0 — изменяется на противоположное). Элементарно проверяется справедливость всех аксиом 1°—8° (справедливость всех аксиом, за исключением аксиомы 5°, уста- новлена в курсе аналитической геометрии **), справедливость аксиомы 5° не вызывает сомнений.) Таким образом, множество всех свободных векторов в прост- ранстве с так определенными операциями сложения векторов и умножения их на числа представляет собой линейное простран- ство, которое мы будем обозначать символом В3. Аналогичные множества векторов на плоскости и на прямой, также являющиеся линейными пространствами, мы будем обоз- начать соответственно символами В2 и Вх. Пример 2. Рассмотрим множество всех положи- тельных вещественных чисел. Определим сумму двух эле- ментов х и у этого множества как произведение вещественных чисел х и у (понимаемое в обычном в теории вещественных чисел *) Разумеется, эти правила должны быть указаны так, чтобы были спра- ведливы свойства 1°—8°, перечисленные в данном выше определении в виде аксиом. **)См. выпуск «Аналитическая геометрия», гл. 2, § 1, п. 2,


§ 1] ПОНЯТИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА 43 смысле). Произведение элемента х множества {х| на вещественное число X определим как возведение положительного вещественного числа х в степень X. Нулевым элементом множества |х| будет являться вещественное число 1, а противоположным (для данного элемента х) элементом будет являться вещественное число Их. Легко убедиться в справедливости всех аксиом 1°—8°. В са- мом деле, справедливость аксиом 1° и 2° вытекает из перемести- тельного и сочетательного свойств произведения вещественных чисел; справедливость аксиом 3 и 4° вытекает из элементарных равенств х-1 = х, х--у- = 1 (для любого вещественного х > 0); аксиома 5° эквивалентна равенству х1 = х; аксиомы 6° и 7° спра- ведливы в силу того, что для любого х > 0 и любых веществен- ных X и р имеют место соотношения (х^)х = хк», х^^ = хх-х**; наконец, справедливость аксиомы 8° следует из того, что для любых положительных х и у и для любого вещественного X имеет место равенство (ху)к = хкук. Итак, мы убедились, что множе- ство |х| с так определенными операциями сложения элементов и умножения их на числа является линейным пространством. Пример 3. Важный пример линейного пространства дает множество Ап, элементами которого служат упорядоченные сово- купности п произвольных вещественных чисел (хх, хг, ..., хп). Элементы этого множества мы будем обозначать одним символом л, т. е. будем писать х — (хх, ха, .... хп), и при этом называть веще- ственные числа Xj, х... хп координатами элемента х. В анализе множество Ап обычно называют n-м е р н ы м координатным пространством*). В алгебраиче- ской трактовке множество Ап можно рассматривать как совокуп- ность всевозможных строк, каждая из которых содержит п веще- ственных чисел (что мы уже и делали в § 3 гл. 1). Операции сложения элементов множества Ап и умножения этих элементов на вещественные числа определим правилами: (А. х2....хп) 4- (й, уг, .... уп) = (*1 + У1, хг + у2, .. „Хп + уп), К (х1( х2, ..., хп) = (Ххь Хха, .... Ххп). Предоставляем читателю элементарную проверку справедли- вости всех аксиом 1°—8° и того факта, что нулевым элементом рассматриваемого множества является элемент 0 = (0, 0.0), а противоположным для элемента (хх, х2, хп) является эле- мент (—хь — —хп). Пример 4. Рассмотрим далее множество С [а, Ъ ] всех функ- ций х — х (I), определенных и непрерывных на сегменте а < < i < Ъ. Операции сложения таких функций и умножения их на ') См. выпуск «Основы математического анализа», часть 1, гл. 14. § 1, п. 4.
44 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 вещественные числа определим обычными правилами математи- ческого анализа. Элементарно проверяется справедливость ак- сиом 1°—8° *), позволяющая заключить, что множество С [а, 6] является линейным пространством. Пример 5. Следующим примером линейного пространства может служить множество \Рп,(t)\ всех алгебраических много- членов степени, не превышающей натурального числа п, с опера- циями, определенными так же, как в предыдущем примере. Заме- тим, что множество |РП (/)}, если его рассматривать на сегменте а с t < Ь, является подмножеством линейного про- странства С [а, &], рассмотренного в примере 4. Замечание 1. Для разъяснения изучаемого понятия ли- нейного пространства укажем примеры множеств, по той или иной причине не являющихся линейными пространствами: а) множество всех векторов пространства с исключением век- торов, коллинеарных некоторой прямой I (ибо в пределах этого множества нельзя складывать векторы, симметричные относи- тельно указанной прямой /); б) множество всех многочленов степени, точно равной нату- ральному числу п (сумма двух таких многочленов может ока- заться многочленом степени ниже п); в) множество всех многочленов степени, не превышающей натурального п, все коэффициенты которых положительны (эле- менты такого множества нельзя умножить на отрицательные веще- ственные числа). Замечание 2. Отметим, что элементы произвольного ли- нейного пространства принято называть векторами. То об- стоятельство, что часто термин «вектор» употребляется в более узком смысле, при этом не приводит к недоразумениям, а, напро- тив, взывая к сложившимся геометрическим представлениям, позволяет уяснить, а зачастую и предвидеть ряд результатов, справедливых для линейных пространств произвольной при- роды. Замечание 3. В сформулированном нами определении линейного пространства числа X, р, ... брались из множества вещественных чисел. Поэтому определенное нами про- странство естественно назвать вещественным линейным пространством. При более широком подходе можно брать X, р, ... из множества комплексных чисел. При этом мы придем к понятию комплексного линейного пространства. 2. Некоторые свойства произвольных линейных пространств. Из аксиом Г—8° в качестве логических следствий можно по- лучить ряд утверждений, справедливых для произвольных ли- •) В частности, нулевым элементом пространства С [а, 6] является функ- ция, тождественно равная нулю на сегменте а t sg: Ь.


$ 1) ПОНЯТИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА 45 нейных пространств. В качестве примера установим два утверж- дения. Теорема 2.1. В произвольном линейном пространстве суще- ствует единственный нулевой элемент и для каждого элемента х существует единственный противоположный элемент. Доказательство. Существование хотя бы од- ного нулевого элемента утверждается в аксиоме 3°. Предполо- жим, что существуют два нулевых элемента 02 и 02. Тогда, полагая в аксиоме 3° сначала х — 02, 0 == 0г, а затем х = 02, 0 = 01( мы получим два равенства 0х + 02 = 0х, 02 + 0х — 02, левые части которых (в силу аксиомы 1°) равны. Стало быть, в силу транзи- тивности знака = равны и правые части двух последних ра- венств, т. е. 0х = 02, и единственность нулевого элемента уста- новлена. Существование для каждого элемента х х о т я бы одного противоположного элемента у утверждается в аксиоме 4°. Пред- положим, что для некоторого элемента х существует два проти- воположных элемента уг и у2, так что х 4-yi = 0 и х 4- у2 =0. Но тогда в силу аксиом 3°, 2° и 1° ух = yj 4- 0 = ух 4- (х4- у2) = == (Ут 4-Дс) 4- у2 = 0 4- у2 =у2 4- 0 = у2, т. е. yi = у2, и един- ственность для каждого элемента х противоположного элемента доказана. Теорема доказана. Теорема 2.2. В произвольном линейном пространстве 1) нулевой элемент 0 равен произведению произвольного эле- мента х на вещественное число 0; 2) для каждого элемента х противоположный элемент равен произведению этого элемента х на вещественное число —1. Доказательство. 1) Пусть х — произвольный эле- мент, а у — ему противоположный. Последовательно применяя аксиомы 3°, 4°, 2°, 5°, 1°, 7° и снова 5° и 4°, будем иметь х-0 = = л-0 4- 0 = х-0 4- (х 4- у) — (л-0 4-л) 4- у — (х-0 4- х-1) 4- 4- у = х (0 4- 1) 4- у = х-1 4- у = х 4- у = 0, т. е. х-0 = = 0. 2) Пусть х — произвольный элемент, у = (—1)-х. Используя аксиомы 5°, 7°, 1° и уже доказанное равенствол*0 = 0, получим равенство л4- у = х 4- (—1) х= 1 -х 4- (—1) х— [1 4- (—1) ]л = = 0-х— х-0 — 0, которое и доказывает (в силу аксиомы, 4°), что у — элемент противоположный х. Теорема доказана. Отметим в заключение, что аксиомы 1°—4° позволяют дока- зать существование и единственность разности любых двух элементов линейного пространства х и у, которая определяется как элемент z, удовлетворяющий условию z 4- у = л*). (Тако- вым элементом служит сумма z = х 4- (—1) у.) •) Достаточно дословно повторить доказательство, данное в теории веще- ственных чисел (см. выпуск «Основы математического анализа», часть 1, гл. 2, § 2, п. 3).
46 ЛИНЕЙНЫЕ ПРОСТРАНСТВА (Гл. 3 § 2. Базис и размерность линейного пространства I. Понятие линейной зависимости элементов линейного про- странства. В курсе аналитической геометрии *) было введено понятие линейной зависимости векторов, а в п. 1 § 3 предыдущей главы — понятие линейной зависимости строк (или, что то же самое, элементов пространства Ап, рассмотренного в примере 3 из п. 1 § 1 настоящей главы). Обобщением этих понятий является понятие линейной зави- симости элементов совершенно произвольного линейного про- странства, к выяснению которого мы и переходим. Рассмотрим произвольное вещественное линейное простран- ство R с элементами х, у, ..., г, .... Линейной комбинацией элементов х, у..........z про- странства R мы будем называть сумму произведений этих эле- ментов на произвольные вещественные числа, т. е. выражение вида ах + Ру + ... + уг, (2.1) где а, 0, ..., у — какие угодно вещественные числа. Определение 1. Элементы х, у, ..., z пространства R назы- ваются линейно зависимыми, если найдутся такие вещественные числа а, 0, .... у, из которых хотя бы одно отлично от нуля, что линейная комбинация элементов х, у, ..., г с ука- занными числами является нулевым элементов пространства R, т. е. имеет место равенство ах + + • • • + Уг — 0- (2-2) Элементы х, у, .... z, не являющиеся линейно зависимыми, мы будем называть линейно независимыми. Дадим другое определение линейно независимых векторов, построенное на логическом отрицании содержания определения 1. Определение 2. Элементы х, у, ..., г пространства R назы- ваются линейно независимыми, если линейная комби- нация (2.1) является нулевым элементом пространства R лишь при условии а = 0 = ...=у = О. Теорема 2.3. Для того чтобы элементы х, у, ..., z простран- ства R были линейно зависимы, необходимо и достаточно, чтобы один из этих элементов являлся линейной комбинацией осталь- ных элементов. Доказательство. 1) Необходимость. Пусть элементы х, у.г линейно зависимы, т. е. справедливо равен- ство (2.2), в котором хотя бы одно из чисел а, 0, ..., у отлично от нуля. Пусть, ради определенности, а =/= 0. Тогда, поделив (2.2) на а и введя обозначения X = ——, ..., ц. =-—, мы можем a ct ) См. выпуск «Аналитическая геометрия», гл. 2, § 1, п. 3.


§ 2J БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 47 переписать (2.2) в виде х — Ху ... + (2.3) а это и означает, что элемент х является линейной комбинацией элементов у, г. 2) Достаточность. Пусть один из элементов (напри- мер, х) является линейной комбинацией остальных элементов. Тогда найдутся числа X, ..., р, такие, что справедливо равен- ство (2.3). Но это последнее равенство можно переписать в виде (— l)x + \y + ...4-pz = 0. (2.4) Так как из чисел (—1), X, .... р одно отлично от нуля, то равен- ство (2.4) устанавливает линейную зависимость элементов х, у, Z. Теорема доказана. Справедливы два элементарных утверждения: 1. Если среди элементов х, у, z имеется нулевой элемент, то эти элементы линейно зависимы. В самом деле, если, напри- мер, х — 0, то равенство (2.2) справедливо при а = 1, 0 = ... = = у — 0. 2. Если часть элементов х, у, .... г являются линейно зависи- мыми, то и все эти элементы являются линейно зависимыми. В самом деле, если, например, элементы у, .... z линейно зави- симы, то справедливо равенство 0у + ... + yz = 0, в котором не все числа 0, ..., у равны нулю. Но тогда с теми же числами 0, .... у и с а = 0 будет справедливо равенство (2.2). В заключение рассмотрим вопрос о линейной зависимости элементов пространства Ап, введенного в примере 3 п. 1 § 1. Докажем, что п элементов указанного пространства ex = (l, 0, 0, ... , 0), е2 = (0, 1, 0........0), е3 = (0, 0, 1, .... 0), (2.5) еп = (0, 0, 0, .... 1) являются линейно независимыми, а совокупность п элементов (2.5) и еще одного произвольного элемента х = (xlt xt, ..., x„) пространства Ап уже образует линейно зависимую систему эле- ментов. Рассмотрим линейную комбинацию элементов (2.5) с какими- либо числами аг, а2, а3, .... ап. В силу аксиом эта линейная ком- бинация представляет собой элемент «121 + «2^2 4-• • • + «п«?п == (<*!, .«п)> который является нулевым лишь при условии ах = at = ... = = ап = 0. Но это и означает линейную независимость элемен- тов (2.5).
48 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Докажем теперь, что система, состоящая из п элементов (2.5) и еще одного произвольного элемента х — (xlt х2, .... хп) пространства Ап, уже является линейно зависимой. В силу тео- ремы 2.3 достаточно доказать, что элемент, х — (хь х2, .... хп) представляет собой линейную комбинацию элементов (2.5), а это очевидно, ибо в силу аксиом = (Xi, х2, ..., хп) = х^ -j* х2е2 4* • • • 4* хпвп’ 2. Базис и координаты. Рассмотрим произвольное веществен- ное линейное пространство R. Определение. Совокупность линейно независимых элементов ег, е2, ..., еп пространства R называется базисом этого пространства, если для каждого элемента х пространства R найдутся вещественные числа xlt х2, ..., хп такие, что справед- ливо равенство x = Xiei-^x2e2-\-...-\-xnen. (2.6) При этом равенство (2.6) называется разложением элементах по б а з и с у еи е2, .... еп, а числа хг, х2, хп называются координатами элемента х (относительно ба- зиса е2, е2, .... еп). Докажем, что каждый элемент х линейного пространства R может быть разложен по базису е2, е2, ...» еп единствен- ным способом, т. е. координаты каждого элемента х отно- сительно базиса е2, .... еп определяются однозначно. Допустим, что для некоторого элемента х наряду с разложе- нием (2.6) справедливо еще и другое разложение по тому же самому базису х = x[ci 4* х'2е2 4~ • • • 4~ хпвп. (2.7) Почленное вычитание равенств (2.6) и (2.7) приводит нас к соотношению *) (АП — xj) е1 4- (х2 — х2) е2 4-... 4- (хп — х'п) еп = 0. (2.8) В силу линейной независимости базисных элементов е2, е2, ... .... еп, соотношение (2.8) приводит к равенствам хх— х[ = 0, х2 — — х2 = 0, ..., Хп — х'п — 0 ИЛИ XI = xi, Х2 = Х2, .... Хп = Хп. Единственность разложения по базису доказана. Значение базиса заключается также и в том, что операции сложения элементов и умножения их на числа при задании базиса превращаются в соот- ветствующие операции над числами — координатами этих эле- ментов. Именно справедливо следующее утверждение. *) Возможность почленного вычитания равенств (2.6) и (2.7) и производи- мой группировки членов вытекает из аксиом 1°—8°.


$ 2] БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 49 Теорема 2.4. При сложении двух любых элементов линейного пространства R их координаты (относительно любого базиса пространства R) складываются-, при умножении произвольного элемента на любое число К все координаты этого элемента умно- жаются на к. Доказательство. Пусть еь е2, ..., еп — произволь- ный базис пространства R, х = x2ev + х2е2 + ... + хпеп и у = = У+ у2ег + ... + упеп — любые два элемента этого про- странства. Тогда в силу аксиом Г—8° х + У = (Х1 + У1) е1 + (х2 + Уг) + • • + (хп + Уп* вп, kx = (Xxj) Ci + (Хх2) е2 + ... + (Ххп) еп. В силу единственности разложения по базису теорема доказана. Приведем примеры базисов конкретных линейных пространств. Из аналитической геометрии известно, что любые три некомп- ланарных вектора образуют базис в линейном пространстве В3 всех свободных векторов (это пространство рассмотрено в при- мере 1 п. 1 § 1). Заметим далее, что совокупность п элементов (2.5), рассмот- ренных в конце п. 1, образует базис в линейном пространстве Аа, введенном в примере 3 п. 1 § 1. В самом деле, в конце предыдущего пункта доказано, что элементы (2.5) линейно независимы и что любой элемент х = = (*i, х2, .... хп) пространства Ап представляет собой некоторую линейную комбинацию элементов (2.5). Убедимся, наконец, что базис линейного пространства {х}, введенного в примере 2 п. 1 § 1, состоит из одного элемента, в ка- честве которого можно взять любой ненулевой элемент этого пространства (т. е. любое положительное вещественное число х0, не равное 1). Достаточно доказать, что для любого поло- жительного вещественного числа х найдется вещественное число X такое, что х = х$ *)• Но это очевидно: достаточно взять X = logXox. 3. Размерность линейного пространства. Как и выше, будем рассматривать произвольное вещественное линейное простран- ство R. Определение 1. Линейное пространство R называется п-м е р н ы м, если в нем существует п линейно независимых элементов, а любые (п 4- 1) элементов уже являются линейно зависимыми. При этом число п называется размерностью пространства R. *) Напомним, что произведение элемента х0 на число X определяется как число xj.
50 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Размерность пространства R обычно обозначают символом dim R. Определение 2. Линейное пространство R называется бес- конечномерным, если в нем существует любое число линейно независимых элементов *). В настоящей книге мы будем изучать в основном пространства конечной размерности п. Бесконечномерные пространства состав- ляют предмет специального изучения. (Они изучаются в гл. 10 и 11 выпуска «Основы математического анализа», часть II.) Выясним связь между понятием размерности пространства и введенным в предыдущем пункте понятием базиса. Теорема 2.5. Если R — линейное пространство размерности п, то любые п линейно независимых элементов этого пространства образуют его базис. Доказательство. Пусть ег, е2, .... еп — любая си- стема п линейно независимых элементов пространства R (существо- вание хотя бы одной такой системы вытекает из определения 1). Если х — любой элемент R, то, согласно определению 1, система (n + 1) элементов х, eit ег еп линейно зависима, т. е. найдутся не все равные нулю числа а0, а1г а2, ...» ап такие, что справедливо равенство аох + 4- с^Сг + ... + апеп = 0. (2.9) Заметим, что число а0 заведомо отлично от нуля (ибо в против- ном случае из равенства (2.9) вытекала бы линейная зависимость элементов elt е2, .... еп). Но тогда, поделив равенство (2.9) на а0 ОС1 ОС j ОСд И ПОЛОЖИВ Х2 = ——-, х2 = ——, ..., хп —-----——, мы по- CCq OCq CTq лучим из (2.9) x = xie14-x2ea4-.. .-}-хпеп. (2.10) Так как х — произвольный элемент R, то равенство (2.10) дока- зывает, что система элементов elt е2, .... еп является базисом пространства R. Теорема доказана. Теорема 2.6. Если линейное пространство R имеет базис, состоящий из п элементов, то размерность R равна п. Доказательство. Пусть система п элементов е2, е2, ... ..., еп является базисом пространства!?. Достаточно доказать, что любые (л + 1) элементов этого пространства хг, х2, .... х„+1 линейно зависимы **). Разложив каждый из этих элементов по *) Для обозначения того, что пространство R является бесконечномерным, используют следующую символику: dim R = оо. •*) Ибо базисные элементы elt е,, ...,еп образуют систему л линейно не- зависимых элементов пространства R,


$ 2] БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 51 базису, будем иметь *1 = а11^1 4" °12еа 4" • ’ • 4" а1п^п> х2 = a21ei 4~ а22^ч 4" • • • 4" ^п^п, •*п+1 = 0(71 + 1)1^1 4'а<п +1)2^2 4- •• • 4'а(П + 1)П^П. где ап, 012, .... a(n+i) л—некоторые вещественные числа. Очевидно, линейная зависимость элементов jq, х2, ..., хп+1 эквивалентна линейной зависимости строк матрицы °11 О12 • • • °1П аа ам • • • °2п °(71 +1) 1 а(П+1) 2 . • . 0(П + 1)П Но строки указанной матрицы заведомо линейно зависимы, ибо порядок базисного минора этой матрицы (содержащей (п 4- 1) строк и п столбцов) не превосходит п, и хотя бы одна из (п + 1) ее строк не является базисной и по теореме о базисном миноре *) представляет собой линейную комбинацию базисных (а стало быть, и всех остальных) строк. Теорема доказана. Обращаясь к примерам, рассмотренным в конце предыдущего пункта, мы теперь можем сказать, что размерность простран- ства В3 всех свободных векторов равна трем, размерность про- странства Ап равна п, а размерность пространства {х} равна единице. Примером бесконечномерного пространства может служить линейное пространство С [а, Ь] всех функций х = х (t), опреде- ленных и непрерывных на сегменте а < t с b (см. пример 4 из п. 1 § 1). В самом деле, для любого номера п система (п -f- 1) элементов этого пространства 1, t, Р, ..., tn является линейно независимой (ибо в противном случае некоторый многочлен Со + Cyt + Сг/2 + + ... 4-Сп/п, не все коэффициенты Со, Сь ..., Сп которого равны нулю, оказался бы тождественно равным нулю на сегменте а с t < Ь). 4. Понятие изоморфизма линейных пространств. В этом пункте мы покажем, что различные линейные пространства одной и той же размерности п в смысле свойств, связанных со введен- ными в этих пространствах операциями, по существу не отличаются друг от друга. Так как в линейных пространствах введены лишь операции сложения элементов и умножения элементов на числа, то есте- ственно сформулировать следующее определение. *) См. теорему 1.6 из п. 2 § 3 гл. 1.
52 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Определение. Два произвольных вещественных линейных про- странства R и R' называются изоморфным и, если между элементами этих пространств можно установить взаимно одно- значное соответствие *) так, что если элементам х и у простран- ства R отвечают соответственно элементы х' и у' простран- ства R', то элементу х 4- у отвечает элемент х' 4- у', а эле- менту кх при любом вещественном X отвечает элемент кх'. Заметим, что если линейные пространства R и R' изоморфны, то нулевому элементу R отвечает нулевой элемент R' и наоборот. (В самом деле, пусть элементу х пространства R отвечает неко- торый элемент х' пространства R'. Тогда элементу О-хпростран- ства R отвечает элемент 0-х’ пространства R'.) Отсюда следует, что если в случае изоморфизма элементам X, у, .... z пространства R отвечают соответственно элементы х', у', .... z' пространства R', то линейная комбинация ах 4- 4- Ру 4- ••• 4- Уг является нулевым элементом пространства R тогда и только тогда, когда линейная комбинация ах' + 4- ру' + ... -Ь yz' является нулевым элементом пространства R'. Но это означает, что если пространства R и R' изоморфны, то максимальное число линейно независимых элементов в каждом из этих пространств одно и то же. Иными словами, два изоморфных пространства обязаны иметь одинаковую размерность. Стало быть, пространства разной размерности не могут быть изоморфны. Докажем теперь следующее утверждение. Теорема 2.7. Любые два п-мерных вещественных линейных пространства R и R' изоморфны. Доказательство. Выберем в R какой-либо базис elt е?...еп, а в R' — какой-либо базис е], ei, .... е'п. Поставим в соответствие каждому элементу х = хгег 4- х2е2 + .. 4- хпеп пространства R элемент х' — xiei + xiei 4- ... 4- хпе„ простран- ства R' (т. е. мы берем в качестве х' тот элемент R', который имеет относительно базиса ej, е?, ..., еп те же самые координаты, что и элемент х относительно базиса elt ег, ..., еп). Убедимся в том, что установленное соответствие является взаимно однозначным. В самом деле, каждому элементу х про- странства R однозначно соответствуют координаты хъ х2, ..., хп, которые в свою очередь определяют единственный элемент х' пространства R'. В силу равноправности пространств R и R' каждому элементу х' пространства R' в свою очередь соответ- ствует единственный элемент х пространства R. *) Напомним, что соответствие между элементами двух множеств R и /?' называется взаимно однозначным, если при этом соответствии каждому элементу R отвечает один и только один элемент R', причем каждый элемент R' отвечает одному и только одному элементу R.


j 3] ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 53 Остается заметить, что если элементам х и у пространства R отвечают соответственно элементы х' и у' пространства R', то в силу теоремы 2.4 элементу х + у отвечает элемент х' + у', а элементу кх отвечает элемент кх'. Теорема доказана. Из приведенного нами рассмотрения следует, что единствен- ной существенной характеристикой конечномерного линейного пространства является его размерность. § 3. Подпространства линейных пространств 1. Понятие подпространства и линейной оболочки. Предпо- ложим, что некоторое подмножество L линейного пространства R удовлетворяет следующим двум требованиям: 1°. Если элементы х и у принадлежат подмножеству L, то и сумма х + у принадлежит этому подмножеству. 2°. Если элемент х принадлежит подмножеству L, а X — любое вещественное число, то и элемент кх принадлежит под- множеству L. Убедимся в том, что подмножество L, удовлетворяющее тре- бованиям 1° и 2°, само является линейным пространством. Доста- точно убедиться в справедливости для элементов подмножества L аксиом 1°—8° из определения линейного пространства. Все ука- занные аксиомы, кроме аксиом 3° и 4°, заведомо справедливы для элементов подмножества L, поскольку они справедливы для всех элементов пространства R. Остается проверить вы- полнение аксиом 3° и 4°. Пусть х — любой элемент подмноже- ства L, а X — любое вещественное число. Тогда в силу требова- ния 2° элемент кх также принадлежит L. Остается заметить, что (в силу теоремы 2.2) этот элемент кх при к — 0 превращается в нулевой элемент пространства R, а при к — —1 превращается в противоположный для х элемент. Таким образом, подмноже- ству L принадлежит нулевой элемент и противоположный (для каждого элемента х) элемент, а это и означает, что для элементов подмножества L справедливы аксиомы 3° и 4°. Тем самым пол- ностью доказано, что подмножество L само является линейным пространством. Определение. Подмножество L линейного пространства R, удовлетворяющее требованиям 1° и 2°, называется линейным подпространством (или просто подпростран- ством) пространства R. Простейшими примерами подпространств могут служить: 1) так называемое нулевое подпространство, т. е. подмножество линейного пространства R, состоящее из одного нулевого элемента; 2) все пространство R (которое, конечно, можно рассматривать как подпространство). Оба эти подпространства принято называть несобствен- ными.
54 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Укажем примеры подпространств более содержательного вида. Пример 1. Подмножество \Рп (/)} всех алгебраических многочленов степени, не превышающей натурального числа п *), в линейном пространстве С [а, Ь] всех функций х = х (/), опре- деленных и непрерывных на сегменте а < t < Ь *♦) (справедли- вость для элементов подмножества (/)} требований 1° и 2° не вызывает сомнений). Пример 2. Подмножество В2 всех свободных векторов, параллельных некоторой плоскости, в линейном пространстве В3 всех свободных векторов ***) (справедливость для элементов В2 требований 1° и 2° очевидна). Пример 3. Пусть х, у, .... z — совокупность элементов некоторого линейного пространстваR. Линейной оболоч- кой элементов х, у, ..., г будем называть совокупность всех ли- нейных комбинаций этих элементов, т. е. множество элементов вида ах + Ру+ ...+??, где а, р, ..., у — какие угодно вещественные числа. Договоримся обозначать линейную оболочку элементов х, у, ..., г символом L (х, у, г). Для линейной оболочки произвольных элементов х, у, ..., z линейного пространства R, очевидно, выполняются требования 1° и 2°, сформулированные в начале настоящего пункта. Поэтому всякая линейная оболочка является подпространством основного линейного пространства R. Это подпространство, очевидно, содержит элементы x,y,...,z, на которых построена линейная оболочка L (х, у, .... z). С другой стороны, всякое подпростран- ство, содержащее элементы х, у, ..., Z, обязано содержать и все линейные комбинации этих элементов. Поэтому линейная обо- лочка элементов х, у,.... г является наименьшим подпро- странством, содержащим элементы х, у, ..., z. Конкретным примером линейной оболочки может служить линейная оболочка элементов 1, t, ..., tn линейного простран- ства С [а, b ] всех функций х = х (t), определенных и непрерыв- ных на сегменте а < t < b. Эта линейная оболочка, очевидно, представляет собой множество \Рп (/)} всех алгебраических много- членов степени, не превышающей п. Другие примеры подпространств будут рассмотрены в п. 3 настоящего параграфа. *) Это подмножество введено в примере 5 п. 1 § 1 настоящей главы. **) Пространство С [а, Ь] введено в примере 4 п. 1 § 1 этой главы. **•) Множества Вг и В3 были введены в примере 1 п. 1 § 1 этой главы.


5 3] ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 55 Рассмотрим вопрос о размерности подпространства (и, в част- ности, линейной оболочки). Можно утверждать, что размерность любого подпространства п-мерного линейного пространства R не превосходит размерности п пространства R (ибо всякая линейно независимая система эле- ментов подпространства является одновременно линейно незави- симой системой элементов всего пространства R). Более точно можно утверждать, что если подпространство L не совпадает со всем п-мерным линейным пространством R, то размерность L строго меньше п. Это вытекает из того, что если размерности L и R обе равны п, то всякий базис подпространства L, поскольку он состоит из п элементов, является (в силу теоремы 2.5) базисом и всего про- странства R. Заметим, что если во всем пространстве R выбран базис е2, .... еп» то базисные элементы подпространства L, вообще говоря, нельзя выбирать из числа элементов еи е2, .... еп (ибо в общем случае ни один из элементов ег, ег, .... еп может не при- надлежать L). Однако справедливо обратное утверждение: если элементы elt е2, .... е^ составляют базис k-мерного подпро- странства п-мерного линейного пространства R, то этот базис можно дополнить элементами ем, .... еп пространства R так, что совокупность элементов elt ... eh, eft+1, ..., еп будет состав- лять базис всего пространства R. Докажем это утверждение. Если k < п, то найдется элемент еА+1 пространства R такой, что элементы ег, е2, ..., ek, ek+1 линейно независимы (в противном случае пространство R оказалось бы й-мерным). Далее, если k + 1 < п, то найдется элемент е^2 пространства R такой, что элементы е2, .... eh, efe+i, еА+2 линейно независимы (в противном случае пространство R оказа- лось бы (k + 1)-мерным). Продолжая аналогичные рассуждения, мы докажем сформулированное утверждение. В заключение докажем важную теорему о размерности линей- ной оболочки. Теорема 2.8. Размерность линейной оболочки L (х, у, .... z) элементов х, у, ..., z равна максимальному числу линейно неза- висимых элементов в системе элементов х, у, ..., z. В частности, если элементы х, у, ..., z линейно независимы, то размер- ность линейной оболочки L (х, у, ..., г) равна числу элементов х, у, ..., z (а сами эти элементы образуют базис линейной обо- лочки L (х, у, ..., z)). Доказательство. Допустим, что среди элементов х, у, ..., z имеется г линейно независимых элементов (обозначим их через хи х2, .... лг), а любые (г + 1) из элементов х, у, .... z линейно зависимы. Тогда каждый из элементов х, у, ..., z пред- ставляет собой некоторую линейную комбинацию элементов
56 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 хг, .... хг*), и поскольку по определению каждый элемент ли- нейной оболочки L (х, у, .... г) представляет собой некоторую линейную комбинацию элементов х, у, .... Z, то каждый эле- мент указанной линейной оболочки представляет собой некоторую линейную комбинацию одних только элементов х2, ..., хг. Но это и означает, что система линейно независимых элементов Хг, .... хг образует базис линейной оболочки L (х, у, ..., г) и что размерность Цх, у..... z) равна г. Теорема доказана. 2. Новое определение ранга матрицы. В § 3 главы 1 мы опре- делили ранг произвольной матрицы А как порядок ее ба- зисного минора, т. е. как число г, удовлетворяющее тре- бованию существования у матрицы А отличного от нуля минора порядка г и отсутствия у этой матрицы отличных от нуля миноров порядка, большего г. В этом пункте мы убедимся, что ранг произвольной матрицы А равен максимальному числу линейно независимых строк (или столбцов) этой матрицы. Отсюда будет следовать новое определение ранга матрицы как максимального числа линейно независимых строк (или столб- цов) этой матрицы **). Проведем все рассуждения для строк (для столбцов они ана- логичны). Рассмотрим в линейном пространстве Ап (введенном в примере 3 п. 1 § 1) линейную оболочку базисных строк произ- вольной содержащей т строк и п столбцов матрицы А и пред- положим, что число базисных строк равно г. Из теоремы 1.6 о базисном миноре вытекает, что любая строка матрицы А яв- ляется элементом указанной линейной оболочки, а из линейной независимости г базисных строк и из теоремы 2.8 вытекает, что размерность указанной линейной оболочки равна г. Стало быть, любые (г + 1) элементов указанной линейной оболочки (и, в част- ности, любые (г + 1) строк матрицы А) линейно зависимы. А это и означает, что число г представляет собой максимальное число линейно независимых строк. 3. Сумма и пересечение подпространств. Пусть и L2— два произвольных подпространства одного и того же линейного про- странства R. Совокупность всех элементов х пространства R, принадлежа- щих одновременно Lr и Lit образует подпространство простран- ства R ***), называемое пересечением подпространств и L2. *) Это устанавливается с помощью тех же самых рассуждений, которые были проведены при доказательстве теоремы 2.5. **) В частности, отсюда будет следовать весьма нетривиальная теорема о том, что у любой матрицы максимальное число линейно независимых строк совпадает с максимальным числом линейно независимых столбцов. ***) Ибо элементы этой совокупности удовлетворяют требованиям 1° и 2°, сформулированным в начале п. 1.


$ 3] ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 57 Совокупность всех элементов пространства /? вида у + z, где у — элемент подпространства £х, az — элемент подпростран- ства Lit образует подпространство пространства /? *), называемое суммой подпространств £х и £2. Пример. Пусть R — линейное пространство всех свобод- ных векторов (в трехмерном пространстве), £х — подпростран- ство всех свободных векторов, параллельных плоскости Оху, L2 — подпространство всех свободных векторов, параллельных плоскости Oxz. Тогда суммой подпространств £х и £2 будет яв- ляться все пространство R **), а пересечением подпространств £х и £2 будет являться множество всех свободных векторов, парал- лельных оси Ох. Справедливо следующее утверждение. Теорема 2.9. Сумма размерностей произвольных подпрост- ранств и Lt конечномерного линейного пространства R равна сумме размерности пересечения этих подпространств и размерно- сти суммы этих подпространств. Доказательство. Обозначим через £0 пересечение £х и £2, а через £ — сумму £х и £2. Считая £0 fc-мерным, выберем в нем базис elt е2....eh. (2.11) Используя утверждение, доказанное в п. 1, дополним базис (2.11) до базиса 61, ..., ek, g!...gt (2.12) в подпространстве £х и до базиса Ci.....eh,fi,...,fm (2.13) в подпространстве £2. Достаточно доказать, что элементы gi.....go 6i, ..., ek, fi....fm (2.14) являются базисом суммы £ подпространств £х и £2***). Для этого в свою очередь достаточно доказать, что элементы (2.14) линейно независимы и что любой элемент х суммы £ представляет собой некоторую линейную комбинацию элементов (2.14). Сначала докажем, что элементы (2.14) линейно независимы. *) См. предыдущую сноску. **) В самом деле, любой вектор х пространства R представляет собой ли- нейную комбинацию х = aZ -f- РУ -f- yft базисных векторов i, j, к параллельных осям Ох, Оу и Ог соответственно, причем вектор cd 4- РУпринадлежит £х, а век- тор ук принадлежит L2. ***) Ибо при этом размерность L, равная I -|- Л 4- т, в сумме с размер- ностью Lo, равной k, будет равна сумме размерностей к -f- I и k 4- т подпро- странств Li и Lt.
58 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Предположим, что некоторая линейная комбинация элемен- тов (2.14) представляет собой нулевой элемент, т. е. справедливо равенство а1&1 + • • + alSl + ₽1®1 + •••-(- + Y1/1 + • • • + Ут/т = О (2.15) или aigi. + • • • + aigi + Pi^i + • • • + Ma = — Yi/1 — ... — ymfm (2.16) Так как левая часть (2.16) является элементом £ь а правая часть (2.16) является элементом L2, то как левая, так и правая часть (2.16) принадлежит пересечению Lo подпространств Lx и L2. Отсюда следует, в частности, что правая часть (2.16) представляет собой некоторую линейную комбинацию элементов (2.11), т. е. найдутся такие числа ..., Xft, что — Y1/1 — ... — Ут/т — Ml + •••-(- (2.17) В силу линейной независимости базисных элементов (2.13) равен- ство (2.17) возможно лишь в случае, когда все коэффициенты Yl> •••> Ут, М Ь-k равны нулю. Но при этом из (2.15) мы полу- чим, что aigi + • • • + aigi + Pi^i + • • + Рл^а = 0. (2.18) В силу линейной независимости базисных векторов (2.12) равен- ство (2.18) возможно лишь в случае, когда все коэффициенты «1, .... alt рь ..., ph равны нулю. Тем самым мы установили, что равенство (2.15) возможно лишь в случае, когда все коэффи- циенты ах, ..., a!t рх, ..., pft, ух.ут равны нулю, а это и дока- зывает линейную независимость элементов (2.14). Остается доказать, что любой элемент х суммы L представ- ляет собой некоторую линейную комбинацию элементов (2.14), но это сразу следует из того, что этот элемент х представляет собой (по определению L) сумму некоторого элемента xx подпростран- ства Llt являющегося линейной комбинацией элементов (2.12), и некоторого элемента х2 подпространства Ьг, являющегося линей- ной комбинацией элементов (2.13). Теорема доказана. Возвращаясь к примеру, рассмотренному перед формулиров- кой теоремы 2.9, заметим, что в этом примере размерность каждого из подпространств и L2 равна двум, размерность их суммы равна трем, а размерность их пересечения равна единице. 4. Разложение линейного пространства в прямую сумму под- пространств. Пусть 7?х и R2 — два подпространства линейного п-мерного пространства R. Определение. Будем говорить, что пространство R пред- ставляет собой прямую сумму nodnpocmpaHcmeRi и Rt, если


$ 3] ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 59 каждый элемент х пространства R может быть единствен- ным способом представлен в виде суммы х = х1 + л2 (2.19) элемента Xi подпространства R1 и элемента х2 подпространст- ва R2. Тот факт, что R представляет собой прямую сумму R2 и /?2 символически записывают так: R = Ri ® R2. Последнее равенство обычно называют разложением пространства R в прямую сумму подпро- странств Rx и R2. Так пространство R всех свободных векторов (в трехмерном пространстве) можно разложить в прямую сумму подпростран- ства всех векторов, параллельных плоскости Оху и подпро- странства R2 всех векторов, ’параллельных оси Ог. Теорема 2.10. Для того чтобы п-мерное пространство R пред- ставляло собой прямую сумму подпространств и Т?2, доста- точно, чтобы пересечение Rx и R2 содержало только нулевой эле- мент и чтобы размерность R была равна сумме размерностей подпространств R2 и R2. Доказательство. Выберем некоторый базис е2, ..., в подпространстве и некоторый базис glt ..., gt в подпростран- стве R2. Докажем, что объединение этих базисов еъ ..., eh, glt .... gi (2.20) представляет собой базис всего пространства R. Так как по усло- вию теоремы размерность п всего пространства R равна сумме k + I размерностей Rx и R2, то достаточно (в силу теоремы 2.5) доказать линейную независимость элементов (2 20). Предположим, что некоторая линейная комбинация элемен- тов (2.20) представляет собой нулевой элемент, т. е. справедливо равенство + • • • + ak^k + Р1#1 + • • • + PzfiTz — 0» (2-21) или + ... + akeh = — Piffi — ... - Pzg-f- (2.22) Так как левая часть (2.22) является элементом Rlt а правая — элементом R2, а пересечение R2 и Rt содержит лишь нулевой элемент, то как левая, так и правая часть (2.25) представляет собой нулевой элемент, а это (на основании линейной независи- мости элементов каждого из базисов eit .... ek и gx, ..., gt) воз- можно лишь при условии «1 = ... = aft = 0, Pi = ... = Р/ = 0. (2.23)
60 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Тем самым мы установили, что равенство (2.21) возможно лишь при условии (2.23), а это и доказывает линейную независимость элементов (2.20) и тот факт, что элементы (2.20) образуют базис всего пространства 7?. Пусть теперь х — любой элемент R. Разложив его по базису (2.20), будем иметь х = Mi + ... + Ma + Pigi + ... + |xzgz или xt +х2, где Xi = Mi + ... + Xhek — элемент Rb а х2= = Higi + ... + P-tgi — элемент R2. Остается доказать, что представление (2.19) является един- ственным. Предположим, что, кроме (2.19), справедливо и еще одно представление х = х'1 + х2, (2.24) где х{— элемент Ri, а х2 — элемент R2. Вычитая (2.24) из (2.19), получим, ЧТО 0 =Х\ — х'1 + х2 — Х2, ИЛИ ЛС1 — х{ — х2— х2. Так как в левой части последнего равенства стоит элемент Rlt а в правой — элемент R2, и поскольку пересечение Rx и R2 содержит лишь нулевой элемент, то из этого равенства следует, что Х\ — х\ = 0, х2 — х2 = 0, т. е. х\ = Х\, х2 = х2. Теорема дока- зана. Замечание. В случае, когда пространство R представ- ляет собой не прямую, а обычную сумму подпространств Rv и R2, представление (2.19) любого элемента х пространства R также справедливо, но не является, вообще говоря, единственным. Пусть, например, R представляет собой трехмерное простран- ство всех свободных векторов, Rr — подпространство всех век- торов, параллельных плоскости Оху, a R2 — подпространство всех векторов, параллельных плоскости Oxz. В предыдущем пункте мы выяснили, что R представляет собой сумму (но, конечно, не прямую сумму) подпространств Rx и R2. Обозначим через I, J, k базисные векторы, параллельные осям Ох, Оу и Ог соответ- ственно, и разложим произвольный элемент х пространства R по базису i,J, k. Найдутся вещественные числа а, р и у такие, что x=o.l + Р/+ yk, так что, с одной стороны, х = Xi + дс2, где Xi= а.1 + р/— элемент Rlt а х2 — yk — элемент R2, с другой стороны, х= х{ +х2, где л! = Р/ — элемент Ri, ах2 = a.1 + yk— элемент R2. § 4. Преобразование координат при преобразовании базиса «-мерного линейного пространства 1. Прямое и обратное преобразование базисов. Пусть elt е2, .... еп и el, е2, ..., е'п — два произвольных базиса п-мерного линейного пространства R. Как всякий элемент пространства R, каждый элемент е\, е2, .... е'п может быть разложен по базису ei, е2, .... еп. Предположим, что элементы ei, е2, ..., е'п


$ 4] ПРЕОБРАЗОВАНИЕ КООРДИНАТ ПРИ ПРЕОБРАЗОВАНИИ БАЗИСА 61 выражаются через elt е2, ...» еп с помощью формул С\ = Дц01 4- ацвг 4-... 4- а\п€п> 02 = <22101 4" °2202 4" • • • 4- а2пСп, 25) Сп — OnlCt 4“ Ол202 4- • • • 4- аппСп- Это означает, что переход от первого базиса 0Ь е2, ..., еп ко вто- рому базису с], 02, .... 0л, задается матрицей вИ °12 • • • ат Л___ в« • • • а‘п (О ОЩ апг • • апп Подчеркнем, что определитель А матрицы (2.26) заведомо отличен от нуля *), ибо в противном случае в силу теоремы 1.7 строки этой матрицы (а стало быть, и базисные элементы е\, е’г, .... е’п) оказались бы линейно зависимыми. Убедимся в том, что обратный переход от второго базиса е\, е2, .... е’п к первому базису eif ег, .... еп, осуществляется с по- мощью матрицы В, обратной к матрице А. Напомним, что матрица В, обратная к матрице А, введена в п. 7 § 2 гл. 1 и имеет вид где через А обозначен определитель матрицы А, а через Aih — алгебраическое дополнение элемента aih этого определителя. Умножим уравнения (2.25) соответственно на алгебраические дополнения Лу, Аг1, ..., AnJ элементов /-го столбца определи- теля А и после этого сложим эти уравнения. В результате полу- чим (для любого номера /, равного 1, 2, .... и) c'iAjf 4- 02-4г/ 4" • • • 4~ e'nAnj = S Ci (ацА1/ 4- Я2М2/ 4" • • • 4" aniAn/). 1 Учитывая, что сумма произведений элементов i-ro столбца на соответствующие алгебраические дополнения элементов /-го столб- ца равна нулю при i =/= j и равна определителю А при i = j **) *) Такую матрицу в п. 7 § 2 гл. 1 мы договорились называть невы- рожденной. **) См. свойство 4° из п. 4 § 2 гл. 1.
62 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 получим из последнего равенства С1Л1/ 4" е'тАц 4- ... елЛп — etA, откуда е, +-^-е2 + ... + ^еп (/=1,2............п) или подробнее о ^11 о । Ан . . । ЛП1 • е — — «Н—д-е24-... + — еп, - <412 _ I Ац „< I I Лпа en = ^ei + ^e; + ...4-^e;. (2.28) Формулы (2.28) и устанавливают, что обратный переход от базиса е\, ei, .... е'п к базису ei, е2, ...» еп осуществляется с помощью матрицы (2.27), обратной к матрице А. Эту обратную к А матрицу мы кратко будем обозначать символом Л-1. 2. Связь между преобразованием базисов и преобразованием соответствующих координат. Пусть, как и выше, базис е2, е2, . . . .... еп преобразуется в базис ei, ei, ..., е'п с помощью невырожден- ной матрицы (2.26), так что обратное преобразование базисов задается матрицей (2.27). Пусть далее х — произвольный эле- мент рассматриваемого линейного пространства R, (xlt хг, ..., хп)— его координаты относительно первого базиса е^, ег, .... еп, W» xi, ..., х’п) — его координаты относительно второго базиса е{, ei, .... eh, так что х == х[е[ xiei 4-... 4- xhe’n = xiei 4- хгег 4- • • 4- хпеп. Подставив в это равенство вместо элементов et, е2, ..., еп их выражения, определяемые формулами (2.28), получим х = xiei 4- xiei 4- • • • 4- х'пеп — «> 4" «2 4~ • • • 4" «п) 4- +ч-^+4>+-+4ч-'~ + х,(^+^й+... + ^). Из последнего равенства (в силу единственности разложения по базису ei, ei, ...» е'п) сразу же вытекают формулы перехода от координат (хъ хг, ..., хп) относительно первого базиса к


$ 4] ПРЕОБРАЗОВАНИЕ КООРДИНАТ ПРИ ПРЕОБРАЗОВАНИИ БАЗИСА 63 координатам (xj, х2, х'п) относительно второго базиса: __ Al v | Л12 , | Лщ xi — д Х1 I д х% “Г • • • I д х> '_ Л21 । Ац । । Л2п Х2 — -д- Xi -f- -д- Х2 -f- . . . -f- -д- X, • •••••••••••••••• Anl | Апг I I Апп Хп — -д- Х1 + -д— х2 + • • • + — X, (2.29) Формулы (2.29) показывают, что переход от координат (х,, х2, .... *п) к координатам (х\, х2, х„) осуществляется с помощью матрицы д Агп Д Ann & транспонированной к обратной матрице (2.27). Мы приходим к следующему выводу: если переход от первого базиса ко второму осуществляется с помощью невырожденной матрицы А, то переход от координат произвольного элемента относительно первого базиса к координатам этого элемента относительно второго базиса осуществляется с помощью мат- рицы (Л-1)', транспонированной к обратной матрице Л-1.
ГЛАВА 3 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Из элементарного курса и из курса аналитической геометрии читатель знаком с системой двух линейных уравнений с двумя неизвестными и с системами двух и трех линейных уравнений с тремя неизвестными *). Целью настоящей главы является изу- чение системы произвольного числа т линейных уравнений с про- извольным числом п неизвестных. Мы сначала установим необходимое и достаточное условие существования хотя бы одного решения (или, как говорят, сов- местности) такой системы, а затем займемся отысканием всей совокупности ее решений. В § 4 главы 4 будет рассмотрен важный для приложений случай приближенного задания всех коэффициентов системы и ее свободных членов. Для этого случая будет изложен метод регуляризации А. Н. Тихонова, позволяющий найти так называемое нормальное (т. е. наиболее близкое к началу координат) решение указанной системы с точностью, со- ответствующей точности задания коэффициентов и свободных членов. В главе 6 будет дано представление о численных (итерацион- ных) методах решения систем линейных уравнений. § 1. Условие совместности линейной системы 1. Понятие системы линейных уравнений и ее решения. В общем случае система т линейных уравнений с п неизвестными (или кратко линейная система) имеет следующий вид: а11Х1 4” Q12X2 + • • • + а1ПХп — Ьп а21х1 4" а22х2 + . . • + агпхп — ^2> (3.1) atnlxl 4" атгх2 4"• • • 4" атпхп — Ьт. •) См, выпуск «Аналитическая геометрия», дополнение к главе 1.


J п УСЛОВИЕ СОВМЕСТНОСТИ ЛИНЕЙНОЙ СИСТЕМЫ 65 При этом через xlt х2, хп обозначены неизвестные, подлежащие определению (число их п не предполагается обязательно равным числу уравнений т); величины ап, а12, .... атп, называемые коэффициентами системы, и величины Ьи b2, Ьт, называемые свободными членами, предполагаются из- вестными. Каждый коэффициент системы ai} имеет два индекса, первый из которых i указывает номер уравнения, а второй / — номер неизвестного, при котором стоит этот коэффициент. Система (3.1) называется однородной, если все ее сво- бодные члены Ьи Ь2, .... Ьт равны нулю. Если хотя бы один из свободных членов blt b2, .... Ьт отли- чен от нуля, то система (3.1) называется неоднород- ной. Система (3.1) называется квадратной, если число т составляющих ее уравнений равно числу неизвестных п. Решением системы (3.1) называется такая совокупность п чисел сь с2, •••» ст которая при подстановке в систему (3.1) на место неизвестных xlt х2, .... хп обращает все уравнения этой системы в тождества. Не всякая система вида (3.1) имеет решения. Так, система линейных уравнений Х1 + *2=1, | *1 + -Ч = 2 ) заведомо не имеет ни одного решения (ибо если бы существовало решение этой системы, то при подстановке этого решения в левых частях обоих уравнений стояли бы одинаковые числа и мы полу- чили бы, что 1=2). Система уравнений вида (3.1) называется совместной, если она имеет хотя бы одно решение, и несовместной, если у нее не существует ни одного решения. Совместная система вида (3.1) может иметь или одно решение, или несколько решений. Два решения совместной системы вида (3.1) cP, cP, ..., с™ и ср, cP, ..., cP называются различными, если нарушается хотя бы одно из равенств cP = cP, c2l} = cP, ..., — с„2>. Совместная система вида(3.1)называется определенной, если она имеет единственное решение. Совместная система вида (3.1) называется неопределен- ной, если у нее существуют по крайней мере два различных решения. Весьма удобно записывать линейную систему (3.1) в матричной форме. Для этого используем введенное в п. 2 § 1 гл. 1 понятие произведения двух матриц (таких, что число столбцов первой из этих матриц равно числу строк второй из матриц). В качестве 3 Зак 459
66 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 перемножаемых матриц возьмем две матрицы: матрицу °11 а12 ... О1П в21 а22 • . . Огп о mi атз ••• Отп (3.2) содержащую т строк и п столбцов и составленную из коэффи- циентов при неизвестных (такую матрицу мы в дальнейшем будем называть основной матрицей системы(3.1))и матрицу X, содержащую п строк и 1 столбец, т. е. один столбец вида Х = (3.3) Согласно правилу перемножения двух матриц *) произведе- ние АХ матрицы (3.2) на матрицу (3.3) представляет собой мат- рицу, содержащую т строк и 1 столбец, т. е. один столбец следую- щего вида: 411*1 "1“ 012*2 + • » • + 01П*П 021*1 + О22*2 + . . • + 02п*П ' (J 4) Omi*i Ч" 0тг*2 + . . . 4° 0тп*п Система равенств (3.1) означает, что этот столбец (3.4) совпадает со столбцом (3.5) Таким образом, в матричной записи систему (3.1) можно заменить одним эквивалентным ей матричным уравнением АХ = В, (3.6) в котором матрицы А, X и В определяются соотношениями (3.2), (3.3) и (3.5). Решение матричного уравнения (3.6) заключается в отыскании такого столбца (3.3), который при заданной мат- рице (3.2) и заданном столбце правых частей (3.5) обращает урав- нение (3.6) в тождество. В этом и в следующем параграфах мы выясним в отношении линейной системы (3.1) следующие три вопроса: 1) способ установления того, является система (3.1) совмест- ной или нет, *) См. п. 2 § 1 гл. 1, формулу (1.4).

I
S и УСЛОВИЕ СОВМЕСТНОСТИ ЛИНЕЙНОЙ СИСТЕМЫ 67 2) способ установления того, является система (3.1) (в случае ее совместности) определенной или нет, 3) способ отыскания единственного решения совместной си- стемы (3.1) (в случае ее определенности) и отыскания всех ее решений (в случае ее неопределенности). 2. Нетривиальная совместность однородной системы. Начнем с рассмотрения однородной линейной системы вида (3.1), т. е. системы allXl а12Х2 • • • “F ainxn — 01 G22X1 + а22*а а2пхп = 0> /о 7\ &mlxl Н- ®m2^2 “F • • • “F &тпхп — 0- Сразу же отметим, что эта система всегда совместна, ибо она всегда обладает так называемым тривиальным (или нуле- в ы м) решением xt — хг = ... = хп — 0 *). Возникает вопрос о том, при каких условиях однородная си- стема (3.7) имеет, кроме указанного тривиального решения, еще и другие решения (т. е. является «нетривиально сов- местной»). Этот вопрос решается довольно просто. Заметим, что существо- вание нетривиального решения системы (3.7) эквивалентно линей- ной зависимости столбцов матрицы (3.2) (ибо линейная зависи- мость столбцов матрицы (3.2) означает, что существуют числа хи х2, ..., хп, не все равные нулю и такие, что справедливы ра- венства (3.7)). Но в силу теоремы 1.6 о базисном миноре линейная зависи- мость столбцов матрицы (3.’2) будет иметь место тогда и только тогда, когда не все столбцы этой матрицы являются базис- ными, т. е. тогда и только тогда, когда порядок г базисного минора матрицы (3.2) меньше числа п ее столбцов. Мы приходим к следующей теореме. Теорема 3.1. Однородная система (3.7) имеет нетривиальные решения тогда и только тогда, когда ранг г матрицы (3.2) меньше числа п ее столбцов. Следствие. Квадратная однородная система **) имеет не- тривиальные решения тогда и только тогда, когда определитель, составленный из коэффициентов при неизвестных, равен нулю. В самом деле, в случае квадратной однородной системы (3.7), т. е. при т — п ранг г матрицы (3.2) будет меньше числа т = п тогда и только тогда, когда определитель этой матрицы равен нулю. *) Действительно, подставив в систему (3.7) нули на место всех неизве- стных xlt хг.хп, мы обратим в тождества все уравнения этой системы. **) То есть система (3 7), у которой число уравнений т равно числу не- известных л.
68 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 3. Условие совместности общей линейной системы. Установим теперь необходимое и достаточное условие совместности общей (вообще говоря, неоднородной) системы вида (3.1). С этой систе- мой связаны две матрицы: матрица А, определяемая соотноше- нием (3.2), которую принято называть основной матри- цей системы (3.1) (она составлена из коэффициентов при неизвестных), и матрица fill 012 . . Oln bl 021 022 • Огп b2 0ml Qmz • • • Omn bm (3.8) которую принято называть расширенной матрицей системы (3.1) (она получается из основной матрицы путем добавления к этой матрице столбца (3.5) свободных членов). Справедлива следующая основная теорема. Теорема 3.2 (теоремаКронекера—Капелли *). Для того чтобы линейная система (3.1) являлась совместной, необходимо и достаточно, чтобы ранг расширенной матрицы этой системы был равен рангу ее основной матрицы. Доказательство. 1) Необходимость. Пусть система (3.1) совместна, т. е. существуют такие числа сг, ..., сп, что справедливы равенства anCi + ai2c2 + • • • + ат^п — °21С1 4" ^2^2 4" • • • 4" fl2nCn = Ьг> , (3 9) 4" &т2р2 4- • • • 4- ^тп^п = Обозначим через г ранг основ.ной матрицы системы (3.1) и рассмотрим линейную оболочку L г базисных столбцов этой матрицы. В силу теоремы 1.6 о базисном миноре любой столбец основной матрицы принадлежит указанной линейной оболочке L. Иными словами, любой столбец расширенной матрицы (3.8), кроме последнего ее столбца, принадлежит указанной линейной оболочке L. Из равенств (3.9) следует, что и последний столбец расширен- ной матрицы (3.8) принадлежит линейной оболочке L (ибо этот последний столбец в силу равенств (3.9) линейно выражается через все столбцы основной матрицы и поэтому линейно выра- жается через ее базисные столбцы). Таким образом, все столбцы расширенной матрицы (3.8) при- надлежат указанной линейной оболочке L. В п. 2 § 3 гл. 2 мы уже установили, что размерность указанной линейной оболочки L равна г. Это означает, что любые г 4- 1 столбцов расширенной *) Леопольд Кронекер (1823— 1891) — немецкий математик, Альфред Капелли (1855—1910) — итальянский математик.


5 2) ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 69 матрицы (3.8) линейно зависимы, т. е. ранг расширенной матрицы (равный максимальному числу линейно независимых столбцов этой матрицы) также равен числу г. Необходимость доказана. 2) Достаточность. Пусть ранги основной и расши- ренной матриц совпадают. Тогда г базисных столбцов основной матрицы будут являться базисными столбцами и расширенной матрицы (3.8) *). По теореме 1.6 о базисном миноре последний столбец расширенной матрицы (3.8) представляет собой некоторую линейную комбинацию указанных г базисных столбцов. Стало быть, последний столбец расширенной матрицы (3.8) представ- ляет собой некоторую линейную комбинацию и всех столбцов основной матрицы (3.2) **), т. е. существуют числа clt с2, ..., сп такие, что справедливы равенства (3.9). Последние равенства означают, что числа си сг, ..., сп представляют собой решение системы (3.1), т. е. эта система является совместной. Теорема полностью доказана. § 2. Отыскание решений линейной системы Теорема Кронекера—Капелли устанавливает необходимое и достаточное условие совместности линейной системы, но не дает способа нахождения решений этой системы. В этом параграфе мы займемся отысканием решений линейной системы (3.1). Сначала мы рассмотрим простейший случай квад- ратной системы линейных уравнений с отличным от нуля опре- делителем основной матрицы, а затем перейдем к отысканию совокупности всех решений общей линейной системы вида (3.1). 1. Квадратная система линейных уравнений с определителем основной матрицы, отличным от нуля. Пусть дана квадратная система линейных уравнений aiixi Ч- Ч- • • • Ч- ainxn = &х> аих1 4“ 4" • • • агпхп = . (3.10) ЯпЛ + атхг +... + аппхп = Ьп с отличным от нуля определителем А основной матрицы Oil O1S • • • Я1Л Огх ац ... 02л (3.11) 0л1 От . .. Опп *) Ибо указанные г базисных столбцов линейно независимы, а большего чем г числа линейно независимых столбцов расширенная матрица не имеет. **) Не изменяя линейной комбинации г базисных столбцов, мы можем до- бавить к ней все небазисные столбцы с множителями, равными нулю.
70 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ (ГЛ. 3 Докажем, что такая система имеет и притом единственное реше- ние, и найдем это решение. Сначала докажем, что система (3.10) может иметь только одно решение (т. е. докажем единственность решения системы (3.10) в предположении его существования). Предположим, что существуют какие-либо п чисел хи х2, ..., хп такие, что при подстановке этих чисел в систему (3.10) все урав- нения этой системы обращаются в тождества (т. е. существует некоторое решение системы (3.10) хъ х2, ..., хп). Тогда, умножая тождества (3.10) соответственно на алгебраические дополне- ния Ац, А21, Ant элементов /-го столбца определителя Д мат- рицы (3.11) и складывая затем получающиеся при этом тождества, мы получим (для любого номера /, равного 1, 2, ..., л) S xi (ОцАи + + • • • + antAnj) = b^u Ь2Аи + bnAnJ. 1 Учитывая, что сумма произведений элементов i-ro столбца на соответствующие алгебраические дополнения элементов /-го столб- ца равна нулю при i #= / и равна определителю А матрицы (3.11) при i = / * *), мы получим из последнего равенства Х;Д = b^u + Ь2Аи bnAn}. (3.12) Обозначим символом A3(bt) (или более кратко символом А}) определитель, получающийся из определителя Д основной матрицы (3.11) заменой его j-го столбца столбцом из свободных членов Ьг, Ъ2, .... Ьп (с сохранением без изменения всех остальных столб- цов Д). Заметим, что в правой части (3.12) стоит именно определи- тель Д; (bt) •♦), и это равенство принимает вид х,Д = Д, (/= 1, 2, ..., л). (3.13) Поскольку определитель Д матрицы (3.11) отличен от нуля, равенства (3.13) эквивалентны соотношениям х3 = -%- (/=1,2........л). (3.14) Итак, мы доказали, что если решение xlt х2, ..., хп системы (3.10) с определителем Д основной матрицы (3.11), отличным от нуля, существует, то это решение однозначно определяется фор- мулами (3.14). Формулы (3.14) называются формулами Краме- ра ***). *) См. свойство 4° из п. 4 § 2 гл. 1. ♦♦) Чтобы убедиться в этом, достаточно записать разложение определителя й] (bt) по элементам (i-ro столбца. ♦•») Габриель Крамер (1704—1752) — швейцарский математик.


S 21 ОТЫСКАНИЕ РЕШЕНИЯ ЛИНЕЯНОЯ СИСТЕМЫ 71 Еще раз подчеркнем, что формулы Крамера пока получены нами в предположении существования решения и доказывают его единственность. Остается доказать существование решения системы (3.10). Для этого в силу теоремы Кронекера—Капелли достаточно доказать, что ранг основной матрицы (3.11) равен рангу расширенной мат- рицы *) Яц Я18 ... Я21 Я«2 • • • Я|11 ап1 • • " Я1л din bi dnn bn (3.15) но это очевидно, ибо в силу соотношения Д =/= 0, ранг основной матрицы равен п, а ранг содержащей п строк расширенной ма- трицы (3.15) больше числа п быть не может и потому равен рангу основной матрицы. Тем самым полностью доказано, что квадратная система ли- нейных уравнений (3.10) с определителем основной матрицы, отличным от нуля, имеет и притом единственное решение, опре- деляемое формулами Крамера (3.14). Доказанное нами утверждение еще проще устанавливается матричным способом. Для того чтобы сделать это, заменим (как и в п. 1 § 1) систему (3.10) эквивалентным ей матричным урав- нением АХ = В, (3.16) где А — основная матрица системы (3.11), а X и В — столбцы Х1 Х1 Хп bi Ьз В = первый из которых подлежит определению, а второй задан. Так как определитель Д матрицы А отличен от нуля, то су- ществует обратная матрица А'1 (см. п. 7 § 2 гл. 1). Предположим, что существует решение системы (3.10), т. е. существует столбец X, обращающий в тождество матричное уравнение (3.16). Помножая указанное тождество слева на обрат- ную матрицу Л-1, будем иметь А-1 (АХ) = А^В. (3.17) Учтем теперь, что в силу сочетательного свойства произведения трех матриц (см. п. 2 § 1 гл. 1) и в силу соотношения А'1 А — Е, *) Существует и другой способ доказательства существования решения системы (3.10), заключающийся в проверке того, что числа х1( хг, ..., хп, опре- деляемые формулами Крамера (3.14), обращают в тождества все уравнения си- стемы (3.10).
72 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. Э где Е — единичная матрица (см. п. 7 § 2 гл. 1), Л-1 (АХ) — = (Л-1Л) X = EX = X, так что мы получим из (3.17) X = А-ГВ. (3.18) Развертывая равенство (3.18) и учитывая вид обратной матрицы *), мы и получим для элементов столбца X формулы Крамера. Итак, мы доказали, что если решение матричного уравне- ния (3.16) существует, то оно однозначно определяется соотноше- нием (3.18), эквивалентным формулам Крамера. Легко проверить, что столбец X, определяемый соотноше- нием (3.18), в самом деле является решением матричного уравне- ния (3.16), т. е. при подстановке в это уравнение обращает его в тождество. В самом деле, если столбец X определяется равен- ством (3.18), то АХ = А (А-'В) = (ЛЛ-1) В = ЕВ = В. Итак, если определитель Д матрицы А отличен от нуля (т. е. если эта матрица является невырожденной), то существует и притом единственное решение матричного уравнения (3.16), опре- деляемое соотношением (3.18), эквивалентным формулам Крамера. Пример. Найдем решение квадратной системы линейных уравнений + 2х2 + Зх3 4х4 = 30, — + 2х2 — Зх3 -f- 4х4 — 10, ^2— *.з + *4 = 3, *i -|- хг -f- х3 + х4 = 10 с отличным от нуля определителем основной матрицы 12 3 4 — 1 2—3 4 0 1—11 11 11 Поскольку 30 2 10 2 3 1 10 1 1 2 — 1 2 0 1 1 1 Д4 = Дз = 3 4 3 4 1 1 1 1 30 4 10 4 3 1 10 1 4 30 3 10—3 3 —1 10 1 1 2 3 30 — 1 2 — 3 10 д4 = 0 1 — 1 3 1 1 1 10 = —16, ') См. формулу (1.41) из п. 7 § 2 гл. 1.


$ 2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 73 то в силу формул Крамера единственное решение рассматривае- мой системы имеет вид хх = 1, х2 — 2, х3 = 3, х4 = 4. Основное значение формул Крамера состоит в том, что они дают явное выражение для решения квадратной системы линей- ных уравнений (с определителем, отличным от нуля) через коэф- фициенты уравнений и свободные члены. Практическое исполь- зование формул Крамера связано с довольно громоздкими вычис- лениями (для решения системы п уравнений с п неизвестными приходится вычислять (n + 1) определитель п-го порядка). К этому следует добавить, что если коэффициенты уравнений и свобод- ные члены представляют собой лишь приближенные значения каких-либо измеряемых физических величин или округляются в процессе вычислений, то использование формул Крамера может привести к большим ошибкам и в ряде случаев является неце- лесообразным. В § 4 гл. 4 будет изложен метод регуляризации, принадле- жащий А. Н. Тихонову и позволяющий находить решение ли- нейной системы с точностью, соответствующей точности задания матрицы коэффициентов уравнений и столбца свободных членов, а в главе 6 дается представление о так называемых итерацион- ных методах решения линейных систем, позволяющих решать эти системы при помощи последовательных приближений неиз- вестных. В заключении отметим, что в этом пункте мы исключили из рассмотрения случай обращения в нуль определителя А основной матрицы системы (3.10). Этот случай будет содержаться в общей теории систем т линейных уравнений с п неизвестными, изла- гаемой в следующем пункте. 2. Отыскание всех решений общей линейной системы. Рас- смотрим теперь общую систему т линейных уравнений с п неиз- вестными (3.1). Предположим, что эта система совместна и что ранг ее основной и расширенной матриц равен числу г. Не огра- ничивая общности, мы можем предположить, что базисный минор основной матрицы (3.2) находится в левом верхнем углу этой матрицы (общий случай сводится к этому случаю посредством перестановки в системе (3.1) уравнений и неизвестных). Тогда первые г строк как основной матрицы (3.2), так и рас- ширенной матрицы (3.8) являются базисными строками этих матриц *), и по теореме 1.6 о базисном миноре каждая из строк расширенной матрицы (3.8), начиная с (г + 1)-й строки, является линейной комбинацией первых г строк этой матрицы. В терминах системы (3.1) это означает, что каждое из урав- нений этой системы, начиная с (г + 1)-го уравнения, является *) Так как ранги основной и расширенной матриц оба равны г, то базисный минор основной матрицы будет одновременно являться базисным минором и рас- ширенной матрицы.
74 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 линейной комбинацией (т. е. следствием) первых г уравнений этой системы (т. е. всякое решение первых г уравнений системы (3.1) обращает в тождества и все последующие уравнения этой системы). Таким образом, достаточно найти все решения лишь первых г уравнений системы (3.1). Рассмотрим первые г уравнений си- стемы (3.1), записав их в виде + П12*2 + • • • + а1гХ = Ь\ — О[ (г+1)Хг+1 — • • • — OtnXn, 021*1 -f- 022X2 -j- • • • -j- X2rXr = bi — 02 (r+l)Xr+i — • • • — O2nXa, OriXt -f- a^Xi -f- • • • + arrxr = br — ar (r+i)X>+i — • • • — ornxn. , (3.19) Если мы придадим неизвестным xr+1, ..., хп совершенно про- извольные значения сг+1, .... сп, то система (3.19) превратится в квадратную систему г линейных уравнений для г неизвестных х2, .... хг, причем определителем основной матрицы этой си- стемы является отличный от нуля базисный минор матрицы (3.2). В силу результатов предыдущего пункта эта система (3.19) имеет единственное решение, определяемое формулами Крамера, т. е. для произвольно выбранных сг+1, ..., сп существует единственная совокупность г чисел clt с2, ..., сг, обращающих в тождества все уравнения системы (3.19) и определяющихся формулами Крамера. Чтобы записать это единственное решение, договоримся обо- значать символом Mj(dt) определитель, получающийся из базис- ного минора М. матрицы (3.2) заменой его /-го столбца столбцом из чисел di, d2, .... dt, ..., dr (с сохранением без изменения всех остальных столбцов М). Тогда записывая решение системы (3.19) с помощью формул Крамера и пользуясь линейным свойством определителя, мы получим С/ = Мj (bi — at (r+i)Cr+i — • • • — Otncn) = = {М/ (bt) — Cr+iM, (ac tr+i) —---cnMj (ain)J (3.20) (/ = 1, 2, .. ., r). Формулы (3.20) выражают значения неизвестных х} = с} (j = 1, 2, ..., г) через коэффициенты при неизвестных, свободные члены и произвольно заданные параметры сг+1, ..., сп. Докажем, что формулы (3.20) содержат любое решение системы (3.1). В самом деле, пусть с°, с®, ..., c°r, c°+i.с° — произволь- ное решение указанной системы. Тогда оно является решением и системы (3.19). Но из системы (3.19) величины с?, с2, ..., с? о о определяются через величины сг+), ..., сп однозначно и именно по формулам Крамера (3.20). Таким образом, присг+1 = с®+1, ...


5 2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 75 .... сп = Сп формулы (3.20) дают нам как раз рассматриваемое 0 0 0 0 о решение Ci, с2, cr, cr+i, .... сп. Замечание. Если ранг г основной и расширенной матриц системы (3.1) равен числу неизвестных п, то в этом случае соот- ношения (3.20) переходят в формулы = (/ = 1’ 2............. определяющие единственное решение системы (3.1). Та- ким образом, система (3.1) имеет единственное решение (т. е. является определенной) при условии, что ранг г основной и расши- ренной ее матриц равен числу неизвестных п (и меньше числа уравнений т или равен ему). Пример. Найдем все решения линейной системы * i — х3 + х3 — х4 = 4, * i + *2 + 2*з + = 8, 2Xi + 4х3 + 5*3 + Юх* = 20, 2*! — 4*а + *3 — 6*4 = 4. Нетрудно убедиться в том, что ранг как основной, так и расши- ренной матрицы этой системы равен двум (т. е. эта система со- вместна), причем можно считать, что базисный минор М стоит в левом верхнем углу основной матрицы, т. е. М — | ' J | = 2. Но тогда, отбрасывая два последних уравнения и задавая произ- вольно с3 и с4, мы получим систему * i — хг = 4 — с3 4- с4, | * i + *2 = 8 — 2с3 — Зс4, ) из которой в силу формул Крамера получаем значения *i= Ci = 6---с3 — с4, х3 = Cj = 2------2~ сз — 2с4. (3.22) Таким образом, четыре числа (б----|-с3 —с4, 2----i-c3 — 2cit с3, с4^ (3.23) при произвольно заданных значениях с3 и с< образуют решение системы (3.21), причем строка (3.23) содержит все решения этой системы. 3. Свойства совокупности решений однородной системы. Рас- смотрим теперь однородную систему т линейных уравнений с п неизвестными (3.7), предполагая, как и выше, что матрица (3.2)
76 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 имеет ранг, равный г, и что базисный минор М расположен в ле- вом верхнем углу этой матрицы. Поскольку на этот раз все bt равны нулю, вместо формул (3.20) мы получим следующие формулы: Cj = — Jj- (а( (г+1)) --------p cnMj (aln)] (j = 1, 2, . ., r), (3.24) выражающие значения неизвестных x; = Cj (j = 1, 2, ..., г) через коэффициенты при неизвестных и произвольно заданные значения сг+1, .... сп. В силу доказанного в предыдущем пункте формулы (3.24) содержат любое решение однородной системы (3.7). Убедимся теперь в том, что совокупность всех решений одно- родной системы (3.7) образует линейное пространство. Пусть Х\ = (х}0, .... Хп0) и Х2 = (х!2), ..., х„2)) — два произ- вольных решения однородной системы (3.7), а X — любое веще- ственное число. В силу того, что каждое решение однородной системы (3.7) является элементом линейного пространства Ап всех упорядоченных совокупностей п чисел, достаточно доказать, что каждая из двух совокупностей X, + Х2 == (х}‘> + х}2).хР + х<2>) и XX, = (Ххр.......АхР) также является решением однородной системы (3.7). Рассмотрим любое уравнение системы (3.7), например t-e урав- нение, и подставим в это уравнение на место неизвестных эле- менты указанных совокупностей. Учитывая, что Хх и Х2 — реше- ния однородной системы, будем иметь £ а„ И'> + хП = £ + S - 0, /=1 /=1 /=1 s ао[Ххр] = Х Sa</Xp=0, i=i i=i а это и означает, что совокупности Хх + Хг и ХХх являются решениями однородной системы (3.7). Итак, совокупность всех решений однородной системы (3.7) образует линейное пространство, которое мы обозначим симво- лом R. Найдем размерность этого пространства R и построим в нем базис. Докажем, что в предположении о том, что ранг матрицы однородной системы (3.7) равен г, линейное пространство R всех решений однородной системы (3.7) изоморфно линейному про- странству Ап~г всех упорядоченных совокупностей (п — г) чисел *). ♦) Пространство Ат введено в примере 3 п. 1 § 1 гл. 2.


$ 2} ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 77 Поставим в соответствие каждому решению (сь сг, сг+1,... .... Сп) однородной системы (3.7) элемент (сг+1, сп) простран- ства Ап~г. Поскольку числа сг+ь сп могут быть выбраны про- извольно и при каждом выборе с помощью формул (3.24) одно- значно определяют решение системы (3.7), то установленное нами соответствие является взаимно однозначным. Далее заметим, что если элементы .... с*°) и (с'^.с*,2>) пространства Ап~г отвечают элементам (ср. с)'\ сЦь ....сР) и (ср, ..., с<2), сг(+|, .... ср) пространства R, то из формул (3.24) сразу же следует, что элементу (с*Vi 4- сРь с^ + с(п2>) отвеча- ет элемент (ср + cP, ..., cP + ср, cP + cP, ...,4й + СР). а элементу (Хер, .... ХсР) при любом вещественном А, отвечает элемент (Хер, ..., ТссР, M+i, ^ср). Тем самым доказано, что установленное нами соответствие является изоморфизмом. Итак, линейное пространство R всех решений однородной системы (3.7) с п неизвестными и рангом основной матрицы, рав- ным г, изоморфно пространству Ап-Г, и, стало быть, имеет размерность п — г. Любая совокупность из (п — г) линейно независимых решений однородной системы (3.7) образует (в силу теоремы 2.5) базис в пространстве R всех решений и называется фундамен- тальной совокупностью решений однородной системы (3.7). Для построения фундаментальной совокупности решений можно отправляться от любого базиса пространства Ап~г. Отве- чающая этому базису совокупность решений системы (3.7) в силу изоморфизма будет линейно независимой и поэтому будет являться фундаментальной совокупностью решений. Особо выделяют фундаментальную совокупность решений си- стемы (3.7), отвечающую простейшему базису Ci = (1, 0, 0, ..., 0), е2 = (0, 1, 0, ..., 0), ... еп-г — (0. 0, 0, .... 1) пространства Ап~' и называемую нормальной фундаментальной совокупностью решений однородной системы (3.7). При сделанных выше предположениях о ранге и расположении базисного минора, в силу формул (3.24), нормальная фундамен- тальная совокупность решений однородной системы (3.7) имеет вид: Afi (oin) М Mr (al(r+V)) j q /И ’ ’ : Мг (а, (г+2)) п . М ’ и’ ' (3.25) , 0, 0, м
78 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 По определению базиса любое решение X однородной системы (3.7) представимо в виде X = С4Х4 + СгХ3 +... + Сп_гХп_Г, (3.26) где Clt С2, ..., Сп_г — некоторые постоянные. Поскольку в фор- муле (3.26) содержится любое решение однородной системы (3.7), то эта формула дает общее решение рассматриваемой од- нородной системы. Пример. Рассмотрим однородную систему уравнений xi — хг + хз — xt = О, xi -I- х2 -I- 2х3 -j- Зх4 = О, 2хх + 4хг 4- 5х3 4- 10х4 = 0, 2хг — 4х2 4- х3 — 6х4 = 0, (3.27) соответствующую неоднородной системе (3.21), разобранной в примере в конце предыдущего пункта. Там мы выяснили, что ранг г матрицы этой системы равен двум, и взяли в качестве базисного минор, стоящий в левом верхнем углу указанной матрицы. Повторяя рассуждения, проведенные в конце предыдущего пункта, мы получим вместо формул (3.22) соотношения 3 1 п Ci — 2~ сз £<> Сг----2~ Сз — 2с4, справедливые при произвольно выбранных с3 и с4. С помощью этих соотношений (полагая сначала с3 = 1, с4 = 0, а затем с3 = 0, с4 = 1) мы получим нормальную фундаментальную совокупность двух решений системы (3.27): Х1 = (-4> --Г- °)’ = -2: °> о- Общее решение однородной системы (3.27) имеет вид Х = С1(----4-----'г, 1, 0)4-Сг(-1, —2, 0, 1), (3.28) где Cj и С2 — произвольные постоянные. В заключение этого пункта установим связь между реше- ниями неоднородной линейной системы (3.1) и соответствующей ей однородной системы (3.7) *). Докажем следующие два ут- верждения. 1°. Сумма любого решения неоднородной системы (3.1) с любым решением соответствующей однородной системы (3.7) представ- ляет собой решение системы (3.1). *) С теми же самыми коэффициентами при неизвестных.


§ 2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 79 В самом деле, если сь .... сп — решение системы (3.1), а dt, ..., dn — решение соответствующей ей однородной системы (3.7), то, подставив в любое (например, в t-e) уравнение системы (3.1) на место неизвестных числа сг + dlt ..., сп + dn, получим S ац (cj + d/) = S вцС} ~Ь S Qt/dj — bt + 0 = bh /==1 /=i /=1 что и требовалось доказать. 2°. Разность двух произвольных решений неоднородной системы (3.1) является решением соответствующей однородной системы (3.7). В самом деле, если Ci, ..., с'п и с], .... с„ — два произвольных решения системы (3.1), то, подставив в любое (например, в i-e) уравнение системы (3.7) на место неизвестных числа с{—Ci, ... ..., Сп—Сп, получим £ af/(c; — с/) = £ a/jCj — S а/?/ = b{ — bt = О, /=1 /-=1 ;=1 что и требовалось доказать. Из доказанных утверждений вытекает, что; найдя одно реше- ние неоднородной системы (3.1) и складывая его с каждым реше- нием соответствующей однородной системы (3.7), мы получим все решения неоднородной системы (3.1). Другими словами, сумма частного решения неоднородной системы (3.1) и общего решения соответствующей однородной системы (3.7) дает общее решение неоднородной системы (3.1). В качестве частного решения неоднородной системы (3.1) естественно взять то его решение *) Хо = ......°- °’ • • - °)’ (329> которое получится, если в формулах (3.20) положить равными нулю все числа сг+1, ..., сп. Складывая это частное решение с общим решением (3.26) соответствующей однородной системы, мы получим следующее выражение для общего решения неод- нородной системы (3.1): X = Хо + + С2Х2 + ... + Cn_rXn_r- (3-30) В этом выражении Хо обозначает частное решение (3.29), Си С2, ..., Сп_Т — произвольные постоянные, a Хь Х2, ..., Хп_г — элементы нормальной фундаментальной совокупности решений (3.25) соответствующей однородной системы. *) При этом предполагается, как и выше, что ранги основной и расширенной матриц системы (3.1) равны г и что базисный минор находится в левом верхнем углу этих матриц.
80 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 Так, для рассмотренной в конце предыдущего пункта не- однородной системы (3.21) частное решение вида (3.29) равно Хо = (6, 2, 0, 0). Складывая это частное решение с общим ре- шением (3.28) соответствующей однородной системы (3.27), мы получим следующее общее решение неоднородной системы (3.21): Х = (6, 2, 0, 0) + С1(-4.-О) Ч-Са(—1, -2, 0, 1). (Здесь Cj и С2 — произвольные постоянные.) 4. Заключительные замечания о решении линейных систем. Развитые в предыдущих пунктах методы решения линейных систем упираются в необходимость вычисления ранга матрицы и нахождения ее базисного минора. После того как базисный минор найден, решение сводится к технике вычисления опреде- лителей и к использованию формул Крамера. Для вычисления ранга матрицы можно использовать следу- ющее правило: при вычислении ранга матрицы следует пере- ходить от миноров меньших порядков к минорам больших поряд- ков; при этом, если уже найден отличный от нуля минор М по- рядка k, то требуют вычисления лишь миноры порядка {k + 1), окаймляющие*) этот минор М; в случае равенства нулю всех окаймляющих миноров порядка (&+1) ранг матрицы равен k **). Укажем и другое правило вычисления ранга матрицы. Заме- тим, что со строками (столбцами) матрицы можно производить три элементарные операции, не изменяющие ранга этой матрицы: 1) перестановку двух строк (или двух столбцов), 2) умножение строки (или столбца) на любой отличный от нуля множитель, 3) прибавление к одной строке (столбцу) произволь- ной линейной комбинации других строк (столбцов) ***). Будем говорить, что матрица ||ао||, содержащая т строк и п столбцов, имеет диагональный вид, если равны нулю все ее элементы, отличные от ап, ам, .... агг, где г = min \т, п\. Ранг такой матрицы, очевидно, равен г. Убедимся в том, что посредством трех элементарных опера- ций любую матрицу ami ••• атп *) То есть содержащие внутри себя минор М. **) В самом деле, в указанном случае все строки (столбцы) матрицы при- надлежат линейной оболочке ее k строк (столбцов), на пересечении которых стоит минор М, а размерность указанной линейной оболочки равна k. ***) Эти три операции не изменяют ранга матрицы вследствие того, что опе- рации 1) и 2) не изменяют максимального числа линейно независимых строк (столбцов) матрицы, а операция 3) обладает тем свойством, что линейная обо- лочка всех строк (столбцов), имевшихся до проведения этой операции, совпадает с линейной оболочкой всех строк (столбцов), полученных после проведения этой операции.


S 21 ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 81 можно привести к диагональному виду (что и позволяет вычис- лить ее ранг). В самом деле, если все элементы матрицы (3.31) равны нулю, то эта матрица уже приведена к диагональному виду. Если же у матрицы (3.31) есть отличные от нуля элементы, то путем пере- становки двух строк и двух столбцов можно добиться того, чтобы был отличен от нуля элемент ап. Умножая после этого первую строку матрицы на ай’, мы превратим элемент ап в единицу. Вычитая далее из /-го столбца матрицы (при / = 2, 3, ..., п) пер- вый столбец, умноженный на аи, а затем вычитая из i-й строки (при i = 2, 3, .... п) первую строку, умноженную на atl, мы полу- чим вместо (3.31) матрицу следующего вида: 1 0 0 0 022 . ain 0 а'т2 . • &тп Совершая уже описанные нами операции с матрицей, взятой в рамку, и продолжая действовать аналогичным способом, мы после конечного числа шагов получим матрицу диагонального вида. Изложенные в предыдущих пунктах методы решения линей- ных систем, использующие в конечном итоге аппарат формул Крамера, могут привести к большим погрешностям в случае, когда значения коэффициентов уравнений и свободных членов заданы приближенно или когда производится округление этих значений в процессе вычислений. В первую очередь это отно- сится к случаю, когда матрица, отвечающая основному опреде- лителю (или базисному минору), является плохо обуслов- ленной (т. е. когда «малым» изменениям элементов этой ма- трицы отвечают «большие» изменения элементов обратной матрицы). Естественно, что в этом случае решение линейной системы будет неустойчивым (т. е. «малым» изменениям значений коэффициентов уравнений и свободных членов будут отвечать «большие» изменения решения). Отмеченные обстоя- тельства приводят к необходимости разработки как других (от- личных от формул Крамера) теоретических алгоритмов отыскания решения, так и численных методов решения линейных систем. В § 4 главы 4 мы познакомимся сметодом регуляри- зации А. Н. Тихонова отыскания так называемого нормаль- ного (т. е. наиболее близкого к началу координат) решения линейной системы. В главе 6 будут изложены основные сведения о так назы- ваемых итерационных методах решения линейных си- стем, позволяющих решать эти системы при помощи последова- тельных приближений неизвестных.
ГЛАВА 4 ЕВКЛИДОВЫ ПРОСТРАНСТВА Из курса аналитической геометрии читатель знаком с поня- тием скалярного произведения двух свободных векторов и с че- тырьмя основными свойствами указанного скалярного произве- дения. В настоящей главе изучаются линейные пространства любой природы, для элементов которых каким-либо способом (причем, безразлично каким) определено правило, ставящее в соответствие любым двум элементам число, называемое ска- лярным произведением этих элементов. При этом важно только, чтобы это правило обладало теми же четырьмя свойствами, что и правило составления скалярного произведения двух свободных векторов. Линейные пространства, в которых определено указанное правило, называются евклидовыми пространствами. В настоящей главе выясняются основ- ные свойства произвольных евклидовых пространств. § 1. Вещественное евклидово пространство и его простейшие свойства 1. Определение вещественного евклидова пространства. Веще- ственное линейное пространство R называется веществен- ным евклидовым пространством (или просто евкли- довым пространством), если выполнены следующие два тре- бования: I. Имеется правило, посредством которого любым двум эле- ментам этого пространства х и у ставится в соответствие вещественное число, называемое скалярным произведе- нием этих элементов и обозначаемое символом (х, у). II. Указанное правило подчинено следующим четырем аксиомам: Г. (х, у) = (у, х) (переместительное свойство или симметрия). 2°. (лгх + х2, у) — (Xi, у) + (хг, у) (распределительное свой- ство). 3°. (кх, у) = к (х, у) для любого вещественного к. 4°. (х, х) 7» 0, если х — ненулевой элемент; (х, х) = 0, если х — нулевой элемент. Подчеркнем, что при введении понятия евклидова простран- ства мы абстрагируемся не только от природы изучаемых объек-


S 1) ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 83 тов, но и от конкретного вида правил образования суммы эле- ментов, произведения элемента на число и скалярного произве- дения элементов (важно лишь, чтобы эти правила удовлетворяли восьми аксиомам линейного пространства и четырем аксиомам скалярного произведения). Если же природа изучаемых объектов и вид перечисленных правил указаны, то евклидово пространство называется кон- кретным. Приведем примеры конкретных евклидовых пространств. Пример 1. Рассмотрим линейное пространство В3 всех сво- бодных векторов. Скалярное произведение любых двух векторов определим так, как это было сделано в аналитической геометрии (т. е. как произведение длин этих векторов на косинус угла между ними). В курсе аналитической геометрии была доказана справедливость для так определенного скалярного произведения аксиом 1°—4° *). Стало быть, пространство В3 с так определен- ным скалярным произведением является евклидовым простран- ством. Пример 2. Рассмотрим бесконечномерное линейное про- странство С [а, b ] всех функций х (t), определенных и непрерывных на сегменте а с t < ft. Скалярное произведение двух таких функций х (/) и у (t) определим как интеграл (в пределах от а до Ь) от произведения этих функций ь (4.1) а Элементарно проверяется справедливость для так определенного скалярного произведения аксиом 1°—4°. В самом деле, спра- ведливость аксиомы Г очевидна; справедливость аксиом 2° и 3° вытекает из линейных свойств определенного интеграла; спра- ь ведливость аксиомы 4° вытекает из того, что интеграл J х2 (0 dl а от непрерывной неотрицательной функции х2 (t) неотрицателен и обращается в нуль лишь тогда, когда эта функция тождественно равна нулю на сегменте а < t < 6**) (т. е. является нулевым эле- ментом рассматриваемого пространства). Таким образом, про- странство С [a, ft] с так определенным скалярным произведе- нием представляет собой бесконечномерное евклидово простран- ство. Пример 3. Следующий пример евклидова пространства дает n-мерное линейное пространство Ап упорядоченных сово- *) См. выпуск «Аналитическая геометрия», гл. 2, § 2, п. 3. **)См. выпуск «Основы математического анализа», часть 1, свойства Г и 2° из п. 1 § 6 гл. 10.
84 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 купностей п вещественных чисел, скалярное произведение двух любых элементов х = (хъ х2, ..., хп) и у — (у1г уг, уп) кото- рого определяется равенством (х, у) = х& + х^ + •.. 4- хпУп. (4.2) Справедливость для так определенного скалярного произведения аксиомы Г очевидна; справедливость аксиом 2° и 3° легко про- веряется (достаточно вспомнить определение операций сложения элементов и умножения их на числа: (хъ хг, . . хп) 4- (ylt у2, . . уп) = = (*i 4- Ух. Ъ 4- У2, • • хп 4- уп) A,(Xi, х2, . . ., хп) = (A,xlf Кх2, . . Ххп)); наконец, справедливость аксиомы 4° вытекает из того, что (х, х) = = х? 4- х| 4* ... 4* х„ всегда является неотрицательным числом и обращается в нуль лишь при условии хг = х2 = ... = хп = 0. Рассмотренное в этом примере евклидово пространство часто обозначают символом Еп. Пример 4. В том же самом линейном пространстве Ап введем скалярное произведение любых двух элементов х = = (хп х2, ..., хп) и у = (i/i, у2, ..., уп) не соотношением (4.2), а другим более общим способом. Для этого рассмотрим квадратную матрицу порядка п Оц а21 Ont 012 °22 аП2 О1П Ощ Ппп (4-3) Составим с помощью матрицы (4.3) однородный многочлен вто- рого порядка относительно п переменных хь х2, ..., хп п п Е S aikXtxh. (4.4) 1=1 Ь=1 Забегая вперед, отметим, что такой многочлен называется квадратичной формой (порождаемой матрицей (4.3))*). Квадратичная форма (4.4) называется положительно определенной, если она принимает строго положительные значения для всех значений переменных хь х2, ..., хп, одновре- менно не равных нулю **). Так как при хг = х2 = ... = хл =0 квадратичная форма (4.4), очевидно, равна нулю, то можно ска- зать, что положительно определенная квадратичная форма обра- щается в нуль лишь При условии Xj = х2 = ... = хп =0. *) Квадратичные формы систематически изучаются в главе 7 этой книги. **) В главе 7 этой книги будет указано необходимое и достаточное условие положительной определенности квадратичной формы.


$ 1] ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 85 Потребуем, чтобы матрица (4.3) удовлетворяла двум условиям: Г. Порождала положительно определенную квадратичную форму (4.4). 2°. Была симметричной (относительно главной диагонали), т. е. удовлетворяла условию ath = aht для всех i = 1, 2, ..., п и всех k = 1, 2, ..., п. С помощью матрицы (4.3), удовлетворяющей условиям 1° и 2°, определим скалярное произведение двух любых элементов х = (*1, Х2, .... хп) и у = (у1г Уг.уп) пространства Ап соот- ношением (х, у) = s S atkX^. (4.5) i=l Л=1 Легко проверить справедливость для так определенного ска- лярного произведения всех аксиом 1°—4°. В самом деле, акси- омы 2° и 3 , очевидно, справедливы при совершенно произвольной матрице (4.3); справедливость аксиомы 1° вытекает из условия симметричности матрицы (4.3), а справедливость аксиомы 4° вытекает из того, что квадратичная форма (4.4), представляющая собой скалярное произведение (х, х), является положительно определенной. Таким образом, пространство Ап со скалярным произведе- нием, определяемым равенством (4.5), при условии симметрич- ности матрицы (4.3) и положительной определенности порождае- мой ею квадратичной формы, является евклидовым простран- ством. Если в качестве матрицы (4.3) взять единичную матрицу, то соотношение (4.4) перейдет в (4.2), и мы получим евклидово пространство Еп, рассмотренное в примере 3. 2. Простейшие свойства произвольного евклидова простран- ства. Устанавливаемые в этом пункте свойства справедливы для совершенно произвольного евклидова пространства как конеч- ной, так и бесконечной размерности. Теорема 4.1. Для любых двух элементов х и у произвольного евклидова пространства справедливо неравенство (х, у)2 <(л, х) (у, у), (4.6) называемое неравенством Кош и—Б у н як о в с к о г о. Доказательство. Для любого вещественного, числа К, в силу аксиомы 4° скалярного произведения, справедливо не- равенство (hx — у, %х — у) 0. В силу аксиом Г—3° последнее неравенство можно переписать в виде X2 (х, х) — 2Х (х, у) + (у, у) 2s 0.
86 ЕВКЛИДОВЫ ПРОСТРАНСТВА (ГЛ. 4 Необходимым и достаточным условием неотрицательности по- следнего квадратного трехчлена является неположительность его дискриминанта, т. е. неравенство *) (х, у)2 - (х, х) (у, у) < 0. (4.7) Из (4.7) сразу же вытекает неравенство (4.6). Теорема доказана. Наша очередная задача — ввести в произвольном евклидовом пространстве понятие нормы (или длины) каждого элемента. Для этого введем понятие линейного нормированного про- странства. Определение. Линейное пространство R называется н арми- рованным, если выполнены следующие два требования: I. Имеется правило, посредством которого каждому элементу х пространства R ставится в соответствие вещественное число, называемое нормой (или длиной) указанного элемента и обо- значаемое символом ||х||. II. Указанное правило подчинено следующим трем аксиомам: Г. Илг||>0, если х—ненулевой элемент-, ||х|| = 0, если х—ну- левой элемент. 2°. J АхЦ = |Х|||х|| для любого элемента х и любого веществен- ного числа К. 3°. Для любых двух элементов х и у справедливо следующее неравенство: |л + у|<|х| + |у|, (4.8) называемое неравенством треугольника (или нера- венством Минковского). Теорема 4.2. Всякое евклидово пространство является нор- мированным, если в нем норму любого элемента х определить равенством ||х| = У(х, х). (4.9) Доказательство. Достаточно доказать, что для нормы, определенной соотношением (4.9), справедливы аксиомы 1*—3° из определения нормированного пространства. Справедливость для нормы аксиомы Г сразу вытекает из аксиомы 4° скалярного произведения. Справедливость для нормы аксиомы 2° почти непосредственно вытекает из аксиом Г и 3° скалярного произведения. Остается убедиться в справедливости для нормы аксиомы 3°, т. е. неравенства (4.8). Будем опираться на неравенство Коши— Буняковского (4.6), которое перепишем в виде | (х, у) | < Z(х, х) V(y, у) . (4.7') *) В случае (х, х) = 0 квадратный трехчлен вырождается в линейную функ- цию, но в этом случае элемент х является нулевым, так что (х, у) = 0 и неравен- ство (4.7) также справедливо.


0 1J ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 87 С помощью последнего неравенства, аксиом Г—4° скалярного произведения и определения нормы получим ]|х4-у 11 = /(*4~у, *4~у) —/(*, *)4-2(*. у)4-(у, у) « < ]/(*, X) + •/(X X) ‘V(у, у) 4- (у, у) — = У[/{X. X) 4-/(у, у)]2 = i/(x, X) 4-/(у,у) = IIхII4-1|у||. Теорема доказана. Следствие. Во всяком евклидовом пространстве с нормой элементов, определяемой соотношением (4.9), для любых двух элементов х и у справедливо неравенство треугольника (4.8). Заметим далее, что в любом вещественном евклидовом пространстве можно ввести понятие угла между двумя произ- вольными элементами хну этого пространства. В полной ана- логии с векторной алгеброй, мы назовем у г л о м <р между эле- ментами х и у тот (изменяющийся в пределах от 0 до л) угол, косинус которого определяется соотношением cos ф = (Х| у) =_______(х' у) ф 1|х|Ц|у|| Данное нами определение угла корректно, ибо в силу нера- венства Коши—Буняковского (4.7') дробь, стоящая в правой части последнего равенства, по модулю не превосходит единицы. Далее договоримся называть два произвольных элемента х и у евклидова пространства Е ортогональными, если скаляр- ное произведение этих элементов (х, у) равно нулю (в этом случае косинус угла ф между элементами х и у будет равен нулю). Снова апеллируя к векторной алгебре, назовем сумму х 4~ у двух ортогональных элементов х и у гипоте- нузой прямоугольного треугольника, построенного на элемен- тах х и у. Заметим, что во всяком евклидовом пространстве справед- лива теорема Пифагора: квадрат гипотенузы равен сумме квадратов катетов. В самом деле, поскольку л и у ортого- нальны и (х, у) = 0, то в силу аксиом и определения нормы И4-у||2 = (*4-у> *4-у) = = (*. х)4-2(х, у) 4-(у. у) = (*. х)4-(у, у) =Цлс Г 4-IIУ IP- Этот результат обобщается и на л попарно ортогональных элементов xt, хг, .... хп: если z = х2 4- *г + ... + хп, то г II2 = (*i 4- *? 4- • • • 4- хп, Xi 4- хг 4- • • • 4* хп) = = (*!, *1)4-(*2. *2)4-----Н*П> *п)== = ||*1Р4-11*г|]!!4- ••• -Н*ПР- В заключение запишем норму, неравенство Коши—Буняков- ского и неравенство треугольника в каждом из конкретных евклидовых пространств, рассмотренных в предыдущем пункте.
88 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 В евклидовом пространстве всех свободных векторов с обыч- ным определением скалярного произведения норма вектора а совпадает с его длиной |а|, неравенство Коши—Буняковского приводится к виду (а, Ь)* < |а|2|6|2 *). а неравенство треуголь- ника — к виду |а + Ь\ < |а| + |6| **). В евклидовом пространстве С [а, Ы всех непрерывных на сегменте а < t < b функций х = х (t) со скалярным произведе- нием (4.1) норма элемента х = x(t) равна J хъ (t) dt, а не- а равенства Коши—Буняковского и треугольника имеют вид < J х3 (/) Л _[ f/2 (0 ,д J а а |/ f [* W 4-1/ (О)2 dt « ]/ J х2 (0 dt + (0 dt Оба эти неравенства играют важную роль в различных разделах математического анализа. В евклидовом пространстве Еп упорядоченных совокупностей п вещественных чисел со скалярным произведением (4.2) норма любого элемента х = (хь х2, ..., хп) равна Q х || = "j/"Х[ -|- х2 -|- • • • -|- х2п, а неравенства Коши—Буняковского и треугольника имеют вид (xiyi + Х2У2 + • • • + хпуп)2 < < (х? -|- X2 -|- • • • 4- -4) (у2 -|- У2 4- « • . 4- Уп), V (*i 4- nJ2 4- (хл 4- Уг)2 4-И*» 4- Уп)2 < < jAx2 4- 4- • • • 4- х2 4- J/ i/i 4" [/2 4" • • 4" z/n. Наконец, в евклидовом пространстве упорядоченных совокуп- ностей п вещественных чисел со скалярным произведением (4.5) норма любого элемента х = (х1( х2, ..., хп) равна ***) п п IIX || 1/ 2 £ , » 1=1 i=l *) Для скалярного произведения векторов (а, b) = | а | [ b | cos <р это неравенство тривиально вытекает из того, что cos2 <р 1. **) Если сложить векторы а и Ь по правилу треугольника, то это нера- венство тривиально сводится к тому, что одна сторона треугольника не пре- восходит суммы двух других его сторон. ***) Напоминаем, что при этом матрица (4.3) симметрична и порождает положительно определенную квадратичную форму (4.4).


$ al ОРТОНОРМИРОВАННЫЙ БАЗИС евклидова ПРОСТРАНСТВА 89 а неравенства Коши—Буняковского и треугольника имеют вид S aikxif/h) с I онЛ*а) I S lj а1кУ1Ук]> ,=1 *=1 / \<=1A=1 / \t=l A=1 / 1=1 *=1 aih (xi + Ul) (Xk + Ук) < 2j Zj aikxixk + !=1 Л=1 2j Zj агкУ1Ук • =1 Л=1 § 2. Ортонормированный базис конечномерного евклидова пространства В этом параграфе будут изучаться евклидовы пространства конечной размерности п. Распространение изучаемых здесь результатов на бесконечномерные евклидовы пространства выхо- дит за рамки этой книги и является предметом специального изучения. (Такие пространства изучаются в главах 10 и 11 вы- пуска «Основы математического анализа, часть 2».) 1. Понятие ортонормированного базиса и его существование. В главе 2 было введено понятие базиса n-мерного линейного пространства. В линейном пространстве все базисы являлись равноправными, и у нас не было оснований предпочитать один базис другому. В евклидовом пространстве существуют специальные, особо удобные базисы, называемые ортонормированными базисами. Эти базисы играют ту же роль, что и декартов прямо- угольный базис в аналитической геометрии. Перейдем к опреде- лению ортонормированного базиса. Определение. Будем говорить, что п элементов elt е2, ..., еп n-мерного евклидова пространства Е образуют ортонор'ми- рованный базис этого пространства, если эти элементы попарно ортогональны и норма каждого из этих элементов равна единице, т. е. если (1 при I = k, (elt eh) — „ . , . (4.10) ' ‘ (0 при t=£k. v Для того чтобы установить корректность сформулированного определения, следует доказать, что входящие в это определение элементы еи ег, .... еп образуют один из базисов рассматри- ваемого n-мерного пространства Е, а для этого в силу теоремы 2.5 достаточно доказать, что эти элементы ех, е2, ... , еп линейно независимы, т. е. что равенство 01*1 +---------h«nen = O (4.11) возможно, лишь когда ах = а2 = ... = ап = 0.
90 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 Докажем это. Пусть k — любой из номеров 1, 2, п. Умножая равенство (4.11) скалярно на элемент eh и пользуясь аксиомами скалярного произведения и соотношениями (4.10), мы получим, что ah = 0. Докажем теперь следующую основную теорему. Теорема 4.3. Во всяком п-мерном евклидовом пространстве Е существует ортонор мированный базис. Доказательство. Согласно определению размерности в пространстве Е найдется п линейно независимых элементов f., f..... fn- Докажем, что можно построить п элементов elt ег, ..., еп, линейно выражающихся через flt f...fn и образующих орто- нормированный базис (т. е. удовлетворяющих соотношениям (4.Ю)). Проведем доказательство возможности построения таких эле- ментов 61, б2, ..., еп методом математической индукции. Если имеется только один элемент fu то для построения элемента бх с нормой, равной единице, достаточно нормировать элемент /х, т. е. умножить этот элемент на число [ff(/х, /i)]-1» обратное его норме *). Мы получим при этом элемент 6Х = = [}/(/i, /1)]'1 fi с нормой, равной единице. Считая, что т — целое число, меньшее п, предположим, что нам удалось построить т элементов бх, ег, ..., ет, линейно вы- ражающихся через f, f, ..., fm попарно ортогональных и име- ющих нормы, равные единице. Докажем, что к этим элементам 61, е2, ..., еп можно присоединить еще один элемент em+i, ли- нейно выражающийся через fu ft..... fm+u ортогональный к каждому из элементов 6Х, б2, .... еп и имеющий норму, равную единице. Убедимся в том, что этот элемент бт+х имеет вид &т+1 = ®т+11Ут+1 (fn+V &т) &т (fm+lt ^т-1) &т-1 ' ’ ‘ - -(/m+i. ejej, (4.12) где ат+1 — некоторое вещественное число. В самом деле, элемент em+i линейно выражается через flf ft, •••. fm+i (в силу того, что он линейно выражается через бх, ег, .... ет, fm+i> а каждый из элементов бх, е2, ..., ет линейно выражается через f, f, ..., /т). Отсюда сразу же следует, что при ат+1 Ф 0 элемент ет+х заве- домо не является нулевым (ибо в противном случае яв- лялась бы нулевым элементом некоторая линейная комбинация линейно независимых элементов /х, /2, .... fm+i, в которой в силу (4.12) отличен от нуля коэффициент при /т+1)- *) Напомним, что среди линейно независимых элементов /х, /2...fn не мо- жет быть нулевого элемента, так что норма /х больше нуля.


$ 2] ОРТОНОРМИРОВАННЫЙ БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 91 Далее из того, что элементы еа.......ет попарно ортого- нальны и имеют нормы, равные единице, и из соотношения (4 12) сразу же вытекает, что скалярное произведение (ет+1. ей) равно нулю для любого номера k равного 1, 2, ..., т. Для завершения индукции остается доказать, что число ат+1 можно выбрать так, что норма элемента (4 12) будет равна еди- нице. Выше уже установлено, что при ат+1 =/= 0 элемент em+i, а, стало быть, и элемент, заключенный в (4 12) в квадратные скобки, не является нулевым. Стало быть, для того чтобы нормировать элемент, заключен- ный в квадратные скобки, следует взять число ат+1 обратным положительной норме этого заключенного в квадратные скобки элемента. При этом норма ет+1 будет равна единице. Теорема доказана. Доказанная теорема приводит к следующему осуществляемому шаг за шагом алгоритму построения по данной системе п линейно независимых элементов /г, .... fn системы п попарно ортого- нальных элементов elt ег..... еп, норма каждого из которых равна единице: Л /(Л. Л) ’ е» = -|7йг1^Г> где Л V («г, gt) = где g3=f3-(f3, e^e2 — {f3, eJet V (g3, gs) gn = ’ где Sn = fn — (fn. enj) en_i--(fn.e^Ci. V (gn, gn) Указанный алгоритм обычно называют процессом ор- тогонализации линейно независимых элементов Л, Л .... fn. Замечание. Конечно, в каждом n-мерном евклидовом про- странстве Е существует много ортонормированных базисов. Дей- ствительно, если например, строить ортонормированный базис процессом ортогонализации одних и тех же линейно независимых элементов /х, /2, ..., fn, то, начиная процесс ортогонализации с различных элементов /А, мы придем к различным ортонорми- рованным базисам. Ниже, в п. 2 § 7 гл. 7 будет рассмотрен во- прос о том, как связаны между собой различные ортонорми- рованные базисы данного евклидова пространства Е. Примером ортонормированного базиса может служить де- картов прямоугольный базис евклидова пространства' всех
92 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 свободных векторов или совокупность п элементов *! = (!, 0. 0. .... 0), Cj s (0, 1, 0, ...) 0), еп = (0, 0, 0, .... 1) евклидова пространства Еп всех упорядоченных совокупностей п вещественных чисел со скалярным произведением (4.2). 2. Свойства ортонормированного базиса. Пусть elt е2, . . . ...,еп — произвольный ортонормированный базис п-мерного евкли- дова пространства Е, а х и у — два произвольных элемента этого пространства. Найдем выражение скалярного произведения (х, у) этих элементов через их координаты относительно базиса е1г вг, .... Сп- Обозначим координаты элементов х и у относительно базиса еи е2 еп соответственно через xlt х2, ..., хп и уи у2 уп, т. е. предположим, что х= Х& 4- х2е2 + ... 4- хпеп, у = 4- 4- y2et 4- ... 4- упеп. Тогда (х, у) = (Х1Е?! + х2е2 + • • • + хпеп, у^, + у2е2 4-Ь упеп). Из последнего равенства в силу аксиом скалярного произведения и соотношений (4.10) получим / п п \ п п (•*. У) = (Е x^i, Е t/hej = Е Е Xiyk (e,ek) = \(=1 *=i / ;=i *=i в Х1У1 + хгУг + * * ’ + хпУп- Итак, окончательно, (X, у) = ад 4- ад8 4- • • • 4- хпуп- (4.13) Таким образом, в ортонормированием базисе скалярное произ- ведение двух любых элементов равно сумме произведений соответ- ствующих координат этих элементов. Рассмотрим теперь в п-мерном евклидовом пространстве Е совершенно произвольный (вообще говоря, не ортонормирован- ный) базис flt f2, ..., fn и найдем выражение скалярного про- изведения двух произвольных элементов хну через координаты этих элементов относительно указанного базиса. Обозначим координаты элементов л и у относительно базиса fi, f.....fn соответственно через х1( х2, ..., хп и ylt у2, уп, т. е. предположим, что л = xif 4* хг/ъ + • • • + xnfn, у = yifi + У2/2 + • • • + Уп/л' Пользуясь аксиомами скалярного произведения, получим (л, у) = (Xifi 4- x2f2 4---1- xnfn, yj\ 4- y2f2 4- ... 4- ynfn) = = (E xifit E уа/а) = E E xiyk (ft, fk), \r=l k=l / <=l A=1

г
§ S] ОРТОНОРМИРОВАННЫЙ БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 93 Таким образом, в произвольном базисеfy, f2, fn скалярное произведение двух любых элементов х — Xj/i + х2/2 + ••• + xnfn и у = yifi + «/2/2 + ... + Уп/п определяется равенством п п (X, У) = £ Е atkxiyk> (4.14) z=i л=1 в котором матрица Ца1л|| (i — 1, 2..п\ k = 1, 2, ..., п) имеет элементы а1К = (/г. Л). Последнее утверждение приводит к следующему результату: для того чтобы в данном базисе Д, f2...fn евклидова простран- ства Е скалярное произведение двух любых элементов было равно сумме произведений соответствующих координат этих элемен- тов, необходимо и достаточно, чтобы базис flt f2, ..., fn был ортонормированным. В самом деле, выражение (4.14) переходит в (4.13) тогда и только тогда, когда матрица Цaik || с элементами aih = (ft, Л) является единичной, т. е. тогда и только тогда, когда выполнены соотношения 11 при i — k, (fi> fk) (0 ПрИ t- k, устанавливающие ортонормированность базиса Д, f2, ..., fn. Вернемся к рассмотрению произвольного ортонормированного базиса elt е2...еп n-мерного евклидова пространства Е. Выяс- ним смысл координат произвольного элемента х относительно указанного базиса. Обозначим координаты элемента х относительно базиса elt е2, .... еп через xlt х2.хп, т. е. предположим, что х = XtCi 4- х2е2 н--h хпеп. (4.15) Обозначим далее через k любой из номеров 1, 2, .... л и умно- жим обе части (4.15) скалярно на элемент еА. На основании аксиом скалярного произведения и соотношений (4.10) получим (X, £?а) = ( £ xt£i, == Е xi (®i> ®ft) == Xfi. \<=1 / i=l Таким образом, координаты произвольного элемента относи- тельно ортонормированного базиса равны скалярным произведе- ниям этого элемента на соответствующие базисные элементы. Поскольку скалярное произведение произвольного элемента х на элемент е, имеющий норму, равную единице, естественно назвать проекцией элемента х на элементе, то можно сказать, что координаты произвольного элемента относи- тельно ортонормированного базиса равны проекциям этого эле- мента на соответствующие базисные элементы.
94 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 Таким образом, произвольный ортонормированный базис об- ладает свойствами, вполне аналогичными свойствам декартова прямоугольного базиса. 3. Разложение n-мерного евклидова пространства на прямую сумму подпространства и его ортогонального дополнения. Пусть G — произвольное подпространство n-мерного евклидова про- странства Е. Совокупность F всех элементов у пространства Е, ортогональ- ных к каждому элементу х подпространства G, называется о р- тогональным дополнением подпространства G. Заметим, что ортогональное дополнение F само является под- пространством Е (ибо из ортогональности каждого из элементов У! и уа элементу х, очевидно, вытекает, что и любая линейная комбинация элементов yi и у2 ортогональна элементу х). Докажем, что всякое п-мерное евклидово пространство Е пред- ставляет собой прямую сумму своего произвольного подпростран- ства G и его ортогонального дополнения F. Выберем в G произвольный ортонормированный базис elt ег, .... ек. В силу доказанного в п. 1 § 3 гл. 2 этот базис можно дополнить элементами fk+1.... fn пространства Е до базиса во всем Е. Произведя процесс ортогонализации элементов ....ек, fk+1...fn, мы получим ортонормированный базис е1( ..., ек, ек+1, .... еп всего пространства Е. Разложив произвольный элемент х пространства Е по этому базису, т. е. представив его в виде х = х1е1 + ... + хкек 4- хк+1ек+1 4- ... 4- + хпеп, мы получим, что этот элемент х однозначно представим в виде х = х' + х", где х’ = хгек + ... + хкек совершенно определенный элемент G, а х" — хк+1ем + ... 4- хпеп — со- вершенно определенный элемент ортогонального дополнения F (каждый элемент ем, .... еп ортогонален к любому из элементов е1( ..., ек, а потому ортогонален любому элементу G; поэтому и линейная комбинация хк+1ек+1 4- ... 4- хпеп ортогональна к любому элементу G, т. е. является совершенно определенным элементом F). 4. Изоморфизм n-мерных евклидовых пространств. В этом пункте мы покажем, что различные евклидовы пространства одной и той же размерности п в смысле свойств, связанных со введенными в этих пространствах операциями, по существу не отличаются друг от друга. Поскольку в евклидовых пространствах введены лишь опера- ции сложения элементов, умножения элементов на числа и ска- лярного перемножения элементов, то естественно сформулировать следующее определение. Определение. Два евклидовых пространства Е и Е' назы- ваются изоморфными, если между элементами этих про- странств можно установить взаимно однозначное соответствие так, что если элементам х и у пространства Е отвечают соот-


$ 3] КОМПЛЕКСНОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 95 ветственно элементы х' и у' пространства Е', то элементу X + у отвечает элемент х' + у', элементу \х (при любом веще- ственном X) отвечает элемент \х' и скалярное произведение (х, у) равно скалярному произведению (х', у'). Таким образом, евклидовы пространства Е и Е' изоморфны, если они изоморфны как линейные пространства *) и если этот изоморфизм сохраняет величину скалярного произведения соот- ветствующих пар элементов. Теорема 4.4. Все евклидовы пространства одной и той же размерности п изоморфны между собой. Доказательство. Достаточно доказать, что любое n-мерное евклидово пространство Е' изоморфно евклидову про- странству Еп упорядоченных совокупностей п вещественных чисел со скалярным произведением (4.2). Согласно теореме 4.3 в евкли- довом пространстве Е' существует ортонормированный базис е\, е'ч..е'п. Каждому элементу х — xiei 4- х2е2 + ... + хпе‘п пространства Е' поставим в соответствие п вещественных чисел xlt х2, .... хп, т. е. вполне определенный элемент х = (хп х2.... хп) пространства Еп. Установленное соответствие будет взаимно однозначным. Кроме того, из теоремы 2.4 вытекает, что если элементам х' = (хи х2.... хп) и у' = (ylt у2, ..., уп) пространства Е' **) отвечают со- ответственно элементы х — (хх, х2, ..., хп) и у = (уъ у2, уп) пространства Еп, то элементу х' + у' отвечает элемент х + у, а элементу Хх' отвечает элемент Хл. Остается доказать, что для соответствующих пар элементов х', у' н х, у сохраняется величина скалярного произведения. В силу ортонормированности базиса ei, е'ч..е’п и формулы (4.13) (хг, у') = + х2у2 + ... + хпуп. С другой стороны, в силу формулы (4.2), определяющей скалярное произведение в пространстве Еп, (х, у) — х2у2 + х^2 + ... + хпуп. Теорема доказана. Доказанная теорема позволяет утверждать, что если в каком- нибудь конкретном n-мерном евклидовом пространстве Е' дока- зана теорема, сформулированная в терминах операций сложения, умножения на числа и скалярного перемножения элементов, то эта теорема справедлива и в совершенно произвольном п-мерном евклидовом пространстве Е. § 3. Комплексное евклидово пространство 1. Определение комплексного евклидова пространства. В конце п. 1 § 1 гл. 2 мы уже указывали, что если в определении ли- нейного пространства числа X, ц, ... брать не из множества ве- щественных чисел, а из множества всех комплексных чисел, то *) См. п. 4 § 2 гл. 2. **) Координаты этих элементов берутся относительно базиса ej, е2,.... е‘п.
96 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. ♦ мы придем к понятию комплексного линейного простран- ства. На базе комплексного линейного пространства строится ком- плексное евклидово пространство, играющее фундаментальную роль в теории несамосопряженных линейных преобразований. Для введения комплексного евклидова пространства следует ввести в комплексном линейном пространстве понятие скалярного произведения двух его элементов, подчиненное соответствующим четырем аксиомам. Определение. Комплексное линейное пространство R назы- вается комплексным евклидовым простран- ством, если выполнены следующие два требования: I. Имеется правило, посредством которого любым двум эле- ментам X и у этого пространства ставится в соответствие комплексное число, называемое скалярным произ- ведением этих элементов и обозначаемое символом (х, у). 11. Указанное правило подчинено следующим четырем аксиомам: I0. {X, у} = (у, х) *). 2°. (х, 4- хг, у) = (xlt у) + (хг, у). 3°. (кх, у) = X (х, у). 4°. (х, х) представляет собой вещественное неотрицательное число, обращающееся в нуль лишь в случае, когда х — нулевой элемент **). Логическими следствиями аксиом 1°—3° являются следующие два соотношения: (х, Ху) = X (х, у), (х, у! 4- уг) = (х, yi) 4- (х, у2). В самом деле, из аксиом 1° и 3° заключаем, что (х, Ху) = (Ху, х) = X (у, х) == X (х, у), а из аксиом 1° и 2° получим, что (X, У14- 3»2) = (У14- Уг, X) = (у1( X) 4- (у2, X) = (X, уо 4- (х, у2). Приведем примеры конкретных комплексных евклидовых пространств. *) Здесь и в дальнейшем символом а обозначается число, комплексно со- пряженное с а, **) Аксиома 1° отличается от соответствующей аксиомы 1° вещественного евклидова пространства. Легко убедиться в том, что при переходе к комплекс- ному пространству невозможно сохранить без изменения все три аксиомы 1°, 3° и 4° вещественного скалярного произведения. В самом деле, при наличии аксиом (х, у) = (у, х) и (Хх, у) = X (х, у), мы получили бы, что (х, Ху) = = (Ху, х) = X (у, х) = X (х, у). Но тогда оказалось бы, что (Хх, Хх) = X2 (х, у), и, стало быть, при X = i мы получили бы, что (ix, ix) = —(х, х), а это противо- речило бы аксиоме 4° о неотрицательности (у, у) для любого элемента у.


5 3] КОМПЛЕКСНОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 97 Пример 1. Рассмотрим совокупность С* [а, Ь] всех функ- ций z = z (/), определенных для значений t из сегмента а < t < b и принимающих комплексные значения z (t) = х (t) + iy (t) такие, что вещественные функции х (/) и у (t) являются непрерывными на этом сегменте. Операции сложения этих функций и умноже- ния их на комплексные числа заимствуем из анализа. Скалярное произведение двух любых таких функций определим соотноше- нием (?! (/), z2 (/)) = J Zj (f) z^(tj dt. a Нетрудно убедиться в справедливости для так определенного скалярного произведения всех аксиом 1°—4°, из чего следует, что рассматриваемая совокупность представляет собой комплекс- ное евклидово пространство. Пример 2. Рассмотрим комплексное линейное пространство Л", элементами которого служат упорядоченные совокупности п комплексных чисел, xlt х2, .... хп с такими же определе- ниями операций сложения элементов и умножения их на числа, как и в случае вещественного линейного пространства Ап. Скалярное произведение двух любых элементов х = (х1( х2, хп) и у = (ylt у2, ...» уп) определим соотношением (л, у) = х1у1 + х2у2 + ... + хпуп. (4.16) Справедливость для так определенного скалярного произве- дения аксиом 1°—3° проверяется совершенно элементарно. Спра- ведливость аксиомы 4° вытекает из соотношения (Л, X) = XjXj + х2х2 + •.. + хпхп = | хх |2 +1 х212 -|-Н хп |а. Стало быть, пространство А" со скалярным произведением (4.16) является комплексным евклидовым пространством. Пример 3. В том же самом комплексном линейном про- странстве А" можно ввести скалярное произведение не соотноше- нием (4.16), а более общим соотношением *) (л, у) = ЕЕ athx,yk, (4.17) 1=1 Л=1 в котором || a,k || — произвольная матрица, состоящая из комплекс- ных чисел аЛ, удовлетворяющих условию alh — ам, такая, что п п квадратичная форма £ Е aikxixk для всех комплексных х,, <=1 *=i *2, ..., хп принимает вещественные неотрицательные значения и *) (4.17) переходит в (4.16), когда матрица || aik || является единичной. 4 Зак 459
98 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 обращается в нуль лишь при условии | хх I3 + | х212 + ... + + | хп |2 = 0. Предоставляем читателю проверку того, что так определенное скалярное произведение удовлетворяет аксиомам 1°—4°. 2. Неравенство Коши — Буняковского. Понятие нормы. До- кажем, что для любых двух элементов X и у произвольного ком- плексного евклидова пространства справедливо неравенство Кош и—Б уняковского* **)) !(•*> у)|2<(*. Х)(у, у). (4.18) На основании аксиомы 4° для любого комплексного числа X справедливо неравенство (Хх — у, Хх — у) s* 0. (4.19) Так как в силу аксиом 1°—3° и их логических следствий (кх — у, кх — у) = АА (х, х) — к (х, у) — А (у, х) + (у, у) = = | А |а (л, х) — А (х, у) — Х(х, у) + (у, у), то неравенство (4.19) принимает вид ] А |2 (х, х) — Х(х, у) — А (л, у) + (у, у) 0. (4.20) Обозначим через ф аргумент комплексного числа (х, у) и представим это число втригонометрической форме * *) (х, у) = |(л, у) | (cos ф + i sin <р). (4.21) Положим теперь комплексное число А равным А = i (cos ф — i sin ф), (4.22) где t — произвольное вещественное число. Из соотношений (4.21) и (4.22) очевидно, что | А | = 111, А (х, у) = — А (л, у) = 11 (л, у) |. Поэтому при выбранном нами А неравен- ство (4.20) переходит в неравенство ? (х, л) - 2/ ] (л, у) | + (у, у) 0, (4.23) *) Поскольку (х, у) является, вообще говоря, комплексным числом, то нельзя записывать неравенство Коши — Буняковского в виде (4.6). **) Понятия аргумента и тригонометрической формы комплексного числа разбираются, например, в § 1 гл. 7 выпуска «Основы математического анализа», часть I.


§31 КОМПЛЕКСНОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 99 справедливое при любом вещественном t. Необходимым и доста- точным условием неотрицательности квадратного трехчлена, стоя- щего в левой части (4.23), является неположительность его дис- криминанта, т. е. неравенство |(х, у)|2 — (х, х) (у, у) < 0, экви- валентное неравенству (4.18). С помощью неравенства Коши—Буняковского (4.18) и рас- суждений, полностью аналогичных доказательству теоремы 4.2, устанавливается, что всякое комплексное евклидово пространство является нормированным, если в нем норму любого элемента х определить соотношением ||х|| = /(х,л). (4.24) В частности, во всяком комплексном евклидовом пространстве с нормой, определяемой соотношением (4.24), справедливо нера- венство т р е у г о л ь н и к а Цл + у|| < ||х II + Ы1- Замечание. Подчеркнем, что введенное для веще- ственного евклидова пространства понятие угла <р между двумя произвольными элементами х и у теряет смысл для ком- плексного евклидова пространства (вследствие того, что скалярное произведение (х, у) является, вообще говоря, комплекс- ным числом). 3. Ортонормированный базис и его свойства. Элементы х и у произвольного комплексного евклидова пространства будем на- зывать ортогональными, если скалярное произведение (х, у) этих элементов равно нулю. Ортонормированным базисом n-мерного комплексного евкли- дова пространства назовем совокупность его элементов е1г е2,..., еп, удовлетворяющих соотношениям ( 1 при i = k, (е„ eh)= n . (4.25) v ' (0 при ’ (т. е попарно ортогональных и имеющих нормы, равные единице). Как и в п. 1 § 2, доказывается, что эти элементы линейно независимы и потому образуют базис. В полной аналогии с доказательством теоремы 4.3 (т. е. с по- мощью процесса ортогонализации) устанавливается существова- ние в произвольном n-мерном комплексном евклидовом про- странстве ортонормированного базиса. Выразим скалярное произведение двух произвольных элемен- тов х и у л-мерного комплексного евклидова пространства через их координаты (хп х2, ..., хп) и (у1г у2, уп) относительно орто- нормированного базиса elt е2, еп. Так как х — х& + х2ег + • • • + хпеп, у = у^ -f- уге2 + •••-{- yneni
100 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 то в силу аксиом 1°—4° и соотношений (4.25) получим (Л Е xteh 1=1 п \ п п S ytfk = Е Е хмЛь, еп) = *=1 / i=i *=i — Х1У1 + хгУ° + *' • + хпУп- Выразим далее координаты х1; х2, ..., хп произвольного эле- мента х относительно ортонормированного базиса elt ег.еп. Умножая разложение этого элемента по базису х = х1е1 + + х2е2 4- ... 4- хпеп скалярно на ек и пользуясь соотношениями (4.25), получим (для любого k, равного 1, 2, .... п) (п \ п Е Wt, = Е xt (е„ eh) = xk. i=l / i=l Итак, как и в случае вещественного евклидова пространства, координаты произвольного элемента х относительно ортонорми- рованного базиса равны скалярным произведениям этого элемента на соответствующие базисные элементы. В полной аналогии с доказательством теоремы 4.4 устанавли- вается, что все комплексные евклидовы пространства одной и той же размерности п изоморфны между собой. § 4. Метод регуляризации для отыскания нормального решения линейной системы Снова возвратимся к рассмотрению общей линейной системы т уравнений с п неизвестными вида (3.1). Эту систему кратко за- пишем в матричной форме *) АХ = В. (4.26) Напомним, что в этой записи символ А обозначает матрицу А — = llaull 0 == 1. 2, ..., /п; / = 1, 2, ..., п), а символы X и В обозна- чают столбцы (или векторы) вида первый из которых подлежит определению, а второй — задан. Будем рассматривать случай, когда значения элементов ма- трицы А и столбца свободных членов В заданы нам лишь прибли- женно **). Тогда естественно говорить лишь о приближенных *) См. формулу (3.6) из предыдущей главы. **) Такая ситуация будет иметь место в случае, если эти значения полу- чаются из физических измерений или если в процессе вычислений приходится округлять указанные значения до некоторого знака.


S <1 МЕТОД РЕГУЛЯРИЗАЦИИ 101 значениях искомого столбца X. Изложенные в предыдущей главе и основанные на формулах Крамера алгоритмы вычисления столбца решений X в этом случае могут приводить к большим погрешно- стям и теряют практический смысл *) В этом параграфе мы изложим принадлежащий А. Н. Тихо- нову алгоритм, позволяющий находить так называемое нор- мальное (т е. наиболее близкое к началу координат) реше- ние X с точностью, соответствующей точности задания элементов матрицы А и столбца В **). Введем в рассмотрение так называемые сферические нормы столбцов В и X и матрицы А, положив их равными Г т Г п / т п ||В|| = 1/ 2Ж||хц=1/ S^.M||=1/ LS4/. (4.27) Г Г / = 1 Г | = 1 / = 1 Заметим, что нормы столбцов В и X определяются как обыч- ные нормы векторов — элементов пространств Ет и соответственно Еп. Норма матрицы А согласована с нормой п-мерного столбца X в том смысле, что норма m-мерного столбца АХ, равного произ- ведению матрицы А на столбец X, удовлетворяет условию ***) ||АХ||<||А||||Х||. (4.28) Будем считать, что вместо точных значений элементов матрицы А = ||а^|| и столбца правых частей В = ||Ь{|| нам заданы прибли- женные значения А — ||а„||, В — ||Ь,||. Матрицу А (столбец В) будем называть б-п риближением матрицы А (столбца В), если справедливо неравенство *) Особенно это относится к случаю так называемых «плохо обусловлен- ных» матриц (для которых «малые» изменения элементов матрицы базисного минора ведут к «большим» изменениям элементов обратной матрицы). * *) См. А. Н. Т и х о н о в «О некорректных задачах линейной алгебры и устойчивом методе их решения», Доклады Академии наук СССР, том 163, № 3 (1965), стр. 591—594 ***) В самом деле, пользуясь определением произведения матрицы на стол- бец, соотношениями (4.27) и неравенством Коши — Буняковского для элементов евклидова пространства Еп, будем иметь (4.29) т п *]2 т Г п tl Il ах II2 = £ S аих! Ё Ё Ё J L/=i т п п = Е £4-Е*/ = 1М1|2||х||2. 1=17=1 /=1
102 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 Назовем нормальным решением совместной си- стемы (4.26) то ее решение Х° = '2 , норма ||Х°|| которого яв- х° п ляется наименьшей среди норм ||X || всех решений X этой системы. Заметим, что у всякой совместной системы (4.26) (в том числе и у неопределенной) существует единственное нормальное решение. Введем в рассмотрение следующую функцию п переменных Xi, х2, , хп или одного столбца X = %п Fa(xlt ...» хп, A, B) = Fa(X, А, В) = || АХ - ВЦ2 + а||Х||2, (4.30) зависящую как от параметров от элементов матрицы А и столбца В, а также зависящую от некоторого числового параметра а. В по- дробной записи эта функция выглядит так: т Г п 12 п Fa(X, А, В) =S S ад -bi + а £ х2. (4.30') •=1 /=1 J /=1 Фактически Fa (X, А, В) является функцией от элементов X евклидова пространства n-мерных столбцов Еп. Такого рода функцию, аргументом которой служат элементы некоторого ли- нейного пространства, принято называть функционало м*). Легко убедиться в том, что при любом фиксированном а > 0 неотрицательный функционал (4.30') достигает своего минималь- ного (во всем пространстве Еп) значения в единственной точке А Х“ = В пространства Еп. а х Лп самом деле, дважды дифференцируя функцию (4.30'), по- № Д ( 1 ПРИ k=l, *У’»“ SS - 2 2 + 2“6«'> гае = ( о при k I. Следовательно, второй дифференциал функции Fa имеет вид п п Г т п п d2Fa = s s s aikatl dxh dxt + a £ £ 6fti dxh dxt = Ы L J bl/=l m Г n "|2 n = E E aik dxh + a S (dxh)2. i=i |_fc=i J k-i *) Функционалы систематически изучаются в следующей главе.


Ml МЕТОД РЕГУЛЯРИЗАЦИИ 103 Из этого равенства вытекает оценка cFFa^ a. J] (dxA)2, означа- fa=l ющая, что функция Fa является с т р о го в ы п у к л о й вниз. Кроме того, Fa -> +оо при || X || — |/ Й xk -> со. Отсюда очевидным образом следует, что Fa имеет и притом единственную точку минимума Ха *). Методы отыскания минимальных значений функционалов вида (4.30) хорошо разработаны **). Докажем следующую фундаментальную теорему, сводящую вопрос о приближенном отыскании нормального решения системы $ (4.26) к отысканию того элемента Ха = • • • лп гает своего минимального значения функционал (4.30). Теорема А. Н. Тихонова. Пусть матрица А и столбец В удовлетворяют условиям, обеспечивающим совместность системы .о • — нормальное решение этой системы, А — .о ^-приближение матрицы А, ~В—^-приближение столбца В, е (6) и а (6) — какие-либо возрастающие функции 6, стремящиеся к нулю при б -> 0 + 0 и такие, что б2 < е (б) а (б). Тогда для любого е > 0 найдется положительное число б0 = б0 (е, || Х° ||) такое, что при любом б < б0 (е, )|Х°||) и при любом а, удовлетворяющем условию , на котором дости- (4.26), Х° = .а (4.31) элемент Ха = • • • , доставляющий минимум функционалу (4.30), ха К п удовлетворяет неравенству — Х°|| < е. (4.32) Доказательство. Рассмотрим в линейном пространстве «1 подмножество всех элементов U — ... , представи- Urn Ет мых в виде U = АХ, где X = Х1 ... — произвольный элемент *) См., в частности, выпуск 1 «Основы математического анализа», часть I, гл. 14, § 7. **) См. там же.
104 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 пространства Еп. Совершенно очевидно, что подмножество (£/;,} представляет собой линейное пространство и поэтому является подпространством Ет. Обозначим через (Vj) ортогональное до- полнение {(до всего Ет) и разложим Ет в прямую сумму подпространств {£/^} и *). Пусть В а обозначает проекцию столбца В на подпространство {U-^], так что В = В^ + (В — В~), где (В — — элемент {}• Тогда, поскольку для любого эле- мента X пространства Еп столбец АХ является элементом {(/^1, мы получим следующее разложение: АХ - В = (АХ - В д) + (В а - В), в котором элементы (АХ — Ва) и (Ва — В) ортогональны друг другу и принадлежат соответственно и {V~^ j. Пользуясь теоремой Пифагора (см. п. 2 § 1), мы получим (для любого элемента X пространства Еп) || ЛХ — В ||2 = || ЛХ — Вл ||2 4-1| В — Вл ||2. (4.33) Из (4.33) следует, в частности, неравенство ||В- В А || < II лх - ВЦ, (4.34) также справедливое для любого элемента X пространства Еп. Из (4.33) и (4.30) мы получим, что для любого X из Еп F“(X, А, В) = ||В-В~А ||2 4- Fa(X, Л, Ва), (4.35) т. е. функционалы, стоящие в левой и в правой частях (4.35), имеют общий элемент Х“, доставляющий им минимум. Установим теперь для любого а, удовлетворяющего условиям (4.31), следующее неравенство F“(X“, Л, Вл) < ае (б) С2 4-а||Х°||, (4.36) в котором через С обозначена величина С = 2 (1 4- || Х°||), а Х° — нормальное решение системы (4.26). Так как столбец Х“ доставляет минимум функционалу, стоя- щему в правой части (4.35), то F“ (Х“, Л, Вл) < F« (Х°, Л, В л) = || ЛХ° - В л Ц2 4- а || Хо |р. (4.37) ♦) См. п. 3 § 2 этой главы.


Ml МЕТОД РЕГУЛЯРИЗАЦИИ 105 Пользуясь соотношением АХ° = В и неравенством треуголь- ника, получим ||ЛХ°—Вд || < || АХ° — ЛХ°|Ц-||В — ВЦ ||В — Вл||. В правой части последнего неравенства воспользуемся соотно- шениями (4.28) и (4.29), а также неравенством (4.34), взятым при X = Х°. Получим || АХ° - В а || < 61| Х° || + 6 + || В - АХ° ||. (4.38) Еще раз учитывая, что АХ° = В, и снова пользуясь нера- венством треугольника и соотношениями (4.28) и (4.29), полу- чим, что ЦВ-ЛХ»||< ||В — ВЦ + ЦДХ® — ЛХ°Ц < 8-|-б.||Х0||. (4.39) Из (4.38) и (4.39) следует, что ||ЛХо-Вл||<2б(1+||Хо|р = С6, (4.40) где С = 2(1 +H°ID- Для завершения доказательства оценки (4.36) остается под- ставить (4.40) в (4.37) и воспользоваться неравенством (4.31). Поскольку из определения функционала Fa сразу вытекает, что а-||II2 < Fa (Х“, А, Вд), то из доказанного нами неравен- ства (4.36) вытекает также следующее неравенство: ||Х“||< ЦХОЦ + еДб), (4.41) в котором (6) -> 0 при б -* 0 + 0. Из (4.41) вытекает, что при всех достаточно малых 6 множество |Ха| точек. Х“ простран- ства Еп является ограниченным. Теперь уже нетрудно доказать теорему от противного. Пред- положим, что для некоторого е0 > 0 существует последователь- ность бп -> 0 + 0 и отвечающая ей последовательность {ап} чисел ап, удовлетворяющих условию —1-тб^<ап<а(6л), (4.31*) е \Оп) такая, что для всех номеров п ||хап-х°Ьео. (4.42) Так как множество |Х“| ограничено, то в силу теоремы Больцано—Вейерштрасса из последовательности {Х“п} можно выделить сходящуюся подпоследовательность. Чтобы не менять обозначений, будем считать, что вся последовательность {Х“п} сходится к некоторому столбцу Х° = • • , то есть I Х“п —Х° —> 0 при п -► сю.
106 ЕВКЛИДОВЫ ПРОСТРАНСТВА (ГЛ. 4 Убедимся в том, что || ЛХ“" - АХ° || 0 при п -> оо. (4.43) В самом деле, пользуясь неравенством треугольника, оцен- ками (4.28), (4.29), (4.36) и (4.40) и соотношением (4.31*), получим II ЛХв" - ЛХ° || < II АХа» - АХа* || +1| АХа» - Ba || +1| В а - А Х°|| < < || Ха» |] + / Fa* (Xе», А, В а) + С6„ < 6„ (|| Xе» || -f- С) + + /а(1е (6„)С-|-а„|| Х°||2 -> 0 при п -> оо. Из неравенства (4.43) вытекает, что АХ° = АХ°, т. е. пре- дельный элемент Х° является решением системы (4.26), удов- летворяющим в силу соотношения (4.41) неравенству ||Х°|| < < ||Х°||. Так как по определению для нормального решения Xе справедливо обратное неравенство ||Х°|| < || Х° ||, то || Х° Ц = ||Х°||, т. е. Х° = Х°, а это противоречит неравенству (4.42), справедли- вому для любого номера п. Полученное противоречие завершает доказательство теоремы.


ГЛАВА 5 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В этой главе исследуются так называемые линейные ото бражения линейных и евклидовых пространств, т. е. такие отображения, при которых образ суммы элементов равен сумме их образов и образ произведения элемента на число равен произведению этого числа на образ элемента. При этом мы будем рассматривать комплексные линейные и евклидовы про- странства. Результаты, относящиеся к вещественным простран- ствам, будут оговорены специально. § 1. Понятие линейного оператора. Основные свойства 1. Определение линейного оператора. Пусть V и W — линей- ные пространства, размерности которых равны соответственно п и т. Мы будем называть оператором А, действую- щим из V в W, отображение вида А: V -> W, сопоставляющее каждому элементу х пространства V некоторый элемент у про- странства W. При этом будем использовать обозначение у — А (х) или у = Ах. Определение. Оператор А, действующий из V в W, называет- ся линейным, если для любых элементов х^ и х2 пространства V и любого комплексного числа X выполняются соотношения: 1°. A fa + х,) = АХх + Ах, (свойство аддитивности опе- ратора). 2°. A (kx) = XАх (свойство однородности оператора). Замечание 1. Если пространство W представляет собой комплексную плоскость, то линейный оператор А, действующий из V в W, называется линейной формой или линей- ным функционалом. Замечание 2. Если пространство W совпадает с про- странством V, то линейный оператор, действующий в этом случае из V в V, называют также линейным преобразова- нием пространства V. 2. Действия над линейными операторами. Пространство ли- нейных операторов. В множестве всех линейных операторов, действующих из V в W, определим операции суммы таких операторов и умножения оператора на скаляр.
108 ЛИНЕЙНЫЕ ОПЕРАТОРЫ (ГЛ. 5 Пусть А и В —два линейных оператора, действующих из V в IF. Суммой этих операторов назовем линейный оператор А 4- В, определяемый равенством (Л + В) л = Ах 4- Вл. (5 1) Произведением линейного оператора А на скаляр X назовем линейный оператор ХЛ, определяемый равенством (ХЛ) л = X (Ллс). (5.2) Назовем нулевым оператор, обозначаемый символом О и отображающий все элементы пространства V в нулевой элемент пространства W. Иными словами, оператор О действует по правилу Ох— 0. Для каждого оператора Л определим противополож- ный оператор — Л посредством соотношения —Л = (—1)Л. Легко проверить справедливость следующего утверждения. Множество L (V, W) всех линейных операторов, действующих из V в W, с указанными выше операциями суммы и умножения на скаляр и выбранными нулевым оператором и противоположным оператором образует линейное пространство. 3. Свойства множества L (V, F) линейных операторов. Иссле- дуем подробнее линейные операторы, действующие из V в V, т. е. изучим подробнее множество L (V, V). Назовем тождественным (или единичным) опе- ратором линейный оператор /, действующий по правилу 1х = х (здесь л — любой элемент V). Введем понятие произведения линейных операторов из множества L (V, V). Произведением операторов Л и В из L (V, V) называ- ется оператор АВ, действующий по правилу (АВ)х = А(Вх). (5 3) Отметим, что, вообще говоря, АВ =/= ВА. Справедливы следующие свойства линейных операторов из L (V, V): 1°. X (АВ) = (ХЛ) В. 2°. (Л4-Д)С = ЛС4- ВС. 3°. Л(Д4-С) = АВ+ АС 4°. (ЛД)С = Л(5С). (5.4)


§1) ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА. ОСНОВНЫЕ СВОЙСТВА 109 Первое из свойств (5.4) следует из определения произведения линейного оператора на скаляр (см. (5.2)) и определения произве- дения операторов (см. (5.3)). Перейдем к обоснованию свойства 2°. Имеем, согласно (5.1), (5 2) и (5 3), ((Л + В) С) х = (А + В) (Сх) = А (Сх) + В (Сх) = = (АС) х + (ВС) х = (АС + ВС) х. Сравнивая левую и правую части последних соотношений, мы получаем равенство (Л + В) С — АС + ВС. Свойство 2° установлено. Совершенно аналогично доказывается свойство 3°. Свойство 4° справедливо, поскольку, согласно определению (см (5.3)), произведение линейных операторов заключается в их последовательном действии, и поэтому линейные операторы (АВ) С и А (ВС) совпадают и, следовательно, тождественны. Замечание 1. Свойство 4° позволяет определить произве- дение АВ . С любого конечного числа операторов из L (V, V) и, в частности, л-ю степень оператора А с помощью формулы Ап = АА...А п сомножителей Очевидно, справедливо соотношение Ап+т = АпАт. Нам понадобится понятие обратного оператора для данного оператора А из L (V, V). Определение 1. Линейный оператоа В из L (V, V) называет- ся обратным для оператора А из L (V, У), если выполняет- ся соотношение АВ = В А — I Обратный оператор для оператора А обычно обозначается символом Л-1. Из определения обратного оператора Л-1 следует, что для любого х £ V справедливо соотношение А'Ах — х. Таким образом, если А~гАх= 0, то х = 0, т. е. если оператор Л имеет обратный, то из условия Ах = 0 следует, что х — 0. Мы будем говорить, что линейный оператор Л действует взаимно однозначно из V в V, если любым двум различным элемен- там хг и хг отвечают различные элементы у, = Ахг и у2 = Ахг Если оператор Л действует взаимно однозначно из V в V, то отображение Л : V —♦ V представляет собой отображение У на У, т. е. каждый элемент у £ У представляет собой образ некото- рого элемента х £ У: у —Ах. Чтобы убедиться в этом, достаточно, очевидно, доказать, что п линейно независимых элементов xlt хг, ..., хп пространства У
но ЛИНЕЙНЫЕ ОПЕРАТОРЫ (ГЛ. 5 отображаются посредством оператора А в п линейно независимых элементов Алъ Axt, Ахп этого же пространства. Итак, пусть хи х,, .... хп—линейно независимые элементы V. Если линейная комбинация щАх, 4- агАх2 4- ... 4- апАхп пред- ставляет собой нулевой элемент пространства V: a±AXi 4- а2Ах2 4- • • • 4- апАхп = О, то из определения линейного оператора (см. п. 1 этого параграфа) следует, что A (a^Vi 4- a2x2 4- • • • 4- anxn) = 0. Так как оператор А действует из V в V взаимнооднозначно, то из последнего соотношения вытекает, что atxt 4- 4- ... ...4- anxn = 0. Но элементы хг, ..., хп линейно независимы. Поэтому ai = а2 = ... = an = 0. Следовательно, элементы Лхь Ах....... Ах„ также линейно независимы. Отметим следующее утверждение. Для того чтобы линейный оператор А из L (V, V) имел обрат- ный, необходимо и достаточно, чтобы этот оператор действовал взаимно однозначно из V в V. Убедимся, что сформулированное условие необходимо. Пусть оператор А имеет обратный, но не действует взаимно однозначно из V в V. Это означает, что некоторым различным элементам Jfj и хг, х2 —Xi =/= 0 из V отвечает один и тот же элемент у = —Axj = Ах2. Но тогда А (х2 —хг) = 0, и поскольку А имеет обратный, х2 —Хг = 0. Но выше было отмечено, что хг—Хг 0. Полученное противоречие доказывает необходимость условия утверждения. Докажем достаточность этого условия. Допустим, что оператор А действует взаимно однозначно из V в V. Тогда каждому элементу у £ V отвечает элемент х £ V такой, что у =Ах. Поэтому имеется оператор Л-1, обладающий тем свойством; что Л-1у = А~1 (Ах) = х. Легко убедиться, что оператор Л-1 линейный. По определению Л-1 —обратный опера- тор для оператора А. Достаточность условия утверждения также доказана. Введем понятия ядра и образа линейного оператора. Определение 2. Ядром линейного оператора А называется множество всех тех элементов х пространства V, для которых Ах = 0. Ядро линейного оператора А обозначается символом ker Л. Если ker Л = 0, то оператор Л действует взаимно однозначно из V в V. Действительно, в этом случае из условия Ах = 0 выте- кает х — 0, а это означает, что различным хг и х2 отвечают различ- ные = Ax^ и у, = Ахг (если бы ух — у2, то А (х2 —ху) — О, т. е. Хг = х2 и элементы хг и х2 не были бы различны). Таким образом, согласно доказанному выше утверждению условие кет Л = 0 является необходимым и достаточным для того, чтобы оператор А имел обратный.


§ 1] ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА. ОСНОВНЫЕ СВОЙСТВА Щ Определение 3. Образом линейного оператора А назы- вается множество всех элементов у пространства V, представи- мых в виде у — Ах. Образ линейного оператора А обозначается символом im Л*). Замечание 2. Отметим, что если кег А = 0, то im А = V, и наоборот. Поэтому наряду с отмеченным выше условием кег А — 0 условие im А = V также является необходимым и достаточным для того, чтобы оператор А имел обратный. Замечание 3. Очевидно, ядро кег А и образ im Л — линейные подпространства пространства V. Поэтому можно рассматривать размерности dim (кег А) и dim (im Л) этих под- пространств. Справедлива следующая теорема. Теорема 5.1. Пусть размерность dim V пространства V равна п, и пусть А — линейный оператор из L (V, V). Тогда dim (im Л) -|- dim (кег Л) = п. Доказательство. Так как кег Л представляет собой подпространство V, то можно указать такое подпространство пространства V, что V будет представлять собой прямую сумму Vi и кег Л **). Согласно теореме 2.10 dim + dim (кег Л) = п. Поэтому для доказательства теоремы достаточно убедиться, что dim Vi = dim (im Л). Пусть dim Vt = p, dim (im Л) = q и ylt y2, ..., yq —базис в im А. Так как линейный оператор А действует взаимно одно- значно из в im Л ***), то каждому элементу у из im Л можно поставить в соответствие единственный элемент х £ V± такой, что Ах = у. Поэтому в 14 определены элементы JCj, х2, ..., xq такие, что Axh = yk, k— 1, 2, ..., q. Элементы х1г x2, ..., xq линейно независимы, ибо если ccjJCj + а2х2 + ... + а9л(,= 0, то Л (ajAj 4- а.2х2 + . . . + aqxq) = + а2у2 + ... + ctqyq = 0, *) Символ im следует отличать от символа Im, используемого для обозна- чения мнимой части комплексного числа. **) Чтобы убедиться в этом, выберем в V такой базису, е2, ..., еп, что пер- вые г векторов elt ег, .., ег образуют базис в кег Л, тогда линейная оболочка век- торов ег+1, ..., еп представляет собой Vi (см. подробнее главу 4). ***) По аналогии с линейными операторами, действующими взаимно одно- значно из V в V, можно ввести понятие линейного оператора А, действующего взаимно однозначно из линейного пространства V в линейное пространство W. Эти операторы характеризуются тем, что различным элементам х2 и х2 простран- ства V отвечают различные элементы yj = ЛХ1 и у2 = Лх2 пространства W. Таким свойством обладает рассматриваемый оператор Л, действующий из про- странства У2, в пространство im Л. Действительно, если Xj £ Vj, х2 € ^i> х2—Xj =/= 0, то х2 —Xj g Vi, и по- этому Ах2 AXi (AXi g im Л, Лх2 С im Л), ибо если бы Лх2 = Лх2, то Л(х2 — хх) — 0, т. е.х2 — Xj С кег Л, что противоречило бы принадлежности х2 — xi G Vi и условию х2 — Xj =/= 0 (Vj и кег Л составляют прямую сумму и поэтому имеют общим лишь нулевой элемент).
112 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 а так как элементы ylt у2..yq линейно независимы, то = = а2 = • • = а<7 = 0, т. е. и xlt х.. хч линейно независимы. Таким образом, в имеется q линейно независимых элементов. Следовательно, р q (напомним, что р = dim Vx). Предположим, что р > q. Добавим к линейно независимым элементам хг, х2, ..., Xq элементы xq+i, xq+2.хр так, что лх, х2, ..., хр образуют базис в Vx. Так как р > q и q = dim (im А), то элементы Ахг, Ах2, .... Ахр, принадлежащие im А, линейно зависимы, и поэтому существуют не все равные нулю числа Хх, Х2 такие, что ХхЛл:х + к2Ах2 + ... + крАхр = 0. Отсюда следует, что А (Хххх + Х2х2 + ... + Хрхр) = 0. Так как А дей- ствует из Vi в im А взаимно однозначно, то из последнего равенства получаем Хххх + Х2л:2 + • • • + Хрл:р — 0. Нохх,л2....хр —базис в Vi. Поэтому Хх = Х2 = ... = Хр = 0. Выше указывалось, что не все Хх, Х2, ..., Хр равны нулю. Следо- вательно, предположение р > q ведет к противоречию. Таким образом, р = q. Теорема доказана. Имеет место также следующая теорема, в определенном отно- шении обратная теореме 5.1. Теорема 5.2. Пусть Ух и V2 — два таких подпространства п-мерного пространства V, что dim Ух + dim V2 = dim V. Тогда существует такой линейный оператор А из L (V, V), что Vx = — im А и V2 = ker А. Доказательство. Пусть dim Ух — р, dim V2 = q. Выберем в пространстве V базис ех, е2.еп так, чтобы элементы ер+1, ер+2> принадлежали V2. Далее в пространстве Vx выберем некоторый базис glt g2, ..., gp. Определим теперь значения линейного оператора А на базис- ных векторах elt е2, ..., еп пространства V следующим образом: Aei = gi, Ae2 — g2...Aep = gp, Aep+i — 0, Aep+2 = 0, ..., Aea = 0. Далее, если x = xxex + x2e2 + ... + xpep + хр+1ер+1 + ... 4- xnen, to Ax — Xigi + x2g2 + . . . + xpgp. Очевидно, оператор A линейный и обладает требуемыми свойствами. Теорема доказана. Введем понятие ранга линейного оператора А. Назовем рангом линейного оператора А число, обозначае- мое символом rang А и равное rang А = dim (im Л). Отметим следующее очевидное следствие из теоремы 5.1 и из замечания 2 этого пункта. Следствие из теоремы 5.1. Для того чтобы оператор А из L (V, V) имел обратный А'1, необходимо и достаточно, чтобы rang А = dim V — п. Пусть А и В — линейные операторы из L (V, V)- Справедлива следующая теорема.


5 и ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА. ОСНОВНЫЕ СВОЙСТВА ИЗ Теорема 5.3. Имеют место следующие соотношения: rang АВ < rang A, rang АВ < rang В. Доказательство. Докажем сначала первое из отмечен- ных соотношений. Очевидно, im АВ s im Л*). Поэтому dim (im АВ) < dim (im Л), т. е. rang АВ < rang Л. Для доказательства второго соотношения воспользуемся сле- дующим очевидным включением**): ker В s ker Л В. Из этого включения следует, что dim (ker В) < dim (ker АВ). Из последнего неравенства в свою очередь следует неравенство dim V —dim (ker АВ) < dim V —dim (ker В), а из него, со- гласно теореме 5.1, получаем dim (im АВ) < dim (im В), т. е. rang АВ < rang В. Теорема доказана. Докажем еще одну теорему о рангах линейных операторов. Теорема 5.4. Пусть А и В—линейные операторы из L (V, V) и п — размерность V. Тогда rang АВ з» rang Л + rang В — п. Доказательство. Согласно теореме 5.1 dim (im ЛВ)dim (ker ЛВ) = п. (5.5) Так как rang АВ — dim (im АВ), то из (5.5) получаем rang АВ — п — dim (ker АВ). (5.6) Поскольку, согласно теореме 5.1, dim (ker Л) + dim (ker В) = 2п — (rang Л + rang В), (5.7) то для доказательства теоремы достаточно установить неравенство dim (ker АВ) с dim (ker Л) + dim (ker В). (5.8) Действительно, из этого неравенства и из соотношения (5.6) следует неравенство rang АВ п — (dim (ker Л) + dim (ker В)), из которого, согласно (5.7), сразу же вытекает справедливость утверждения теоремы. Итак, перейдем к обоснованию неравенства (5.8). *) Символ s здесь и в дальнейшем обозначает включение, т. е. запись А s В обозначает, что А является подмножеством В. **) Так как АВ и В А различные, вообще говоря, операторы, то включение im АВ = im В может не иметь места, и поэтому для доказательства второго соотношения rang АВ rang В требуются специальные рассуждения.
114 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ 5 Пусть dim (кег В) = q. (5.9) Согласно теореме 5.3 dim (ker АВ) q. Поэтому справедливо соотношение dim (кег АВ) = р + q, где р 0. (5 10) Так как кег В s кег АВ, то в подпространстве кег А В можно выбрать базис хх, хг, .... xp+q так, что элементы хр+1, ..., xp+q образуют базис в кег В. При таком выборе хъ хг, хр+ч элементы BxltBx2, Вхр линейно независимы (если линейная комбинация р / р \ р S KhBxh — 0, то В 2 lhxh = 0, т е. £ Khxh £ кег В, а это *=1 \А=1 / k=l может быть, в силу выбора Xj, xt, хр, лишь при Xh= 0, k = 1, 2....р). Поэтому элементы Вхъ Вхг, ..., Вхр принадлежат кег А, т. е. р < dim (кег Л). Из этого неравенства и соотношений (5.9) и (5.10) вытекает требуемое неравенство (5 8). Теорема доказана. Следствие из теорем 6.3 и 5.4. Если rang А = п (п — размерность V), то rang АВ — rang В А = rang В Указанное следствие вытекает из неравенств rang АВ < rang В (теорема 5 3), rang АВ rang В (теорема 5 4 при rang А = п). Из этих неравенств получим, что rang АВ = rang В. Аналогично доказывается соотношение rang В А = rang В. § 2. Матричная запись линейных операторов 1. Матрицы линейных операторов в заданном базисе линей- ного пространства V. Фиксируем в линейном пространстве V базис elt ег...еп- Пусть х — произвольный элемент V и п х = S xkeh (5 11) разложение х по данному базису. Пусть А —линейный оператор из L (V, У)- Тогда из (5 11) получаем Лл=2х*Лел. (5.12) t=i Полагая Aeh = iafkeJt (5.13) /=i


9 2J МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ 115 перепишем (5.12) в следующей форме: Ах = S х* £ = S ( S а***') в/. /г=1 /=1 /=1 \А=1 / Таким образом, если у = Ах и элемент у имеет координаты у1, у2, уп, то j/=EaZ /=1,2...........п. (5 14) Л=1 Рассмотрим квадратную матрицу А с элементами а[: А = (аЬ). Эта матрица называется матрицей линейного оператора в заданном базисе еъ ег, еп. Наряду с ранее указанным способом записи линейного опера- тора используется при заданном базисе е2, .... еп матричная форма записи: у = Ах, причем, если х = (х1, х2, .... хп), то у = = (у1,у2, .... уп), греу1, ] — 1,2, ..., п, определяются с помощью соотношений (5.14), а элементы а* матрицы А вычисляются по формулам (5.13). Замечание 1. Если оператор А нулевой, то все элементы матрицы А этого оператора равны нулю в любом базисе, т. е. А — нулевая матрица. Замечание 2. Если оператор А единичный, т. е. А = I, то матрица этого оператора будет единичной в любом базисе. Иными словами в этом случае А = Е, где Е — единичная матрица. В дальнейшем единичную матрицу мы будем обозначать также символом /. Мы выяснили, что каждому линейному оператору А из L (V, V) при заданном базисе линейного пространства V отвечает матрица А этого оператора. Естественно возникает обратный вопрос — каждой ли данной матрице А при заданном базисе в V можно поставить в соответствие линейный оператор А, матрицей которого будет данная матрица. Важно также выяснить вопрос о единствен- ности матрицы линейного оператора в заданном базисе. Справедливо следующее утверждение. Теорема 5.5. Пусть в линейном пространстве V задан базис е\, е?, ..., еп, и пусть А = (<з{) —квадратная матрица, содержа- щая п строк и п столбцов. Существует единственный линейный оператор А, матрицей которого в заданном базисе является ма- трица А. Доказательство. Докажем сначала существование оператора А. Для этой цели определим значения Аек этого опера-
116 ЛИНЕЙНЫЕ ОПЕРАТОРЫ (ГЛ. 5 тора на базисных векторах ек с помощью соотношения (5.13), полагая в этом соотношении равными соответствующим эле- ментам заданной матрицы А. Значение оператора А на произволь- ном векторе л £ V, разложение которого по базисным векторам elt е2, ..., еп дается формулой (5.11), определим по формуле (5.12). Очевидно, построенный оператор линейный и матрицей этого оператора является матрица А. Единственность оператора А, матрицей которого в базисе elt ег..еп является матрица А, следует из соотношений (5.13): с помощью этих соотношений единственным образом определяются значения оператора на базисных векторах. Замечание 3. Пусть А и В — квадратные матрицы порядка п, А и В — отвечающие им линейные операторы в задан- ном базисе пространства V. Из доказательства теоремы 5.5 следует, что матрице А + кВ, где к — некоторое число, отвечает линейный оператор А + кВ (напомним, что А, В и А + кВ принадлежат L (V, V)). Докажем следующую теорему. Теорема 5.6. Ранг линейного оператора А равен рангу матри- цы А этого оператора: rang Л = rang Л. Доказательство. По определению rang А = = dim (im Л), a im Л —линейная оболочка векторов gh: gk^Yia'ke, (5.15) /=i (см. матричную форму записи оператора и определение im Л). Поэтому rang Л равен максимальному числу линейно незави- симых векторов gh. Так как векторы elt ег, ...,еп линейно незави- симы, то, согласно (5.15), максимальное число линейно независи- мых векторов gh совпадает с максимальным числом линейно независимых строк (a*, al, а*) матрицы Л, т. е. с рангом Л. Теорема доказана Пусть Л и В — произвольные квадратные матрицы, содержа- щие п строк и п столбцов. Из теорем 5.3, 5.4, 5.5 и 5.6 вытекают следующие следствия. Следствие 1. Ранг rang АВ произведения Л и В удовлетво- ряет соотношениям rang АВ < rang Л, rang АВ < rang В, rang АВ 5s rang Л + rang В — п. Следствие 2. Обратный оператор Л-1 для оператора Л су- ществует только тогда, когда ранг матрицы Л оператора Л ра- вен п (п = dim V). Отметим, что в этом случае существует также и обратная матрица Л-1 для матрицы А.


5 2] МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ 117 2. Преобразование матрицы линейного оператора при переходе к новому базису. Пусть V — линейное пространство, А — линей- ный оператор из L (V, V)> &1, ег, .... еп и elt ег, .... еп —два базиса в V и Хг=1, 2, . .., п (5.16) <=i — формулы перехода от базиса |е,| к базису Обозначим через U матрицу (и*): U = (и‘к). (5.17) Отметим, что rang U = п. Пусть Л = (4) и Л = (а*) (5.18) — матрицы оператора А в указанных базисах. Найдем связь между этими матрицами. Справедливо следующее утверждение. Теорема 5.7. Матрицы А и А оператора А в базисах {eft} и соответственно связаны соотношением А = U^AU, где U'1 обратная матрица *) для матрицы U, определенной равенством (5.17). Доказательство. Обращаясь к понятию матрицы линейного оператора, получим, согласно (5.18), Авк = S ak€i, Aek = S alkei. (5.19) <=i i=i Из определения линейного оператора, из формул (5.16) и из второй из формул (5.19) следуют соотношения Авк = А ( Л Uket I, Авк = Л а‘к S и{е<. \z=i / 1=1 1=1 п п / п \ Поэтому справедливо равенство У1, UkAei = 21 I S a'kui] в/. 1=1 1=1 \i=i / Подставляя в левую часть этого равенства выражение Aet по первой из формул (5.19), найдем л / и \ п / п \ 21 I 21 иМ) et = S S aW) et. /=1 \,=1 / /=1 \1=1 / *) Так как rang U = п, то обратная матрица U’1 для матрицы U суще- ствует.
118 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Так как {в;} — базис, то из последнего соотношения вытекают равенства 2] ы*а{= 2j /> £ = 2, . . п. (5.20) i=i i=i Если обратиться к матрицам А, А и U (см. (5.17) и (5.18)), то соотношения (5.20) эквивалентны следующему матричному равенству: UA = AU. Умножая обе части этого равенства слева на матрицу U~\ получим требуемое соотношение А — U_1AU. Теорема доказана. Замечание 1. Обратимся к формуле А — l)~xA U. Умно- жая обе части этого матричного равенства слева на матрицу U и справа на U-1, получим соотношение A=UAU~\ (5.21) представляющее собой другую форму связи между матрицами А и А линейного оператора А в разных базисах. Замечание 2 Пусть А и В — квадратные матрицы порядка п, А и В — отвечающие им линейные операторы в задан- ном базисе {в),} Как уже отмечалось (см замечание 3 предыду- щего пункта) матрице А + кВ отвечает линейный оператор А + кВ. Выясним вид матрицы этого оператора в базисе Пусть А и В —матрицы операторов Л и В в базисе Тогда, согласно (5 21), имеем А = UAU~\ В = UBU-K (5.22) Матрица линейного оператора А + кВ в базисе имеет, согласно (5.21), следующий вид: U (А + кВ) U'1. Используя распределительное свойство умножения матриц, перепишем по- следнюю формулу следующим образом (напомним, что эта формула представляет собой матрицу линейного оператора А 4- кВ в ба- зисе |ёй}): UAU"1 + к (UBU-1). Обращаясь к соотношениям (5.22), видим, что матрица опера- тора А 4- кВ в базисе {efc| записывается следующим образом: А 4- кВ. В частности, если В —единичная матрица, В = /, то В = / (см. замечание 2 предыдущего пункта и теорему 5.5), и поэтому


§ 21 МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ 119 матрица линейного оператора А + А/ в базисе {в/J имеет вид 4 4- W. Следствие из теоремы 5.7. det А = det А. В самом деле, так как определитель произведения матриц равен произведению определителей этих матриц, то из равенства А = U~lAU следует, что det А = det С~г det A det U. (5.23) Поскольку det U~l det U = 1, то из соотношения (5.23) получаем равенство det А = det А. Таким образом, определитель матрицы линейного оператора не зависит от выбора базиса. Поэтому можно ввести понятие определителя det Л линейного оператора А, полагая det А = det А, (5.24) где А —матрица линейного оператора А в любом базисе. 3. Характеристический многочлен линейного оператора. Пусть А —линейный оператор, а I —тождественный оператор из L (V, V). Определение. Многочлен относительно А det (А — V) (5.25) называется характеристическим многочленом оператора А. Пусть в пространстве V задан базис (ej и А = (а'к) —матрица оператора А в этом базисе. Тогда, согласно (5.24), характеристи- ческий многочлен (5.25) оператора А запишется следующим образом: det(A —А/) = а} — A Oj ... а” °2 °2 — А • • • а2 а'п ап ... (5.26) Запишем характеристический через dk коэффициент при X4: многочлен (5.25), обозначая det (А - V) = 2 dhM. *=о (5.27) Замечание 1. Так как значение определителя det (А — — А/) не зависит от выбора базиса, то коэффициенты dk характери- стического многочлена в правой части (5.27) также не зависят от выбора базиса. Таким образом, коэффициенты dh характеристи- ческого многочлена оператора А представляют собой инварианты — величины, значения которых не зависят от выбора базиса.
120 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Г Л. 5 В частности, коэффициент dn-i, равный, очевидно, а] + + щ + ... + а'п, является инвариантом. Этот инвариант называ- ется следом оператора А и обозначается символом tr А (от английского слова trace —след): tr А = Qi -|- йч -|- • • • -f- а". (5.28) Замечание 2. Уравнение det (А - X/) = 0 (5.29) называется характеристическим уравнением оператора А. § 3. Собственные значения и собственные векторы линейных операторов Пусть — подпространство п-мерного линейного простран- ства V и А — линейный оператор из L (V, И). Определение 1. Пространство \\ называется инва- риантным. подпространством оператора А, если для каждого х, принадлежащего /ц элемент Ах также принад- лежит Kj. Примерами инвариантных подпространств оператора А могут служить ker Л и im Л. Определение 2. Число X называется собственным значением оператора А, если существует ненулевой век- тор х такой, что Ах = кх. (5.30) При этом вектор х называется собственным вектором оператора А, отвечающим собственному значению X. Справедливо следующее утверждение. Теорема 5.8. Для того чтобы число X было собственным зна- чением оператора А, необходимо и достаточно, чтобы это число бы- ло корнем характеристического уравнения (5.29) оператора А. Доказательство. Пусть X —собственное значение опе- ратора А и х —собственный вектор, отвечающий этому X (х=£0). Перепишем соотношение (5.30) в следующей форме: (Л — Х/)л = 0. Так как х — ненулевой вектор, то из последнего равенства сле- дует, что кег (Л — X/) 0, т. е. dim (кег (Л — XZ)) з» 1. (5.31) Поскольку, согласно теореме 5.1, dim (im (Л — XJ)) -)- dim (кег (Л — XZ)) = n,


$ з] СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ 121 то из этого равенства и неравенства (5.31) получаем dim (im (Л — X/)) < п — 1. (5.32) По определению dim (im (А — X/)) равняется рангу оператора А —М. Поэтому из неравенства (5.32) следует rang (А — X/) < п. (5.33) Таким образом, если X —собственное значение, то ранг матрицы А —X/ оператора А —X/ меньше п, т. е. det (Л —X/) = 0 и, следовательно, X—корень характеристического уравнения. Пусть теперь X —корень характеристического уравнения (5.29). Тогда справедливо неравенство (5.32), а следовательно, и нера- венство (5.31), из которого вытекает существование для числа X такого ненулевого вектора х, что (Л — X/) х = 0. Последнее соотношение эквивалентно соотношению (5.80). Поэтому X — собственное значение. Теорема доказана. Следствие* Каждый линейный оператор имеет собственное значение. Действительно, характеристическое уравнение всегда имеет корень (в силу основной теоремы алгебры). Справедлива следующая теорема: Теорема 5*9* Для того чтобы матрица А линейного опера- тора А в данном базисе была диагональной *), необходимо и достаточно, чтобы базисные векторы eh были собственными век- торами этого оператора. Доказательство. Пусть базисные векторы являются собственными векторами оператора Л. Тогда Aek = Xheft, (5.34) и поэтому матрица А оператора Л имеет вид (см. соотношения (5.13) и понятие матрицы линейного оператора) (X! 0 ... 0\ °), (5.35) о о ... т. е. является диагональной. Пусть матрица А линейного оператора Л в данном базисе диагональна, т. е. имеет вид (5.35). Тогда соотношения (5.13) примут вид (5.34), а это означает, что —собственные векторы оператора Л. Теорема доказана. Докажем еще одно свойство собственных векторов. *) Напомним, что матрица называется диагональной, если все ее элементы, расположенные не на главной диагонали, равны нулю.
122 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Теорема 5.10. Пусть собственные значения Х2........Хр one- ротора А различны. Тогда отвечающие им собственные векто- ры Ci, е2...ер линейно независимы. Доказательство. Применим индукцию. Так как ег — ненулевой вектор, то для одного вектора (р — 1) утверждение справедливо (один ненулевой вектор является линейно незави- симым). Пусть утверждение теоремы доказано для т векторов в], е2, .... ет. Присоединим к этим векторам вектор ет+1 и до- пустим, что имеет место равенство т~Н S “а«а = °- (5.36) (г=1 Тогда, используя свойства линейного оператора, получим т-Н S ahAeh = 0. (5.37) 4=1 Так как eh —собственные векторы, то Авь = и поэтому равенство (5.37) можно переписать следующим образом: т-|-1 Е aftM„ = 0. (5.38) А=1 т+1 Согласно (5.36) Е ^m+iaA^A = 0. Вычитая это равенство из 4=1 равенства (5.38), найдем Е (^А — ^т+1) аА#А = 0. (5.39) 4=1 По условию все различны, т. е. — \т+1 0. Поэтому из (5.39) и предположения о линейной независимости векторов еи е2, .... ет следует, что = а2 = ... = ат = 0. Отсюда и из (5.36), а также из условия, что ет+1 — собственный вектор (ет+1 ¥= 0), вытекает, что am+I — 0. Таким образом, из равенства (5.36) мы получаем, что = ... = am+1 = 0. Это означает, что векторы elt ...... ет+1 линейно независимы. Индукция проведена, и доказательство теоремы завершено. Следствие. Если характеристический многочлен оператора А имеет п различных корней, то в некотором базисе матрица опе- ратора А имеет диагональный вид. Действительно, в рассматриваемом случае, согласно только что доказанной теореме собственные векторы линейно независимы и поэтому могут быть выбраны в качестве базисных. Но тогда по теореме 5.9 в этом базисе матрица оператора А будет диагональной.


j 4] ЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФОРМЫ 123 § 4. Линейные и полуторалинейные формы в евклидовом пространстве 1. Специальное представление линейной формы в евклидовом пространстве. Пусть V — евклидово пространство, а С — ком- плексная плоскость (одномерное комплексное линейное про- странство). В п. 1 § 1 этой главы мы ввели понятие линейной формы — линейного оператора, действующего из V в С. В этом пункте мы получим специальное представление произвольной линейной формы f из L (V, С). Лемма. Пусть f —линейная форма из L (V, С). Тогда суще- ствует единственный элемент h из V такой, что f(x) = (x,h). (5.40) Доказательство. Для доказательства существования элемента А выберем в V ортонормированный базис eit ег, .... еп. Рассмотрим элемент h, координаты hk которого в выбранном базисе определяются соотношениями *) Лй = /(ей). (5.41) гг Таким образом, h — £ hkeh. 4=1 п Пусть х = J] х*ей — произвольный элемент пространства V. Используя свойства линейной формы f и равенство (5.41), получим f(x) = Sx*f(eft)=S (5.42) 4=1 4=1 Так как в ортонормированном базисе скалярное произве- п п п дение (х, h) векторов х = S xkek и А = Р равно У] xkhk, 4=1 4=1 Л=1 то из (5.42) получаем f (х) = (х, h). Существование вектора h доказано. Докажем единственность этого вектора. Пусть hx и Аа —два вектора таких, что с помощью этих векторов форма / (х) может быть представлена в виде (5.40). Очевидно, для любого х справед- ливо соотношение (х, AJ = (х, Аа), из которого следует равенство *) Черта над / (ед) означает, что берется комплексно сопряженное значение этого выражения.
124 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 (л, h3 — А,) = 0. Полагая в этом равенстве х = А2 — hr и исполь- зуя определение нормы элемента в евклидовом пространстве, найдем || hi — AJ = 0. Итак, А2 = Ах. Лемма доказана. Замечание. Очевидно, лемма справедлива и в случае, если V —вещественное евклидово пространство, а / £ L (V, R), где R — вещественная прямая. 2. Полуторалинейные формы в евклидовом пространстве. Спе- циальное представление таких форм. Введем понятие полуто- ралинейной формы в линейном пространстве Определение. Числовая функция В (х, у), аргументами кото- рой являются всевозможные векторы х и у линейного пространст- ва L, называется полуторалинейной формой, если для любых век- торов х, у и z из L и любого комплексного числа А выполняются соотношения B(x-j-y, z) = B(x, z) + B(y, z), В(х, у-\- z) = B(x, у)-\-В(х, z), В (Хх, у) = КВ (х, у), В (х, Ху) = ХВ (х, у). (5.43) Иными словами, полуторалинейная форма В (х, у) представляет собой числовую функцию двух векторных аргументов х, у, опре- деленную на всевозможных векторах х и у линейного пространства L, линейную по первому аргументу х и антилинейную по второму аргументу у Замечание 1. Если линейное пространство L является вещественным, то полуторалинейные формы переходят в так называемые билинейные формы, т. е. формы, линейные по каждому из аргументов (четвертое из соотношений (5.43) в силу веществен- ности X будет характеризовать линейность и по второму аргу- менту). Билинейные формы изучаются в главе 7. Обратимся к полуторалинейной форме, заданной в евклидовом пространстве V. Справедлива следующая теорема о специальном представлении такой формы. Теорема 5.11. Пусть В (х, у)—полуторалинейная форма в евклиоовом пространстве V. Тогда существует единственный линейный оператор А из L (V, И) такой, что В(х, у) — (х, Ау). (5.44) Доказательство. Пусть у — любой фиксированный элемент пространства V. Тогда В (х, у) представляет собой линей- ную форму аргумента х. Поэтому по лемме предыдущего пункта можно указать такой однозначно определенный элемент h про- странства V, что В(х, у) = (х, К). (5.45)


$ 4] ЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФОРМЫ 125 Итак, каждому у из V по правилу (5.45) ставится в соответствие единственный элемент h из V. Таким образом, определен оператор А такой, что Л = Ау. Линейность этого оператора элементарно следует из свойств (5.43) полуторалинейной формы и из свойств скалярного произведения. Докажем единственность оператора А. Пусть Ai и Аг —два оператора таких, что с помощью этих операторов форма В (л, у) может быть представлена в виде (5.44). Очевидно, для любых х и у справедливо соотношение (х, Лху) = = (х, Агу), из которого следует равенство (х, Агу — А у) — 0. Полагая в этом равенстве х = Агу —и используя определение нормы элемента, найдем || Агу — Л1у| = 0. Таким образом, для любого у из V имеет место равенство Агу = Ау, т. е. Аг = А±. Теорема доказана. Следствие- Пусть В (х, у) —полуторалинейная форма в евк- лидовом пространстве V. Тогда существует единственный линейный оператор А из L (V, V) такой, что В(х, у) —(Ах, у). (5.46) Справедливость следствия вытекает из следующих рассужде- ний. Во-первых, форма (у, х) = В (х, у) является полутора- линейной (это следует из того, что В (х, у) — полуторалинейная форма и из определения такой формы). Далее, по теореме 5.11 получаем для Bt (у, х) представление в виде ВЛу, х) = (у, Ах). (5.47) Так как сопряженное значение от (х, у) равно Вг (х, у), то, беря сопряженное значение левой и правой частей (5.47) и учиты- вая равенство Вх (у, х) = В (х, у), получим В (х, у) = (у, Ах). (5.48) Но (у, Ах) — (Ах, у) (см. гл. 4, § 3, п. 1). Поэтому из (5.48) получаем равенство (5.4b). Следствие доказано. Замечание 2. Теорема 5.11 и следствие из этой теоремы справедливы и для случая вещественного евклидова пространства. В этом случае в формулировке теоремы и следствия термин «полу- торалинейная форма» надо заменить термином «билинейная форма». См. также замечание 1. Введем понятие матрицы полуторалинейной формы в данном базисе (efcJ. п п Пусть х, у принадлежат V и х= £ х>е}, у= £ ykek—-разло- /=1 А=1 жения х и у по базису Из определения полуторалинейной
126 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 формы следуют соотношения В(х, у) = В (s x/gj, s /ej = Й xWlej, eh). (5.49) \/=l k=l / /=1 4=1 Полагая bjk = B(ejt eh), (5.50) запишем выражение (5.49) для В (х, у) в следующей форме: В(*, у)= S b]hx/yk. J. *=1 Матрица В = (Ь]к) называется матрицей полутора- линейной формы В (х, у) в базисе Справедливо следующее утверждение: Пусть полуторалинейная форма В (х, у) представлена в виде (5.46) В (х, у) = (Ах, у). (5.46) Пусть далее элементы матрицы А оператора А в данном орто- нормированием базисе равны ак/. Тогда в этом базисе Ь/к = а*. Для доказательства обратимся к выражению (5.50) для коэффи- циентов bjh полуторалинейной формы. Преобразуем правую часть (5.50) с помощью (5.46). Получим, согласно (5.13), Ь/к = В (е,, ек) = (Ae/t ек) = S ek = S (eq, ek). 4=1 / ?=1 Так как базис ортонормированный, то (eq, ек) = 0, если q Ф k и (ек, ек) — 1. Поэтому из всех слагаемых последней суммы отличным от нуля будет лишь то, которое получается при q = k. Таким образом, Ь!к — а*. Утверждение доказано. Замечание 3. Если полуторалинейная форма представ- лена в виде В (х, у) = (х, Лу) и элементы матрицы А оператора А в данном ортонормированном базисе равны а*, то в этом базисе ^/4 — &Г § 5. Линейные самосопряженные операторы в евклидовом пространстве 1. Понятие сопряженного оператора. Мы будем рассматри- вать линейные операторы в конечномерном евклидовом простран- стве V. Определение 1. Оператор Л* из L (V, V) называется сопряженным к линейному оператору А, если для любых х и у из V выполняется соотношение (Ах, у) = (х, Л*у). (5.51)


5 5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 127 Легко убедиться в том, что оператор А*, сопряженный к линей- ному оператору А, сам является линейным оператором. Это вытекает из очевидного соотношения (Ах, ayL + ₽у2) = а (Ах, уг) + Р (Ах, уг) = =а(Х, А*у1) + $(Х, А*уг) = (х, Л*(ау1 + ₽у2)), справедливого для любых элементов х, ylt уг и любых комплекс- ных чисел аир. Докажем следующую теорему. Теорема 5.12. Каждый линейный оператор А имеет единст- венный сопряженный. Доказательство. Очевидно, скалярное произведение {Ах, у) представляет собой полуторалинейную форму (см. гл. 4, § 3, п. 1 и определение полуторалинейной формы). По теореме 5.11 существует единственный линейный оператор А* такой, что эта форма может быть представлена в виде (х, Л*у). Таким образом, (Ах, у) — (х, А*у). Следовательно, оператор Л* —сопряженный к оператору Л. Единственность оператора Л* следует из единственности пред- ставления полуторалинейного оператора в виде (5.44). Теорема доказана. В дальнейшем символ Л* будет обозначать оператор, сопря- женный оператору Л. Отметим следующие свойства сопряженных операторов: 1°. /* = I. 4°. (Л*)* = А. 2°. (А + В)* = Л* + В*. 5°. (АВ)* = В*А*. 3°. (М)* = ХЛ*. Доказательства свойств Г—4° элементарны, и мы предостав- ляем их читателю. Приведем доказательство свойства 5°. Согласно определению произведения операторов справедливо соотношение (АВ) х = А (Вх). С помощью этого равенства и определения сопряженного оператора получаем следующую це- почку соотношений: ((АВ)х, у) = (А(Вх), у) = (Вх, А*у) = = (х, В* (А*у)) = (х, (В*А*) у). Таким образом, ((АВ) х, у) = (х, (В*А*) у). Иными словами, оператор В*А* является сопряженным к оператору АВ. Справед- ливость свойства 5° установлена. Замечание. Понятие сопряженного оператора для вещест- венного пространства вводится совершенно аналогично. Выводы этого пункта и свойства сопряженных операторов справедливы и для этого случая (при этом свойство 3° формулируется так: (ХЛ)* == ЛЛ*).
128 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 2. Самосопряженные операторы. Основные свойства. Определение 2. Линейный оператор А из L (V, V) называ- ется самосопряженным, если справедливо равенство Л* = Л Самосопряженный оператор в вещественном пространстве опреде- ляется аналогично. Простейшим примером самосопряженного оператора является тождественный оператор I (см. свойство Г сопряженных операто- ров в предыдущем пункте). С помощью самосопряженных операторов можно получить специальное представление произвольных линейных операторов. Именно, справедливо следующее утверждение. Теорема 5-13. Пусть А —линейный оператор, действующий в комплексном евклидовом пространстве V. Тогда справедливо представление А = A# + iA/t где и А, — самосопряженные операторы, называемые соответственно действительной и мнимой частью оператора А. Доказательство. Согласно свойствам 2°, 3° и 4° сопря- женных операторов (см. предыдущий пункт этого параграфа) операторы AR = (А + А*)/2 и А, = (А —A*)/2t самосопря- женные. Очевидно, А — Ак 4- iAt. Теорема доказана. В следующей теореме выясняются условия самосопряженности произведения самосопряженных операторов. Мы будем говорить, что операторы А и В коммутируют, если АВ = В А. Теорема 5.14. Для того чтобы произведение АВ самосопряжен- ных операторов А и В было самосопряженным оператором, необ- ходимо и достаточно, чтобы они коммутировали. Доказательство. Так как А и В — самосопряженные операторы, то, согласно свойству 5° сопряженных операторов (см. п. 1 этого параграфа), справедливы соотношения (Л5;* = В*Л* = 5Л (5.52) Следовательно, если АВ = ВА, то (АВ)* = АВ, т. е. опера- тор АВ самосопряженный. Если же АВ — самосопряженный оператор, то АВ = (АВ)*, и тогда на основании (5 52) АВ = = ВА. Теорема доказана. В дальнейших теоремах устанавливается ряд важных свойств самосопряженных операторов. Теорема 5.15. Если оператор А самосопряженный, то для любого л £ V скалярное произведение (Ал, л) —вещественное число. Доказательство. Справедливость утверждения тео- ремы вытекает из следующего свойства скалярного произведения


5 5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 129 в комплексном евклидовом пространстве (Ах, х) = (х, Ах) и определения самосопряженного оператора (Ах, х) = (х, Ах) *). Теорема 5.16. Собственные значения самосопряженного опера- тора вещественны. Доказательство. Пусть X — собственное значение са- мосопряженного оператора А. По определению собственного значения оператора А (см. определение 2 § 3 этой главы) существует ненулевой вектор х такой, что Ах = кх. Из этого соотношения следует, что вещественное (в силу теоремы 5.15) скалярное про- изведение (Ах, х) может быть представлено в виде (Лх, х) = К(х, х) = Х|[лс||** ***)). Так как ||х|| и (Ах, х) вещественны, то, очевидно, и X —вещест- венное число. Теорема доказана. В следующей теореме выясняется свойство ортогональности собственных векторов самосопряженного оператора. Теорема 5.17. Если А — самосопряженный оператор, то соб- ственные векторы, отвечающие различным собственным значениям этого оператора, ортогональны. Доказательство. Пусть и — различные собствен- ные значения (Xj Х2) самосопряженного оператора A, a xt и хг —соответственно отвечающие им собственные векторы. Тогда имеют место соотношения Ахг = XjXi, Ахг = кгхг. Поэтому ска- лярные произведения (Axlt х2) и (хп Ахг) соответственно равны следующим выражениям1 (AXi, Х2) = Xj (Xj, Х2), (Xj, Ax2) = А-г ^i> Так как оператор А самосопряженный, то скалярные произве- дения (Лхп хг) и (Xj, Ах2) равны, и поэтому из последних соотно- шений путем вычитания получаем равенство (Х-2 — Xi) (Xj, х2) = 0. Поскольку Х2 Xi, то из последнего равенства следует равен- ство нулю скалярного произведения (Xi,x2), т. е. ортогональность собственных векторов Xi и х2. Теорема доказана. 3. Норма линейного оператора. Пусть А — линейный оператор, отображающий евклидово пространство V в это же пространство. Введем понятие нормы оператора А. *) Напомним, что если комплексное число равно своему сопряженному, то это число — вещественное. **) Напомним, что символ ||х|| обозначает норму элемента х ***) Так как собственные значения самосопряженного оператора веще- ственны, то (Xi, Ахг) = Кг (хъ х2) = Х2 (хх, х2). 5 Зак
130 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Определение 3. Н о р м о й || Л || линейного оператора А назы- вается число, определяемое соотношением *) || Л ||= зирЦЛхЦ. (5.53) IIх 11=1 Из определения нормы линейного оператора вытекает следую- щее очевидное неравенство: ||Лх||<||Л|||И| (5.54) (для доказательства достаточно воспользоваться соотношением Ах = (Л ) ||л||). Из соотношения (5.54) следует, что если || Л || = 0, то оператор Л является нулевым. Норму самосопряженного оператора Л можно определить и другим способом. Именно, справедливо утверждение: Если А — самосопряженный оператор, то введенная выше норма А || оператора А равна sup | (Ах, х) |: II X 11=1 sup | (Ах, х) | = || Л||. (5.55) И1=1 Доказательство. Для любого х из V справедливо неравенство Коши—Буняковского (см. п. 2, § 3, гл. 4) | (Ах, х)| <|Ллг||||х||. Из него и из неравенства (5.54) получаем следующее неравенство: (Ах, х) | < ||Л ИЦхИ2. Поэтому число ц= sup | (Ллс, л)| (5.56) ii*ii=i удовлетворяет соотношению Ц<МП- (5-57) Отметим, что из равенства (Аг, 2) = (Лтр-п, -тАп-')|| z Ц2, ' II II II 2 II / £г=/=0, и определения числа р. (см. (5.56)) вытекает следующее неравенство: \(Az, (5.58) Обратимся теперь к следующему очевидному тождеству: 4 Re (Ах, у) = (Л (х + у), х + у) — (Л (х - у), х — у) *) Напомним, что || Лх|| = 1^(Ах,Ах). Отсюда следует, что || Ах || пред- ставляет собой непрерывную функцию х, которая на замкнутом множестве Ц х || = = 1 достигает конечного наибольшего значения.


5 5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 131 (в этом тождестве символ Re (Ах, у) обозначает действительную часть комплексного числа (Ах, у); само тождество легко вытекает из свойств скалярного произведения, см. п. 1 § 3 гл. 4). Беря левую и правую части этого тождества по модулю, используя свойство модуля суммы и неравенство (5.58), получим следующие соотношения *)• 41 Re (Аж, у) | с М-* + Я2 + М*-Я2 = 2Н(1И12 + ||у1|2)- Отсюда при ||л|| = ||у|| = 1 получаем неравенство |Re(At, у)| < ц. Полагая в этом неравенстве у = Ах!\Ах|| (очевидно, ||у|| = 1) и учитывая, что число (Ах, Ах) — || АхЦ2 является вещественным (поэтому Re (Ах, Ах) = (Ах, Ах)= ||Лл J2), получим ||Лл|1 < р, ||л|| = 1. Отсюда, согласно неравенству (5.53), найдем || А || с р. Для завершения доказательства остается сравнить полученное неравенство с неравенством (5.57) и воспользоваться определением числа р (см. (5.56)). 4. Дальнейшие свойства самосопряженных операторов. В этом пункте мы докажем ряд важных свойств линейных операторов, связанных с понятием нормы. Сначала мы установим необходимое и достаточное условие самосопряженности оператора. Докажем следующую теорему. Теорема 5.18. Для того чтобы линейный оператор А был самосопряженным, необходимо и достаточно, чтобы Im (Ял, л) = 0**). Доказательство. По теореме 5.13 произвольный ли- нейный оператор А может быть представлен в виде А = Ая + iAlt где Ar и Aj —самосопряженные операторы. Поэтому (Ах, х) = (Аях, x)-f-i(A,x, х), причал, согласно теореме 5.15, для любого л числа (ARx, х) и (А,х,х) — вещественные. Следовательно, эти числа соответственно равны действительной и мнимой частям комплексного числа (Ах, л): Re (Ах, х) = (А#х, х), Im (Аж, х) = (А,х, х). Допустим, что А —самосопряженный оператор. *) Мы использовали при этом определение нормы элемента в комплексном евклидовом пространстве. ••) Символ Im (Ах, х) обозначает мнимую часть комплексного числа (Ах, х). Равенство Im (Ах, х) = 0 означает, что число (Ах, х) является вещественным.
132 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 По теореме 5.15 в этом случае (Ах,х) —вещественное число, и поэтому Im (Лх, х) — 0. Необходимость условия теоремы доказана. Докажем достаточность условия теоремы. Пусть Im (Лх, х) — (Л7х, х) = 0. Отсюда следует, что || А, || = 0, т. е. Ai — О. Поэтому А = Лд, где Ля—самосопряженный оператор. Теорема доказана. В следующих утверждениях выясняются некоторые свойства собственных значений самосопряженных операторов. Лемма. Любое собственное значение к произвольного линей- ного самосопряженного оператора А в евклидовом пространстве равно скалярному произведению (Лх, х), где х—некоторый век- тор, удовлетворяющий условию ||х|[ = 1: Х = (Лх, х), ||х||=1. (5.59) Доказательство. Так как X — собственное значение оператора А, то существует такой ненулевой вектор Z, что Az^Xz. (5.60) Полагая х = z/^z\\ (очевидно, ||х|| = 1), перепишем (5.60) следующим образом: Лх= Хх, ||х|| = 1. Отсюда получаем соотно- шения (Лх, х) = X (х, х) = X||х|г = X, т. е. (5.59) имеет место. Лемма доказана. Следствие. Пусть А —самосопряженный оператор и X — любое собственное значение этого оператора. Пусть далее т = inf (Лх, х), М = sup (Лх, х). (5.61) им им Справедливы следующие неравенства: т<Ъ.^М. (5.62) Замечание 1. Так как скалярное произведение (Лх, х) представляет собой непрерывную функцию от х, то на замкнутом множестве ||х|| = 1 эта функция ограничена и достигает своих точных граней т и М. Замечание 2. Согласно теореме 5.16 собственные значе- ния самосопряженного оператора вещественны. Поэтому нера- венства (5.62) имеют смысл. Доказательство следствия. Так как любое собственное значение X удовлетворяет соотношению (5.59), то, очевидно, каждое собственное значение заключено между точными гранями т и М скалярного произведения (Лх, х). Поэтому нера- венства (5.62) справедливы.


ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 133 $ 5] Мы докажем, что числа т и М, определенные соотношениями (5.61) являются соответственно наименьшим и наи- большим собственными значениями самосопряженного опе- ратора А Предварительно убедимся в справедливости следующего утверждения. Теорема 5.19, Пусть А — самосопряженный оператор и, кро- ме того, (Ах, х)^ 0 для любого х. Тогда || А || равна наибольшему собственному значению этого оператора * *). Доказательство Мы уже отмечали (см. утверждение предыдущего пункта), что ||Л|| = sup | (Ах, х) |. Так как (Ах, x)s* 5s 0, то || А || = sup (Ах, х). Согласно замечанию I этого пункта К*11==1 для некоторого х0, ||л0||= 1, (Лл0, х0) = || А || = %. Обращаясь к определению нормы и используя только что написанные равенства, получим соотношения **) || (А - X/) х01|2 = || Ах01|2 - 2Х (Ах0, х0) + X21| х01|2 = = ||Л II2 - 2М1Н|Л|| + ||4||2.1 —0. Таким образом, (А — М) х0 = 0, или иначе Ах0 = Хх0, т. е. X == || А || —собственное значение оператора А. То, что X — наибольшее собственное значение, вытекает из только что установ- ленного следствия из леммы этого пункта. Теорема доказана. Докажем теперь, что числа т и М (см. (5 61)) являются наимень- шим и наибольшим собственными значениями самосопряженного оператора А. Теорема 5.20. Пусть А — самосопряженный оператор, а т и М — точные грани (Ах, х) на множестве ||х|| = 1. Эти числа представляют собой наименьшее и наибольшее собственные значе- ния оператора А. Доказательство. Очевидно, достаточно доказать, что числа т и М —собственные значения оператора А. Тогда из неравенств (5.62) сразу же следует, что т и М являются соответ- ственно наименьшим и наибольшим собственными значениями. Докажем сначала, что М —собственное значение. Для этого рассмотрим самосопряженный оператор В = А —ml. Так как (Вх, х) — (Ах, х) — т (х, х) 0, то оператор В удовлетворяет условиям теоремы 5.19 и поэтому *) Так как собственных значений конечное число и они вещественны, то из них можно указать наибольшее * *) Мы также воспользовались равенством || Ах0 |р = || А О2, которое следует из соотношений (| А || = (Лх0, Xq) < У AxQ Ц и || А (| = sup | Ах
134 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 норма |2?| этого оператора равна наибольшему собственному значению. С другой стороны ||В J = sup {Вх, х) — sup (Ах, х) — т = М — т. IWI=1 1М1=1 Таким образом, (М — т) — наибольшее собственное значение оператора В. Следовательно, существует такой ненулевой вектор х0, что Вх0 = (М — т) х0- (5.63) Так как В = А —ml, то Вх0 = Ах0 — т!х0 = Ах0 — тх0. Подставляя это выражение Вх0 в левую часть равенства (5.63), получим после несложных преобразований соотношение Ах0 — = Л4х0- Таким образом, М —собственное значение оператора А. Убедимся теперь, что число т также является собственным значением оператора А. Рассмотрим самосопряженный оператор В — —А. Очевидно, —т = sup {Вх, х). Согласно только что проведенному дока- зательству число —т представляет собой собственное значение оператора В. Так как В = —А, то т будет являться собственным значением оператора А. Теорема доказана. В следующей теореме выясняется важное свойство собственных векторов самосопряженного оператора. Теорема 5.21. У каждого самосопряженного линейного опера- тора А, действующего в п-мерном евклидовом пространстве V существует п линейно независимых попарно ортогональных и единичных собственных векторов. Доказательство. Пусть —максимальное собствен- ное значение оператора А (А* = sup (Ах, х)). Обозначим через ei n*li=i собственный вектор, отвечающий и удовлетворяющий условию ll^ill = 1 (возможность его выбора следует из доказательства леммы этого пункта). Обозначим через Vi (п — 1)-мерное подпространство простран- ства V, ортогональное к е^ Очевидно, —инвариантное под- пространство оператора А (т. е. если х С Vi, то и Ах £ V\). Действительно, пусть х£ Vt (т. е. (х, et) = 0). Тогда*) (Ах, е1) = (х, Aei) = X1(x, ег) = 0. Следовательно, Ах — элемент Vit и поэтому — инвариантное подпространство оператора А. Это дает нам право рассматривать оператор А в подпространстве В этом подпространстве А будет представлять собой самосопряженный оператор. Следова- •) Мы использовали свойство самосопряженности оператора (Ах, е-д = = (х, Agj) и то обстоятельство, что — собственный вектор оператора: Aet —


§ 5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 135 тельно, имеется максимальное собственное значение этого оператора, которое можно найти с помощью соотношения *) Х2 = тах(Лл:, л). 11*11=1 XJlC, Кроме того, можно указать такой вектор ег, е% I &i, ||е2|| — 1, что Ае2 — Х2е2. Обращаясь далее к (п —2)-мерному подпространству V2, ортогональному векторам ех и е2 и повторяя проведенные выше рассуждения, мы построим собственный вектор вз, == 1, ортогональный ei и е2. Рассуждая и далее таким же образом, мы последовательно найдем п взаимно ортогональных собственных векторов ei, е2, .... еп, удовлетворяющих условию ||е(|| = 1, i = 1, 2....п. Замечание 1. Договоримся в дальнейшем нумеровать собственные значения самосопряженного оператора в порядке убывания с учетом повторяющихся, т. е. кратных собственных значений. При этом 7^ 2& 2s ... 2s 7tn и отвечающие им собствен- ные векторы 61, е2...еп можно считать взаимно ортогональными и удовлетворяющими условию Це(|| = 1. Таким образом, (1 при i=/, С]) |q ПрИ /^4.^ Замечание 2. Из рассуждений я доказательстве теоремы 5.21 следует соотношение Xm+1= max Эго соотно- X±eh 'Х' Х> А=1, 2, т . (Ах, х) шение можно также записать в виде Xm+1= max , хА.Ет 1X1 х> где Ет — линейная оболочка векторов ег, ег.......ет. Справед- ливость замечания вытекает из того, что (х, л) = ЦлЦ2, и поэтому (Ах, х) _ I Л х х \ (X, X) “И||х||- IIХе- нричем норма элемента Х''||л|| равна I. Пусть &т —множество всех m-мерных подпространств про- странства К. Справедливо следующее важное минимаксное свойство собственных значений. Теорема 5.22. Пусть А —самосопряженный оператор и 7.lt Х.2> .... —ег0 собственные значения, занумерованные в порядке, указанном в замечании 1. Тогда Xm+l= min max • (5-64) *) Символ ₽ij_e2 обозначает ортогональность векторов ei и е2.
136 ЛИНЕЙНЫЕ ОПЕРАТОРЫ Ггл, 5 Доказательство. Пусть Ет — линейная оболочка собственных векторов еи е2.ет оператора А (см. замечание 1). В силу замечания 2 max х±Ет (Ах, х) (X, X) — ^тп+1‘ Поэтому для доказательства теоремы достаточно убедиться в справедливости соотношения max max <* (Ах, х) (х, х) (5.65) — ^m+l для любого Е £ Перейдем к доказательству соотношения (5.65). Обозначим символом Е± ортогональное дополнение подпро- странства Е (см. п. 3 § 2 гл. 4). Из теоремы 2.10 следует, что раз- мерность Е±- равна п — т. Следовательно, dim Е± + dim Ет+1 = (п — т) + (т + 1) = п + 1 > п. Это означает, в силу теоремы 2.9, что пересечение подпро- странств EL и Ет+1 содержит ненулевой элемент. Итак, существует элемент х такой, что х I Е, ||х|| = 1, х £ Ет+1, т. е. х= У' скек. ~ 4=1 Так как ||х|| = 1 и базис еи ег, ..., ет+1 ортонормированный, то в силу теоремы Пифагора (см. п. 2 § 1 гл. 4) НИ2 = 2 Ыг=1- (5.66) k=l m-f-1 m-f-1 Имеем далее Ах = А S скек — 2 скАек. Поскольку ек —соб- 4=1 4=1 ственные векторы оператора А, то из последних соотношений m-t-l получаем Ах= S ск2.кек. Отсюда и из ортонормированности ек 4=1 следует справедливость соотношения m-4-l \ 2 СаМа» 2 срер) = S |cft|2XA. (5.67) 4=1 р=1 / 4=1 Мы занумеровали собственные значения в порядке убывания с учетом возможной их кратности. Поэтому Xm+1 ХА, k — 1, 2, .... т. Отсюда и из соотношений (5.67) и (5.66) получаем m-Н т4-1 (AXt X) = J] | Ch |2 А-й Kn+l Zj | I* я ^т+1* 6==1


ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 137 § 5] Замечая, что для любого х #= 0 норма элемента х/||х|| равна 1 и ||x|| = 1, а также учитывая, что х I Е, получим (А ТПГ ’ ТППГ) {Ах' л) Хт+1‘ Итак, соотношения (5.65) установлены. Теорема доказана. 5. Спектральное разложение самосопряженных операторов. Теорема Гамильтона—Кэли. Рассмотрим самосопряженный опе- ратор А и собственные значения ... Хп этого опера- тора. При этом е.......................... еп —ортонормированный базис, состоя- щий из собственных векторов, отвечающих {Х(|. Пусть х £ V. Тогда X = s (X, eh) ek (5.68) k=i (см. п. 3 § 2 гл. 4), а так как Ае^ = то с помощью (5.68) получаем Ах = £ Хк (х, eh) eh. (5.69) *>=i Оператор РА, определяемый соотношением Pkx = (x, eh)eh, (5.70) называется проектором на одномерное подпространство, порожденное вектором еА. Из свойств скалярного произведения сразу же следует, что РА —самосопряженный линейный оператор. Отметим следующие важные свойства проекторов: Г. РА = Pk (отсюда следует, что РГ = РА, где т — нату- ральное). 2°. PhP} = 0, где k =£ j. Доказательство этих свойств следует из соотношений (PhPj) x = Ph (Pjx) = РА (x, ej) e, = . . . , f (x, ek) eh при k = /, ~(x, e}) (e}, eh)eh -j Q при Заметим также, что непосредственно из определения (5.70) следует, что РА коммутирует с каждым оператором, который коммутирует с А. Из соотношений (5.68), (5.69) и (5.70) получаем следующие выражения для х и Ах: x^tiPkX, (5.71) *=i Ax^=YilhPhx. (5.72)
138 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 6 п Из равенства (5.71) следует, что оператор 2 является k=i тождественным : г = 2 (5.73) Л=1 Из равенства (5.72) получаем так называемое спектраль- ное разложение самосопряженного опера- тора: A=ihPk. (5.74) k=i Из свойств Г и 2° проекторов и из соотношения (5.74) вытекает следующее выражение для Д2: д2= 2 to.. Очевидно, вообще для любого целого положительного s As = 2 KPk- (5.75) А=1 т Рассмотрим произвольный полином р(Х)—2СЛ‘- По опре- 1 = 1 m делению считают р (А) — 2 ckAk. Обращаясь к соотношению *=1 (5.75), легко получить следующее выражение для р (Д): р (Д) = 2 р (Xt) Р,. (5.76) 1=1 Докажем следующую теорему. Теорема 5.23 (теорема Гамильтона—Кэли) Если А — самое. iряженный оператор и р (X) = det (Д —X/) —харак- теры мческии многочлен этого оператора, то p(A) = Q. Доказательство. Действительно, если А — само- сопряженный оператор и X — собственные значения этого опера- тора, 1 ->, согласно теореме 5.8, Х( является корнем характеристи- ческое уравнения, т. е р (АД = 0. Отсюда и из соотношения (5.76) следует, что р (Д) — 0. Теорема доказана. 6. Положительные операторы. Корни /n-й степени из опера- тора. Самосопряженный оператор А называется положитель- н ы м, если для любого х из V справедливо соотношение (Ах, х)^0. (5.77)


} 5) ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 139 Если оператор А — положительный и из условия (Ах, х) = О следует, что х = 0, то А называется положительно определенным оператором. Положительные и положительно определенные операторы соответственно обозначаются символами А 0 и А >0. Отметим следующее простое утверждение. Каждое собственное значение положительного (положительно определенного) оператора неотрицательно (положительно). Это утверждение следует из простых рассуждений. Пусть А —собственное значение оператора А. Тогда, согласно лемме п. 4 этого параграфа, можно указать такой элемент х, || л || = 1, что А = (Ах, х). Отсюда и из соотношения (5.77) получаем, что А 0 для положительных операторов и А > 0 для положительно определен- ных операторов. Утверждение доказано. Введем понятие корня т-й степени (т — натуральное число) из оператора. Определение. Корнем т-й степени из оператора А назы- вается оператор В такой, что Вт = А. Корень т-й степени из оператора А обозначается символом А1/т. Естественно выделить какой-либо класс операторов, для ко- торых имела бы смысл операция нахождения корня т-й степени. Определенный ответ на этот вопрос дается следующей теоремой. Теорема 5.24. Пусть А — положительный самосопряженный оператор, А 0. Тогда для любого натурального т существует положительный самосопряженный оператор А1/т, А!/т 0. Доказательство. Обозначим через Ал — собствен- ные значения оператора А, и пусть —ортонормированный базис из собственных векторов. Обозначим далее через — про- ектор на одномерное подпространство, порожденное вектором Согласно предыдущему пункту имеет место спектральное разложение (5.74) самосопряженного оператора А: А = S КРк- (5.74) *=i Так как Aft 0 (см. только что доказанное утверждение), то можно ввести следующий самосопряженный оператор В: B^Yt^Pk. (5.78) Ь=1 Согласно (5.70) справедливо соотношение (Ркх, х)>0, из которого следует положительность операторов Pk и положи- тельность оператора В (см. (5.78)).
140 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Из свойств Г и 2° проекторов Рк (см. п. 5 этого параграфа) п вытекает, что Вт = £ Сравнивая это выражение для Вт *=i с выражением (5.74) для А, получим Вт = А. Выше была уста- новлена положительность оператора В. Теорема доказана. Замечание 1. Отметим без доказательства, что сущест- вует единственный положительный оператор Л!/т. Замечание 2. В ортонормированном базисе собствен- ных векторов оператора А матрица оператора А1/т имеет следу- ющий вид: (1}/т о ... о \ о Ц/т ... 01 о о ... лут/ § 6. Приведение квадратичной формы к сумме квадратов В этом параграфе мы изучим вопрос о выборе такого базиса, в котором квадратичная форма (инвариантная квадратичная функция координат вектора; точно это понятие определяется ниже) имеет наиболее простой вид. Квадратичные формы подробно изучаются в главе 7. Там будут, в частности, рассмотрены различные способы приведения таких форм к сумме квадратов. Введем понятие так называемых эрмитовых форм. Определение. Полуторалинейная форма В (х, у) называется эрмитовой, если для любых х и у справедливо соотноше- ние В(х, у) = В(х, у). (5.79) Согласно следствию из теоремы 5.11 любая полуторалинейная форма В (х, у) (в том числе и эрмитова) может быть единственным образом представлена в виде В(х, у) = (Лл, у), (5.80) где Л —линейный оператор. Докажем следующие два утверждения, в которых выясняются условия, при которых полуторалинейная форма является эрми- товой. Теорема 5,25. Для того чтобы полуторалинейная форма В (х, у) являлась эрмитовой, необходимо и достаточно, чтобы оператор А в представлении (5.80) этой формы был самосопря- женным (Л = Л*).


§ 6] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 141 Доказательство. Действительно, если А — самосо- пряженный оператор, то, используя свойства скалярного произ- ведения, получим В (х, у) — (Ах, у) = (х, Ау) = (Ау, х) = В (у, х). Таким образом, выполнено соотношение (5.79), т. е. форма В (х, у) = (Ах, у) является эрмитовой. Если же форма В (х, у) — (Ах, у) эрмитова, то, опять обра- щаясь к свойствам скалярного произведения, получим равенства (Ах, у) = В (х, у) = В (у, х) = (Ау, х) = (Л, Ау). Таким образом, (Ах, у) = (х, Лу), т. е. оператор А явля- ется самосопряженным. Теорема доказана. Теорема 5.26. Для того чтобы полуторалинейная форма В (х, у) была эрмитовой, необходимо и достаточно, чтобы функ- ция В (х, х) была вещественной. Доказательство. Форма В (х, у) будет эрмитовой в том и только в том случае, когда линейный оператор А в пред- ставлении (5.80) этой формы является самосопряженным (см. теорему 5.25). Согласно же теореме 5.18, для того чтобы опера- тор А был самосопряженным, необходимо и достаточно, чтобы для любого х скалярное произведение (Ах, х) было вещественным. Теорема доказана. Введем теперь понятие квадратичной формы. 1усть В (х, у) — эрмитова форма. Квад ратичной формой, соответствующей форме В (х, у), называется функция В (х, X). Докажем следующую теорему о приведении квадратичной формы к сумме квадратов. Теорема 5.27. Пусть В (х, у) —эрмитова форма, опреде- ленная на всевозможных векторах х и у п-мерного евклидова про- странства V. Тогда в этом пространстве существует такой ор- тонормированный базис {еА} и можно указать такие веществен- ные числа что для любого х, принадлежащего V, квадратичная форма В (х, х) может быть представлена в виде следующей суммы квадратов координат вектора х в базисе {eh|: В(х, *)=SM&d’. Л-1 (5.81) Доказательство. Так как форма В (х, у) эрмитова, то, согласно теореме 5.25, существует самосопряженный опера- тор А такой, что В(х, у) = (Лл, у). (5.82)
142 ЛИНЕЙНЫЕ операторы [ГЛ. 5 Обратимся теперь к теореме 5.21. По этой теореме для опера- тора А можно указать ортонормированный базис из собствен- ных векторов этого оператора. Если —собственные значения A, a —координаты вектора л в базисе так что п (5.83) Л=1 то, используя формулу (5.12) и соотношение Аек = *), получим следующее выражение для Ал: п Ал=% (5.84) *=! Из (5.83), (5.84) и ортонормированности базиса получим следующее выражение для (Ал, х): (Ал, x)=S*fc|Ma. Из этого выражения и из соотношения (5.82) получим (5.81). Теорема доказана. Докажем теперь важную теорему об одновременном приведе- нии двух квадратичных форм к сумме квадратов. Теорема 5.28. Пусть А (л, у) и В (л, у) —эрмитовы формы, определенные на всевозможных векторах л и у п-мерного линейного пространства V. Допустим, далее что для всех ненуле- вых элементов л из V имеет место неравенство В (л, л) > 0. Тогда в пространстве V можно указать базис такой, что квадратичные формы А(л, х) и В (л, л) могут быть представ- лены в следующем виде: А (л, x)=SAft|gft|2, (5.85) В (л, x)==S|£fc|\ (5.86) Л»! где — вещественные числа, а —координаты вектора л в базисе Доказательство. Так как свойства скалярного про- изведения и свойства эрмитовой формы В (л, у) при дополнитель- ном требовании о том, что В (л, х) > 0 при л =/= 0, форму- лируются одинаково, мы можем ввести в линейном про- странстве V скалярное произведение (л, у} векторов, полагая (л, у) = В(л, у). (5.87) *) Это соотношение следует из Того, что Хд и ek — соответственно собствен- ные значения и собственные векторы оператора А.


j 7] УНИТАРНЫЕ И НОРМАЛЬНЫЕ ОПЕРАТОРЫ ЦЗ Таким образом, V представляет собой евклидово пространство со скалярным произведением (5.87). По теореме 5.27 можно указать в V такой ортонормированный базис и такие вещественные числа Хй, что в этом базисе квадратичная форма А (х, х) будет представлена в виде (5.85). С другой стороны, в любом ортонормированном базисе ска- лярное произведение (х, х), равное, согласно (5.87), В (х, х), равно сумме квадратов модулей координат вектора х. Таким об- разом, представление В (х, х) в виде (5.86) также обосновано. Теорема доказана. § 7. Унитарные и нормальные операторы В этом параграфе рассматриваются свойства важного класса операторов, действующих в евклидовом пространстве V. Определение 1» Линейный оператор U из L (V, V) называется унитарным., если для любых элементов х и у из V справед- ливо соотношение (Ux, Uy) = (х, у). (5.88) В дальнейшем соотношение (5.88) будем называть условием унитарности оператора. Замечание 1. Из условия (5.88) унитарности оператора следует, что для любого унитарного оператора U справедливо равенство || £/л|| = ||х||. Отметим следующее утверждение. Если X —собственное значение унитарного оператора U, то | X | = 1. Действительно, если X —собственное значение U, то сущест- вует такой элемент е, что ||е|| = 1 и Ue = Хе. Отсюда и из заме- чания 1 следуют соотношения |Х| = ||Хе|| = ||f7e|| = ||е|| = 1. Утверждение доказано. Докажем следующую теорему. Теорема 5.29. Для того чтобы линейный оператор U, дей- ствующий в евклидовом пространстве V, был унитарным, необ- ходимо и достаточно, чтобы было выполнено соотношение U*=U\ (5.89) Доказательство. 1) Необходимость. Пусть оператор U унитарный, т. е. выполнено условие (5.88). Обращаясь к определению сопряженного оператора U*, можно переписать это условие в следующей форме *) (U*Ux, у) = (х, у), (5.90) *) Напомним, что оператор U* называется сопряженным к оператору U, если для любых z и у выполняется соотношение (г, Uy) = (U*z, у) Полагая я = Ux, получим (5.90).
144 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ 5 или, иначе, для любых х и у выполняется равенство х, у) = 0. Фиксируя в этом равенстве любой элемент х и считая у про- извольным, получим, что линейный оператор U*U —I действует по правилу (U*U — 1} х = О Следовательно, U*U = I. Совершенно аналогично можно убедиться, что UU* = /. Таким образом, U и U* —взаимно обратные операторы, т. е. соотношение (5.89) выполнено. Необходимость условия теоремы доказана. 2) Достаточность. Пусть выполнено условие (5.89). Тогда, очевидно, UU* — U*U — I. Обращаясь к опреде- лению сопряженного оператора и используя только что написан- ные соотношения, получим при любых х и у равенства (Ux, Uy) = (x, U*Uy) = (x, fy) = (x, у). Таким образом, условие (5.88) унитарности оператора выпол- нено. Следовательно, оператор U унитарный. Теорема доказана. Замечание. 2. В процессе доказательства теоремы уста- новлено, что условие (5.88) унитарности оператора U и условие U*U = UU* = I (5.91) эквивалентны. Таким образом, в основу определения унитарного оператора можно положить условие (5.91). Это условие также можно называть условием унитар- ности оператора U. Введем понятие нормального оператора. Определение 2. Линейный оператор А называется нор- мальным, если справедливо соотношение А* А = ЛЛ*. (5.92) Обращаясь к условию (5.91) унитарности оператора и к усло- вию (5.92), мы видим, что любой унитарный оператор является нормальным оператором. Нам понадобится следующее вспомогательное утверждение. Лемма. Пусть А —нормальный оператор. Тогда оператор А и оператор А* имеют общий собственный элемент е такой, что ||е|| = 1, и справедливы соотношения Ае = Хе и Л*е = Хе. Доказательство. Пусть X — собственное значение опе- ратора Л, и пусть RK = кег (Л — X/). Иными словами, RK — множество всех элементов х таких, что Ах — Хх = 0. Убедимся теперь, что если х принадлежит RK, то и А*х при- надлежит RK. Действительно, если Ах = Хх (т. е. х £ R^), то, поскольку Л — нормальный оператор, Л (Л*х) = Л* (Лх) = Л* (Хх) = X (Л*х).


§ 7) УНИТАРНЫЕ И НОРМАЛЬНЫЕ ОПЕРАТОРЫ 145 Иными словами, вектор А*х является собственным вектором оператора А и отвечает собственному значению А, т. е принад- лежит RK. Рассматривая далее оператор А* как оператор, действующий из Rx в RK, и используя вывод следствия из теоремы 5 8 о том, что каждый линейный оператор имеет собственное значение, мы можем утверждать, что в R^ существует элемент е такой, что ||е|| = 1 и справедливы соотношения А*е = ре и Ае = Ае. Используя эти соотношения и условие ||е|| — 1, найдем (Ае, е) = д.е, е) = А|]е||2 = А, (е, А*е) = (е, ре) = й || е |р = й- Так как (Ле, е) = (е, Л*е), то, очевидно, А — р. Лемма до- казана. Докажем теперь следующую теорему. Теорема 5.30. Пусть А —нормальный оператор Тогда существует ортонормированный базис {еД, состоящий из соб- ственных элементов операторов А и А*. Доказательство. Согласно только что доказанной лемме операторы Л и Л* имеют принадлежащий V общий собст- венный элемент еь причем ЦеД = 1. Собственные значения для операторов Л и Л*, соответствующие elt равны соответственно Aj и Ар Пусть Vi —ортогональное дополнение элемента elt д.о про- странства V. Иными словами, —совокупность всех х, удов- летворяющих условию (х, ед = 0. Докажем, что если х принадлежит Vlt то Ах и А*х принад- лежат Ур Действительно, если (х, ед — 0, то (Ах, ед = (х, А*ед = (х, к^д = Ах (х, ед — 0. т. е. Ах £ 1Д. Аналогично, если (х, ед — 0, то (А*х, ед — (х, Аед — (х, A^J = At (х, ед = 0, т. е. А*х £ 1Д. Таким образом, — инвариантное подпространство опера- торов Л и Л*. Поэтому по только что доказанной лемме в под- пространстве 1Д существует общий собственный элемент е2 опе- раторов Л и Л* такой, что ||е2|| = 1, Ае2 = А2е2, Л*е2 = А2е2. Далее мы обозначим через V2 ортогональное дополнение эле- мента е2 до Vp Рассуждая так же, как и выше, мы докажем, что в V2 есть общий собственный элемент е3 операторов Л и Л* такой, что ||е3|| = 1. Продолжая аналогичные рассуждения, мы, очевидно, построим в пространстве V ортонормированный базис {еД, состоящий из собственных элементов операторов Л и Л*. Теорема доказана. Следствие 1. Пусть А —нормальный оператор Существует базис {еД, в котором А имеет диагональную матрицу.
146 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Действительно, по только что доказанной теореме сущест- вует базис {еА} из собственных векторов оператора А. Согласно теореме 5 9 в этом базисе матрица оператора А диагональна. Следствие 2. Унитарный оператор имеет полную орто- нормированную систему собственных векторов. Следующая теорема является обратной для теоремы 5.30. Теорема 5.31. Если у действующего в п-мерном евклидовом пространстве V оператора А имеется п попарно ортогональных собственных элементов е-L, е2, ..., еп, то оператор Анормальный. Доказательство. Пусть {еА| — попарно ортогональ- ные собственные векторы оператора А. Тогда Aek = ХАеА, и, согласно (5 69), имеет место следующее представление опера- тора А* **)). п Ах = Е ЪЛх, ek)ek. А=1 Докажем, что сопряженный оператор А* действует по пра- вилу п Л*у = S Xft(y, ek)ek. (5.93) £=1 Достаточно доказать, что для операторов А и А*, определяемых соотношениями (5.69) и (5.93), справедливо равенство (х, Л*у) = (Ах, у). (5 94) Подставляя в левую часть этого равенства выражение А*у по формуле (5.93), получим после несложных преобразований п п _________ (х, А*у) = Е (•*, ^а (у. eh) eh) = Е h (у, eh) (х, ek) = £=1 k=l п = S (X, ек) (ек, у) = (Ах, у). k=l Таким образом, равенство (5.94) доказано, и поэтому опера- тор А*, действующий по правилу (5.93), является сопряженным к оператору А. Чтобы завершить доказательство теоремы, нужно убедиться в справедливости равенства (5.92): А* А = А А*. Имеем, согласно (5.93) *♦), п АА*х — Е ^а <•*, «а) Аек = А=1 = Е ^а^а (х, ек) ек — Е ^а^а (х, ек) ек = А*Ах. А=1 А=1 *) Представление (5 69) справедливо для любого оператора, имеющего п попарно ортогональных собственных векторов. **) Мы воспользовались так же соотношениями Аек = ^кек.


$ 8J КАНОНИЧЕСКИЙ ВИД ЛИНЕЙНЫХ ОПЕРАТОРОВ 147 Итак, для операторов А и А* справедливо равенство (5 92), и, следовательно, оператор А является нормальным. Теорема дока- зана. § 8. Канонический вид линейных операторов В этом параграфе рассматривается вопрос о выборе для за- данного линейного оператора специального базиса, в котором матрица этого оператора имеет простейший вид, называемый оюордановой формой матрицы. Введем понятие присоединенного элемента оператора А. Определение. Элемент х называется присоединен- ным элементом оператора А, отвечающим собственному значению X, если для некоторого целого т 1 выполняются соотношения (Д —(Д — V)m+* л = 0. При этом число т называется порядком присоеди- ненного элемента х. Иными словами, если х —присоединенный элемент порядка т, то элемент (Д —Х/)т х является собственным вектором опе- ратора А. В этом параграфе мы докажем следующую основную теорему. Теорема 5.32. Пусть А — линейный оператор, действующий в п-мерном евклидовом пространстве V. Существует базис {еГ}, А=1, 2, ..т=1, 2.........ед ni + пг + • • • + Щ — п, (5.95) образованный из собственных и присоединенных векторов опера- тора А, в котором действие оператора А описывается следующими соотношениями: Ael — ’kkel, k=\, 2, . .., I; Ае™ = Kek 4- е™~1, *=1, 2...1\ т = 2, 3, .. ., ед (5.96) Прежде чем перейти к доказательству, сделаем ряд замечаний. Замечание I. Очевидно, векторы el (k — I, 2...../) базиса (5.95) являются собственными векторами оператора А, отвечающими собственным значениям Xft. Из определения присоединенных векторов и соотношений (5.96) следует, что векторы еТ (Ф — 1, 2, .... /; т = 2, 3, ..., пк) являются присоединенными векторами порядка т, отвечающими собственным значениям соответственно.
148 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Замечание 2. Обращаясь к формулам (5.13) и (5.12), мы видим, что соотношения (5.96) действительно определяют дей- ствие оператора А в пространстве V при заданном базисе {е™}- Замечание 3. Матрица А линейного оператора А в ба- зисе {е**} имеет следующий «клеточный» вид: /\ о\ / а2 \ А = | \ , (5.97) \0 * Аг/ где клетка Ак представляет собой следующую матрицу: (Хй 1 о ... о \ О Хд 1 . о \ ............... - (5.98) О О О ... 1 J О 0 0 . . . Xft/ Замечание 4. Форма (5.97) матрицы А линейного опе- ратора А называется жордановой формой мат- рицы этого оператора. При этом клетка Ак обычно называет- ся жордановой клеткой матрицы А. Отметим, что теорему 5.32 о приведении матрицы оператора к простейшему виду (5.97) называют теоремой о приведении матрицы оператора к жордано- вой форме. Замечание 5. Жорданова форма матрицы (5.97) опреде- лена с точностью до порядка расположения клеток Ак по диа- гонали матрицы. Этот порядок зависит от порядка нумерации собственных значений Хй. Мы дадим доказательство теоремы 5.32, предложенное А. Ф. Филипповым *). Доказательство теоремы 5.32. Для доказатель- ства теоремы применим метод индукции. При п = 1 утверждение теоремы очевидно. Пусть п > 1 и теорема верна для пространств размерности меньше п. Докажем, что при этом предложении она верна и для пространств размерности п. Этим и будет завершено доказательство теоремы. Пусть X —собственное значение оператора А. Согласно тео- реме 5.8 это число является корнем характеристического урав- нения det (А — Х7) = 0. Следовательно, ранг г линейного опе- ратора **) В = А - V (5.99) меньше п, т. е. г < п. *) А. Ф. Филиппов. Краткое доказательство теоремы о приведении матрицы к жордановой форме. — Вестник Московского университета, 1971, № 2. **) Напомним, что ранг г линейного оператора В равен размерности 1шв; согласно теореме 5.6 ранг г равен рангу матрицы этого оператора.


$ в] КАНОНИЧЕСКИЙ ВИД ЛИНЕЙНЫХ ОПЕРАТОРОВ 149 Линейный оператор В отображает пространство V на подпро- странство imB. Поэтому оператор В отображает подпространство im В размерности г < п в это же подпространство. По предполо- жению индукции в imB есть базис {Л*}, k=l, 2, р\ т=1, 2, ..., гй; и 4-r2-J- • • • +гр = г, (5.100) в котором действие оператора В из im В в im Я дается следующими соотношениями: Bhk — ^kfik, k= 1, 2.......р, BhT = + йГ1, й=1, 2...........р- т = 2, 3......гк.\ (5Л01) Таким образом, в этом базисе матрица В оператора В, дейст- вующего из im В в im В *), имеет следующий клеточный вид: (-Mi п \ /Нл 1 0 • • • 0 \ Mt U I / О Нй 1 ... о 1 0 •_ , где 51»= .. .. ..... . . (5.102) Мр] \ 0 0 0 ... щ/ Пусть лишь первые тг (tnL 0) собственных значений опера- тора В равны нулю. Так как ранг каждой клетки Mk (см. (5.102)), для которой Ш = 0, равен гк — 1, а ранг клетки, для которой 0, равен rft, _ р то, согласно (5.100), ранг матрицы В равен У! rh —mL = г —mL. k“L Поэтому размерность подпространства кег В равна **) и кегВ представляет собой линейную оболочку векторов й’, йг, ... .... йт,. Эти векторы в силу_ линейной независимости образуют базис в кег 2?. Очевидно, кег В с: кег В. Дополним базис й', й2, ... ..., h'm, в кег В до базиса в кег В векторами k — 1, 2, ..., т0, то — п—г—тх (размерность кег В по теореме 5.1 равна п — dim im В, т. е. равна п — г). Так как gh £ kerB, то Bgft = 0. (5.103) *) Символом В мы будем обозначать оператор В, действующий из im В в im В. **) Ранг матрицы В равен dim imB. Согласно теореме 5.1 dim im В 4- -|- dim кег В — г. Следовательно, dim кег В— mt.
150 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Обратимся теперь к векторам Л?, k = 1, 2, /п^ Поскольку эти векторы принадлежат im В, то существуют такие векторы Л € V, «то Bfk=hk\ k=\, 2, .... mi. (5.104) Докажем теперь, что векторы 2, ..., р-, /и = 1, 2, ...» г*), 1 gh(k^\, 2, .... т0), fh(k=\, 2, . . mj) J линейно независимы. Рассмотрим следующую равную нулю линейную комбина- цию fэтих векторов: /= S Е «ый* + Е ₽*gr* + S 4kfk=0. (5.106) ft=l m=1 Л=1 Л=1 Рассмотрим действие оператора В на этот элемент f. Получим согласно (5.101), (5.103) и (5.104), следующее вы- ражение Bf = Е + Е Е akm {pkh’k + Л* ') + S ythk1 = о. Л=1 fe=l m=2 fc=l (5.107) Соотношение (5.107) представляет собой равную нулю линей- ную комбинацию базисных векторов {й*1}; поэтому коэффициенты при этих векторах в указанной линейной комбинации равны нулю. Поскольку p.ft = 0 при k < т1, то из (5.107) следует, что коэффициенты при hk в точности равны у*, и поэтому у* = 0. Отсюда и из соотношения (5.106) получаем равенства g = Е fog* = - Е S (5.108) £=1 £==! т=1 из которых следует, что вектор g, представляющий собой линей- ную комбинацию векторов {£&}, принадлежит кег В (напомним, что векторы составляют часть базиса в ker В), С другой стороны, из (5.108) вытекает, что g представляет собой линейную комбинацию векторов Л“, т. е. принадлежит im/?. Следовательно, g принадлежит ker В (напомним, что ker В тх есть пересечение im Й и кег В), и поэтому g — Е


$ 91 ЛИНЕЙНЫЕ ОПЕРАТОРЫ 151 Так как линейные оболочки наборов векторов } и |й*) имеют общим лишь нулевой элемент (эти наборы вместе обра- зуют базис в ker/?) и, как мы установили, g принадлежит каждой из упомянутых линейных оболочек, то g — 0. Но тогда из (5.108) следует, что = 0 (й = 1, 2.........т0) и akm = 0 (k — 1, 2, ... ..., р; т = 1, 2, .... rh). Итак, все коэффициенты в линейной комбинации (5.106) век- торов (5.105) равны нулю, т. е. векторы (5.105) линейно незави- симы. Общее число векторов (5.105) равно г + т0 + тх. Так как то = п — г — тг (это было установлено выше в доказательстве при введении векторов gh), то общее число векторов (5.105) рав- но п и поэтому они образуют базис в V. Обозначим Л = й?+* (5.109) и запишем векторы этого базиса в следующей последовательности серий: {^1; • • •; te-nJ; {й!.....л?, л?+1!, й=1, 2...........тг, {й!.....й?}, k — mi + 1, . . ., р. (5.110) Рассмотрим действие оператора В на векторы базиса (5.110) в пространстве V. Обращаясь к соотношениям (5.101), (5.103), (5.104) и (5.109), убедимся, что действие В в базисе (5.110) дается соотношениями Bgh = 0, k ~ 1, 2, . . ., то, ВНь'+‘ == hk, k—\, 2, .... n и соотношениями (5 101). Итак, в базисе (5.110) оператор В — А —г.1 действует э правилу (5.96), указанному в формулировке теоремы 5. Но тогда в этом базисе и оператор А — В X/ действует .ю этому же правилу. Теорема доказана. § 9. Линейные операторы в вещественном евклидовом пространстве В этом параграфе ' и покажем, каким образом определения и результаты предыду их параграфов переносятся на случай вещественных евклидо>. пространств. 1. Общие замечания. Рассмотрим произвольное n-мерное ве- щественное евклидово пространство V и оператор А, действующий из V в V. Понятие линейного оператора для случая вещественного ли- нейного пространства формулируется в полной аналогии с соот- ветствующим понятием для комплексного пространства.
152 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Определение 1. Оператор А называется линейным, если для любых элементов x£Vuy£Vu любых вещественных чи- сел а и Р выполняется равенство А (ах + = ссАх -}-(5.111) В полной аналогии с комплексным пространством вводится понятие собственного значения и собственного вектора оператора. Важно заметить, что собственные значения являются кор- нями характеристического уравнения оператора. Обратное утверждение в вещественном случае верно лишь тогда, когда соответствующий корень характеристического урав- нения вещественный. Только в этом случае указанный корень бу- дет собственным значением рассматриваемого линейного оператора. В связи с этим естественно выделить какой-либо класс ли- нейных операторов в вещественном евклидовом пространстве, все корни характеристических уравнений которых вещественны. В доказанной выше теореме 5.16 было установлено, что все собственные значения самосопряженного оператора вещественны. Кроме того, понятие самосопряженного оператора играло важ- ную роль в выводах § 6 настоящей главы о квадратичных фор- мах. Естественно поэтому перенести понятие самосопряженного оператора на случай вещественного пространства. Предварительно введем понятие оператора А*, сопряженного к оператору А. Именно, оператор Л* называется сопряженным к А, если для любых х и у из V выполняется равенство (Ах, у) = = (х, Л*у). Без затруднений на случай вещественного пространства пере- носится теорема 5.12 о существовании и единственности сопря- женного оператора. Напомним, что доказательство теоремы 5.12 опирается на по- нятие полуторалинейной формы. В вещественном случае вместо полуторалинейной формы следует воспользоваться билинейной формой В (х, у). По этому поводу в п. 2 § 4 гл. 5 сделано соответствующее замечание. Напомним в связи с этим определение билинейной формы в любом вещественном не обязательно евклидовом линейном пространстве L. Пусть В — функция, сопоставляющая каждой упорядоченной паре (х,у) векторов х £ L и у £ L вещественное число В (х, у). Определение 2. Функция В (х, у) называется билиней- ной формой, заданной на L, если для любых векторов х, у и z из L и любого вещественного числа X выполняются соотношения B(x + z, у) = В(х, y) + B(z, у), В(х, y + z) = B(x, у) + В(х, z), В(Кх, у) = В(х, Ку) = КВ(х, у). (5.112)


5 9] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 153 Важную роль в данном параграфе будет играть специальное представление билинейной формы В (х, у) в виде В(х, у) —(Ах, у), (5.113) где Л—некоторый линейный оператор. Соответствующая теорема (теорема 5.11) об аналогичном представлении полуторалинейной формы в комплексном пространстве опиралась на выводы леммы п. 1 § 4 настоящей главы о специальном представлении линейной формы f (л). В конце указанного пункта отмечалось, что эта лемма верна и в вещественном пространстве. Заметим только, что в доказательстве леммы выбор элементов hk нужно произво- дить не по формуле (5.41), а с помощью формулы hk — f (ек), где / (х) — данная линейная форма в вещественном пространстве. В § 6 настоящей главы были введены эрмитовы формы. Эрми- това форма —это полуторалинейная форма В (х,у) в комплекс- ном пространстве, характеризующаяся соотношением В (х, у) = = В (у, х) (черта над В означает, что берется комплексно сопря- женное значение для В). В случае вещественного пространства аналогом эрмитовых форм служат симметричные билинейные формы. Такая форма характеризуется соотношением В(х, у) —В (у, х). (5.114) Билинейная форма В (х, у), заданная на линейном простран- стве L, называется кососимметричной, если для любых векторов х и у из L выполняется соотношение В (х, у) = —В (у, х). Очевидно, что для каждой билинейной формы функции Bi (X, y)=-L[B (х, у) 4- В (у, х)], Вг(Х, y)=-i-[B(x, у) — В (у, л)] являются соответственно симметричной и кососимметричной би- линейными формами. Поскольку В (х, у) = Вк (х, у) + Вг (х,у), то мы получаем следующее утверждение: Любую билинейную форму можно представить в виде суммы симметричной и кососимметричной билинейной формы. Нетрудно видеть, что такое представление является единствен- ным. Мы докажем следующую теорему о симметричных билиней- ных формах (эта теорема служит аналогом теоремы 5.25 об эрми- товых формах). Теорема 6,33. Для того чтобы билинейная форма В (х, у), заданная на всевозможных векторах х и у вещественного евкли- дова пространства V, была симметричной, необходимо и доста- точно, чтобы линейный оператор А, фигурирующий в представ- лении (5.113), был самосопряженным.
154 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Доказательство. Если А — самосопряженный опе- ратор, то, используя свойства скалярного произведения, получим В (л?, у) = (Лх, у) = (х, Ау) = (Ау, х) = В(у, х). Таким образом, выполняется соотношение (5.114), т. е. би- линейная форма В (х, у) ~ (Ах, у) симметричная. Если же форма В (х, у) = (Ах, у) симметричная, то спра- ведливы соотношения (Ах, у) = В (х, у) = В (у, х) = = (Ау, х). Следовательно, оператор А самосопряженный. Теорема до- казана. Введем понятие матрицы линейного оператора А. Пусть еи е2, .... еп —какой-либо базис в n-мерном вещественном линей- п ном пространстве L. Положим Ле* — S alkei. 1=1 Тогда, как и в комплексном случае, нетрудно показать, что п если х— S xkek, то для компонент вектора у — Ах справед- п либо представление у1 = J] a*xft. *=i Матрица А = (а£) называется матрицей линейного опера- тора А в базисе Аналогично тому, как это было сделано в § 2 настоящей главы, можно доказать, что величина det А не зависит от выбора базиса и, тем самым, корректно вводится определитель det Л опе- ратора А. Характеристическим уравнением, отвечающим оператору Л, называется уравнение det (Л — X/) = 0, а многочлен, стоящий в левой части этого уравнения, называется характеристическим многочленом оператора А. Докажем теперь теорему о корнях характеристического много- члена самосопряженного оператора в вещественном евклидовом пространстве. Теорема 5.34. Все корни характеристического многочлена самосопряженного линейного оператора А в евклидовом простран- стве вещественны. Доказательство. Пусть X — а + Ф — корень ха- рактеристического уравнения det(A-M) = 0 (5.115) самосопряженного оператора Л. Фиксируем в V какой-либо базис и обозначим через ajh —элементы матрицы оператора Л в этом базисе (отметим, что ал — вещественные числа).


ЛИНЕЙНЫЕ ОПЕРАТОРЫ 155 5 9J Будем искать ненулевое решение следующей системы линейных однородных уравнений относительно £2, Ьп- = / = 1. 2......П, (5.116) где X = а 4- i'P. Так как определитель системы (5.116) равен det (Л —X/) (напомним, что определитель матрицы линейного преобразова- ния не зависит от выбора базиса и, согласно (5.115), этот определи- тель равен нулю), то система (5.116) однородных линейных урав- нений имеет ненулевое решение = xft + iyk, k — 1, 2, n. Подставляя это решение в правую и левую части системы (5.116), учитывая при этом, что А = а 4- ip и отделяя затем ве- щественную и мнимую части полученных соотношений, найдем, что наборы (хь х2, ..., хп) и (ylt у2, ..., уп) вещественных чи- сел *) удовлетворяют следующей системе уравнений: п S а)кхк = ах} — $у}, k=l п S ajhyk = ay) + pxj, / = 1, 2, . . ., п. (5.117) Рассмотрим в данном базисе elt е2, .... еп векторы х и у с координатами (хь х2, .... хп) и (ylt у2 уп) соответственно. Тогда соотношения (5.117) можно переписать в виде Ах = ал — Ру, Ау = ау 4- рл. Умножим первое из полученных соотношений скалярно на у, а второе — на х. Очевидно, получим равенства (Ах, у) = а(х, у)-Р(у, у), 1 (х, Ау) = а (х, у) + р (х, х). / ' Так как оператор А самосопряженный, то (Ах, у) = (л, Ау). Поэтому путем вычитания соотношений (5.118) получим равенство Р [(л, х) + (у, у)] = 0. Но (х, х) 4- (у, у) =£ 0 (если (х, х) + (у, у) = 0, то хк = 0 и ук = 0, k = 1, 2, ..., п; следовательно, решение = хк + iyh было бы нулевым, тогда как по построению это решение ненуле- вое). Поэтому р = 0, а так, как р —мнимая часть корня А, = = а 4- г'Р характеристического уравнения (5.115), то, очевидно, А — вещественное число. Теорема доказана. *) Напомним, что не все эти числа равны нулю.
156 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Как и в комплексном случае, для самосопряженного опера- тора справедливо утверждение о существовании ортонормиро- ванного базиса, состоящего из собственных векторов этого опе- ратора (аналог теоремы 5.21). Докажем это утверждение. Теорема 5.35. У каждого самосопряженного линейного опе- ратора А, действующего в п-мерном вещественном евклидовом пространстве V, существует ортонормированный базис из соб- ственных векторов. Доказательство. Пусть — вещественное собствен- ное значение оператора А, а —единичный собственный вектор, отвечающий этому собственному значению (8^11 = 1). Обозначим через (п — 1)-мерное подпространство про- странства V, ортогональное к е^ Очевидно, — инвариантное подпространство пространства V (т. е. если то Ах £ VJ. Действительно, пусть х£ тогда (х, ег) = 0. Поскольку опе- ратор Л самосопряженный и —собственное значение А, по- лучим (Ах, ej = (х, AeJ = (х, ej = 0. Следовательно, Ах £ Vlt и поэтому — инвариантное под- пространство оператора А. Поэтому, мы можем рассматривать оператор А в подпространстве Ясно, что в Vx оператор А будет самосопряженным По теореме 5.34 у оператора А, действующего в Vi, имеется вещественное собственное значение Х2, которому отвечает собственный вектор ег С Vi оператора А, удовлетворя- ющий условию ||е2|| — 1. Обращаясь далее к (п — 2)-мерному подпространству V2, ортогональному векторам ег и е2 и повторяя только что опи- санные рассуждения, мы построим собственный вектор е3 опе- ратора А, ортогональный векторам ег и е2 и удовлетворяю- щий условию ||е3|| = 1. Рассуждая и дальше таким же образом, мы в результате найдем п взаимно ортогональных собственных векторов elt .. .... еп оператора А, удовлетворяющих условию — 1, k — = 1, 2, ..., п. Очевидно, векторы образуют базис в V. Теорема доказана. Замечание. Пусть elt е2, ..., еп —ортонормированный базис в n-мерном евклидовом пространстве V, состоящий из собственных векторов самосопряженного оператора А, т. е. Aeh = Тогда матрица оператора А в базисе является диагональной, причем диагональные элементы имеют вид а* = Xk. Отметим, что если — произвольный ортонормированный базис в вещественном евклидовом пространстве V, то матрица самосопряженного оператора А будет симметричной, т. е. А' = — А. Верно и обратное утверждение, т. е. если в некотором орто- нормированном базисе матрица оператора является симмет- ричной, то оператор А — самосопряженный.


г J 9] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 157 Этим вещественный случай отличается от комплексного, по- скольку в комплексном случае оператор А является самосопря- женным тогда и только тогда, когда матрица А этого оператора в ортонормированном базисе является эрмитовой, т. е. элементы матрицы А удовлетворяют условию а‘к = а* (черта озна- чает комплексное сопряжение). Указанное утверждение непосредственно следует из того, что если (а1ь) —матрица оператора А, то матрица сопряженного оператора в вещественном случае равна (а*), а в комплексном случае — (а*), что легко проверяется прямым вычислением. 2. Ортогональные операторы. В комплексном евклидовом пространстве важную роль играют унитарные операторы, вве- денные в § 7. Аналогом унитарных операторов в вещественном евклидовом пространстве являются ортогональные операторы. Определение 1, Линейный оператор Р, действующий в ве- щественном евклидовом пространстве V, называется орто- гональным, если для любых х и у из V выполняется ра- венство (Рх, Ру) = (х, у). (5.119) Таким образом, ортогональный оператор сохраняет скаляр- ное произведение. Отсюда непосредственно следует, что если elt е2, ..., еп —ортонормированный базис евклидова простран- ства V, то Рех, Рег, ..., Реп также является отронормирован- ным базисом. В дальнейшем условие (5.119) будем называть условием ортогональности оператора Р. Справедливо следующее утверждение. Теорема 5.36. Для того чтобы линейный оператор Р был ортогональным, необходимо и достаточно, чтобы существовал оператор Р~1 и было выполнено равенство Р* = Р1, (5.120) где Р* —оператор, сопряженный к Р, а Р'1 —оператор, об- ратный к Р. Доказательство. 1) Необходимость. Пусть Р —ортогональный оператор, т. е. выполняется условие (5.119). Применяя сопряженный оператор Р*, это условие можно записать в виде (Р*Рх, у) = (х, у). Таким образом, для любых х и у выполняется равенство ((Р*Р —/) х. у) =0. Фиксируя в этом равенстве любой элемент х, считая у про- извольным, получим, что линейный оператор Р*Р —I действует по правилу (Р*Р —I) х = 0. Следовательно, Р*Р = /; совершенно аналогично можно убе- диться, что РР* — /. Таким образом, операторы Р* и Р вза- имно обратны, т. е. условие (5.120) выполнено.
158 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 2) Достаточность. .Пусть выполнено условие (5.120). Тогда, очевидно, РР* — Р*Р = Z. Обращаясь к определению сопряженного оператора и исполь- зуя только что написанные соотношения, получим для любых л и у равенства (Рл, Ру) = (л, Р* Ру) = (л, fy) = (л, у). Мы видим, что условие (5.119) выполнено, следовательно, оператор Р ортогональный. Теорема доказана. Введем теперь понятие ортогональной матрицы Р. Определение 2. Матрица Р называется ортогональной, если Р'Р = РР' = 1, (5.121) где Р' —транспонированная матрица, а I —единичная ма- трица. Если е1( ег....еп —ортонормированный базис в евклидо- вом пространстве V, то оператор Р является ортогональным тогда и только тогда, когда его матрица в базисе {eh} ортогональна. Непосредственно из равенства (5.121) следует, что если мат- рица Р = (р*) является ортогональной, то V *il 1 ПРИ А = fe\PtPi (0 при &=/=/. В комплексном евклидовом пространстве аналогом ортого- нальной матрицы является унитарная матрица. Именно, матри- ца U называется унитарной, если выполняется соотношение U*U = UU* = l, (5.122) в котором U* —эрмитово сопряженная матрица, т. е. U* = U', где штрих означает транспонирование, а черта —комплексное сопряжение. Нетрудно показать, что в ортонормированном базисе матрица линейного оператора U является унитарной тогда и только тогда, когда оператор U является унитарным. В заключение рассмотрим для примера ортогональные преоб- разования в одномерном и двумерном пространствах. В одномерном случае каждый вектор л имеет вид л = ае, где а —вещественное число, и е —вектор, порождающий данное пространство. Тогда Ре = ке, и так как (Ре, Ре) — X2 (е, е) = = (е, е), то X = ±1. Таким образом, в одномерном случае существуют два орто- гональных преобразования: Р+л = л и Р_л = —л. В двумерном случае каждое ортогональное преобразование определяется в произвольном ортонормированном базисе орто- /а b \ тональной матрицей порвдка 2, т. е. матрицей Р — I d ). Из ус- ловия РР' — Р'Р = [ следует cP + Ьг = 1, cP = dP, Ьг — с2, ас + db = 0, ab + cd — 0.


§ 9] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 159 Полагая а = cos <р, b = —sin ф, получаем, что каждая ортого- нальная матрица порядка 2 имеет вид р ___/ cosqp— sin <р\ ± \±sin <р ± cos <р / ’ причем во второй строке в обоих случаях следует брать либо знак +, либо знак —. Отметим, что det Р+ = ±1. Ортогональная матрица Р+ назы- вается собственной, а ортогональная матрица Р_ —несобствен- ной. Оператор Р+ с матрицей Р+ в ортонормированном базисе Ci, е2 осуществляет поворот в плоскости elt е2 на угол ф Для того чтобы выяснить, как действует оператор Р_ с мат- /1 рицей Р_, введем матрицу Q = i0 совпадающую с Р_ при <р = 0, и заметим, что Р_ = QP+. Матрице Q отвечает отражение плоскости относительно оси е1( следовательно, действие операто- тора Р_ заключается в повороте на угол ф и последующем от- ражении. Заметим, что векторы Р+в1, Р+е2 образуют в силу ортого- нальности А, ортонормированный базис и в этом базисе матрица оператора Р_ совпадает с Q, т. е. является диагональной. В общем случае, когда ортогональный оператор Р действует в n-мерном евклидовом пространстве, существует ортонормиро- ванный базисе!, ег, в котором матрица оператора Р имеет вид 1 1 О —1 -1 COS ф! — sin Ф1 8Шф1 — СОБфх О COS фА~ sin sin фА — COS фА В этой матрице все элементы, кроме выписанных, равны нулю. Таким образом, в некотором ортонормированном базисе дей- ствие ортогонального оператора сводится к последовательным поворотам и отражениям относительно координатных осей.
ГЛАВА 6 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ И ЗАДАЧ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ В настоящей главе изучаются различные методы решения системы линейных уравнений с вещественными коэффициентами относительно неизвестных, также принимающих вещественные значения. Все используемые на практике методы решения систем ли- нейных уравнений можно разделить на две большие группы: точные методы и итерационные методы. Под точным методом решения понимается метод, теорети- чески позволяющий получить точные значения неизвестных в результате проведения конечного числа арифметических операций. Примером точного метода может служить изложенный в главе 3 метод, основанный на применении формул Крамера *). Итерационные методы позволяют получить искомое решение лишь в виде предела последовательности векторов, по- строение которых производится с помощью единообразного про- цесса, называемого процессом итераций (последовательных при- ближений). Итерационные методы весьма удобны для использо- вания современной вычислительной техники. Изложению наиболее употребительных итерационных методов решения линейных систем посвящен § 1 настоящей главы. Итерационные методы находят широкое применение и при решении другой важной вычислительной задачи линейной ал- гебры — так называемой полной проблемы соб- ственных значений (так называют проблему отыска- ния всех собственных значений и отвечающих им собственных векторов заданной матрицы **)). В итерационных методах соб- *) Практически метод, основанный на формулах Крамера, обычно не при- меняется, ибо он требует проведения очень большого числа арифметических операций и записей. Более удобным является точный метод, основанный на по- следовательном исключении неизвестных и называемый методом Гаусса (его изложение можно найти, например, в книге Д. К. Фаддеева и В. Н. Фад- деевой «Вычислительные методы линейной алгебры», Гостехиздат, 1963, гл. 2). **) В отличие от этой проблемы, задачу отыскания некоторых (например, наибольших по модулю) собственных значений заданной матрицы называют частичной проблемой собственных значений.


§ 1] ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 161 ственные значения вычисляются как пределы некоторых число- вых последовательностей без предварительного определения коэф- фициентов характеристического многочлена. В § 2 настоящей главы разбирается один из самых важных и наиболее употребительных на ЭВМ итерационных методов ре- шения полной проблемы собственных значений —так называе- мый метод вращений (или метод Якоби). Этот метод применим ко всякой симметричной (или к эрмитовой) матрице, легко реализуется на ЭВМ и всегда сходится. Он устойчив по отношению к ошибкам округления результатов промежуточных вычислений и обладает тем замечательным свойством, что на- личие кратных и близких друг к другу собственных значений не только не замедляет его сходимости, а, напротив, ускоряет ее. Метод вращений, предложенный Якоби и известный еще с сере- дины прошлого века, долгое время не находил практического применения из-за большого объема вычислений, необходимых для его реализации. И лишь появление быстродействующих электрон- ных вычислительных машин сделало его самым эффективным ме- тодом решения полной проблемы собственных значений симметрич- ных и эрмитовых матриц. § 1. Итерационные методы решения линейных систем 1. Метод простой итерации (метод Якоби). Рассмотрим ква- дратную систему линейных уравнений с вещественными коэффи- циентами (3.10) (см. п. 1 § 2 гл. 3), которую запишем в матричном виде АХ — F, (6.1) понимая под А основную матрицу системы аН а12 • • • а1п а21 а22 ... о2л Ощ Оп2 • • • апп а под X и F векторы-столбцы вида X = пер- вый из которых подлежит определению, а второй задан. Предполагая однозначную разрешимость системы (6.1), заме- ним матричное уравнение (6.1) эквивалентным ему матричным уравнением X = X —хАХ + xF, в котором через т обозначено вещественное число, обычно называемое стационарным параметром. 6 Зак 459
162 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 С помощью этого последнего уравнения составим итерацион- ную последовательность векторов {Хй|, определив ее рекуррент- ным соотношением Хм = Хъ-хАХк + тР Ml,...) (6.3) при произвольном выборе «нулевого» приближения Хо. Метод простой итерации заключается в замене точного реше- ния X системы (6.1) £-й итерацией Хк с достаточно большим номером k. Оценим погрешность Zk — Хк — X метода простой итерации. Из соотношений (6.3) и (6.1) сразу же вытекает следующее матричное уравнение для погрешности Zh: 2ft+1 = (£-TA)Zft, (6.4) где Е —единичная матрица порядка п. Введем в рассмотрение норму вектора в пространстве Еп и операторную норму квадратной матрицы порядка п. Как обычно, назовем нормой вектора X число ||X||, равное корню квадратному из суммы квадратов координат этого вектора. На- зовем операторной нормой произвольной матрицы А число ||А||, равное либо точной верхней грани отношения || АX ||/|| X || на множестве всех ненулевых векторов X, либо (что то же самое) точной верхней грани норм || АХЦ на множестве всех векторов X, имеющих норму, равную единице. Итак, по определению <м> Напомним, что для любой симметричной матрицы А*) опера- торная норма этой матрицы равна наибольшему по модулю соб- ственному значению этой матрицы (см. п. 4 § 5 гл. 5), т. е. || А ||= max |AS|. (6.6) s Из (6.5) вытекает следующее неравенство, справедливое для любой матрицы А и любого вектора X: || АХ || <|| А || || Х||. (6.7) Из матричного уравнения для погрешности (6.4) и из неравенства (6.7) мы получим, что для любого номера k Иа+1||сН-тА||||2й||. (6.8) Докажем теперь следующую простую, но важную теорему. *) Матрица А называется симметричной, если А = А'.


§ 1] ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 163 Теорема 6.1. Для того чтобы итерационная последователь- ность (6.3) при любом выборе нулевого приближения Хо и при данном значении параметра т сходилась к точному решению X системы (6.1), достаточно, чтобы было выполнено условие р = ||Е - тЛ||< 1. (6.9) При этом последовательность (6.3) сходится со скоростью гео- метрической прогрессии со знаменателем р. В случае, если матрица А является симметричной, условие (6.9) является и необходимым условием сходимости итерацион- ной последовательности (6.3) при любом выборе нулевого прибли- жения Хо. Доказательство. Для установления достаточности условия (6.9) заметим, что из неравенства (6.8) вытекает следую- щее соотношение: ||Zft||<||£-тЛГ||7о||. (6.10) Из (6.10) очевидно, что условие (6.9) обеспечивает сходимость последовательности погрешностей Zh к нулю со скоростью гео- метрической прогрессии со знаменателем р. В случае, если матрица Л является симметричной, будет симметричной и матрица Е —тЛ, а поэтому в силу (6.6) условие (6.9) можно переписать в эквивалентном виде р = max 11 — t!s I < 1 (6.11) $ (здесь через обозначены собственные значения матрицы Л). Убедимся в том, что условие (6.11) является необходимым условием сходимости к нулю последовательности {Zft| при любом выборе нулевого приближения Хо. Предположим, что условие (6.11) не выполнено. Тогда существует собственное значение Xs, удовлетворяющее неравенству |1 —tXs | 5» 1. Обозначим через %(s) отвечающий этому собственному значению собственный вектор матрицы А и выберем нулевое приближение Хо так, чтобы Zo совпало с X<s>. Тогда, последовательно записывая соот- ношение (6.4) для номеров 1, 2, ..., k, мы получим, что Zk = = (1 —tXs)*Z0. Из последнего соотношения в силу неравенства II —тХ,| 5. 1 вытекает, что ||ZA|| не стремится к нулю при k оо. Теорема 6.1 доказана. Сразу же заметим, что для практических целей недостаточно установить только факт сходимости последовательности итера- ций. Центральной задачей численных методов является оценка скорости сходимости. Очень важно знать, как наилучшим спосо- бом распорядиться стационарным параметром т.для того, чтобы получить наиболее быструю сходимость. Остановимся на этом вопросе подробнее.
164 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 Пусть задана е-точность, с которой нам требуется получить точное решение системы (6.1). Требуется найти итерацию Xh с таким номером k, для которого (6-12) Из (6.9) и (6.10) вытекает, что ||ZA|| < р* || Zo||, и, стало быть, (6.12) выполняется при р* < е, т. е. при k -fn~fi'/p) * Отсюда видно, что для уменьшения числа итераций k, доста- точных для достижения требуемой е-точности, следует выбрать параметр т так, чтобы получить минимум функции р = р (т) — = ||£ — тАЦ. Считая матрицу А симметричной и положительно определен- ной, мы приходим к следующей задаче оптимизации: найти мини- мум функции min р (т) = min||Е — тА|| = min (max j 1 — tXs [}. т т т s Решение этой и несколько более общей задачи, предложенное А. А. Самарским, излагается в следующем пункте. Там будет доказано, что указанный минимум функции р = р (т) достигается для значения т = 2/(ух 4- у2), где и у2 —соответственно мини- мальное и максимальное собственные значения матрицы А, при- чем минимальное значение функции р (т) равно 1—К Ya _ Ya — Y1 ] + Yi Ya + Y1 ‘ Ya 2. Общий неявный метод простой итерации. Снова обратимся к решению линейной системы (6.1), но на этот раз заменим ите- рационную последовательность (6.3) более общей итерационной последовательностью, определяемой соотношением В .Xk^Xh + AXh = F, (6.13) в котором В представляет собой некоторую «легко обратимую» квадратную матрицу n-го порядка, а т —стационарный параметр. Такой метод составления итерационной последовательности и называется неявным методом простой итера- ции. Рассмотренный в предыдущем пункте явный метод простой итерации получается из неявного метода в частном случае В — = Е, где Е —единичная матрица порядка п. Для того чтобы сформулировать в удобной для приложений форме условие сходимости общего неявного метода простой ите- рации, напомним некоторые понятия, введенные в предыдущей главе.


5 1) ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ )65 Напомним, что матрица А называется поло жительно определенной, если (АХ, X) > 0 для любого ненулевого вектора X. В главе 5 было доказано, что необходимым и достаточ- ным условием положительной определенности симметричной ма- трицы А (или, что то же самое, самосопряженного линейного оператора А) является положительность всех собственных зна- чений этой матрицы (этого оператора). Если матрица А является положительно определенной, то мы договоримся писать неравенство А > 0. Далее договоримся писать неравенство В > А (или А <Z В) в случае, если В — А > > 0 (т, е. если матрица В—А является положительно опре- деленной). Докажем следующую замечательную теорему *). Теорема 6.2 (теорема А. А. Самарского). Пусть мат- рица А является симметричной и выполнены условия А >0, В > > 0 (симметричность матрицы В, вообще говоря, не предпола- гается) . Тогда для того чтобы итерационная последовательность, определяемая соотношением В 4- AXk = F, (6.13) при любом выборе нулевого приближения Хо сходилась к точному решению X системы АХ = F достаточно, чтобы были выполнены условия 2В>тЛ, тЛ>0. (6.14) При дополнительном предположении о том, что матрица В является симметричной, условия (6.14) не только достаточны, но и необходимы для сходимости указанной итерационной после- довательности при любом выборе нулевого приближения Хо. Доказательство. 1) Достаточность. Прежде всего оценим погрешность Zh = Xh —X. Так как X удовлетво- ряет уравнению АХ = F, а Хк соотношению (6.13), то для Zh получим соотношение В 4- AZh = 0. (6 15) Установим для погрешности Zh так называемое основное энергетическое соотношение. *) Эта теорема является частным случаем доказанного известным советским математиком А. А. Самарским значительно более общего утверждения. (А. А. Самарский. Введение в теорию разностных схем. — М.: Наука, 1971.)
166 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 Умножая (6.15) скалярно на вектор получим равенство 2т (в Zh^~-k- -Zk+1- Zk) + 2z (AZk, jfo+ijrA) = о. (6.16) Если воспользоваться обозначением С = 2В —хА и соотноше- нием •7 Zh+1 -J- 2ft Zk+i “ 2ft Zft+i —— Zft т Zft+1 — Zft h~ 2 2 ~ 2 ~ 2 ’ r ’ то равенство (6.16) можно переписать в виде т (С, Z^-Zk ) + (A (Zh+1 + 7Л), Zft+1 - Zft) = 0. (6.17) Далее заметим, что в силу симметрии матрицы А второе сла- гаемое в (6.17) равно (AZk+1, Zk+1) — (AZk, Zk). Это приводит нас к основному энергетическому соотноше- нию: т(с г^-гк , (XZft+ij A+i) = {AZk< Zk) (6л8) Для доказательства достаточности условий (6.14) остается с помощью основного энергетического соотношения доказать сходимость к нулю последовательности Из основного энергетического соотношения и из положитель- ной определенности матрицы С = 2В —хА вытекает, что (AZk+1, Zk) < (AZk, Zk), т. e. вытекает невозрастание последователь- ности {(AZft, Zft)}. Из условия А >0 вытекает, кроме того, что эта последовательность ограничена снизу нулем, а поэтому схо- дится. Но тогда из основного энергетического соотношения следует, что lim (С = 0 (6 19) Напомним, что для положительно определенной матрицы С всегда найдется 6 > 0 такое, что (СХ, X) 6 (X, X) для лю- бого вектора X или, что то же самое, || X Ц3 с (СХ, X). Последнее неравенство позволяет заключить, что из равенства нулю указанного выше предела (6.19) следует, что lim ||Zft+1 — Zk ||=0. (6.20) А-*оо


$ 1] ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 167 Для завершения доказательства достаточности следует вос- пользоваться соотношением В г*41т~ Zk 4- AZh = О, из которого в силу существования для положительно определенной матрицы А ограниченной обратной матрицы А-1 вытекает, что Zft = — А 1 • — (Zfe+i — Zh). Последнее равенство и соотношение (6.20) дают право заключить, что lim || Zft|| = 0. Достаточность доказана. £-*оо Для доказательства необходимости условий (6.14) при допол- нительном предположении о том, что матрица В симметрична, привлечем следующую лемму. Лемма. Пусть С —некоторая симметричная матрица, а В —симметричная положительно определенная матрица. Тогда матрица С является положительно определенной в том и только в том случае, когда являются положительными все собственные значения задачи СХ — МЗХ. Для доказательства леммы заметим, что так как матрица В является симметричной и положительно определенной, то (в силу теоремы 5.24 из п. 6 § 5 гл. 5) существует самосопряженный по- ложительно определенный оператор В1/2 такой, что для соот- ветствующей ему матрицы В1/2 справедливо равенство В1/2 х х В1/2 = В. Так как матрица В1/2 является положительно оп- ределенной и симметричной, то для нее существует ограниченная и симметричная обратная матрица, которую мы обозначим через В'1/2. Заметим далее, что с помощью замены X = В-1/2 -Y и умно- жения слева на матрицу В~1>2 задача на собственные значения СХ = ХВХ переходит в эквивалентную задачу на собственные значения В-1/2 -С’В-1/2У = ХУ, так что для доказательства леммы остается убедиться в том, что заведомо симметричная матрица В-1/2-С-В-1/г является положительно определенной тогда и только тогда, когда является положительно определенной мат- рица С. Это последнее сразу вытекает из того, что для любых двух ненулевых векторов X и Y, связанных соотношением Y = = В'1/2»Х справедливо равенство (В"‘/г .С.В~'1гХ, Х) = (С-В~'1гХ, В~‘/2.Х)= (СУ, У). Лемма доказана. Теперь мы можем перейти к доказательству необходимости ус- ловий (6.14) теоремы 6.2 при дополнительном предположении о том, что матрица В является симметричной. 2) Необходимость. Будем опираться на следующее утверждение из доказанной выше леммы: если матрица В является
168 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 симметричной и положительно определенной, а матрица С явля* ется симметричной и не является положительно определенной, то задача на осбственные значения СХ —КВХ имеет хотя бы одно неположительное собственное значение Xs. Предположим, что не выполнено первое из условий (6.14), т, е. не выполнено требование 2В —тА >0. Полагая в проведенных выше рассуждениях С — 2В —тА, мы получим, что задача на собственные значения (2В —тА) X — = ХВХ имеет хотя бы одно неположительное собственное значе- ние Xs. Обозначим через X(s) отвечающий Xs собственный вектор и выберем нулевое приближение Хо так, чтобы было выполнено условие Zo = X(s>. Тогда, переписав уравнение для погрешности (6.15) в виде BZh+1 = —BZh + (2В —tA)Zh, мы получим, последовательно полагая k равным 0, 1, ..., 21 = (- 1 + X,)Х<’>, Z2 = (— 1 Ц- V X(s), .. 2k = (-l+^)^(s). ... Поскольку —1 + —1, то очевидно, что ||Zh|| не стремится к нулю при k-+oo. Аналогично рассматривается случай невыполнения второго условия (6.14), т. е. условия тА > 0. В этом случае в проведенных выше рассуждениях следует положить С = тА. Мы получим при этом, что задача тАХ = кВХ имеет хотя бы одно неположительное собственное значение Xs с собственным вектором X(s). Выбирая нулевое приближение Хо так, чтобы было справедливо равенство Zo = и переписывая (6.15) в эквивалентном виде BZh+1 = = BZh —^AZk, мы получим, что 2Х = (1 -XS)XU), Z2 = (l -XS)2X(S), ...,Zh = (l -Xs)feX<s’, ... Так как X, с 0, то очевидно, что ||Zft|| на стремится к нулю при k ->• оо. Теорема 6.2 полностью доказана. Перейдем теперь к оценке скорости сходимости общего не- явного метода простой итерации. Следуя А. А. Самарскому *), вы- ясним вопрос о выборе такого значения параметра т, которое обес- печивает наиболее быструю сходимость. Предположим, что матрица В является симметричной и поло- жительно определенной. С помощью такой матрицы естественно ввести так называемое «энергетическое» скал яркое произведение двух произвольных векторов X и Y, по- ложив его равным (ВХ, Y) — (X, BY). Такое скалярное произ- ведение будем обозначать символом (X, Y)B. *) А. А. Самарский. Введение в теорию разностных схем. — М.: Наука, 1971. А. А. С а м а р с к и й, А. В. Г у л и н. Устойчивость разностных схем. — М.; Наука, 1973,


§ 1] ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 169 С помощью матрицы В1/2 это скалярное произведение можно записать в виде (X, Y)B = (В'^В^Х, Y) = (В‘'2Х, В1/2К). С по- мощью последнего равенства легко проверяется справедливость для введенного нами скалярного произведения четырех аксиом скалярного произведения (см. п. 1 § 1, гл. 4). Далее естественно ввести энергетическ у ю но р м у вектора X, положив ее равной yY(X, Х)в — уГ(ВХ, X). Эту энергетическую норму мы обозначим символом ||Х||В. Две различные нормы одной и той же совокупности векторов || X ||х и || X ||п называют эквивалентными, если существуют такие положительные постоянные ft и ft, что справедливы не- равенства 'У1Н111«Н11п< ^Hik- Заметим , что энергетическая норма вектора X и обычная его норма являются эквивалентными. В самом деле, справедливость неравенства ft ||Х|| < ||Х||в, т. е. неравенства yf (X, X) с с (ВХ, X) вытекает из положительной определенности матрицы В, а справедливость неравенства || X||в с ft ||X||, т. е. неравен- ства (ВХ, X) < Т2ЦХЦ2 вытекает из неравенства Коши—Буня- ковского и оценки (6.7) (достаточно положить у2 = ||В||). Установленная эквивалентность обычной и энергетической норм позволяет утверждать, что последовательность ||Xh|| схо- дится к нулю тогда и только тогда, когда сходится к нулю после- довательность || Xk ||в. Для дальнейших рассуждений энергетическая норма является более удобной, чем обычная норма. Докажем следующую фундаментальную теорему. Теорема 6.3 (теорема й. А. Самарского). Пусть мат- рицы А и В симметричны и положительно определены, Zh обоз- начает погрешность общего неявного метода простой итерации. Тогда, для того чтобы при р < 1 было справедливо неравенство ||Zft ||в < р*ро||в, достаточно, чтобы было выполнено условие (6.21) Замечание. А. А. Самарским доказано, что условие (6.21) не только достаточно, но и необходимо для справедливости неравенства IlZbUe < ₽* 1Ио 1!в> но мы на этом останавливаться не будем. Доказательство теоремы 6.3. Для удобства разобьем доказательство на два шага. Г. Сначала докажем, что если симметричные и положительно определенные матрицы А и В удовлетворяют условиям Самар- ского (6.14), то (BZM) Zh+1) « (BZh, Zh).
170 ИТЕРАЦИОННЫЕ МЕТОДЫ (ГЛ. 6 Умножая равенство (6.15) скалярно на 2rZA+1 = т (ZA+1 4- + Zft) + т (ZA+1 — ZA), получим (5 (ZA+i — Zft), ZA+14- ZA) 4- (B (ZA+1 — Zk), Zh+1 — Zk) 4- 4-t(AZa+1, ZA+14~Zft) 4~ т (/lZft, ZA+1— ZA) = 0. В последнем равенстве заменим AZk на разность 4 A (ZA+14- Zft) - 2. Л (ZA+1 - Zk). Тогда, учитывая вытекающее из симметрии матрицы А ра- венство (Д (ZA+1 — Zh), Zh+1 4- ZA) = (ZA+1 — ZA, A (Zh+1 4- ZA)),Mbi получим тождество (В (ZA+1 - Zk), zA+14- zk) 4- ((в - 4Л) (ZA+1 - Zk), zM 4- zk) 4- 4* — (тД (zA+14- zA), zA+14- Zft) = 0. Учитывая, что (в силу условий Самарского (6.14)) операторы тД и В—^-А являются положительно определенными, мы получим из последнего тождества следующее неравенство: (B(ZA+1-ZA), Za+14-Za)<0. Это неравенство эквивалентно доказываемому неравенству (5Za+i, Za+1) с (BZa, Za) (в силу вытекающего из симметрии оператора В тождества (BZA+n ZA) = (ZA+1, BZA)). 2°. Пусть теперь при р < 1 выполнены услЬвия Самарского (6.21). Докажем справедливость неравенства ||ZA||B < p*||Z0]|B. Положим ZA = р*УА. Тогда, очевидно, -Zh = p‘+IVA+i - рЧ = p*+1 (УА+1 - Vh) - (1 - p) p% Подставляя эти значения ZA и ZA+1 —ZA в равенство (6.15) и производя сокращение на рА, получим для величин УА следующее соотношение: В + Аук = 0, (6.22) в котором В = рВ, А —А—' ~ р В. В силу условий (6.21) операторы В и А удовлетворяют усло- виям тД > 0, 2В > гА. Из этих условий и из того, что уравнение (6.22) для УА совершенно идентично уравнению (6.15) для ZA> в силу первого шага для УА вытекает следующая оценка:


§ 1J ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 171 (BVM, Vft+1) < (BV к, Vft). Из этой оценки в свою очередь, учиты- вая, что ~В =рВ, получим неравенство (BVA+1, VA+1) < (BVk, VA). Последовательное применение указанного неравенства для номеров k — 0, 1, ... приводит нас к соотношению (BVh, VA) с с (ВVo, Vo), а умножение последнего соотношения на р2* при- водит к окончательной оценке *) (BZk, Zh) < р2* (BZ0, Zo). Тем самым неравенство ||ZA||B с pfe|| Zo ||в доказано. Доказа- тельство теоремы 6.3 завершено. В заключение применим теорему Самарского 6.3 для выясне- ния вопроса о выборе такого значения параметра т, при котором скорость сходимости является максимальной. Из доказанной в теореме 6.3 оценки || Zft Цв с р*|| Zo ||в вытекает, что эта задача сводится к нахождению такого значения т, при котором дости- гается минимальное значение функции р ~ р (т). Так как обе матрицы Л и В симметричны и положительно определены, то существуют положительные постоянные "ft и у2 такие, что справедливы неравенства YjB < А < у2В. Будем считать, что постоянные и у2 в этих неравенствах нам заданы**). Сопоставляя только что написанные неравенства с условиями (6.21), мы получим, что минимальное значение р достигается при условии (1 —р)/т =7!, (1 4- р)/т = у2, откуда получаем опти- мальное значение т = 2/(-уг + у2) и минимальное значение р, равное (у2 — Т1)/(у2 + yj. Частным случаем проведенного нами рассмотрения является явный метод простой итерации, изученный в п. 1. Для этого метода справедливы все полученные нами результаты. В следующих трех пунктах с помощью общего неявного метода простой итерации и теоремы Самарского 6.2 мы рассмотрим не- сколько наиболее употребительных итерационных методов и установим условия их сходимости. 3. Модифицированный метод простой итерации. Этот метод получается из общего неявного метода простой итерации в том частном случае, когда стационарный параметр т равен единице, а матрица В представляет собой диагональную матрицу D, со- стоящую из элементов матрицы А, лежащих на главной диаго- нали, т. е. В == D, где Сц о ... О О 0 ... апп *) Мы учитываем, что Zk = pftVA, Zo = Vo. **) Постоянные Vi и y2 естественно назвать константами эквива- лентности матриц А и В. Для коммутирующих матриц А и В постоянные у2 и у2 соответственно равны наименьшему и наибольшему собственным значе- ниям задачи АХ = ХВХ.
172 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 При этом, конечно, предполагается, что матрица А является симметричной и что все ее диагональные элементы а11( а22, ..., апп являются положительными (последнее требование необходимо и достаточно для положительной определенности диагональной матрицы В = D). Из теоремы 6.2 сразу же вытекает, что для сходимости моди- фицированного метода простой итерации при любом выборе нулевого приближения достаточно, чтобы были выполнены два условия 2D > А, А >0. Теорема 6.1 позволяет выразить достаточное условие сходи- мости модифицированного метода простой итерации и в другой форме: || £ - D-M||< I*) (6.24) (под нормой матрицы, как и выше, понимается операторная норма). Так как ||£ — 0-хЛ|| = ||Р'1(£> — Л)|| =р-1 (Л — D)||, то достаточное условие сходимости (6.24) можно переписать в экви- валентном виде Р'ЧЛ-РЖ!. (6.25) Неравенство (6.25) позволяет получить различные достаточ- ные условия сходимости модифицированного метода простой итерации. Прежде всего заметим, что если наряду с операторной нормой матрицы (6.2) (которую мы, как и выше, будем обозначать сим- волом || Л ||) ввести так называемую сферическую норму этой матрицы, обозначаемую символом || А ||сф и определяемую равен- Г п п 11/2 ством ||Л||Сф= S S , то, как доказано в §4 гл. 4 (см. »=1 /=i J формулу (4.28)), для любого вектора X пространства Еп будет справедливо неравенство *♦) ||ЛХ||<||Л||сф||Х||. (6.26) Из (6.26) и (6.5) сразу же вытекает, что операторная и сфери- ческая нормы матрицы связаны соотношением ||Л|| < ||Л ||сф. Таким образом, в силу (6.25) достаточное условие сходимости модифицированного метода простой итерации выражается нера- *) Мы учитываем, что в рассматриваемом случае вместо матрицы А следует взять матрицу А, определяемую формулой Д= В'1 А и положить В — D, т = **) В этом неравенстве под нормой вектора X = называемая сферическая норма || X || = X1 II • • понимается так Хп II


$ 1] ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 173 венством IP"1 (Л — О)||сф <1, которое в развернутой записи V V 1 имеет вид 2j2j"5?7<L /=1 ’ Заметим далее, что при определении операторной нормы (6.5) матрицы А мы исходили из обычной (так называемой с ф е р и- II X! Ц Г п 11/2 ческой) нормы вектора X = • •, равной ||Х|| — I 2 х2( IIХП II L 1=1 J Часто вводят еще две нормы вектора X'. так называемую к у- бическую норму, определяемую равенством ||X||„уб == = max | Xt I, и так называемую октаэдрическую н о р- 1<1<л п м у, определяемую равенством ||XЦокт = S |xj. Если в опреде- i=i лении (6.5) операторной нормы матрицы А понимать под нор- мой вектора соответственно его кубическую или октаэдрическую норму, то соотношение (6.5) приведет нас к определению соот- ветственно кубической и октаэдрической опе- раторных норм матрицы А. Можно доказать, что кубическая и октаэдрическая оператор- ные нормы матрицы (6.2) следующим образом выражаются через элементы этой матрицы *): п п МИкуб = тах Е|ао|. М11окт = шах S |а0|. 1<1<п /=1 1</<п 1=1 Дословное повторение проведенных выше рассуждений с за- меной сферических норм соответственно кубическими и октаэдри- ческими приведет нас к достаточному условию сходимости моди- фицированного метода простой итерации, выраженному соотно- шением (6.25), в котором под нормой матрицы следует понимать соответственно ее кубическую или октаэдрическую операторные нормы. Это приводит нас к следующим двум условиям, каждое из которых является достаточным для сходимости модифицирован- ного метода простой итерации п SISzH1 (для l‘=I> 2, ...,п); 7=1 /*> п SIS-H1 (Для /=1, 2, ,,.,п). i=i 1*1 *)См., например, книгу: В. И. Крылов, В. В. Бобков и П. И. Монастырям й. Вы- числительные методы высшей математики, том 1, — Минск: Вышэйшая школа, 1972, с. 111—112,
174 ИТЕРАЦИОННЫЕ МЕТОДЫ (ГЛ. 6 4. Метод Зейделя. Представим симметричную матрицу (6.2) в виде суммы трех матриц А = D + L + U, где D — диагональ- ная матрица (6.23), a L и U соответственно строго левая и строго правая матрицы, имеющие вид О О L = аг1 О U= 0 0 ... а2п О О О Oni апг ••• О 0 ... О и удовлетворяющие условию L' = U. Метод Зейделя получается из общего неявного метода простой итерации в том частном случае, когда стационарный параметр т равен единице, а матрица В равна сумме D + L. Таким образом, последовательные итерации в методе Зейделя определяются соотношением (D + L) (XM-Xk) + ^=F. Докажем, что метод Зейделя сходится для любой симметрич- ной и положительно определенной матрицы А. В силу теоремы 6.2 достаточно доказать, что для любой такой матрицы А выполнено условие 2 (D + L) > А. (6.27) Для доказательства (6.27) заметим, что для любого вектора X (2 (О + L) X, X) = (DX, X) + (DX, X) + (LX, X) +(LX, X) = = (DX, X) + (DX, X) + (LX, X) + (X, UX) = = (DX, X) + (AX, X). Таким образом, для доказательства неравенства (6.27) доста- точно убедиться в положительной определенности матрицы D, но она сразу вытекает из того, что у положительно определенной и симметричной матрицы А все элементы, лежащие на главной диагонали, являются положительными *). Сходимость метода Зейделя доказана. 5. Метод верхней релаксации. Этот метод получается из общего неявного метода простой итерации в том частном случае, когда я — ы, В = D + &L, а параметр со выбран так, чтобы являлось наименьшим наибольшее по модулю собственное значение мат- рицы Е — со (D + соД)"1 А, осуществляющей переход от k-й ите- рации к (k + 1)-й. Докажем, что если матрица А является симметричной и поло- жительно определенной, то для сходимости метода верхней ре- лаксации достаточно, чтобы было выполнено условие 0 < со < 2. В силу теоремы 6.2 для сходимости достаточно выполнение условий со > 0, 2 (D 4- соА) > соА. *) Достаточно заметать, что если у вектора X k-я координата равна еди- нице, а все остальные нулю, то (АХ, X) a^k > О-


§ 1] ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 175 Второе из этих условий для любого вектора X приводит к не- равенству (2 (D + <о£) X, X) > (соЛХ, X). (6.28) Последнее неравенство эквивалентно каждому из неравенств в следующей цепочке: (2DX, X) + (coLX, X) + (aLX, X) > (а>АХ, X), (2 — ш) (DX, X) + (©DX, X) + (aLX, X) + 4- (X, ©f/X) > (©ЛХ, X), (2 — ©) (DX, X) > 0. Из последнего неравенства и из положительной определенности D заключаем, что (6.28) справедливо при 2 — и > 0, т. е. при со < 2. Итак, доказано, что условия 0 < © < 2 обеспечивают сходимость метода верхней релаксации. 6. Случай несимметричной матрицы А. В случае несимметрич- ной матрицы А мы можем умножить матричное уравнение (6.1) слева на матрицу А' и заменить уравнение (6.1) уравнением АХ = F, в котором F = A'F, А — А'А, так что матрица А яв- ляется симметричной и (как легко убедиться) положительно определенной. 7. Итерационный метод П. Л. Чебышева *). Всюду выше при рассмотрении общего неявного метода простой итерации мы предполагали, что итерационный параметр т принимает одно и то же постоянное значение. Естественно возникает идея рассмо- треть более общий случай, когда в указанном методе значения итерационного параметра зависят от номера k итерации. В таком случае последовательность итераций будет определяться не соот- ношением В Хк^.Хк + AXh = F, (6.13) а более общим соотношением При этом, как и выше, В — некоторая легко обратимая квадрат- ная матрица порядка п. При таком выборе итерационной после- довательности для погрешности = Xk — X итерационной схемы получится соотношение BZk^—k -\-AZh = Q. (6.15*) *) Пафнутий Львович Чебышев (1821—1894) — великий русский математик и механик.
176 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 Предположим, что обе матрицы А и В симметричны и поло- жительно определенны. Тогда, как уже отмечалось выше, най- дутся положительные постоянные ft и ft такие, что yYB с Л<у2В. Будем считать, что эти постоянные ft и ft нам заданы и еще раз напомним, что эти постоянные равны соответственно наимень- шему и наибольшему собственным значениям задачи АХ = кВХ. Оценим энергетическую норму погрешности ||ZA||B. Напомним еще раз, что для симметричной и положительно определенной матрицы В существует симметричная и положительно определенная матрица В1/2 такая, что В^2-В|/2 = В. Как и выше, договоримся обозначать символом В-1/2 матрицу, обратную к мат- рице В1/2. Для оценки нормы погрешности Zh сделаем замену, положив Zk =B-1/2-Vfe. При такой замене соотношение для погрешно- сти Zh переходит в следующее соотношение для Vk+i = (E~th+1C).Vh (k = Q, 1, 2, ...), где через С обозначена матрица вида С = В-'/2 -А-В~и2. Убе- димся в том, что квадрат обычной нормы вектора равен квад- рату энергетической нормы вектора Zh. В самом деле, ||Vft|f = (Vft, Vh) = (B'/2Z, B1/2Z) = (BZh, Zh) = \\ZhfB. Таким образом, для оценки энергетической нормы Zh достаточно оценить обычную норму Vh. Оценим норму || ||. Прежде всего заметим, что из неравенств ft (ВХ, X) < (АХ, X) < ft (ВХ, X) с помощью замены X = — в-’/2 • Y получаются неравенства ft (Y, Y) < (CY, Y) < < Та (К, У)- Последние неравенства эквивалентны тому, что ftE < С с ftE. Поскольку кроме того матрица С = = B~li2-A-В-U2 симметрична, то все собственные значения этой матрицы вещественны и расположены на отрезке [ft, ft], После- довательно записывая соотношение V\+i = (Е —ft+i-C) Vh для номеров k = 0, 1, ..., мы придем к следующему равенству: k = П (Е — т/7)« Vo, /=1 из которого сразу же вытекает, что ||Ии<?|Д(Е— «г/7)[.||К0[|. Но тогда из равенства || Vk || — || Zh вытекает, что || Z* Дв < где qh = п /=1 (Е -туС) Следовательно, итера- ционный процесс сходится при условии, что последовательность стремится к нулю, причем тем быстрее, чем меньше вели- чины qk.


§ 1] ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 177 Поскольку каждое значение qk является функцией парамет- ров т1( т2, тА, возникает задача построения оптимального набора итерационных параметров из условия минимума qh для фиксированного k. Перейдем к решению этой задачи. Предположим, что все собственные значения матрицы С лежат на заданном сегменте [ylt у2]. Учитывая симметрию мат- рицы С, мы приходим к следующей задаче оптимизации: найти min^(Tb т2 • Tft) = min {Ъ} k II П (Е — т,С) = /=1 II f * = min (max П(1 — TyZs) {ту} I S / = 1 Поскольку все Xs лежат на отрезке [ylt у2 ], то расширяя область по которой берется максимум, мы получим, что min<7h(Tj, т2, ..., тл) < min j max {Ту} {Ту} k П(1 - Ту/) /=1 Полученная огрубленная задача имеет более простое решение. Кроме того, при решении такой задачи не используется информа- ция о конкретном расположении собственных значений Xs на отрезке [уь у2], а учитываются лишь границы этого отрезка. Такой подход позволяет построить набор оптимальных пара- метров для матриц произвольной структуры. Перейдем к решению указанной огрубленной задачи оптими- k зации. Положим Р (/) = П (1 —т;/) и заметим, что полином Р (I) /=1 удовлетворяет условию нормировки Р (0) = 1. С помощью за- мены переменной Та — Vi 2 - . где р0 = , , т0 = —;, мы отобразим отрезок у, < t с у, 1 а т Yi Vi ~г Уз в отрезок —1 < S < 1, причем точка t = 0 переходит в точку S = So ==-±- > 1. Ро При такой замене рассматриваемая задача оптимизации пере- ходит в следующую задачу: среди всех полиномов Ph (S) степени k, удовлетворяющих условию нормировки Рк = L найти та- кой, для которого max|P(S)l минимален. 1SK1
178 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 Таким полиномом, как известно, является полином Чебы- шева Ph (S) = Tk (S)-[Th (So)?1, где cos (k arccos S) при | S | < 1, 4-[(S + /S^i)ft + (S-/S5^T)*] при |S|> 1. Так как max I Th (S) I =1, то |S|<1 min max |pft(/)| = —J—, {Tj) Jk(^o) 1 1^72 — V 71 причем tus.) = 9a = -ГГ-2Г > гДе Pi = ,Д • 1 k (io) 1 + Pl V ?2 + V Yi Для вычисления оптимального набора параметров будем исходить из равенства k Pk (о=П о - = 9аП /=i (мы учли, что S = '—р°~ ) • Приравняем корни полиномов, стоящих в левой и в правой частях этого равенства. Так как полином Ph (/) имеет корни — 1/т, (j = 1, 2, ..., k), а полином Тк (S) имеет корни Sj = cos л (/ = 1, 2, .... k), то учи- тывая, что t — получим = —~^s/pe. (/=1,2,... ..., k; Sj определены выше). Итак, оптимальными значениями итерационных параметров будут значения т, = , ,T”-g , где S, = cos л, /=1,2,... * 1 -f- J 2fi * k. Итерационный процесс с указанным оптимальным набором параметров называется чебышевским. Мы приходим к следующей теореме.- Теорема 6.4. Если матрицы А и В симметричны и положи- тельно определены и если yrB < А < у2В, то чебышевский ите- рационный процесс сходится, и для погрешности Zk после выпол- нения k итераций справедлива оценка Иа1Ь ^<7аПоЬ где qk = -~ P12k при pt = .


$ Ij ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 179 Если в качестве условия окончания процесса взять для зара- нее заданной е-точности требование ||Zk ||s <e||Z0||B, то из тео- ремы 6.4 получается для числа итераций k следующая оценка: k^ka (е) = 1п. . Сравнивая эту оценку с установленной вы- числа итераций для 1п е мы получим при In (2/г) 2/F ’ ше оценкой g = у2/У1 мала, что k0(e) метода простой итерации условии, что величина с . . 1п (1/е) к0(щ~—2^—. Сравнение этих оценок указывает на преимущество чебышевского метода (в случае, когда величина | мала). Описанный нами чебышевский метод известен еще с начала 50-х годов. Иногда его называют методом Ричардсона. Следует отметить, что мы изучили этот метод для идеального вычислительного процесса с бесконечным числом знаков, в то время как на ЭВМ вычисления ведутся с конечным числом зна- ков, в связи с чем имеются числа, являющиеся машинной беско- нечностью Л4оо и машинным нулем. Если в процессе вычислений на ЭВМ появляется число М, превосходящее М^,, то происходит аварийный останов машины (авост). С точки зрения идеального вычислительного процесса значе- ния итерационных параметров т7 можно упорядочить как угодно (любым из k\ способов). Любые две последовательности итера- ционных параметров |т7| с точки зрения идеального вычисли- тельного процесса эквивалентны, ибо для них требуемая е-точ- ность достигается за одно и то же число итераций. Но при вычислении на ЭВМ различные последовательности параметров {т7( не эквивалентны. Для одних последовательно- стей значений )т7| может произойти аварийный останов машины вследствие роста промежуточных значений. Для других после- довательностей значений |т7} аварийного останова машины не происходит, но в связи с немонотонным характером стремления к нулю погрешности Zft, т. е. вследствие того, что норма матрицы Е—т7С перехода от (/ — 1)-й итерации к /-й может быть больше единицы, для этой погрешности не справедлива установленная нами для идеальной ситуации оценка. Вследствие указанных обстоятельств возникает теоретиче- ская проблема — указать такой наилучший закон упорядочения значений |т7|, при котором для чебышевского метода было бы наименьшим влияние ошибок округления. Исчерпывающее решение этой проблемы можно найти в книге А. А. Самарского «Теория разностных схем», М., «Наука», 1977 год (с, 572 и далее).
180 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 § 2. Решение полной проблемы собственных значений методом вращений Ради простоты сначала будем рассматривать вещественную симметричную матрицу А, определяемую равенством (6.2). Заме- тим, что отыскание всех собственных значений и собственных векторов этой матрицы сводится к отысканию такой ортогональ- ной матрицы Т, для которой произведение D = Т'АТ (6.29) представляет собой диагональную матрицу. В самом деле, если такая ортогональная матрица Т будет найдена, то диагональные элементы матрицы D будут являться собственными значениями матрицы А, а столбцы матрицы Т будут являться соответствую- щими собственными векторами матрицы А *). Введем в рассмотрение сферическую норму матрицы А: п п 11/2 М 1|сф = S 2j ао Lz=i/=i J Тогда, очевидно, для диагональных элементов матрицы А будет справедливо неравенство п (б.зо) <=1 причем это неравенство переходит в точное равенство только в случае, когда матрица А является диагональной. Заметим теперь, что при ортогональном преобразовании мат- рицы А (т. е. при преобразовании вида А = UAR, где U и R — ортогональные матрицы) сферическая норма этой матрицы не изменяется **). Отсюда следует, что от всех ортогональных пре- образований матрицы А преобразование (6.29) отличается тем, что это преобразование делает максимальной сумму квадратов диагональных элементов преобразованной матрицы и минималь- ной — сумму квадратов всех внедиагональных элементов этой матрицы. *) Для доказательства этого обозначим через Xj, Х2, „,,ХП диагональные элементы матрицы D и положим || ек ||, где элементы ек столбца ек удовлет- воряют условию: ек = 0 при £=/= I и = 1. Тогда, очевидно, Dek = Хлеъ т. е. Т'АТеь= и так как Т’ — Т’1, то АТек— ^-иТек. Следовательно, Теь являются собственными векторами матрицы А. *♦) В самом деле, если Л = UAR, а символ tr С обозначает сумму всех^эле- ментов матрицы С, лежащих на ее главной диагонали, то |Л |£ф = tr (А' А) = ~b(R'A'U'UAR) = \r (R'A'AR) |4Я^ф = |(AR)’ |ф = || R'А' = = tr (ARR'A') = tr (АА') = || А' |£ф = | А |£ф.


МЕТОД ВРАЩЕНИЙ 181 § 21 Методом вращения называется итерационный метод, при кото- ром указанная выше матрица Т находится как предел бесконеч- ного произведения элементарных матриц вращения, каждая из которых имеет вид ’ 1 COS ф ... — sin ф . . (i-я строка), (6.31) Sin ф ... COS Ф- . . 1 (/-я строка). О • 1 В целом метод вращений состоит в построении последователь- ности матриц А, Л1, Л2, ..., Av, Лу+1, ..., (6.32) каждая последующая из которых получается из предыдущей при помощи элементарного шага вида Лу+i = Т^ЛуТ;/. Если для упрощения записи опустить индекс v и рассмотреть один такой шаг Л =7’г/Л7\/, осуществляемый с помощью матрицы (6.31), то для элементов atj преобразованной матрицы Л мы по- лучим следующие выражения через элементы ati матрицы Л: aht = aM при k=£i, j, j, au = atl cossin<p при l=£i, j, й/i — — a/zsln<p-}-a;Zcos(p при l=£i, j, 6/, =?/, cos(p4-anslnq> при l=£i, j, atj = — ati sin <p -f- a^cos <p при l=£i, j, ati = («n cos <p + an sin tp) cos cp -}- (aucos <p a3] sin tp) sin <p, а„ = (— ait sin <p + aJt cos <p) cos <p -}- (— atj sin <p а}] cos <p) sin <p, a}j = — (— atl sin <p ait cos tp) sin <p -f- (— ai} sin <p + cos tp) cos <p, йи = — (aH cos <p -}- an sin <p) sin <p (au cos <p ап sin <p) cos <p. (6.33)
182 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 Из соотношений (6.33) и из условия симметричности матрицы А вытекает следующее легко проверяемое равенство: п п п п ah — 2а?у -f- {(ah — о„) sin 2ф -j- 2az/ cos 2<р]2. *=i t=i *=i i=i k+l (6.34) Из этого равенства вытекает, что для максимального умень- шения суммы квадратов всех внедиагональных элементов необ- ходимо матрицу (6.31) выбрать так, чтобы были выполнены два требования: 1) номера i и / выбрать так, чтобы квадрат элемента а}, был наибольшим среди квадратов всех недиагональных элементов матрицы А, т. е. выбор номеров i и / подчинить условию fl/у = шах 0^1, IsUsSn 2) угол поворота <р в матрице (6.31) выбрать так, чтобы было справедливо равенство (а}} — ап) sin 2<p -f- 2a0cos2<p = 0. (6.35) Равенство (6.35) однозначно определяет угол <р, удовлетворяю- щий условиям (в.зб) Это равенство позволяет вычислять cos ф и sin <р по формулам со5ф=(4.[1+(1+л-,'‘1},/г. sin ф = sgn р (4 [1 — (1 где р = 2ai}/(atl — а}}). Заметим, что если матрица (6.31) выбрана так, что выполнены указанные выше требования 1) и 2), то равенство (6.34) пере- ходит в следующее соотношение: S Sa2AZ-2a?/, (6.37) k=\ 1=1 k=l z=i 1 k*i в котором ati представляет собой наибольший по модулю вне- диагональный элемент матрицы.


$ 2] МЕТОД ВРАЩЕНИЙ 183 Теперь мы можем более точно сказать, что метод вращений состоит в построении последовательности матриц (6.32), каждая последующая из которых получается из предыдущей посредством ортогонального преобразования Av+] = Т'ц-Ау-Т^, в котором матрица Ttj = Tt] (<р) выбирается так, чтобы были выполнены указанные выше два требования *). Докажем сходимость метода вращений. Обозначим символом S3 сумму квадратов всех внедиагональных элементов матрицы Av, а символом a(v). наибольший по модулю внедиагональный эле- мент этой матрицы. Тогда в силу (6.37) справедливо равенство S2v+1 = S2 - 2 [ц‘Х]2. (6.38) Далее, поскольку общее число внедиагональных элементов матрицы Av равно п (п — 1), a a^)v —наибольший по модулю из этих элементов, то справедливо неравенство Из (6.38) и (6.39) вытекает неравенство S?+,<S}[| (6.40) Последовательно используя неравенство (6.40), записанное для номеров 0, 1, .... v, и обозначая через S2 = So (А) сумму квад- ратов всех внедиагональных элементов основной матрицы А, мы получим, что S2+I < So (А) [1 - •^п~~су jV+‘ • (6.41) Из неравенства (6 41) сразу же следует, что limSv+i =0, что и доказывает сходимость метода вращений. В качестве приближенных значений собственных чисел мат- рицы А берутся диагональные элементы матрицы Av, а в каче- стве приближенных собственных векторов матрицы А берутся столбцы матрицы Ttljl ’^272 ••• ^iyiv Более точные результаты получены В. В. Воеводиным **). Для случая, когда произвольная (не обязательно симметричная) матрица А не имеет жорда- *) Номера i и / на каждом шаге выбираются такими, чтобы наибольшим по модулю являлся внедиагональный элемент матрицы Ау с этими номерами. **) В. В. Воеводин. Численные методы алгебры. Теория и алго- рифмы. — М.; Наука, 1966,
184 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 новых клеток и все ее внедиагональные элементы являются величинами порядка s и малы по сравнению с числом р = min |Х,—Х;|, В. В. Воеводин получил следующие оценки: п а) для собственных значений оценку X/ = ац + / —--------------1- О (е3) Да! ац — арр (из указанной суммы исключаются значения р, принадлежащие множеству /?/ тех чисел / = 1,2...п, для которых X; = X,); б) если Т — матрица, столбцы которой являются собственными векторами матрицы А и Т = Е -|- И, где Е — единичная матрица, то для элементов матрицы Н справедливы оценки О, если X; = Ху, hll = \__aij----f-O(e3), если X/=£ Xj. Если А — комплексная эрмитова матрица, то вместо матрицы (6.31) следует взять унитарную матрицу Ти (ф, ф) = ‘ 1 COS ф. . . 1 — sin О (<-я строка), (6.42) 1 sm <ре—. cos ф . . 1 О При этом вместо равенства (6.34) мы придем (/-я строка). к равенству п п п п А=1 1=1 t=l 1=1 k*l k+l 4-2|ai;|-|cos2<p>e‘“ — sln2<p-e‘ + (ал — a/()cos<psin <регф |2, в котором через а обозначен аргумент комплексного числа afj.


S 2] МЕТОД ВРАЩЕНИЯ 185 Для максимального уменьшения суммы квадратов модулей внедиагональных элементов следует у матрицы (6.42) выбрать такие номера I и /, чтобы элемент atJ был наибольшим по модулю внедиагональным элементом матрицы А, а выбор углов q> и ф подчинить условию jatj|(cos2(p»e‘a — sln2<p-ez<2’t’““) (ап — a(1)cosrp-slntp.e*'1’) = 0. Последнее условие приводит к соотношениям ^arga,,, tg2<p = ац-аИ> Доказательство сходимости метода вращений проводится точно так же, как и для случая вещественной матрицы.
ГЛАВА 7 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ В этой главе изучаются билинейные формы, опреде- ленные в вещественном линейном пространстве, т. е. числовые функции двух векторных аргументов, линейные по каждому из этих аргументов. Подробно исследуются так называемые квад- ратичные формы, представляющие собой билинейные формы, определенные для совпадающих значений их аргументов. Рассматриваются также некоторые приложения теории билиней- ных и квадратичных форм. § 1. Билинейные формы 1. Понятие билинейной формы. Понятие билинейной формы в произвольном линейном пространстве было введено нами ранее в главе 5. Однако для удобства изложения в этом пункте мы напомним некоторые определения и простейшие утверждения. Определение 1. Числовая функция А (х, у), аргументами которой являются всевозможные векторы х и у вещественного ли- нейного пространства L, называется билинейной фор- мой, если для любых векторов х, у и г из L и любого вещественного числа X выполняются соотношения А (х + z, у) = А (х, у) Н- A (z, у), А(х, y + z) = A(x, у) + А(х, z), А (Хх, у) = ХА (х, у), А (х, Ху) = ХА (х, у). Иными словами, билинейная форма представляет собой чис- ловую функцию А (х, у) двух векторных аргументов х и у, опре- деленную на всевозможных векторах х и у вещественного линей- ного пространства L и линейную по каждому из этих аргумен- тов *). Простейшим примером билинейной формы может служить произведение двух линейных форм f (х) и g (у), определенных на векторах х и у линейного пространства L. *) При этом часто говорят, что билинейная форма А (х, у) задана на линей- ном пространстве L,


S и билинейные формы 187 Определение 2. Билинейная форма А (х, у) называется сим- метричной {кососимметричной), если для любых векторов х и у линейного пространства L выполняются соотно- шения А(х, у) — А(у, х) (Л(х, у) = — Л (у, х)). (7.2) Справедливо следующее утверждение: любую билинейную форму можно представить в виде суммы симметричной и косо- симметричной билинейных форм (см. п. 1 § 9 гл. 5). 2. Представление билинейной формы в конечномерном линей- ном пространстве. Пусть в n-мерном линейном пространстве L задана билинейная форма В (х, у). Выясним вопрос о представ- лении формы В (х, у) в случае, когда в L задан определенный базис е = (Ci, е2, ..., еп)- Справедливо следующее утверждение. Теорема 7.1. Билинейная форма В (х, у) при заданном в п-мерном линейном пространстве базисе e=(ei, е2, ...,еп) может быть однозначно представлена в следующем виде: В{х, у)= £ (7-3) i. /=1 где bti = B(et, е,). (1А) a h и т]; — координаты в базисе е векторов х и у соответственно, п п Доказательство. Пусть х = EJ и у = Е r\je} — i=i /=i разложения векторов х и у по базису е. Так как форма В (х, у) линейна по каждому из аргументов л и у (см. (7.1)), то В(х, у) = £ па) = £ 5 A, е})&ц}. \i=i /=i / i, i=i Таким образом, для формы В (х, у) справедливо представ- ление (7.3) с выражениями (7.4) для коэффициентов Ь1}. Чтобы доказать однозначность этого представления, предпо- ложим, что для В (х, у) справедливо представление (7.3) с н е- которыми коэффициентами btJ. Беря в (7.3) х = Ci, у — е}, мы сразу же получим выражения (7.4) для коэффициентов bti. Теорема доказана. Определение. Матрица /^11 ^12 • . • tln\ В (е) = (Ьи) = I *22 • • * btn ), (7.5) fini Ьпг . . • 1>пп.
188 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 элементы bi} которой определены с помощью соотношений (7.4), называется матрицей билинейной фо р м ы В (х, у) в данном базисе е. Замечание 1. Обратимся к вопросу о построении всех билинейных форм в данном конечномерном вещественном прост- ранстве L. Ответ на этот вопрос следующий: любая квадратная матрица (bi}) является в данном базисе е = (ех, е2, .... еп) матри- цей некоторой билинейной формы. Убедимся в справедливости этого утверждения. Определим в линейном пространстве L с данным базисом е — (еп е2, .... еп) с помощью матрицы (6г7) числовую функ- п цию В (х, у) двух векторных аргументов х = %>tei и У — 1=1 п п = S вида в у) = S btjltfj. i=i 1.1—\ Легко видеть, что эта функция удовлетворяет всем условиям определения билинейной формы. Но тогда, согласно теореме 7.1, элементы btj заданной матрицы равны В (ег, е}), а написанная выше формула есть представление этой формы в виде (7.3). Согласно сделанному замечанию естественно называть пред- ставление (7.3) билинейной формы В (х, у) о б щ и м видом билинейной формы в п-м ерном линейном пространстве. Замечание 2. Если В (х, у) — симметричная (кососим- метричная) билинейная форма, то матрица (7.5) этой формы в ба- зисе е является симметричной (кососимметричной). Справедливо и обратное—если матрица (7.5) билинейной формы В (х, у) симметрична (кососимметрична), то и билинейная форма является симметричной (кососимметричной). Убедимся в справедливости этого замечания. Пусть В (х, у) — симметричная (кососимметричная) билиней- ная форма. Полагая в соотношениях (7.2) х = et, у =е}, полу- чим, согласно (7.4), btj = bn, (Ь„ = -bJt), (7.6) т. е. матрица (7.5) является симметричной (кососимметричной). Пусть теперь матрица (7.5) билинейной формы В (х, у) сим- метрична (кососимметрична), т. е. ее элементы удовлетворяют соотношениям (7.6). Тогда из соотношения (7.3) и соотношения п В (у, •*) = S следует, что В(х, у) = В(у, х), (В (х, у)= ». /—1 == — В (у, х)), т. е. форма В (х, у) является симметричной (ко- сосимметричной) . 3. Преобразование матрицы билинейной формы при переходе к новому базису. Ранг билинейной формы. Рассмотрим в линей- ном пространстве L два базиса е = (elt е2, .... еп) и f =


j j] БИЛИНЕЙНЫЕ ФОРМЫ 189 = (/1, /2...fn)- Пусть А (е) = (а„) и А (/) = (Ьи) — матрицы данной билинейной формы в указанных базисах. Выясним вопрос о связи этих матриц, т. е. выясним вопрос о преобразовании матрицы ai} билинейной формы при переходе от базиса е к новому базису f. Справедливо следующее утверждение. Теорема 7.2. Матрицы А (е) и А (/) билинейной формы Л (л, у) в базисах е — (elt е2, .... еп) и f =(/1, /2, •••> fn) связа- ны соотношением A (f) = С А (е) С, (7.7) где С — (ср?) — матрица перехода от базиса е к базису f, а С — транспонированная матрица С. Доказательство. Элементы fq нового базиса f выра- жаются через элементы ер старого базиса е с помощью матрицы С = (срч) по формулам п fq=^i Cptfip. (7.8) Р=1 Так как blk — A (f, /й), то, согласно (7.8), получим b!k = A (f, fk) = А ( £ cltei, S = \1=1 ;=1 / — £ A(eh едсцс}ь— S ацСцС^. (7.9) i, /=1 i. 7=J Напомним, что элементы с'ц транспонированной матрицы С" связаны с элементами сц матрицы С соотношениями сц = с'ц. Подставляя эти соотношения в правую часть (7.9), получим для blk следующее выражение: Ь Ik — S aiiCiiCik— Сц (J] . (7.10) if /«1 s'—1 \/=l / n Сумма S cttjCjh (по определению произведения матриц) пред- /=1 ставляет собой элемент матрицы А (е) С. On юда следует, что выражение в правой части (7.10) является оле»'снтом матрицы С' А (е) С. Но в левой части (7.10) стоит элемент матрицы А ([). Поэтому А (/) = С А (е) С. Теорема доказана. Следствие. Ранг матрицы А (/) равен ранги матрицы А (е). Это сразу вытекает из соотношения (7.7), из того, что мат- рица С и, стало быть, матрица С являются невырожденными, и из теоремы о том, что ранг матрицы не изменяется при умноже- нии ее на невырожденную матрицу.
190 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Это следствие позволяет ввести важный числовой инва- риант билинейной формы — так называемый ранг били- нейной формы. Определение 1. Рангом билинейной формы, заданной в ко- нечномерном линейном пространстве L, называется ранг мат- рицы этой формы в произвольном базисе пространства L. Определение 2. Билинейная форма А (х, у), заданная в ко- нечномерном линейном пространстве L, называется невырожден- ной (вырожденной), если ее ранг равен (меньше) размерности про- странства L. § 2. Квадратичные формы Пусть А (х, у) — симметричная билинейная форма, заданная на линейном пространстве L. Определение 1. Квадратичной формой называется числовая функция А (х, х) одного векторного аргумента х, которая полу- чается из билинейной формы А (х, у) при х — у. Симметричная билинейная форма А (х, у) называется п о- лярной к квадратичной форме А (х, х). Полярная билинейная форма А (х, у) и квадратичная форма А (х, х) связаны следующим соотношением: А(х, у) = -^-(А(х + у, х + у) — А(х, х) — А(у, у)], которое вытекает из очевидного равенства Л(л: + у, х-\-у) — А(х, х) + А(х, у) + Л(у, х) + А(у, у) и свойства симметрии формы А (х, у). Пусть в конечномерном линейном пространстве L задана сим- метричная билинейная форма А (х, у), полярная к квадратич- ной форме А (х, х). Пусть, кроме того, в L указан базис е = = (ei, е2, •••, еп) Согласно теореме 7.1 форму А (х, у) можно представить в виде (7.3) А(х, у)= £ (7-3) t, /=i где и т)у —координаты в базисе е векторов х и у соответственно. При этом в силу симметрии А (х, у) аи — ап (7.11) (см. замечание 2 п. 2 предыдущего параграфа).


5 2] КВАДРАТИЧНЫЕ ФОРМЫ 191 Полагая в (7.3) х = у (т. е. Tfo = £,), мы получим следующее представление для квадратичной, формы А (х, х) в конечномер- ном пространстве L с заданным базисом е: А(х, х)= % а,^. (7-12) i. z=i Матрица (atj) называется матрицей квадратич- ной формы А (х, х) в заданном базисе е. Согласно (7.11) матрица (а,;) является симметричной. Очевидно, каждой симметричной матрице (ai7) отвечает с помощью соотно- шения (7.12) квадратичная форма А (х, х), причем (7.12) будет представлением А (х, л) в пространстве L с заданным базисом е (см. также замечание 3 п. 2 предыдущего параграфа). Отметим, что матрица квадратичной формы при переходе к новому базису преобразуется по формуле (7.7). Поэтому ранг этой матрицы не меняется при переходе к новому базису. Обычно ранг матрицы квадратичной формы А (х, х) назы- вается рангом квадратичной формы. Если ранг матрицы квадратичной формы равен размерности пространства L, то форма называется невырожденной, а в противном случае — вырожденной. В дальнейшем мы будем использовать следующую термино- логию. Определение 2. Квадратичная форма А (х. х) называется: 1) поло ж и т е л ь н о (о трицательн о) опреде- л е н н о й, если для любого ненулевогох выполняется неравенство А(х, л)>0 (А(х, л)<0) (такие формы называются такжез н а к о о п р е д е л е н н ы ми)\ 2) знакопеременной, если существуют такие х и у, что А(х, л)>0, Л (у, у) < 0; 3) квазизнакоопределенной, если для всех х А (х, л) 5s 0 или А (л, л) < 0, но имеется отличный от нуля вектор х, для которого Л (л, л) = 0. В дальнейшем мы укажем признаки, по которым можно су- дить о принадлежности формы А (л, л) к одному из указанных типов. Отметим следующее важное утверждение. Если А (л, у) представляет собой билинейную форму, поляр- ную положительно определенной квадратичной форме А (л, л), то А (л, у) удовлетворяет всем аксиомам скалярного произведе- ния векторов в евклидовом пространстве.
192 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ СГЛ. 7 Обратимся к четырем аксиомам скалярного произведения (см. п. 1 § 1 гл. 4). Если число, называемое скалярным произведением векторов х и у, обозначить символом А (х, у), то эти аксиомы запишутся следующим образом: 1°. А (х, у) = А (у, х). 2°. А (х + Z, у) = А (х, у) + A (z, у). 3°. А (кх, у) = кА (х, у). 4°. А(х, х) > 0 и А (х, х) > 0 при х =£ 0. Так как билинейная форма А (х, у) полярная квадратичной форме А (х, х) симметрична, то аксиома 1° выполняется. Аксиомы 2° и 3° в сочетании с требованием симметрии выполнены в силу определения билинейной формы (см. п. 1 § 1 этой главы). Ак- сиома 4° выполняется, так как квадратичная форма А (х, х) положительно определена. Замечание. Очевидно, аксиомы скалярного произведе- ния можно рассматривать как совокупность требований, опреде- ляющих билинейную форму, полярную положительно опреде- ленной квадратичной форме. Поэтому скалярное произведение в линейных пространствах может быть задано с помощью такого вида билинейной формы. § 3. Приведение квадратичной формы к сумме квадратов В этом параграфе указаны различные методы приведения квадратичной формы к сумме квадратов, т. е. будут указаны методы выбора такого базиса f — (flt .... fn) в линейном про- странстве L, по отношению к которому квадратичная форма представляется в следующем каноническом виде: А {X, х) = А.1Т)? ХгТ]2 + • • • ^-пТ1а> (7.13) СЛх» Лг. •••> Лп) —координаты х в базисе f. Коэффициенты кг.......кп в выражении (7.13) называются каноническими коэффициентами. Подчеркнем, что мы рассматриваем квадратичные формы в произвольном вещественном линейном пространстве. В § 6 будут изучены квадратичные формы в евклидовом пространстве и будет доказана возможность приведения каждой квадратичной формы к каноническому виду даже в ортонормированном базисе. Исходя из результатов главы 5 в том же § 6 настоящей главы будет получено новое доказательство теоремы о приведении квад- ратичной формы к каноническому виду в произвольном (не обя- зательно евклидовом) вещественном линейном пространстве. Настоящий же параграф посвящен не только доказательству возможности приведения квадратичной формы к каноническому


§ 3] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 193 виду, но и описанию двух методов такого приведения, имеющих большую практическую ценность и широко встречающихся в при- ложениях. Так как каждому преобразованию базиса отвечает невырож- денное линейное преобразование координат, а невырожденному преобразованию координат—преобразование базиса, то вопрос о приведении формы к каноническому виду можно решать путем выбора соответствующего невырожденного преобразования коор- динат. 1. Метод Лагранжа. Докажем следующую теорему. Теорема 7.3. Любая квадратичная форма А (х, х), заданная в п-мерном линейном пространстве L, с помощью невырожден- ного линейного преобразования координат может быть приведена к каноническому виду (7.13). Доказательство. Проведем доказательство теоремы методом Лагранжа. Основная идея этого метода заклю- чается в последовательном дополнении квадратного трехчлена по каждому аргументу до полного квадрата. Будем считать, что А (х, х) 0 *) и в данном базисе е = = (в1, е2, •••, еп) имеет вид А(х, х) = S а^. (7.14) /=i Убедимся, во-первых, что с помощью невырожденного преоб- разования координат форму А (х, х) можно преобразовать так, что коэффициент при квадрате первой координаты вектора х будет отличен от нуля. Если в данном базисе этот коэффициент отличен от нуля, то нужное невырожденное преобразование является тождественным. В случае, если ап = 0, но отличен от нуля коэффициент при квадрате какой-либо другой координаты, то с помощью перену- мерации базисных векторов можно добиться требуемого резуль- тата. Ясно, что перенумерация является невырожденным преоб- разованием. Если же все коэффициенты при квадратах координат равны нулю, то нужное преобразование можно получить следующим способом. Пусть, например, а12у=0**). Рассмотрим следующее невырожденное преобразование координат***): »=з,4......п. *) Если форма А (х, х) = 0, то ее матрица в любом базисе состоит из нуле- вых элементов, и поэтому такая форма по определению имеет канонический вид в любом базисе. **) Напомним, что А (х, х) Ф 0, и поэтому хотя бы один коэффициент аи отличен от нуля. ***) Определитель матрицы этого преобразования равен 2, и потому это преобразование невырожденное. 7 Зак 459
194 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 После этого преобразования коэффициент при V будет равен 2а1а и поэтому отличен от нуля. Итак, будем считать, что в соотношении (7.14) ап =# 0. Выделим в выражении (7.14) ту группу слагаемых, которые содержат |х. Получим А (х, х) — Оц^1 4- 2<2i2^i^2 4~ • • 4~ 2ai„|i£n 4~ 2 (7.15) i. /=2 Преобразуем выделенную группу слагаемых следующим об- разом: оц£1 4~ 2ai2?i?2 + • • • + 2ain?iln = <2ц 4- ~?2 4“ • • + ~^£л) — 2 2 °12 5-2 aln g2 n а12°1Э ts О а1П-10щ е Е --- — 62 — • • • — — 6п — А — 6263 — •••—/-------Sn-16л- au au alt ап Очевидно, выражение (7.15) можно теперь переписать так: 4(л, л) = ап(£1 + £Ч2+---+^ЪУ+ ЕШ (7.16) где а*, —коэффициенты при полученные после преобразо- вания. Рассмотрим следующее невырожденное преобразование коор- динат: Ъ = £1 + 1Л+-+-^п. Чг== ?2> Л л == Вл- С помощью этого преобразования и представления (7.16) для А {х, х) получим А(х, х) — ацт]1 4- U (7-17) i, 1=2 Итак, если форма А (х, х) =£ 0, то с помощью невырожден- ного преобразования координат эту форму можно привести к виду (7.17). п Обратимся теперь к квадратичной форме У! Яо-тьЛ/. Если эта I, 1=2 форма тождественно равна нулю, то вопрос о приведении А (х,х) п к каноническому виду решен. Если же форма J] 0> I. /=2 то мы можем повторить рассуждения, рассматривая преобразова- ния координат г]2, ..., т)п, аналогичные описанным выше, и не


$ 31 ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 195 меняя при этом координату i]i- Очевидно, такого типа преобра- зования координат т)ь т]2, т)п будут невырожденными. Ясно, что за конечное число шагов мы приведем квадратич- ную форму А (х, х) к каноническому виду (7.13) Отметим, что нужное преобразование исходных координат £i, £г> ••> можно получить путем перемножения найденных в процессе рассуждений невырожденных преобразований. Тео- рема доказана. Замечание!. Базис, в котором квадратичная форма имеет канонический вид, называется каноническим. Отметим, что канонический базис определен неоднозначно. Замечание 2. Если форма А (х, х) приведена к канони- ческому виду (7.13), то, вообще говоря, не все канонические коэф- фициенты X, отличны от нуля. Оставляя в (7.13) лишь отличные от нуля К, и перенумеровывая их заново, получим следующее выражение для А (х, х): А (х, х) = Х1Т]। 4~ Хат)! 4- • • • + С?-1®) Ясно, что k с п. Так как ранг квадратичной формы по опре- делению равен рангу ее матрицы в любом базисе, то из (7.18) и условия Xj =4= 0 при i — 1, 2, k вытекает, что ранг формы равен k. Таким образом, число отличных от нуля канонических коэффициентов равно рангу квадратичной формы. 2. Метод Якоби. При некоторых дополнительных предположе- ниях о квадратичной форме А (х, х) можно указать явные фор- мулы перехода от данного базиса е = (elt е2, еп) к канониче- скому базису [ = (ft, f2, ..., fa) и формулы для канонических коэффициентов Предварительно мы введем понятие треугольного преобразования базисных векторов. Преобразование базисных векторов elt е2, еп называется треугольным, если оно имеет следующий вид: Л = Ci, | /s = 4- ^2« I fa — a31^1 4“ «32^2 4-^3, (?• 19) fn -- anl£l 4- an2^2 4" • ” 4- ^71- Замечание. Так как определитель матрицы треугольного преобразования (7.19) отличен от нуля (равен 1), то векторы flt f2, fn образуют базис. Введем в рассмотрение угловые миноры матрицы А (е) = (а4Д коэффициентов формы А (х, х) в базисе е, обозначив их симво- лами Дх, Д2, .... Дп-j: Дх = аи, Д2 = |ап °12 I °21 °гг (7.20)
БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Справедливо следующее утверждение. Теорема 7.4. Пусть миноры Дп Д3, ..., An-1 матрицы (ац) квадратичной формы А (х, х} отличны от нуля. Тогда сущест- вует единственное треугольное преобразование базисных векторов <?i, е3.еп, с помощью которого форму А (х, х) можно при- вести к каноническому виду. Доказательство. Напомним, что коэффициенты biS формы А (х, х) в базисе j\, fn вычисляются по формулам = A (fh ft). Если форма А (х, х) в базисе /г fn имеет каноничес- кий вид, то bti = 0 при i j. Поэтому для доказательства тео- ремы достаточно построить с помощью треугольного преобразо- вания (7.19) такой базис /1( /3.../п, в котором будут выпол- няться соотношения A(ft, при j, или, что то же, при /</ (7.21) (при этом, конечно, надо убедиться, что искомое преобразование единственно). Если обратиться к формулам (7.19) для ft, то, используя линейное свойство квадратичной формы А (х, х) по каждому аргументу, легко заметить, что соотношения (7.21) будут выпол- нены, если будут выполнены соотношения *) A (elt = О, А (ег, Л) = 0, ..., Л (ем, /,) = 0, (7.22) / — 2, 3.......п. Запишем формулы (7.22) в развернутом виде. Для этого под- ставим в левые части этих формул выражение Л = апе1 + алА +•••+«/, + ei (7.23) для fj из соотношений (7.19). Используя далее свойство линей- ности А (х, х) по каждому аргументу и обозначение А (вь в]) = = atj, получим в результате следующую линейную систему уравнений для неизвестных коэффициентов ajK: ajlall + aJ2a12 + • • + aJ, J-lal, i-1 + aij — 0» ................................................................ (7.24) 1 + ai2ai-l, 2 + " ’ • + aA }-i + a}-l, i ~ 0. . Определитель этой системы равен Дм. По условию Д7_! =А= 0. Следовательно, система (7.24) имеет единственное решение. Таким •) Нетрудно убедиться, что из соотношений (7.21) следуют соотношения (7.22).


$ 3] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 197 образом, можно построить единственное треугольное преобразо- вание базисных векторов, с помощью которого форма А (х, х) приводится к каноническому виду. Теорема доказана. Приведем формулы, по которым можно вычислить коэффи- циенты ait искомого треугольного преобразования, и формулы для канонических коэффициентов X/. Обозначим символом ДЛ11 t минор матрицы располо- женный на пересечении строк этой матрицы с номерами 1, 2, ... .... / — 1 и столбцов с номерами 1, 2.i — 1, i + 1, ..., /. Тог- да, обращаясь к системе (7.24) и используя формулы Крамера, получим следующее выражение для ая: п ( \\l+i i-'-i (7.25) Займемся вычислением канонических коэффициентов Так как X, = b)} = A (fj, fj), то из выражения (7.23) для f} и формул (7.22) получаем — A (fb fi)~A (ajiei + +•••+«>, + Cj, fj) — = A (e}, fj) — A (Cj, ccjjCj. + a72e2 +•••+«;, + fy) — — aJlal} + a>2a2> +•••+«>. j 4“ aJi- Подставляя выражение (7.25) для an в правую часть последнего соотношения, найдем X; = ((— 1)/+*а1^Д^_1,14- (— iy+2a2jA?-i.2+ • • • ... (— 1)2/ 1 аууДу_х) ДДь Числитель последнего соотношения представляет собой сумму произведений элементов строки с номером / в определителе Д/ на алгебраические дополнения этих элементов в указанном оп- ределителе. Следовательно, этот числитель равен Ду. По- этому Kj==^ 1 = (7-26) Так как = А (/ь /i) = A (elt ех) = ап = Дь то отсюда и из (7.26) получаем следующие формулы для канонических коэффи- циентов: 1 ___ А 1 _ 1 — дГ’ •••’ Ап—Дп.1 • (7.27)
198 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 § 4. Закон инерции квадратичных форм. Классификация квадратичных форм 1. Закон инерции квадратичных форм. Мы уже отмечали (см. замечание 2 п. 1 предыдущего параграфа), что ранг квадра- тичной формы равен числу отличных от нуля канонических коэф- фициентов. Таким образом, число отличных от нуля каноничес- ких коэффициентов не зависит от выбора невырожденного преоб- разования, с помощью которого форма А (х, х) приводится к ка- ноническому виду. На самом деле при любом способе приведения формы А (х, х) к каноническому виду не меняется число поло- жительных и отрицательных канонических коэффициентов. Это свойство называется законом инерции квадратичных форм. Прежде чем перейти к обоснованию закона инерции, сделаем некоторые замечания. Пусть форма А (х, х) в базисе е = (еь е2, ..., еп) опреде- ляется матрицей А (е) — (ао): А(х, х) = S (7.28) I, i=i где gj, ..., —координаты вектора х в базисе е. Допустим, что эта форма с помощью невырожденного преобразования коор- динат приведена к каноническому виду А(х, х) = li(i? I2P-2 -|- • • • + IfeM-I» (7.29) причем lj, 1», .... 1*—отличные от нуля канонические коэф- фициенты, занумерованные так, что первые q из этих коэффи- циентов положительные, а следующие коэффициенты — отрица- тельные: 11 0, 12 0, .. , 19 > 0, lfl+i 0, ..., 1ft <с 0. Рассмотрим следующее невырожденное преобразование коор- динат (ij*): 4.-j7=>4,.... л.=7=-и., ..........=7=ТТ,1‘' Ла+1 = Ш+1> • • •» Пл = Ил- (7 30) В результате этого преобразования форма А (х, х) примет вид Л (л, х) = т]? + т)2 + • • • + И? — Лн-i — • • • — Пь (^.31) называемый нормальным видом квадратичной формы. *) Легко видеть, что определитель этого преобразования отличен от нуля.


5 4] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ. КЛАССИФИКАЦИЯ 199 Итак, с помощью некоторого невырожденного преобразования координат 5г.......In вектора х в базисе е = (ех, е2, .... еп) Л/ = “<i£i + Н---------F «иЕп, (7.32) i=l, 2..... п, det (al7) =£0 (это преобразование представляет собой произведение преобра- зований £вр.ир,вт]по формулам (7.30)) квадратичная форма может быть приведена к нормальному виду (7.31). Докажем следующее утверждение: Теорема? .5 (закон инерции квадратичных форм). Чис- ло слагаемых с положительными {отрицательными) коэффициен- тами в нормальном виде квадратичной формы не зависит от способа приведения формы к этому виду. Доказательно. Пусть форма А (х, х) с помощью невы- рожденного преобразования координат (7.32) приведена к нор- мальному виду (7.31) и с помощью другого невырожденного пре- образования координат приведена к нормальному виду А(х, *) = £? + $+------------------------& (7.33) Очевидно, для доказательства теоремы достаточно убедиться в справедливости равенства р = q. Пусть р > q. Убедимся, что в этом случае имеется ненулевой вектор х такой, что по отношению к базисам, в которых форма А (х, х) имеет вид (7.31) и (7.33) координаты Л1, т]2, ...» т]? и £р+1, •••» этого вектора равны нулю: Л1 = °» Т]2= 0, ..., Т]. = О, U1 = O. •••> Сп = 0. (7.34) Так как координаты т|4 получены путем невырожденного преобразования (7.32) координат £х, ..., |п, а координаты — с помощью аналогичного невырожденного преобразования этих же координат £х, ..., gn, то соотношения (7.34) можно рассматри- вать как систему линейных однородных уравнений относительно координат gx, ..., искомого вектора х в базисе е —{еъ ег, .... еп) (например, в развернутом виде соотношение Л1 = 0 имеет, сог- ласно (7.32), вид <хх1£х + aX2g2 + ... + alngn = 0). Так как р > <7, то число однородных уравнений (7.34) меньше п, и поэтому система (7.34) имеет ненулевое решение относительно координат ......искомого вектора х. Следовательно, если р > q, то существует ненулевой вектор х, для которого выполняются соот- ношения (7.34). Подсчитаем значение формы А (х, х) для этого вектора х. Обращаясь к соотношениям (7.31) и (7.33), получим Л (х, х) = — Л«4-1 — • • • — Л* = £? + й + • • • + £₽•
200 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Последнее равенство может иметь место лишь в случае т]?+1 = = ... = т|л ~ 0 и ?i = = ... = £р = 0. Таким образом, в неко- тором базисе все координаты £1( £„ .... £п ненулевого вектора х равны нулю (см. последние равенства и соотношения (7.34)), т. е. вектор х равен нулю. Следовательно, предположение р > q ведет к противоречию. По аналогичным соображениям ведет к противоречию и предположение р <q. Итак, р = q. Теорема доказана. 2. Классификация квадратичных форм. В п. 1 § 2 этой главы (см. определение 2) были введены понятия положительно опре- деленной, отрицательно определенной, знакопеременной и квази- знакоопределенной квадратичных форм. В этом пункте с помощью понятий индекса инерции, поло- жительного и отрицательного индексов инерции квадратичной формы мы укажем, каким образом можно выяснить принадлеж- ность квадратичной формы к тому или иному из перечисленных выше типов. При этом индексом инерции квадратичной формы мы будем называть число отличных от нуля канонических коэф- фициентов этой формы (т. е. ее ранг), положительным индексом инерции —число положительных канонических коэффициентов, отрицательным индексом инерции —число отрицательных кано- нических коэффициентов. Ясно, что сумма положительного и отрицательного индексов инерции равна индексу инерции. Итак, пусть индекс инерции, положительный и отрицательный индексы инерции квадратичной формы А (х, х) соответственно равны k, р и q (k = р + q). В предыдущем пункте было доказано, что в любом каноническом базисе / = (/р /2, ..., /„) эта форма может быть приведена к следующему нормальному виду: А (л, X) = tji 4* т,2 4* • • • 4* т\р — т]р4-1 — • • • — т)*, (7.35) где т)!, т]2, .... т]п —координаты вектора х в базисе /. 1°. Необходимое и достаточное условие знакоопределенности квадратичной формы. Справедливо следующее утверждение: Для того чтобы квадратичная форма А (х, х), заданная в п-мерном линейном пространстве L, была знакоопределенной, необходимо и достаточно, чтобы либо положительный индекс инерции р, либо отрицательный индекс инерции q был равен раз- мерности п пространства L. При этом, если р — п, то форма положительно определенная, если же q = п, то форма отрицательно определенная. Доказательство. Так как случаи положительно оп- ределенной формы и отрицательно определенной формы рассма- триваются аналогично, то доказательство утверждения проведем для положительно определенных форм.


5 4] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ. КЛАССИФИКАЦИЯ 201 1) Необходимость. Пусть форма А (х, х) положи- тельно определена. Тогда выражение (7.35) примет вид Л(л, X) =Т)1 + nN-----F Пр- Если при этом р < п, то из последнего выражения следует, что для ненулевого вектора х с координатами Hi= 0, Па= 0, ..., т]р = 0, Пр+i ' > Нп 0 форма А (х, х) обращается в нуль, а это противоречит определе- нию положительно определенной квадратичной формы. Следо- вательно, р = п. 2) Достаточность. Пусть р = п. Тогда соотношение (7.35) имеет вид А (х, х) = н? + Пг + ••• + П«- Ясно, что Л (х, х) 2s 0, причем, если Л = 0, то Hi = Па = ... = Пи — 0> т. е. вектор х нулевой. Следовательно, Л (х, х) — положительно определенная форма. Замечание. Для выяснения вопроса о знакоопределен- ности квадратичной формы с помощью указанного признака мы должны привести эту форму к каноническому виду. В следующем пункте мы докажем критерий Сильвестра зна- коопределенности квадратичной формы, с помощью которого можно выяснить вопрос о знакоопределенности формы, заданной в любом базисе без приведения к каноническому виду. 2°. Необходимое и достаточное условие знакопеременности квадратичной формы. Докажем следующее утверждение: Для того чтобы квадратичная форма была знакопеременной, необходимо и достаточно, чтобы как положительный, так и отри- цательный индексы инерции этой формы были отличны от нуля. Доказательство. 1) Необходимость. Так как знакопеременная форма принимает как положительные, так и отрицательные значения, то ее представление (7.35) в нормаль- ном виде должно содержать как положительные, так и отрицатель- ные слагаемые (в противном случае эта форма принимала бы либо неотрицательные, либо неположительные значения). Следователь- но, как положительный, так и отрицательный индексы инерции отличны от нуля. 2) Достаточность. Пусть д =И= 0 и q 0. Тогда для вектора хг с координатами t]i 0, ..., т]р 0, т)р+1 = 0, ... .... Пп = 0 имеем А (хх, х^ > 0, а для вектора х2 с координатами П1 — 0...п₽ = 0, Пр+i =/= 0. Пп ¥= 0 имеем А (х2, хг) < 0. Следовательно, форма А (х, х) является знакопеременной. 3°. Необходимое и достаточное условие квазизнакоопределен- ности квадратичной формы. Справедливо следующее утверждение:
202 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Для того чтобы форма А (х, х) была квазизнакоопределенной, необходимо и достаточно, чтобы выполнялись соотношения: либо р < п, q = 0, либо р = 0, q < п. Доказательство. Мы рассмотрим случай положи- тельно квазизнакоопределенной формы. Случай отрицательно квазизнакоопределенной формы рассматривается аналогично. 1) Необходимость. Пусть форма А (х, х) положи- тельно квазизнакоопределенная. Тогда, очевидно, q = 0 и р < п (если бы р = п, то форма была бы положительно определенной). 2) Достаточность. Если р < п, q = 0, то А (х, х) 0 и для ненулевого вектора х с координатами т)1 = 0, ..., т]р = 0, Лр+i 0. ••> Лп ¥= 0 имеем А (х, х) = 0, т. е. А (х, х) — поло- жительно квазизнакоопределенная форма. 3. Критерий Сильвестра*) знакоопределенности квадратичной формы. Пусть форма А (х, х) в базисе е = (elt е2, ...» еп) опреде- ляется матрицей А (е) = (а,;): п А (х, л) = £ a^fo, t, /“1 аи• . . ат л А 011 °12 А и пусть Д1 = Оц, Д2 = ,..., Дп== I “21 “22 ’ вые миноры и определитель матрицы (а1}). ............ — угло- ап1 . . апп Справедливо следу- ющее утверждение: Теорема 7.6 (критерий Сильвестра). Для того чтобы квадратичная форма А (х, х) была положительно определенной, необходимо и достаточно, чтобы были выполнены неравенства Aj > 0, Д2 > 0...... Дп > 0. Для того чтобы квадратичная форма была отрицательно определенной, необходимо и достаточно, чтобы знаки угловых миноров чередовались, причем Дх < 0. Доказательство. 1) Необходимость. Дока- жем сначала, что из условия знакоопределенности квадратичной формы А (х, х) следует Д( =/= 0, i = 1, 2, ..., п. Убедимся, что предположение Дй = 0 ведет к противоречию — при этом предположении существует ненулевой вектор х, для которого А (х, х) = 0, что противоречит знакоопределенности формы. Итак, пусть Дй = 0. Рассмотрим следующую квадратную од- нородную систему линейных уравнений: °U?1 + °12^2 + ’ • • + alk%k = о, й21£1 4" й22?2 4" • ’ ’ 4" a2klh — 0, (7.36) °ai£i 4- ам£г 4- • • • 4- akklk — 0. *) Джемс Джозеф Сельвестр (1814 — 1897) — английский математик.


§ 5] ПОЛИЛИНЕЙНЫЕ ФОРМЫ 203 Так как Дй — определитель этой системы и Ah =0, то система (7.36) имеет ненулевое решение |2, • ••> (не все h равны нулю). Умножим первое из уравнений (7.36) на второе на g2, ..., последнее на и сложим полученные соотношения. В результате k получим равенство У а17^^=0, левая часть которого представ- i. /=i ляет собой значение квадратичной формы А (х, х) для ненулевого вектора х с координатами (|ъ g2, .... 0, ..., 0). Это значение равно нулю, что противоречит знакоопределенности формы. Итак, мы убедились, что А, =#= 0, i = 1, 2, ..., п. Поэтому мы можем применить метод Якоби приведения формы А (х, х) к сумме квадратов (см. теорему 7 4) и воспользоваться формулами (7.27) для канонических коэффициентов X,. Если А (х, х) —по- ложительно определенная форма, то все канонические коэффи- циенты положительны. Но тогда из соотношений (7.27) следует, что Aj >0, Д2 >0, ..., Дп >0. Если же А (х, х) —отрица- тельно определенная форма, то все канонические коэффициенты отрицательны. Но тогда из формул (7.27) следует, что знаки угло- вых миноров чередуются, причем Дх < 0. 2) Достаточность. Пусть выполнены условия, нало- женные на угловые миноры А, в формулировке теоремы. Так как Дг =4 0, 1 = 1, 2, .... л, то форму А можно привести к сумме квадратов методом Якоби (см. теорему 7.4), причем канонические коэффициенты X, могут быть найдены по формулам (7.27). Если Дх >0, Д2 > 0, ..., Дп > 0, то из соотношений (7.27) следует, что все > 0, т. е. форма А (х, х) положительно определенная. Если же знаки Дг чередуются и <0, то из соотношений (7.27) следует, что форма А (х, х) отрицательно определенная. Теорема доказана. § 5. Полилинейные формы Определение. Полилинейной формой А (хи х2, .... хр) р век- торных аргументов называется числовая функция, определенная на всевозможных векторах xlt х2, ..., хр, линейного пространства L и линейная по каждому из аргументов, при фиксированных значе- ниях остальных аргументов. Простейшим примером полилинейной формы может служить произведение линейных форм А (х,) А (х2) ... А (хр). Полилинейная форма A (xlt х2, .... хр) называется симме- тричной (кососимметричной), если для каждых двух ее аргумен- тов xh и xt и для любых значений этих аргументов выполняется соотношение ("®i> • • • > •••> Хь • • • > Jtp)== ^4 • • • > &i, ..., хк,~..., Хр) (A(xit ...,xk, ...,xh ...,Xp) = — A(xlt ...,xt.xh.....xp)).
204 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Пусть полилинейная форма А (xit х2, хр) задана в ко- нечномерном линейном пространстве L, и пусть е1( е2, .... еп — базис в L. Обратимся к разложению, каждого вектора Xi по базис- ным векторам еи е2, eni п Xi = • • • + ^tnen — S i=L 2, (7.37) /=i Подставляя выражения для xt по формулам (7.37) в полили- нейную форму A (xlt хг, ...,хр) и используя свойство линейно- сти этой формы по каждому аргументу, получим A(xlt х2, ...,хр) = А ( п — S 51/.52J, • • • /.. А......./р=1 1 4 ^/2> •••> ^_^p]pOjpj ~ Ъ>РА(?Н' е,г....е]р). (7.38) Таким образом, значения полилинейной формы А (Х1Г х2>... хр) в конечномерном пространстве с выделенным базисом eif е2, .... еп определяются всевозможными значениями А (е^, ej.......... е/р) этой формы на векторах e/v ..., в/р. Докажем следующее утверждение: Теорема 7.7. Любая полилинейная кососимметричная форма A (Xi, х2, .... хп) заданная в п-мерном линейном пространстве L с выделенным базисом еи е2, .... еп может быть представлена в виде A (xlt х2.........хп) 511 51я • • • 51п 511 5м • • • 5«п 5ni 5м • • • 5пп (7.39) где а = А (еп е2.....еп), а (Бп> 5и. ...» — координаты вектора xt в базисе е2, е2..еп. Доказательство. Так как форма A (Xi, х2, ...,хп) является кососимметричной, то для произвольной перестановки Он /а» •••> in) индексов (1, 2, п) имеем А(eh> eh> •••> e^n)= (li'h........,П)Л(вк е2, .... еп) = = (— 1)"(,р ..... а, (7.40) к •••» in) —число беспорядков в перестановке (/i, где N (/1. /а, /а» /п)«


ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 206 § 6J В силу кососимметричности формы для двух одинаковых индексов jhnji (jh = jt) значение Л (еУ1, ...» e]k.e}l, .... eJn) равно нулю. Отсюда и из соотношения (7.40) следует, что для рассматриваемого случая соотношение (7.38) примет вид А(х1г хг, .... хп) = а S (— ...--lnjn. /'1> /г> •••' /п-1 •41) Сравнивая формулу (7.41) в формулой (1.28) гл. 1 для опреде- лителя порядка п, мы убедимся в справедливости соотношения (7.39). Теорема доказана. § 6. Билинейные и квадратичные формы в евклидовом пространстве В предыдущих параграфах мы изучали билинейные и квадра- тичные формы в произвольном (не обязательно евклидовом) веще- ственном линейном пространстве L. В этом параграфе мы получим ряд сведений о билинейных и квадратичных формах, заданных в вещественном евклидовом пространстве. При этом мы будем широко пользоваться результатами § 9 гл. 5, посвященного ли- нейным операторам. В п. 3 настоящего параграфа будет показано, каким образом теория евклидовых пространств может быть применена для по- лучения содержательных результатов в произвольных линейных пространствах. В частности, нами будет получено независимое до- казательство теоремы о том, что каждая квадратичная форма в линейном пространстве может быть приведена к каноническому виду. 1. Предварительные замечания. В этом пункте мы напомним некоторые понятия теории линейных операторов. Пусть V —n-мерное вещественное евклидово пространство и А — линейный оператор, действующий из V в V. Оператор А* называется сопряженным к А, если для всех х С V и у С V выполняется равенство (Ах, у) = (х, Л*у). (7.42) Оператор А называется самосопряженным, если А = А*, т. е. если для всех х £ V и у £ V (Ах, у) = (х, Ау). (7.43) Рассмотрим билинейную форму В (х, у), заданную в евкли- довом пространстве V. В главе 5 было установлено, что каждой такой форме В (х, у) однозначно соответствует линейный опера- тор такой, что справедливо равенство В (х, у) = (Ах, у). (7.44)
206 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (ГЛ. 7 Кроме того, в теореме 5 33 было доказано, что билинейная форма В (х, у) является симметричной тогда и только тогда, когда оператор А, фшурирующий в (7 44), является самосопря- женным. Напомним также, что в теореме 5.35 для любого самосопря- женного оператора А было доказано существование ортонорми- рованного базиса из собственных векторов Это означает, что существуют ортонормированная система еь е2, .... еп и вещест- венные числа Ij, Х2, Хп такие, что Лвл = У-кек. (7.45) Отметим, что в базисе матрица оператора А имеет диаго- нальный вид. 2. Приведение квадратичной формы к сумме квадратов в ортогональном базисе. Пусть В (х, у) —симметричная били- нейная форма, заданная в вещественном евклидовом пространстве V, а В (х, х) — определяемая ею квадратичная форма. Докажем следующую теорему о приведении квадратичной формы В (х, х) к сумме квадратов. Теорема 7.8. Пусть В (х, у) —симметричная билинейная форма, заданная в евклидовом пространстве V. Тогда в простран- стве V существует такой ортонормированный базис и можно указать такие вещественные числа что для любого х £ V ква- дратичная форма В (х, х) может быть представлена в виде следую, щей суммы квадратов координат вектора х в базисе В(л, (7.46) k=t Доказательство. Так как В (х, у) — симметричная билинейная форма, то существует самосопряженный оператор А такой, что В(х, у) = (Ах, у). (7.47) По теореме 5.35 для оператора А можно указать ортонорми- рованный базис {eft| из собственных векторов этого оператора; пусть —собственные значения, отвечающие ел. Пусть вектор х имеет в базисе ек координаты %к: (7-48) Тогда, очевидно, поскольку ек —собственные векторы опе- ратора А: Ах — S Ь£кек. (7.49) п х = s %кек.


$ 6] ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 207 Из соотношений (7.48) и (7.49) вследствие ортонормирован- ности базиса получаем следующее выражение для скаляр- ного произведения (Ах, х): (Ах, х) = S (7.50) Отсюда и из соотношения (7.47) получаем (7.46). Теорема до- казана. 3. Одновременное приведение двух квадратичных форм к сумме квадратов в линейном пространстве. Докажем теперь важную теорему об одновременном приведе- нии двух квадратичных форм к сумме квадратов в произвольном (не обязательно евклидовом) вещественном линейном пространстве. Теорема 7.9. Пусть А (х, у) и В (х, у) — симметричные би- линейные формы, определенные в вещественном линейном простран- стве V. Допустим далее, что для всех х £ V, х =/= Q, справедливо неравенство В (х, х) >0 (т. е. квадратичная форма В (х, х) — положительно определенная). Тогда в пространстве V можно ука- зать базис такой, что квадратичные формы А (х, х)и В (х, лс) могут быть представлены в виде А(х, х)^^^. (7.51) £=1 В(х, .*) = £& (7.52) fe=i где Вй —координаты вектора х в базисе Доказательство. Согласно замечанию в конце § 2 этой главы скалярное произведение в конечномерном веществен- ном пространстве может быть задано с помощью билинейной формы В (х, у), полярной к положительно определенной квадратичной форме В (х, х). Поэтому мы можем ввести в линейном пространстве V скаляр- ное произведение (х, у) векторов х и у, полагая (х, у) — В(х, у) (7.53) Таким образом, V представляет собой евклидово пространство со скалярным произведением (7.53). По теореме 7.11 можно ука- зать такой ортонормированный базис и такие вещественные числа что в этом базисе квадратичная форма А (х, х) предста- вляется в виде (7.51). С другой стороны, в любом ортонормированном базисе ска- лярное произведение (х, х), равное, согласно (7.53), В (х,х), представляется в виде суммы квадратов координат вектора х. Таким образом, представление В (х, х) в виде (7.52) в базисе (ей) также обоснованно. Теорема доказана.
208 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Замечание. Из доказанной нами теоремы непосредст- венно следует, что любую квадратичную форму в произвольном вещественном линейном пространстве можно привести к канони- ческому виду. Однако способ такого приведения является, вообще говоря, более сложным, чем способы, изложенные выше в § 3, поскольку он требует нахождения всех собственных векторов неко- торого самосопряженного оператора (см. по этому поводу гл. 6). 4. Экстремальные свойства квадратичной формы. Рассмотрим произвольную дифференцируемую функцию f, определенную на некоторой гладкой поверхности S (см. определение гладкой по- верхности в гл. 5 части 2 «Основ математического анализа»). Будем говорить, что точка х0 поверхности S является стационар- ной точкой функции f, если в точке х0 производная функции f по любому направлению на поверхности S равна нулю. В част- ности, точки экстремума функции f являются ее стационарными точками. Значение f (х0) функции f в стационарной точке х0 называется стационарным значением. Иногда стационарную точку х0 функции f называют ее критической точкой, а величину f (х0) — критическим значением. В этом пункте мы исследуем вопрос о стационарных и, в частности, экс- тремальных значениях квадратичной формы В (х, х) на сфере единичного радиуса в евклидовом пространстве V и о связи этих значений с собственными значениями самосопряженного опера- тора А, с помощью которого симметричная билинейная форма В (х, у), полярная квадратичной форме В (х, х), представляется в виде В(х, у) = (Ах, у). (7.54) При этом единичной сферой в V мы будем называть множество тех векторов х £ V, которые удовлетворяют уравнению (х, х)=\ или ||х ||=1. (7.55) Для упрощения рассуждений мы воспользуемся выводами предыдущего пункта о приведении квадратичной формы к сумме квадратов. Итак, пусть В (X, х) — квадратичная форма, В (х, у) — поляр- ная этой форме билинейная форма, А —самосопряженный опера- тор, связанный с В (х, у) соотношением (7.54). По теореме 7.8 в ортонормированном базисе {в/Д. состоящем из собственных векторов оператора А, квадратичная форма В (х, х) имеет вид В(х, *)=£&*& (7.56) 4=1


$ 61 ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 209 где —координаты вектора х в базисе {ей}, а Ак—собственные значения оператора А. Мы договоримся нумеровать эти собствен- ные значения в порядке убывания: Ai 5г А2 2» • • • 5з Ап. (7.57) Заметим, что в выбранном базисе единичная сфера, определяе- мая уравнением (7.55), в координатах вектора х задается уравне- нием £Й-1=о, <7-58) *=1 Докажем следующую теорему. Теорема 7.10. Стационарные значения квадратичной формы В(х, х) на единичной сфере (7.55) равны собственным значениям Аа оператора А. Эти стационарные значения достигаются, в част,' ности, на единичных собственных векторах eh оператора А. Доказательство. Так как речь идет о стационарных значениях функции В (х, х) при условии (х,х) = 1, т. е. об услов- ном экстремуме этой функции, то мы можем воспользоваться методом неопределенных множителей Лагранжа (см. «Основы ма- тематического анализа» часть I, п. 2, § 5, гл. 15). Составим для функции В (х, х), используя ее выражение (7.56) в данном базисе {вл}, функцию Лагранжа V (h, &2, ..., £п), учитывая при этом, что уравнение связи имеет вид (7.58). Получим ¥= Е АаЙ-А Й-1), (7.59) *=1 \л=1 / где А — неопределенный множитель Лагранжа. Напомним, что если А в (7.59) выбрано так, что при условии (7.58) выполняются соотношения д'? ^ = 0, Л=1, 2, ...,п, (7.60) то в точках сферы (7.58), отвечающих этим значениям А, функция В (х, х) (квадратичная форма В (х, х)) имеет стационарное значе- ние. Таким образом, вопрос о стационарных значениях В (х,х) на сфере (х, х) = 1 редуцируется к исследованию системы уравне- ний (7.58), (7.60) относительно неизвестных А и координат £2, ... .... Вп вектора х. Отметим, что при этом g2, ..., gn будут коор- динатами того вектора х, на котором В (х, х) будет иметь стацио- нарное значение.
210 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Так как = 2 (kh —X) то интересующая нас система (7.58), (7.60) примет вид (7.61) (kh — X) = 0, k = 1, 2, ..., n. . Пусть система (7.61) имеет решение % = X, х — (5i, |2> • • • > £п). Умножая каждое из соотношений (Xft — X) = 0 на сум- п мируя затем полученные соотношения и учитывая, что У, 51 = 1» fc=i получим, согласно (7.56), следующее значение для Л: Х = S lkl2k = B(x, х). Л=1 Таким образом, если X и х = (5ц 52, .... 5П) — решение систе- мы (7.61), то к равно значению квадратичной формы В(х,х) на векторех = (5i, 1г, .... 1п), на котором эта форма имеет ста- ционарное значение. Легко видеть, что решениями системы (7.61) служат следующие значения неизвестных X и 5р Х = Х4; 51 = 0....gA_i = 0, 5ft=l, Ui = 0......5n = 0, k = 1, 2, ..., n. Очевидно, эти решения являются собственными значениями Xft и координатами соответствующих собственных векторов eh. Тео- рема доказана. Замечание. Мы только что выяснили, что собственные значения Xft являются стационарными значениями квадратичной формы В (х, х) на сфере (х, х) = 1. Оказывается, числа Xj и Хл (при условии (7.57)) являются соот- ветственно наибольшим и наименьшим значениями В (х, х) на сфере (х, х) = 1 (то, что эти значения достигаются, установлено выше). Чтобы убедиться в справедливости замечания, достаточно заменить в (7.56) все Xfc сначала на Хп, а затем на X, и воспользо- ваться соотношениями (7.57) и (7.58). Очевидно, получим неравенства Хп < В (х, х) < Хх.


§ 7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 211 § 7. Гиперповерхности второго порядка В этом параграфе мы познакомимся с понятием и основными типами гиперповерхностей второго порядка. Кроме того, будут указаны способы исследования таких поверхностей. 1. Понятие гиперповерхности второго порядка. Пусть V — п-мерное вещественное евклидово пространство. Ради геометрической наглядности будем называть векторы х этого пространства точками. Гиперповерхностью S второго порядка будем назы- вать геометрическое место точек х, удовлетворяющих уравнению вида А (х, х) + 2В (х) 4- с = 0, (7.62) где А (х, х) — не равная тождественно нулю квадратичная форма, В (х) —линейная форма, а с —вещественное число. Уравнение (7.62) будем называть общим уравнением гиперповерхности второго порядка. Выделим в пространстве V какой-либо ортонормированный базис |ей}. Координаты вектора х (точки х) в этом базисе обозна- чим через (xlt хг, ..., хп). Тогда (см. п. 2. § 1 этой главы) квадра- тичная форма А (х, х) может быть представлена в виде и Л (л, х) — S alkXjXk, (7.63) /. Л=1 где aJh = A(ej, ек) (7.64) и А (е}, ek) — значение на векторах е} и ек симметричной били- нейной формы А (х, у), полярной квадратичной форме А (х, х). Линейная форма В (х) в указанном базисе представляется в виде *) В(х)=ЬЛ (7.65) Таким образом, общее уравнение гиперповерхности второго по- рядка в евклидовом пространстве V с выделенным базисом \eh\ мо- жет быть представлено в следующей формех п п S ajkXjXb 4~ 2 bhxh с = 0. (7.66) Договоримся о следующей терминологии. *) Согласно лемме п. 1 § 4 гл. 5 линейная форма В (х) может быть пред- ставлена в ваде В (х) =» (х, о), где Ь — постоянный вектор. Обозначая £>t, Ьг,... ..., Ьп координаты вектора Ь и учитывая ортонормированность базиса {ёь}, мы получим представление В (х) в виде (7.65).
212 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 (7.67) л Слагаемое А (л, л) = S ajkxixk будем называть группой /,*=1 старших членов уравнения (7.62) или (7.66). п Группу слагаемых В (л) + с = £ bhxh + с будем называть Й=1 линейной частью уравнения (7.62) или (7.66). Мы будем рассматривать в дальнейшем матрицы / <711 . . . О1П ан ... ат \ / ... .......... ............I и В = 1 ащ ... аПп/ \ani • • • Ьп '01 ... Ьп с и определители det Л и det В этих матриц. Исследование гиперповерхностей второго порядка мы будем проводить с помощью метода, сходного с методом, применяемым в аналитической геометрии при исследовании кривых и поверх- ностей второго порядка, заданных общими уравнениями. Идея этого метода заключается в том, что путем выбора спе- циальной декартовой системы координат на плоскости (для кри- вых второго порядка) или в пространстве (для поверхностей вто- рого порядка) достигается максимальное упрощение уравнения кривой или поверхности. Затем путем исследования этого уравне- ния выясняются геометрические свойства кривой или поверх- ности. Кроме того, перечисление всех возможных типов простей- ших (канонических) уравнений кривых или поверхностей второго порядка позволяет дать их классификацию. Чтобы использовать этот метод в многомерном случае, мы сна- чала должны изучить такие преобразования (отображения) п-мер- ного евклидова пространства, которые представляют собой ана- логи преобразований декартовых прямоугольных координат в случае двух и трех измерений. Такими преобразованиями в n-мерном случае будут параллель- ные переносы и такие преобразования базисов, при которых орто- нормированный базис переходит в новый ортонормированный ба- зис. Точные определения этих преобразований будут даны в сле- дующем пункте. Очевидно, гиперповерхность второго порядка, рассматривае- мая как геометрический объект пространства V, не изменяется, если производится преобразование указанного выше вида. Ниже мы убедимся, что для каждого уравнения вида (7.62) (или (7.66)) можно выбрать такое начало координат и выбрать такой ортонор- мированный базис в V, что это уравнение, записанное в коорди- натах относительно нового базиса, будет максимально простого вида, и поэтому, как и в случае двух и трех измерений, можно будет указать геометрические характеристики таких поверхностей и дать им классификацию.


S 71 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 213 2. Параллельные переносы в евклидовом пространстве. Пре- образования ортонормированных базисов в ортонормированные. Параллельным переносом в евклидовом простран- стве V мы будем называть преобразование, задаваемое формулами х = х’ + х, (7.68) где х—фиксированная точка, называемая новым началом коор- динат. Пусть точки х,х' и х имеют координаты, соответственно рав- ные (хь х2, .... хп), (х{, х2,.... Хп) и (Х1, х2, .... Хп). Тогда в координатах параллельный перенос определяется фор- мулами Xk = x’k + Xk, k= 1, 2, ..., n. (7.69) Отметим, что при параллельном переносе любой фиксирован- ный базис не изменяется. Перейдем теперь к выяснению характеристики преобразова- ния ортонормированного базиса в ортонормированный. Допустим, что ортонормированный базис {еЛ} преобразуется в новый ортонормированный базис {е*}. Разложим каждый век- тор е'ь по векторам Получим б| = PllCt 4* р21^2 + • • • + Рп1Сп> е2 = pi26\ 4* р22е2 4“ • ’ • 4“ РтСщ сп — PinCi 4~ PinCi 4~ • • • 4~ Рппвп- Обозначим буквой Р матрицу преобразования (7.70): (Р11 Ptl ... Pni \ Pit Рю ... Pnt 1 (7.71) Pin Pin ... Рпп / Так как базисы и ортонормированные, то из (7.70) путем скалярного умножения е] на е’ь получим . , Л в (1 при j = k, (б/, ек)=* S PmiPmk — 6/* = | k (7.72) I U при J К» Рассмотрим теперь транспонированную матрицу Р', т. е. матрицу, полученную из Р перестановкой строк и столбцов. Очевидно, согласно (7.72), РР' = Р'Р = /, (7.73) где / —единичная матрица.
214 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 1ГЛ. 7 Равенства (7.73) показывают, что матрица Р' является обрат- ной для матрицы Р, т. е. Р-1 = Р'. (7.74) Допустим теперь, что мы рассматриваем преобразование орто- нормированного базиса по формулам (7.70), причем матрица Р этого преобразования удовлетворяет условию (7.73) (или, что то же, (7.74)). Тогда очевидно, элементы pjh матрицы Р удовлетворяют усло- вию (7.72), что согласно этим же соотношениям (7 72), эквивалентно условию ортонормированности базиса Напомним, что в § 9 гл. 5 матрицу Р, удовлетворяющую усло- вию (7.73), мы назвали ортогональной. Итак, для того чтобы преобразование (7.70) было преобразова- нием ортонормированного базиса в ортонор мированный, необхо- димо и достаточно, чтобы матрица Р этого преобразования была ортогональной. Замечание. Обращаясь к формулам (5.14) преобразова- ния координат вектора при преобразовании базиса (см п 1, § 2, гл. 5) и учитывая, что обратная матрица для ортогональной ма- трицы Р есть матрица Р', получим следующие формулы преобра- зования координат точки х при переходе от ортонормированного базиса к ортонормированному: Х1 — PllX\ 4" Р\2Х2 4” • • • 4” PlnXnf Х2 — Р2\Х\ 4- Р22х2 4- • • 4- P2nXni (7.75) хп = Рп\Х\ 4" Рп2Х2 4- ' • 4- РппХп- 3. Преобразование общего уравнения гиперповерхности вто- рого порядка при параллельном переносе. Рассмотрим параллель- ный перенос, который определяется как преобразование простран- ства V по формуле (7.68) (или в координатах по формуле (7.69)). Левая часть (7.62) после подстановки вместо х его выраже- ния по формуле (7.68) в силу линейности квадратичной формы по первому и второму аргументу *) и свойств линейной формы примет следующий вид: А (х', х') 4- 2 (Л (х', х) + В (х’У] 4- JA (х, х) 4- 2В (х) 4- с] = 0. *) Квадратичная форма А (х, х) связана с симметричной билинейной фор- мой А (х, у), полярной к форме А (х, х). Билинейная форма А (х, у) линейна по аргументам х и у. Фигурирующее в дальнейшем тексте выражение А (х'.х) представляет собой значение формы А (х, у) на векторах х' и х.


$ 7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 215 Итак, общее уравнение (7.62) гиперповерхности S при парал- лельном переносе (7.68) запишется в форме А (х', х') + 2В(х') + с' — 0, (7.76) где линейная форма В' (х') и постоянное число с' определяются соотношениями В' (х') = А (х', х) + В (х'), (7.77) с' = А (х, х) + 2В (х) + с. (7.78) Запишем полученные формулы в координатах. Пусть координаты точек х' их равны соответственно х[, Хг, ... ..., х„ и xi, Х2, .... °хп- Так как при параллельном переносе базис не меняется, то квадратичная форма А (х', х') запишется следующим образом: А(х, х')= 2 alkxtxk (7.79) (отметим, что коэффициенты aJh = А {е}, ек) не меняются, так как не меняются базисные векторы ей). Следовательно, мы можем сделать важный вывод: при парал- лельном переносе группа старших членов сохраняет свой вид. Займемся теперь формулами (7.77) и (7.78). Так как A (* , х) = 2 ( 2 xi ^4» 4=1 \/=l / В (x) = 2 bkxk, fc=l A(x, x) = 2 alkxtxk, I. 4=1 в (x) == 2 bk*k, 4=1 то формула (7.77) примет вид В (х ) = 2 =2 U aikX/-{- &41 хк> (7.80) 4=1 4=1 L/=l J а формула (7.78) запишется следующим образом: с' =» 2 aikXj хк + 2 2 bkXk + с. (7.81) /, 4=1 4=1
216 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Таким образом, уравнение (7.76) в координатах будет иметь следующий вид: S aikxixk + 2 4- с — 0. (7.82) /, i=l t=i Нам понадобится несколько иное, чем (7.81), выражение для с'. Запишем (7.81) в следующей форме: с' = S S djhxi 4~ 1 xh + S Ькхк + c. (7.83) *=i L/=i J *=i Учитывая, что коэффициенты b'k выражаются, как это следует из (7.80), по формулам bi = E<W/44> (7.84) 7=1 мы получим из (7.83) нужное нам выражение для с': с'= S (^4-М^ + с. (7 85) *=i 4. Преобразование общего уравнения гиперповерхности вто- рого порядка при переходе от ортонормированного базиса к орто- нормированному. Пусть ортонормированный базис преобра- зуется в новый ортонормированный базис по формулам (7.70) и Р —ортогональная матрица этого преобразования (см. (7.71)). Тогда, согласно замечанию в п. 2 этого параграфа, координаты хк и х'ь точки в базисах и связаны соотношениями (7.75). Подставляя выражение для хк из (7.75) в левую часть уравнения (7.66) и учитывая, что вследствие однородности соотношений (7.75) группа старших членов и линейная часть уравнения (7.66) преоб- разуются автономно, получим следующее выражение для общего уравнения гиперповерхности второго порядка в координатах хк точек в преобразованном базисе {е*): S 4- 2 S &Л 4- с' = 0. (7.86) /, *=i Согласно отмеченной выше автономности преобразования группы старших членов, справедливы равенства S а1кх',х'к = S ajkxixb n , f n (7.87) A=1 £=! c' =C.


§ 71 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 217 Обращаясь к первой из формул (7.87), мы видим, что для опре- деления коэффициентов а'1к можно воспользоваться правилом преобразования коэффициентов квадратичной формы при переходе к новому базису. Именно, если обозначим буквой А' матрицу ква- дратичной формы А (х, х) в базисе {е*}, то, согласно теореме 7.2 и соотношению Р' = Р~1, получим следующую связь между матри- цами А и А' формы А (х, х) в базисах и А' = Р~1АР (7.88) (напомним, что Р — матрица ортогонального преобразования). Будем рассматривать теперь матрицу А' как матрицу некото- рого линейного оператора А в базисе *), а матрицу Р"1 как матрицу перехода от базиса к базису Тогда, согласно теореме 5.7 (см. п. 2 § 2 гл. 5) матрицу А можно рассматривать как матрицу этого линейного оператора А в базисе Иными словами, матрица квадратичной формы при преобразо- вании ортонормированного базиса в ортонормированной изме- няется как матрица некоторого линейного оператора. Этот вывод мы используем в следующем пункте. Замечание. Отметим, что оператор А, матрица которого в ортонормированном базисе совпадает с матрицей квадратичной формы А (х, х), самосопряженный. Для доказательства проведем следующие рассуждения. Пусть А (х, х) — квадратичная форма и А (х, у) — симме- тричная билинейная форма, полярная форме А (х, х). Согласно теореме 7.8 билинейная форма А (х, у) может быть представлена в виде А (л, у) = (Ах, у), где А —самосопряженный оператор. Поэтому квадратичная форма А (х, х) может быть представ- лена в виде А(х, х) = (Ах, х). Докажем, что в ортонормированном базисе матрицы опе- ратора А и квадратичной формы совпадают. Этим будет доказано утверждение замечания. Пусть aJh —элементы матрицы формы А (х, х) и а]к —эле- менты матрицы оператора А в базисе {eft}. Согласно п. 2 § 1 этой главы aJh = А (в), ек), а элементы а^, согласно п. 1 § 2 гл. 5, п формуле (5.13), могут быть найдены из равенств Ае} = S ajpep. p=i *) Согласно теореме 5.5 (см. п. 1 § 2 гл. 5) любая квадратная матрица из п строк и п столбцов может рассматриваться как матрица некоторого линейного оператора, действующего в n-мерном пространстве.
218 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Умножим обе части последнего соотношения скалярно на Тогда, учитывая ортонормированность базиса получим (AeJt eh) = aJh. Так как А (е}, eh) = (Ае}, eh), то ajk = aJh. Утверждение замечания доказано. 5. Инварианты общего уравнения гиперповерхности второго порядка. Назовем инвариантом общего уравнения (7.62) (или (7.66)) гиперповерхности второго порядка относительно па- раллельных переносов и преобразований ортогональных базисов в ортогональные такую функцию f (ап, а12, ..., апп, blt ..., bn, с) коэффициентов этого уравнения, значение которой не меняется при указанных преобразованиях пространства. Докажем следующее утверждение! Теорема 7.11. Инвариантами общего уравнения (7.62) (или (7.66)) гиперповерхности второго порядка являются коэффициенты характеристического многочлена матрицы А квадратичной формы А (л,х) и определитель det В матрицы В в соотношении (7.67). В частности, инвариантами являются det А и след ап + а22 + • • • ----Ь Опп матрицы А. Доказательство. Очевидно, инвариантность пере- численных в условии теоремы величин достаточно доказать от- дельно для параллельного переноса и преобразования ортонорми- рованного базиса в ортонормированный. Рассмотрим сначала параллельный перенос. В п. 3 этого пара- графа мы установили, что при этом преобразовании группа стар- ших членов сохраняет свой вид (см. формулу (7.79)). Поэтому не меняется матрица А, а следовательно, и характеристический мно- гочлен этой матрицы. Докажем инвариантность det В. При параллельном переносе (7.68) (или (7.69)) матрица преоб- разуется в матрицу В', определитель которой, согласно (7.82), имеет вид аи det В ат ь’, а1п Ь1 апп Ьп ’ Ь'п с' (7.89) где величины Ь’ь и с' определяются по формулам (7.84) и (7.85). Вычтем из элементов последней (п + 1)-й строки определителя (7.89) элементы первой строки, умноженные на хь затем элементы второй строки, умноженные на х2, и т. д., наконец, элементы п-й строки, умноженные на хп. Так как при таких преобразованиях определитель не меняется, то, используя (7.84) и (7.85), получим


$ 7) ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 219 соотношение det В' = а1п ь\ апп (п У, bkXk 4-с *=i (7.90) Вычтем теперь из элементов последнего (п 4- 1)-го столбца определителя (7.90) элементы первого столбца, умноженные на xlt затем элементы второго столбца, умноженные на х2, и т. д., на- конец, элементы n-го столбца, умноженные на хп. Так как при таких преобразованиях определитель не меняется, то, используя соотношение ajk = akj, вытекающее из симметричности формы А (х, у), и формулу (7 84), мы получим в результате det В. Итак, равенство det В' = det В доказано. Следовательно, det В инва- риантен относительно параллельных переносов. Рассмотрим теперь преобразование ортонормированного базиса в ортонормированный. Во-первых, убедимся, что коэффициенты-характеристического многочлена матрицы А квадратичной формы являются инвариан- тами рассматриваемого преобразования. В предыдущем пункте мы установили, что при переходе к но- вому ортонормированному базису матрица А изменяется как ма- трица некоторого линейного оператора. Но в таком случае, как следует из замечания 1 п. 3, § 2, гл. 5, коэффициенты характери- стического многочлена этой матрицы не меняются при переходе к другому базису. В частности, определитель det А и след ап + а22 4-----Н апп матрицы А, как коэффициенты характеристического многочлена, являются инвариантами. Нам останется доказать инвариантность определителя det В при преобразовании ортонормированного базиса в ортонормиро- ванный. Приступим к этому доказательству. Применим следующий прием. Введем обозначения bh = ~ ak, n+п А = 1, 2, .... п, с = an+i, п+1- Тогда уравнение (7.66) гиперповерхности можно записать следующим образом: "4-1 S ajkxixk = 0» (7.91) /» Л®1 где xn+i — 1. Рассмотрим преобразование переменных хъ хг, хп, хп+1 в переменные х[, х2, ..., х’п, хй+i. при котором первые п перемен- ных преобразуются по формулам (7.75), а переменная хп+1 преоб- разуется по формуле хл+1 = x'n+i.
220 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ, 7 Ясно, что это преобразование переменных можно рассматри- вать как преобразование координат при преобразовании ортонор- мированного базиса es, .... еп, еп+1 (п + 1)-мерного евкли. дова пространства, причем матрица Р этого преобразования имеет вид Р11 . . . Рт 0\ Pin • . . Рпп 0 I• . о ... 0 1/ (7.92) Легко видеть, что матрица Р удовлетворяет условию Р' — Р~х и поэтому является ортогональной. Но тогда, согласно п. 2 этого параграфа, ортонормированный базис elt е2, .... еп, еп+1 преоб- разуется с помощью матрицы Р в ортонормированный базис. Выше было выяснено, что при таком преобразовании матрицы В квадратичной формы определитель det В этой матрицы представ- ляет собой инвариант. Теорема доказана. Замечание. Из рассуждений в доказательстве теоремы следует, что инвариантами общего уравнения гиперповерхности второго порядка будут также величины rang А и rang В. 6. Центр гиперповерхности второго порядка. Попытаемся найти такой параллельный перенос, при котором общее уравнение (7.76) не содержало бы слагаемого 2В' (х') (или, если обратиться к уравнению (7.82), то слагаемых 2 £ b'kX’k]. *=i / Иными словами, будем искать параллельный перенос (т. е. координаты х1( хг..хп точки х), при котором обратятся в нуль все коэффициенты Ь'ь. Обращаясь к формулам (7.84), найдем, что искомые координаты xlt х2...хп точки х представляют собой решение следующей системы линейных уравнений: У*1 QjhXj = 0, k 1, 2, ..., п. (7.93) /=1 Уравнения (7.93) называются уравнениями центра гиперповерхности второго порядка, а точка х с координатами (хъ хг, ...', хп), где (хь хг, .... хп) —решение системы (7.93), называется центром этой поверхности. Поясним наименование «центр» гиперповерхности. Пусть на- чало координат помещено в центр х, т. е. произведен искомый параллельный перенос. Тогда уравнение поверхности S примет вид S a^x’fx'k + с' = 0. (7.94) /,к=1


§ 7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 221 Пусть точка х с координатами (х{, х'2, xh) расположена на S. Это означает, что ее координаты удовлетворяют уравнению (7.94). Очевидно, точка — х с координатами (—х{, —xi, ..., —Хп), симметричная с точкой х относительно точки х, также располо- жена на S, ибо ее координаты тоже удовлетворяют уравнению (7.94). Таким образом, если у гиперповерхности S есть центр, то отно- сительно центра точки S располагаются симметрично парами. Замечание!. Если гиперповерхность S второго порядка имеет центр, то инварианты det A, det В и свободный член с' в уравнении (7.94) связаны соотношением det В = с’ det А. (7.95) Действительно, для уравнения (7.94) получим cu... aln0 detB = atlf‘ann О О ... О с' Из последней формулы и вытекает (7.95). Наличие центра у гиперповерхности второго порядка связано с разрешимостью уравнений центра (7.93). Если уравнения центра имеют единственное решение, то гипер- поверхность S будем называть центральной. Так как определитель системы (7.93) равен det Л, а необходи- мым и достаточным условием существования единственного реше- ния этой системы является отличие от нуля ее определителя, то мы можем сделать следующий вывод: для того чтобы гиперповерх- ность S была центральной, необходимо и достаточно, чтобы det А =/= 0. Замечание 2. Если начало координат перенесено в центр центральной гиперповерхности S, то уравнение этой гиперпо- верхности будет иметь вид п . /,^0^+^=°. (7.96) Действительно, после переноса начала в центр уравнение ги- перповерхности примет вид (7.94). Так как для центральной ги- перповерхности det А 0, то из формулы (7.95) найдем с‘ = = det B/det А. Подставляя это выражение для с' в формулу (7.94), мы и получим уравнение (7.96). 7. Стандартное упрощение любого уравнения гиперповерхно- сти второго порядка путем преобразования ортонормированного базиса. По теореме 7.8 существует такой ортонормированный базис, в котором квадратичная форма А (х, х) записывается в виде суммы квадратов. Обозначим этот базис через \ek\, а координаты
222 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 точки хв этом базисе обозначим через х{, х2,,..., х'п. Кроме того, буквами Х2, ..., Хп обозначим собственные значения самосо- пряженного оператора А, матрица которого в ортонормирован- ном базисе совпадает с матрицей квадратичной формы А (х, х) (см. замечание в п. 4 этого параграфа). Используя теперь выводы теоремы 7.8, запишем квадратичную форму А (х, х) в координатах (х{, х'2> ..., хА) точки х в базисе следующим образом: п А (х, х) = S . (7.97) к= 1 Итак, перейдем от базиса к базису (е*). Так как фор- мулы преобразования координат точек при таком преобразовании линейны и однородны (см. замечание п. 2 этого параграфа, формулы (7.75)), то группа старших членов и линейная часть уравнения гиперповерхности S преобразуются автономно. На основании этого и в силу (7.97) уравнение гиперповерхности S в базисе будет иметь следующий вид *): S ^kxh 4“ 2 У bgXk -}- с = 0. (7.98) А=1 t=l Приведение любого уравнения гиперповерхности S второго порядка к виду (7.98) будем называть стандартным упрощением этого уравнения (путем преобразования орто- нормированного базиса). 8. Упрощение уравнения центральной гиперповерхности вто- рого порядка. Классификация центральных гиперповерхностей. Выводы, сделанные в предыдущих двух пунктах, позволяют ре- шить вопрос о классификации всех центральных гиперповерхно- стей второго порядка. Решение этого вопроса мы проведем по следующей схеме. Во-первых, путем переноса начала координат в центр гиперповерхности (7.66) мы приведем ее уравнение к виду (7.96). После этого произведем стандартное упрощение уравнения (7.96). В результате, очевидно, мы получим, согласно (7.98), сле- дующее уравнение центральной поверхности второго порядка: X.txi2 -f- Xsx22 4- ... 4- ^пх”п 4- "det 'X' = О' (7.99) в котором — собственные числа матрицы А квадратичной формы А (х, х) в уравнении (7.62), ах* — координаты точки ж в оконча- тельном ортонормированном базисе |е*|. Отметим, во-первых, что все собственные числа kk, k = 1, 2, ... ..., п, отличны от нуля. *) Напомним, что при переходе от ортонормированного базиса к ортонор- мированному свободный член с в уравнении поверхности S не меняется (см. третью из формул (7.87)).


§ 7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 223 Действительно, подсчитывая det А для уравнения (7.99), полу- чим det А = ... in, а так как для центральной поверхности det А 0, то, очевидно, что все 0. Договоримся далее все положительные собственные числа ма- трицы А нумеровать первыми индексами, а отрицательные — последующими. Таким образом, найдется такой номер р, что Х1>0, Л2>0, .... Хр>0, 1р+1 < 0, 1р+2 < 0, • • • > In < 0. Введем теперь следующие обозначения: det В п если Sgn j-r-z =/= 0, то положим ° det А ~ * I det А 1, 1 , . п | —при /’=1,2....................р, = при*=р + 1.............«; det В п если sgn т-г-л = 0, то положим ® det А ’ 1ft = -V при k = 1, 2, .... р, ak 1ft —---при k = p-{- 1, .. .,п. (7.100) (7.101) Тогда очевидно, уравнение (7.99) может быть переписано сле- дующим образом (при этом мы заменим обозначение координат х* на хк): —4+^£т=°- <7-1аг> Уравнение (7.102) называется каноническим урав- нением центральной гиперповеохности второго порядка. Величины aft, k = 1, 2, ..., п, называются полуосями цен- тральной гиперповерхности второго порядка. Они могут быть вы- числены по формулам (7.100) и (7.101). С помощью канонического уравнения (7.102) дадим следую- щую классификацию центральных гиперповерхностей. «о ____ det В « ’ 1 . р = п, sgn = —1. В этом случае гиперповерхность S называется (п. — 1)-м ерным эллипсоидом. Каноническое уравнение такого эллипсоида обычно записы- вают в виде х2 х2 4+--- +4=1- <7.103) °1 ап
224 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Если ах = а2 = • • = ап = R, то (п — 1)-мерный эллипсоид пред- ставляет собой сферу радиуса 7? в л-мерном пространстве. Замечание 1. В случае р = 0, sgn = 1 мы также получаем (п — 1)-мерный эллипсоид. Очевидно, в этом случае уравнение (7.102) может быть записано в виде (7.103). 2°. р — п, sgn д- = 1. Гиперповерхность является мнимой и называется мнимым эллипсоидом. Замечание 2. Очевидно, в случае р = 0, sgn =—1 мы также получаем мнимый эллипсоид. 3°. 0 < р < п, sgn о. Центральные гиперповерхности называются в этом случае гиперболоидами. Геометрические характеристики гиперболоида зависят от соот- „ det В ношении чисел р и п и значения sgn т-т- г-. г ° det Л 4°. sgn = 0. Центральные гиперповерхности называются в этом случае вырожденными. Среди вырожденных гипер- поверхностей отметим так называемый вырожденный эллипсоид, отвечающий значениям р = 0 и р = п. 9. Упрощение уравнения нецентральной гиперповерхности вто- рого порядка. Классификация нецентральных гиперповерхностей. Пусть гиперповерхность S, заданная уравнением (7.62), не яв- ляется центральной, т. е. det А = 0. (7.104) Произведем стандартное упрощение уравнения (7.62). В ре- зультате это уравнение примет вид (7.98). Подсчитаем det А, ис- пользуя (7.98) (это возможно, так как det А — инвариант). Полу- чим, учитывая (7.104), det А — ... Хп = 9. Таким образом, по крайней мере одно собственное значение матрицы А равно нулю. Подчеркнем, что не все собственные зна- чения равны нулю, ибо иначе квадратичная форма А (х, х) была бы тождественно равной нулю, мы же предполагаем (см. п. 1 § 1 этой главы), что эта форма ненулевая. Оставим в выражении (7.98) лишь те слагаемые в первой сумме, которые отвечают ненулевым собственным значениям, а затем произведем такую перенумерацию базисных векторов, чтобы пер- вым р базисным векторам е{, .... е'р отвечали все ненулевые соб- ственные значения А1( Л2....(отметим, что p = rangH). Очевидно, после этого уравнение (7.98) может быть переписано следующим образом: S 4~ 2 2 bkXk -f- 2 S bkx'k -ф- с = 0 (7.105) 4=1 4=1 4=р+1


$ 7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 225 (здесь 0 < р < п, Xj =,4= 0..у= 0; кроме того, мы специально выделили первые р слагаемых второй суммы в уравнении (7.98)). Проведем теперь следующие преобразования. 1°. Для каждого номера k, 1 < & < р, объединим слагаемые с этим номером из первой и второй суммы в (7.105) и затем проде- лаем следующие преобразования (при этом мы учитываем, что =#= 0): 2 ^-hx'k + 26*х* = -|- 2-^x'k + = Очевидно, после этих преобразований (7.105) запишется сле- дующим образом: р . , . g п S4x*+|r/ +2 S ^ + с'=0> (7.106) i&l *=Р-Н где постоянная с' определяется равенством Р >2 <7|07> fe= I Осуществим теперь параллельный перенос по формулам x'k = Xi -I- k = 1, 2....р; x"k = х'к, k = р + 1, .. ,п В результате уравнение (7.106) перейдет в уравнение Р п S hXk2 + 2 Е b'kxnk + с' = 0, (7.108) k= 1 <г=р+1 причем с' определяется по формуле (7.107). 2°. Будем искать теперь такое преобразование ортонормиро- ванного базиса при котором первые р базисных векторов е{, ..., е'р не меняются, за счет же изменения базисных векторов п e'p+i..е'п попытаемся преобразовать слагаемое 2 S b'^xh к виду и, № Ь = Р+ 1 2|1хп, где хп —п-я координата в новом базисе. Отметим, что при такого вида преобразованиях свободный член с' не меняется. Заметим, во-первых, что если все коэффициенты 6* в (7.108) равны нулю, то цель преобразования п. 2° достигнута —слагае- п мое 2 У» bkx”k имеет вид 2рх^, где и, = 0. Итак, будем считать, что по крайней мере один из коэффи- Л циентов bi в сумме 2 b^xl отличен от нуля. Тогда мы можем рас- k=p+i сматривать эту сумму как некоторую линейную форму В" (х), 8 Зак 459
226 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 заданную в подпространстве V”, которое представляет собой линей- ную оболочку векторов ер+..... е'п. Согласно лемме п. 1 § 4 гл. 5 эта форма в указанном подпространстве может быть представлена в виде В" (х) = (h, х), где h— некоторый вектор подпространства V". Если мы теперь в подпространстве V" направим единичный вектор е'п по вектору й, так что h— ре„, а векторы e"P+i...e”n-i выберем так, чтобы система e"p+i,,..., e'n-i, еп была базисом в V", то, очевидно, в этом базисе В (х) = (й, х) = р (е„, х) = цх”, поскольку (е'п, л) — хп. Таким образом, выбирая в V базис опи- санным выше способом, мы преобразуем У, Ь'кх"п к виду p,x„. fc=p+l Итак, можно указать такое преобразование базиса е{, .... е'п в ортонормированный базис е'{, ..., е"п (при этом преобразовании векторы е[, ..., е'р остаются неизменными), что уравнение (7.108) примет вид (при этом мы заменим обозначение координат хк на хк) р S М + 2цхп + с' = 0. (7.109) »=i Отметим, что в уравнении (7.109) не исключается случай р = О’ Уравнение (7.109) называется каноническим у рае не' н и е м нецентральной гиперповерхности второго порядка. С помощью канонического уравнения (7.109) дадим следую- щую классификацию нецентральных гиперповерхностей. Возможны следующие случаи. 1°. ц^0, р = rang А = п — 1. В этом случае последние два слагаемых в уравнении (7.109) запишем в виде 2uxn 4- с' — 2р (хп и сделаем параллель- ный перенос по направлению оси хп на величину —с'/2ц. Чтобы не осложнять запись, не будем при этом менять обозначение коор- динат В результате каноническое уравнение (7.109) примет вид 4----+ i4-i 4- 2цхп = 0. (7.110) Гиперповерхности второго порядка, каноническое уравнение которых имеет вид (7.110), называются параболоидами. 2° р = 0, р = rang А < п. В этом случае каноническое уравнение (7.109) перепишется так: %!4 4- • • • 4" ХрХр 4* с' = 0. (7.111) Очевидно, в подпространстве, являющемся линейной оболоч- кой векторов е'\....е'Р, уравнение (7.111) представляет собой каноническое уравнение центральной поверхности S' второго порядка Чтобы получить представление о гиперповерхности 5 во всем пространстве, нужно в каждой точке поверхности 3' поме- стить плоскость, параллельную плоскости V" (линейная оболочка


$ 7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 227 векторов gp+i, .., еп). Геометрическое место таких плоскостей образует поверхность S Таким образом, поверхность S представ ляет собой центральный цилиндр с направляющей поверхностью S', определяемой уравнением (7.1 И), и образую- щими плоскостями, параллельными плоскости V" 3°. р #= 0, р = rang А < п — 1. Поступая так же, как и в случае 1°, мы приведем каноническое уравнение (7.109) к виду • • • -|- ХрХр -|- 2цхп = 0. (7.112) Очевидно, в подпространстве, представляющем собой линей- ную оболочку векторов е{, ..., вр, уравнение (7.112) опреде ляет параболоид S' (см. случай 1°). Чтобы получить представление о строении гиперповерхности S во всем пространстве, нужно в каждой точке S' поместить плоскость, параллельною плоскости V" (линейная оболочка векторов gp+i, .., e«_i). Геометрическое место таких плоскостей образует поверхность S Таким образом, поверхность S представляет собой параболоидальный цилиндр с направляющей поверхностью S', определяемой уравнением (7.112), и образующими плоскостями, параллельнь ми плоскости V".
ГЛАВА 8 ТЕНЗОРЫ В этой главе рассматриваются важные объекты, называемые тензорами и характеризующиеся в каждом базисе совокуп- ностью координат, специальным образом преобразующихся при переходе от одного базиса к другому. Тензоры широко исполь- зуются в геометрии, физике и механике Понятие тензора возни- кает при изучении различных анизотропных явлений (например, при изучении распределения скоростей распространения света в кристалле в зависимости от направления его распространения) § 1. Преобразование базисов и координат В данном параграфе, носящем вспомогательный характер, мы рассмотрим законы преобразования координат в произвольном вещественном евклидовом пространстве Еп Возникающие при этом наводящие соображения делают более прозрачным понятие тензора, вводимого в следующем параграфе. I. Определители Грама*). В этом пункте мы укажем способ, с помощью которого можно выяснить вопрос о линейной зависи- мости системы векторов е1г ег, . , ек в евклидовом пространстве. Введем для этого так называемый определитель Грама указан- ной системы векторов. Определителем Грама системы векторов ех, е2, ... .., ек называется следующий определитель: (ei ед (е, ег) (ег, ег) (ег ег) (ег, ек) (ег, ek) (8.1) (ek. er) (ek, ег) ... (ek, ek) Справедливо утверждение Теорема 8.1. Для того чтобы система векторов ех, е2, ..., Ck евклидова пространства Еп была линейно зависимой, необходимо и достаточно, чтобы определитель Грама (8.1) этой системы был равен нулю. Доказательство. 1) Необходимость. Пусть векторы ех, ег, eh линейно зависимы Тогда один из них, ♦) Йорген Грам (1850 — 1916) —датский математик.


§ 1] ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 229 например является линейной комбинацией остальных. &k — + а2®2 + • • • + aA-l^A-i- Умножая написанное соотношение скалярно на eit i = 1, 2, ... .... k, мы получим, что последняя строка определителя Грама (8.1) является линейной комбинацией первых k — 1 строк. По теореме 1.7 этот определитель равен нулю Необходимость условия дока- зана. 2) Достаточность. Предположим, что определитель Грама (8.1) равен нулю. Тогда его столбцы линейно зависимы, т. е. существуют не все равные нулю числа 0а, ..., такие, что для i = 1, 2, ..., k выполняются соотношения ₽1(б>, Ci) + |Мб1> ег) + • •' 4"Ра (е<> ек) =0- Переписывая эти соотношения в виде (б(, Pi^i 4- Р262 + • • • + Ра6а) = 0, i = l,2.k, убеждаемся, что вектор p^i + рае 4---И pfteft ортогонален всем векторам е2, .... ek, т. е. ортогонален линейной оболочке L этих векторов. Так как этот вектор принадлежит L, то он равен нулю. Поскольку не все Р;- равны нулю, то это означает, что век- торы Ci, е2, .... Ck линейно зависимы. Теорема доказана. Следствие. Если векторы eit е2, ..., ек линейно независимы, то определитель Грама этих векторов отличен от нуля. Докажем, что в указанном случае определитель Грама поло- жителен. Пусть L — линейная оболочка векторов еъ е2, ... ..., Ck- Очевидно, Ci, е2, .... eh —базис в L. Рассмотрим били- нейную симметричную форму А (х, у), представляющую собой скалярное произведение (х, у) : А (х, у) = (х, у). Соответствую- щая квадратичная форма Л (х, х) = (х, х) будет, очевидно, знако- определенной, и поэтому, согласно теореме 7.6 (критерию Сильве- стра), определитель det (atj) ее матрицы (atJ) в базисе elt е2, .... Ck положителен. Но этот определитель и представляет собой опреде- литель Грама (8.1) системы et, е2, .., Ck, ибо atj = (е,, е,). 2. Взаимные базисы. Ковариантные и контравариантные координаты векторов. Пусть elt е2, ..., еп —базис в евклидовом пространстве Еп. Базис е1, е2..еп называется взаимным для базиса et, < = 1,2, .., п, если выполняются соотношения ( 1 при i = /, (et, е/) = б{= л (8.2) ' * ' * ( 0 ПРИ < =/= / при <, / = 1, 2, ..., п. Символ 6/ называется символом Кр онекер а. Возникает вопрос о существовании и единственности взаим- ного базиса. Ответ на этот вопрос утвердительный: для любого дан- ного базиса е1г е2... еп существует единственный взаимный
230 ТЕНЗОРЫ Ггл. 8 базис. Для доказательства поступим следующим образом. Пусть х{, х2, .... х„ — координаты искомых векторов е1 в базисе ег. е'= xfa + х&2 +------h^en, / = 1, 2, ..п (8.3) Умножая скалярно обе части последних равенств на е{, полу- чим, используя (8.2), 4 (ег-, ej + 4 (en е2) + • • • + 4 («ь еп) = (8.4) i, / = 1, 2, . ., п Соотношения (8.4) при фиксированном / можно рассматривать как квадратную систему линейных уравнений относительно неиз- вестных координат Xi, Хг, .... х„ вектора е1 в базисе et. Так как определитель системы (8.4) представляет собой определитель Грама базисных векторов ег, е2.....еп, он, согласно следствию из теоремы 8.1, отличен от нуля, и поэтому система (8.4) имеет единственное решение х{, х2, .... х'п, которое будет ненулевым, поскольку эта система неоднородная. Затем с помощью соотно- шений (8.3) строятся векторы е', которые, очевидно, удовлетво- ряют соотношениям (8.2). Мы должны еще убедиться, что векторы е1, е2, ..., еп образуют базис Пусть некоторая линейная комбинация этих векторов равна нулю с^е1 + а2е2 -|-----h апеп = 0. Умножая скалярно последнее равенство последовательно на eL, е2, ..., еп и используя (8.2), получим aj = 0, а2 = 0, ... .... ап =0. Следовательно, векторы е1, е2, .., еп линейно неза- висимы, т. е. образуют базис. Итак, взаимный базис е' и для базиса существует и опреде- ляется единственным образом. Замечание 1. В силу симметрии соотношений (8.2) отно- сительно е( и е’, взаимным базисом для базиса е' будет базис et. Поэтому в дальнейшем мы будем говорить о взаимных базисах ei, е1. Замечание 2. Если базис е2, .... еп ортонормирован- ный, то взаимный базис е1 совпадает с данным базисом. Действи- тельно, полагая в этом случае е' = е,, мы убедимся, что соотно- шения (8.2) выполняются. Используя свойство единственности взаимного базиса, мы убедимся в справедливости замечания. Пусть е;, е* — взаимные базисы, а х — произвольный вектор пространства. Разлагая вектор х по базисным векторам et и е', получим х = х.е1 + х2е2 4----h Хпеп, | х = х1ег 4- х2е2 + • • • + хпеп. )


§ 1] ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 231 Координаты (хх, х2, хп) вектора х в базисе е' называются ковариантными кооординатами вектора х, а а координаты (х1, ха, .... хп) этого вектора в базисе е, называются контравариантными координатами вектора х. Эти наименования будут разъяснены в следующем пункте. Для сокращения записи формул, в которых фигурируют одно- типные слагаемые (примерами таких формул могут служить соот- ношения (8.5)), мы будем пользоваться в дальнейшем соглаше- нием о суммировании. Это соглашение заключается в следующем. Пусть имеется выражение, составленное из сомножителей, кото- рые снабжены конечным числом индексов, часть из которых ниж- ние, а другая часть — верхние. При этом договариваются все ниж- ние индексы обозначать различными символами Верхние индексы также договариваются обозначать различными символами. Если в этом выражении встречаются два одинаковых индекса, из кото- рых один верхний, а другой нижний, то считают, что по этим ин- дексам производится суммирование, т. е. индексам последова- тельно даются значения 1, 2, ..., п, а затем складываются полу- ченные слагаемые. Например, Xlel = х.е' + х2е2 ---И хпеп, 6f = + 62 Н------И 6„, ёД*'*' = (g^x'xi) + (.g2jX2X>) Н-И (gnjXnxi) = = fen*1*1 + gii*1*2 Ч--F gmxlxn) + + (g-21*2*1 + fe*2*2 4-F g^2xn) + + teni*"*1 + gmxnx2 4-----F gnnxnxn). С помощью соглашения о суммировании формулы (8.5) запи- сываются следующим компактным образом: х = х(е‘, х — х'е,- (8.6) Замечание 3. Верхние и нижние одинаковые индексы, о которых говорилось в соглашении о суммировании, обычно называются индексами суммирования. Ясно, что индексы суммиро- вания могут обозначаться любыми одинаковыми символами. При этом не изменится выражение, в которых они фигурируют. Например, х,е‘ и представляют собой одно и то же выражение. Получим теперь явное выражение для ковариантных и контра- вариантных координат вектора х. Для этого умножим скалярно первое из равенств (8.6) на ej, а второе на е1 Учитывая затем соотношения (8.2), найдем (х, е,) — xt (е‘, ej) = xt6j = xJt (х, ef) — xl (et, e1) — x1# — x/. Итак, x} — (x, e,), xi — (x, ef). (8.7)
232 ТЕНЗОРЫ (ГЛ. 8 С помощью соотношений (8.7) запишем формулы (8.6) в сле- дующем виде: х = (ж, е,) е‘, х — (х, ес) et (8.8) Соотношения (8.8) называются формулами Гиббса*). Обратимся еще раз к вопросу о построении взаимных базисов. С помощью формул (8.8) имеем е‘= (е‘, e')ej, ei = (et, е})е>. (8.9) Введем обозначения ёи = (еь е3), g4 == (е‘, е>). (8.10) С помощью этих обозначений перепишем соотношения (8.9) следующим образом: = ei=gilei (8.11) Итак, для построения базиса е‘ по базису et достаточно знать матрицу (g4), а для построения базиса et по базису е‘ достаточно знать матрицу (gtj). Докажем, что указанные матрицы взаимно обратны Отметим, что так как элементы обратной матрицы могут быть вычислены через элементы данной матрицы, то ясно, что с помощью соотно- шений (8.11) решается вопрос о построении взаимных базисов Итак, установим, что матрицы (gl/) и (gjy) взаимно обратны. Умножая первое из равенств (8.11) скалярно на получим (el, ek) = gl> (в), ек). Из этого соотношения, учитывая (8.2) и (8.10), найдем I, П при i = k, ё ё1к k j о при i k. Таким образом, произведение матриц (g11) и (gl}) представляет собой единичную матрицу Следовательно, матрицы (g1') и (gy) взаимно обратны. 3. Преобразования базиса и координат. Пусть и е‘ — за- данные взаимные базисы, а ее и е‘‘ — некоторые новые взаимные базисы, элементы которых мы обозначим штрихованными индек- сами. Фактически это означает, что мы вводим новый натуральный ряд Г, 2', 3', . и считаем, что индекс Г принимает значения Г, 2', .., п'. Таким образом, индексы i и I' независимо принимают различные значения: /=1,2...... п, /'= Г, 2',..., п'. Используя введенное в предыдущем пункте соглашение о сум- мировании, запишем формулы преобразования базисных векторов. В результате получим: *) Д. У Гиббс (1839—1903) — американский физик-теоретик


$ 1] ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 233 (8 12) на е», соотношения 1) формулы перехода от старого базиса et к новому базису d- и формулы обратного перехода et- = b‘i-eit et = t = 1, 2, ..., n, i' = Г, 2', ..., n', (8.12) 2) формулы перехода от старого базиса е' к новому е!' и фор- мулы обратного перехода el = bi'e', е' = 5!-е‘, 1 = 1,2...п, Г = Г, 2', (8.13) Так как преобразования (8.12) (равно как и преобразования (8.13)) взаимно обратны, то матрицы (bi-) и (Ы) (равно как и матрицы (б)-) и (б?)) взаимно обратны Докажем, что матрицы (б{-) (б{-) тождественны. Тем самым будет доказана тождественность и матриц (bi) и (6f) Для дока- зательства умножим скалярно первое из равенств а второе из равенств (8 13) — на Учитывая (8.2), получим е") = bi- (et, е") = bi-tf = Ь*-, (е!, ек.) = 5‘г (е‘‘, е*-) = б^£ = 5^. Из этих соотношений при k = i, k' = Г получим bi-= (е{-, е‘), bi- = (et-, е1). Поскольку правые части соотношений (8.14) и (8.15) равны и левые части Иными словами, bi- = bi-, а это тождественность матриц (б,--) и (bi-) Отметим, что элементы 65- матрицы (bi-) могут быть вычислены по формулам (8 14). Итак, справедливо утверждение: Для перехода от базиса е,, е‘ к базису ее, е‘‘ достаточно знать лишь матрицу (b\-) перехода от базиса а к базису ei- (матрица (Ы ) вычисляется по матрице (bi-)). Приведем полную сводку формул преобразований базисных векторов; (8-14) (8.15) равны, то и означает ei- — bi-c(, в( = b‘i в{ л- it' J tJ Л е =bi е , е = bi-e (8.16) Перейдем к выводу формул преобразования координат вектора х при переходе к новому базису Пусть Xi- — ковариантные координаты х в базисе et-, е1'. Тогда, согласно (8.7), имеем xt- = (х е,-). Подставляя в правую часть этого соотношения выражение для et- из формул (8.16), найдем Xi- = (х, b\-et) — bi- (х, et) = bi-x .
234 ТЕНЗОРЫ [гл. 8 Мы приходим к следующему выводу: формулы преобразования ковариантных координат вектора х при переходе к новому базису имеют вид Xf-b^-x,. (8.17) Следовательно, при переходе к новому базису ковариантные координаты вектора х преобразуются с помощью матрицы прямого перехода от старого базиса к новому. Это согласование преобразований и объясняет наименование ковариантные *) координаты вектора. Рассмотрим теперь преобразование контравариантных коор- динат вектора х Подставляя в правую часть соотношения х1' = (х, е1’) выра- жение для е1' из формул (8.16), получим после преобразований = (8.18) Мы видим, что при переходе к новому базису контравариантные координаты вектора х преобразуются с помощью матрицы (b\ ) обратного перехода от нового базиса к старому. Это несогласование преобразований и объясняет термин контравариантные **) координаты вектора, § 2. Понятие тензора. Основные операции над тензорами I. Понятие тензора. В этом параграфе мы рассматриваем произвольное (не обязательно евклидово) вещественное п-мерное линейное пространство Ln. Определение. Тензором А типа (р, q) (р раз ковариант- ным и q раз контравариантным) называется геометрический объект, который 1) в каждом базисе е, линейного пространства Ln опреде- k . k ляется координатами At* '.i4p (индексы ilt ..., ip, klt .... kq независимо принимают значения 1, 2, .... п, 2) обладает тем k .k свойством, что его координаты А > в базисе ец связаны с коорди- 1 "*р натами АА (ч в базисе е, соотношениями *1’ '*р * k •• k. i in k k • • A.i ? = b;>...b?b'.b‘,A' (8.19) ‘.••‘p 'p \ % \-1p в которых Ь\ —элементы матрицы (b{.) перехода от базиса et к базису et’, а Ь* —элементы матрицы обратного перехода от е,- к ei. *) Ковариантный — согласованно изменяющийся. **) Контравариантный — противоположно изменяющийся.


§ 2] ПОНЯТИЕ ТЕНЗОРА. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 235 Число г = р + q называется рангом тензора. Замечание 1. Формулы (8.19) называют формулами преобразования координат тензора при преобразовании ба- зиса. Отметим, что ковариантные и контравариантные координаты вектора преобразуются по формулам (8.19) (при р = 1 и q = О в первом случае и при р — 0 и q = 1 во втором, см. п. 3 § 1 этой главы). Поэтому вектор представляет собой тензор ранга 1 (1 раз ковариантный, либо 1 раз контравариантный — в зависимости от выбора типа координат этого вектора). Отметим, что рассматривают также тензоры ранга 0. Это тен- зоры, имеющие лишь одну координату, причем эта координата не снабжена индексами и имеет одно и то же значение во всех системах координат Тензоры ранга 0 обычно4называются инвариан- тами. Замечание 2. Индексы ц, .... ip называются ковариант- ными, a ku ..., kq —контравариантными. Наименование объясня- ется тем, что по каждому из упомянутых индексов преобразование координат тензора производится в полной аналогии с преобразова- ниями ковариантных и контравариантных координат вектора (см формулы (8.17) и (8.18)). Для того чтобы определение тензора было корректным, нужно убедиться, что последовательные переходы от базиса ei к базису е^, а затем от базиса еп к базису е,» приводят к такому же преобразо- ванию координат тензора, что и при непосредственном переходе от et к et ’. Пусть (Ьг), (Ьг) и (Ьг) —соответственно матрицы перехода от базиса ei к базису е,-, от базиса е,- к ei- и от базиса е( к Так как при последовательных переходах матрицы преобразова- ний перемножаются, то очевидны соотношения Ь\; = Ъ\-Ь\., Ь{( = b‘".b‘'. (8.20) После сделанных замечаний убедимся в корректности определе- k k k’-.-k k- -k ния тензора Пусть Д 1 А ' А» °—координаты тен- 1,"1р * "‘1р *₽ зора А в базисах et, и et- соответственно. По формулам (8.19), переходя последовательно от в; к е,<, а затем к вс получим А>1 = Ь'...ЬРЬ'---ЬЧА14, (8.21) _ n К _ • • • » .. 1 P 1 Pl Q 1 P Akl"'kS = b(l. ,.b‘p-bk'... .bk‘!Ak}"'k‘!. (8.22) ‘p i, ‘p *q '
236 ТЕНЗОРЫ [ГЛ 8 Подставляя в правую часть (8.22) выражения координат & k' А.) .? из (8.21) и учитывая соотношения (8.20), получим ‘1 ‘р А / 1 I \ I L i„\ ( Ь Ь \ a i ч= ь 'ь:-\... [ь.аь ? [Ь‘-ь * ... I •• i \ i I/ \ \ « Ь / । Р ' I 1/ ' Р Р/ ' 1 йх' / k \ k k I i k k k k ... МИЯ-1 q = b^...bpb'. bqA.' q \ % V 7 ‘p ‘p *. % *, 'p Таким образом, последовательные переходы от базиса е, к базису e-t , а затем к базису ег приводят к такому же преобразованию координат тензора, как и при непосредственном переходе от et к ер. Корректность определения тензора установлена Замечание 3. Любая система пр+<? чисел Aq может рассматриваться в данном базисе ei как координаты некоторого тензора А типа (р, q) Чтобы убедиться в этом, определим в про- извольном базисе ер с помощью формул (8.19) систему чисел *' k А'- которые будем рассматривать как координаты искомого 1 р тензора А в базисе ер. Очевидно, при переходе от базиса ei к ба- зису ер эти координаты преобразуются по формулам (8 19) Как и выше, легко убедиться, что последовательные переходы от базиса ei к базису ер, а затем к базису ер приводят к такому же преобразованию полученных координат, как и при непосредствен- k k ном переходе от в; к ер. Следовательно система чисел A,* tq действительно представляет собой координаты некоторого тензора А типа (р, q) 2. Примеры тензоров. 1° Нуль-тензор. Среди тензоров типа (р, q) следует выделить так называемый нуль-тензор. Это тензор, координаты которого в любом базисе равны нулю. Очевидно, соотнонения (8.19) выполняются. Отметим, что если координаты тензора А равны нулю в ка- ком-либо базисе, то, согласно (8 19), они равны нулю в любом базисе, и, следовательно, А — нуль-тензор. 2°. Символ Кронекера. Убедимся, что тензор А типа (1, 1), имеющий в базисе е, координаты 6?, будет иметь в базисе е-р координаты 8р- Итак, пусть А — тензор, имеющий в данном базисе коорди- наты б* Для того чтобы найти координаты этого тензора в базисе ер, надо воспользоваться формулами (8.19), т. е. координаты тензора А в базисе ер равны bk’bpb’i Используя свойства символа Кронекера, получим Ьк’Ьрб* = b^bp = 6*<’.


§ 2] ПОНЯТИЕ ТЕНЗОРА. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 237 Итак, в новом базисе ее координаты тензора А действительно равны бг. Поэтому символ Кронекера можно рассматривать как тензор типа (1, 1). 3°. Пусть А (х, у) — билинейная форма, заданная в конечно- мерном евклидовом пространстве Еп, a е2, .... еп — какой-либо базис в этом пространстве. Тогда векторы х и у могут быть пред- ставлены в виде х = x'et, у — y'ej. Используя линейное свойство формы А (х, у) по каждому аргументу, мы можем записать Д(л, y) = A(x!ei, у'е}) = A (eh e})xlyi. Обозначим A (fit, в}) через а^-. ai} = A(ei,e}). (8.23) Тогда форма А (х, у) может быть записана следующим образом: Л (х, у) = atjxiyl. (8.24) Убедимся, что коэффициенты ац матрицы формы А (х, у) при переходе к новому базису преобразуются по закону (8.19) преобразования координат тензора типа (2, 0), т. е. представляют собой тензор типа (2, 0). Рассмотрим произвольный базис е^, е^, еп-. Запишем в этом базисе форму А (х, у) в виде (8.24) А (х, у) — arj-x^yi' причем аГ/-= Л (в,', «?/')• (8.25) Перейдем от базиса ei, ег..еп к новому базису е^, ег’, ..., еп Обозначая матрицу перехода от базиса et к базису через Ь*- получим е,’ — bi-et, е,’ = b'i-ej’ Подставляя эти выражения для е^ и в/- в правую часть (8.25) и используя линейное свойство формы А (х, у) по каждому аргу- менту, найдем at’j' = A (b^ei, fy-ej) = ЬрЬ'г A (ei, е,}- Согласно формуле (8.23) последнее соотношение можно пере- писать в виде ai’i- = Ь^Ь/’ац. Следовательно коэффициенты а1} матрицы билинейной формы преобразуются по закону (8.19) преобразования координат тензора типа (2, 0) и поэтому могут рассматриваться как координаты тен- зора такого типа. 4°. Каждому линейному оператору, заданному в конечномер- ном евклидовом пространстве Еп и действующему в то же про- странство, можно поставить в соответствие некоторый тензор типа (1, 1), причем этот тензор будет вполне определять указанный оператор.
238 ТЕНЗОРЫ ГГЛ. 8 Пусть у = Lx—линейный оператор, заданный в Еп и elt ег, .... еп — базис в Еп. Так как х = а у = y!ej и L — линейный оператор, то yiej = x‘L (е(). (8.26) Разложим вектор L (е{) по базису е2, .... еп: L (et) = ctej. Подставляя полученное выражение для L (ег) в (8.26) и исполь- зуя единственность разложения по базису, получим у’ = а(х\ / = 1,2, ..., п. (8.27) Напомним, что соотношения (8.27) можно рассматривать как координатный способ задания линейного оператора. При этом матрицу (а/) коэффициентов а{ называют матрицей линейного оператора. Убедимся, что коэффициенты этой матрицы при переходе к новому базису преобразуются по закону (8.19) преобразования координат тензора типа (1, 1) и поэтому представляют собой тензор типа.(1, 1). Рассмотрим произвольный базис ви, е?-, ..., еП’. Запишем в этом базисе линейный оператор L в виде (8.27) у'" = а['.х1', j' = 1', 2'.п'. (8.28) Перейдем теперь от базиса ei, ег, .... еп к базису ег, е^, , еП'. Обозначая матрицу перехода (b‘r) (или, что то же самое, (&/-)), получим *) (см. п. 3 § 1 этой главы) xl = bl/,x1', у'^Ь^'. Подставим эти выражения для х‘ и у1 в (8.27). Получим сле- дующие соотношения: y*'bfk, = afy.x1', /==1,2....п. (8.29) Нам нужно получить из (8.29) выражение для у1 . Для этой цели умножим обе части (8.29) на Ь) и просуммируем по / от 1 до п. Учитывая, что b^-b1- =6'fe-, получим у* 6^. = (Ь^.Ь) а{) х1'. Заметим, что = у1". Поэтому у'' = (b\.b'.’a't) х1’ Сравнивая это выражение для у1' с выражением для у1 по формуле (8.28), получим следующее тождество, справедливое для любых векторов х (для любых координат х1’)\ а!{’,х1’ a!t) х1'. *) В формуле для у' индекс суммирования мы обозначим через k'.


§ 2] ПОНЯТИЕ ТЕНЗОРА ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 239 Отсюда и из произвольности х‘ следует, что коэффициенты ai матрицы линейного оператора преобразуются по закону а{' = = Ь\,Ь'-а’(. Итак, коэффициенты a't преобразуются по закону (8.19) пре- образования координат тензора типа (1.1) и поэтому представляют такой тензор. 3. Основные операции над тензорами. Основными операциями над тензорами называются операции сложения и вычитания тензо- ров, операция умножения тензора на число, операция умножения тензоров, операция свертывания тензоров, операция перестановки индексов, операции симметрирования и альтернирования тензоров. Перейдем к определению этих операций. 1°. Сложение и вычитание тензоров. Опера- ции сложения и вычитания определяются для тензоров одинакового типа. k k k k Пусть А и В — два тензора типа (р, q), Л/* и — одноименные координаты этих тензоров в базисе et. Суммой А + В (разностью А — В) этих тензоров называется тензор, имеющий в базисе et координаты Лг. tp (лг. ip-Blv .ip). Чтобы данное определение операций сложения и вычитания тензоров было корректным, необходимо проверить, преобразуются ли координаты суммы (разности) тензоров по закону (8 19) пре- образования координат тензора. Для этого представим себе, что наряду с формулами (8.19) преобразования координат тензора А записаны аналогичные формулы преобразования координат тен- зора В. Тогда путем сложения (вычитания) таких двух формул преобразования координат тензоров Л и В мы убедимся, что координаты суммы (разности) преобразуются по закону пре- образования координат тензора. 2°. Умножение тензора на число. Пусть А — k k тензор типа (р, q), имеющий в базисе е, координаты и а — произвольное вещественное число. Произведением аА тензора А на число а называ- k . k ется тензор, имеющий в базисе e-t координа ч аЛЛ ,q. k . .k 1 р То, что координаты аД;*' преобразуются по тензорному закону, непосредственно усматривается из формул (8.19). 3°. Умножение тензоров. Операция умножения тен- зоров определяется для тензоров произвольного типа. Пусть А — тензор типа (р, р), имеющий в данном базисе е h k * координаты Л;‘ а В —тензор типа (г, s), имеющий в этом же базисе координаты
240 ТЕНЗОРЫ 1ГЛ. 8 Для определения произведения D = ЛВтензоров А и В составляются всевозможные произведения координат тен- зора А на координаты тензора В. В каждом таком произведении индексы /1, . 1Т и mlt ms у координат тензора В заменяются новыми индексами. Именно, полагают = ip+1, .. , lT = гр+, и mj = kq+l, та = kq+s. Произведением D = АВ тензоров А и В называется тензор типа (р + г, q + s), имеющий в базисе et координаты >’ = W+1. (8.30) Чтобы убедиться, что координаты D** ^р+Д *7р’г> опре- деленные соотношением (8.30), преобразуются при переходе к другому базису по закону преобразования координат тензора, т. е. действительно представляют собой координаты тензора, достаточно записать формулы преобразования (8.19) для коор- динат A J и В;’** ,’++*г тензоров А и В и перемножить правые и левые части этих формул. В результате, обращаясь к соотноше- нию (8.30), легко получаются нужные формулы преобразования для координат D*' Замечание Операция умножения тензоров не обладает свойством перестановочности: вообще говоря, АВ =# В А Это объясняется тем, что порядок следования индексов у координат тензора определяет «номер» этой координаты Таким образом, хотя численное значение выражений д*1 k9R*<i*i' и *?+«д** кч •1 Lp ‘р+1” ‘р+г ^р+1 *р+г *Г 'С одинаково, порядок следования индексов у этих выражений различен, и поэтому они отвечают координатам с различными «номерами». Это и означает, что АВ =/= В А. 4°. Свертывание тензора. Операция сверты- вания применяется к тензору типа (р, q), у которого р=#0 и q 0 (т. е к тензору, у которого имеется по крайней мере один верхний и один нижний индекс). Пусть А — тензор указанного выше типа. Перейдем к описанию операции свертывания. Свертывание тензора А производится по каким-либо отмечен- ным верхнему и нижнему индексам. При этом в результате сверты- вания получается тензор типа (р—1, q — 1). Пусть, например, у каждой координаты тензора А отмечен верхний индекс с номером т и нижний индекс с номером п: дк1 кт' А{1 ‘п -‘р


§ 2] ПОНЯТИЕ ТЕНЗОРА ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 241 Произведем суммирование (свертывание) координат тензора с одинаковыми выделенными индексами . Эта операция и дает следующие координаты тензора, полученного свертыванием по верхнему и нижнему индексам с номерами т и п: Z; « % (8.31) (в выражении (8.31) мы использовали соглашение о суммирова- нии). Проверим, что величины (8.31) действительно образуют коор- динаты тензора типа (р — 1, q — 1). Для этого обратимся к фор- мулам (8.19). Перепишем эти формулы в следующем виде, выделив интересующие нас индексы (эти индексы мы подчеркнем квадрат- ными скобками): 1 п р k = . .Ь^.. .bfyb1',. . b{”. .b<pAkl' k.m "ki (8.32) *1 “m % [ i । Jr ‘n ‘p 1 П p Произведем теперь суммирование в правой и левой частях (8.32) по выделенным индексам k'm и i'n. Для этого достаточно положить эти индексы равными а' и воспользоваться соглашением о суммировании. В результате мы получим некоторое равенство. Найдем выражения в левой и правой частях этого равенства В левой части мы получим, очевидно, выражение k, ...a ...k А} ? (8.33) р В правой же части произведение на Ь£ равно Ькпт, т. е. равно единице при km = in = а и равно нулю при km in. Таким образом, в правой части мы получим следующее выражение: ••^'4 “Л <8-34> Сравнив выражения (8.33) и (8.34), мы убедимся, что величины а i’ преобразуются при переходе к новому базису по закону преобразования координат тензора. Очевидно, этот тензор будет типа (р — 1, q — 1). Замечание Термин «свертывание тензоров» употребля- ется еще и в следующем смысле. Рассмотрим два тензора А и В, у координат первого из которых имеется по крайней мере один верхний индекс k, а у координат второго — по крайней мере один нижний индекс i. 9 Ък 454
242 ТЕНЗОРЫ [ГЛ. 8 Составим произведение АВ этих тензоров и затем проведем операцию свертывания тензора АВ по верхнему индексу k и нижнему индексу I. Для этой операции обычно употребляется терминология: «свертывание тензоров А и В по индексам k и I». 5°. Перестановка индексов Эта операция заклю- чается в том, что в любом базисе индексы у каждой координаты тензора подвергаются одной и той же перестановке. Это означает, что мы иным образом «нумеруем» координаты данного тензора. Читателю предлагается проверить, что в результате получается тензор (отличный, вообще говоря, от данного). 6°. Симметрирование и альтернирование. Предварительно введем понятия симметричного и кососимметричного тензоров. Тензор А с координатами (8-35) называется симметричным по нижним индексам im и 1п, если при перестановке этих индексов *) координаты тензора А не меняют своего значения, т. е. 4 (8.зв) Соотношение (8.36) называется условием симметрии тензора А по нижним индексам с номерами тип. Тензор А называется кососимметричным по нижним индексам im и in, если при перестановке этих индексов справедливо соотношение ln..tp=~Aky%..lm...lp. (8.37) Соотношение (8.37) называется условием кососимметрии тензора А по нижним индексам с номерами тип. Аналогично вводится понятие симметрии и кососимметрии тензора по двум верхним индексам. Замечание. Если условие симметрии (кососимметрии) по нижним индексам im и in выполняется для тензора А в данной системе координат, то оно выполняется и в- любой другой системе координат. Перейдем теперь к описанию операции симметри- рования. Пусть А —тензор типа (/?, q) с координатами (8.35). Пере- ставим у каждой координаты нижние индексы с номерами тип и затем построим тензор А(т, п> с координатами 4 <в.зв) *) Напомним, что при перестановке индексов у координат тензора мы полу- чаем координаты, вообще говоря, другого тензора,


§ 3] МЕТРИЧЕСКИЙ ТЕНЗОР. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 243 Операция построения тензора А(т, п) называется опера- цией симметрирования тензора А по нижним индек- сам с номерами тип. Отметим, что координаты (8.38) тензора А(т, п) обычно обозна- чаются символами ь h (8-39> Очевидно, для тензора А(т, П) выполняется условие симметрии (8.36) по нижним индексам с номерами т и п. Операция симметрирования тензора по верхним индек- сам с номерами тип определяется аналогично. Построенный тензор обозначается символом А(т-п). Для координат тензора д(т,п) используется обозначение, аналогичное обозначению (8.39) координат тензора Л(т, п) Операция альтернирования тензора А по нижним индексам с номерами тип производится следующим образом. У каждой координаты тензора А переставляются нижние индексы с номерами т и п и затем строится тензор А[т, п] с коор- динатами (в*» Операция построения тензора Aim, П] называется опера- цией альтернирования тензора А по нижним индек- сам с номерами тип. Координаты (8.40) тензора Л[т, П] обычно обозначаются символами k k •••'₽• (8-41) Очевидно, для тензора Л[т, П] выполняется условие кососим- метрии (8.37) по нижним индексам im и in. Операция альтернирования тензора по верхним индек- сам im и in определяется аналогично. Построенный тензор обозначается символом А1т-п]. Для координат тензора Alm’ используется обозначение, аналогичное обозначению (8.41) коор- динат тензора А[т, nj. В заключение отметим очевидное равенство А = А(т, м) + А[т, п]- § 3. Метрический тензор. Основные операции векторной алгебры в тензорных обозначениях 1. Понятие метрического тензора в евклидовом пространстве. В § 2 гл. 7 говорилось о том, что скалярное произведение в конеч- номерном линейном пространстве может быть задано с помощью
244 ТЕНЗОРЫ [ГЛ. 8 билинейной формы, полярной некоторой положительно определен- ной квадратичной форме. В этом параграфе мы будем считать, что в рассматриваемом конечномерном евклидовом пространстве Еп скалярное произведение задано такого типа билинейной формой Л (х, у). В п 2 предыдущего параграфа (пример 3) мы убедились, что коэффициенты матрицы билинейной формы могут рассматриваться как координаты тензора Эти коэффициенты для билинейной формы А (х, у), с помощью которой задается скалярное умножение в Еп, мы обозначим через gi}. Таким образом, gl} —координаты неко- торого тензора G в базисе .... еп. Этот тензор типа (2, 0) называется метрическим тензором пространства Еп. Напомним, что координаты gtj тензора G определяются соотно- шениями gtj — A(elt е}) (8.42) (см. формулу (8.23)). Заметим также, что так как форма А (х, у) симметрична (Л (х, у) = А (у, х)), то, согласно (8.42), gtJ = gjt, т. е. метри- ческий тензор G симметричен по нижним индексам i и j. Пусть х и у — произвольные векторы в Еп, х1 и у1 — коорди- наты этих векторов в базисе ег, е2, .... еп. Скалярное произведение (х, у) векторов х и у равно Л (х, у). Обращаясь к выражению (8.24) для билинейной формы в данном базисе и используя равенство (х, у) = Л (х, у), получим следую- щую формулу для скалярного произведения (х, у) векторов х и у: (х, у) = gi^yt. (8.43) В частности, скалярные произведения (ef, в}) базисных векторов Ct и в; равны gif. (eheJ)=glj (8.44) (это следует из равенства (е<, в}) = Л (е;, е}) и из формулы (8.42); впрочем, формулу (8.44) легко получить и непосредственно из (8.43)). Рассмотрим теперь наряду с базисом elt е2, .... еп взаимный базис е1, е2, ...,еп. Пусть х = и у — у^е1 —разложения векторов х и у по векторам взаимного базиса Тогда для скалярного произведения (х, у) получим следующую формулу: (х, у) = Л (х, у) = Л (xtel, у}е<) = А (е1, е') х(у}. Обозначая g‘i = Л (е‘, е>), (8.45) получим следующее выражение для (х, у): (X, у) = gVxtyj (8.46)


$ 3] МЕТРИЧЕСКИЙ ТЕНЗОР ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 245 Как и в п. 2 предыдущего параграфа (см. пример 3), легко убедиться, что gif представляют собой координаты тензора типа (О, 2) симметричного по индексам i и /. Этот тензор типа (0, 2) также называется метрическим тензором простран- ства Еп Мы будем обозначать его тем же символом 0, что и введенный выше метрический тензор типа (2, 0): в следующем пункте мы выясним, что координаты gi} и gl1 можно рассматривать как ковариантные и контравариантные координаты одного и того же тензора В дальнейшем эти координаты gl} и g'i мы так и будем называть ковариантными и контравариантными координатами тензора G. В конце п. 2 § 1 этой главы, исследуя вопрос о построении взаимных базисов, мы ввели величины gtj и g'i по формулам (8.10). Сравнивая эти формулы с формулами (8.42) и (8.45), мы приходим к выводу, что эти величины представляют собой ковариантные и контравариантные координаты метрического тензора G. В этом же п 2 § 1 мы доказали, что матрицы, элементами которых являются координаты git и g‘i, взаимно обратные. Это означает, что справедливо соотношение g^gik^ti- (8.47) Таким образом, координаты gl/ тензора G могут быть по- строены по координатам gi} и наоборот (для этого надо обратиться к известному способу построения элементов обратной матрицы). 2. Операция поднятия и опускания индексов с помощью ме- трического тензора. Метрический тензор G используется для опе- рации поднятия и опускания индексов у координат данного тензора А. Эта операция заключается в следующем. Пусть А —тензор типа (р, q) с координатами Для примера покажем, каким образом проводится операция поднятия индекса iv Свернем тензоры G и А по верхнему индексу / у первого тензора и по нижнему индекусу у второго тензора, т. е. построим тензор с координатами giaAai* j’ и у координат полученного тензора индекс i обозначим через i\. Затем эти координаты обозна- чим символами А(*.!.(р ч. Таким образом, <8-48) Замечание 1. Так как порядок расположения индексов у координат тензора определяет «нумерацию» его координат, то, вообще говоря, при поднятии индекса нужно отмечать место среди верхних индексов, на которое будет поднят данный нижний
246 ТЕНЗОРЫ [ГЛ. 8 индекс. Иногда в ряду нижних индексов нужно отметить место поднимаемого нижнего индекса Это делается с помощью точки, которая ставится на место поднятого индекса. Поэтому координаты тензора в левой части (8.48) следовало бы записать следующим образом: А ,2 /р ’ К примеру, если первый нижний индекс поднимается на второе место среди верхних индексов, то в результате мы получим тензор с координатами Aiz -lq q Замечание 2. Операция опускания индекса с помощью метрического тензора G определяется аналогично Например, координаты тензора, полученного путем опускания у тензора А индекса kq на последнее место в ряду нижних индексов, имеют следующий вид: Замечание 3. Операцию поднятия или опускания индекса можно применять несколько раз, причем каждый раз по отношению к различным индексам данного тензора. Рассмотрим примеры поднятия и опускания индексов у тен- зоров Пусть х — вектор, хг и х‘ — соответственно его ковариантные и контравариантные координаты (напомним, что вектор представ- ляет собой тензор ранга 1). Поднимем у координат х( индекс i с помощью метрического тензора G. В результате получим тензор с координатами glaxa. Так как ха = (х, еа), то giaxa = g‘a(х, еа) = (х, gtaea). Согласно (8.11) glaea = е1, а (х, е‘) = х‘. Поэтому g‘axa = хс. Таким образом, контравариантные координаты х‘ вектора х можно получить как результат операции поднятия индекса у ко- вариантных координат х, этого вектора. Ковариантные координаты xt могут быть получены как ре- зультат операции опускания индекса у контравариантных коор- динат х‘ Выясним результат двукратного применения операции подня- тия индекса у ковариантных координат gtj метрического тензора G с помощью контравариантных координат gi! этого же тензора. Иными словами, выясним, что представляет собой тензор с коор- динатами giag!*g<& (8.49) Используя симметрию тензора G по нижним индексам и соот- ношение (8.47), найдем g^g^ — gipg$a = ®а- Подставляя найден- ное выражение для g'pgap в (8.49/ и используя свойства символа Кронекера 6'а, получим


§ 3] метрический тензор, операции в ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 247 Совершенно аналогично можно убедиться в справедливости ра- венства gta-gifig^ = gu- Последние две формулы еще раз подчеркивают, что gtj и g‘f есте- ственно рассматривать как ковариантные и контравариантные координаты метрического тензора G. 3. Ортонормированные базисы в Еп. Мы уже выяснили, что скалярное произведение (х, у) в Еп может быть задано с помощью метрического тензора G, координаты gi;- которого представляют собой элементы симметричной положительно определенной ма- трицы (gi}). Именно, согласно (8.43), (X, y) = gijX‘y'. Известно, что с помощью преобразования базиса матрицу билинейной формы gux‘y' можно привести к диагональному виду. При этом, в силу положительной определенности матрицы, после приведения матрицы (gi}) к диагональному виду координаты метрического тензора будут равны нулю при i =£ j и единице при i = /. Обозначая эти координаты прежним символом gtj, получим gu^ О при i у= /, 1 при i = j. (8.50) Базис eit в котором координаты g^ метрического тензора удовлетворяют условию (8.50), является ортонормированным Действительно, так как (ег, е}) = git (см. (8 44)), то согласно (8.50), ( 0 при i у= /, (еь е,)= , . . v '' [1 при I = /, а это и означает, что et — ортонормированный базис. В гл. 4 мы выяснили, что в ортонормированном базисе скаляр- ное произведение (х, у) векторов х и у с координатами х1 и yi может быть вычислено по формуле п (X, у) = Е х‘у1, 1=1 а квадрат длины (х, х) вектора х — по формуле (х, х) = Е (х;)2. г=1 (8.51) (8.52) Обратимся к так называемым ортогональным линей- ным преобразованиям, т. е. к таким линейным преобразованиям,
248 ТЕНЗОРЫ (ГЛ. 8 при которых ортонормированный базис переходит в ортонормиро- ванный. Иными словами, если L — ортогональное преобразование и е, — ортонормированный базис, то Let также образует орто- нормированный базис Исследуем действие преобразования L на произвольный вектор х = х!е,. Обозначим через X результат действия L на х X=Lx Используя свойство линейности L, найдем X — Lx‘el — xlLe, Так как Le, — базис, то из последнего соотношения вытекает, что вектор X имеет в базисе такие же координаты, как и вектор х в базисе т. е. при ортогональном преобразовании сохраняют свое значение координаты вектора. Поскольку Let —ортонормированный базис, то скалярное произведение (X, У) векторов X = Lx и Y = Ly может быть найдено по формуле (8.51), а квадрат длины (X, X) вектора X = Lx — по формуле (8.52). Мы выяснили, что при ортогональ- ных преобразованиях сохраняют свое значение координаты векто- ров. Отсюда и из соотношений (8.51) и (8.52) получаем (X, У) — (х,у), (Х,Х) = (х,х). Таким образом, при ортогональных преобразованиях не меняются длины векторов и их скалярные произведения. Как известно, ортогональные преобразования L могут быть заданы с помощью ортогональной матрицы. Определитель det L такой матрицы удовлетворяет условию det L = ± 1. Выберем один из ортонормированных базисов и договоримся называть этот базис правым. В этом случае будем говорить, что евклидово пространство Еп ориентировано. Все базисы в Еп, получающиеся из данного ортогональными преобразованиями с определителем, равным +1, назовем правыми, а все базисы, которые получаются из данного ортогональными преобразова- ниями с определителем, равным —1, —левыми. Легко убедиться, что преобразование правого базиса в правый характеризуется равенством +1 определителя преобразования, а левого в левый — равенством —1 этого определителя. Обозначим через О (л) — множество всех ортогональных пре- образований в Еп, а через О+ (л) — множество ортогональных преобразований правых базисов. Эти множества будут рассмотрены в следующей главе. Замечание. В дальнейшем мы будем называть произволь- ный базис е^, е2, ..., еп п р а в ы м (левы м), если определитель матрицы перехода от выбранного ортонормированного базиса к базису ei, е2, ..., еп положителен (отрицателен). 4. Дискриминантный тензор. Рассмотрим так называемый вполне кососимметрический тензор е^2..л


§ 3] МЕТРИЧЕСКИЙ ТЕНЗОР. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 249 типа (р, 0), т. е. такой тензор, который кососимметричен по любым двум нижним индексам. Для того чтобы этот тензор не был нулевым, необходимо, чтобы число р не превышало п, т. е. удовлетворяло условию реп, ибо, если р > п, то любая координата будет иметь по меньшей мере два одинаковых индекса, при перестановке которых эта координата одновременно должна и изменить знак, и остаться неизменной Это может быть лишь в том случае, когда указанная координата равна нулю Следовательно, при р > п любая коорди- ната тензора равна нулю, т. е тензор является нулевым. Особый интерес представляет вполне кососимметрический тензор, ранг р которого равен размерности п пространства. Любая координата е11(-2 ,<п такого тензора может быть найдена по формуле 0, если среди индексов ib iz, ..., in хотя бы два совпадают, (8.53) (—l)signaei2 . п, если все индексы различны. В формуле (8.53) sign о равно 0 или +1 в зависимости от четности или нечетности перестановки о = (ilt i2, .., in) (sign о называют также знаком этой перестановки). Рассмотрим какую-либо правую ортонормированную систему координат и положим в ней 6i2...n = l. (8.54) С помощью соотношения (8.53) в данной системе координат опре- деляются все координаты е/ ;2_. 1п вполне кососимметрического тензора, а следовательно, и сам тензор, который в дальнейшем мы будем называть дискриминантным тензором. Коор- динаты этого тензора в произвольном базисе еъ е2, .., еп обозна- чим через с(1Ч ,п. Обозначим символом В матрицу перехода от выбранного пра- вого ортонормированного базиса к некоторому базису ei', е^, ... ..., еп-, а через Ь\. —элементы этой матрицы. Согласно (8.53) для вычисления координат дискри- минантного тензора в базисе еп- достаточно знать значение координаты С1-2- п-. Используя формулу (8.19) преобразования координат тензора и соотношение (8.54), получим, переходя от выбранного ортонор- мированного базиса к базису в\-, вт..еП’ •, = eI2...„ S (-l)sign0^?...b'-? = «’“('l,<п) = det (b‘r) = det В. (8.55)
250 ТЕНЗОРЫ [ГЛ. 8 Пусть gi’j’ — координаты метрического тензора в базисе в\', в2', , еп- Так как матрица G — (gi-j’) есть матрица билиней- ной формы gi'/'Xl'x>', представляющей собой скалярное произведе- ние векторов хи у с координатами х‘‘ и у'', то при переходе от данного ортонормированного базиса (в котором матрица Е рас- сматриваемой билинейной формы является единичной) к базису ер, ег', . еп- справедлива формула G = В'ЕВ. Отсюда следует, что det G = det В' det Е det В = (det В)2. Обозначая det G через g, получим из последнего соотношения det В = ± g Обращаясь к соотношениям (8.55), мы получим, что сиг- .п’ = ± Vg Таким образом, в произвольном базисе еь е2, ..., еп выражение для координаты С12.. п дискриминантного тензора имеет вид ci2...n= ± (8.56) где g —определитель матрицы (gi}) метрического тензора в базисе ^2» • •» &П • Отметим, что в формуле (8.56) знак плюс соответствует правому базису, а знак минус — левому. 5. Ориентированный объем. Введем в ориентированном евкли- довом пространстве Еп так называемую аффинную си- стему координат, определив ее как совокупность фикси- рованной точки О с координатами (0, 0, . , 0) и базиса elt eit ..., еп. Координаты любой точки М в Еп определяются в этом случае как координаты в базисе е2, .., еп вектора ОМ. Рассмотрим в Еп занумерованную систему из п векторов 1 2 п х, х, ..., х (8.57) и рассмотрим всевозможные векторы ОМ, определяемые соотно- шениями ___ 1 2 п ОМ = агх + а^х + ... 4- «п*> (8.58) при всевозможных а{, удовлетворяющих неравенствам 0 < а, < 1, [=1, 2, ..., п. Множество всех точек М пространства Еп, определяемое соотношениями (8.58), образует так называемый п-м е р н ы й параллелепипед в Еп, натянутый на векторы (8.57). / 1 2 Ориентированным объемом V\x,x, ...,х) этого параллелепипеда называется число / 1 2 л\ 12 п. Vlx, х, ..., x) = cil(i ../«. (8.59)


§ 3] МЕТРИЧЕСКИЙ ТЕНЗОР ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 251 При этом ctli2 in — координаты дискриминантного тензора в ба- I 2 п зисе elt е2, .... еп, а х’1, х'2, , х‘п —контравариантные коорди- 1 2 п наты векторов х, х, , х в этом же базисе Термин «ориентированный объем» объясняется тем, что в слу- чае, если векторы (8.57) образуют правый базис, ориентированный объем положителен (V >0), а в случае левого базиса —отри- цателен (V < 0) Отметим, что при п = 3 ориентированный объем, вычисляемый для п = 3 по формуле (8.59), представляет собой обычный объем 1 2 з параллелепипеда, натянутого на векторы х, ху х, взятый со знаком 1 2 3 + , если тройка х, х, х правая, и со знаком —, если эта тройка левая. 6. Векторное произведение. С помощью дискриминантного тензора можно записать в трехмерном пространстве Е3 в тензорном виде векторное произведение Такая запись широко используется при различных вычислениях в так называемых криволинейных координатах Пусть ciih —координаты дискриминантного тензора в данном базисе elt е2, &з пространства Е3 Поднимем у этого тензора первый индекс i с помощью метрического тензора glm, т.е. рассмотрим тензор c}k Тогда координаты г1 вектора z = [ху ] (т. е. векторного произведения векторов х и у) в базйсе е1У е2, е3 имеют вид г' = cjftx't/\ (8.60) Так как c\kx'yk представляет собой тензор типа (0, 1), то г1 можно рассматривать как контравариантные координаты вектора. Поэтому, чтобы убедиться, что г‘ действительно представляют собой координаты векторного произведения, достаточно обра- титься к какой-либо определенной системе координат и непосред- ственно провести проверку Эта проверка элементарна для орто- нормированного базиса и предоставляется читателю. Соотношение (8.60) может служить основой для введения векторного произведения п — 1 вектора в Еп 1 2 л-1 Пусть х, х, , х— какие-либо п — 1 вектор в Еп. Определим Г 1 2 л-11 координаты zl векторного произведения z = [хх ..л] с помощью соотношений it h 2i п~‘ (8.61) В соотношениях (8.61) in t —координаты дискриминант- 1 2 л-1 ного тензора с поднятым первым индексом, а х\ х'2, ..., х*7*-1 — 1 2 п-1 контравариантные координаты векторов х, ж, ,.м х.
252 ТЕНЗОРЫ (ГЛ. 8 7. Двойное векторное произведение. Из векторной алгебры известна следующая формула для двойного векторною произведе- ния [a [bd ] ] векторов а, b и d la[bd]] = b ad) — d(ab). (8.62) Используя соотношение (8 60) и формулу (8.43) для скалярного произведения векторов, перепишем (8 62) следующим образом: Ckiakc‘mntrdn = b‘gklakd‘ - ^g^b1. (8.63 ) С помощью (8.63) мы получим формулу, связывающую тензоры clki и gtk, которую в свою очередь используем для записи координат двойного векторного произведения. Проведем следующие преобразования в формуле (8.63) В пер- вом слагаемом b‘gkiakd’ в правой части (8.63) заменим Ь‘ на и индекс суммирования / заменим на п. Во втором слагаемом в пра- вой части (8.63) положим d‘ = (Гв‘п и индекс суммирования / заменим на т. После этих преобразований формула (8.63) примет вид (cft(Cmn) akbmdn = (gkn6(m — gkmS‘n) akbmdn. (8.64) Так как соотношение (8.64) справедливо для любых векторов а, b и d, то оно представляет собой тождество относительно коорди- нат ak, bm и dn этих векторов, и поэтому для любых индексов i, k, т, п имеет место равенство = gknb‘m - gkmbn. (8.65) Обозначим через г1 координаты двойного векторного произведения Тогда, согласно (8.63), z' = Ckiclmnakbmdn. Отсюда и из (8.65) получаем следующее выражение для координат г' двойного векторного произведения fafbd]]: ^ = (g^-gtm6i)aklfldn. (8.66) Формула (8.66) удобна для различных приложений. § 4. Метрический тензор псевдоевклидова пространства 1. Понятие псевдоевклидова пространства и метрического тен- зора псевдоевклидова пространства. Рассмотрим n-мерное линей- ное пространство L, в котором задана невырожденная, симметрич- ная билинейная форма А (х, у), полярная знакопеременной квадратичной форме. Будем называть скалярным произведением (х, у) векторов х и у значение А (х, у) билинейной формы. Наименование *) Соотношение Ь‘ =Ьтд1т следует из свойств символа Кронекера.


5 4] МЕТРИЧЕСКИЙ ТЕНЗОР ПСЕВДОЕВКЛИДОВА ПРОСТРАНСТВА 253 «скалярное произведение» условно, поскольку в рассматриваемом случае не выполняется четвертая аксиома скалярного произведе- ния. Именно, в случае, когда билинейная форма А (х, у) полярна знакопеременной квадратичной форме, выражение А (х, х) в зави- симости от выборах может иметь как положительное, так и отри- цательное значение и обращаться в нуль для ненулевых векторов х. Все же мы будем пользоваться термином «скалярное произведение», так как это общепринято. Сформулируем определение псевдоевклидова пространства. Определение. Псевдоевклидовым простран- ством называется п-мерное линейное пространство L, в котором задано скалярное произведение посредством невырожденной симме- тричной билинейной формы А (х, у), полярной знакопеременной квадратичной форме. Число п называется размерностью псевдоевклидова пространства. Выделим в линейном пространстве L базис elt е.,, . еп и обозначим через (gif) матрицу билинейной формы А (х, у) в этом базисе (напомним, что gi} = А (ег-, в/)) Если и у'1 —контрава- риантные координаты векторов хи у, то А(х, y) = g!}xlyi. (8.67) В полной аналогии с рассуждениями п. 2 § 2 этой главы дока- зывается, что (gu ) представляют собой координаты тензора G типа (2,0). Этот тензор мы будем в дальнейшем называть метри- ческим тензором псевдоевклидова про- странства. Так как скалярное произведение (х, у) равно А (х, у), то, согласно (8.67), имеем (х, у) = gtjx'yf. Известно, что матрицу (gtf) билинейной формы А (х, у) можно привести к диагональному виду. При этом в силу невырожденности формы А (х, у) координаты gtj метрического тензора после приве- дения к диагональному виду будут равны нулю при i =/= j и единице или минус единице при i = /. Число р положительных и число q отрицательных диагональных элементов не зависит от способа приведения к диагональному виду, причем, в силу невырожден- ности формы А (х, у), р + q = п. Приведенные рассуждения поясняют обозначение Е”р, для п-мерного псевдоевклидова пространства. Естественно поставить вопрос об измерении длин векторов в псевдоевклидовом пространстве. В евклидовом пространстве с метрическим тензором gtj квадрат длины вектора хс координатами х‘ считается равным gijrfx>. Если определить квадрат длины s2 (х) вектора х с помощью соотношения s2 (х) = gt jx‘x>, (8.68)
254 ТЕНЗОРЫ [ГЛ. 8 то, очевидно (поскольку форма А (х, х) знакопеременная), можно указать ненулевые векторы с положительным квадратом длины, с отрицательным квадратом длины и с нулевым квадратом длины. Поэтому, чтобы получить в качестве меры длины векторов лишь действительные числа, обычно за длину вектора принимают о (х) = (sgn s2 (х)) s2 (х) |. (8.69) В дальнейшем мы будем использовать следующую терминоло- гию, заимствованную из специальной теории относительности: мы будем называть ненулевой вектор х времениподобным, если для этого вектора о (х) >0, пространственнопо- добны м, если о (х) <0, и изотропным, если о (х) = 0. Справедливо следующее утверждение: Множество концов всех времениподобных (пространственно- подобных, изотропных) векторов, начала которых совпадают с про- извольной фиксированной точкой М псевдоевклидова пространства, образует конус. Для определенности докажем утверждение, рассматривая времениподобные векторы. Очевидно, достаточно доказать, что если х — времениподобный вектор, то при любом вещественном X =/= 0 вектор Хх также времениподобен. Так как координаты вектора Хх равны Хх‘, то, согласно (8.68), s2 (Хх) = Х2$2 (х), т. е. sgn s2 (Хх) = sgn s2 (х). Отсюда и из (8.69) следует, что вектор Хх будет времениподобным. Для случая времениподобных векторов утверждение доказано. Рассуждая аналогично, убедимся в справедливости утверждения для случая пространственноподобных и изотропных векторов. Конус времениподобных векторов обозначается часто символом Т (от англ, time—время), а конус пространственноподобных векторов —символом S (от англ, space —пространство). 2. Галилеевы координаты. Преобразования Лоренца*). В тео- рии псевдоевклидовых пространств важную роль играют те си- стемы координат, в которых квадрат интервала (так обычно назы- вают квадрат длины вектора $2 (х)) имеет вид Р п S2 (X) = £ (х‘)2 - S (х‘)2. (8.70) i=i /=р-Н По терминологии, заимствованной из физики, такие системы координат называются галилеевыми. Преобразования координат, которые сохраняют для $2 (х) выражение (8.70), называются преобразованиями Лоренца. В следующем пункте мы рассмотрим вопрос о преобразованиях Лоренца пространства £ц, з), называемого пространством *) Гендрик Антон Лоренц (1853 — 1928) — нидерландский математик


§ 4] МЕТРИЧЕСКИЙ ТЕНЗОР ПСЕВДОЕВКЛИДОВА ПРОСТРАНСТВА 255 Минковского*). Это пространство представляет особый инте- рес для физики, ибо является пространством событий специальной теории относительности. Отметим, что обычно в пространстве Минковского нумерация координат вектора начинается с нуля. Таким образом, согласно (8.70), квадрат $2 (х) интервала в пространстве E(lt3> записывается следующим образом: s2 (х) = (х0)2 — (х1)2 — (х2)2 — (х3)2. (8.71) Для удобства в физике координата х° отождествляется с выра- жением ct, где с —скорость света, a t —временная переменная; х1, х2, х3 называются пространственными переменными. В пространстве Минковского конус Т времениподобных векто- ров распадается на две различные связные открытые компоненты 7'+ (конус будущего) и Т~ (конус прошлого); конус S простран ственно подобных векторов образует связное множество. Поясним структуру связных компонент Т+ и Т~. Для этого обратимся к физической интерпретации вектора х с координатами х1, i = 0, 1, 2, 3, в пространстве Е(1,з>: этот вектор характеризу- ется величиной Д/ = хЧс и вектором Дг = {х1, х2, х3}. Таким образом, рассматривая х как перемещение в Е*\, 3), можно считать, что это перемещение характеризуется временным Д/ и простран- ственным Дг перемещениями. Времениподобные векторы х определяются условием s (х) > 0. В этом случае, очевидно, jДг|/ |Д/| < с. Если при этом Д/ > 0, то для перемещения х получим неравенство 0 < | Дг|/| Д/| < с Такое перемещение х принадлежит по определению Т+ и может рассматриваться как перемещение материальной частицы «в буду- щее» Если Д/ < 0, то перемещение х принадлежит 74' и может рассматриваться как перемещение частицы «в прошлое» (в физике так интерпретируется движение античастиц). Очевидно, Т+ и Т~ представляют собой две связные открытые компоненты конуса Т. Проведенные рассуждения поясняют их наименования — конус будущего и конус прошлого. 3. Преобразования Лоренца пространства Еу, з>. Рассмотрим в псевдоевклидовом пространстве E(ii3) галилееву систему коор- динат с базисом et. В такой системе координат квадрат интервала s2 (х) имеет вид (8.71), а матрица (gtj) метрического тензора имеет вид (1 о о 0\ 0 — 1 0 0 | /0-70, о 0—1 о )• (8.72) О 0 0 — 1 / ) Герман Минковский (1864— 1909) — немецкий математик и физик.
256 ТЕНЗОРЫ [ГЛ. 8 Перейдем к новой галилеевой системе координат с базисом eg и выясним условия, которым должны удовлетворять коэффи- циенты др матрицы В преобразования базисных векторов.Так как ei = b‘rel (8.73) и так как матрица (gp,’) метрического тензора в базисе также имеет вид (8.72), то используя формулы gty ~ b\’b'i-gi преобразо- вания координат метрического тензора, получим следующую систему уравнений для определения коэффициентов Ь\ матрицы В преобразования базисных векторов (см (8.73); при этом индексы i и i' пробегают значения 0, 1, 2, 3 (см (8.71)): 3 Ю2-2 W = i, а=1 bl.bl - s b-bf =0, <х= 1 3 ( — 1 ь°л - s Ь*.Ь1. = а=1 ( U (8.74) при / = [}', при /, Р' = 1, 2,3. Соотношения (8.74) можно записать в матричной форме Для этой цели рассмотрим наряду с матрицей В матрицу В*, которая получается из В путем изменения знака у элементов последних трех столбцов и последующего транспонирования. Очевидно, соотношения (8.74) можно записать в следующей форме: B*B = J, (8.75) где матрица J определяется соотношением (8.72) (для сравнения напомним, что матрица С ортогональных преобразований евкли- дова пространства удовлетворяет соотношению С'С = /, где / —единичная матрица). Так как det В* = —det В, a det J = —1, то из соотношения (8.75) следует, что det В* В = det В* det В = —(det В)г = —1, т. е. detB = ±l. (8.76) Обозначим через L совокупность всех общих преобразований Лоренца пространства Минковского Из этих общих преобразова- ний выделим те преобразования, которые переводят каждый вектор из Т+ в вектор, также принадлежащий Т+. Совокупность таких преобразований обычно называется преобразова- ниями Лоренца пространства Efi, з) и обознача- ется символом Lf. Общие преобразования Лоренца, для которых det В = +1, образуют класс В+ так называемых собственных пре- образований Лоренца.


$ 4] МЕТРИЧЕСКИЙ ТЕНЗОР ПСЕВДОЕВКЛИДОВА ПРОСТРАНСТВА 257 Класс L. несобственных преобразований Лоренца характеризуется соотношением det В = —1. Приме- ром такого преобразования может служить отражение относительно трех пространственных осей: х1' = —х1, х2' = —х2, х3’——х3. Пусть В — матрица произвольного несобственного преобразо- вания Лоренца, а Р — матрица только что рассмотренного отра- жения Очевидно, произведение произвольного несобственного преобразования и рассмотренного отражения будет собственным преобразованием с матрицей В' = РВ Так как Р2 = Р Р = /, где / —единичная матрица, то В = Р2В = Р (РВ) = РВ'. Таким образом, всякое несобственное преобразование Лоренца является произведением некоторого собственного преобразования с матрицей В' и отражения с матрицей Р. Пересечение множеств и L+ обозначают символом L^. Некоторые групповые свойства множеств L, Lj, L+ и L । будут рассмотрены в следующей главе. В заключение найдем те преобразования L , которые не меня- ют координат х2 и х3. Ясно, что это будут преобразования L дву- мерного псевдоевклидова подпространства с координатами х° и х1, в котором квадрат интервала вычисляется по формуле (х°)2 — — (*х)2 Запишем для рассматриваемого случая формулы (8.74) По- лучим b°0.b°} -Ь\.Ь\ ==о, (^)г_(ь;,)2 = _1. (8.77) Полагая b^-lbv = 0, найдем из (8.77) следующие выражения для коэффициентов Ь\- матрицы преобразования В базисных векторов е , в\, вг, вз в базисные векторы Со-, ер, вг, ез-'- —_!—_ М, = j- ___Ё—_ Ь'(. = -и —.. Р — /1-р2 /l-р2 /М2 Ь\, = -t— 1 К" 1 - р2 В этих формулах знак выбирается из условия принадлеж- ности преобразования Лоренца классу L Не вникая в детали вычислений, запишем окончательные формулы преобразования координат: x°'=-^J^, х1' == х2 = х2, х3'= х3. (8.78) 1 - р2 р 1 - Р2
258 ТЕНЗОРЫ [ГЛ. 8 Положим в соотношениях (8.78) х° = ct, х1 = х, х2 = у, х3 = г, х°' = ct', х1' = х, х2' — у', х3' = г'. Тогда формулы (8.78) перепишутся следующим образом: /-------х 0 , , с , — рс/ + X , , г - , х = -Р- У — У, г = г. /1 - Р2 |Л1 - Р2 (8.79) Выясним теперь физический смысл константы 0. Допустим, что точка Р неподвижна в системе координат (f, х', у', г') Это означает, что время /' меняется, а пространственные координаты х', у', г' этой точки постоянны Исследуем вопрос о поведении точки Р относительно системы (/, х, у, г). Дифференцируя послед- ние три уравнения (8.79) и учитывая, что dx' = dy' = dz' = О, получим 0 — ~ ^р.77—, 0 — dy, 0 = dz . Поэтому = 0с, rfy _ a dt ’ di Следовательно, всякая точка Р, неподвижная в системе коор- динат (f, х', у', г') (а следовательно, и вся эта система координат), движется относительно системы (t, х, у, г) с постоянной скоростью и = 0с в направлении оси Ох. Итак, 0 = и/с, где v —скорость движения системы (Г, х', у', г') относительно системы (х, у, z, t). Отметим, что так как О < v < с, то 0 < 0 < 1. Перепишем теперь следующим образом формулы (8.79): х = 17"—у=у' г 8,80 V 1 - Формулы (8 80) представляют собой формулы перехода от инерциальной системы (/, х, у, г) к другой инерциальной системе (/', х , у', г'). Эти формулы называются формулами Ло- ренца. § 5. Тензор момента инерции Рассмотрим твердое тело, закрепленное в точке О. Пусть г — ОМ. — радиус-вектор точки М этого тела, v — скорость точки М. Как известно, момент импульса 2V определяется соотношением W= j [rv}dm, где V —объем тела, dm=pdV (р— плотность тела). v Обозначая через N1 — контравариантные координаты вектора /V и используя формулу (8.60) для векторного произведения, получим Nl = j clklrkvl dm (8.81) V


ТЕНЗОР МОМЕНТА ИНЕРЦИИ 259 $ 5] (напомним, что 4/ = gisCski, где см — координаты дискрими- нантного тензора в данном базисе пространства Е3, см п 6 § 3 этой главы). По теореме Эйлера существует мгновенная ось вращения тела Обозначая через (о вектор мгновенной угловой скорости, получим v = [юг 1 Снова обращаясь к формуле (8.60) для вектор- ного произведения, найдем а' = с>Г. (8.82) Подставляя найденное выражение и1 в правую часть (8.81) и учитывая независимость от переменных интегрирования, получим следующее выражение для N1: N' = \c‘k clpnrkrn^ dm = <а₽ J 44„r*rn dm == <£>pJlp. (8.83) V V Тензор JP= dm, (8.84) v фигурирующий в правой части соотношений (8.83), называется тензором момента инерции. Преобразуем выражение (8.84) для тензора момента инерции. Для этой цели обратимся к формуле (8.65). По этой формуле имеем =£*п6р —gkpti- Поэтому К = J (gkA ~ ghpti) ^гк dm. (8.85) v Если в выражении (8.85) опустить индекс i с помощью метри- ческого тензора, то в результате получим часто используемую формулу для координат дважды ковариантного тензора момента инерции: Jtp = J (г2Я/₽ — Vp) dm. (8.86) v Тензор момента инерции широко используется в механике твердого тела. Для примера запишем с помощью этого тензора выражение для кинетической энергии Т. Имеем T = ~Y j у2 dm = -^- J gijVlv! dm. v v Но поскольку v‘ = c‘pnwprn, выражение для T примет вид Т = J gifpnC^rW dm = -L J „4/V dm. V V Отсюда, согласно (8.84), найдем 7’ = 4-ю₽соА/рА.
ГЛАВА 9 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП В этой главе будут изложены основные понятия теории групп и указаны некоторые приложения этой теории. Важность теории групп определяется многочисленными ее приложениями в физике. § 1. Понятие группы. Основные свойства групп 1. Законы композиции. Будем говорить, что в множестве А определен закон композиции, если задано отображе- ние Т упорядоченных пар элементов из А в множество А. При этом элемент с из Л, поставленный с помощью отображения Т в соот- ветствие элементам а, b из Д, называется композицией этих элементов. Композиция с элементов а и Ь обозначается символом аТЬ'. с = аТЬ. Для композиции элементов а, Ь множества А используются и другие формы записи. Наиболее употребительными являются аддитивная форма записи с = а -Ь Ь и мультипликативная форма записи с = ab. В случае аддитивной формы записи композиции соответству- ющий закон композиции обычно называется сложением, а при мультипликативной форме — умножением. Закон композиции называется ассоциативным, если для любых элементов а, Ь, с множества А выполняется соотношение аТ (ЬТс) — (аТЬ) Тс Закон композиции называется коммутативным, если для любой пары а, Ь £ А выполняется соотношение аТЬ — ЬТа Элемент е множества А называется нейтральным от- носительно закона Т, если для любого элемента а множества А выполняется соотношение аТе = а. Примерами законов композиции могут служить обычные сло- жение и умножение в множестве вещественных чисел . Оба эти закона коммутативны. Нейтральным элементом для сложения является нуль, для умножения —единица.


$ 1] ПОНЯТИЕ ГРУППЫ. ОСНОВНЫЕ СВОЙСТВА ГРУПП 261 2. Понятие группы. Некоторые свойства групп. Сформули- руем следующее определение. Определение 1. Множество А, в котором определен закон композиции Т, называется группой G, если этот закон ассо- циативен, существует нейтральный элемент е относительно закона Т и для каждого элемента а множества А существует об- ратный элемент а"1, т. е. такой элемент, для которого аТаг1 — = е. Если использовать мультипликативную форму записи ком- позиции элементов, то определению 1 можно придать следующую форму. Определение 2. Множество А элементов а, Ь, с...... в ко- тором определен закон композиции, называемый умножением и ставящий в соответствие каждой паре элементов а, b множе- ства А определенный элемент с = ab этого множества, называется группой G, если этот закон удовлетворяет следующим тре- бованиям-. 1°. a (be) — (ab)c (ассоциативность). 2°. Существует элемент е множества А такой, что для лю- бого элемента а этого множества ае = а (существование ней- трального элемента). 3°. Для любого элемента а множества А существует обратный элемент а"1 такой, что ааг1 = е. Обычно нейтральный элемент е называется единицей группы G. Если закон композиции Т, действующий в группе G, является коммутативным, то группа G называется коммутатив- ной или абелевой. Для абелевых групп часто используется аддитивная форма записи композиции элементов. В этом случае нейтральный элемент абелевой группы называется нулем. Рассмотрим примеры групп. 1) Множество Z целых чисел образует абелеву группу отно- сительно сложения. Действительно, операция сложения целых чисел представляет собой, очевидно, закон композиции. Ясно, что этот закон ассо- циативен и коммутативен. Нейтральным элементом (нулем) яв- ляется целое число нуль. Обратным элементом для целого числа а служит целое число — а. 2) Множество положительных вещественных чисел образует абелеву группу относительно умножения. Эта операция пред- ставляет собой закон композиции. Очевидно, этот закон ассо- циативен и коммутативен. Нейтральным элементом является вещественное число единица. Обратным элементом для числа а > 0 служит число 1/а. 3) Линейное пространство образует абелеву группу относи- тельно сложения элементов. Эта операция представляет собой закон композиции. Согласно аксиомам линейного пространства
262 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП (ГЛ. 9 этот закон ассоциативен и коммутативен Нейтральным элементом является нулевой элемент пространства, обратным элементом для элемента х —элемент —х. 4) Пусть BCD — равносторонний треугольник (см. рис. 9.1) Рассмот- рим следующее множество А опера- ций, совмещающих треугольник с са- мим собой Г Поворот а на 2л/3 вокруг цен- тра Н, переводящий В в С. 2°. Поворот 0 на 4л/3, переводя- щий В в D. 3°. Симметрия Sx, переводящая С в D. 4°. Симметрия S2, переводящая D в В. 5°. Симметрия S3, переводящая В в С. 6°. Тождественная операция 1. Следующая таблица представляет закон композиции эле- ментов множества А: Приведенный закон композиции ассоциативен, но не комму- тативен, существует нейтральный элемент —тождественная опе- рация 1. Каждая операция имеет обратную (в каждой строке и столбце таблицы имеется тождественная операция). Таким образом, множество А операций с указанным законом композиции представляет собой группу, очевидно, не коммута- тивную. 5) Группы перестановок. Взаимно однозначное отображение f произвольного множества Е на себя называется перестановкой множества Е. При


§ п ПОНЯТИЕ ГРУППЫ ОСНОВНЫЕ СВОЙСТВА ГРУПП 263 этом всякий элемент а множества Е переходит в элемент f (а), обратная перестановка f"1 переводит f (а) в а. Перестановка f (а) = а для любого а множества Е называется тождествен- ной перестановкой. Если множество Е состоит из элементов а, Ь, с.то пере- становку f этого множества записывают следующим образом: f .)• В множестве Р перестановок множества Е естественным об- разом определяется закон композиции: если Д и /2 — перестановки Е, то последовательное проведение /2°/1 этих перестановок пред- ставляет собой некоторую перестановку множества Е. Легко ви- деть, что композиция ассоциативна. Если множество Р содержит тождественную перестановку, обратную перестановку для каждой своей перестановки f и вместе с любыми двумя перестановками f1( /2 их композицию /2%> то, очевидно, Р представляет собой группу. Все перестановки множества Е образуют группу. Для конеч- ного множества Е из и элементов эта группа называется сим- метрической группой Sn. Обратимся к примеру 4), в котором были рассмотрены опе- рации совмещения равностороннего треугольника BCD с самим собой. Обозначим через Е множество вершин этого треугольника: Е = (BCD). Очевидно, группу операций, рассмотренную в примере 4), можно получить, обращаясь к следующей группе перестановок: , /В С D\ /В С D\ я (В С D\ {~\В С D/’ а~\С D В/’ ₽ ко В С)' с _(В С D\ /В С D\ „ /В С D \ dl~\S D С)' ^~\D С в)’ 3 \С В D )' 6) Рассмотрим группу Z2, состоящую из двух элементов 0 и 1, в которой умножение определено по правилу 0-0 = 0, 0-1 = 1, 1.0 = 1, 1-1=0. (9.1) Единицей группы является- элемент 0. Эту группу называют группой вычетов по модулю 2. 7) Рассмотрим группу, состоящую из двух элементов: 1) тож- дественное преобразование евклидова пространства (обозначим этот элемент 0); 2) отражение евклидова пространства относи- тельно начала координат (обозначим этот элемент 1). Очевидно, умножение (т. е. последовательное проведение опе- раций I) и 2)) элементов 0 и 1 будет проводиться по правилу (9.1). Мы видим, что рассматриваемая группа отличается от группы Z2 (пример 6) лишь природой элементов Групповые свойства этих двух групп одинаковы.
264 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. 9 Отметим следующие свойства групп (мы будем использовать мультипликативную форму записи композиции). Теорема 9.1. Если аа'1 = е, то а'1а — е. Доказательство Пусть х — обратный элемент для элемента а'1: а'1х = е. Тогда а = ае — а (а^х) = (аа-1) х = ех, т. е а = ех Следова- тельно, а'1 а — а-1 (ех) = (а ге) х = а-1х = е, т е а'1а = е. Тео- рема доказана. Теорема 9.2. Для любого элемента а группы справедливо со- отношение еа = а. Доказательство. По теореме 9.1 а'1 а = е и, кроме того, па"1 = е. Поэтому еа — («а-1) а — а (а-1а) = а, т. е. еа = а. Тео- рема доказана. Теорема 9.3. Если ах = е и ау = е, то х = у. Доказательство. Так как ау = е, то у — обратный элемент для а, и поэтому, согласно теореме 9.1, уа = е. Имеем далее у = уе = у (ах) = (уа) х = ех = х. Теорема доказана. Из доказанных теорем вытекают следующие важные следствия: Следствие 1. Обратным элементом для элемента а-1 служит элемент а. Или, иначе, элемент а'1 является как правым, так и левым обратным элементом для элемента а (т. е. аа'1 = е и а'1 а = е) Следствие 2. В любой группе уравнения ах = b и уа = Ь од- нозначно разрешимы. Решениями этих уравнений служат соот- ветственно элементы х = а~1Ь и у = Ьа'1. Следствие 3. В группе имеется единственный нейтральный элемент (единица группы) (если ае = а и ае* = а, то е = е*). Замечание. Отметим, что обратным элементом (ab)'1 для произведения ab служит элемент Ь^а'1. Действительно, используя ассоциативное свойство умноже- ния, получим (ab) (Ь^а'1) = a (bb~l) а'1 = аса-1 = аа'1 = е. 3. Изоморфизм групп. Подгруппы. Примеры, рассмотренные в предыдущем пункте (см примеры 4 и 5, примеры 6 и 7) по- казывают, что существуют группы, отличающиеся природой своих элементов, но обладающие одинаковыми групповыми свойствами. Такие группы естественно назвать изоморфными. Сформулируем точное определение этого понятия. Определение 1. Две группы G± и G2 называются изоморф- ными, если существует взаимно однозначное отображение f группы Ох на группу G2 такое, что для любых элементов а и b из Gj выполняется условие f (ab) — f (a) f (b). Заметим, что если е} —единица группы Gb а е2 —единица группы G2, то / (ej = е2. Действительно, / (et) = f (е^) = — f tei)7 (ei) и умножение на элемент, обратный к f (ег), показы- вает, что е2 — f (ех)


§ 1] ПОНЯТИЕ ГРУППЫ. ОСНОВНЫЕ СВОЙСТВА ГРУПП 265 Отметим также, что обратное отображение f'1 группы G2 на группу Gj для любых элементов х и у из Gt удовлетворяет условию Г1 (ху) = f'1 (X) Г (у). Кроме того, для любого а из Gt из равенства е2 = / (ех) — = f (аа'1) = f (a) f (а-1) следует, что обратным к элементу f (а) является элемент f (а"1). Таким образом, изоморфные группы, рассматриваемые аб- страктно, без указания природы их элементов, сточки зрения груп- повых свойств неразличимы. Замечание 1. Обычно соответствие между изоморфными группами Gx и С2 называется изоморфизмом или изо- морфным отображением одной группы на другую (конечно, при этом обе группы равноправны). Замечание 2. Изоморфное отображение группы G на себя называется автоморфизмом. Автоморфизмы группы определенным образом характеризуют ее симметрию. Если отдельные автоморфизмы группы рассматривать как некоторые элементы, а последовательное проведение автомор- физмов — как произведение соответствующих элементов, то авто- морфизмы сами образуют группу (единичным элементом будет тождественный автоморфизм). Эта группа называется группой автоморфизмов данной группы. Легко убедиться, что группа автоморфизмов группы Z2 (см. пример 6 предыдущего пункта) изоморфна этой же группе. Важную роль в теории групп играет понятие подгруппы. Определение 2. Подмножество Gx элементов группы G назы- вается подгруппой этой группы, если выполнены условия: 1) если элементы а и b принадлежат Git то и ab принадлежит Glt 2) если элемент а принадлежит Glr то и обратный элемент а'1 также принадлежит G^. Подгруппа Gj группы G, рассматриваемая как самостоятель- ное множество, в котором определена операция умножения по закону композиции из объемлющей группы G, представляет собой группу. Проверка этого утверждения не представляет затруднений. Простейшей подгруппой любой группы является ее единич- ный элемент. Другим примером может служить подгруппа Gx всех четных чисел в группе G относительно сложения всех це- лых чисел. 4. Смежные классы. Нормальные делители. Пусть Нх и Н2— произвольные подмножества группы G. Произведением подмножеств Нх и Н2 назовем под- множество Н3, состоящее из всех элементов вида h^, где £ Hlt h2 £ Н2,
266 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. 9 Для произведения подмножеств используется обозначение Н-з = HtHt. (9.2) Рассмотрим случай, когда состоит из одного элемента h. Тогда, согласно (9.2), произведение и Н2 можно записать в виде hH2. Отметим, что если подмножества и Я2 являются подгруппами группы G, то их произведение НХН2, вообще говоря, не является подгруппой. Пусть Н —подгруппа группы G, а —элемент группы G. Мно- жество аН называется левым смежным классом, а множество На — правым смежным классом под- группы Н в G. Конечно при выборе другого элемента вместо а правые и левые классы подгруппы Н в G, вообще говоря, изменяются. Отметим следующие свойства смежных классов (эти свойства формулируются лишь для левых смежных классов; для правых смежных классов они формулируются аналогично): 1°. Если а £ Н, то аН = Н. 2°. Смежные классы аН и ЬН совпадают, если а-1Ь £ Н. 3°. Два смежных класса одной подгруппы Н либо совпадают, либо не имеют общих элементов. 4°. Если аН —смежный класс, то а £ аН. Первое из отмеченных свойств очевидно. Убедимся в спра- ведливости свойства 2°. Так как, согласно Г, а~Ч)Н = Н, то, поскольку аа-1 = е, имеем ЬН — (аа"1) ЬН = а (a^b) Н = аН. Тем самым свойство 2° установлено. Перейдем к доказательству третьего свойства. Очевидно, до- статочно доказать, что если смежные классы аН и ЬН имеют общий элемент, то они совпадают. Пусть элементы hx £ Н и h2 £ Н такие, что ah! = bh2 (9.3) (равенство (9.3) означает, что классы аН и ЬН имеют общий эле- мент). Поскольку Н — подгруппа группы G, то элемент /1Д21 принадлежит Н. Отсюда и из (9.3) получаем а-1* = й1Й21 е н. Следовательно, согласно свойству 2°, аН — ЬН. Свойство 3° до- казано. Свойство 4° следует из того, что подгруппа Н содержит еди- ничный элемент е, и поэтому ае = а £ аН. Пусть Н —подгруппа G, для которой все левые смежные классы одновременно являются правыми смежными классами. В этом случае для любого элемента а должно иметь место соот- ношение (9.4) аН = На.


и ПОНЯТИЕ ГРУППЫ. ОСНОВНЫЕ СВОЙСТВА ГРУПП 267 Действительно, согласно свойству 4°, элемент а £ аН. С дру- гой стороны, класс аН является одновременно некоторым клас- сом НЬ, который, очевидно (в силу того, что а £ НЬ), совпадает с множеством На. Подгруппа Н, для которой все левые смежные классы яв- ляются правыми смежными классами, называется нормаль- ным делителем группы G. Справедливо следующее утверждение: Если Н —нормальный делитель группы G, то произведение смежных классов представляет собой также смежный класс. Действительно, пусть аН и ЬН —смежные классы. Тогда по определению произведения смежных классов как подмножеств группы G с учетом (9.4), получим аНЬН = a (Hb) Н = а (ЬН) Н = (ab) (НН) = (ab) Н, т. е. произведение смежных классов аНЬН есть смежный класс (ab) Н. 5. Гомоморфизмы. Фактор-группы. _ Пусть G — группа с элементами а, Ь, с, ... и б — некоторое множество, в котором определен закон композиции его элемен- тов а, б, с, .... Мы будем использовать мультипликативную форму записи композиции: с = аб, а элемент с будем называть произведением элементов а и б. Определение 1. Отображение f группы G на множество G *): f : G -* G (9.5) называется гомоморфизмом, если для любых элементов а £ G и б £ G выполняется соотношение f (ab) = f (a) f (b), (9.6) где / (a), f (b) и f (ab) — образы элементов a, b и ab при отобра- жении f. При этом G называется гомоморфным образом G. В случае, если G является подмножеством G, то для гомо- морфизма (9.5) употребляется наименование эндоморфизм. Замечание. Если задано гомоморфное отображение (гомо- морфизм) группы G на множество G, то все элементы группы раз- биваются на непересекающиеся классы: в один класс объединяются все те элементы G, которые отображаются в один и тот же эле- мент множества G. *' Под отображением f группы G на множество G понимается такое соответ- ствие между элементами множеств G и G, при котором каждому элементу a f С ставится в соответствие лишь один элемент а £ G и каждый элемент а € G яв- ляется образом по крайней мере одного элемента из G. Символически отображе- ние G на G записывается с помощью соотношения (9.5)
268 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. 9 Справедливо следующее утверждение: Теорема 9.4. Гомоморфный образ группы является группой. Доказательство. Пусть а, б, с, ... —элементы гомо- морфного образа G группы G при гомоморфизме f. Это означает, что в группе G можно указать такие элементы а, Ь, в... что й ~ f (а), б = f (b), c=f(c), ... Тогда в множестве G умножение элементов согласовано с пра- вилом (9.6). Проверим, что эта операция умножения удовлетворяет требо- ваниям 1°, 2е и 3е определения 2 группы (см. п. 2 этого пара- графа). Г. Ассоциативность умножения. Составим два произведения а (бс) и (аб) с. Имеем, согласно правилу (9.6), а (бс) = f(a)(f (b) f (с)) = f(a)f (be) — f (abc), (аб) c — (f(a)f (b)) f(c) = f (ab) f (c) = f (abc). Сопоставляя эти соотношения, получим а (бс) = (аб) с. Следо- вательно, ассоциативность умножения элементов выполняется. 2°. Существование единицы. Обозначим символом ё элемент / (е), где е — единица группы G: ё = f (е). Для любого элемента а множества G имеем, согласно пра- вилу (9.6), аё — f (a) f (е) = f (ае) — f (а) = а. Следовательно, элемент ё действительно играет роль единицы. 3°. Существование обратного элемента. Обозначим симво- лом а-1 элемент f (а-1), где а-1 —обратный элемент для элемента а в группе G. Имеем, согласно (9.6), аа~х = f (a) f (а'1) = f (aa~l) ~ f (е) — ё. Следовательно, элемент а'1 играет роль обратного элемента для элемента а. _ Итак, для операции умножения элементов G выполнены тре- бования Г, 2°, 3° определения 2 группы. Поэтому G — группа. Теорема доказана. Пусть // —нормальный делитель группы С._Определим сле- дующее отображение f группы G на множество G смежных клас- сов по нормальному делителю Н: если а принадлежит G, то этому элементу поставим в соответствие тот класс смежности, которому принадлежит указанный элемент. Согласно свойству 3° смежных классов (см. предыдущий пункт) каждому элементу группы G при таком отображении отвечает только один класс, т. е. налицо действительно отображение f группы G на множество классов смежности по нормальному делителю Н. Докажем следующую теорему.


§ и ПОНЯТИЕ ГРУППЫ. ОСНОВНЫЕ СВОЙСТВА ГРУПП 269 Теорема 9.5. Указанное выше отображение f группы G на смежные классы по нормальному делителю Н, при определении умножения классов смежности как подмножеств группы G, пред- ставляет собой гомоморфизм. Доказательство. В конце предыдущего пункта мы до- казали утверждение о том, что если аН и ЬН — смежные классы, то произведение аНЬН этих классов как подмножеств G есть смежный класс (ab) Н. Следовательно, с помощью рассматри- ваемого отображения f произведению элементов ab ставится в соответствие смежный класс (ab) Н, равный произведению смежных классов аН и ЬН. Поэтому f — гомоморфизм. Теорема доказана. Следствие^ Множество смежных классов группы G по нор- мальному делителю Н с операцией умножения этих классов как подмножеств G образует группу. Эта группа называется фактор-группой группы G по нормальному делителю Н и обозначается символом G/H. Справедливость следствия вытекает из теоремы 9.4. Замечание. Очевидно, отображение f группы G на множе- ство смежных классов по нормальному делителю Н представляет собой гомоморфизм этой группы на фактор-группу G/H. Рассмотрим следующий пример. Пусть Rn — n-мерное линейное координатное пространство, которое, как отмечалось в примере 3 п. 2 этого параграфа, яв- ляется абелевой (т. е. коммутативной) группой относительно сложения элементов (напомним, что точками х этого пространства являются упорядоченные совокупности из п вещественных чисел (х1г ..., хп), причем сложение элементов (хх.хп) и (ylt ..., уп) производится по правилу (хх + ylt .... хп + уп)). По определению прямого произведения, Rn представляет собой прямое произведение одномерных пространств: Rn = R'w X X ... X /?<„)• Так как, например, R\ni представляет собой абелеву под- группу, то, очевидно, 2?(Л) —нормальный делитель группы Rn. Смежным классом элемента а из Rn служит прямая, проходящая через точку а параллельно прямой R\n), а фактор-группа Rn[R\n-> изоморфна (п — 1)-мерному подпространству Rn~1-. Rn 1 === Л<1) X /?(2) X ... ХЛ'л-о» (9.7) Отметим, что обозначение фактор-группы Rn/R\n> определен- ным образом объясняется с помощью соотношения Rn/R}n) — Ли, X ... X = Я<1) X ... X Rl(n-i)> (9.8)
270 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. 9 которое следует из (9.7). Отметим, что в формуле (9.8) послед- ний знак равенства нужно рассматривать как изоморфизм между соответствующими группами. Мы доказали, что по нормальному делителю Н определяется гомоморфизм группы G на фактор-группу G/Н. Справедливо об- ратное утверждение: если задан гомоморфизм группы G на мно- жество G, то по этому гомоморфизму определяется такой нор- мальный делитель Н, что группа G *) и фактор-группа G/Н изо- морфны. Докажем две теоремы, относящиеся к этому утверждению. Теорема 9.6. Пусть f—гомоморфизм группы G на G, и пусть Н—множество тех элементов группы G, которое при гомомор- физме f отображаются в элемент f (е), где е—единица группы G. Тогда Н—нормальный делитель группы G. Доказательство. Достаточно доказать, что Н — под- группа группы G и каждый левый смежный класс по этой под- группе является одновременно и правым смежным классом. Убедимся, во-первых, что Н — подгруппа группы G. Для этого следует доказать, что если а £ Н и b £ Н, то ab £ Н, а также что если а £ Н, то и а-1 £ Н. Пусть а £ Н и b £ Н. Так как f — гомоморфизм, то f (ab) = -f(a)f(b)=f(e)f(e). Но / (е) играет роль единицы в группе G (см. теорему 9.4). Поэтому / (е) f (е) = f (е), т. е. f (ab) — f (е). Следовательно, ab £ £ Н. Далее пусть а £ Н, т. е. f (а) = f (е). Тогда, если а-1 —обрат- ный элемент для а, то аа-1 = е, т. е. аа-1 £ Н. Так как f — гомо- морфизм, то f (е) — f (аа-1) = f (a) f (а-1) — f (е) f (а-1) — / (а-1). Поэтому f (а-1) = f (е) и, следовательно, а-1 £ Н. Докажем теперь, что каждый левый смежный класс является одновременно и правым смежным классом. Пусть а—произвольный элемент группы G. Докажем, что множество А элементов группы G, отображающихся при гомо- морфизме f в элемент / (а), есть одновременно левый и правый смежные классы аН и На. Этим и будет завершено доказатель- ство теоремы. Пусть а' £ А. Рассмотрим уравнение **) ах = а'. (9.9) Так как f — гомоморфизм и / (а') — f (а), то из этого уравне- ния получаем f (ах) = f (a) f (х) — f (o') = f (а), т. е. f (х) = f (е). Поэтому х £ Н. Но тогда, согласно (9.9), а" — ах, т. е. а' £ аН. *) Согласно теореме 9.4 гомоморфный образ группы представляет собой группу. **) В силу следствия 2 из теоремы 9.3 это уравнение разрешимо. Решением будет элемент х = а-1с(.


5 2] ГРУППЫ ПРЕОБРАЗОВАНИЙ 271 Обращаясь далее к уравнению ха = а' и проводя аналогичные рассуждения, мы убедимся, что х £ Н. Но тогда а' = ха, т. е. а' С На. Таким образом, А = аН — На. Теорема доказана. Теорема 9.7 (теорема о гомоморфизмах групп). Пусть f — гомоморфизм группы G на G и Н — тот нормальный делитель группы G, элементам которого соответствуют при гомоморфизме f единица группы G *). Тогда группа G и фактор-группа GIH изоморфны. Доказательство. Установим взаимно однозначное со- ответствие между элементами группы G и смежными классами по нормальному делителю Н-. элементу а группы G поставим в соот- ветствие тот смежный класс, который с помощью / отображается в а. Очевидно, это соответствие взаимно однозначно, ибо, согласно свойству 3° смежных классов (см. п. 4 этого параграфа), эти классы не пересекаются. Если определить умножение этих клас- сов как подмножеств группы G и воспользоваться утверждением, доказанным в конце предыдущего пункта, то легко видеть, что установленное только что взаимно однозначное соответствие есть изоморфизм. Но классы смежности и есть элементы фактор- группы. Теорема доказана. § 2. Группы преобразований В этом параграфе изучаются группы невырожденных линейных преобразований линейного и, в частности, евклидова простран- ства. 1. Невырожденные линейные преобразования. В п. 1 § I гл. 5 было введено понятие линейного оператора. Напомним, что линейным оператором А называлось такое отображение линей- ного пространства V в линейное пространство W, при котором образ суммы элементов равен сумме их образов и образ произ- ведения элемента на число равен произведению этого числа на образ элемента. Мы будем рассматривать так называемые невырожден- ные линейные операторы, отображающие данное конечномерное линейное пространство И в это же пространство. При этом ли- нейный оператор А называется невырожденным, если det А =/= ^=0 **). Отметим следующее важное свойство невырожденных операто- ров: каждый такой оператор отображает пространство V на себя взаимно однозначно. *) По теореме 9.4 G представляет собой группу. **) Напомним, что det А был введен в п. 2 § 2 гл. 5 как определитель ма- трицы линейного оператора в данном базисе. Там же было доказано, что зна- чение det А не зависит от выбора базиса.
272 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. 9 Иными словами, если А —невырожденный оператор, то каж- дому элементу х С V соответствует только один элемент у £ V, который может быть найден по формуле у = Ах, (9.10) и если у —любой фиксированный элемент пространства V, то существует только один элемент х такой, что у — Ах. Для доказательства второй части сформулированного утвер- ждения обратимся к матричной записи действия линейного опе- ратора. Итак, если А = (а£) — матрица оператора А в данном базисе и элементы хну имеют соответственно координаты х1, .. , хп и г/1, .... уп, то, согласно формуле (5.14) (см. п. 1 § 2 гл. 5), соотношение (9.10) перепишется в виде z/'=£a(x*, j = 1, 2, ..., п, (9.11) и поэтому координаты х* можно рассматривать как неизвестные при заданных координатах у'. Так как оператор А невырожден- ный, т. е. det А =/= 0, система уравнений (9.11) имеет единствен- ное решение для неизвестных xk. Это и означает, что для каждого фиксированною элемента у С У существует только один элемент х такой, что у = Ах. Итак, результат действия невырожденного линейного опера- тора можно рассматривать как отображение линейного про- странства V на себя. Поэтому при заданном невырожденном операторе мы можем говорить о невырожденном линейном преобразовании простран- ства V, или, короче, о линейном преобразовании пространства У. 2. Группа линейных преобразований. Пусть У —n-мерное ли- нейное пространство с элементами х, у, z, ... и GL (л) —мно- жество всех невырожденных линейных преобразований этого пространства. Определим в GL (л) закон композиции, который в дальнейшем будем называть умножением. Мы определим умножение линейных преобразований из GL (п) так же, как было определено в п. 2 § 1 гл. 5 умножение линейных операторов. Именно, произведением АВ линейных преобразований А и В из множества GL (л) мы назовем линейный оператор, действующий по правилу (АВ)х = А(Вх). (9.12) Отметим, что, вообще говоря, АВ В А. Для того чтобы указанное произведение действительно было законом композиции (см. п. 1 § 1 этой главы), достаточно дока- зать, что преобразование АВ является невырожденным, а это сле- дует из того, что матрица линейного преобразования АВ равна


§ 2 J ГРУППЫ ПРЕОБРАЗОВАНИЙ 273 произведению матриц преобразований А и В, а следовательно, det (АВ) = det Л’det В 0, ибо det А 0 и det В =/= 0. Докажем теперь следующую теорему. Теорема 9.8. Множество GL (п) невырожденных линейных пре- образований линейного п-мерного пространства V с введенной выше операцией умножения представляет собой группу (называемую группой линейных преобразований линейного пространства V). Доказательство. Проверим требования 1°, 2°, 3° опре- деления 2 группы (см. п. 2 § 1 этой главы). 1°. Ассоциативность умножения, т. е. равенство А (ВС) = (АВ) С справедливо, поскольку, согласно (9.12), произведение линейных преобразований заключается в их последовательном действии, и поэтому линейные преобразования А (ВС) и (АВ) С совпадают с линейным преобразованием АВС и, следовательно, тождественны. 2°. Существование единицы. Обозначим символом I тожде- ственное преобразование. Это преобразование невырожденное, так как det I = 1. Очевидно, для любого преобразования Л из GL (п) справедливо равенство Al = IA = Л. Следовательно, линейное преобразование I играет роль еди- ницы. 3°. Существование обратного элемента. Пусть Л —любое фиксированное невырожденное линейное преобразование. Обра- тимся к координатной записи (9.11) этого преобразования. Так как det Л Ф 0, то из системы (9.11) можно по заданному у (по за- данным координатам у) единственным образом определить х (координаты xk). Следовательно, определено обратное преобразо- вание Л-1, которое, очевидно, будет линейным (это следует из (9.11)); кроме того, по самому определению Л'1 Л == I. Поэтому линейный оператор Л-1 играет роль обратного элемента для Л. Итак, для операции умножения элементов из GL (п) выпол- нены требования Г, 2s, 3° определения 2 группы. Поэтому GL (п) — группа. Теорема доказана. 3. Сходимость элементов в группе GL (п). Подгруппы группы GL (п). В этом и дальнейших пунктах этого параграфа мы будем рассматривать группу GL (п) в л-мерном евклидовом простран- стве V. Введем понятие сходимости в группе GL (л). Определение. Последовательность элементов {Лп} из GL (л) называется сходящейся к элементу А £ GL (л), если для любого х из V последовательность {Лпл| сходится к Ах*). *) Последовательность {Дпх} представляет собой последовательность точек пространства V. Поэтому сходимость последовательности {Лпх) понимается в обычном смысле. 10 Зак 459
274 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП (ГЛ. 9 Понятие сходимости в GL (п) мы используем ниже при введе- нии так называемых компактных групп. Рассматривают следующие типы подгрупп группы GL (л). Iе. Конечные подгруппы, т. е. подгруппы, содержащие конеч- ное число элементов. Примером конечной подгруппы может служить подгруппа отражений относительно начала координат, содержащая два элемента —тождественное преобразование и отражение относи- тельно начала (см. пример 7 п. 2 § 1 этой главы). 2°. Дискретные подгруппы, т. е. подгруппы, содержащие счет- ное число элементов. Примером такой подгруппы может служить подгруппа пово- ротов плоскости около начала координат на углы /г<р, k = 0, ±1, ±2, .... где <р—угол, несоизмеримый с л. 3°. Непрерывные подгруппы, т. е. подгруппы, содержащие более чем счетное число элементов. Подгруппа всех поворотов трехмерного пространства вокруг фиксированной оси представляет собой пример непрерывной подгруппы. Среди непрерывных подгрупп группы GL (л) выделяются так называемые компактные подгруппы, т. е. подгруппы, у которых из любого бесконечного множества ее элементов можно выделить последовательность, сходящуюся к элементу этой под- группы. 4. Группа ортогональных преобразований. В группе GL (л) вы- деляется специальная подгруппа так называемых ортого- нальных преобразований. Эти преобразования, рас- сматриваемые как отдельное множество, образуют группу, назы- ваемую ортогональной группой. Введем понятие ортогональных преобразований. Напомним, что мы рассматриваем невырожденные линейные преобразования. Понятие такого преобразования равнозначно понятию невырожденного оператора, т. е. оператора Д, для кото- рого det А 0. Напомним теперь введенное в § 9 гл. 5 понятие ортогональ- ного оператора, действующего в вещественном евклидовом про- странстве V. Именно, линейный оператор Р мы назвали ортогональным, если для любых х и у из V справедливо соотношение (Рх, Ру) = (х, у). (9.13) Результат действия ортогонального оператора Р будем назы- вать ортогональным преобразованием Р. В теореме 5.36 было доказано, что оператор Р является орто- гональным тогда и только тогда, когда существует обратный опе- ратор Р'1 и выполняется равенство Р~1 = Р*. (9.14)


ГРУППЫ ПРЕОБРАЗОВАНИЙ 275 J !] В этом равенстве Р* —оператор, сопряженный к Р. Таким образом, если преобразование Р является ортогональ- ным, то у этого преобразования есть обратное Р х. Отсюда сле- дует, что каждое ортогональное преобразование является невы- рожденным. Действительно, поскольку РР’1 = I, где / — то- ждественное преобразование, то det Р-det Р 1 = det 7=1, т. е. det Р Ф 0. Следовательно, ортогональное преобразование Р невырожденное. Отметим следующее важное свойство ортогональных преоб- разований. Теорема 9.9. Множество всех ортогональных преобразований евклидова пространства V с обычной операцией умножения линей- ных преобразований, образует группу (называемую ортого- нальной группой и обозначаемую символом О (п)). Доказательство. Достаточно доказать, что произведе- ние ортогональных преобразований представляет собой ортого- нальное преобразование. Существование обратного преобразова- ния (обратного элемента) для данного ортогонального преобразо- вания доказано в теореме 5.36 (см. также только что сделанное замечание). Итак, пусть Рх и Р2 —ортогональные преобразования. Рас- смотрим произведение АД. Согласно теореме 5.36 нам доста- точно доказать соотношение (ЛР2)(ЛА)*==/. (9.15) В п. 1 § 5 гл. 5 (см. свойство 5° сопряженных операторов) мы установили, что (АТ^)* = Р?Р' Используя это соотношение и ортогональность преобразований Pt и Pt, получим (Ptpt) (/W - (Ptpt) (РЖ)=Pl (PtPi) р; = PJPf = PJ>’ = I. Таким образом, соотношение (9.15) доказано. Теорема доказана. Замечание 1. Очевидно, ортогональная группа является подгруппой группы GL (п). Замечание 2. Значение определителя det Р ортогональ- ного преобразования Р удовлетворяет соотношению (detP)2=l. (9.16) Таким образом, detP=±l. (9.17) Для доказательства (9.16) заметим, что для матрицы Р пре- образования Р справедливо соотношение РР'=1, (9.18) где Р' —транспонированная матрица, полученная из Р переста- новкой строк и столбцов, а 7 —единичная матрица.
276 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. 9 Так как det Р = det Р* (при перестановке строк и столбцов определитель не меняется) и det / = 1, то из соотношения (9.18) следует, что (det Р)а = 1, т. е. det Р = ±1. Поскольку, по опре- делению, det Р вводится как определитель матрицы Р в любом базисе, то соотношения (9.16) и (9.17) доказаны. Соотношение (9.17) для определителя ортогонального преоб- разования служит основой для разделения всех таких преобра- зований на два класса. В первый класс мы отнесем все ортогональные преобразова- ния, для которых det Р = 4-1. Эти преобразования в дальней- шем будем называть собственными. Во второй класс отнесем все ортогональные преобразования, для которых det Р = —1. Такие преобразования будем называть несобственными. Множество всех собственных ортогональных преобразований образует группу, называемую собственной ортого- нальной группой. Эта группа обозначается символом SO (п). Можно доказать, что каждая группа SO (п) компактна. 5. Некоторые дискретные и конечные подгруппы ортогональ- ной группы. В этом пункте мы не будем стремиться к полноте изложения. На отдельных примерах мы постараемся выяснить характеристики некоторых подгрупп ортогональной группы. Отметим, что конечные и дискретные подгруппы группы О (3) имеют важное значение в кристаллографии. Г. Рассмотрим двумерную ортогональную группу О (2). В этой группе можно выделить дискретную подгруппу поворотов на угол А<р, k = 0, ±1, ±2, ... Обозначим буквой а элемент этой подгруппы, отвечающий значению k = +1. Тогда, очевидно, элемент оА, отвечающий по- вороту на угол Лф при k > 0 равен ак = а-а ... а. Это соотноше- k раз ние можно сокращенно записать в следующей форме: ah = ak, k = 1, 2, ... Если обозначить символом а-1 элемент, обратный элементу а (сГ1 —элемент, отвечающий повороту на угол —ф) и единицу рассматриваемой подгруппы обозначить а°, то, очевидно, любой элемент ак при отрицательном, положительном и нулевом зна- чении k можно записать в виде ик ~ k = 0t xfcl» Ч~2. ... (9.19) Группы, элементы ак которых могут быть представлены в виде (9.19), называются циклическими. Очевидно, циклические группы являются дискретными. Отметим два типа циклических подгрупп поворотов:


s 2] ГРУППЫ ПРЕОБРАЗОВАНИЙ 277 1) Если ф 2nplq, где р и q — целые числа (т. е. угол не- соизмерим с л), то все элементы ah различны. 2) Если ф = 2np/q, где р и q -— взаимно простые числа, то справедливо соотношение aft+7 = ah, то есть а9 = а0. Группы, для которых выполняется последнее соотношение, называются циклическими группами по- рядка q. 2°. Обратимся теперь к так называемым подгруппам зер- кальной симметрии. Каждая подгруппа зеркальной симметрии состоит из двух элементов: единица (тождественное преобразование) и отражение либо относительно какой-либо плоскости, либо относительно на- чала координат. Убедиться в том, что тождественное преобразование и отра- жение образуют группу, весьма просто —достаточно заметить, что два последовательных отражения дают тождественное преоб- разование (см. пример 7 п. 2 § 1 этой главы). Рассмотрим, например, подгруппу {/, Р\ группы О (3), со- стоящую из единицы I и отражения Р трехмерного пространства относительно начала координат. В ортонормированном базисе /—1 о о\ матрица Р этого преобразования имеет вид /’=( 0—1 о ). \ 0 о — 1 J Так как определитель det Р = —1, то подгруппа \1, Р\ является несобственной. В примере 7 п. 2 § 1 этой главы от- мечалось, что подгруппа \1, Р\ изоморфна группе Z2 вычетов по модулю 2. Докажем следующее утверждение: Рассматриваемая подгруппа Р\ представляет собой нор- мальный делитель группы О (3). Нам требуется доказать, что для любого элемента а из О (3) справедливы соотношения al = 1а, аР — Ра (9.20) (эти соотношения показывают, что левый и правый смежные классы подгруппы |/, Р\ совпадают, что является признаком нормального делителя). Первое из соотношений (9.20) очевидно. Для доказательства второго соотношения воспользуемся сле- дующими очевидными свойствами отражения Р: PP^I РаР = а, а£О (3). Умножая соотношение РаР слева на Р и пользуясь равен- ством РР = I, получим второе соотношение (9.20). Докажем теперь следующее утверждение
278 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. 9 Подгруппа SO (3) собственных ортогональных преобразований группы О (3) изоморфна фактор-группе группы О (3) по нормаль- ному делителю {/, Р\. Доказательство. Смежный класс элемента а £ SO (3) по подгруппе {/, Р\ имеет вид {а, Ра|, причем Ра — несобственное преобразование (произведение собственного преобразования а и несобственного преобразования Р дает несобственное преобразо- вание). Если а* — несобственное преобразование, то смежный класс |а', Ра'\ приводится к виду {а, Ра), где а = Ра' —собственное преобразование и Ра — Р (Ра') = (РР) а' = а'. Таким образом, фактор-группа О (3)/{/, состоит из смежных классов вида (а, Ра\, где а —собственное преобразование. Оче- видно, соответствие а *— {а, Ро} есть изоморфизм между груп- пами SO (3) и О (3)/{/, Р|. Утверждение доказано. 6. Группа Лоренца. В п. 1 § 4 гл. 8 мы ввели понятие псевдо- евклидова пространства ?), т. е. линейного пространства, в котором задано скалярное произведение (л, у), равное невы- рожденной симметричной билинейной форме А (х, у), полярной знакопеременной квадратичной форме А (х, х): (х, у) = А (х, у). (9.21) В п. 2 § 4 гл. 8 было отмечено, что в так называемой галилеевой системе координат квадрат интервала s*(x) = (x,x) (9.22) (так обычно называется квадрат длины вектора х с координа- тами (хь xit .... X,,)) имеет вид s2 (X) = s — S (9.23) /=-1 I—л+1 Введем понятие преобразования Лоренца псев- доевклидова пространства £?₽, «)• Определение. Линейное преобразование Р псевдоевклидова про- странства Е"р,называется преобразованием Ло- ренца, если для любых х и у из E"Pl справедливо соотношение (Рх, Ру)=(х,у), (9.24) где (х, у) —скалярное произведение, определенное соотношением (9.21). Равенство (9.24) называется условием лоренц о- вости преобразования. Отметим, что при преобразовании Лоренца сохраняется ква- драт интервала s* (х), определенный соотношением (9.22) (или 9.23)).


$ 2] ГРУППЫ ПРЕОБРАЗОВАНИЯ 279 Так же как в п. 4 этого параграфа, можно доказать, что опре- делитель det Р преобразования Лоренца отличен от нуля, и по- этому для каждого преобразования Лоренца Р существует обрат- ное преобразование Р1. Кроме того, по самому смыслу определения преобразования Лоренца, произведение таких преобразований дает в результате преобразование Лоренца. Таким образом, справедливо следу- ющее утверждение. Множество всех преобразований Лоренца псевдоевклидова про- странства Е"р, с обычной операцией умножения линейных пре- образований (линейных операторов) образует группу, называемую общей группой Лоренца псевдоевклидова простран- ства Е(Р, и обозначаемую символом L (п; р, q). Мы выделим специальный класс псевдоевклидовых пространств n-о (сюда включается интересное с физической точки зрения пространство £(1. 3))- Группа Лоренца для пространств £(i,n-i) обозначается через L(n). В п. 1 § 4 гл. 8 (формула (8.69)) было введено понятие длины а (л) вектора л, которая вычисляется по формуле о (л) = (sgn s2 (л)) /| з2 (л) |- С помощью этой формулы все ненулевые векторы псевдоевкли- дова пространства разделяются на времениподобные (а (л) > 0), пространственноподобные (а (л) <0) и изотропные (о (л) = 0). Было доказано, что множество концов времениподобных (пространственноподобных, изотропных) векторов, начала которых совпадают с произвольной фиксирован- ной точкой, образует конус Т (конус пространственноподобных векторов обозначается буквой S). Конус Т по соглашению •) разделяется на две связные компоненты Т* и Т~ (конус будущего и конус прошлого) так, что каждая из этих компонент вместе с вектором л содержит любой вектор Кл, где 1 > 0. Описанное разделение векторов в псевдоевклидовом простран- стве дает возможность выделить из группы Лоренца L (п) некото- рые подгруппы. Именно, подгруппа группы L (л), преобразования которой переводят любой времениподобный вектор снова во временипо- добный вектор, называется полной группойЛоренца. Для нее используется обозначение L । (л). *) В п. 2 §4 гл. 8 для пространства Минковского 3) указа- но, как разделяется конус Т на связные компоненты 74 и 7" и дается физическая интерпретация этих компонент.
280 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП Ггл. е Выделяется еще одна подгруппа группы L (л). В эту под- группу входят преобразования, определитель матрицы которых положителен. Эта подгруппа обозначается £+ (л) и называется собственной группой Лоренца. Собственные преобразования Лоренца, которые принадлежат подгруппе Lf (л), также образуют подгруппу. Ее часто называют группой Лоренца и обозначают символом L । (л). В заключение этого пункта мы отметим, что группы Лоренца, в отличие от ортогональных групп, некомпактны *). Для примера докажем некомпактность группы L । (2). В п. 3 § 4 гл. 8 мы полностью описали эту группу. Напом- ним, что если в E(i, и введена система координат (х, у) так, что квадрат интервала задается формулой s2=x2 — у2, (9.25) то преобразования Лоренца из группы L । (2) пространства Ep.i) задаются формулами х' = х~№ и' = у~$х V1 — р2 ’ у /1 - р2 (9.26) Рассмотрим в плоскости (х, у) вектор х с координатами (0, 1). По формуле (9.26) этот вектор перейдет в вектор х$ с координа- тами / -Р \/1 -Р2 ’ 1 /Т^р5 (9.27) Обратимся теперь к последовательности преобразований Ло- ренца (9.26), определяемой значениями 0Л из соотношения = « = 1,2, ... (9.28) Согласно (9.27) и (9.28) вектор х перейдет при действии ука- занной последовательности преобразований Лоренца в следу- ющую последовательность векторов |хп} с координатами (—/л^Т, /л). (9.29) *) В п. 3 этого параграфа было введено понятие сходимости элементов в группу GL (л) в л-мерном евклидовом пространстве и связанное с понятием сходимости понятие компактной группы. Эти понятия легко переносятся на случай группы в произвольном конечно- мерном линейном пространстве V. Сначала вводится понятие сходимости точек в V (например, можно выбрать в V систему координат и рассматривать сходи- мость последовательности векторов {хт} как сходимость последовательностей координат этих векторов). После этого в полной аналогии с определением схо- димости в случае группы GL (п) в евклидовом пространстве вводится понятие сходимости в группе, заданной в линейном пространстве, и определяется поня- тие компактной группы в таком пространстве.


$ 3] ПРЕДСТАВЛЕНИЯ ГРУПП 281 Таким образом, из бесконечной последовательности преобра- зований Лоренца в группе L । (2), определенной соотношениями (9.26), для значений 0 из равенств (9.28) нельзя выделить сходя- щуюся последовательность (напомним, что последовательность элементов Ап группы называется сходящейся к элементу А, если для любого х последовательность сходится к Ах), ибо по- следовательность (9.29) неограниченная. Геометрическая иллюстрация некомпактности группы L । (2) заключается в следующем. Согласно (9.25) окружность радиуса единица в псевдоевклидо- вой плоскости будет гиперболой х2 —у2 == 1, являющейся не- компактным множеством. При действии рассмотренной выше по- следовательности преобразований из группы L । (2) заданная точка на этой окружности преобразуется в бесконечно большую по- следовательность точек на указанной выше гиперболе, а из беско- нечно большой последовательности точек нельзя выделить схо- дящуюся последовательность. 7. Унитарные группы. В этом пункте мы обратимся к комп- лексному линейному пространству. В полной аналогии с п. 2 этого параграфа можно рассматривать группы линейных преобра- зований такого пространства. Так как комплексное число опре- деляется двумя вещественными числами (действительной и мни- мой частью), то полная линейная группа GL (л) преобразований n-мерного комплексного линейного пространства изоморфна пол- ной линейной группе преобразований вещественного 2л-мерного пространства GL (2п) (вместо этого символа часто пишут GL (2п, R), подчеркивая тем самым, что речь идет о группе преобразований вещественного пространства). В полной линейной группе преобразований комплексного евклидова пространства по аналогии с вещественным евклидовым пространством рассматриваются так называемые унитарные группы U (л), являющиеся аналогом ортогональных групп (на- помним, что в § 7 гл. 5 унитарные преобразования (унитарные операторы) определялись как линейные преобразования, сохра- няющие скалярное произведение; таким же образом в веще- ственном случае определялись и ортогональные преобразования). Как и в вещественном случае, в группе U (л) унитарных пре- образований выделяется подгруппа SU (л), для которой опреде- лители унитарных преобразований равны единице. § 3. Представления групп В предыдущем параграфе мы рассматривали группы линейных преобразований линейного пространства. Таким образом, линей ные преобразования исследовались с точки зрения их групповых
282 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. б свойств. При этом не игнорируются геометрические и другие свойства линейных преобразований. В этом параграфе нас будет интересовать в определенном смысле обратный вопрос — в какой мере свойства абстрактно за- данной группы могут быть охарактеризованы посредством групп линейных преобразований. Один из способов решения этого вопроса заключается в гомо- морфном (и, в частности, изоморфном) отображении абстрактной группы на подгруппу (или на всю группу) линейных преобразо- ваний. Таким образом, возникает понятие представления данной группы с помощью подгруппы группы линейных преобра- зований *). Изучение различных представлений данной группы позволяет выявить важные свойства группы, нужные для различных при- ложений. Во многих разделах физики (кристаллография, теория отно- сительности, квантовая механика и т. д.) требуется построение представлений различных групп (конечных и дискретных под- групп группы GL (3), групп О (3), L (3), U (3), SU (3) и т. д.). Эти построения выходят далеко за рамки начальных понятий теории групп и не могут рассматриваться в данном руководстве. Мы ограничимся некоторыми понятиями, используемыми в тео- рии представлений и примерами. 1. Линейные представления групп. Терминология. Определение. Л инейным представлением груп- пы G в конечномерном евклидовом пространстве Еп называется такое отображение f, посредством которого каждому элементу а этой группы ставится в соответствие линейное преобразование Та пространства ЕП так, что для любых аг и аг из G выполняется соотношение Т{а,ао = Ta,Taj. Таким образом, линейное представление группы G в конечно- мерном евклидовом пространстве Еп есть гомоморфизм этой группы на некоторое подмножество линейных преобразований этого пространства. Используется следующая терминология: пространство Еп на- зывается пространством представления, раз- мерность п этого пространства называется размерностью представления, базис в пространстве Еп называется базисом представления. Заметим, что гомоморфный образ f (G) группы G также назы- вается представлением этой группы в пространстве представлений. В дальнейшем для краткости л-мерные линейные представления группы мы будем называть просто представлениями этой группы. *) Конечно, можно рассматривать и более общий вопрос о представлении данной группы путем отображения ее на какую-либо группу преобразований.


9 3) ПРЕДСТАВЛЕНИЯ ГРУПП 283 Для обозначения представления группы G используется сим- вол D (G); различные представления данной группы отмечаются индексом (например, ZJG** (G)). Символом (g) будем обозна- чать линейное преобразование (линейный оператор), отвечающее элементу g G G в представлении 0<ц) (G). Тривиальным представлением группы G называется гомоморфное отображение G в единичный элемент группы GL (п). Если отображение f группы G на подгруппу GL (п) является изоморфизмом, то представление называется точным. Очевидно, не у всякой группы есть точное n-мерное пред- ставление для заданного п. Например, у группы 0 (10), конечно, не может быть точного одномерного представления (это следует, в частности, из того, что группа О (1) абелева, а группа О (10) не абелева). Отметим, что при гомоморфном отображении f группы G в GL (п) получающееся представление группы изоморфно фактор- группе G/kern f, где kern f — так называемое ядро гомоморфизма f, т. е то множество элементов G, которое при гомоморфизме f отображается в единицу группы GL (п). 2. Матрицы линейных представлений. Эквивалентные пред- ставления. Рассмотрим представление D'^ (G) группы G. В этом представлении каждому элементу g из G отвечает линейное пре- образование D<>*> (g). Матрицу этого линейного преобразования в базисе представления Dw (G) мы будем обозначать Dw ‘ (g) или (g). В зависимости от выбора базиса в пространстве представ- лений будет меняться и матрица D}/’ (g), отвечающая элементу g. Естественно поэтому возникает вопрос об эквивалентных представлениях группы в одном и том же пространстве. Сформулируем определение эквивалентности представлений: Определение. Представления (G) и (G) группы G в одном и том же пространстве Еп называются эквивалент- ными, если существует такое невырожденное линейное преобра- зование С пространства Е", что для каждого элемента g £ G справедливо соотношение (g) = (g) С. Понятие эквивалентности играет важную роль в теории пред- ставлений, главным образом в перечислении и классификации представлений. Выбор базиса в пространстве представлений важен еще и потому, что в каком-либо базисе матрицы, отвечающие элементам группы, могут иметь стандартный, достаточно простой вид, кото- рый позволяет сделать важные заключения об исследуемом пред- ставлении. В следующем пункте мы дадим некоторую класси- фикацию представлений, опираясь на специальный вид ма- триц.
284 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. 9 3. Приводимые и неприводимые представления. В этом пункте мы обсудим вопрос о том, при каких условиях данное представ, ление D (G), заданное в пространстве Еп, индуцирует в год. пространстве Е' этого пространства представление Ь (G) Этот вопрос тесно связан с вопросом об описании данного представления с помощью более простых представлений, которые имеют меньшую размерность, чем заданное. С решением поставленного вопроса тесно связано понятие инвариантного подпространства линейного преобразования (ли- нейного оператора). Напомним, что подпространство Е' называется инвариантным подпространством линейного оператора А, если для каждого элемента х из Е' элемент Ах принадлежит Е' (см § 3 гл. 5). Иными словами, подпространство Е' инвариантно, если действие оператора А на элементы этого подпространства не выводит их из этого подпространства. Отметим, что само пространство Ел и нулевой элемент пространства являются инвариантными под- пространствами любого линейного оператора. Можно ввести понятие инвариантного подпространства для представления D (G). Именно, подпространство Е' называется инвариантным для представления D (G), если оно инва- риантно для всякого оператора из D (G). Очевидно, что на инвариантном подпространстве^ представ- ления D (G) индуцируется некоторое представление D (G). Сле- дует отметить, что представление D (G) не сводится к представ- лению D (G), если инвариантное подпространство Е’ не совпа- дает с Еп. Поясним теперь понятие приводимого представления. Пусть, например, все матрицы некоторого трехмерного пред- ставления D (G) имеют вид ай яц Яц д»а, где А1г Аг, А3 и О соответственно обозначают матрицы . («зз)> (О, 0)- Легко проверить, что произведение матриц вида (9.30) подчиняется закону т. е. произведение матриц вида (9.30) есть матрица вида (9.30). Более того, при умножении матриц этого вида изолированно перемножаются матрицы Л! и Ai и матрицы Аз и Аз.


$ 3] ПРЕДСТАВЛЕНИЯ ГРУПП 285 (йц в21 ati) °бРазУ* ет двумерное представление рассматриваемой группы, а матрица А3 = (аэз) образует одномерное представление этой же группы. В таких случаях говорят, что представление D (G) приво- димо. Если все матрицы (речь идет о квадратных матрицах по- рядка п) операторов представления имеют вид /4, ! О \ (9.31) где Л1 и Аз — квадратные матрицы, вообще говоря, разных по- рядков, то ясно, что матрицы At и Л2 образуют представления, сумма размерностей которых равна п. В этом случае представление называется вполне при- водимым. Отметим, что операторы, матрицы которых имеют вид (9.31), фактически редуцируются к двум операторам, дей- ствующим независимо в двух инвариантных подпространствах. Заметим также, что представление, индуцируемое на инвари- антном подпространстве данным представлением D (G), называется частью представления D (G). В заключение этого пункта сформулируем понятие непри- водимого представления. Представление D (G) группы G называется неприводи- мым, если у этого представления существуют лишь два инвари- антных подпространства: Еп и О. В противном случае представление называется приво- димым. Роль неприводимых представлений заключается в том, что любое представление может быть выражено через неприводимые. 4. Характеры. В теории представлений групп и в особенности в теории представлений конечных групп полезную роль играют инварианты линейных преобразований, образующих представ- ление. Важность инвариантов ясна еще и потому, что они не зависят от выбора базиса представления и поэтому в определен- ном смысле характеризуют представление. Пусть D (G) — n-мерное представление группы G и D1/ (g) — матрица оператора, отвечающего элементу g из G. Характером элемента g £ G в представлении D (G) называется число X (Я) “ Dlt (g) = D\ (g) + Dl(g)+...+ Ы (g). Таким образом, характер элемента g есть след матрицы опе- ратора D (g). Так как след матрицы линейного оператора представляет собой инвариант (см. п. 3 § 2 гл. 5), то характер любого элемента
286 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП (ГЛ. 9 не зависит от базиса представления и поэтому является инва- риантом. Итак, каждому элементу g £ G представления D (G) отвечает число —характер этого элемента. Поскольку у различных элементов могут быть одинаковые характеры, то следует выяснить вопрос о том, каким элементам группы отвечают одинаковые характеры. Для решения этого во- проса введем понятие сопряженных элементов и классов сопря- женных элементов в данной группе G. Элемент b £ G называется сопряженным элементу а £ G, если существует такой элемент и £0, что иаи'1 = Ь. (9.32) Отметим следующие свойства сопряженных элементов: 1) Каждый элемент а сопряжен самому себе. Действительно, если е — единица группы, то, очевидно, справедливо соотношение еае"1 = а, которое и означает, что а — элемент, сопряженный а. 2) Если элемент b сопряжен элементу а, то элемент а сопря- жен элементу Ь. Это свойство сразу же вытекает из (9.32). Дей- ствительно, умножая обе части (9.32) слева на и-1 и справа на и, получим и'^Ьи = а. Замечая, что обратным элементом для эле- мента и-1 является элемент и, мы убедимся в справедливости сформулированного свойства. 3) Если Ь —сопряженный элемент для а и с —сопряженный элемент для Ь, то с —сопряженный элемент для а Действительно, так как с = vbo'1 и b = иаи'1, то, очевидно, с == vuau^v'1. (9.33) Так как обратным элементом для элемента vu является элемент и'Ч'1, то из (9.33) следует, что элемент с сопряжен элементу а. Объединим в один класс все те элементы группы, которые сопряжены данному элементу а. Таким образом, согласно свой- ству 3), каждый элемент класса сопряжен любому элементу этого класса. Очевидно, два таких класса либо совпадают, либо не имеют общих элементов. Вернемся теперь к представлениям групп. Пусть а и b —сопряженные элементы, т. е. справедливо со- отношение (9.32): b = иаи'1. (9.32) Обратимся к операторам D (a), D (b), D (и) и D (и'1). Согласно определению представления группы оператор D (и'1) является обратным для оператора D (и), т. е. D (и'1) = (D (и))'1. Обращаясь опять к определению представления, получим, согласно (9.32), соотношение D (b) = D (u) D (a) (D (и))-1 Перейдем теперь к матрицам операторов, фигурирующих в последнем соотношении. Мы видим, что матрицу оператора D (Ь)


ПРЕДСТАВЛЕНИЯ ГРУПП 287 $ 31 можно рассматривать как матрицу оператора D (а) при переходе к новому базису с матрицей перехода D (и) (см. п. 2 § 2 гл. 5). Поскольку при таких преобразованиях след матрицы инвариан- тен и по определению равен характеру элемента, мы можем за- ключить, что х (а) = х (Ь). Итак, характеры всех элементов, принадлежащих одному классу сопряженных элементов, равны друг другу. Очевидно также, что характеры элементов для эквивалентных представлений совпадают. Понятие характера в теории представлений используется обычно следующим образом. Пусть данная группа G может быть разбита на конечное число различных классов сопряженных элементов .... Kv. Тогда каждому элементу класса Ki в данном представлении D (G) (и в любом эквивалентном ему представлении) отвечает один и тот же характер Хр Поэтому представление D (G) можно описать с по- мощью набора характеров Xi, Хг> •••> Xv, который можно рас- сматривать как координаты вектора в евклидовом пространстве размерности v. Таким образом, различным представлениям будут отвечать различные векторы. Указанный геометрический подход позволяет во многих слу- чаях решать важные вопросы теории представлений групп. 5. Примеры представлений групп. Пример 1. Пусть G — группа симметрии трехмерного про- странства, состоящая из двух элементов: тождественного преобра- зования / (единица группы) и отражения Р относительно начала координат. Таким образом, G = {/, Р\. Умножение элементов группы задается следующей таблицей: (9.34) 1) Одномерное представление группы G. Выберем в пространстве Е1 базис и рассмотрим матрицу Л(1> линейного невырожденного преобразования А(1) в этом простран- стве: = (1). Очевидно, преобразование Д<1) образует под- группу в группе GL (1) линейных преобразований пространства Е1, причем умножение в этой подгруппе задается таблицей (1) А А*” А(” Очевидно, мы получим одномерное представление (G) группы G
288 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП (ГЛ. 9 с помощью соотношений £>(I) (/) «= А(Ч, D(I) (Р) == A(lf (эти со- отношения задают гомоморфизм группы G в GL (1), а следова- тельно, и ее представление). 2) Двумерное представление группы G. Выберем в Е2 какой-либо базис еп и рассмотрим в этом базисе матрицы Л<2) и 5<2) линейных невырожденных преобра- зований Л<2) и Р(2): /1 0\ /0 1\ Л<2) = ), В(2> = \о 1/ \1 о/ (так как det Л(2) == 1 и det Вт = —1, то А(2> и В(2) —невы- рожденные преобразования) Преобразования Л<2) и В(2> образуют подгруппу в группе GL (2). Непосредственной проверкой (путем перемножения ма- триц Л(2) и В(2>) убеждаемся, что умножение операторов Л<2) и 2?<2> задается таблицей л(2> в‘2> л'2’ л<2> в(2) в(2> в<2> л<2> Мы получим двумерное представление Z>(2) (G) группы G с по- мощью соотношений £)<2> (/) = л<2), D‘2> (Р) = В<2>. (9.36) Действительно, сравнивая таблицы (9.34) и (9.35), мы ви- дим, что (9.36) определяет изоморфизм группы G на подгруппу {Л(2), Вт} группы GL (2), а следовательно, и представление этой группы. 3) Трехмерное представление группы G. Рассмотрим в Е3 линейное преобразование Л<3>, задаваемое матрицей /1 о о\ Д(з>= о 1 о). \о о 1/ Это преобразование образует подгруппу в группе GL (3) с законом умножения Л(3,Л<3* = Л<3). Как и в случае одномерного представления, мы получаем трехмерное представление D<3>G с помощью соотношений: D<3> (/) = Л<3>, D<3) (Р) = А(3>. 4) Четырехмерное представление группы G.


9 3 ПРЕДСТАВЛЕНИЯ ГРУПП 289 Рассмотрим в Е* линейные преобразования Д<4> и зада- ваемые матрицами /1 о I о о\ /О 1 о о\ ( о 1 ! о о \ ( 1 о о о \ Д(4> = -----1--- , ВИ)== -----------1 I О О I 1 О / I О О I О 1 / \О О | О 1/ \0 О I 1 о/ Преобразования Л(4) и В<4> образуют подгруппу в группе GL (4) с законом умножения, задаваемым таблицей, аналогичной таблице (9.35) (с заменой индекса 2 на индекс 4). Очевидно, мы получаем четырехмерное представление D<4> (G) группы G с помощью со- отношений D<4> (/) = Д<4>, D<4> (Р) = В<4>. Замечание. Нетрудно видеть, что матрицы Л<4> и В<4> можно записать в виде Л<4> = О \ л‘2> /' В<4> = в(2) о о в™ Поэтому представление О<4> (G) можно условно записать в виде Ь<4’ (G) = £Н2> (G) 4- D(2> (G) = 2Z?<2> (G). Совершенно аналогич- но можно условно записать £>(3) (G) в виде D(3) (G) = 3D(I) (G). Используя это замечание, читатель без труда построит пред- ставление группы G любой конечной размерности. Пример 2. В п. 5 § 2 этой главы мы доказали, что только что рассмотренная группа симметрии G = \1, Р\ трехмерного про- странства представляет собой нормальный делитель группы О (3) (группа ортогональных преобразований пространства Es). В том же пункте мы доказали, что подгруппа SO (3) собственных ортого- нальных преобразований группы О (3) изоморфна фактор-группе группы 0(3) по нормальному делителю {/, Р\. Так как группа гомоморфно отображается на каждую свою фактор-группу, то О (3) гомоморфно отображается на группу SO (3) Как мы видели в п. 5 § 3 этой главы, указанный гомомор- физм осуществляется следующим образом. Если а — собственное преобразование из О (3), то ему из SO (3) ставится в соответствие это же самое преобразование. Если а' — несобственное преобразование, то ему ставится в соответствие собственное преобразование Ра . Таким образом, мы получаем трехмерное представление DO (3) группы ортогональных преобразований посредством группы SO (3) собственных ортогональных преобразовании.
алфавитный указатель Автоморфизм групп 265 Алгебраическое дополнение 29 Альтернирование тензора 243 Ассоциативный закон композиции 260 Аффинная система координат 250 Аффинное пространство 41 Базис 48 — взаимный 229 — представления 282 Базисные столбцы 39 — строки 39 Базисный минор 39 Бесконечномерное линейное простран- ство 50 Беспорядок 23 Билинейная форма 152,186 ---вырожденная 191 ---кососимметричная 153,188 ---невырожденная 191 ---симметричная 153,188 Блок матрицы 15 Блочная матрица 15 Буняковского — Коши неравенство 85, 98 Вандермонда определитель 33 Вектор 44 Верхней релаксации метод 174 Вещественное евклидово пространство 82 Времениподобный вектор 254 Галилеевы системы 254 Гамильтона — Кэлн теорема 138 Гиббса формулы 232 Гиперболоид 224 Гиперповерхность второго порядка 211 -------центральная 221 Главная диагональ 11 Гомоморфизм групп 267 Грама определитель 228 Группа 261 — абелева 261 — коммутативная 261 Группа линейных преобразований 273 — Лоренца 278, 279 — ортогональных преобразований 275 — перестановок 262 — симметрическая 263 — собственных ортогональных преоб- разований 276 Группы унитарные 281 — циклические 277 Диагональ матрицы главная 11 ---побочная 11 Диагональная матрица 14 Дополнительный минор 25 Евклидово пространство вещественное 82 ---комплексное 96 Единица группы 261 Единичная матрица 14 Единичный оператор 108 Жорданова клетка 148 — форма матрицы 148 Закон инерции квадратичной формы 199 — композиции 260 Зейделя метод 174 Изоморфизм групп 264 — евклидовых пространств 94 — линейных пространств 52 Инвариант 235 — уравнения гиперповерхности 218 Инвариантное подпространство опера- тора 120 Индекс инерции 200 ---отрицательный 200 ---положительный 200 Инерции закон 199 Канонические коэффициенты 192 Канонический базис 195 — вид квадратичной формы 192,193
АЛФАВИТНЫЙ УКАЗАТЕЛЬ Каноническое уравнение нецентраль- ной гинерноверхности второго по- рядка 226 -------центральной гинерноверхности второго норядка 223 Канелли — Кронекера теорема 68 Квадратичная форма 141, 190 -----вырожденная 191 -----знакоопределениая 191 -----знакопеременная 191 -----квазизнакоопределениая 191 -----невырожденная 191 -----отрицательно определенная 191 -----положительно определенная 191 Квадратная матрица 10 — система 65, 69 Коммутативный закон композиции 260 Коммутирующие матрицы 13 — операторы 128 Комплексное евклидово пространство 96 Композиция 260 Координаты ковариантные 231 — контравариантные 231 Корень из оператора 139 Кососимметричная билинейная форма 153, 188 Коши — Буняковского неравенство 85, 98 Коэффициенты линейной системы 65 Крамера формулы 70 Критерий Сильвестра 202 Критическая точка 208 Критическое значение 208 Кронекер 68,229 Кронекера символ 229 Кронекера — Канелли теорема 68 Кубическая норма 173 Кэли — Гамильтона теорема 138 Лагранжа метод 193 Лаплас 24 Лапласа теорема 25 Линейная зависимость строк 37 -----элементов линейного простран- ства 46 — комбинация строк 28 -----элементов линейного простран- ства 46 — независимость строк 38 -----элементов линейного простран- ства 46 — оболочка 54 — система 64 — форма 107 Линейное представление группы 282 — преобразование 107 — пространство бесконечномерное 50 291 Линейное пространство вещественное 41,44 ---комплексное 44 Линейные пространства изоморфные 52 Линейный онератор 105,152 — функционал 107 Лоренца группа 278, 279 — преобразования 256,278 — формулы 258 Матрица 10 — билинейной формы 187, 188 — блочная 15 — диагональная 14 — единичная 14 — квадратичной формы 191 — квадратная 10 — линейного оператора 115 — невырожденная 37 — нулевая 14 — обратная 36, 37 — ортогональная 158 ---несобственная 159 ---собственная 159 — нолуторалинейной формы 126 — транспонированная 27 — унитарная 158 Матрицы коммутирующие 13 — норядок 10 Метод верхней релаксации 174 — Зейделя 174 — Лагранжа 193 — регуляризации Тихонова 100 — Якоби 161,195 Метрический тензор евклидова про- странства 244 ---псевдоевклидова пространства 253 Минимаксное свойство собственных значений 135 Минковского неравенство 86 — пространство 255 Минор 18, 25 — базисный 39 — второго типа 25 — дополнительный 25 — нервого типа 25 Многочлен характеристический 119, 154 Невырожденная матрица 37 Нейтральный закон композиции 260 Неоднородная система 65 Неопределенная система 65 Неравенство Коши — Буняковского 85,98 — • Минковского 86
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 292 Неравенство треугольника 86, 99 Несобственное подпространство 53 Несовместная система 65 Нетривиально совместная система 67 Норма 86 — кубическая 173 — линейного оператора 130 — матрицы операторная 162,173 — октаэдрическая 173 — сферическая 101,173 — энергетическая 169 Нормальная фундаментальная сово- купность решений 77 Нормальное решение 102 Нормальный делитель группы 267 — оператор 144 Нормированное пространство 86,99 Нормы эквивалентные 169 Нулевая матрица 14 Нулевой оператор 108 Образ оператора 111 Обратная матрица 36, 37 Обратный оператор 109 Однородная система 65, 67, 75 Октаэдрическая норма 173 Оператор линейный 105,152 — нормальный 144 — нулевой 108 — обратный 109 — ортогональный 157 — положительно определенный 139 — положительный 138 — противоположный 108 — самосопряженный 128 — сопряженный 126 — тождественный 108 — унитарный 143 Операторная норма матрицы 162,173 Операторы коммутирующие 128 Определенная система 65 Определитель 17 — Вандермонда 33 — Грама 228 — линейного оператора 119 — произведения матриц 34, 35 — треугольный 32 Определителя свойство антисимметрии ---линейное 28 — — равноправности строк и столб- цов 27 Ориентированный объем 250 Ортогонализации процесс 91 Ортогональная матрица 158 ---несобственная 159 — — собственная 159 Ортогональное дополнение 94 Ортогональные элементы 87, 99 Ортогональный оператор 157 Ортонормированный базио 89, 99 Основная матрица линейной системы 66 Параболоид 226 Параболоидальный цилиндр 227 Параллельный перенос 213 Перемножение матриц 12 Пересечение подпространств 56 Перестановка 23,262 Пифагора теорема 87 Побочная диагональ 11 Погрешность метода итераций 162,165 Подгруппа 265 — дискретная 274 — компактная 274 — конечная 274 — непрерывная 274 Подпространство 53 Полилинейная форма 203 Положительно определенный оператор 139 Положительный оператор 138 Полуоси центральной гиперповерхно- сти второго порядка 223 Полуторалннейная форма 124 Порядок матрицы 10 Представление группы 281 ----вполне приводимое 285 ----линейное 282 ----неприводимое 285 ----приводимое 284, 285 ----точное 283 ----тривиальное 283 Представления групп эквивалентные 283 Преобразования Лореица 256,278 Присоединенный элемент 147 Проектор 137 Произведение матриц 12 — матрицы на число 11,12 — оператора на число 108 — операторов 108 — тензора на число 239 — тензоров 239, 240 Простой итерации метод 161 --------модифицированный 171 --------общий неявный 164 Пространственноподобный вектор 254 Пространство аффинное 41 — евклидово вещественное 82 ----комплексное 96 — линейное 41,44 — нормированное 86, 99 — представления 282 Противоположный элемент 41, 45
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 293 Процесс ортогонализации 91 Прямая сумма квадратных матриц 16 ----подпространств 58, 59 Псевдоевклидово пространство 253 Разложение определителя по столбцу 21.22 строкам 25 строке 19 Размерность представления 282 — пространства линейного 49 ----псевдоевклидова 253 Ранг матрицы 39, 56 — оператора 112 — формы билинейной 190 ----квадратичной 191 Расширенная матрица линейной си- стемы 68 Регуляризации метод Тихонова 100 Решение системы 65 ----нетривиальное 67 ----тривиальное 67 Ричардсона метод 179 Самарского теорема 165,169 Самосопряженный оператор 128 Свертывание тензора 240 Свободные члены линейной системы 65 Сильвестра критерий 202 Симметрирование тензора 242 Симметричная билинейная форма 153, 188 Система координат аффинная 254 ----линейная 64 ----неоднородная 65 ----неопределенная 65 ----несовместная 65 ----нетривиально совместная 67 ----однородная 65,67, 75 ----определенная 65 ----совместная 64, 65 — уравнений квадратная 65 Скалярное произведение 82,96 След оператора 120 Сложение матриц 11 Смежный класс подгруппы 266 Собственное значение 120 Собственный вектор 120 Совместная система 65 Сопряженный оператор 126 — элемент группы 286 Спектральное разложение оператора 138 Стационарная точка 208 Стационарное значение 208 Столбцы базисные 39 Строки базисные 39 Сумма матриц 11 — операторов 108 — прямая квадратных матриц 16 ---подпространств 58, 59 — тензоров 239 Сферическая норма 101,173 Тензор 234 — вполне кососимметричный 248, 249 — кососимметричный 242 — метрический 244, 253 — момента инерции 259 — симме1ричный 242 Теорема Гамильтона — Кэли 138 — Кронекера — Канелли 68 — Лапласа 25 — о базисном миноре 39 — Пифагора 87 — Самарского 165,169 — Тихонова 103 Тождественный оператор 108 Транспонированная матрица 27 Треугольное преобразование 195 Треугольный определитель 32 Тривиальное решение 67 Унитарная матрица 158 Унитарные группы 281 Унитарный оператор 143 Уравнение гиперповерхности второго порядка 211 — характеристическое 120,154 — центра гиперповерхности второго порядка 220 Фактор-группа 269 Форма билинейная 152, 186 ---вырожденная 191 ---кососимметринная 153, 188 ---невырожденная 191 ---симметричная 153,188 — квадратичная 141,190 — линейная 107 — полилинейная 203 — полуторалинейная 124 — эрмитова 140 Формулы Крамера 70 — Лоренца 258 Фундаментальная совокупность реше- ний 77 Характер 285 Характеристический многочлен 119, 154
294 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Характеристическое уравнение 120, 154 Эквивалентные нормы 169 Элементы матрицы 10 Эллипсоид 223 Центр гиперповерхности второго по- рядка 220 Центральная гиперповерхность 221 вырожденная 224 Циклическая группа 277 Цилиндр параболоидальный 227 — центральный 227 — вырожденный 224 — мнимый 224 Эндоморфизм 267 Энергетическая норма 169 Энергетическое скалярное произведе- ние 168 Эрмитова форма 140 Чебышева метод 175 Ядро оператора 110 Якоби метод 161,195

ISBN 5-02-015235-8 Учебное издание ИЛЬИН Владимир Александрович, ПОЗНЯК Эдуард Генрихович ЛИНЕЙНАЯ АЛГЕБРА Серия «Курс высшей математики и математической физики» Редакторы М. М. Горячая, И. М. Овчинникова Корректор И. Я. Кршиталь ЛР № 020297 от 23 06.97 Подписано в печать с готовых диапозитивов 20 06 98 Формат 60х90'/1б Бумага типографская. Печать офсетная Усл печ л 19 Уч-изд л 19,46 Тираж 5000 экз Заказ 459. С-026 Издательская фирма «Физико-математическая литература» РАН. 117071, Москва В-71, Ленинский проспект, 15. При участии ООО «Харвест» Лицензия ЛВ № 32 от 27 08.97 220013, Минск, ул. Я. Коласа, 35 — 305 Отпечатано с готовых диапозитивов заказчика в типографии издательства «Белорусский Дом печати». 220013, Минск, пр. Ф. Скорины, 79
Издательская фирма ФИЗИКО-МАТЕМАТИЧЕСКАЯ ЛИТЕРАТУРА Академиздатцентра «Наука» РАН 117071 Москва В-71, Ленинский проспект, 15 Выходят из печати в серии «Курс высшей математики и математической физики» ИЛЬИН В. А., ПОЗНЯК Э. Г. Основы математического анализа: В 2 ч. Часть I: Учеб.: Для вузов. 5-е изд. М.: Наука. Физматлит. II полугодие 1998, поз. 166. В пер. 616 с. (Вып.1). ИЛЬИН В. А., ПОЗНЯК Э. Г. Основы математического анализа: В 2 ч. Часть II: Учеб.: Для вузов. 3-е изд. М.: Наука. Физматлит. II полугодие 1998, поз. 167. В пер. 448 с. (Вып.2). ИЛЬИН В. А., ПОЗНЯК Э. Г. Аналитическая геометрия: Учеб.: Для вузов. 5-е изд. М.: Наука. Физматлит. II полугодие 1998, поз. 168. В пер. 224 с. (Вып.З). ИЛЬИН В. А., ПОЗНЯК Э. Г. Линейная алгебра: Учеб.: Для вузов. 4-е изд. М.: Наука. Физматлит. II полугодие 1998, поз. 169. В пер. 296 с. (Вып.4). СВЕШНИКОВ А. Г., ТИХОНОВ А. Н. Теория функций комплексной переменной: Учеб.: Для вузов. 5-е изд. М.: Наука. Физматлит. II полугодие 1998, поз. 193. В пер. 320 с. (Вып.5). ТИХОНОВ А. Н., ВАСИЛЬЕВА А. Б., СВЕШНИКОВ А. Г. Диффе- ренциальные уравнения: Учеб.: Для вузов. 3-е изд. М.: Наука. Физматлит II полугодие 1998, поз. 196. В пер. 232 с. (Вып.6). Планируемые к выпуску издания объявляются в полугодовых анно- тированных тематических планах Академиздатцентра «Наука» РАН (Наука Физматлит). Заказывайте и приобретайте учебную и справочную литературу Издательской фирмы «Физматлит» РАН в магазинах книготоргов, рас- пространяющих литературу данной тематики (номера объявленных позиций по вышеприведенному списку указаны). Заказы принимаются по телефонам: (095) 974-18-05, (095) 955-03-30.

ДЛЯ ЗАМЕТОК