Текст
                    УДК 512.64+514.1
ББК 22.143+22.151.5
Е91
Ефимов Н. В., Розендорн Э. Р. Линейная алгебра и много-
многомерная геометрия. — 3-е изд. — М.: ФИЗМАТЛИТ, 2004. — 464 с. — ISBN
5-9221-0386-5.
Предметом книги является объединенный курс линейной алгебры и мно-
многомерной аналитической геометрии. Главное место в ней занимают основы
теории конечномерных линейных пространств и линейных преобразований.
В книге изложена тензорная алгебра и на соответствующих примерах пока-
показаны ее приложения. На примере групп преобразований читатель позна-
познакомится с элементами теории групп. В последней главе дается введение
в проективную геометрию.
Книга рассчитана на студентов механико-математических факультетов
университетов. Она может быть полезна студентам втузов, инженерам и на-
научным работникам разных специальностей, изучающим или использующим
методы линейной алгебры и многомерной геометрии. В течение многих лет
книга являлась основным учебником для вузов и имела гриф учебника
Министерства высшего и среднего образования СССР.
Учебное издание
ЕФИМОВ Николай Владимирович
РОЗЕНДОРН Эмиль Ренольдович
ЛИНЕЙНАЯ АЛГЕБРА И МНОГОМЕРНАЯ ГЕОМЕТРИЯ
Редактор И. Л. Легостаева
Оригинал-макет: Е.А. Знаменская
Оформление переплета: А.Ю. Алехина
ЛР №071930 от 06.07.99. Подписано в печать 06.11.03. Формат 60x90/16.
Бумага типографская. Печать офсетная. Усл. печ. л. 29. Уч.-изд. л. 30,5.
Заказ №
Издательская фирма «Физико-математическая литература»
МАИК «Наука/Интерпериодика»
117997 Москва, ул. Профсоюзная, 90
E-mail: fizmat@maik.ru
Отпечатано с диапозитивов
в ОАО «Чебоксарская типография № 1»
428019 Чебоксары, пр. И. Яковлева, 15
ISBN 5-9221-0386-5
785922
103862
ISBN 5-9221-0386-5
© ФИЗМАТЛИТ, 2004


ОГЛАВЛЕНИЕ Предисловие 8 Введение 10 Глава I. Линейные пространства 13 § 1. Аксиомы линейного пространства 13 § 2. Примеры линейных пространств 15 § 3. Простейшие следствия из аксиом линейного простран- пространства 22 § 4. Линейная комбинация. Линейная зависимость .... 23 § 5. Лемма о базисном миноре 25 § 6. Основная лемма о двух системах векторов 28 § 7. Ранг матрицы 30 § 8. Конечномерные и бесконечномерные пространства. Базис 32 § 9. Линейные операции в координатах 34 § 10. Изоморфизм линейных пространств 36 § 11. Соответствие между комплексными и действитель- действительными пространствами 39 § 12. Линейное подпространство 41 § 13. Линейная оболочка 43 § 14. Сумма подпространств. Прямая сумма 46 Глава II. Линейные преобразования переменных. Пре- Преобразования координат 52 § 1. Сокращенная запись суммирования 52 § 2. Линейное преобразование переменных. Произведение линейных преобразований переменных и произведе- произведение матриц 55 § 3. Квадратные матрицы и невырожденные преобразо- преобразования 58 § 4. Ранг произведения матриц 63 § 5. Преобразование координат при изменении базиса . . 65
4 ОГЛАВЛЕНИЕ Глава III. Системы линейных уравнений. Плоскости в аффинном пространстве 68 § 1. Аффинное пространство 68 § 2. Аффинные координаты 69 § 3. Плоскости 71 § 4. Системы уравнений первой степени 74 § 5. Однородные системы 78 § 6. Неоднородные системы 85 § 7. Взаимное расположение плоскостей 88 § 8. Системы линейных неравенств и выпуклые много- многогранники 95 Глава IV. Линейные, билинейные и квадратичные формы 104 § 1. Линейные формы 104 § 2. Билинейные формы 108 §3. Матрица билинейной формы 112 §4. Квадратичные формы 114 § 5. Приведение квадратичной формы к каноническому виду методом Лагранжа 117 §6. Нормальный вид квадратичной формы 119 § 7. Закон инерции квадратичных форм 120 § 8. Приведение квадратичной формы к каноническому виду методом Якоби 122 § 9. Положительно определенные и отрицательно опре- определенные квадратичные формы 124 § 10. Определитель Грама. Неравенство Коши-Буняков- ского 126 §11. Нулевое подпространство билинейной и квадратич- квадратичной формы 129 § 12. Нулевой конус квадратичной формы 132 § 13. Простейшие примеры нулевых конусов квадратич- квадратичных форм 133 Глава V. Тензорная алгебра 136 § 1. Взаимные базисы. Контравариантные и ковариант- ные векторы 136 § 2. Тензорное произведение линейных пространств . . . 143 § 3. Базис в тензорном произведении. Координаты тен- тензора 146 § 4. Тензоры билинейных форм 152 § 5. Многовалентные тензоры. Произведение тензоров . . 155 § 6. Координаты многовалентных тензоров 158
ОГЛАВЛЕНИЕ О § 7. Полилинейные формы и их тензоры 160 § 8. Симметрирование и альтернирование. Косые формы 161 § 9. Второй вариант изложения понятия тензорного про- произведения двух линейных пространств 165 Глава VI. Понятие группы и некоторые его приложения 171 § 1. Группы и подгруппы. Распределение базисов на клас- классы по данной подгруппе матриц. Ориентация 171 § 2. Группы преобразований. Изоморфизм и гомоморфизм групп 177 § 3. Инварианты. Осевые инварианты. Псевдоинварианты 182 § 4. Тензорные величины 187 § 5. Ориентированный объем параллелепипеда. Дискри- минантный тензор 192 Глава VII. Линейные преобразования линейных прост- пространств 197 § 1. Общие сведения 197 § 2. Линейное преобразование как тензор 200 § 3. Геометрический смысл ранга и определителя линей- линейного преобразования. Группа невырожденных линей- линейных преобразований 203 § 4. Инвариантные подпространства 205 § 5. Примеры линейных преобразований 208 § 6. Собственные векторы и характеристический много- многочлен преобразования 214 § 7. Основные теоремы о характеристическом многочлене и собственных векторах 216 § 8. Нильпотентные преобразования. Общая структура вырожденных преобразований 219 § 9. Канонический базис нильпотентного преобразования 222 § 10. Приведение матрицы преобразования к жордановой нормальной форме 230 § 11. Преобразования простой структуры 235 § 12. Эквивалентность матриц 237 § 13. Формула Гамильтона-Кэли 240 Глава VIII. Пространства с квадратичной метрикой . . . .241 § 1. Скалярное произведение 241 § 2. Норма вектора 243 § 3. Ортонормированные базисы 244 § 4. Ортогональная проекция. Ортогонализация 246 § 5. Метрический изоморфизм 251
6 ОГЛАВЛЕНИЕ § 6. /^-ортогональные матрицы и /^-ортогональные группы 253 § 7. Группа евклидовых поворотов 256 § 8. Группа гиперболических поворотов 264 § 9. Тензорная алгебра в пространствах с квадратичной метрикой 272 § 10. Уравнение гиперплоскости в пространстве с квадра- квадратичной метрикой 279 §11. Евклидово пространство. Ортогональные матрицы. Ортогональная группа 282 § 12. Нормальное уравнение гиперплоскости в евклидовом пространстве 286 § 13. Объем параллелепипеда в евклидовом пространстве. Дискриминантный тензор. Векторное произведение . 289 Глава IX. Линейные преобразования евклидова простран- пространства 292 § 1. Сопряженное преобразование 292 § 2. Лемма о характеристических корнях симметричной матрицы 294 § 3. Самосопряженные преобразования 295 § 4. Приведение квадратичной формы к каноническому виду в ортонормированном базисе 301 § 5. Совместное приведение к каноническому виду двух квадратичных форм 303 § 6. Кососопряженные преобразования 306 § 7. Изометричные преобразования 308 § 8. Канонический вид изометричного преобразования . . 313 § 9. Движение твердого тела с одной неподвижной точкой 318 § 10. Кривизна и кручение пространственной кривой . . . 320 §11. Разложение произвольного линейного преобразова- преобразования в произведение самосопряженного и изометрич- изометричного преобразований 322 § 12. Приложения к теории упругости. Тензор деформа- деформаций и тензор напряжений 325 Глава X. Поливекторы и внешние формы 328 § 1. Альтернация 328 § 2. Поливекторы. Внешнее произведение 333 § 3. Бивекторы 338 § 4. Простые поливекторы 348 § 5. Векторное произведение 351 § 6. Внешние формы и действия над ними 358
ОГЛАВЛЕНИЕ ( § 7. Внешние формы и ковариантные поливекторы .... 361 § 8. Внешние формы в трехмерном евклидовом простран- пространстве 367 Глава XI. Гиперповерхности второго порядка 372 § 1. Общее уравнение гиперповерхности второго порядка 372 § 2. Изменение левой части уравнения при переносе на- начала координат 373 § 3. Изменение левой части уравнения при изменении ор- тонормированного базиса 375 § 4. Центр гиперповерхности второго порядка 378 § 5. Приведение к каноническому виду общего уравне- уравнения гиперповерхности второго порядка в евклидо- евклидовом пространстве 379 § 6. Классификация гиперповерхностей второго порядка в евклидовом пространстве 383 § 7. Аффинные преобразования 390 § 8. Аффинная классификация гиперповерхностей вто- второго порядка 394 § 9. Пересечение прямой второго порядка. Асимптотиче- Асимптотические направления 395 § 10. Сопряженные направления 397 Глава XII. Проективное пространство 401 § 1. Однородные координаты в аффинном пространстве. Бесконечно удаленные точки 401 § 2. Понятие проективного пространства 404 § 3. Связка плоскостей в аффинном пространстве 413 § 4. Центральное проектирование 421 § 5. Проективная эквивалентность фигур 425 § 6. Проективная классификация гиперповерхностей вто- второго порядка 431 § 7. Пересечение гиперповерхности второго порядка и пря- прямой. Поляры 437 Приложение 1. Доказательство теоремы о классификации ли- линейных величин 445 Приложение 2. Эрмитовы формы. Унитарное пространство . . 449 Список литературы 464
ПРЕДИСЛОВИЕ Настоящая книга задумана как учебник по объединенному курсу линейной алгебры и аналитической геометрии. Замысел книги возник в связи с лекци- лекциями Н.В. Ефимова, которые читались для студентов механико-математичес- механико-математического факультета МГУ в 1964-1966 годах. Однако материал этих лекций под- подвергнут авторами полной переработке и значительно расширен. Указанный лекционный курс проводился каждый раз во втором семестре (как и теперь проводится в МГУ) при четырех часах лекций и четырех ча- часах практических занятий в неделю. В настоящей книге ему приблизительно соответствуют главы I—VI, §§ 1-7 главы VII и главы VIII, IX, XI. При этом §§ 8-13 главы VII, глава X и глава XII могут рассматриваться в виде трех независимых дополнений к отмеченным выше основным разделам. В МГУ этот материал не входит в объединенный курс второго семестра и сообщает- сообщается с большей или меньшей степенью общности в других курсах. Например, тематика параграфов 8-13 гл. VII (приведение матриц к жордановой форме) входит в курс алгебры на третьем семестре. С точки зрения авторов основная часть книги и дополнения различают- различаются весьма условно. Книга имеет свою структуру, достаточно определенную внутренними связями между всеми ее разделами, независимо от распределе- распределения их по кафедрам и лекционным курсам (объединенным или раздельным, обязательным или факультативным). Что же касается выбора вошедших в книгу разделов, то авторы старались делать его с учетом потребностей дру- других математических дисциплин, а также механики и физики. Мы надеем- надеемся, что весь материал книги окажется полезным. Материал этот к тому же вполне доступен. Во всяком случае, вся предварительная подготовка, кото- которую мы предполагаем, может быть дана в первом семестре в курсах анали- аналитической геометрии и алгебры, как бы просто они ни читались. Нужно лишь твердое знание элементарного материала по этим дисциплинам. В частности, для гл. XII желательно предварительное знакомство с проективными преоб- преобразованиями и проективными свойствами фигур на плоскости. Заметим еще, что в гл. X читатель ради упрощения дела может пропустить пункты 13—23 § 3, весь § 5 и п. 10 § 7. После этих сокращений материал гл. X может служить минимальной алгебраической основой для теории многомерного интегриро- интегрирования. В заключение отметим, что уже первые пять глав настоящей книги со- содержат материал, находящий широкие приложения в математике, механике, физике. Эти главы, дополненные отдельными вопросами из последующих глав, могут быть использованы при изучении математики в высших техни- технических учебных заведениях с повышенной математической программой. 30 августа 1969 года Н.В. Ефимов Э.Р. Розендорн
ПРЕДИСЛОВИЕ У Во втором издании добавлено Приложение 2 «Эрмитовы формы. Унитар- Унитарное пространство». Остальной текст переработке не подвергался. Исправле- Исправлена только одна неточность в формулировке на стр. 182, а также замеченные опечатки. 2 ноября 1973 года Н.В. Ефимов Э.Р. Розендорн Предисловие к 3-му изданию В середине 60-х годов в Киевском и Московском университетах линей- линейная алгебра была выделена в самостоятельный предмет и в нее включена многомерная аналитическая геометрия. Исторический курьез: в Москве кафедры алгебры и геометрии не могли договориться, кому из них за это взяться. Тогда академики П.С. Александров и А.Н. Колмогоров нашли нестандартный выход: обратиться к заведующему кафедрой математического анализа Н.В. Ефимову — крупному геометру и выдающемуся педагогу. Опыт был успешным и получил распространение, в том числе и в техни- технических университетах. Время показало правильность сделанного Н.В. Ефи- Ефимовым отбора материала для учебника. Он был переиздан, переведен на другие языки. К сожалению, в текст закрался дефект, который был замечен не сразу (п. 4, § 7 гл. I); в данном издании он исправлен. 15 июня 2003 года Э.Р. Розен дорн
ВВЕДЕНИЕ В математике и ее приложениях часто приходится рассматривать неко- некоторые множества объектов, для которых установлены так называемые линейные операции: сложение и умножение на число. Например, в ме- механике рассматривают всевозможные силы, приложенные к данному твердому телу. Две силы, приложенные к одной точке, можно сло- сложить, т.е. заменить одной силой, приложенной к той же точке. Силу можно умножить на число а, т.е. увеличить в а раз, сохранив ли- линию действия. В механике рассматривают также сложение скоростей и умножение скорости на число; рассматривают сложение ускорений и умножение ускорения на число. Силы, скорости и ускорения различ- различны по своей физической природе. Однако линейные операции, которые производятся над ними, единообразны с геометрической точки зрения. Поэтому в механике принят общий способ изображения этих объек- объектов в виде направленных отрезков. Тем самым все они обслуживаются общими правилами сложения и умножения на число геометрических векторов. Но это обобщение идет гораздо дальше. Рассмотрим, например, множество всех функций, непрерывных на числовой оси, или множе- множество всех периодических функций с данным периодом, или множество всех алгебраических многочленов. В каждом из этих множеств мы мо- можем естественным образом рассматривать линейные операции (пони- (понимая сумму функций и произведение функции на число, как принято в анализе). Объекты, о которых мы сейчас говорим, не похожи на си- силы, скорости и ускорения или на геометрические векторы. Линейные операции над ними также не похожи на линейные операции над век- векторными величинами механики или над геометрическими векторами. Однако здесь есть и нечто общее, позволяющее изучать линейные операции абстрактно, отвлекаясь от конкретной природы объектов. Прежде всего, в любом нашем примере дело обстоит так, что линей- линейные операции над элементами данного множества (т. е. над объектами, из которого оно состоит) дают в результате элементы того же мно- множества. Именно, складывая геометрические векторы или умножая их на число, мы получаем геометрические векторы; складывая непрерыв- непрерывные функции или умножая их на число, мы получаем непрерывные функции. То же самое можно повторить про периодические функции с данным периодом или про алгебраические многочлены.
ВВЕДЕНИЕ 11 Кроме того, линейные операции, различные для разных множеств, имеют ряд общих свойств (рассмотренных ниже, в первой главе). На- Наличие общих свойств позволяет изучать линейные операции вообще. Изучая множества с данными в них линейными операциями, их объединяют понятием линейного пространства. Теория линейных про- пространств находит чрезвычайно широкие применения в современной ма- математике и соседних с ней науках. Определение линейного пространства будет сформулировано в бли- ближайшем параграфе. Оно не будет содержать каких-либо описаний эле- элементов рассматриваемых множеств или производимых линейных опе- операций. Будут потребованы только некоторые свойства линейных опера- операций, общие для всех частных случаев. Эти требования выражаются ак- аксиомами линейного пространства. Следует заметить, что требования, которые выраженны в аксиомах, весьма немногочисленны, и остается возможность добавлять к ним новые предположения. Поэтому в общем понятии линейного пространства возникает некоторая классификация, так что все-таки приходится иметь дело не с единым линейным про- пространством, а с различными классами линейных пространств, и теория, основанная на аксиомах линейного пространства, разветвляется. Прежде всего, все линейные пространства разделяются на конечно- конечномерные и бесконечномерные. Конечномерные пространства (одномер- (одномерные, двумерные, трехмерные и т. д.) изучаются в линейной алгебре, которая является предметом этой книги. Бесконечномерные простран- пространства рассматриваются в различных разделах функционального анали- анализа; у нас они будут встречаться лишь эпизодически, для иллюстрации некоторых общих выводов. К числу конечномерных пространств принадлежит трехмерное про- пространство геометрических (свободных) векторов. Это пространство содержит в себе бесконечно много двумерных и одномерных пространств, называемых подпространствами (каждое двумерное подпространство состоит из векторов, лежащих в одной плоскости, каждое одномерное подпространство состоит из векторов, лежащих на одной прямой). Таким образом, для одномерных, двумер- двумерных, трехмерных линейных пространств мы имеем геометрические мо- модели, с которыми естественно связаны наши наглядные представления о векторах. При переходе к многомерным пространствам наглядность частично теряется, но теория этих пространств сохраняет геометри- геометрический характер. Дело в том, что ее основные понятия строятся пу- путем заимствования у трехмерного случая и надлежащего обобщения на многомерный. Не последнюю роль здесь играет сохранение геометри- геометрической терминологии; например, говоря о разнообразных множествах, мы называем их пространствами. Заметим кстати, что элементы вся- всяких линейных пространств принято называть векторами. Вместе с тем
12 ВВЕДЕНИЕ линейные пространства называют также векторными пространствами. Геометричность терминологии и основных понятий линейной алгебры помогает ее контактам с геометрией. Мы имеем в виду здесь анали- аналитическую геометрию, причем многомерную, т. е. многомерный аналог обычной (трехмерной) аналитической геометрии. Более того, линей- линейная алгебра и аналитическая геометрия настолько тесно связаны, что между ними трудно провести четкую грань. Мы и не будем к этому стремиться. Выше мы назвали в качестве предмета нашей книги линей- линейную алгебру. С таким же основанием можно сказать, что ее предметом является многомерная аналитическая геометрия.
ГЛАВА I. ЛИНЕЙНЫЕ ПРОСТРАНСТВА § 1. Аксиомы линейного пространства 1. Пусть имеется множество L, состоящее из каких угодно эле- элементов. Для обозначения элементов этого множества мы будем упо- употреблять малые буквы латинского алфавита а, 6, ..., ж, ?/, ... Только в одном случае мы употребим дальше аналогичным образом греческую букву в. Вместе с элементами множества L будут рассматриваться чис- числа или любые действительные, или любые комплексные. Для обозна- обозначения чисел мы воспользуемся малыми греческими буквами а, /3, ... (исключая в). 2. Мы предполагаем, что в множестве L определено понятие ра- равенства элементов. Это значит, что все элементы множества L неко- некоторым образом распределены по классам (подмножествам L) так, что разные классы не имеют общих элементов. При этом два элемента а, b считаются равными (а = 6), если они принадлежат одному классу. Не исключается, что каждый класс состоит только из одного элемен- элемента; в таком случае равенство а = b означает, что через а и b обозначен один и тот же элемент множества L. В дальнейшем мы будем иногда говорить, что совершается допу- допустимая замена некоторого элемента множества L, если вместо этого элемента берется другой элемент одного с ним класса, иначе говоря, любой другой равный ему элемент. 3. В ряде случаев вместо заранее данного разбиения множества L на классы равных элементов будут непосредственно указываться усло- условия допустимых замен (т. е. условия, при которых элементы считаются равными). Тогда для произвольного элемента а из L будет определен класс Л, состоящий из всех элементов L, равных элементу а. Одна- Однако, чтобы получить требуемое распределение множества L по таким классам, нужно обеспечить следующие три обстоятельства: 1) Сам элемент а должен войти в класс Л, то есть условия равен- равенства должны быть такими, чтобы элемент а считался равным самому себе: а = а (иначе говоря, замена элемента самим собой должна быть допустимой). 2) Если а = 6, то должно быть b = a. 3) Если а = b и b = с, то должно быть а = с. При соблюдении этих трех обстоятельств (и только в этом случае) любые два элемента, входящие в класс Л, равны между собой; кроме
14 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I того, класс Л включает все элементы множества L, равные какому- нибудь элементу этого класса. Иллюстрация сказанного дается на примерах § 2. 4. Будем говорить, что в множестве L определены действия сло- сложения и умножения на число, если: 1) каждым двум элементам a, b из множества L сопоставлен неко- некоторый элемент того же множества L, называемый их суммой; сумма элементов a, b обозначается через а + 6; 2) каждому числу а и каждому элементу а из множества L сопо- сопоставлен некоторый элемент того же множества L, называемый произ- произведением а на а или а на а; произведение а на а обозначается через аа или аа. Предполагается, что действия сложения и умножения на число ин- инвариантны относительно допустимых замен элементов множества L: если а = a', b = 6', то а + b = а' + Ь' и аа = «а'. Предполагается также, что соблюдены требования следующих вось- восьми аксиом: 1) Для любых a, b из L а + 6 = 6 + а. Это свойство сложения называется перестановочным или коммутатив- коммутативным. 2) Для любых а, 6, с из L (а + 6) + с = а + F + с). Это свойство называется сочетательным или ассоциативным. Оно поз- позволяет писать сумму без скобок, считая а + b + с = (а + 6) + с = = а + (Ь + с). Вследствие первой аксиомы безразличен также и поря- порядок записи слагаемых. 3) В множестве L существует элемент в такой, что а + 6 = а для любого а из L. Элемент в называется нулевым. 4) Для любого элемента х из L существует элемент у из L такой, что х + у = в. Элемент у называется противоположным для х и обозначается че- через —х. 5) 1 • а = а. 6) а(Ра) = (аР)а. 7) (а + Р)а = аа + /За. 8) а (а + Ь) = аа + ab. В последних четырех аксиомах а и b означают произвольные эле- элементы из L; а и Р — произвольные числа.
§ 2 ] ПРИМЕРЫ ЛИНЕЙНЫХ ПРОСТРАНСТВ 15 Отметим, что свойство, выраженное седьмой аксиомой, называется распределительным или дистрибутивным для сомножителя из L (эта аксиома разрешает распределять сомножитель из L по составляющим числового сомножителя). Восьмая аксиома выражает распределитель- распределительное свойство для числового сомножителя. 5. Основное о п ре дел е н и е. Множество L, рассматриваемое вместе с заданными в нем действиями сложения и умножения на число, называется линейным пространством. Подчеркнем, что в этом определении подразумевается, что сложе- сложение и умножение удовлетворяют всем свойствам, перечисленным в п. 4. Восемь аксиом, сформулированных в п. 4, называют аксиомами ли- линейного пространства. Как мы уже говорили во введении, элементы линейного простран- пространства принято называть также векторами, а само линейное простран- пространство можно называть векторным пространством. Впрочем, очень часто множество L мы будем называть пространством, не употребляя ника- никаких прилагательных, но считая, что речь идет о векторном простран- пространстве. 6. Если для векторов пространства L определено умножение толь- только на действительные числа, то L называется действительным вектор- векторным пространством. Если определено умножение векторов из L также и на комплексные числа, то пространство L называется комплексным. Всюду в дальнейшем, употребляя термин «произвольное число», мы будем иметь в виду любое действительное число, если речь идет о действительном пространстве, и любое комплексное число, если речь идет о комплексном пространстве. Значительная часть фактов, изложенных в ближайших главах, от- относится и к действительным, и к комплексным пространствам. В тех случаях, когда какое-либо свойство справедливо только для действи- действительного или только для комплексного пространства, это будет особо оговариваться. 7. Иногда вместо умножения на числа рассматривается умножение элементов из L на элементы произвольного алгебраического поля U (с соблюдением тех же восьми аксиом линейного пространства). В этом случае множество с заданными линейными операциями называется ли- линейным (или векторным) пространством над полем U. § 2. Примеры линейных пространств Предварительное замечание. Если относительно какого- либо конкретного множества с заданными в нем линейными операция- операциями утверждается, что оно есть линейное пространство, то для доказа- доказательства этого утверждения нужно проверить, что заданные операции
16 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I в самом деле являются линейными, то есть удовлетворяют требовани- требованиям восьми известных нам аксиом. 1. Пространство геометрических векторов. Рассмотрим в трехмерном евклидовом пространстве множество всех геометрических векторов. Заметим, что два элемента этого множества, т. е. два вектора, считаются равными в том случае (и только в том слу- случае), когда они коллинеарны, имеют равные длины и направлены в одну сторону. Таким образом, речь идет о свободных векторах, точка приложения которых может выбираться произвольно. Допустимые замены вектора заключаются в его параллельных пе- перенесениях к новым точкам приложения. Соблюдение трех условий п. 3 § 1 при этом очевидно. Линейные операции над геометрическими векторами производятся хорошо известным образом: сложение — по правилу параллелограмма, умножение на действительное число а есть растяжение вектора в а раз. Обе операции инвариантны относительно допустимых замен. В самом деле, если а = ar, b = b', то паралле- параллелограмм, построенный на векторах а', 6', получается параллельным перенесением параллелограмма, который построен на а, 6; тем самым, вектор а' + Ь' получается параллельным перенесением вектора а + 6, то есть а + Ь = а' + Ь'. Столь же просто усматривается равенство аа = аа'. Геометрические векторы с указанным определением линейных опе- операций образуют действительное линейное пространство. Нулевым эле- элементом здесь является вектор нулевой длины. Если х — любой вектор, то в качестве противоположного ему вектора у = — х следует понимать вектор той же длины и противоположного направления. Требования аксиом 1)-8) п. 4 § 1 при этом соблюдены, в чем легко убедиться при помощи простых геометрических рассуждений. Разумеется, в этом нет чего-либо случайного. Дело в том, что геометрические векторы послу- послужили исходной моделью для общего понятия линейного пространства, т. е. в аксиомах 1)-8) высказаны свойства линейных операций над гео- геометрическими векторами, хорошо известные в элементарной векторной алгебре. Можно было бы спросить, почему в аксиомах 1)-8) не потребованы другие, столь же простые и важные свойства геометрических векторов, которыми постоянно пользуются в векторных выкладках? Например, что умножение любого вектора на число нуль дает нулевой вектор или что при умножении любого вектора х на число —1 получается противо- противоположный вектор —х. Оказывается, в этом нет надобности, поскольку такие свойства можно уже доказать, т. е. вывести из аксиом, что и будет сделано в § 3. 2. Нулевое пространство. Пусть L — множество, состоя- состоящее только из одного элемента. Что представляет собой этот элемент, нам безразлично. Обозначим его буквой в. Определим в множестве L
§ 2 ] ПРИМЕРЫ ЛИНЕЙНЫХ ПРОСТРАНСТВ 17 линейные операции, полагая, что в в сумме с самим собой дает в и что при умножении в на любое действительное число мы получаем также в. Легко убедиться, что в этом случае требования аксиом 1)- 8) соблюдены. Таким образом, данное множество L является действи- действительным линейным пространством, состоящим из единственного, оче- очевидно, нулевого элемента. Ясно, что с тем же успехом множество L можно определить как комплексное пространство. Замечание. Все другие (действительные или комплексные) ли- линейные пространства обязательно имеют бесконечное количество эле- элементов. Именно, в п. 2 §3 показано, что если линейное пространство содержит хотя бы один элемент а, отличный от нулевого, то для раз- различных чисел а и /3 элементы аа и Ра также различны. 3. Координатное пространство. Пусть теперь L означа- означает множество, элементами которого служат всевозможные упорядо- упорядоченные наборы действительных чисел, по п чисел в каждом (п — за- зафиксированное натуральное число). Называя какой-нибудь набор из п чисел упорядоченным, мы считаем, что составляющие его числа за- занумерованы. (При этом они не обязаны быть различными). Имея в виду, что элемент х из L есть набор чисел xi, x2j ..., хп, будем пи- писать х = {xi, #2, . . ., хп}. Считая х произвольным, рассмотрим еще один, также произвольный элемент у = {yi, у2, . . . , уп}- Элементы х и у будем полагать равными в том и только в том случае, когда х\ = yi, х2 = 2/2, • • • •> хп = уп. Определим линейные операции в L соотношени- соотношениями: х + у = {хх + 2/ь х2 + 2/2, • • • , %п + Уп), A) ах = {axi, ax2j . . ., ахп}. B) Тогда требования первых двух аксиом линейного пространства соблю- соблюдены, поскольку сложение действительных чисел обладает перестано- перестановочным и сочетательным свойствами. Для проверки аксиом 3), 4) до- достаточно указать в множестве L нулевой элемент; именно: 0 = {О,О,...,О}. C) Вместе с тем ясно, что в L для любого х существует противоположный элемент —ж; именно: -х = {-хи -х2, . . . , -хп}. D) Аксиома 5) сразу усматривается из соотношения B). Наконец, акси- аксиомы 6), 7), 8) соблюдаются вследствие соотношений A), B), а также вследствие сочетательного и распределительного свойств для умноже- умножения действительных чисел. Таким образом, множество L с заданными линейными операциями является действительным линейным пространством. Мы будем назы- называть его действительным координатным пространством Кп.
18 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I Замечание. Рассматриваемое сейчас множество L не позволяет считать множитель а в соотношении B) комплексным числом, так как при комплексном а в правой части B) получится набор комплексных чисел, не являющийся элементом множества L. 4. Обозначим на этот раз через L множество всех упорядоченных наборов из комплексных чисел, по п чисел в каждом. Линейные операции определим формулами A) и B), считая теперь, что a, Xj,yj (j = 1, ..., п) — комплексные числа. Как и в предыдущем пункте, все аксиомы 1)-8) соблюдены, причем нулевой и противопо- противоположный элементы выражаются формулами C) и D). Таким образом, L есть линейное пространство, комплексное, поскольку комплексны чис- числа а. Мы будем называть его комплексным координатным простран- пространством Кп. Замечание. Ничто не мешает нам, однако, в соотношениях A), B) употреблять в качестве а только действительные числа (при ком- комплексных Xj, yj). В таком случае множество L оказывается действи- действительным линейным пространством. Отсюда ясно, что одни и те же предметы (например, упорядоченные наборы комплексных чисел) мо- могут служить в качестве векторов различных линейных пространств. Поэтому в общем определении § 1 линейным пространством называ- называется не просто множество L, а множество вместе с заданными в нем линейными операциями, причем необходимо указывать, из какого поля берутся множители а. 5. Пространство м ат р и ц. Как принято, будем называть пря- прямоугольной матрицей, точнее, т х n-матрицей таблицу чисел, располо- расположенных в т строчках по п чисел в каждой. Если числа, составляющие матрицу, обозначены через а^ (i = 1, 2, ..., т; k = 1, 2, ..., n), a сама матрица — через а, то будем писать am2 • • • Urn Самой этой записью данные числа располагаются также и по столбцам (число dik находится в строке с номером г и в столбце с номером к). Наряду с подробной записью матрицы в виде таблицы мы часто будем употреблять сокращенную запись: а = ||аг*||- Условимся матрицу называть действительной или комплексной в слу- случаях, когда она составлена соответственно из действительных или из комплексных чисел. Пусть L — множество всех т х n-матриц, например, действитель- действительных. Две матрицы будем считать равными элементами множества L
§ 2 ] ПРИМЕРЫ ЛИНЕЙНЫХ ПРОСТРАНСТВ 19 в том и только в том случае, когда в них соответствующие места заня- заняты одинаковым числами (т. е. на пересечении г-й строки и к-го столбца и в одной и в другой матрице стоит одно и то же число). Определим в множестве L линейные операции. Именно, если а = Ца^Ц, Ь = \\bik\\ — произвольные матрицы из L, а а — произвольное действительное число, то положим а + b = \\aik + bik\\, aa = \\aaik\\. E) Иначе говоря, при сложении т х n-матриц а и b мы попарно склады- складываем одинаково расположенные в них числа а^ и 6^; при умножении матрицы а на число а мы умножаем на а все числа, составляющие мат- матрицу а. Совершенно так же, как в п. 3, можно установить, что линейные операции E) удовлетворяют требованиям аксиом 1)-8); при этом роль нулевого элемента в L играет матрица в, состоящая из одних нулей (ну- (нулевая матрица), а противоположным элементом для а = Ца^Н служит матрица || — а^||. Тем самым L с линейными операциями E) являет- является действительным линейным пространством. Аналогично множество всех комплексных т х n-матриц с линейными операциями E), где а — комплексное, является комплексным линейным пространством. Разу- Разумеется, рассматривая комплексные т х n-матрицы, мы можем считать а действительным; тогда получим действительное линейное простран- пространство тех же комплексных матриц. Замечание. В частном случае т = 1 (при данном п) мы полу- получаем матрицы, каждая из которых имеет только одну строку (состо- (состоящую из п чисел). Линейное пространство таких матриц есть не что иное, как координатное пространство Кп (см. п. 3). При п = 1 и данном т получаются матрицы, имеющие только один столбец; ясно, что они также образуют координатное пространство, именно Кт. Более того, пространство любых т х n-матриц можно рассматривать как коорди- координатное пространство Ктп, поскольку ничто не мешает установить для всех элементов матриц общую нумерацию по какому-нибудь единому стандарту и выписать их в одну строку или в один столбец. 6. Пространство непрерывных фу н кц и й. Возьмем на числовой оси произвольный сегмент Т\ ^ г ^ Т2 и обозначим через L множество всех функций, непрерывных на этом сегменте и принима- принимающих действительные значения. Имея в виду, что элемент х из L есть некоторая непрерывная функция ж (г), т\ ^ г ^ Т2, будем писать х = = {х(т)}. Считая х произвольным, рассмотрим еще один также произ- произвольный элемент у = {у(т)}. Элементы х и у будем считать равными в том и только в том случае, когда х(т) = у(т), т.е. когда х(т) и у(т) совпадают в любой точке г сегмента т\ ^ г ^ т^. Определим линейные операции в L, полагая х + у = {х(т) + у(т)}, ах = {ах(т)}, F)
20 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I где а — действительное число. Иначе говоря, мы складываем функции и умножаем их на числа обычным образом, как принято в анализе. Су- Существенно заметить, что при сложении непрерывных функций и при умножении непрерывной функции на постоянную получаются снова непрерывные функции. Легко убедиться, что линейные операции F) удовлетворяют требованиям аксиом 1)-8). При этом нулевой элемент в есть функция, равная нулю во всех точках т сегмента [ti, T2]; для элемента х = {х(т)} противоположным служит {—х(т)}. Таким об- образом, множество всех действительных непрерывных на т\ ^ г ^ t<i функций с линейными операциями F) есть действительное линейное пространство. Если в качестве L мы возьмем множество всех непрерывных на Tl ^ т ^ Т2 функций с комплексными значениями, т.е. функций ви- вида х(г) = и(т) + iv(r), то в этом множестве можно задать линейные операции F) при комплексном а. Все аксиомы 1)-8) здесь также удо- удовлетворены, и мы получаем комплексное линейное пространство непре- непрерывных функций с комплексными значениями. Аналогично примерам, которые рассматривались в пп. 4 и 5, мы можем и в данном случае мно- множество непрерывных функций х(т) = и(т) + iv(r) сделать действительным линейным пространством, если в равенствах F) будем в качестве а допускать только действительные числа. 7. Пространство интегрируемых функций 1). Рассмотрим всевозможные действительные функции, интегрируемые на сегменте т\ ^ г ^ т^. Множество этих функций обозначим через L. Известно, что если мы изменим интегрируемую функцию в одной точке как угодно (сохранив остальные ее значения), то она останется интегрируемой, а интеграл от нее будет равен тому же числу, что и до изменения. То же самое можно сказать, если функция изменяется в нескольких точках и даже в бесконечном множестве точек при условии, что это множество имеет меру нуль. Такого рода изменения функции с точки зрения теории интегрирования несущественны. Поэтому в вопросах теории интегрирования целесообразно не различать две функции, если они совпадают на сегменте т\ ^ т ^ t<i почти везде, т. е. во всех точках сегмента т\ ^ г ^ Т2, кроме, быть может, некоторого множества меры нуль. В связи с этим условимся два элемента х — {ж(т)}, у — {у(т)} множества L считать равными, если х (г) = у(т) почти везде х) Читатель, не знакомый с теорией интегрирования, этот пункт может пропустить.
§ 2 ] ПРИМЕРЫ ЛИНЕЙНЫХ ПРОСТРАНСТВ 21 на сегменте т\ ^ г ^ т2. Соответственно допустимая замена произвольного элемента х = {х(т)} Е L заключается в любом изменении значений функции х(т) на любом множестве меры нуль. Легко убедиться, что такое определение равенства элементов L удовлетворяет трем требованиям п. 3 § 1. Для первых двух это очевидно. Пусть теперь у = ж, то есть, у(т) = х(т) всюду, кроме некоторого множества Л4± меры нуль; пусть z = ж, то есть z(t) = х(г) всюду, кроме некоторого множества Л42 меры нуль. Тогда у (г) = z(r) всюду, кроме, быть может, объединения множеств .Mi и Л42. Но объединение двух множеств меры нуль есть множество меры нуль. Следовательно, у(т) = z(r) почти всюду, а значит, у = z. Таким образом, и третье требование удовлетворено: если у = ж, z = х, то у — z. Если в множестве L определить линейные операции согласно формулам F) п. 6, то будут обеспечены и инвариантность операций относительно допустимых замен, и соблюдение всех аксиом 1)-8). Не останавливаясь на доказательстве этих обстоятельств, заметим только, что в данном случае нулевым элементом является в = {#(т)}, где 6(т) — любая функция, равная нулю почти везде на сегменте [ti, T2]. Множество L с заданными линейными операциями называется пространством функций, интегрируемых на сегменте [ti, T2]. 8. Контрпример. Обозначим через L множество всех упорядоченных наборов действительных чисел по п (п > 1) чисел в каждом, т.е. множество того же вида, что и в п. 3. Определим сумму двух элементов из L так же, как в п. 3: х + у = {ж1 + 2/1, х2 + 2/2, • • • , Хп + Уп}- G) Умножение х на а пусть дается правилом ах = {axi, ж2, . . ., хп} (8) (справа на а умножается только х\). Вследствие соотношения G) аксиомы 1)-4) удовлетворены, причем в = {0, 0, . . ., 0}, -х = {-хи -х2, . . ., -хп}. Легко проверить также что соблюдаются требования аксиом 5), 6), 8). Вместе с тем аксиома 7) нарушена: (а + /3)х = {(а + /3)ж1, ж2, . . ., хп}, ах + /Зх = {(а + /3)xi, 2х2, . . ., 2жп}. Таким образом, множество L с операциями G), (8) не является линейным пространством.
22 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I § 3. Простейшие следствия из аксиом линейного пространства 1. Перейдем к изложению общей теории, т.е. к выводам из акси- аксиом 1)-8) независимо от частных особенностей конкретных линейных пространств. Имеют место следующие предложения: 1) В каждом линейном пространстве нулевой вектор только один. Доказательство. Пусть элементы Ох и #2 нулевые. Вслед- Вследствие аксиом 1) и 3) они совпадают: Л Л | Л Л | Л Л  =  т f 1 = f 1 + G2 = G1. Замечание. Разумеется, когда мы говорим, что нулевой вектор только один, то мы не различаем равные векторы. В том же смысле следует понимать утверждение единственности и в других теоремах (например, в следующем предложении). 2) Для любого вектора х существует только один противополож- противоположный вектор. Доказательство. Предположим, что х-\-ух = в и что х + у<± = = в. Аксиомы 1)-4) позволяют записать следующую цепочку равенств: У2 = У2 + 0 = ?/2 + (Х + 2/1) = B/2 + Х) + уХ = = (х + 2/2) + У\ = в + у\ = ?/1, то есть, у2 = У1. 3) Произведение любого вектора х на число 0 равно нулевому век- вектору в. Доказательство. Для данного вектора х возьмем противопо- противоположный вектор у. Используя аксиомы 2)-5) и 7), получаем О . х = 0 • х + 6 = 0 • х + (х + у) = @ + 1)х + у = х + у = 6. 4) Произведение любого вектора х на число —1 равно вектору, про- противоположному для х, т. е. (—1)х = —х. Доказательство. Нужно установить, что х + (—1)х = в. Из предыдущего свойства и аксиом 5) и 7) имеем х + (-1)х = A-1)х = 0-х = в. 5) Произведение нулевого вектора в на любое число а равно нулево- нулевому вектору. Доказательство. Возьмем произвольный вектор х. Исполь- Используя аксиому 6) и свойство 3), находим ав = а@ • х) = (а • 0)х = 0 • х = в.
§ 4] ЛИНЕЙНАЯ КОМБИНАЦИЯ. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 23 2. Замечания.1. Из свойства 5) следует, что произведение нену- ненулевого вектора на число, не равное нулю, всегда есть ненулевой вектор. В самом деле, если бы при Л ф О, а ф в было Ха = в, то вследствие свойства 5) и аксиом 5)-6) мы получили бы а = 1 • а = ( \ • Л ) а = ^(Ао) = \в = 6, у Л у Л Л что противоречит условию а ф в. 2. Если а ф /3 и а ф 6, то аа ф Ра. В самом деле, если бы оказалось аа = /За, то аа + (—Р)а = 0 или (а — Р)а = #, что противоречит предыдущему, так как а — РфОиафв. 3. В линейном пространстве определено действие вычита- вычитания. Именно, вектор х называется разностью вектора b и вектора а, если х + а = 6, что записывается х — Ь — а. Докажем, что для, любых элементов a ub разность существует и единственна. Существование. Докажем, что вектор х = b + (—1)а является разностью b — а. Вследствие аксиом 2), 3), 5), 7) и свойства 3) имеем: х + а = b + (-l)ft + a = b + (-1 + 1)а = b + 0 • а = 6. Единственность. Покажем, что если ж является разностью b — а, то его всегда можно представить в виде х = 6 + (—1)а. В самом деле, из равенства х -\- а = b с помощью аксиом 2), 3), 5), 7) и свойства 3) получаем х = х + 6 = х + A-1)а = х + а + (-1)а = b + (-l)ft. 4. В дальнейшем мы будем пользоваться аксиомами линейного про- пространства и свойствами, установленными в этом параграфе, без подроб- подробных пояснений. Вследствие аксиом и полученных здесь результатов вы- выкладки, в которых участвуют элементы линейного пространства, про- проводятся аналогично преобразованиям в элементарной алгебре, с той лишь разницей, что нет умножения векторов и нужно различать число нуль и нулевой вектор. В частности, можно переносить вектор из одной части векторного равенства в другую, умножая переносимый вектор на минус единицу (или, что то же самое, заменяя его противоположным вектором). § 4. Линейная комбинация. Линейная зависимость 1. Пусть дано конечное число элементов линейного пространства: а, 6, с, ..., q. Пусть далее а, /3, j, ..., к — произвольные числа. Определение 1. Всякий элемент х пространства L, предста- вимый в виде х — аа + РЬ + 7е + * * * + кЧ->
24 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I называется линейной комбинацией элементов а, Ь, с, ..., q. Говорят также, что х линейно выражается через а, Ь, с, ..., q. Определение 2 . Линейная комбинация называется тривиаль- тривиальной, если a = C = j = ... = K = 0, и называется нетривиальной, если среди чисел a, C, j, ..., к хотя бы одно отлично от нуля. Определение 3. Система векторов а, Ь, с, ..., q называется линейно зависимой, если существует нетривиальная линейная комби- комбинация векторов а, Ь, с, ..., q, равная нулевому вектору; иначе говоря, если справедливо равенство аа + /ЗЬ + 7е + * * * + КЧ — ®•> где среди чисел а, /3, j, ..., к хотя бы одно отлично от нуля. Определение 4. Система векторов а, Ь, с, ..., q называется линейно независимой, если равенство аа + РЬ + 7е Н \- xq = О возможно только в том случае, когда а = /3 = 'у=... = к = 0. 2. Рассмотрим свойства введенных понятий. 1) Непосредственно из определений видно, что всякая конечная си- система векторов является либо линейно зависимой, либо линейно неза- независимой. Покажем, что система, состоящая из одного вектора, ли- линейно зависима тогда и только тогда, когда этот вектор нулевой. В самом деле, равенство ав = в при любом а, в частности, при а ф 0, установлено в п. 1 § 3. Пусть теперь ж/^и ах = в. Тогда а = О согласно п. 2 § 3. 2) Если часть системы линейно зависима, то и вся система ли- линейно зависима. Пусть известно, что в системе а, Ь, с, ..., q часть, состоящая, напри- например, из векторов с, ..., q, линейно зависима. Значит, существуют числа j, ..., к, не все равные нулю и такие, что jc + • • • + x,q = в. Но тогда линейная комбинация 0 • а + 0 • b + jc + • • • + Kq = в нетривиальна, поскольку отличные от нуля числа имеются среди ^, ..., к. 3) Если вся система линейно независима, то и любая ее часть ли- линейно независима. Это вытекает непосредственно из предыдущего свойства. В частно- частности, нулевой вектор не может входить в линейно независимую систему. 4) Если система линейно зависима, то в ней найдется хотя бы один вектор, который линейно выражается через остальные векторы этой системы. В самом деле, если аа + /3b + jc + • • • + Kq — в, а среди коэффи- коэффициентов а, /3, j, ..., к есть отличные от нуля, то любой из векторов,
§5] ЛЕММА О БАЗИСНОМ МИНОРЕ 25 имеющих ненулевые коэффициенты, можно линейно выразить через остальные векторы системы. Так, например, если а ф О, то /? 7 * а = b -с — . . . q. а а а Свойство 4) не только необходимо, но и достаточно для линейной за- зависимости системы векторов. Именно, справедливо следующее утвер- утверждение. 5) Если некоторый элемент системы является линейной комбина- комбинацией остальных элементов этой системы, то система линейно зави- зависима. Действительно,если а = f3'b + j'c-\ Ьх'#, то 1 ¦ а + (-Р')Ь + (-т')с + ¦ • ¦ + {->c')q = в, и линейная комбинация в левой части последнего равенства нетриви- нетривиальна. 6) Пусть ai, ..., dk — какие-нибудь векторы. Пусть каждый из векторов ci, C2, ..., сп линейно выражается через ai, ..., а^: Cl = ацп! -\ Ь С2 = + ' ' ' + ( Пусть, далее, вектор b линейно выражается через а±, ..., а/., С\ , . . . , Сп. b = Aiai + h Xk^k + Vici + h /incn- Тогда вектор b линейно выражается через векторы ai, ..., а&. Доказательство. b = (Ai +/xiau H h/in«ni)fti H \~(^ § 5. Лемма о базисном миноре 1. Пусть дана прямоугольная матрица Л = ||&ij||- Будем рассмат- рассматривать строчки этой матрицы как векторы координатного простран- пространства Кп, а столбцы — как векторы координатного пространства Кт (см. §2, пп. 3-5). Тогда мы сможем говорить о линейной зависимости и независимости строк данной матрицы или о линейной зависимости и независимости ее столбцов.
26 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I 2. Пусть отмечено к разных строк и к разных столбцов матрицы А (к ^ п, к ^ т). Элементы1) матрицы Л, стоящие на пересечении от- отмеченных строк и столбцов, сами образуют некоторую, очевидно квад- квадратную, матрицу В. Определитель матрицы В называется минором порядка к данной матрицы А. Отметим, если это возможно, еще одну строку и еще один столбец матрицы Л, не повторяя тех, которые уже были отмечены раньше. Те- Теперь все отмеченные строки и столбцы своим пересечением определяют некоторую квадратную матрицу С. Определитель матрицы С есть минор порядка к + 1 матрицы А. Мы будем называть его окаймляющим для первоначального взятого минора (т.е. для определителя матрицы В). Замечания. 1. Если к = п или к = т, то для минора порядка к окаймляющих миноров нет. 2. Если к = 1, то матрица В состоит из одного элемента матрицы А. Миноры первого порядка представляют собой численные значения эле- элементов матрицы. 3. Определение 1. Минор матрицы называется базисным, ес- если он не равен нулю, а окаймляющие его миноры либо все равны нулю, либо отсутствуют вовсе. Определение 2. Столбцы матрицы, пересекающие базисный минор, называются базисными столбцами. Аналогичная терминоло- терминология употребляется для строк. Замечание. Матрица может иметь несколько базисных мино- миноров и соответственно несколько систем базисных столбцов. Всякая мат- матрица, кроме нулевой, имеет по крайней мере один базисный минор и, тем самым, по крайней мере одну систему базисных столбцов. 4. Лемма о базисном миноре. Столбцы матрицы, пере- пересекающие базисный минор, линейно независимы; всякий столбец через них линейно выражается. Эта же лемма, согласно определению 2, может быть высказана так: Базисные столбцы линейно независимы; любой столбец матрицы линейно выражается через базисные. Доказательство первого утверждения леммы — методом от противного. Предположим, что базисные столбцы линейно зависимы. ) Элементами матрицы называют составляющие ее числа: аи, СЦ2-, ••• Однако точнее следует сказать, что элементами матрицы являются символы an, ai2, • • • При этом два элемента aik и aji считают различными, если г ф j и к ф I (не исключая возможности, что а^ и a,ji обозначают одно и то же число). Заметим еще, что в ряде случаев рассматриваются матрицы, где под aik подразумеваются не числа, а какие-нибудь другие объекты, например, функции.
ЛЕММА О БАЗИСНОМ МИНОРЕ 27 Тогда линейно зависимы столбцы базисного минора. Но в таком случае базисный минор равен нулю, что противоречит его определению. Доказательство второго утверждения. Будем считать для определенности, что рассматриваемый базисный минор имеет поря- порядок г и занимает верхний левый угол матрицы: СЬц . . . Qj\r a 7*1 ... CL г"г ... a\k • • • a\n ••• ark - - - arn Обозначим этот базисный минор через D. Возьмем произвольные индексы г, А; A ^ составим определитель порядка г + 1 т, 1 п) и ar7 ац Докажем, что А^ = 0. Рассмотрим три возможных случая: 1) ъ ^ г. В этом случае А^ = 0, так как в нем последняя строка совпадает с одной из предыдущих строк. 2) к ^ г. В этом случае А^ = 0, потому что в нем последний столбец совпадает с одним из предыдущих. 3) i > г, к > г. В этом случае определитель А^ является окаймляю- окаймляющим для минора D и равен нулю потому, что D — базисный минор. Зафиксируем к и будем считать, что г пробегает всевозможные зна- значения от 1 до т. Разложим А^ по элементам последней строки. Алгебраические до- дополнения элементов последней строки обозначим через Ai, A<i, ... . . ., Лг+1. При изменении г эти величины остаются неизменными, так как алгебраическое дополнение какого-либо элемента зависит только от его места в определителе, но не зависит от численного значения самого элемента. В результате разложения получим Aik = Агац + • • • + Arair + Ar+1aik = 0, A) причем Лг+1 = D ф 0. B) Соотношения A) и B) дают агк = ( - D
28 линейные пространства [Гл.1 Напомним, что к зафиксировано, г пробегает все значения от 1 до т, поэтому o>ik D D alr C) Формула C) представляет k-и столбец матрицы (который может быть взят произвольно) в виде линейной комбинации базисных столб- столбцов. Лемма доказана. Замечание. Разумеется, аналогичная лемма имеет место и для базисных строк. 5. Как следствие леммы о базисном миноре получается следующая Теорема. Определитель квадратной матрицы равен нулю в том и только в том случае, когда между столбцами этой матрицы име- имеется линейная зависимость. Аналогичное утверждение справедливо и для строк. Доказательство. Если столбцы п х n-матрицы зависимы, то ее определитель равен нулю, что известно как одно из основных свойств определителей. Покажем, что если столбцы независимы, то определи- определитель не равен нулю. В самом деле, если столбцы независимы, а опреде- определитель равен 0, то должен найтись базисный минор М порядка < п. Но тогда имеется столбец, который не входит в систему базисных столбцов, соответствующую минору М и который линейно выражается через эту систему, т. е. между столбцами имеется зависимость, что противоречит предположению. § 6. Основная лемма о двух системах векторов 1. Пусть даны две системы векторов ai, а^-, - •., ак и 6i, 62, ..., bm из одного и того же линейного пространства. Лемма 1 (основная). Если система 6i, 62, ..., Ьш линейно неза- независима, а каждый из векторов bi линейно выражается через систему ai, ^2, ..., dk, то т ^ k. Доказательство проведем от противного. Предположим, что т > к. Выпишем формулы, выражающие векторы bi через ау. 61 = OLnCLi + • • • + 62 = 0^21^1 + * * * + О(>2кО>к, Ьш = -\ Ь A) и рассмотрим матрицу Ца^'Н- Если матрица ||c*f/|| нулевая, то 6i = . . . . . . = bm = в и система 6i, 62, ..., bm линейно зависима, что противоре-
§ 6 ] ОСНОВНАЯ ЛЕММА О ДВУХ СИСТЕМАХ ВЕКТОРОВ 29 чит условию леммы. Пусть матрица ||а^|| не нулевая. Тогда она имеет базисный минор, причем порядок базисного минора не превышает чис- числа столбцов к. Число строк в матрице ||а^||, равное т, больше к и, следовательно, больше числа базисных строк этой матрицы. Таким образом, матрица ||c^ij|| имеет некоторую систему базисных строк и еще, по крайней мере, одну строку, не входящую в эту систему. Согласно лемме о базисном миноре указанная строка линейно выра- выражается через базисные. Но это означает, что между строками матрицы имеется линейная зависимость (см. §4, п. 2, предложения 5 и 2). Напи- Напишем ее в виде Ai{au, . . ., а1к} Н Ь Am{amij . . ., атк} = {0, . . ., 0}, B) где среди чисел Ai, ..., Am есть отличные от нуля. Умножим равенства A) соответственно на Ai, ..., Am и сложим их почленно. Учитывая линейную зависимость B), найдем Xibi + Ь ХщЬт = ai(Aian + • • • + Xmami) + • • • h ak(Xialk -\ h Хшашк) = = 0-oi H \-0-ak = 0. Система 6i, ..., bm оказалась линейно зависимой, что невозможно по условию леммы. Полученное противоречие показывает, что лемма 1 доказана. 2. Говорят, что векторы а^, ..., &ir образуют линейно независи- независимую подсистему в системе ai, ..., ак (к ^ г), если векторы а^, ..., &ir линейно независимы и входят в систему ai, ..., ак. Очевидно, что система ai, ..., ак содержит (по крайней мере одну) линейно независимую подсистему в том и только в том случае, когда среди векторов ai, ..., ак имеется хотя бы один ненулевой. 3. Лемма 2 . Пусть система векторов ai, ..., ar, ar+i линей- линейно зависима, а ее подсистема ai, ..., аг линейно независима. Тогда вектор ar+i линейно выражается через векторы ai, ..., аг. Доказательство. Имеем зависимость Aiai + Ь Arar + Ar+iar+i = в, C) где среди чисел Ai, ..., Ar, Ar+i есть отличные от нуля. Ясно, что Ar+i не может быть равным нулю, так как в этом случае оказалась бы зависимой подсистема ai, ..., аг. Таким образом, Ar+i ф 0, и мы из формулы C) находим ( Ai ( ar+i = ai Л h что и требовалось доказать.
30 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I 4. Определение. Пусть система а\, ..., а/, содержит линейно независимую подсистему, состоящую из г векторов. Число г называет- называется рангом системы ai, ..., а/., если всякая ее подсистема из большего числа векторов линейно зависима, либо если таких подсистем нет со- совсем (в случае г = к). Коротко: рангом системы называется максимальное число ее ли- линейно независимых векторов. Если все векторы системы ai, ..., а/, нулевые, то будем говорить, что ее ранг равен нулю. 5. Лемма 3 (обобщенная основная). Пусть каждый из векторов &i, ..., Ъш линейно выражается через векторы ai, ..., аи- Тогда ранг системы 6i, ..., 6m не больше ранга системы ai, ..., a/.. Доказательство. Обозначим через г ранг системы а±, ..., а/.. Если г = 0, то справедливость утверждения леммы 3 очевидна. Если г = А;, то справедливость утверждения леммы 3 следует из леммы 1. В самом деле, ранг системы 6i, ..., Ьш по лемме 1 не больше к — г. Пусть 0 < г < к. Тогда в системе ai, ..., аи найдется г линейно независимых векторов. Пусть это будут векторы ai, ..., аг. Добавляя к ним еще один вектор из системы ai, ..., а&, всякий раз будем полу- получать линейно зависимые системы, а именно: ai, . . . , ar, ar+i; oi, . . . , ar, ak. По лемме 2 каждый из векторов ar+i, ..., а& линейно выражается через векторы ai, ..., аг. С другой стороны, по условию леммы каж- каждый вектор &i, ..., Ьш линейно выражается через все векторы ai,... . . ., аи- Отсюда и из предыдущего заключения следует, что каждый вектор &i, ..., Ьш линейно выражается через ai, ..., аг (см. §4, п. 2, предложение 6). Но тогда по лемме 1 число векторов в любой линей- линейно независимой подсистеме системы 6i, ..., Ъш не больше г. Лемма 3 доказана. Следствие. Пусть каждый из векторов Ь\, ..., Ьш линейно выражается через векторы ai, ..., а/, и каждый из векторов ai, ... . . ., аи линейно выражается через 6i, ..., Ьш. Тогда системы векторов ai, ..., а^ и 6i, ..., bm имеют одинаковые ранги. § 7. Ранг матрицы 1. Определение. Рангом матрицы называется максимальное число ее линейно независимых столбцов. Иначе говоря, ранг матрицы есть ранг системы ее столбцов, рас- рассматриваемых как векторы координатного пространства.
§7] РАНГ МАТРИЦЫ 31 Ранг матрицы Л будем обозначать символом Rang Л. Если матрица Л нулевая, то Rang Л = 0, так как у нулевой матри- матрицы нет линейно независимых столбцов. Отметим, что ранг ненулевой матрицы всегда положителен. 2. Теорема о ранге матрицы. Ранг произвольной матри- матрицы равен максимальному порядку ее миноров, отличных от нуля. Доказательство. Если Rang А = 0, то А — нулевая матрица, и у нее нет отличных от нуля миноров. Естественно считать в этом случае, что максимальный порядок отличных от нуля миноров равен нулю. Пусть далее матрица А — ненулевая. Если некоторый ее минор М порядка г не равен нулю, а все миноры более высокого порядка равны нулю или отсутствуют вовсе, то М является базисным минором. По лемме о базисном миноре столбцы матрицы Л, пересекающие минор М, линейно независимы. Поэтому Rang А ^ г. По той же лемме любой столбец матрицы А линейно выражается через базисные столбцы. От- Отсюда, применяя лемму 3 § 6, находим, что Rang Л ^ г. Таким образом, Rang Л = г, что и требовалось доказать. 3. Из рассуждений, проведенных в предыдущем пункте, вытекает ряд важных следствий: 1) Ранг ненулевой матрицы равен порядку любого ее базисного ми- минора. В самом деле, если М — произвольный базисный минор, г — его по- порядок, то, повторяя предыдущие рассуждения, находим, что Rang Л = = г. 2) Все базисные миноры ненулевой матрицы имеют одинаковый по- порядок, равный ее рангу. 3) Если в матрице А минор М базисный, то все миноры более вы- высокого порядка равны нулю (а не только миноры, окаймляющие М). 4) Максимальное число линейно независимых строк произвольной матрицы А равно максимальному числу ее линейно независимых столб- столбцов {то есть, равно рангу А). Доказательство. Если матрица Л — нулевая, то число ли- линейно независимых строк, как и число линейно независимых столбцов, равно нулю. Пусть Л — ненулевая матрица. Транспонируем матрицу Л. Тогда ее строки перейдут в столбцы транспонированной матрицы Л*, линейно независимые строки перейдут в линейно независимые столбцы Л*, а максимальный порядок отличных от нуля миноров сохранится, поскольку при транспонировании каждый из миноров сохраняет свое числовое значение. Таким образом, Rang Л = Rang Л* и равен максимальному числу линейно независимых строк матрицы Л.
32 линейные пространства [Гл.1 5) Если А — произвольная т х п-матрица, то Rang А не превыша- превышает меньшего из двух чисел тип. 4. Из предыдущего ясно, что ранг матрицы не изменяется при пе- перестановке ее столбцов или строк. Кроме того, в силу следствия, сформулированного в конце предыду- предыдущего параграфа, ранг матрицы не изменится, если какой-нибудь из ее столбцов умножить на ненулевой коэффициент, а также если к одному из столбцов прибавить другой столбец, умноженный на произвольное число. Это последнее из указанных здесь преобразований матрицы об- обсудим подробнее. Пусть ее столбцы есть xi, ..., хп до преобразования, 2/i, ..., уп — после преобразования. Тогда У\ = УР = yq = ахр xi = У\ X г, Ур xq = -аур + yq 6. Уп — %n ' %п — Уп то есть, мы находимся как раз в условиях следствия из п. 5 Отсюда вытекает Утверждение. Ранг матрицы не изменится, если к одному из ее столбцов прибавить линейную комбинацию других ее столбцов. Аналогично ранг сохраняется, если строку умножить на ненулевой коэффициент или к одной из строк прибавить линейную комбинацию других строк. Перечисленные в этом пункте свойства обычно используются для вычисления ранга матрицы. Именно, данную матрицу преобразуют так, чтобы ранг не изменился, но чтобы в результате получилась мат- матрица, у которой сразу виден базисный минор. § 8. Конечномерные и бесконечномерные пространства. Базис 1. Определение 1. Линейное пространство называется п-мер- ным, если в нем имеется линейно независимая система, состоящая из п векторов, а всякая система, состоящая из большего числа векторов, является линейно зависимой. Число п называется размерностью линейного пространства. Таким образом, размерность пространства — это наибольшее число его ли- линейно независимых векторов.
§8] РАЗМЕРНОСТЬ. БАЗИС 33 Например, пространство геометрических векторов (см. § 2, п. 1) трехмерно, так как в нем имеется три независимых вектора, а любые четыре связаны линейной зависимостью. Геометрические векторы, рас- расположенные в одной плоскости, образуют двумерное пространство; в нем любые два неколлинеарных вектора линейно независимы, а всякие три вектора линейно зависимы. Векторы, лежащие на одной прямой, образуют одномерное пространство. Линейное пространство, содержа- содержащее единственный элемент — нулевой вектор #, — является нульмер- нульмерным. 2. Все n-мерные пространства (п = 0, 1, 2, 3, ...) образуют класс конечномерных пространств. Но этим не исчерпывается множество всех линейных пространств вообще. Определение 2. Линейное пространство называется бесконеч- бесконечномерным, если для любого целого числа N > О в нем найдется линей- линейно независимая система, состоящая из N векторов. Пример. Линейное пространство непрерывных на данном сег- сегменте функций (см. § 2, п. 6) является бесконечномерным. Чтобы убе- убедиться в этом, достаточно рассмотреть степенные функции 1, г, г , ... ...,TN. Нетрудно установить их линейную независимость. В самом деле, любая их линейная комбинация представляет собой многочлен степени не выше N а0 + ol\t + а2т2 + \- anrN = р(т). Но у всякого многочлена с ненулевыми коэффициентами есть лишь конечное число корней, поэтому р(т) = 0, т.е. {р(т)} = 0 тогда и только тогда, когда q/q = а,\ = ОС*} = • • • = OLN = 0. Тем самым показано, что рассматриваемые элементы независимы, а са- само пространство бесконечномерно, поскольку число N может быть сколь угодно большим. 3. Введем весьма важное для дальнейшего Определение 3. Система векторов е\, ..., еп в пространстве L называется базисом, если: 1) векторы ei, ..., еп линейно независимы; 2) любой вектор х из пространства L линейно выражается через еь ..., еп, то есть, х = х1е1 -\ \-хпеп. A) Равенство вида A) называется разложением вектора х по базису ei, ..., еп; числовые коэффициенты х\, ..., хп называются координа- координатами вектора х в этом базисе. 2 Н.В. Ефимов, Э.Р. Розендорн
34 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I 4. Теорема. Линейное пространство п-мерно тогда и только тогда, когда в нем есть базис, состоящий из п векторов. Доказательство. 1) Пусть пространство L является п-мерным. Это значит, что в нем есть линейно независимая система ei, ..., еп, со- состоящая из п векторов, а добавив к ней произвольный вектор х из L, мы получим линейно зависимую систему ei, ..., еп, х. По лемме 2 из §6 вектор х линейно выражается через векторы ei, ..., еп. Поэтому система еь ..., еп образует базис в L. 2) Пусть L имеет базис ei, ..., еп. Рассмотрим в пространстве L произвольную линейно независимую систему векторов 6i, ..., bm. По определению базиса каждый из векторов bj линейно выражается через ei, ..., еп. Поэтому т ^ п в силу леммы 1 из § 6. Значит, любая система векторов из L, содержащая более чем п век- векторов, линейно зависима. Вместе с тем, базис ei, ..., еп образует ли- линейно независимую систему, содержащую п векторов. Таким образом, размерность L равна п. Замечание. Как видно из проведенного доказательства, в п- мерном пространстве любая независимая система из п векторов явля- является базисом. 5. В качестве приложения доказанной в п. 4 теоремы установим, что координатное пространство Кп является п-мерным. С этой целью рассмотрим в Кп векторы еп = {0, 0, ..., 1}. Согласно определению линейных операций в Кп (см. § 2, п. 3) любой вектор из Кп линейно выражается через векторы ei, ..., еп. Именно: х = {xi, х2, . . . , хп} = xiei + х2е2 -\ Ь хпеп. C) Отсюда ясно, что линейная комбинация векторов ei, ..., еп равна в = = {0, 0, . . . , 0} только в случае, когда все ее коэффициенты равны нулю. Значит, векторы ei, ..., еп линейно независимы и составляют базис Кп, так что пространство Кп является п-мерным. § 9. Линейные операции в координатах 1. Пусть пространство L является п-мерным, а векторы ei, ..., еп образуют в нем базис. Теорема 1. Разложение вектора по данному базису единствен- единственно.
ЛИНЕЙНЫЕ ОПЕРАЦИИ В КООРДИНАТАХ 35 Доказательство. Пусть вектор х из L имеет два разложения: х = х\в1 + Ь хпеп х = х\в\ + • • • + хпеп. Тогда (Ж1 - xi)ei H Ь (жта - хп)еп = б, а так как векторы базиса линейно независимы, то Х\ Х\ — ... — X л %п — v "> откуда Х\ «^1 } ' ' ' 1 %П %П ' Теорема доказана. Следствие. Все координаты нулевого вектора в равны нулю при любом выборе базиса: в = 0-ei +0-e2 + --- + 0-en. A) Теорема 2. При умножении вектора на число каждая его ко- координата умножается на это число. При сложении двух векторов складываются их соответствующие координаты. Доказательство. Пусть даны векторы ж, у. Разложим их по базису: х —х\е\ + • • • + жпеп, У =2/iei H \-ynen- Пусть а — произвольное число. Вследствие аксиом линейного про- пространства имеем: ах = а[х\е\ + Ь хпеп) = (axi)ei -\ Ь (ахп)еп. Таким образом, вектор ах имеет координаты ах±, ..., ахп. Далее, х + + у = (xieH Vxnen)Jr{y1e1^ \-упеп) = (^i+j/i)eH Ь(жп + + Уп)^пч т0 есть, вектор х + у имеет координаты х\ + yi, ..., хп + уп. 2. Пусть а, 6, ..., q — произвольная система векторов из L. Разло- Разложим каждый из них по базису: а —а\е\ + • • • + апеП5 Ь =&iei + ... + 6nen, q =q1e1 H h ^nen и наряду с векторами B) рассмотрим матрицу М, образованную их координатами: м = Ьп Чп
36 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I Тогда справедлива Теорема 3. Ранг системы векторов B) равен рангу матри- матрицы М. Доказательство. Предположим, что между векторами B) име- имеется линейная зависимость аа + fib + --- + xq = в. C) Тогда из формул A), C) теоремы 2 и теоремы 1 имеем а{аи . . ., ап} + /3{Ьг, . . ., Ьп} -\ h%, . . ., qn} = = {0,...,0}. D) Иначе говоря, между строками матрицы М имеется линейная за- зависимость с теми же коэффициентами а, /3, ..., к. Обратно, из D) следует C). Аналогичные рассуждения можно провести, взяв не всю систему B), а какую-нибудь ее подсистему и соответствующую подси- подсистему строк матрицы М (т. е. те ее строки, в которых выписаны коорди- координаты векторов выбранной подсистемы). Поэтому подсистема векторов из системы B) линейно независима тогда и только тогда, когда линей- линейно независима соответствующая подсистема строк матрицы М. Значит, максимальное число линейно независимых векторов системы B) совпа- совпадает с максимальным числом линейно независимых строк матрицы М. Теорема 3 доказана. 3. Если число векторов в системе B) равно п, то матрица М стано- становится квадратной. В этом случае получаем следствие предыдущей теоремы: В п-мерном пространстве система из п векторов линейно зави- зависима тогда и только тогда, когда определитель матрицы координат этих векторов равен нулю: А = Det М = О (т. е. когда ранг матрицы М меньше п). Легко понять, что это утверждение по существу не отличается от теоремы в п. 5 § 5. Оно нередко используется при практической провер- проверке линейной зависимости или независимости конкретных систем век- векторов. § 10. Изоморфизм линейных пространств 1. Пусть даны два линейных пространства L и V и между ними установлено взаимно однозначное соответствие, то есть: 1) каждому вектору а из L соответствует некоторый вектор а' из Z/; 2) разные векторы из L имеют разные образы в L'; 3) образы элементов из L заполняют все L'.
§10] ИЗОМОРФИЗМ ЛИНЕЙНЫХ ПРОСТРАНСТВ 37 Определение. Пространства L и L' называются линейно изо- изоморфными, если между ними можно установить взаимно однозначное соответствие с соблюдением условий (а + Ь)' = а' + Ь,' A) (ааУ = аа'. B) Взаимно однозначное соответствие, удовлетворяющее условиям A) и B), называется линейным изоморфизмом пространств L и V. Иначе говоря, при линейном изоморфизме образ суммы равен сум- сумме образов, а образ произведения вектора на число равен произведению его образа на это же число. Алгебраические и геометрические свойства линейно изоморфных пространств совершенно тождественны. Замечание. Линейный изоморфизм возможен лишь при усло- условии, что и в L, и в U числовые множители берутся из одного и того же алгебраического поля (например, оба пространства L и Z/ действитель- действительны или оба комплексны). Так, если L — комплексное, aL' — действи- действительное, то условие B) невыполнимо потому, что в L' не определено умножение на комплексные множители, допустимое в L. Теорема 1. Для каждого п все действительные п-мерные про- пространства линейно изоморфны между собой. Теорема 1а. Для каждого п все комплексные п-мерные про- пространства линейно изоморфны между собой. Доказательства теоремы 1 и теоремы 1а формально совпа- совпадают, разница состоит лишь в том, что числовые множители берутся из разных полей. Пусть L и U оба n-мерны, причем оба действительны или оба комплексны. Выберем произвольный базис в каждом из них: еь ..., еп Е L; е[, ..., е'п Е V 1). Пусть х — какой-либо элемент из L. Разложим его по базису: х = x\ei -\ Ь хпеп. Поставим в соответствие элементу х такой элемент х' Е Z/, что X — Х\С-^ ~г * * * ~г %п&п' Вследствие теоремы о единственности разложения вектора по ба- базису такое соответствие взаимно однозначно. Проверим выполнение условий изоморфизма: 1) (х + у)' = (я?! + 2/i)ei + • • • + (хп + УпУп = (ziei + • • • + xnefn) + 2) {ахI = (ах1)е[ -\ Ь (axn)efn = а(х1е[ -\ Ь хпе'п) = ах'. х) Символ G обозначает включение данного элемента в данное множество. Запись е; Е L читается так: «е; принадлежит L».
38 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I Мы видим, что установленное соответствие между L и L' удовле- удовлетворяет условиям A), B). Теорема доказана. Замечание. Фактически доказано, что изоморфны любые два линейных пространства одинаковой размерности над одним и тем же алгебраическим полем. 2. Вследствие доказанной теоремы все действительные п-мерные линейные пространства изоморфны действительному координатному пространству Кп\ все комплексные n-мерные пространства изоморф- изоморфны комплексному Кп. Таким образом, в теории n-мерных линейных пространств, не теряя общности, можно ограничиться изучением про- пространств Кп. 3. Теорема 2 . Линейное пространство, изоморфное п-мерному, само является п-мерным. Доказательство. Пусть дано n-мерное линейное простран- пространство L и пусть L' — пространство, изоморфное L. Докажем сначала, что при линейном изоморфизме образом нулевого элемента в Е L явля- является нулевой элемент пространства V'. Для этого возьмем произволь- произвольный элемент a' Е U и его прообраз a Е L. Так как а = а + #, то а' = (а + 0)'. C) Но по определению изоморфизма (а + 0)' = а' + 0'. D) Из C) и D) следует: а' + 0' = а'. Поэтому образ в' элемента в является нулевым элементом пространства V. Покажем далее, что если в L взять независимую систему векторов, то их образы будут независимыми векторами в L'. Пусть а, 6, ..., q — независимая система в L. Рассмотрим соотно- соотношение aaf + /3bf + -- + яЯ' = 0'. E) По определению изоморфизма равенство E) можно переписать так: (аа + РЬ + • • • + xq)' = в1. А так как прообразом нулевого элемента является нулевой вектор из L, то аа + Pb + -- + xq = в. F) В силу линейной независимости векторов а, 6, ..., q в L из F) следует, что а = р = ... = к = 0. G) Таким образом, из E) вытекает G); значит, векторы а1\Ь'\ ..., q' неза- независимы в L''. Так как пространство L является n-мерным, то в нем
§ 11] КОМПЛЕКСНОЕ И ДЕЙСТВИТЕЛЬНОЕ ПРОСТРАНСТВА 39 есть п линейно независимых векторов. Их образы в L' также незави- независимы. Значит, размерность L' не меньше, чем п. В этом рассуждении можно поменять ролями L и L' и тогда получится, что размерность L не меньше, чем размерность L'. Поэтому размерность L' равна п и теорема доказана. Следствие 1. Конечномерные пространства разных размерно- размерностей не изоморфны. Следствие 2. Бесконечномерное пространство не изоморфно никакому конечномерному. § 11. Соответствие между комплексными и действительными пространствами 1. Конечномерные комплексные и действительные линейные про- пространства находятся в некотором соотношении, смысл которого будет сейчас выяснен. Начнем с рассмотрения примера. Геометрические векторы, расположенные на одной прямой, обра- образуют одномерное действительное линейное пространство. Это связано с тем фактом, что посредством умножения на действительное число произвольный ненулевой вектор можно преобразовать в любой другой коллинеарный ему вектор. Геометрические векторы, расположенные на плоскости, образуют двумерное действительное пространство. Здесь уже нельзя фиксиро- фиксированный вектор преобразовать путем умножения в любой другой. Запас действительных множителей слишком мал по сравнению с разнообра- разнообразием векторов, входящих в это пространство, и потому два вектора могут оказаться линейно независимыми. Запас комплексных множителей вдвое богаче. Поэтому умножение векторов на комплексные числа можно определить так, что совокуп- совокупность геометрических векторов на плоскости превратится в одномерное комплексное пространство. Для этого нужно иметь возможность путем умножения преобразовать всякий ненулевой вектор данной плоскости в любой другой вектор той же плоскости. Эта задача решается, если определить произведение геометриче- геометрического вектора на комплексное число следующим образом. Пусть а — произвольный вектор на плоскости. Будем считать, что он отложен из начала координат. Пусть далее а = p(cos </? + г sin </?) — комплексный множитель. Повернем вектор а вокруг начала координат на угол (/?, а затем умножим на действительное число р. Полученный вектор обозначим через b и положим b = aa. Складывать векторы по-прежнему будем по правилу параллелограмма. При таком определении сложения и умножения все аксиомы линей- линейного пространства соблюдаются. Чтобы убедиться в этом, достаточно
40 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I заметить, что сами комплексные числа изображаются векторами на плоскости и что у нас сложение векторов и умножение комплексного числа а на вектор а определены точно так же, как обычно определя- определяют сложение комплексных чисел и умножение комплексного числа а на комплексное число а. Поэтому в нашем случае аксиомы 1)-8) со- соблюдены, поскольку они соблюдены для комплексных чисел. Теперь какой-нибудь один ненулевой вектор образует линейно независимую систему, а любые два вектора линейно зависимы (поскольку умноже- умножение включает поворот), так что полученное комплексное пространство является одномерным. 2. Мы видим, что одномерное комплексное пространство и двумер- двумерное действительное пространство можно построить из одних и тех же предметов, именно из векторов на плоскости, причем сложение векто- векторов будет определено одинаково в обоих случаях. Умножение определяется по-разному, что неизбежно, так как раз- различны запасы множителей. Подчеркнем, однако, что умножение на действительные числа производится в этих пространствах одним и тем же способом. 3. Легко убедиться, что рассмотренный пример является частным случаем более общего явления: каждому комплексному линейному про- пространству соответствует действительное пространство вдвое большей размерности, причем соответствие хотя и не является изоморфизмом, но очень похоже на изоморфизм. Именно, справедлива Теорема. Комплексное линейное пространство Сп размерно- размерности п можно взаимно однозначно отобразить на действительное линейное пространство Ь^п размерности 2п так, что соблюдается условие (a + b)f = а' + &', A) а для действительных множителей А соблюдается условие (Аа)' = Аа'. B) Замечание. Как и в § 10, здесь штрихом помечается образ в L^n элемента из Сп. Доказательство теоремы. Согласно § 10 все комплексные n-мерные пространства изоморфны. Поэтому мы можем ограничиться рассмотрением любого из них. Возьмем в качестве Сп комплексное координатное пространство. Пусть а = {xi + гж2, х3 + гж4, . . ., ж2п-1 + ix2n\ — любой элемент из Сп. Сопоставим с ним элемент а' = {xi, х2, хз, #4, . . ., х2п-1, х2п} из действительного координатного пространства, которому мы прида- придаем роль Lin- Так как разложение комплексного числа на действитель-
§12] ЛИНЕЙНОЕ ПОДПРОСТРАНСТВО 41 ную и мнимую части производится единственным образом, то установ- установленное между Сп и L^n соответствие взаимно однозначно. Справедли- Справедливость A) и B) при действительном Л усматривается с очевидностью. Замечание. При п = 1 имеем а = {x + iy}, a' = {х, у}, что возвращает нас к исходному примеру. 4. В дальнейшем, говоря о геометрических векторах, мы будем счи- считать их элементами действительного пространства. § 12. Линейное подпространство 1. Пусть L — линейное пространство, L — некоторое множество элементов из L. Определение. Множество L в пространстве L называется ли- линейным подпространством, если соблюдены следующие условия: 1) для любых х, у из L их сумма х + у также входит в L; 2) для любого х Е L и любого числа а произведение ах Е L. Замечание. Ради краткости мы будем во многих случаях ли- линейное подпространство называть просто подпространством. 2. Пусть L — линейное подпространство в L. Операции сложения векторов и умножения их на числа, заданные в L, будем рассматри- рассматривать применительно лишь к тем элементам, которые входят в L. Тогда справедлива Теорема \ . В линейном пространстве L каждое линейное под- подпространство L само является линейным пространством. Доказательство. По определению подпространства действия сложения и умножения на число не выводят за пределы L. Аксиомы линейного пространства 1)-2) и 5)—8) заведомо выполнены в L, так как они выполнены вообще для всех элементов L. Поэтому для дока- доказательства надо проверить только аксиомы 3) и 4), то есть, установить, что вместе с каждым элементом х из L в подпространство L входит противоположный элемент —х и что в G L. По второму условию определения подпространства имеем -х = (-1) • х е I. Применяя первое условие, получаем в = х + (-х) е L. Теорема доказана. 3. Пересечением некоторой совокупности множеств называется со- совокупность тех элементов, которые одновременно принадлежат всем
42 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I рассматриваемым множествам. Пересечение двух множеств Ли В обо- обозначается символом ЛГ\ В. Эту запись мы неоднократно используем ниже. Теорема 2. Пересечение любой совокупности подпространств данного линейного пространства L тоже является линейным подпро- подпространством. Доказательство для простоты изложения проведем в случае двух подпространств L\ и L^. Пусть L% = Li П L2, а векторы х, у принадлежат L%. Рассматривая х, у как элементы Li, по определению подпространства находим, что х + у Е Li, ax Е Ь\ (а — произвольное число). Точно так же х + у Е L^^ax Е L^. Но это значит, что х + у Е Ь%, ах Е L3, поэтому Ь% удовлетворяет определению подпространства. Теорема 2 доказана. 4. Примеры подпространств. 1) Множество L, состоящее только из одного нулевого элемента в данного пространства, образует его подпространство. Действительно, в + в = в G L, ав = в G L. 2) В п2-мерном пространстве квадратных п х n-матриц множество симметрических матриц ||ai/e||5 то есть, таких, что ац~ — аы-> образует подпространство. Множество кососимметрических матриц, характеризующихся тем, что dik = —dkij также образует подпространство в пространстве п х п-матриц. 3) В пространстве всевозможных функций, заданных на отрезке Tl ^ Т ^ Г2, каждое из следующих множеств образует линейное под- подпространство: а) функции, непрерывные в некоторой внутренней точке то интер- интервала Т\ < Т < Т2] б) функции, непрерывные в интервале т\ < т < т<ь\ в) функции, непрерывные на всем отрезке [ti, T2]; г) функции, непрерывные на отрезке [ti, t^\ вместе с их производ- производными до порядка N включительно, где N — произвольное целое поло- положительное число; д) функции, имеющие на отрезке [ti, T2] производные всех поряд- порядков; е) всевозможные многочлены, рассматриваемые на отрезке [ti, T2]; ж) многочлены, степени которых не превосходят фиксированного целого числа N > 0. В примере 3) каждое из перечисленных выше подпространств со- содержится в предыдущем, и все они, за исключением последнего, бес- бесконечномерны (последнее имеет размерность N + 1).
§13] ЛИНЕЙНАЯ ОБОЛОЧКА 43 з) Зафиксируем на отрезке [т\, тг] произвольное множество точек Л. Функции, равные нулю в точках множества Д, также образуют подпро- подпространство. В качестве упражнения предлагаем читателю выяснить, как зависит размерность этого подпространства от выбора множества Л. 4) Пусть L — трехмерное пространство геометрических векторов в обычном евклидовом пространстве. Будем считать, что векторы от- отложены из начала координат. Рассмотрим все векторы, расположенные в какой-нибудь плоскости, проходящей через начало координат. Такие векторы образуют подпространство. Доказательство того, что перечисленные выше подпространства действительно удовлетворяют определению п. 1, предоставляем чита- читателю. 5. Укажем примеры подмножеств линейного пространства, кото- которые не являются подпространствами. а) В трехмерном пространстве геометрических векторов рассмот- рассмотрим совокупность векторов, концы которых лежат в фиксированной плоскости, не проходящей через начало координат. Они не образуют подпространства, так как и сумма двух векторов, и произведение век- вектора на любое число (ф 1) уже не входят в это подмножество. б) В этом же пространстве рассмотрим векторы, концы которых лежат на поверхности конуса с вершиной в начале координат. Про- Произведение любого вектора из рассматриваемого множества на любое число снова принадлежит этому множеству. Тем не менее, указанное множество не является подпространством, так как операция сложения, вообще говоря, выводит за его пределы. § 13. Линейная оболочка 1. Пусть в линейном пространстве L дана система векторов Oi, . . . , пк. Определение. Множество всевозможных линейных комбина- комбинаций вида х = ахо1 Н Ь акак называется линейной оболочкой данной системы и обозначается сим- символом L(ai, . . ., ак). Иногда говорят, что Ь(а±, . . ., ак) — линейная оболочка, натянутая на векторы ai, ..., а&. Теорема 1. Линейная оболочка любой системы векторов явля- является линейным подпространством в пространстве L. Доказательство. Возьмем произвольные векторы х и у из линейной оболочки L(ai, . . ., а&): х = ахо1 Н Ь акак G L(alj . . ., а*), у = /3iai Н Ь ркак е L(oi, . . ., ак).
44 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I Тогда х + у = (c*i + /3i)ai Н Ь (ал + ^)afc G L(au . . ., ол). Кроме того, для любого числа Л имеем Хх = (Aai)oi Н Ь (Хак)ак G L(ai, . . ., a*). 2. Замечание. Линейная оболочка L(ai, . . ., ак) может сов- совпасть со всем пространством L (например, если ai, ..., ак — базис bL). 3. Теорема 2 . Если каждый вектор системы с\, ..., сш линей- линейно выражается через векторы системы ai, ..., akj то L(cb . . ., ст) С L(oi, . . ., a^I). Доказательство. Пусть х Е L(ci, . . ., cm), т. е. выражается через ci, ..., cm. Тогда, согласно свойству 6) п. 2 §4, вектор х вы- выражается через ai, ..., а/.. Следовательно, х G L(ai, . . ., a^). Таким образом, L(cb . . ., ст) С L(oi, . . ., ak). Следствие. Линейная оболочка любой подсистемы данной системы векторов включается в линейную оболочку всей данной системы. Теорема 3. Если система ai, ..., ak имеет ранг г > 0, то всякая ее линейно независимая подсистема, состоящая из г векторов, является базисом в линейной оболочке Ь(а±, . . ., ак)- Доказательство. Система а\, ..., ак ранга г (г > 0) имеет линейно независимую подсистему, состоящую из г векторов. Предположим для определенности, что линейно независимы пер- первые г векторов данной системы. Тогда, так как ранг системы ai, ..., ak равен г, то каждый из векторов ai, ..., ak линейно выражается через векторы ai, ..., аг. Отсюда и по теореме 2 L(oi, . . ., orj or+i, . . ., ak) С L(oi,. . ., ar). С другой стороны, по следствию из теоремы 2 L(ai, . . ., а г) С L(ai, . . ., ar, ar+i,. . ., а&). Следовательно, L(ai, . . ., ar, ar+i, . . ., a^) совпадает с L(ai, . . ., ar). Значит, каждый элемент ж из L(ai, . . ., а/.) разлагается по ai, ..., ar. Поэтому и вследствие независимости векторов ai, ..., ar они состав- составляют базис в L(ai, . . ., a/.). Теорема 4. ?сди рапг системы ai, ..., ak равен г, mo L(ai, . . . . . ., a^) является г-мерным подпространством. г) Символ С обозначает включение первого из указанных множеств во вто- второе. Запись вида Л С Б читается «Л содержится в Б» (при этом не исклю- исключено, что Л совпадает с Б).
¦13] ЛИНЕЙНАЯ ОБОЛОЧКА 45 Доказательство. Предположим, что г > 0. Тогда по преды- предыдущей теореме в L(ai, . . ., аи) имеется базис из г элементов. Отсюда и по теореме из п. 4 §8 L(ai, . . ., аи) имеет размерность, равную г. Предположим, что г = 0. В этом случае а\ = . . . = аи = в. Но то- тогда L(ai, . . ., а&) включает только # и, следовательно, имеет размер- размерность 0. Рис. 1. 4. Рассмотрим примеры. 1) Пусть а, 6, с (а ф в) — геометри- геометрические векторы, лежащие на одной прямой. В этом случае L(a, 6, с) = = L(a) (рис. 1). Здесь L(a) — одномерное подпространство, которое состоит из всех векторов, лежащих на данной прямой; вектор а в этом подпространстве составляет базис. Рис. 2. 2) Пусть а, 6, с — геометрические векторы, причем а и b не колли- неарны, с = а + Ь. В этом случае L(a, 6, с) = L(a, 6) (рис. 2), так что произвольный вектор х G L(a,b,c) представляется в виде х = аа + (ЗЬ. Здесь L(a, b) — двумерное подпространство, которое состоит из всех векторов, компланарных с векторами a, b. Векторы a, b составляют базис в L(a, b).
46 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I 3) Пусть функции 1, т, г2, ..., rN рассматриваются как элементы линейного пространства L непрерывных функций, заданных на отрез- отрезке [ti, т2]. Тогда L(l, т, г2, . . ., rN) есть подпространство L, состоя- состоящее из всех многочленов степени не выше N. 5. В заключение отметим одно очевидное, но важное предложение: в конечномерном пространстве всякое подпространство является ли- линейной оболочкой некоторой системы элементов. Для доказательства достаточно заметить, что в п-мерном пространстве L всякое подпространство L конечномерно (причем име- имеет размерность ^ щ это ясно, так как максимальное число линейно независимых элементов в L не может быть больше, чем в L). Но в та- таком случае либо L нульмерно, и тогда L = L@), либо L имеет базис #1, ..., qr, и тогда L = L{qu . . . , qr). В последнем случае подпространство L состоит из тех и только тех векторов, которые имеют вид х = t1q1 Л Ytrqr, A) где ?]_, ..., tr — произвольные числа. Пусть в пространстве L имеется базис ei, ..., еп, причем х = xiei Н Ь хпеп, qi = qua + q2ie2 H h qni^n (здесь г — 1, ..., г; х\, ..., хп — координаты вектора х; q\i,qii•>••••> Чпг — координаты вектора qi). Тогда формулу A) можно заменить соотношениями в координатах B) Соотношения вида B) называются параметрическими уравнения- уравнениями подпространства L(</i, . . ., qr). § 14. Сумма подпространств. Прямая сумма 1. Пусть в линейном пространстве L даны два линейных подпро- подпространства L\ и L2. Обозначим через L множество всех векторов ж, представимых в виде X = Х\ + Х2, где х\ G Li, X2 Е ^2 (рис. 3). Легко убедиться, что L есть линейное подпространство в L. В самом деле, возьмем вместе с х G L еще вектор ж' G L, т.е. где ж^ G Li, ж2 G L2; тогда вектор
¦14] СУММА ПОДПРОСТРАНСТВ. ПРЯМАЯ СУММА 47 принадлежит L, так как х\ + х[ Е Li, Х2 + х2 G ^2- Кроме того, «Ж2 G L, так как aa?i G Li, аж2 G ^2- L2 = L Рис. 3. Подпространство L называется суммой подпространств L\ и L^ и обозначается так: L = L\ + L2. На рис. 3 показан частный случай, когда L = L трехмерно, L\ и Li двумерны. 2. Понятие суммы подпространств непосредственно переносится на любое число слагаемых. Именно, пусть в пространстве L даны под- подпространства Li, ..., L&; тогда их сумма L = Li + L2 H hLfe есть линейное подпространство, состоящее из всех векторов вида х = хх Л V хк, где хх е Lb ..., хк е Lk. A) 3. Определение. Если для каждого х G L разложение A) единственно, то L называется прямой суммой подпространств Li, ... ...,Lk. Для обозначения прямой суммы мы будем пользоваться знаком 0, например: L = Li 0L2 0 •••0Lb Мы будем употреблять знак 0 в тех случаях, когда нужно подчерк- подчеркнуть, что речь идет о прямой сумме. В качестве примера на рис. 4 показана прямая сумма одномерных пространств L\ и Li- Отметим, что сумма L\ + L2 на рис. 3 не является прямой суммой. В двух следующих пунктах да- даются условия, необходимые и доста- достаточные для того, чтобы сумма под- подпространств была прямой суммой. рис 4. 4. Теорема 1. Сумма L = L\ + • • • + Lk является прямой сум- суммой подпространств Li, ..., Lk тогда и только тогда, когда ни одно из подпространств Li, ..., Lk не имеет общих элементов, кроме в, с суммой остальных.
48 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I Доказательство. 1) Пусть дано, что пересечение каждого из рассматриваемых подпространств с суммой остальных состоит только из нулевого вектора в. Докажем, что L = L\ 0 L2 0 . . . 0 L^. Предпо- Предположим, что для вектора х G L существуют два разложения: X = Х\ + Х2 + ' ' ' + Xk , X = ~Xi + ~Х~2 + ' ' ' + ~Xk •> B) где Xj G Lj, ~Xj G Lj. Нужно проверить, что Xj = Xj C) для каждого из номеров j. Из B) имеем в = (ж1 - хг) + (х2 - х2) Н Ь (ж* - жл). D) Положим 2/i = — (afi — a?i). Тогда 2/i = #i — x"i G Li,|/i = (^2 — Ж2) + + . . . + (~хк ~ хк) e L2 + . . . + L/e, и потому yx = 0, то есть, ^i = х\. Далее, вводя у2 = — (x~2 — х2), пользуясь равенством D) и тем, что L2 П (Li + L3 + h Ь^) = 0, получаем ж2 = ж2. Аналогично доказываются остальные равенства C). 2) Пусть дано, что для любого х G L разложение A) единственно. Покажем, что, например, L\ не имеет с L2 + • • • + L& общих элементов, кроме в. Предположим противное, т.е. что есть z ф в такой, что z G G Li, z G L2 + • • • + Lk. Но в таком случае z = z2 + • • • + Zk, где %2 G L2, ..., Zk G Lk. Поэтому можно написать где z\ G Li, z2 G L2, ..., Zk G L/,. С другой стороны, Таким образом, для в G L получились два разных разложения ви- вида A), что противоречит условию. 5. Теорема 2. L = Li + --- + L^ является прямой суммой под- подпространств Li, ..., L& в том и только в том случае, если всякая система ненулевых векторов ai, ..., а&, взятых по одному из каждо- каждого Lj {т.е. dj G Lj, j = 1, ..., к), линейно независима. Доказательство. 1) Пусть L является прямой суммой подпро- подпространств Li, ..., L&. Возьмем произвольные ненулевые векторы ai, ... . . ., dk по одному из каждого Lj (ctj G Lj). Докажем, что они линейно независимы. Предположим, что система ai, ..., а/, зависима. Тогда один из этих векторов линейно выражается через остальные. Будем считать для определенности, что а\ линейно выражается через а2, ... . . ., dk- Но в таком случае этот вектор принадлежит и Li, и сумме L2 + . . . + Lkj что противоречит теореме 1. 2) Пусть любая система ненулевых векторов ai, ..., а/., взятых со- соответственно из Li, ..., L&, линейно независима. Докажем, что L = = Li + • • • + Lfc есть прямая сумма. Предположим противное. Тогда
§ 14] СУММА ПОДПРОСТРАНСТВ. ПРЯМАЯ СУММА 49 по теореме 1 одно из подпространств Li, ..., L& имеет общий нену- ненулевой вектор с суммой остальных. Пусть, например, ненулевой век- вектор а\ принадлежит L\ и L2 + • • • + Lk. Тогда а\ — а2 + • • • + а'к (а2 G L2, ..., afk G Lk). Вместо последнего соотношения можно напи- написать а\ = ?2^2 + • • • -\-Skdk, считая Si = 0 в случае а\ — О и беря в этом случае в качестве а^ любой вектор из L^, лишь бы он не был равен #; если же а\ ф #, то будем считать Si — 1 и а,{ — а\. Тем самым указаны ненулевые векторы ai, ..., а&, а^ G L^, которые связаны линейной зависимостью. Мы получаем противоречие с усло- условием теоремы. 6. Если само пространство L разложено в прямую сумму своих подпространств Li, ..., L&, то каждый вектор х разлагается и притом единственным образом, на компоненты xi, ..., Xk, лежащие соответ- соответственно в Li, ..., Lk. В частности, если ei, ..., еп — базис в L, то L разлагается в прямую сумму одномерных пространств: L = L\ 0 • • • 0 Ln, где Li — линейная оболочка базисного вектора в{ (т. е. Li состоит из векторов, которые получаются умножением в{ на всевозможные числа). 7. Теорема 3. Пусть в линейном пространстве L имеются под- подпространства Lk и Li, размерности которых соответственно равны к и I. Если их пересечение имеет размерность т, то размерность их суммы Lk + L\ равна г = к + / — т 1). Для доказательства теоремы 3 нам потребуется Лемма. В п-мерном пространстве всякую независимую систему векторов в числе, меньшем чем п, можно дополнить до базиса. Доказательство леммы. Пусть е±, ..., е& — независимая система векторов, к < п. Найдется по крайней мере один вектор e&_|_i такой, что ei,..., е&, e&_|_i — тоже независимая система. Если бы такого вектора e&_|_i не было, то любой вектор из L можно было бы выразить через ei, ..., е&, что противоречит условию к < п. Если к + 1 < п, то рассуждение можно повторить и добавить к си- системе еще один вектор, не нарушая линейной независимости. Так мож- можно продолжать до тех пор, пока число векторов в системе достигнет щ тогда она превратится в базис. Лемма доказана. Доказательство теоремы 3. Положим Lm = Lk П L\ и выберем в подпространстве Lm базис ei, ..., ет. Используя лемму, дополним его до базисов в подпространствах Lk и L\\ еь . . ., em, em+i, . . ., ек — базис в Lk; еь . . ., em, e/m+1, . . ., e\ — базис в L/. В частности, при т = 0 сумма Lk + Li будет прямой.
50 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [Гл. I Сопоставляя определение суммы подпространств с определением линейной оболочки (см. § 13), найдем, что Lk + Lt = L(eb . . ., em, em+b . . ., ekj e'm+1, . . ., e\). E) Докажем, что векторы еь . . ., em, em+i, . . ., ek, e'm+1,. . ., e\ F) линейно независимы. Предположим противное. Пусть существует нетри- нетривиальная зависимость -\ Ь атет + a+ Ь акек + ак+1е'т+1 -\ Ь аге\ = в. G) Среди чисел o^+i, ..., аг есть отличные от нуля, иначе были бы линейно зависимы векторы ei, ..., em, em+i, ..., ekj образующие базис в Lk. Положим ak+1e'mJtl + • • • + аге\ = хфв. (8) Из (8) следует, что х Е L/, а из G) следует, что х G Lk, поэтому х G G LiilLk. Следовательно, х линейно выражается через векторы ei, ..., ет. Таким образом, имеется соотношение вида aA+ie'm+1 Н Ь arej = р1е1 -\ h /3mem. (9) Равенство (9) означает нетривиальную линейную зависимость меж- между векторами ei, ..., em, e^+1, ..., ej, что невозможно, поскольку ука- указанные векторы образуют базис в L/. Тем самым мы получили противо- противоречие, и независимость векторов F) доказана. Теперь соотношение E) означает, что векторы F) образуют базис в Lk + L/. Следовательно, размерность Lk + L\ равна числу векторов в системе F), то есть, чис- лу г = к + / - т. Теорема 3 доказана. 8. Теорема 4. Размерность прямой суммы подпространств рав- равна сумме размерностей слагаемых. Объединение любых базисов, вы- выбранных по одному в каждом слагаемом, образует базис в прямой сум- сумме. Доказательство. Если слагаемых два, то первое утверждение теоремы 4 вытекает из теоремы 3 с учетом теоремы 1, вследствие ко- которой т = 0. Второе утверждение теоремы 4 в случае двух слагаемых следует из доказательства теоремы 3, точнее, из того факта, что система век- векторов F) независима (в записи системы F) теперь нужно положить т = 0 и вычеркнуть векторы ei, ..., em). Заметим далее, что если L\ + L^ + L3 + • • • + Lp есть прямая сумма, то L\ + L2, L\ + L2 + L3 = [L\ + L2) + L3 и т. д. также являются пря- прямыми суммами. Поэтому в общем случае оба утверждения теоремы 4 доказываются по индукции.
§ 14] СУММА ПОДПРОСТРАНСТВ. ПРЯМАЯ СУММА 51 9. Отметим, наконец, следующее сочетательное свойство для пря- прямых сумм: если Ь = Ьг®Ь, (I) ь = ь2@---@ьк, (ii) то L = Li 0L2 0 •••® Lk. (Ill) Доказательство. Пусть х — любой элемент L. Имеем: х = = х\ + х, где х\ Е Li, ж Е L. Так как ж Е L, то ж = ж2 + • • • + Xk, где ж2 G L2, ..., ж^ G L^. Таким образом, для любого х G L имеем Ж = #1 + Х2 ~\ \~ Хк, (*) где Х{ G L^. Обратно, из (*) следует х G L. Докажем единствен- единственность (*). Пусть X ^ Х-^ ~~\~ Х^ ~т~ ' ' ' ~т~ Xк , X^ ^ -L/^ • Отсюда х = #i + ж'; здесь х' = ж2 + • • • + х'к. Следовательно, х' G G L. Поэтому и согласно определению (I) получаем х[ = xi, x' = х. Из последнего равенства и по определению (II) находим х\ = Х{ для г = 2, ..., к. Тем самым (III) доказано. Установленным свойством приходится пользоваться в случаях, ко- когда разложение пространства (или подпространства) L в прямую сум- сумму производится последовательно: L = L\ 0 Z/, L' = L2 0 L" и т.д. (см., например, гл. VII, § 10).
ГЛАВА II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ. ПРЕОБРАЗОВАНИЯ КООРДИНАТ § 1. Сокращенная запись суммирования 1. В дальнейшем часто встречаются суммы, в которых слагаемые обозначены одной буквой с индексами, например, аш + ftm+i + • • • • • • + ам- В таких случаях удобно применять сокращенное обозначе- обозначение суммирования: 0"т ~Ь 0"т-\-1 ~\~ ' ' ' ~\~ Q> N = г=т га^г^Л/ (читается: «сумма ai от г = т до г = TV»). 2. Свойства знака суммирования. N 1) Е а — ^а5 поскольку здесь повторяется TV одинаковых слагае- г=1 мых, равных а при любом г. 2) Общий множ;итель мож;но выносить за знак суммы: N N N N N 4) Величина суммы не зависит от того, какой буквой обозначен ин- индекс суммирования: N N N / j OLi = CLm + ат+1 + * * * + O>N — 1 + aN — / J 0>j — / j 0>k- i=m j=m k=m 5) Если суммирование производится по двум различным индексам, каждый из которых меняется независимо от другого, то порядок сум- суммирования безразличен: N2 \ N2 j=rri2 При суммировании по разным индексам скобки обычно опускают и Мг ( N2 \ Мг N2 вместо Е I E aij I пишут Е Е ач-> подразумевая, что сла- i—vn\ \^j=m2 J i=mi j=m2 гаемые aij сначала суммируются по j при фиксированном г (внутрен-
§ 1 ] СОКРАЩЕННАЯ ЗАПИСЬ СУММИРОВАНИЯ 53 няя сумма), затем полученные величины суммируются по г (внешняя сумма). Пятое свойство распространяется на случай суммирования по трем или большему числу разных индексов. Отметим, что если пределы изменения одного индекса зависят от другого индекса суммирования, то при перемене порядка суммирова- суммирования пределы изменения каждого из индексов, вообще говоря, стано- становятся другими; в частности, п п п j i=l j=i l^i^j^n j=l i=l 6) При суммировании по двум (или нескольким) индексам можно выносить из под знака внутренней суммы множитель, не зависящий от индекса внутреннего суммирования: Мг N2 Мг N2 2 ? aiJbi= Л bi Y1а^- i=mi j=m2 i=mi j=m2 Перечисленные выше свойства знака ^ непосредственно вытекают из правил арифметических действий и часто используются в дальней- дальнейшем. 3. Для сокращения записи условимся, что если пределы изменения индекса суммирования не указаны, то подразумевается суммирование от 1 до п, например: Кроме того, если суммирование от 1 до п ведется по нескольким индек- индексам, не зависящим друг от друга, то мы будем писать один знак суммы и под ним все те индексы, по которым идет суммирование, то есть, N п п п i,j,k г=1 э = 1 к=1 Дело в том, что ниже чаще всего встречается суммирование в пре- пределах от 1 до п, где п — размерность рассматриваемых пространств. Условимся, наконец, что если индексы суммирования под знаком суммы совсем не указаны, то это значит, что суммирование произво- производится по всем тем индексам, каждый из которых под знаком суммы встречается два раза, причем по каждому из таких индексов ведется суммирование от 1 до п. Например, ^2 a2b2 -\ h anbn] n n n n / J A-iCLijXj = У ^ У ^ AiCLijXj = у ^ J\{ у ^ CLij
54 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [Гл. II Обратим внимание на внутреннюю сумму в правой части последнего равенства. Общий член этой суммы зависит от двух индексов, но суммирование ведется только по одному из них (по индексу j), так что результат суммы зависит от другого индекса (от номера г). п Полагая у{ = ^ °>ijxj и пользуясь сокращенными обозначениями, можно написать У i = Индексы, по которым ведется суммирование, часто называют немыми или заглушёнными. Согласно свойству 4) п. 2 обозначе- обозначение заглушённых индексов можно изменять в процессе выкладок, например, iaxa, г = 1, ...,n. A) Индексы, по которым суммирование не производится, обычно называют свободными. Важно следить за тем, чтобы свободные индексы в правой и левой частях каждого равенства были обозначены одинаково. Так, например, равенства A) можно заменить следующей эквивалентной записью: Ук = ^2akjXj = ^аьжа, к = 1, . . ., п, но нельзя заменять обозначение свободного индекса только в одной какой-нибудь части равенства. Ниже мы увидим (см. гл. V), что во многих случаях индексы удобно ставить сверху (ж-7, агк и т.п.). При этом следят за тем, чтобы в процессе выкладок нижние свободные индексы оставались нижними, верхние свободные индексы оставались верхними. В дальнейшем будут встречаться суммы, под знаком которых имеется несколько заглушённых индексов. При употреблении таких выражений независимые заглушённые индексы необходимо обозначать различными буквами. Например, Индексы j и /i остались свободными (это значит, что предыдущая строчка заменяет п2 равенств). 4. Замечание. В литературе широко употребляется еще более краткая запись, при которой опускают не только пределы сумми- суммирования и указание индексов, но и сам знак суммы. При такой системе записи считают, например, что к=1 Однако такая запись требует от читателя значительного навыка, и мы опускать знак суммы не будем.
ПРОИЗВЕДЕНИЕ ПРЕОБРАЗОВАНИЙ МАТРИЦ 55 § 2. Линейное преобразование переменных. Произведение линейных преобразований переменных и произведение матриц 1. Пусть xi, ..., хп — упорядоченный набор независимых пе- переменных. Пусть дана т х п-матрица: hi ... bin В = Напишем соотношения Л \-Ь1пхп, A) ~г * * * ~г Ут = t>n где через у\,..., уш обозначены численные значения правых частей A); ясно, что 2/i, ..., уш изменяются в зависимости от xi, ..., хп. Система соотношений A) называется линейным преобразованием переменных xi, ..., хп в переменные yi, ..., ут; числа Ьц~ называются коэффициентами линейного преобразования A); составленная из них матрица В называется матрицей этого линейного преобразования. Будучи заданной, матрица определяет линейное преобразование A). Замечание. Упорядоченный набор переменных xi, ..., хп можно было бы рассматривать как переменную точку координатно- координатного пространства. Точно так же можно геометрически истолковать У\-> ... 5 Ут- Однако представляется целесообразным линейное преоб- преобразование переменных определять как чисто арифметическое (или алгебраическое) понятие, не связывая с ним заранее каких-либо геометрических представлений. 2. Пусть дана р х т-матрица а\\ . . . а\Т А= ар\ . . . арг Напишем соответствующее ей линейное преобразование переменных в виде Z\ = «112/1 Н Ь °>1тУту 1 \ B) zp = apiyi H Ь артут. ) Здесь независимые переменные обозначены через yi, ..., ут, хотя соотношения B) поначалу рассматриваются вне связи с соот- соотношениями A). Вместе с тем можно считать, что yi, ..., ут в правых частях B) суть те же величины, которые определяются равенствами A) по
56 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [Гл. II переменным х\, ..., хп. В таком случае zi, ..., zv становятся функциями от независимых переменных х\, ..., хп, a yi, ..., уш получают роль посредников. Если промежуточные переменные yi, ..., уш исключить из ра- равенств A) и B), то zi, ..., zp будут выражены через xi, ..., хп явно. Чтобы провести эту операцию, нужно в правых частях B) заменить yj их выражениями A). После этого в каждом уравне- уравнении B) каждая из переменных xi, ..., хп встретится т раз. Приводя подобные члены и обозначая полученные коэффициенты через сц, Ci2, ..., напишем результат в виде Н Ь ClnXnj "j > C) -\- ' ' ' -\- CpnXn. j Таким образом, мы снова имеем некоторое линейное преобразование переменных; его матрица Сц с = р\ ... СрП Определение. Линейное преобразование переменных C), по- полученное в результате исключения ?/i, ..., ут из B) и A), называется произведением линейного преобразования переменных B) на линей- линейное преобразование переменных A). При этом р х n-матрица С называется произведением р х m-матрицы А на т х n-матрицу В. Символически: с = лв. 3. Найдем формулу, которая выражает любой элемент матрицы С через элементы матриц А и В. Для этого нужно фактически (а не на словах) произвести исключение величин у±, ..., ут из соотношений A) и B). В целях экономии выкладок запишем систему A) сокращенно в виде Уз = к=1 где j = 1, 2, ..., т соответствуют номерам уравнений. Аналогично запишем систему B): г = 1, ..., р. Теперь имеем
§2] ПРОИЗВЕДЕНИЕ ПРЕОБРАЗОВАНИЙ МАТРИЦ 57 С другой стороны, равенствам C) можно дать сокращенную запись: п Z% — 2_^ сгк^к- \0) к=1 Из D) и E) находим т Cik =У^п{-Ь-к, F) ИЛИ Cik = (lilblk + Uiibik + ' ' ' + 0>imbmk- (?) Выражение G) называется произведением г-й строки матрицы А на к-й столбец матрицы В (по аналогии с известной из аналитической геометрии формулой, выражающей скалярное произведение векторов через их координаты). Число столбцов матрицы А должно быть равно числу строк матрицы Б, иначе произведение АВ не определено. Число строк и столбцов произведения можно выразить по схеме (р х т) • (т х п) = (р х п). Два произведения АВ и В А одновременно определены тогда и только тогда, когда А и В — квадратные матрицы одинакового порядка. Замечание 1. Разумеется, произведение матриц можно было бы определить непосредственно с помощью формулы G), не учитывая ее происхождение из линейных преобразований. Замечание 2. Умножение матриц, вообще говоря, не комму- коммутативно, в чем легко убедиться на примерах. Пусть А = в = Тогда АВ = 4. Наборы переменных X = О 1 о о о о о о ф ВА = Zk запишем в виде матриц-столбцов: Y = Ут Z = Тогда формулы преобразования переменных A), B) и C) можно записать в виде матричных равенств Y = ВХ, Z = AY, Z = CX, где С = АВ.
58 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [Гл. II 5. Укажем ряд тождеств, которые выражают свойства умножения матриц: 1) А(ВС) = (АВ)С (ассоциативность); в силу этого свойства произведение трех матриц ABC можно писать без скобок; 2) (аА)В = А(аВ) = аАВ; 3) А(В + С) = АВ + АС; (В + С) А = ВА + С А. Здесь а — произвольное число, Л, Б, С — произвольные матрицы, у которых число столбцов и строк обеспечивает возможность выполнения указанных выше действий. Доказательство тождеств 1), 2), 3) проводится без труда и оста- останавливаться на нем мы не будем. 6. Нам придется употреблять еще операцию транспонирования матрицы. Эту операцию мы будем обозначать звездочкой, считая, что Л* — матрица, полученная из матрицы А заменой ее строк соответствующими (по номеру) столбцами. Имеют место очевидные тождества: 4) (Л + Б)* = Л* + Б*; 5) (аА)* = аА*. Кроме того, 6) (АВ)* = В*А*. В справедливости последнего тождества легко убедиться, если принять во внимание, что произведение А на В строится по схеме: строка А на столбец В. § 3. Квадратные матрицы и невырожденные преобразования 1. В этом параграфе мы рассмотрим более подробно линейные преобразования, при которых сохраняется число переменных. Таким преобразованиям соответствуют квадратные матрицы. 2. Напомним, что определителем или детерминантом п х п-матри- цы А = H&ijll называется величина DetA= ^2 5i1i2...inai1iai22...a,inn, A) гь ...,in где {О, если среди чисел ii, i<i, ..., in есть одинаковые; + 1, если перестановка (ii, Z2, . .., in) четная; — 1, если перестановка (ii, Z2, . .., in) нечетная. Индексы ii, %2, ..., in принимают значения 1, 2, ..., п. В формуле A) вторые индексы элементов матрицы А взяты в натуральном порядке. Для иного их расположения, а также в случаях
§ 3 ] НЕВЫРОЖДЕННЫЕ ПРЕОБРАЗОВАНИЯ 59 их повторений имеем ui,...,i»aiui,...,*»j» =<*ji,...,j»DetA B) Докажем теорему, важную для дальнейшего. Теорема. Определитель произведения матриц равен произве- произведению их определителей, то есть, Det АВ = Det Л Det Б. Доказательство. Используя A), B) и формулу F) преды- предыдущего параграфа, получаем Det АВ = Det С = ^ Sil...incill . . . апП = П, ...,гта Л -1...J-n6J-1i . ..6jnn = Det Л • Det Б, что и требовалось. 3. Квадратная матрица называется невырожденной или неособен- неособенной, если ее определитель не равен нулю. Линейное преобразование переменных х\, ..., хп в переменные у\, ..., уп называется невырож- невырожденным или неособенным, если оно имеет невырожденную квадратную матрицу. Согласно п. 2 произведение невырожденных матриц есть невы- невырожденная матрица; произведение невырожденных линейных преоб- преобразований переменных есть невырожденное линейное преобразование переменных. Невырожденная п х n-матрица А имеет ранг г — п. Это ясно, так как определитель такой матрицы является ее базисным минором. Вырожденная матрица имеет ранг г < п. Это также ясно, так как определитель вырожденной матрицы равен нулю и, следовательно, ее базисные миноры имеют порядок, меньший п (либо их нет, но тогда г = 0). В понижении ранга матрицы (сравнительно со стандартным случаем г = п) и заключается ее вырождение. 4. Пусть дано невырожденное линейное преобразование перемен- переменных с матрицей А = Ца^-Ц: Л \-а1пхп, | \ C) уп = anixi -\ Ь аппхп, I
60 линейные преобразования переменных [Гл. II Введем обозначение А = Det A По условию А ф 0. В таком случае система C) с произвольно данными 2/i, ..., уп и неизвестными xi, ..., хп имеет единственное решение. Найдем его. Для этого удобно применить формулы Крамера. Согласно этим формулам хк выражается в виде дроби, знаменатель которой есть А, а числитель получается заменой к-го столбца А столбцом из величин 2/i, • • •, Уп- Развертывая определитель, стоящий в числителе такой дроби, получим \- Апкуп), где через Aik, ..., Ank обозначены алгебраические дополнения эле- элементов к-го столбца определителя матрицы А. Таким образом, X п — А1п Н Ь D) А У1 А *и Равенства D), выражающие х\, ..., хп через 2/1, • •-, Уп из фор- формулы C), представляют собой линейное преобразование переменных; оно называется обратным для линейного преобразования C), где 2/i, ..., уп выражаются через xi, ..., хп. Обратим внимание на то, что формулы Крамера D) (при А ф 0) позволяют найти из системы уравнений C) любое из неизвестных Х{, не вычисляя остальных. Матрица преобразования D) называется обратной для (невырож- (невырожденной) матрицы А преобразования C); ее обозначают через Л. Таким образом, если А = аи ... а1п О"п1 • • • апп А = Det А ф 0, то ~А~ ' ' ' ~А~ Следует обратить внимание на то, что в матрице А~х по строкам расположены алгебраические дополнения тех элементов матрицы Л, которые в матрице Л расположены в соответствующих (по номеру) столбцах.
НЕВЫРОЖДЕННЫЕ ПРЕОБРАЗОВАНИЯ 61 5. Так как равенства D) выражают решение системы C) отно- относительно неизвестных х\, ..., хп, то подстановка выражений D) в правые части C) должна дать в результате 2/1 = 2/1, У2 = 2/2, E) Уп= Уп- Такое преобразование называется тождественным; его матрица обозначается буквой Е и называется единичной: 1 0 ... О Е = О 0 ... Поскольку произведение преобразования C) на обратное ему пре- преобразование D) есть тождественное преобразование E), то, соот- соответственно, произведение матрицы А на обратную ей матрицу А~х есть единичная матрица Е: АА'1 = Е. F) 6. Согласно п. 2 имеем из F) (DetA) -pet Л) = 1. Отсюда Det А~х ф О и матрица А~х невырождена. В таком случае решение системы D) относительно з/ъ • • • •> Уп единственно и, следовательно, совпадает с выражениями C). Поэтому подстановка выражений C) в правые части D) должна дать тождественное преобразование Х\ = Xi, Х2 = Х2, Одновременно получаем A~lA = E. 7. Итак, каждое невырожденное линейное преобразование пере- переменных xi, ..., хп в 2/i, ..., уп имеет единственное обратное линейное преобразование переменных ?/ъ •••5 Уп в х\-> •••? хп] оно также невырождено; обратное ему есть исходное преобразование. Каждая невырожденная матрица имеет единственную обратную; она также невырождена; обратная ей есть исходная матрица.
62 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [Гл. II 8. Понятия обратного преобразования и обратной матрицы мож- можно определять несколько иным способом. Именно, пусть даны два линейных преобразования переменных, которые мы запишем сокра- сокращенно: yi = YJai3X3 G) с п х n-матрицей А = \\dij\\ и ^2 (8) с п х n-матрицей В = \\bjk\\- Тогда преобразование (8) можно назвать преобразованием, обратным преобразованию G), если произведение преобразования G) на преобразование (8) есть тождественное пре- преобразование Vi = Zi (г = 1, . . ., га). (9) Соответственно матрицу В можно назвать обратной матрицей для Л, если АВ = Е. A0) Невырожденность преобразования G) и матрицы А можно не оговаривать заранее. Она неизбежно следует из A0), так как вслед- вследствие A0) (Det А) • (Det В) = 1, и поэтому Det А ф 0. Но при условии Det А ф 0 система G) с неизвестными xi, ..., хп и известными yi, ..., уп имеет единственное решение. Следовательно, выражения (8) с учетом (9), т.е. с учетом, что Zk — Ук-> должны совпасть с выраже- выражениями D). Тем самым мы возвращаемся к нашему первоначальному определению обратного преобразования и обратной матрицы. 9. Если А и В невырождены, то имеет место тождество )-1 =B~1A~1. Доказательство. Пусть В~1А~1 = С; тогда (АВ)С = (АВ)(В~1А-1) = А(ВВ~1)А-1 = АЕА'1 = = (АЕ)А'1 = АА'1 = Е. Следовательно, С = (АВ)'1 согласно п. 8; см. A0). 10. В предыдущем пункте мы воспользовались тем, что для любой п х n-матрицы А справедливо легко проверяемое тождество: АЕ = А (а также ЕА = Л), где Е — уже известная нам единичная матрица. Можно сказать, что в умножении матриц Е играет такую же роль, какую единица играет в умножении чисел. Замечание. Легко доказать, что другой матрицы с таким же свойством нет. Более того, если для какой-нибудь одной невырожденной матрицы А соблюдается равенство АЕ\ = Л, то Е\ = Е. В самом деле, Ег = ЕЕг = (А~1А)Е1 = A~X(AEX) = А'1 А = Е.
И] РАНГ ПРОИЗВЕДЕНИЯ МАТРИЦ 63 11. Вместе с произведением матриц определены натуральные степени матрицы: А2 = АА, А3 = ААА и т.д. Тем самым определено понятие многочлена от матрицы: Р(А) = а0Ап + ах А71'1 + • • • + ап-гА + апЕ, A1) где а®, •••5 ^п — числа, а Р(А) есть n x п-матрица. Принято считать, что любая п х n-матрица А в нулевой степени равна единичной п х n-матрице Е: А° = Е. Поэтому слагаемое апЕ в выражении A1) играет роль свободного члена. § 4. Ранг произведения матриц 1. Пусть даны: т х n-матрица А = Ця^'Н? п х р-матрица В = = ||&г.г1|? шхр-матрица С = ||с^-||, равная их произведению: С = ЛБ. Имеет место Теорема 1. Ранг произведения матриц не больше ранга любого из сомножителей, то есть, Rang АВ ^ Rang A, A) Rang АВ ^ Rang В. B) Доказательство. Установим неравенство B). Сначала от- отметим два тривиальных случая: 1) Если Rang Б = 0, то матрица В нулевая. Тогда С = АВ — тоже нулевая матрица, Rang G = 0 и B) соблюдено. 2) Если Rang Б —р (где р — число столбцов матрицы В), то B) также соблюдено, поскольку Rang С не превосходит число столбцов р в матрице С. Положим Rang В = г и будем теперь считать, что 0 < г < р. При таком предположении матрица В имеет некоторую систему из г базисных столбцов и еще хотя бы один столбец, не принадлежащий этой системе. Пусть для определенности базисными являются первые г столбцов матрицы В. Рассмотрим любой столбец с номером к, к > г. По лемме о базисном миноре он линейно выражается через базисные столбцы: fen Ьпк ¦ + аг Ьпг Это же выражение в краткой записи имеет вид VJS, C) 8 = 1 здесь j = 1, 2, п, а индекс к зафиксирован.
64 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [Гл. II С другой стороны, по определению произведения матриц имеем Из C) и D) п /г \ г / п \ г Cik = ^2 aii I ^2 asbis ) = ^2 \as ^2 aiibis = ^2 asCis> ^ j = l \s = l / 8 = 1 \ j = l j 8 = 1 где 1 ^ i ^ m, индекс к зафиксирован и имеет такое же числовое значение, как в формуле C). Равенства E) показывают, что в матрице С любой столбец с номером к, к > г, линейно выражается через первые ее г столбцов: С\к Си С1г Стк Cml Cmr Отсюда и в силу леммы 3 из § 6 гл. I ранг системы всех столбцов матрицы С не больше г, то есть Rang С ^ г, и неравенство B) доказано. Теперь для доказательства неравенства A) достаточно перейти к транспонированным матрицам. В самом деле, согласно свойству 6) из п. 6 § 2, С* = (АВ)* = Б*Л*. F) Из F) и вследствие установленного неравенства для второго сомножителя имеем Rang С = Rang С* ^ Rang Л* = Rang Л. Тем самым теорема доказана полностью. 2. Во избежание недоразумений полезно сделать следующее пре- предупреждение по поводу доказательства неравенства B). Как было показано, в матрице С любой столбец с номером к, к > г, линейно выражается через ее первые к столбцов. Мы не знаем, являются ли эти столбцы независимыми. Поэтому нельзя утверждать, что RangC = r. На простых числовых примерах можно убедиться, что такое утверждение не только не обосновано, но и неверно. 3. Пусть даны: произвольная т х n-матрица Л, невырожденная квадратная п х n-матрица В и невырожденная квадратная т х т- матрица В'. Имеет место Теорема 2. Ранги произведений АВ и В'А равны рангу мат- матрицы Л, то есть, Rang АВ = Rang Л, если Det В ф 0 G)
j 5 ] ПРЕОБРАЗОВАНИЕ КООРДИНАТ 65 Rang В'А = Rang Л, если Det В' ф 0. (8) Иначе можно сказать, что ранг сохраняется при умножении данной матрицы на невырожденную (слева или справа). Доказательство теоремы 2. Пусть С = А • В. Тогда Rang С ^ Rang Л по теореме 1. Но вследствие невырожденности В имеем: Л = АВВ~г = СВ~1, так что Rang Л ^ Rang С по той же теореме 1. Тем самым G) доказано. Равенство (8) доказывается аналогично. § 5. Преобразование координат при изменении базиса 1. Во многих случаях встречается необходимость данный базис заменить новым. Мы выведем сейчас формулы, по которым преоб- преобразуются координаты произвольного вектора при переходе к новому базису. 2. Пусть Ln — линейное n-мерное пространство, ei, ..., еп — его базис. Пусть е[, ..., е'п — новый базис в Ln. Разложим каждый из векторов е[, ..., е'п по старому базису; мы получим е[ = Pud + Pi2e2 H Ь e2 = P21e1 + P22e2+ ... + __, (i) Коэффициенты этих разложений составляют квадратную п х п-мат- рицу Dn ... Pi, Р = *п\ - - - *пп 3. Строка матрицы Р с номером % образована координатами вектора е\ в первоначальном базисе. Так как новые базисные векторы e'l5 ..., е'п независимы, то матрица Р невырождена, т.е. Det Р фО. A) С другой стороны, если произвольно взять матрицу Р при усло- условии A), то векторы е[, ..., е'п, определяемые равенством (I), будут независимы и, следовательно, составят базис. Таким образом, переход к любому новому базису определяется заданием матрицы Р при единственном условии ее невырожденности. 4. Пусть х — произвольный вектор из Ln. Разложим его по старому и новому базису: 3 3 Н.В. Ефимов, Э.Р. Розендорн
66 линейные преобразования переменных [Гл. II Запишем формулы (I) сокращенно в виде п р'. — \ Л Ре 7 — 1 п Отсюда и из второго разложения х имеем i 3 3 i Сравнивая это разложение с первым, найдем (I) j.-Vp..,' 3 — / ^ гЗ г") г=1 или, в подробной записи, Х2 = J — 15 • • • 1 ni 2 Н \~ Н Ь (П) Формулы (II) выражают старые координаты xi, ..., жп вектора х через его новые координаты х[, ..., х'п и представляют собой линейное преобразование переменных х[, ..., х'п в переменные х\, ... . . ., хп. Матрица этого преобразования есть Р*, т.е. получается транспонированием матрицы Р. Поэтому, обозначая через X и X' матрицы-столбцы, состоящие из старых и новых координат вектора х, можем записать формулы (II) в виде матричного равенства Х = Р*Х'. (Па) Преобразование (II) невырождено, так как DetP* = Таким образом, любому изменению базиса соответствует невы- невырожденное линейное преобразование координат каждого вектора. 5. Новые координаты вектора выражаются через его старые ко- координаты с помощью линейного преобразования, обратного преоб- преобразованию (II). Мы напишем его в виде Q12X2 - \~ *2 — Q21X1 + Q22X2 Н \~ (Ш)
§ 5 ] ПРЕОБРАЗОВАНИЕ КООРДИНАТ 67 или сокращенно п x'i = ^QijXj, i = l, . ..,п. (III) Матрица преобразования (III), которую мы обозначим через Q, обратна матрице Р*: Qn • • • Qi q= = (Р*Г1. B) Заметим, что каждый из элементов матрицы Q равен алгебра- алгебраическому дополнению элемента матрицы Р с теми же номерами строки и столбца, поделенному на Det P. Аналогично (Па) можно написать, что X' = QX. (Ill a) 6. Равенство B), связывающее матрицы Р и Q, можно переписать двумя другими эквивалентными способами; именно: P*Q = E, QP* = Е. C) Для дальнейшего полезно равенства C), в свою очередь, переписать еще в другой форме, используя для обозначения элементов единичной матрицы Е так называемый символ Кронекера Sij. По определению f 0, если г Ф j•> если г — j. Отсюда два матричных равенства C) заменяются соответственно двумя системами числовых равенств: В первом из них г-я строка матрицы Р* умножается на j-и столбец матрицы Q, а во втором к-я строка матрицы Q умножается на /-й столбец матрицы Р*. 7. Заметим в заключение, что всякое невырожденное линейное преобразование переменных х\, ..., хп в переменные х[, ..., х'п можно рассматривать как преобразование координат векторов в п-мерном линейном пространстве. В самом деле, если нам дано преобразова- преобразование (III), то мы знаем матрицу Q (Det Q ^ 0). По ней мы найдем Р* = Q~x и Р = (Р*)*. Зная матрицу Р, получим соответствующий базис е[, ..., е'п по формулам (I).
ГЛАВА III СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. ПЛОСКОСТИ В АФФИННОМ ПРОСТРАНСТВЕ § 1. Аффинное пространство 1. В линейном пространстве элементами являются векторы как объекты линейных операций. Однако во многих задачах в центре вни- внимания оказываются геометрические факты, связанные со взаимным расположением фигур (подмножеств) в рассматриваемом простран- пространстве, в то время как линейные операции отступают на задний план. Поэтому наряду с линейным пространством вводится понятие аф- аффинного пространства, элементы которого называются точками. Точки аффинного пространства определенным образом связаны с векторами линейного пространства (подобно тому, как это делается в элементар- элементарной аналитической геометрии). Условия этих связей даны в следующем пункте вместе с определением аффинного пространства. 2. Пусть дано некоторое множество Я, элементы которого будем называть точками и обозначать заглавными латинскими буквами Л, В, ..., М, ... Пусть дано также некоторое линейное пространство L. Пусть с каждой упорядоченной парой точек из Я сопоставлен вектор из L. Если паре точек Л, В соответствует вектор ж, то напишем: х = = АВ; здесь АВ есть только новое обозначение вектора х. Первая их двух точек называется началом вектора АВ, вторая — его концом. Определение. Множество Я, сопоставленное с линейным про- пространством L, называется аффинным пространством, если соблюдены следующие две аксиомы: 1) Для каждой точки Л из Я и каждого вектора х из L найдется и притом единственная точка В из Я такая, что АВ = х. 2) Если ~АВ = ж, ~ВС = у, то АС = х + у (рис. 5). Аффинное пространство называ- называется действительным или комплекс- комплексным, конечномерным или бесконеч- бесконечномерным в зависимости от того, дей- действительным или комплексным, ко- конечномерным или бесконечномерным является соответствующее ему линейное пространство L. Размерностью аффинного пространства Я называют число, равное размерности линейного пространства L.
§ 2 ] АФФИННЫЕ КООРДИНАТЫ 69 Замечание 1. Всякое линейное пространство L можно рассмат- рассматривать как аффинное пространство Я. Для этого достаточно векторы назвать точками и каждой паре векторов а, 6, рассматриваемых как точки множества Я, поставить в соответствие вектор b — a Е L. Замечание 2. Всякое аффинное пространство Я можно рассмат- рассматривать как линейное. Для этого достаточно зафиксировать какую-ни- какую-нибудь точку О пространства Я. Тогда с произвольной точкой М Е Я со- сопоставляется ее радиус-вектор ОМ. Множество радиус-векторов всех точек пространства Я и составляет пространство L. Замечание З.В дальнейшем в конкретных случаях мы каждый раз указываем, что является объектом нашего рассмотрения: аффин- аффинное или линейное пространство. Однако можно раз и навсегда усло- условиться рассматривать линейное пространство с отмеченной в нем точ- точкой. Тогда в нашем распоряжении будут и точки, и векторы. 3. Отметим два простейших свойства аффинного пространства. Теорема 1. С каждой парой совпадающих точек из Я сопостав- сопоставляется нулевой вектор из L. Доказательство. Будем считать, что А — произвольная точка и что с парой точек А А сопоставлен вектор z. Пусть х — произволь- произвольный вектор из L. Тогда по первой аксиоме аффинного пространства найдется точка В такая, что АВ = х. Применяя вторую аксиому, по- получим x + z = z + x= ~AA + lAB = ~АВ = х] следовательно, z = 0. Те о рема 2. Если АВ = х, то В А = —х. Доказательство. Пусть ВА = у. Тогда х + у =~АВ +~ЁГА = ^Л = О, откуда у = — х. § 2. Аффинные координаты 1. Будем считать, что данное аффинное пространство Я является n-мерным, и введем в нем так называемую аффинную систему коор- координат. Для этого в Я выберем произвольную точку О, которую назовем началом координат, а в соответствующем линейном пространстве L возьмем какой-нибудь базис ei,..., еп. Пусть М — произвольная точка из Я. Вместе с началом координат она определяет вектор ОМ G L, ко- который называется радиус-вектором точки М. Разлагая радиус-вектор ОМ по базису ei, ..., еп, получим ОМ = x\e\ + ж2е2 + Ь хпеп.
70 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [Гл. III Коэффициенты этого разложения х\, ..., хп называются аффинны- аффинными координатами точки М (относительно выбранной системы с нача- началом О и базисом ei, ..., еп). Обратим внимание на то, что аффинная система координат задается двумя разнородными объектами — точ- точкой О из аффинного пространства и базисом ei, ..., еп из линейного пространства. Координаты каждой точки М определены однозначно ввиду един- единственности разложения вектора ОМ по базису ei, ..., еп. 2. Пусть дана другая произвольная точка N с координатами у\,... . . ., уп. Покажем, как выражаются координаты вектора МN через аффинные координаты точек М и N. Используя аксиому 2 и теорему 2 из § 1, находим MN = МО + ON = ON - ОМ = (У1 - xi)ei + • • • + (уп - хп)еп, так что вектор МN имеет координаты у\ — х\, ..., уп — хп. Иначе говоря, чтобы получить координаты вектора M7V, нужно из координат его конца вычесть соответствующие координаты начала. 3. Сохраняя выбранный базис, перенесем начало координат из точ- точки О в точку О\. Координаты О\ в первоначальной системе обозначим через ai,..., ап и будем считать их известными. Найдем новые аффин- аффинные координаты xi, ..., хп произвольной точки М. (Старые координа- координаты точки М обозначаем через х\, ..., хп.) Имеем векторное равенство ОМ = 00! +OiM, или, что то же самое, Х!в! -\ Ь хпеп = <це! -\ Ь апеп + хгег -\ Ь хпеп. Отсюда, вследствие единственности разложения вектора по базису, на- находим Xi = Xi + CLi, i = 1, . . . , П. 4. Если начало координат остается на месте, но меняется базис, то аффинные координаты точек преобразуются так же, как координаты их радиус-векторов, то есть, по формулам § 5 гл. II. 5. Предположим теперь, что от данной аффинной системы коор- координат с началом О и базисом ei, ..., еп мы переходим к новой системе с началом О' и базисом е[, ..., е'п. При этом считаем известными ко- координаты О' в старой системе (ai, . . ., an), а также разложения век- векторов нового базиса по старому базису: Используя результаты двух предыдущих пунктов и § 5 гл. II, полу- получим формулы, выражающие старые координаты х\, ..., хп произволь- произвольной точки М через ее новые координаты х[, ..., х'п\ г- — \^ Р--г' 4- п- 7 — 1 п (Л\
ПЛОСКОСТИ 71 Наряду с формулами A) имеют место обратные формулы где Q = (P*)-1 (см. § 5 гл. II), a\ = - ? Qijaj, i = 1, ..., n. Преобразования аффинных координат неоднократно используются в дальнейшем. § 3. Плоскости 1. Пусть в n-мерном аффинном пространстве iln зафиксирована произвольная точка Л, и в соответствующем линейном пространстве Ln зафиксировано произвольное r-мерное подпространство Lr. Определение. Множество всех точек М аффинного простран- пространства, для которых AM Е Lr, называется г-мерной плоскостью, про- проходящей через точку А в направлении подпространства Lr (см. рис. 6, где г = 2). Говорят также, что Lr есть направляющее подпространство этой плоскости. Очевидно, что каж- каждая плоскость определяет одно- однозначно свое направляющее под- подпространство. Точку М называют текущей точкой плоскости. На рис. 6 пока- показаны три положения Mi, М2, М3 текущей точки М. 2. Ч ас т н ы ее л у ч а и. 1) Если г = 0, то плоскость состоит из Рис. 6. одной точки А. Поэтому каждую точку аффинного пространства мож- можно рассматривать как нульмерную плоскость. 2) Одномерная плоскость называется прямой линией (короче, пря- прямой). 3) Плоскость размерности п — 1 называется гиперплоскостью. 4) При г = п плоскость совпадает со всем пространством iln. 3. В определении плоскости выделена точка А. Докажем, что в дей- действительности все точки плоскости равноправны. Обозначим плоскость через Пг и зафиксируем произвольную точку 5 G Пг. Надо доказать, что точка М принадлежит плоскости Пг тогда и только тогда, когда В М G Lr (т. е. что любая точка В может играть роль точки А). Пусть ВМ е Lr (рис. 7). По определению плоскости АВ е Lr. Отсюда и по определению подпространства AM = АВ + ВМ G Lr, поэтому М е Пг. Обратно, если М е Пг, то AM e Lr; следовательно, = ~АМ - ~АВ G Lr.
72 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [Гл. III 4. Теорема. Всякая г-мерная плоскость в аффинном простран- пространстве сама является г-мерным аффинным пространством. Доказательство. Пусть дано аффинное пространство Я, кото- которому соответствует линейное пространство L; пусть Пг — плоскость, проходящая через точку А м Рис. 7. в направлении подпростран- подпространства Lr. Возьмем в плос- плоскости Пг две произвольные точки М, N. По опреде- определению аффинного простран- пространства им соответствует вектор MTV Е L. По определе- определению плоскости векторы AM и AN принадлежат подпространству Lr. Следовательно, MN = AN - AM e Lr. Таким образом, каждой упорядоченной паре точек М, N плоско- плоскости Пг поставлен в соответствие вектор МN из r-мерного линейного пространства Lr. При этом соблюдение для Пг первой из аксиом п. 2 § 1 вытекает из определения r-мерной плоскости, а вторая из аксиом п. 2 § 1 справедлива для Пг потому, что она соблюдается для всего аф- аффинного пространства Я. Теорема доказана. Замечание. Если плоскость проходит через начало аффинной системы координат в направлении подпространства Lr, то совокуп- совокупность радиус-векторов ее точек образует линейное пространство, по определению совпадающее с подпространством Lr. 5. Пусть в аффинном пространстве Я даны точки Ло, Ль ..., Аг (в числе г +1). Говорят, что эти точки находятся в общем положении, если они не принадлежат одной (г — 1)-мерной плоскости. Читатель легко может проверить, что точки Ло, Ai, ..., Аг нахо- находятся в общем положении тогда и только тогда, когда векторы Aq А\,... . . ., А$АГ линейно независимы (рис. 8), причем безразлично, какую из точек брать в качестве Aq (to есть, в качестве начала векторов, идущих из нее в другие точки). Из сказанного в этом пункте и из определения плоскости следует, что через систему точек Ло, А\, ..., Лг, находящихся в общем поло- положении, проходит r-мерная плоскость и притом только одна. 6. Предположим, что в пространстве iln зафиксирована какая- нибудь аффинная система координат с началом О и базисом ei, ..., еп. Рассмотрим плоскость Пг, проходящую через точку А в направлении подпространства Lr. Будем считать, что точка А имеет координаты pi, ..., рп и что Lr задается как линейная оболочка независимой системы векторов </i, ...
;3] плоскости 73 . . ., qr (см. гл. I, § 13, п. 5). Тогда радиус-вектор ОМ текущей точки плоскости можно записать в виде ТШ = ~ОА + ~АМ = ~ОА + ti<7i + '- + Trqr, A) где параметры т\, ..., тг независимо друг от друга пробегают всевоз- всевозможные числовые значения, а вектор О А = р\е\ + • • • + рп^п (рис. 9). л2 Рис. 8. Рис. 9. Разложим векторы </i, ..., qr по базису ei, ..., еп: Координаты текущей точки М обозначим, как обычно, через (#1, . . . , хп) и запишем векторное равенство A) в координатах. В результате получим п числовых равенств XI = 2 Н B) Рп Эти равенства называются параметрическими уравнениями плоско- плоскости Пг (в данной системе координат). Обратим внимание на то, что все уравнения системы B) являются линейными относительно координат текущей точки и параметров tj . Верно и обратное утверждение: геометрическое место точек, опре- определяемых уравнениями B) при всевозможных значениях tj, есть плос- плоскость, проходящая через точку А в направлении подпространства Lr = = L(</i, . . ., qr). В самом деле, уравнения B) равносильны векторному равенству A), которое означает, что вектор AM G Lr. Если для системы B) написать соответствующую однородную си- систему, то есть, pi, ..., рп заменить нулями, то мы получим парамет- параметрические уравнения направляющего подпространства плоскости Пг. 7. Пример. Пространство, изучаемое в стереометрии, является трехмерным аффинным пространством. В нем одномерные и двумер-
74 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [Гл. III ные плоскости совпадают соответственно с прямыми линиями и плос- плоскостями, понимаемыми в элементарно-геометрическом смысле. Это не- нетрудно доказать различными способами, например, воспользовавшись результатами предыдущего пункта и параметрическими уравнениями прямой и плоскости, известными из элементарного курса аналитиче- аналитической геометрии. 8. Важное замечание. В отличие от пространства, изучае- изучаемого в элементарной геометрии, в аффинном пространстве не опреде- определены метрические понятия: расстояние между точками и длины линий, площади и объемы фигур, углы и перпендикулярность. При исследо- исследовании фигур в аффинном пространстве изучаются лишь те геометри- геометрические свойства, которые не зависят от метрических понятий. Тем не менее такое исследование является содержательным и позволяет ре- решать многие задачи. 9. Прежде чем продолжить изучение плоскостей (а также других фигур в аффинном пространстве), мы изложим в следующих парагра- параграфах необходимый для этого алгебраический аппарат: системы уравне- уравнений первой степени. § 4. Системы уравнений первой степени 1. Рассмотрим систему уравнений Буквы аи, ..., атп, 6i, ..., bn обозначают известные числа, #]_,... . . ., хп — неизвестные. Числа dij называются коэффициентами системы A) и образуют т х п-матрицу А= CLml которая называется основной матрицей системы A). Будем считать в дальнейшем, что матрица Л не нулевая, то есть, что среди коэф- коэффициентов системы A) есть отличные от нуля. Числа &i, ..., Ъш называют свободными членами уравнений. Матрица aln В = называется расширенной матрицей системы A).
§4] СИСТЕМЫ УРАВНЕНИЙ ПЕРВОЙ СТЕПЕНИ 75 Всякий упорядоченный набор чисел х\, ..., хп, подстановка кото- которых вместо неизвестных обращает все уравнения системы в арифмети- арифметические тождества, называется решением системы. Система называется совместной, если она имеет хотя бы одно решение. 2. Теорема Кронекера-Капелл и. Для того, чтобы систе- система A) была совместной, необходимо и достаточно, чтобы ранг ее рас- расширенной матрицы был равен рангу основной матрицы: Rang Я = Rang A B) Доказательство. 1. Необходимость. Очевидно, что Rang Б ^ Rang A C) Обозначим через а\, ..., ап столбцы матрицы А, через b — столбец свободных членов и будем все эти столбцы рассматривать как векто- векторы координатного пространства Кт. Пусть система A) имеет решение (х\, . . . , хп). Это решение обращает уравнения в систему числовых тождеств, которые можно записать в виде одного векторного равен- равенства х\а\ + х2а2 + • • • + хпап = Ь. D) Из формулы D) следует, что векторы а\, ..., ап,Ь линейно выражают- выражаются через векторы а\,..., ап. По лемме 3 из § 6 гл. I и в силу определения ранга матрицы имеем Rang Б ^ Rang A E) Из C) и E) следует равенство B). 2. Достаточность. Пусть соблюдается равенство B). Матрица А по условию ненулевая, поэтому у нее есть базисный минор порядка г = Rang Л > 0. Допустим для определенности, что базисными являются первые г столбцов ai, ..., аг . Рассмотрим систему векторов а\, ..., ar, b. Эта система линейно зависима, ибо в противном случае Rang В = = г + 1 > г. Поэтому вектор b выражается через линейно независимые векторы ai, ..., аг (см. гл. I, §6, лемму 2): b = Aiai + h \rar. F) Положим x\ = Ai, ..., xr = Ar, xr+i = ... = xn — 0. G) Записав систему A) в векторной форме D) и подставив в нее вели- величины G), получим тождество F). Таким образом, система A) совмест- совместна: она имеет по крайней мере одно решение G). Теорема доказана.
76 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [Гл. III 3. Отметим частный случай, когда число уравнений равно числу неизвестных, и матрица А (в этом случае квадратная) невырождена, то есть, D = Det A = CLni Тогда система A) имеет единственное решение, которое может быть найдено по правилу Крамера: D2(b) _ Dn(b) D Хо = Хп = (8) Здесь через Dj(b) обозначен определитель, который получается из D заменой его j-ro столбца на столбец свободных членов, то есть, 11 ... aij-i 61 flij+i ... din (9) О"п1 • • • anj-i bn anj+i . . . ann Замечание 1. Если обозначить через х вектор (xi, . . ., хп), за- записанный в виде столбца, то систему A) можно представить в виде матричного уравнения Ах = 6, Aа) а формулы Крамера (8) — в виде матричного равенства х = А~гЬ. (8а) Переход от формулы Aа) к формуле (8 а) получается умножением обе- обеих частей равенства слева на матрицу Л. Замечание 2. Для практического решения систем с большим числом уравнений и неизвестных формулы (8) неудобны ввиду трудно- трудности вычисления определителей D и Dj(b). Поэтому для решения таких систем разработан ряд других методов, которые излагаются в руковод- руководствах по вычислительной математике. 4. Вернемся к рассмотрению системы A) при произвольных тип, предполагая, что соблюдены условия совместности B). Наша цель — найти все решения системы. Число г, равное рангу матриц А и В, назовем рангом системы A). Будем считать для определенности, что базисный минор матрицы А занимает в ней верхний левый угол (этого всегда можно добиться изменением нумерации неизвестных и переста- перестановкой уравнений). Обозначим этот минор через D: D = ari Минор D является базисным и для матрицы В, поэтому строки мат- матрицы В с номерами г + 1, ..., т являются линейными комбинациями
§4] СИСТЕМЫ УРАВНЕНИЙ ПЕРВОЙ СТЕПЕНИ 77 первых ее г строк (см. гл. I, § 7). Это значит, что уравнения с номера- номерами г + 1, ..., т представляют собой линейные комбинации первых г уравнений, так что система A) эквивалентна системе а12х2 Н Ь а1пхп = 6 аг\Х\ + аг2х2 + • • • + arnxn = br. Оставим в левых частях лишь те слагаемые, коэффициенты кото- которых образуют базисный минор Z), все остальные члены перенесем на- направо: -\ Ь а1гхг = &i - a a_! nr* - I ... I g~i nr* r\ /7 _, /у» _, ... /Tr T* nr* J_ «Лу J_ | | Kaj qn qn JU nr* \J nr* Kaj nr* T*—I— _L **J T*—I— J_ ^ T^TX •^ T Неизвестные #r+i, ..., xn будем называть свободными. Им можно придавать любые числовые значения. Тогда неизвестные xi, ..., хг однозначно определятся из системы A1) по формулам Крамера: Г) //> \ Xj = — y> * A2^ Здесь, как и выше, через а^ обозначены столбцы основной матрицы А системы A0), через b — столбец свободных членов системы A0); символ Dj определяется формулой (9), в которой нужно п заменить на г и вместо вектора b подставить вектор b — xr+\ar+\ — • • • — хпап. Пользуясь свойствами определителей, разложим числитель форму- формулы A2). Мы получим = Dj(b) Pj(ar+i) Dj(an)x j = l,...,r. A3) Введем обозначения j = 1, . . ., г, Тогда из A3) x\ = Pi m \ A5) Xr = Pr + Яг+l rXr+l H \~ QnrXn • J Добавим сюда еще п — г очевидных равенств хг+1 = жг+1, Л \ A6) X г\, — % п, • J
78 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [Гл. III Всю совокупность равенств A5) и A6) заменим одним векторным со- соотношением Яп1 хг Xr+i Хг+2 Хп = Pi Pr 0 0 0 + <7r+n Qr+1 г 1 0 0 хг+1 Л Ь Qnr О О A7) Формула A7) дает общее решение системы A), поскольку выражает все неизвестные xi, ..., хг, жг+ъ ..., хп через свободные неизвестные жг+1, ..., хп, которым можно придавать любые численные значения. Покажем, что при этом все возможные решения системы A) будут ис- исчерпаны. В самом деле, если х\,..., хг, хг+\, ..., хп — любое заданное решение системы A), то жг+ь ..., хп имеют определенные численные значения; подставляя их в систему A) и повторяя предыдущие выклад- выкладки, получаем равенство A7). 5. Обозначим столбец в левой части равенства A7) через х; столб- столбцы в правой части этого равенства обозначим по порядку их располо- расположения через р, </г+1, ..., qn. Тогда равенство A7) примет вид х = р + xr+1qr+1 H Ь xnqn. A8) Равенства A8) и A7) следует понимать как равенства между век- векторами координатного пространства Кп. 6. Следствие. Если система A) совместна и ее ранг г меньше числа неизвестных п, то эта система имеет бесконечное множество решений. Замечание. Выбор свободных неизвестных, вообще говоря, мож- можно делать по-разному. Однако не всякие п — г неизвестных можно при- принять за свободные. Нужно, чтобы в системе A) коэффициенты при остальных г неизвестных составили базисный минор матрицы А. § 5. Однородные системы 1. Система уравнений Н Ь а1пхп = dmixi -\ Ь атпхп = 0. называется однородной; в этом случае правые части всех уравнений равны нулю: fti = . . . = Ът = 0. B)
ОДНОРОДНЫЕ СИСТЕМЫ 79 2. Однородная система всегда совместна. С одной стороны, это вы- вытекает из теоремы Кронекера-Капелли: Rang Л = Rang Б, так как матрица В получается из Л добавлением нулевого столбца. С другой стороны, сразу видно, что система A) имеет нулевое ре- решение: Xl = . . . = хп = 0. Нулевое решение однородной системы называется тривиальным. Остальные решения, т.е. не состоящие только из одних нулей, назы- называются нетривиальными. 3. Как и раньше, будем рассматривать решения системы A) в ка- качестве векторов координатного пространства Кп. Теорема 1. Множество решений однородной системы образует в пространстве Кп подпространство размерности п — г, где г — ранг системы. Доказательство. Вследствие условия B) Поэтому в рассматриваемом случае р = в и формула A8) § 4 выражает любое решение х в виде линейной комбинации векторов </r+i, ..., qn- Обратно, всякая линейная комбинация векторов </r+i, ..., qn дает ре- решение однородной системы A). Иначе говоря, множество X всех ре- решений такой системы есть линейная оболочка векторов qr+i, • • •, qn в Кп. Следовательно, X является линейным подпространством в Кп. Теперь убедимся, что векторы qr+i, •••, qn линейно независимы. С этой целью рассмотрим матрицу Г, составленную координатами век- векторов <7Г+Ь ..., qn\ Г = Яг+11 Яп1 Япг о о Нижний минор максимального порядка матрицы Г является ее ба- базисным минором (он равен единице, т.е. отличен от нуля, и не имеет окаймляющих). Следовательно, столбцы Г линейно независимы. Тем самым линейно независимы векторы </r+i, ..., qn. Отсюда следует, что векторы </r+i, ..., qn составляют базис в X. Но число их равно п — г. Значит, размерность X равна п — г, и теорема доказана.
80 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [Гл. III 4. Пусть известна какая-нибудь линейно независимая система ре- решений в числе п — г: с1г Cn-ri С"п, — г C) Тогда любое решение х системы A) представляется в виде линейной комбинации данных решений C): х = nci H Ь тп-гсп-г; D) обратно, любая линейная комбинация вида D) дает решение. Оба утверждения сразу следуют из предыдущей теоремы. Именно, согласно этой теореме подпространство X решений системы A) имеет размерность п — г; следовательно, решения ci, ..., cn_r составляют в нем базис. Определение. Всякая линейно независимая система решений в числе п — г называется фундаментальной для системы уравнений A). Вывод. Чтобы решить однородную систему уравнений A), до- достаточно найти какую-нибудь фундаментальную систему ее решений ci, ..., сп-г. Тогда все решения системы A) даются формулой D), в которой каждый из параметров ti, ..., rn_r независимо от других пробегает всевозможные числовые значения. Замечание. Одна из фундаментальных систем решений состав- составлена столбцами матрицы Г. Эту систему решений дают формулы A4) предыдущего параграфа. 5. Пример. Рассмотрим систему уравнений ju j^ | ju 2i I *^ о «^ 4 — ^ *j Х2 — Хз + Х4 = 0, 1 = 0. / E) Здесь п = 4, г = 2. Значит, пространство решений имеет размерность п — г = 2. Следовательно, нам достаточно найти какие-нибудь два независимых решения, например: х\ =0, Х2 = 0, хз = 1, Х4 = 1; х\ =2, х2 = -1, хз = -1, Х4 = 0. Отсюда получаем общее решение системы E): Xi Х2 хз ХА = Ti 0 0 1 1 + Г2 2 -1 -1 0
§5] ОДНОРОДНЫЕ СИСТЕМЫ 81 6. Важные частные случаи. 1) Однородная система п урав- уравнений с п неизвестными: flu xi + \~ din хп = ОЛ \ F) Н \-аппхп = 0. J Относительно системы F) мы отметим только следующую теорему, которая часто используется в приложениях линейной алгебры. Теорема 2. Система вида F) имеет нетривиальное решение то- тогда и только тогда, когда ее определитель равен нулю: D = Det||aij|| =0. Действительно, в этом и только в этом случае г = Rang А < п и размерность пространства решений положительна: п — г > 0. 2) Однородная система п — 1 независимых уравнений с п неизвест- неизвестными Ь а1пхп = 0, O"n-iiXi + • • • + an-inxn = 0. Условие независимости уравнений означает, что (прямоугольная) мат- матрица А = \\dij\\ системы G) имеет ранг г = п — 1. В этом случае пространство решений одномерно (п — г = 1), и для получения общего решения системы G) достаточно найти одно ее нетривиальное реше- решение. Покажем, как это сделать. Составим вспомогательную квадратную матрицу А порядка п, ко- которая получается из матрицы А прибавлением сверху новой строки; именно: ttoi . . . ftOn an . . . а\п Un-l1 • • • fln-1ь где aoi, ..., fton — произвольные числа. Через Aqj обозначим алгеб- алгебраические дополнения элементов a^j в матрице А. Тогда величины образуют решение системы G). В самом деле, подставим величины (8) в уравнение с номером г; мы получим сумму произведений элемен- элементов одной строки матрицы А на алгебраические дополнения элементов другой строки, равную, как известно, нулю: а '1 Ас\л ~\~''' ~\~ а' An = 0 Таким образом, числа (8) действительно удовлетворяют системе G).
82 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [Гл. III Обозначим через Mj минор матрицы А порядка п — 1, который получается вычеркиванием столбца с номером j: Cllj-1 СЦ j+1 &\ Тогда Aqj = (—l)J+1Mj. Среди миноров Mj имеется по крайней ме- мере один, не равный нулю (базисный минор матрицы Л), поэтому ре- решение (8) нетривиально. Общее решение системы G) можно записать в виде где г — произвольное число. Иначе говоря, решение системы G) про- пропорционально минорам максимального порядка матрицы Л, взятым с чередующимися знаками. Иногда это записывают так: Xi : Х2 : х% : . . . = Mi : (—М2) : М3 : . . . 7. Выше, в п. 3, мы доказали, что однородная система уравнений первой степени ранга г определяет в n-мерном линейном пространстве Ln подпространство размерности п—r. Покажем, что верно и обратное. Именно, справедлива Теорема 3. Всякое подпространство размерности к в простран- пространстве Ln с данным базисом является подпространством решений неко- некоторой однородной системы линейных уравнений ранга п — к. Доказательство. Пусть в Ln даны базис ei, ..., еп и подпро- подпространство L&. Возьмем в этом подпространстве к независимых векто- векторов, которые мы обозначим е'п_к+1, ..., е'п\ используя лемму из п. 7 § 14 гл. I, дополним их до базиса в Ln: е1? . . . , еп_к, en_k+i, . . . , еп. (9) Подпространство L& является линейной оболочкой векторов e^_/,+1, ..., е'п. Поэтому вектор х из Ln лежит в L& тогда и только тогда, когда его координаты в базисе (9), имеющие номера 1, ..., п — к, равны нулю: х\ =0, г = 1, ..., п- к. A0) Формулы A0) представляют собой систему уравнений, определяющую Lk в базисе (9). Перейдем к исходному базису ei, ..., еп. Для этого воспользуемся формулами преобразования координат (см. гл. II, §5) х\ = г = 1, ..., п.
§ 5 ] ОДНОРОДНЫЕ СИСТЕМЫ 83 Отсюда получим искомую систему уравнений A1), эквивалентную си- системе A0): п = 1, . . . , п - к. A1) Так как п х n-матрица Q = ||Qij|| невырожденная, то все ее строки линейно независимы. Следовательно, ранг системы A1) равен числу ее уравнений: г = п — к. Теорема 3 доказана. 8. Как видно из проведенного доказательства, конкретная запись системы уравнений, определяющей L&, зависит от выбора базиса. Кроме того, в данном базисе данное подпространство может зада- задаваться различными однородными системами уравнений. Это ясно, по- поскольку для системы A1) имеется бесконечное множество других, эк- эквивалентных ей систем. Покажем, как можно строить такие системы. Пусть /in Я = — любая невырожденная квадратная матрица порядка п — к. Фикси- Фиксируя /, умножим уравнения A1) соответственно на числа Нц (г = 1, ..., п — к) и сложим их; затем выпишем найденные соотношения, беря / = 1,...,п — к. Мы получим однородную систему п — к п Y^ hH Yl QiJX3 = °> / = 1, . . . , П - *. A2) 2=1 j=l Если ввести числа п-к Rij = Y, Л"^> / = 1, . . ., n - *; j = 1, . . . , n, A3) i=l то система A2) запишется более просто: ijXj=0, I = 1, ..., п- к. A4) Система A4), очевидно, есть следствие системы A1). Покажем, что система A1) в свою очередь есть следствие системы A4). При каждом фиксированном j (I ^ j ^ п) формулу A3) можно рассматривать как систему уравнений с неизвестными Qij и правыми частями Rij. Решая эту систему по правилу Крамера для каждого j, находим, что п — к Qij = Y,HicRclj, A5) а=1 где матрица ||#^|| = Я — обратная по отношению к матрице Н =
84 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [Гл. III Формула A5) показывает, что коэффициенты системы A1) выра- выражаются через коэффициенты системы A4) с помощью матрицы ||#^|| совершенно аналогично тому, как коэффициенты A4) выражались че- через A1) с помощью матрицы ||Л/г||. Таким образом, системы A1) и A4) эквивалентны. Итак, по данной системе A1) мы можем получить бесконечное множество эквивалентных ей систем вида A2), посколь- поскольку бесконечно многими способами можно выбирать невырожденную матрицу Н. Замечание. Если прямоугольные матрицы систем уравнений A1) и A4) обозначить соответственно через Q и й, то две системы равенств A3) и A5) можно заменить двумя матричными равенствами Q = H~1R. Отсюда следует, что Rang R = RangQ. Иначе говоря, все системы ви- вида A4), которые мы строим по данной системе A1), имеют один и тот же ранг, равный п — к. Пример. Система Х\ + Х2 — Хз — Х4 — О, Х\ — Х2 + Хз + Х4 — О определяет в четырехмерном линейном пространстве некоторое дву- двумерное подпространство L2. Беря 11 1 М ~ 2 1 -1 получим в качестве A4) систему Xi =0, Х2 — Хз — Х4 = 0, которая определяет то же самое подпространство L2, что и данная си- система (иначе говоря, мы заменяем данные уравнения их полусуммой и полуразностью). 9. В заключение параграфа докажем, что линейное невырожден- невырожденное преобразование переменных сохраняет ранг системы уравнений A). Запишем систему A) в виде матричного равенства АХ = 0, Aа) где А = \\dij\\ есть т х n-матрица коэффициентов, X — матрица- столбец неизвестных х\, ..., хп, нуль в правой части обозначает ну- нулевую т х 1-матрицу. Пусть дана замена переменных X' = QX (см. формулы (IIIа) и (III) §5 гл. II; Q — невырожденная п х п-матрица). Тогда X = Р*Х', A6) где Р = ЦР/г/H = (О)*- Подставляя A6) в Aа), получим матрич- матричную запись рассматриваемой системы уравнений в новых переменных (АР*)Х' = 0,
§6] или подробнее НЕОДНОРОДНЫЕ СИСТЕМЫ 85 = U, г = 1, . . ., т. Матрица Р невырождена, так что Rang/IP* = Rang Л согласно п. 3 §4 гл. П. Тем самым утверждение, сформулированное в начале этого пункта, доказано. § 6. Неоднородные системы 1. Пусть дана неоднородная система где г = 1, ..., т и среди чисел bi есть отличные от нуля. Допустим, что система совместна, то есть, Rang A = Rang В = г. Пусть {х®, . . ., х^} — некоторое решение системы A). Подставив это решение в систему A), получим тождества B) Вычтем тождества B) из уравнений A). В результате получается си- система C), эквивалентная системе A): C) Положим Xj — х°- = Uj; тогда получим однородную систему Пусть для системы уравнений D) известна фундаментальная си- система решений Сп-г1 E) В таком случае, согласно результатам п. 4 § 5 любое решение си- системы D) выражается в виде линейной комбинации векторов E), то есть, Uj =r1clj -\ Ь Tn-rcn-rj, F)
86 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [Гл. III где Ti, ..., тп-г — произвольные числа. Так как Uj = Xj — х®, то из F) находим Xj = x°j + (ricij H h rn_rcn_r j), j = 1, . . ., n. G) Назовем x\, ..., ж^ частным решением системы A). Сумма, стоя- стоящая в скобках в формуле G), представляет собой общее решение си- системы D). Система D), полученная из системы A) заменой правых частей ну- нулями, называется однородной системой, соответствующей системе A). Формула G) показывает, что справедлива Теорема 1. Общее решение неоднородной системы A) представ- представляется в виде суммы произвольного частного решения этой системы и общего решения соответствующей ей однородной системы. 2. Геометрическое истолкование множества реше- решений неоднородной системы линейных уравнений. Рас- Рассмотрим n-мерное аффинное пространство iln. Зафиксируем в нем какую-нибудь аффинную систему координат. Тогда каждому решению #1, ..., хп системы A) можно поставить в соответствие точку про- пространства iln с координатами xi, ..., хп. Имеет место Теорема 2. Все решения системы A) образуют в iln плоскость размерности п — г. Доказательство. Все решения системы A) даются фор- формулой G). Ввиду независимости векторов E) эта формула есть не что иное, как параметрические уравнения некоторой плоскости размерно- размерности п — г (см. § 3, п. 6). Теорема 2 доказана. Теорема 3. В аффинном пространстве iin и в любых аффинных координатах всякая плоскость Пт может быть задана системой ли- линейных уравнений вида A) и ранга г = п — т. Доказательство. Пусть плоскость Пт проходит через точ- точку Л, имеющую координаты (ж^, . . ., ж^), в направлении подпростран- подпространства Ьш. Перенесем начало аффинной системы координат в точку Л, сохраняя прежний базис. Координаты текущей точки М в исходной системе обозначим через (х±, . . ., жп), в новой системе — через (х±, . . . . . ., хп); последние совпадают с координатами вектора AM G Lm. По теореме 3 из § 5 подпространство Lm задается некоторой однородной системой линейных уравнений ранга г = п — т: п ijXj =0, г = 1, . . ., г. Учитывая, что Xj = Xj — х®, получаем
§6] НЕОДНОРОДНЫЕ СИСТЕМЫ 87 Положив bi = ^2 а%зх% наиДем систему уравнений п ^dijXj = b{, i = 1, . . ., г, (8) j=i которая имеет тот же ранг г = п — т и определяет Пт в исходных координатах. Теорема 3 доказана. 3. Следствие. Плоскость задается однородной системой ли- линейных уравнений тогда и только тогда, когда она проходит через начало координат. 4. Важный частный случай. Гиперплоскость задается од- одним линейным уравнением а\Х\ + а2х2 + • • • + апхп = Ь. 5. Каждое из уравнений (8) можно рассматривать как уравнение некоторой гиперплоскости. Поэтому каждую плоскость размерности т можно рассматривать как пересечение некоторых гиперплоскостей в количестве т — п. 6. Если система линейных уравнений несовместна, то геометриче- геометрически это означает, что нет ни одной точки, принадлежащей сразу всем гиперплоскостям, которые задаются уравнениями системы. 7. Очевидно, что при переходе к новым аффинным координатам вид уравнения (8), задающие плоскость Пт, изменятся. Кроме того, данная плоскость Пт в данной аффинной системе координат может за- задаваться различными системами уравнений. Это ясно, поскольку для системы (8) имеется бесконечное множество других, эквивалентных ей систем. Так, например, можно взять любую невырожденную квадрат- квадратную матрицу Н = ||/if;||j г, j = 1, 2, ..., г, и написать следствия системы (8): / п \ JZ Лге* I 5Z паЗХ3 ~ &с* I = 0. (9) Если ввести обозначения г г a>ij = ^2 hiaaaj, b'i = ^2 hiaba, то уравнения (9) запишутся более просто: п A0) Система уравнений A0) не только следует из системы (8), но является эквивалентной ей (что доказывается так же, как аналогичное утвер- утверждение в п. 8 § 5).
СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [Гл. III Возможность перехода от системы (8) к разным системам вида A0) геометрически означает, что Пт можно определять как пересечение различных наборов независимых гиперплоскостей в числе п — т. Неза- Независимость гиперплоскостей следует понимать в том смысле, что ранг совместной системы A0) уравнений этих гиперплоскостей имеет мак- максимально возможное значение, т. е. равен числу уравнений (г = п — т). § 7. Взаимное расположение плоскостей 1. Пересекающиеся плоскости. Во всем этом параграфе размерности плоскостей и подпространств обозначены индексами сни- снизу. Пусть две плоскости Щ и П/ в аффинном пространстве iln име- имеют общую точку А. Примем эту точку за начало аффинной системы координат. Когда текущая точка М пробегает плоскость Щ (или П/), вектор AM пробегает подпространство L& (соответственно L/). Поэто- Поэтому вопрос о взаимном расположении двух пересекающихся плоскостей естественно связан с рассмотрением подпространств L& и L/ в вектор- векторном пространстве Ln. Используя свойства подпространств (гл. I, §§ 12-14), нетрудно уста- установить следующие факты: 1) Если плоскости Щ и П/ пересекаются, то их пересечением явля- является некоторая плоскость Пт (на рис. 10 взято к = / = 2, т = 1). Замечание 1. Не исключена возможность, что Пт состоит из одной точки (т = 0). Это видно на примере двух пересекающихся Щ \ Рис. 11. прямых или прямой и плоскости (рис. 11). В общем случае по одной точке могут пересекаться две плоскости, сумма Рис. 10. размерностей которых не превышает размерности пространства, например, двумерные плоскости в четы- четырехмерном пространстве. Замечание 2. Мы не исключаем и другого крайнего случая, ко- когда одна из двух плоскостей целиком принадлежит другой. Например, Щ С П/, к < /, тогда Um = Щ (на рис. 12 к = т = 1, / = 2). 2) Если плоскости Щ и П/ пересекаются по плоскости Пт, то суще- существует единственная плоскость Пг размерности г = k + 1 — m, содержа- содержащая Щ и П/, причем ни в какой плоскости меньшей размерности Щ и
§7] ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПЛОСКОСТЕЙ 89 П/ не могут одновременно поместиться. Направляющее пространство Lr плоскости Пг является суммой направляющих подпространств L& и L/. Эта сумма является прямой суммой тогда и только тогда, когда Щ и П/ пересекаются по одной точке (т = 0, см. рис. 13). В част- частном случае, когда к + I — т = п, роль плоскости Пг выполняет все пространство iln (при г = п = 3 см. рис. 10). Рис. 12. Рис. 13. 3) Если пересекающиеся плоскости Щ и П/ содержатся в какой-нибудь плоскости Пг, то размерность их пересечения т ^ к + + / — г. В частности, m ^ к + 1 -п A) для любых двух пересекающихся плоскостей из iln. 4) Если плоскости Щ и П/ проходят через точку А в направлении подпространств L& и L/ соответственно и если L& содержится в L/, то плоскость Щ содержится в плоскости П/. Если при этом к = /, то Щ совпадает с П/ (также и L& совпадает с L/). 2. Параллельные плоскости. Пусть теперь плоскость Щ определяется точкой А и подпространством L&, а плоскость П/ — точ- точкой В и подпространством L/. Будем считать, что / ^ &. Определение. Плоскость П^ параллельна плоскости П/, если Lk С L/. Позволим себе также говорить, что в этом случае плоскость П/ па- параллельна плоскости Щ. Замечание 1. Согласно этому определению включение Щ С П/ является частным случаем параллельности. Замечание 2. Если Щ параллельна П/, причем к = I, то L& совпадает с L/. Замечание 3. Легко убедиться, что при п = 3 частные случаи & = / = 1,& = / = 2и& = 1,/ = 2 согласуются с понятием парал- параллельности прямых и плоскостей, известным из элементарной геомет- геометрии (рис. 14). Пусть в произвольной аффинной системе координат две плоскости ПиП' одинаковой размерности заданы системами линейных уравнений. Пользуясь определением параллельности, нетрудно уста- установить следующее утверждение. Для того, чтобы U и Uf были параллельны, необходимо и доста- достаточно, чтобы соответствующие однородные системы уравнений бы- были эквивалентны.
90 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [Гл. III а) б) Рис. 14. в) В частности, две гиперплоскости параллельны тогда и только то- тогда, когда в одних и тех же координатах они задаются уравнениями а\Х\ + V апхп + 6 = 0 B) bf = 0 B') с пропорциональными коэффициентами при переменных: а\ _ _ ап '" '' а[ а п Для совпадения гиперплоскостей B) и B') необходимо и достаточно, чтобы были пропорциональны все коэффициенты их уравнений: Теорема 1. Пусть в аффинном пространстве iln даны плос- плоскость Щ и точка В. Тогда существует единственная плоскость Ufk размерности к, проходящая через точку В параллельно Щ. Если В G G Щ, то Ufk совпадает с Щ; если точка В расположена вне Щ, то плоскости Щ и I\'k не пересекаются. Доказательство настолько подготовлено предыдущим, что не требует изложения. 3. Скрещивающиеся плоскости. Определение. Две плоскости называются скрещивающимися, если они не пересекаются и не параллельны. Хорошо известно, что в трехмерном пространстве Из две прямые линии, то есть, одномерные плоскости, могут скрещиваться, тогда как прямая линия и двумерная плоскость в Из скрещиваться не могут. С повышением размерности пространства оно становится более про- просторным, в результате чего появляется возможность строить в нем
ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПЛОСКОСТЕЙ 91 скрещивающиеся плоскости разных размерностей, а не только одно- одномерные. Ниже сформулирована теорема 2, содержание которой можно рассматривать как общий прием построения скрещивающихся плос- плоскостей. Именно, пусть в аффинном пространстве iln дана плоскость П/ G < п). Возьмем произвольную плоскость Щ так, чтобы Щ и П/ не были параллельны и пересекались; плоскость, по которой они пе- пересекаются, обозначим через Пт. Пусть Пг — плоскость наименьшей размерности, содержащая Щ и П/. Мы знаем, что г = к + I — т. Теорема 2 . Если к + I — т < п, то всякая к-мерная плоскость, которая параллельна Щ и не лежит в Пг, скрещивается с П/. Следствие. Если целые числа k, /, m, n удовлетворяют нера- неравенствам О ^ т < к, 0 ^ т < /, к + / — т < п, то в iin найдутся скрещивающиеся плоскости Щ и П/ с направляю- направляющими подпространствами L k uLi, пересечение которых Lm = имеет размерность т. Доказательство теоремы 2. Так как г = к + I — т < < п, то плоскость Пг не исчерпывает собой всего пространстваiln. Это позволяет взять (с большим произволом) точку С, не лежащую в Пг. ез Рис. 15. Обозначим через П^ плоскость размерности к, проходящую через С параллельно Щ. Ясно, что П^ не содержится в Пг и что, выбирая по- разному точку С, мы можем получить любую ^-мерную плоскость, удовлетворяющую условию теоремы. (См. рис. 15, на котором к = I = = 2, г = 3, п = 4, и трехмерные плоскости условно изображены в виде параллелепипедов.) Докажем, что плоскости П/ и П^ скрещиваются. Заметим, что плоскость П^ не параллельна П/, так как в противном случае или L& С L/, или L/ С L&, что противоречит условию располо- расположения плоскостей Щ и П/.
92 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [Гл. III Теперь покажем, что П^ и П/ не пересекаются. Проведем через точ- точку С вспомогательную r-мерную плоскость П^,, параллельную Пг. То- Тогда П^ С П'г, и поэтому П^ не может пересечь П/, ибо в противном слу- случае точка их пересечения принадлежала бы параллельным плоскостям Пг и I1J,. Следовательно, П^ скрещивается с П/. Теорема 2 доказана. Пусть в n-мерном аффинном пространстве iln даны скрещивающи- скрещивающиеся плоскости Щ и П/ с направляющими подпространствами L& и L/, причем L& Г\ Li = Lm, к -\-1 — т < п. Теорема 3. Существует единственная плоскость Пг+1 размер- размерности г + 1 = (к + / — т) + 1, содержащая плоскости Щ и П/. Доказательство. Выберем произвольную точку A Е Щ и зафиксируем произвольную точку В Е П/; обозначим через Ь(ЛБ) линейную оболочку вектора Л Б (рис. 16). Допустим, что существует Lr+i = Lk какая-то плоскость П, содержащая Щ и П/; пусть L — ее направля- направляющее подпространство. Очевидно, что L должно содержать L&, L/ и L(AB), а следовательно, и сумму этих подпространств. Обозначим эту сумму через Lr+i: Lr+i = Lk + Li + L(AB) С L. Обратно, если L — любое подпространство, включающее Lr+i, то плоскость П, проходящая через точку А в направлении L, будет содер- содержать Щ и П/. В самом деле, так как A G П и L& С L, то Щ С П; так как А ей и ~АВ е L, то В е П; так как В е П и L/ С L, то П/ С П. Мы получим среди всех плоскостей П искомую плоскость Пг+1 ми- минимальной размерности г + 1 в том единственном случае, когда в ка- качестве L берется Lr+i. Подсчитаем г + 1. С этой целью рассмотрим Z/ = L& + L/ и обозначим размерность Z/ через р. По теореме 3 из § 14 гл. I имеем р = к + I — т. Ниже мы покажем, что Lr+i = V + L(AB) есть прямая сумма; поэтому размерность Lr+i равна р + 1, то есть, (r + 1) = (jfc + /-m) + l.
§7] ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПЛОСКОСТЕЙ 93 Итак, нужно установить, что Lr+i = L' 0 L(AB). Для этого до- достаточно показать, что вектор АВ не принадлежит пространству L'. Предположим противное. Пусть АВ Е L'. Тогда по определению сум- суммы подпространств существуют векторы х, у такие, что xeLk, yeLh ~АВ = х + у. C) По первой аксиоме аффинного пространства найдется точка С такая, что АС = ж, причем С Е Щ. По второй аксиоме аффинного простран- пространства х+~СВ=^С + ~СВ = ~АВ. D) Учитывая C), D), находим, что ~BC = -yeLu E) так что С G П|. Получается, что плоскости Щ и П/ имеют общую точ- точку С, но это невозможно, поскольку плоскости Щ и П/ скрещиваются. Тем самым доказательство теоремы 3 завершено. Замечание. Рис. 16 лишь частично иллюстрирует теорему 3. Например, если размерности Щ и П/ больше т и различны между собой, m ^ 1, Пг+1 ф П ф iln, то, как нетрудно подсчитать, п ^ 7; полностью нарисовать такую ситуацию невозможно. Однако мы и ни- ниже часто будем пользоваться рисунками, изображающими фигуры в пространствах малых размерностей (п = 2, 3, иногда п = 4) для иллю- иллюстраций определений и рассуждений, относящихся к любым п-мерным пространствам. 4. Проведенные выше рассуждения показывают, что плоскости Щ и П/, о которых идет речь в теореме 3, не содержатся ни в какой плос- плоскости меньшей размерности, чем г + 1. Поэтому справедлива также Теорема 4. Если скрещивающиеся плоскости Щ и П/ лежат в плоскости ns, то О(А; + /-т) + 1. F) (Здесь, как и выше, т — размерность пересечения Ьь Г\ Li). Следствие. Если в iln имеются скрещивающиеся плоскости Щ и П/ положительных размерностей, то к ^ п - 2, I ^ п - 2. G) Неравенства G) следуют из соотношения F) при s = n, так как для скрещивающихся плоскостей к — m^l,/ — m^l. Частный случай. Гиперплоскость не может скрещиваться с какой-либо плоскостью положительной размерности. 5. Сохраняя обозначения предыдущего пункта, сформулируем до- достаточное условие пересечения двух плоскостей.
94 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [Гл. III Теорема 5. Если в iln даны плоскости Щ и П/ такие, что к + I - га ^ п, (8) где га — размерность пересечения Ьт направляющих подпространств Lk и Li, то Щ и П/ пересекаются. Доказательство. Исключая тривиальный случай, когда какая- нибудь из данных плоскостей совпадает со всем пространством, имеем к < п, I < п. (9) В расположении двух данных плоскостей могут быть лишь три воз- возможности: либо Щ параллельна П/, либо плоскости Щ и П/ скрещиваются, либо они пересекаются. Если Щ параллельна П/, то для размерности га пересечения соот- соответствующих им подпространств L& и L/ имеем т = min(&, I) A0) и соотношения (9) и A0) противоречат неравенству (8). Если Щ и П/ скрещиваются, то соблюдается неравенство F) при s = n, что тоже противоречит условию (8). Остается предположить, что Щ и П/ пере- пересекаются. Терема 5 доказана. Замечание. Нетрудно доказать, что в условиях теоремы 5 фак- фактически соблюдается равенство к + I — т = п. Однако в вычислени- вычислениях оценочного характера легче проверить неравенство, чем равенство, поэтому достаточное условие пересечения плоскостей мы сформулиро- сформулировали в виде неравенства (8). 6. Укажем алгебраическую интерпретацию теоремы о пересечении плоскостей. Пусть даны две неоднородные порознь совместные системы линей- линейных уравнений, ранги которых равны г\ и г^- Объединим эти две си- системы, то есть, будем рассматривать совместно все входящие в них уравнения. Для такой «объединенной» системы составим соответству- соответствующую ей однородную систему и обозначим ранг последней через г§. Если го ^ 7*1 + Г2, то «объединенная» неоднородная система урав- уравнений совместна. В самом деле, если данные системы уравнений определяют плос- плоскости Щ и П/, то однородная система, соответствующая объединению данных систем, определяет Lm = Lk П L\. Соответственно имеем: к — — п — 7*1, / = п — Г2, га = п — го. Таким образом, к + I — т = п + + го — (ri +Г2) ^ п, и, следовательно, плоскости Щ и П/ пересекаются. А это и означает совместность объединенной системы.
§8] ВЫПУКЛЫЕ МНОГОГРАННИКИ 95 В качестве упражнения рекомендуем читателю доказать сформу- сформулированное в этом пункте утверждение чисто алгебраически, опираясь не на теорему 5, а на теорему Кронекера-Капелли, и проверить попут- попутно, что из неравенства г\ + г2 ^ го на самом деле следует равенство § 8. Системы линейных неравенств и выпуклые многогранники 1. В этом параграфе мы будем рассматривать действительное аф- аффинное n-мерное пространство iln, считая, что в нем дана аффинная система координат. 2. Пусть через некоторую точку Xq E iln, имеющую координаты (ж^, . . . , х°п), проведена прямая в направлении вектора /, координаты которого обозначим {/i, . . . , ln}. Согласно п. 6 §3 эту прямую можно задать параметрическими уравнениями Х{ = х® + т1{, г = 1, . . ., п, — оо < г < +оо. A) Пусть на прямой A) выбраны какие-нибудь точки А и В. Соответ- Соответствующие им значения параметра г обозначим т\ и т^. Предположим, ЧТО Т\ < Т2- Определение. Множество точек прямой, удовлетворяющих не- неравенствам Т\ ^ Г ^ Г2, называется отрезком АВ. 3. Если точка А имеет координаты (ai, . . ., an), точка В имеет координаты Fi, . . ., bn), то в качестве направляющего вектора пря- прямой можно взять вектор / = АВ. Тогда 1{ = Ъ{ — а^, и для текущей точки прямой имеем Х{ = п{ + (Ь{ - CLi)T = A - r)ui + Tbi, причем г = 0 в точке Л, г = 1 в точке Б, так что отрезок АВ задается теперь неравенствами 0 ^ г ^ 1. Положим 1 — г = а, г = /3. Тогда для точек отрезка АВ, и только для них, имеем Х{ = aai + /3b{, i = 1, . . ., n, B) a^O, ^^0, а + )9 = 1, Точка, в которой а = /3 =^, называется серединой отрезка ЛБ. 4. Определение. Множество точек действительного аффин- аффинного пространства называется выпуклым, если вместе с каждыми дву- двумя своими точками Л, В оно содержит отрезок АВ. Простейшими примерами выпуклых множеств могут служить: отре- отрезок, плоскость любой размерности, все пространство iln.
96 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [Гл. III Множество, состоящее из одной точки, и пустое множество также считаются выпуклыми. Непосредственно из определения следует, что пересечение любой совокупности выпуклых множеств само является выпуклым множе- множеством. В самом деле, если точки Л, В принадлежат пересечению неко- некоторой совокупности выпуклых множеств, то отрезок АВ принадлежит каждому из этих множеств, а значит, и их пересечению. 5. Пусть в пространстве iln задана произвольная гиперплоскость A±X! + • • • + Апхп + С = 0. C) Гиперплоскость C) разбивает пространство на две части, называемые открытыми полупространствами. Их точки характеризуются неравен- неравенствами ^iXi + C <0 и ^AiXi + C > 0 D) соответственно. Присоединяя к открытому полупространству гипер- гиперплоскость C), мы получим так называемое замкнутое полупростран- полупространство. Одно из них состоит из точек, координаты которых удовлетворя- удовлетворяют неравенству ^м + С^О. E) Другое: ^м + С^О. F) 6. Существенно, что рассматриваемое пространство является дей- действительным. В комплексном случае никакая гиперплоскость не разде- разделяет пространства, подобно тому как одна прямая не разделяет трех- трехмерного действительного пространства. Подробнее это означает, что если точки А и В в комплексном пространстве не принадлежат какой- либо гиперплоскости, то их можно соединить линией, не пересекающей этой гиперплоскости. Напротив, в действительном пространстве, если точки А и В принадлежат двум разным открытым пространствам D), то любая кривая, соединяющая А и В, пересекает гиперплоскость C). Доказательство опускаем. 7. Теорема 1. Каждое полупространство является выпуклым множеством. Доказательство проведем, например, для полупространства E). Пусть точки А и В принадлежат этому полупространству. Тогда га{ + С ^ 0, Y; А*Ь* + С ^ °'
§8] ВЫПУКЛЫЕ МНОГОГРАННИКИ 97 и для произвольной точки X отрезка АВ, учитывая B), получаем ^2 AiXi + С = ^2 Ai(aai + /ЗЬ{) + С (а +/3) = = а(^2 Aiai + С) + Р(X Ат + С) ^ 0< Таким образом, точка X принадлежит полупространству E). Но точка X на отрезке АВ взята произвольно, значит, весь отрезок АВ принад- принадлежит полупространству E), что и требовалось установить. Рис. 17. Рис. 18. 8. Определение. Пересечение конечного числа полупро- полупространств (если оно непусто) называется выпуклым многогранником. Мы ограничимся рассмотрением многогранников, образованных пе- пересечением замкнутых полупространств. С наглядной точки зрения выпуклый многогранник представляет собой кусок пространства, высеченный несколькими гиперплоскостями (при п = 3 см. рис. 17). Этот кусок может простираться в вз бесконечность (рис. 18). Может слу- случиться также, что многогранник цели- целиком содержится в некоторой ^-мерной плоскости к < п (см. рис. 19 при п = 3, к = 2). Если имеется т полупространств, задаваемых неравенствами т, G) то многограннику (пересечению полупространств G)) принадлежат те и только те точки, координаты которых удовлетворяют системе нера- неравенств А V Н Ь Атпхп + Ст ^ 0. Н.В. Ефимов, Э.Р. Розендорн
98 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [Гл. III С другой стороны, если система вида (8) совместна, то она опреде- определяет многогранник, образованный пересечением полупространств G). Замечание. Очевидно, неравенство вида F) можно всегда заме- заменить неравенством вида G), умножив все его коэффициенты на (—1). 9. Многогранник называется п-мерным параллелепипедом, если в некоторой аффинной системе координат он задается неравенствами вида Zi^Xi^rji, г = 1, . . ., п, (9) где ?^j Vi ~ какие-нибудь числа. В частности, говорят, что паралле- параллелепипед построен на независимых векторах ei, ..., еп, приложенных к точке О, если он задается неравенствами (К х{ <С 1, г = 1, ..., п, A0) в координатах с началом О и базисом ei, ..., еп. Неравенства (9) всегда можно привести к виду A0) с помощью пре- преобразования аффинных координат. n-мерный параллелепипед при п = 1 представляет собой отрезок, при п = 2 — параллелограмм. Часть параллелепипеда A0), расположенная в какой-нибудь из ги- гиперплоскостей Х{ = 0 или Х{ = 1, сама является (п — 1)-мерным па- параллелепипедом и называется (п — 1)-мерной гранью параллелепипе- параллелепипеда A0). Можно рассматривать грани этих (п — 1)-мерных параллелепи- параллелепипедов, грани их граней и т. д. Таким путем получается набор ^-мерных параллелепипедов разных размерностей к (п — 1 ^ к ^ 1). Все они на- называются /^-мерными гранями исходного параллелепипеда A0). Одно- Одномерные грани называются ребрами, их концы — вершинами паралле- параллелепипеда. Можно показать, что вершинами параллелепипеда A0) яв- являются те и только те точки, у которых каждая координата равна либо нулю, либо единице. Пример. В трехмерном евклидовом пространстве с заданной де- декартовой прямоугольной системой координат (ж, у, z) рассмотрим пря- прямоугольные параллелепипеды, ребра которых параллельны коорди- координатным осям. Пусть (жо, уо, zo) — координаты центра параллелепи- параллелепипеда, а, 6, с — длины его ребер, параллельных осям ж, у, z соответ- соответственно. Обозначим через Л множество тех параллелепипедов, цен- центры которых лежат в кубе \х\ ^ ?, \у\ ^ ?, \z\ ^ ?, длины ребер не превышают г). Каждому параллелепипеду из множества Л можно по- поставить в соответствие точку шестимерного аффинного пространства Яб с координатами (#о, Уо, %§•> &•> Ь, с). Тогда само множество Л можно рассматривать как шестимерный параллелепипед
§8] ВЫПУКЛЫЕ МНОГОГРАННИКИ 99 Заметим, что геометрические фигуры одного пространства часто бывает удобно рассматривать как точки другого пространства. 10. Определение. Множество точек в аффинном простран- пространстве Яп называется ограниченным, если координаты всех точек этого множества удовлетворяют неравенству \х{\ ^ М (М > 0 — некоторое число). Пользуясь формулами § 2, нетрудно проверить, что это определение не зависит от выбора аффинной системы координат. Множество огра- ограничено в том и только в том случае, если оно содержится в некотором параллелепипеде. 11. Определение. Выпуклой оболочкой множества Л точек в аффинном пространстве Я называется такое выпуклое множество Л С Я, которое содержится в любом выпуклом множестве, содержащем Л. Иначе говоря, выпуклая оболочка Л С Я представляет собой пере- пересечение всевозможных выпуклых множеств, содержащих данное мно- множество Л; говорят также, что Л С Я является наименьшим выпуклым множеством, содержащим Л (рис. 20). а) б) Рис. 20. Пример. Выпуклой оболочкой двух точек Л, В является отрезок АВ. Можно доказать, что выпуклая оболочка любого конечного числа точек является ограниченным выпуклым многогранником и что вся- всякий ограниченный выпуклый многогранник вида (8) представляет со- собой выпуклую оболочку некоторой конечной системы точек, называе- называемых его вершинами. 12. Покажем одно геометрическое построение, которое бывает по- полезно в вопросах о выпуклых оболочках. Пусть дано выпуклое множество Л и точка М. Построим всевоз- всевозможные отрезки вида MX при X Е Л, и множество точек всех таких отрезков обозначим через В (рис. 21). Справедлива Теорема 2. Множество В является выпуклой оболочкой объеди- объединения A U М.
100 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [Гл. III Доказательство. Если М G Л, то В = Л, и утверждение тео- теоремы очевидно. Пусть точка М не принадлежит множеству Л. Любое выпуклое множество, содержащее Л U М, обязано содержать все В, поэтому нам достаточно проверить выпуклость В. Пусть точки Л, В Е Е В. Тогда точка А лежит на некотором отрезке MX, а точка В — на некотором отрезке MY, где X, Y Е Л (рис. 22). Нам нужно устано- установить, что отрезок ЛВ целиком содержится в множестве В. Пусть С — произвольная точка отрезка АВ. м м В Y Рис. 21. Рис. 22. Тогда (если исключить тривиальные случаи совпадения какой-либо из точек Л, Б с какой-нибудь из точек М, X, У), будем иметь МБ = МС = аМА + /ЗМВ, На отрезке XY найдется точка Z такая, что л _ _ а\——— 6и — MZ = —MX + — О < /i < 1; а ^0, )S ^0, a + )S = 1. где г/ = аХ + /3/i, 0 < v < 1. Точка Z содержится в множестве Л вследствие выпуклости последнего. Легко видеть, что МС = vMZ, то есть, что точка С принадлежит отрезку MZ С В. Тем самым тео- теорема 2 доказана. 13. Отметим простейшие свойства выпуклой оболочки. 1) Множество Л совпадает со своей выпуклой оболочкой тогда и только тогда, когда оно выпукло. 2) Если Л\ С Л2, то выпуклая оболочка множества Л\ содержится в выпуклой оболочке множества Л2- Эти два свойства вытекают непосредственно из определения вы- выпуклого множества и выпуклой оболочки.
§8] ВЫПУКЛЫЕ МНОГОГРАННИКИ 101 3) Пусть Л = А\ U Лг, и пусть А\ — выпуклая оболочка множества А\. Тогда выпуклая оболочка А множества А совпадает с выпуклой оболочкой объединения А\ U Аъ- Доказательство. А\ U Л 2 С А\ U Л2; поэтому А содержится в выпуклой оболочке множества А\ U А^- С другой стороны, А — вы- выпуклое множество, содержащее А\ и Л2; поэтому выпуклая оболочка объединения А\ U Л 2 содержится в А. Таким образом, множество А и выпуклая оболочка множества А\ U Ai совпадают. 14. Пусть в аффинном пространстве Я даны точки Aq, А\, ..., Ар с радиус-векторами ао, fti, ..., ар соответственно. Имеет место Теорема 3. Выпуклая оболочка системы точек Aq, Ai, ..., Ар задается формулой х = аоао + aidi + • • • + арар, A1) где х — радиус-вектор произвольной точки из выпуклой оболочки, чис- числа «о, c*i, ..., ар удовлетворяют условиям ao + ai + --- + ар = 1, 1 «о ^ 0, а\ ^ 0, . . ., ар ^ 0. J Доказательство проведем посредством индукции по числу точек. Для двух точек теорема 3 справедлива, так как при р = 1 фор- формулы A1) и A2) задают отрезок A0Ai. Пусть теорема справедлива для р + 1 точек. Рассмотрим точки Ло, ..., Ар\ их выпуклую оболочку обозначим Л; добавим еще одну точку Лр+1 с радиус-вектором ар+\ и построим выпуклую оболочку В объединения Ли Ар+\. По свойству 3 п. 13 множество В совпадает с выпуклой оболочкой системы точек Aq, ..., Ар, Ар+\. По теореме 2 множество В состоит из всевозможных отрезков Ap+iX, где X G Л. Радиус-вектор ж точки X дается равенством A1). Обозначим через у радиус-вектор произвольной точки отрезка АР+\Х. Тогда 2/ = аж + /Зар+ь а+ /3 = 1, а ^ 0, /3^0. A3) Положим Рг = асч, г = 0, ...,р; /3p+i = 0. A4) Из формул A1)—A4) получаем +i, 1 0, j = 0, ..., р + 1. J ( j Таким образом, каждая точка множества В удовлетворяет соотноше- соотношениям A5). Обратно, подставив величины A4) в формулы A5), получим для у выражение вида A3), где х удовлетворяет соотношениям A1) и A2). Это значит, что каждая точка, удовлетворяющая условиям A5), принадлежит множеству В. Теорема 3 доказана.
102 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [Гл. III 15. Определение. Выпуклая оболочка системы точек Ло, Ai, ..., Лг, находящихся в общем положении, называется г-мерным симплексом с вершинами Ло, Ai, ..., Аг. Из теоремы 3 следует, что симплекс с вершинами Ло, ..., Аг за- задается формулами A1) и A2) при р = г. При этом числа о^, • • • ? #г называются барицентрическими координатами точки симплекса, име- имеющей радиус-вектор х. Частные случаи: нульмерный симплекс — одна точка; одномерный симплекс — отрезок; двумерный симплекс — треугольник; трехмерный симплекс — треугольная пирамида. Точка симплекса, в которой все барицентрические координаты равны между собой lao = ... = ar = ^qr[), называется центром симплекса. Пусть Тг — симплекс с вершинами Ло, Ai, ..., Лг, и пусть Л^о, Л^, ..., Aik — какие-нибудь из его вершин. ^-мерный симплекс, ко- который является выпуклой оболочкой вершин Л^о, Л^, ..., Л^, назы- называется к-мерной гранью симплекса Тг. Одномерные грани, т.е. отрезки, соединяющие вершины, называ- называются ребрами симплекса. Две грани размерностей к и г — (к + 1) называются противополож- противоположными гранями симплекса Тг, если они не имеют общих вершин. Реко- Рекомендуем читателю в качестве упражнений доказать, что симплекс яв- является выпуклой оболочкой пары противоположных граней, что про- противоположные грани симплекса всегда располагаются в скрещиваю- скрещивающихся плоскостях и что отрезок, соединяющий центры противополож- противоположных граней, проходит через центр симплекса. 16. Докажем, что n-мерный симплекс в n-мерном пространстве представляет собой пересечение замкнутых подпространств в числе га + 1. Пусть Ло, Ai, ..., Ап — вершины симплекса Тп. Примем Aq за начало координат, базис выберем следующим образом: ех = А0Аи е2 = А0А2, . . ., еп = А0Ап. Тогда соотношения A1) и A2) (при р = п) в координатах примут вид Xi =«1, Х2 = «2, Н Ь ап = 1, «о ^0, ai ^ 0, . . ., ап ^ 0, > A6)
§8] ВЫПУКЛЫЕ МНОГОГРАННИКИ 103 откуда следует, что xi ^ 0, х2 ^ 0, ..., хп ^ 0, Л Х\ + Х2 + ' ' ' + Хп ^ 1. J С другой стороны, из A7) вытекает A6), если положить а{ = Х{ для г = 1, ..., п, ао = 1 — (xi + Х2 + • • • + жп). Таким образом, системы A6) и A7) эквивалентны и задают один и тот же симплекс Тп (при п = 3 см. рис. 23). Система неравенств A7) показывает, пересечением каких полупро- полупространств образован симплекс Тп. 17. Мы говорили выше, что многогранник можно представлять себе как кусок пространства, «высе- «высеченный» несколькими гиперплоскос- гиперплоскостями. Можно доказать, что если многогранник ограничен, то число тп этих «высекающих» гиперплоскостей, то есть число полупространств, пе- пересечением которых образован мно- многогранник, обязательно превышает Рис. 23. размерность пространства. Наименьшему возможному числу п = m + 1 соответствует сим- симплекс. Отметим попутно,что слово «симплекс» (simplex) в переводе с ла- латинского означает «простой». 18. Пусть задан многогранник системой неравенств вида (8) и пусть дана функция z = с0 + cixi -\ Ь спхп, A8) где со, ci, ..., сп — числовые коэффициенты, х±, ..., хп — координаты точки из iln. Задача о нахождении максимума и минимума функции A8) на мно- многограннике (8) имеет настолько важное значение для приложений (в частности, в экономике), что исследование этой задачи и разработ- разработка численных методов ее решения выделилась в самостоятельную об- область, которая получила название «линейного программирования». С другой стороны, отметим, что геометрическая теория выпуклых многогранников является существенным подспорьем для алгебраиче- алгебраической теории линейных неравенств.
ГЛАВА IV. ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ § 1. Линейные формы 1. Предположим, что в линейном пространстве L задана числовая функция векторного аргумента, т. е. каждому вектору х поставлено в соответствие число а(х). В этой главе мы будем понимать функцию а(х) общепринятым об- образом, именно: будем считать ее инвариантной; это значит, что значе- значение а(х) не зависит от выбора базиса в пространстве L. Замечание. В некоторых дальнейших главах нам придется от- отказаться от общепринятой точки зрения и рассматривать функции, численное значение которых определяется для данного х Е L (или для данных х, у, . . . Е L) при помощи базиса в L и может от базиса зави- зависеть. Впрочем, и в этом случае можно вернуться к общепринятой точке зрения, расширив понятие области определения функции. В самом де- деле, если через ? обозначить множество всех базисов пространства L, то мы можем рассматривать функцию а(ж,е), где х Е L, e Е ?. Мы получаем обычную (инвариантную) функцию а(х), если а(х, е) = а(х) для всех е Е ?. Определение. Функция а(х) называется линейной, если 1) а(х + у) = а(х) + а(у) для любых векторов ж, у из L; 2) а(ах) = аа(х) для любого числа а и любого вектора х из L. В качестве значений функции а(х) будем брать действительные числа, если L действительно, и будем допускать комплексные числа, если L комплексно. 2. Примеры. 1) Пусть х = x±ei + • • • + хпеп, где ei, ..., еп — базис в L. В каждом базисе ei, ..., еп положим а(х) = х\. Тогда свойства 1) и 2) п. 1 для а(х) соблюдаются, но а(х) не удовлетворя- удовлетворяет определению линейной функции, поскольку зависит от выбранного базиса. 2) Пусть L — пространство многочленов степени не выше п. Пусть каждому многочлену х(г) из L ставится в соответствие число а(х) по формуле а(х) = / х(т) dr, A) где т\ ^ г ^ Т2 — заданный отрезок числовой оси. Ясно, что число- числовое значение а(х) не зависит от выбора базиса в L. Условия 1) и 2)
§ 1 ] ЛИНЕЙНЫЕ ФОРМЫ 105 п. 1 соблюдены вследствие известных свойств определенного интегра- интеграла. Таким образом, функция A) является линейной функцией в про- пространстве L. Замечание. Линейную функцию A) можно рассматривать так- также в бесконечномерном пространстве непрерывных функций, задан- заданных на произвольно выбранном отрезке [т[, т?\ при условии, что т{ ^ т\, т^ ^ Т2, или в пространстве всех интегрируемых на [т[, т?\ функций (тоже бесконечномерном). 3. Пусть в пространстве L дана линейная функция а(х). Считая, что пространство L является n-мерным, зафиксируем в нем произвольный базис ei, ..., еп и разложим вектор х по этому базису: х = x±ei + • • • + хпеп. Тогда линейная функция запишется в виде а(х) = а{х\е\ + Ь хпеп) = х\а{е\) -\ Ь хпа(еп). B) Обозначим через а{ значение функции а[х) на базисном векторе ef. oi = o(ei), . . ., ап = а(еп). C) Если базис фиксирован, то ai — вполне определенные числа. Подста- Подставив величины C) в равенство B), получим выражение функции а(х) в виде однородного многочлена первой степени относительно коорди- координат вектора х: а(х) = а\Х\ + а2х2 + • • • + апхп. D) 4. Однородные многочлены степени к принято называть формами степени к; при к = 1 употребляют термин «линейные формы», при к = 2 — термин «квадратичные формы». Согласно формуле D) всякая линейная функция а(х) в п-мерном линейном пространстве является линейной формой относительно ко- координат ее аргумента х. В связи с этим линейные функции обычно называют линейными формами. 5. В пространстве Ln перейдем к новому базису е[, ..., е'п по фор- формуле (см. §5 гл. II). В новом базисе линейная форма будет иметь новые коэффициенты а\\ а[х) = а1х1 + а2Х2 + • • • + апхп. Найдем а'^ пользуясь тем, что эти числа являются значениями формы а(х) на новых базисных векторах:
106 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV Пользуясь выражением (I) для векторов е\ и линейностью функции а(х), находим a'i = а (Е paei) = Е piMej) = Е F*;fli- Итак, Мы видим, что формула E) совершенно аналогична формуле (I). 6. Докажем, что закон преобразования коэффициентов, выражен- выраженный формулой E), обеспечивает инвариантность значений функции, которая в базисе ei, ..., еп задается формулой D). С этой целью используем формулы (III) и D) из § 5 гл. П. Положим в новом базисе i j к Заметим, что в формуле F) и в других аналогичных случаях индексы суммирования в скобках нужно обозначать разными буквами, иначе возникнет путаница при раскрытии скобок. Раскрываем скобки и де- делаем перегруппировку слагаемых: aJxkpijQik = ^2 G) где Sjk — символ Кронекера. Если j ф к, то Sjk = 0, и такие слагаемые учитывать не нужно. Если j = к, то Sjj = 1, так что cljXjSjj = cljXj. Поэтому ^ = ^CLjXj. (8) Сопоставляя формулы F)-(8), окончательно имеем i 3 то есть, численное значение величины а(х) при изменении базиса со- сохраняется. 7. В линейном пространстве L (быть может, бесконечномерном) рассмотрим всевозможные линейные формы, т. е. числовые линейные функции одного векторного аргумента. Будем понимать сумму функ- функций и произведение функции на число в обычном (арифметическом) смысле. Имеет место Теорема 1. Множество L* всех линейных функций, заданных в пространстве L, представляет собой линейное пространство.
§ 1 ] ЛИНЕЙНЫЕ ФОРМЫ 107 Доказательство. Докажем прежде всего, что сумма двух про- произвольных линейных функций а(х), Ь(х) также является линейной функцией. Положим с(х) = а(х) + Ь(х). Тогда с(х + у) = а(х + у) + Ь(х + у) = = [а(ж) + Ь(х)] + [оB/) + Ь(у)] = с(ж) + ф). Кроме того, с(ах) = о(аж) + Ь(ах) = аа(ж) + ab(x) = а[а(ж) + 6(ж)] = ас(х). Таким образом, линейность суммы доказана. Покажем теперь, что если линейную функцию умножить на произ- произвольное число Л, то получится линейная функция. Пусть с(х) = Ха(х). Тогда с(х + у) = Ха(х + у) = Аа(ж) + Ха(у) = с(ж) + с(^/). Далее с(аж) = Ха(ах) = Аст(ж) = ас(х). Тем самым показано, что Ха(х) — линейная функция. Итак, если а(х), Ь(х) G L*, то а(х) + 6(ж) G L* и Ха(х) G L* при любом А. Нулевым элементом L* является (линейная) функция в(х), равная нулю для любого вектора х. Функция (—1) • а(х) является противоположной для а(х). Нетрудно проверить, что для L* выполняются все аксиомы линей- линейного пространства, откуда и вытекает справедливость теоремы 1. 8. Определение. Линейное пространство L* всех линейных функций, определенных на L, называется сопряженным простран- пространству L. Замечание. Согласно определению линейной функции в сопря- сопряженном пространстве допускается умножение на такие же числа, как и в исходном; иначе говоря, если L — действительное, то и L* — дей- действительное, если L — комплексное, то и L* — комплексное. 9. Теорема 2. Если линейное пространство п-мерно, то сопря- сопряженное ему пространство также п-мерно. Доказательство. Введем в L базис в\, ..., еп и разложим по нему произвольный вектор х из L: X = X\6i + Ж2б2 + * * * + Хпеп. Тогда произвольный вектор а из сопряженного пространства L*, то есть, линейная функция а (ж), записывается в виде а(х) =
108 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV и однозначно определяется заданием набора коэффициентов (ai, . . . . . ., ап). Этот набор можно рассматривать как вектор из координат- координатного пространства Кп. При сложении линейных функций и умножении их на число соответственно складываются и умножаются на число их коэффициенты. Поэтому в данном случае L* изоморфно координатно- координатному пространству Кп. Теорема 2 доказана. 10. В заключение параграфа рассмотрим геометрический смысл линейной формы. Для этого используем аффинное пространство iln, считая векторы из Ln радиус-векторами точек из iln, отложенными из некоторой точки О. Будем считать, что значение а(х) в точке А равно ее значению на векторе х = О А. Тем самым функция а(х) будет определена в iln. Справедливы следующие утверждения: 1) Множество точек, в которых линейная функция а(х) принимает постоянное значение, представляет собой гиперплоскость. 2) Всякая гиперплоскость представляет собой геометрическое место точек, в которых некоторая линейная функция сохраняет постоянное значение. 3) Гиперплоскости, соответствующие разным значениям данной ли- линейной функции а(ж), параллельны. 4) Гиперплоскость, на которой а(х) = 0, проходит через начало ко- координат. Для доказательства этих фактов достаточно записать равенство а(х) = с в координатах и воспользоваться результатами §§6, 7 гл. III. § 2. Билинейные формы 1. Числовая функция а(х,у) двух векторных аргументов ж, у на- называется билинейной, если она линейна по каждому аргументу: 1) а(х! + х2, у) = а{хи у) + а(х2,у), а(ах, у) = аа(х, у); 2) а(х, ух + у2) = а(х, уг) + а(х, у2), а(х, ау) = аа(х, у). Здесь ж, у, xi, #2, У\•> У2 — любые векторы пространства L, а — произвольное число. 2. Пусть L — линейное n-мерное пространство, ei, ..., еп — базис в нем, и пусть аргументы билинейной функции разложены по этому базису: Тогда а(х,у) = a \^2xiei,^2ykekJ = ^х{ука(е{, ек). A)
§2] БИЛИНЕЙНЫЕ ФОРМЫ 109 Введем обозначения: aik = а(е{,ек). B) Тогда получим а(х,у) = ^2 aikXiyk. C) i,k=l Формула C) выражает функцию а(х,у) в координатах по данному базису. Многочлен в правой части формулы C) называется билинейной формой. Вместе с ним билинейной формой называют и самую функцию а(х,у). Числа а^к называют коэффициентами данной формы в базисе ei, ..., еп. В качестве аргументов х, у можно рассматривать векто- векторы как действительного, так и комплексного линейного пространства. Соответственно говорят, что форма а(х,у) дана в действительном или в комплексном пространстве. В последнем случае в качестве значе- значений формы а(х,у) допускают комплексные числа; коэффициенты aik в этом случае также являются, вообще говоря, комплексными числами. 3. Легко доказать, что множество всех билинейных форм, задан- заданных в линейном пространстве L, тоже образует линейное пространство (если понимать сложение форм и умножение их на число в обычном арифметическом смысле; см. § 1, где доказательство проведено для ли- линейных форм). 4. В данном базисе ei, ..., еп рассмотрим одночленные билиней- билинейные формы Iik(x,y) = x{yk. D) Из B) и C) а(х, у) = ^2 aikhk(x, у)- E) Если взять х = е/, у = ет при любых фиксированных / и т, то 1\ш — 1, а все остальные формы D) будут равны нулю. Отсюда сле- следует, что формы D) независимы. Поэтому они образуют базис в про- пространстве билинейных форм. Формула E) дает разложение билинейной формы A) по базису D). Базис D) состоит из п2 элементов. Следовательно, пространство билинейных форм имеет размерность п2. 5. Билинейная форма а(х, у) называется симметричной, если для любых х, у G L а(х,у) = а(у,х). Билинейная форма а(х,у) называется кососимметричной, если для любых ж, у G L а(х,у) = -а(у,х). В случае симметричной билинейной формы коэффициенты симмет- симметричны: aik = aki (см. формулу B)). В случае кососимметричной фор-
110 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV мы a,ik = — аы и, в частности, аи = 0. Как симметричные, так и косо- симметричные билинейные формы образуют подпространства в про- пространстве всех билинейных форм с аргументами из L. Чтобы найти размерности этих пространств, построим в них базисы. Симметричную билинейную форму можно записать в виде а(х,у) = ^2aik(xiyk + хку%) + ^2ацХ1у{. F) Рассмотрим формы hk(x,y) = ХгУк+ХкУг приг^&,1 1ц(х,у) = ХгУг. ) Билинейные формы G) линейно независимы и симметричны, а любая симметричная билинейная форма выражается через них по формуле вида F). Поэтому формы G) составляют базис в пространстве всех симметричных билинейных форм. Количество элементов в базисе G) равно Сп + п= |п(п + 1). Такова же и размерность подпространства симметричных форм. Отсюда следует, что при любом выборе незави- независимых симметричных билинейных форм w\ (х, у),..., w^ (x, у) в числе N = ^п(п + 1) произвольная симметричная форма может быть пред- представлена в виде N а(х,у) = к=1 где Xi — числовые коэффициенты. Для кососимметричных билинейных форм имеем а(х, у) = ^2 aik(xiVk i<k и в качестве базиса можно взять формы 7ik(x,y) = ХгУк - Их общее число равно N = ^п(п — 1). Следовательно, при любом вы- выборе кососимметричных независимых форм u?i, ..., w^ получаем для произвольной кососимметричной формы а(х,у) представление а(х,у) = г=1 6. Теорема. Пространство билинейных форм является пря- прямой суммой подпространства симметричных и подпространства ко- кососимметричных билинейных форм. Доказательство. Очевидно, что билинейная форма является одновременно симметричной и кососимметричной тогда и только то- тогда, когда она нулевая. Отсюда и из теоремы 1 § 14 гл. I следует, что сумма рассматриваемых подпространств является прямой суммой.
§2] БИЛИНЕЙНЫЕ ФОРМЫ 111 С другой стороны, всякая билинейная форма а(х,у) может быть представлена в виде суммы симметричной и кососимметричной форм, именно Ф,У) = ^(Ф,у)-\-а(у,х)) + -(а(х,у) -а(у,х)). Следовательно, прямая сумма рассматриваемых подпространств сов- совпадает со всем пространством. Теорема доказана. 7. Пусть делается переход к новому базису: В новом базисе Вследствие инвариантности формы а(х,у) имеем а(х,у) = ^aikxiyk = ^а\кх\у'к, (9) где a'ik — новые коэффициенты. Разумеется, инвариантность формы а(х,у) не означает инвариантности ее коэффициентов (вообще говоря, а\к ф dik). Найдем выражения коэффициентов а\к через старые а,{к. Воспользуемся тем, что значения формы на базисных векторах совпа- совпадают с коэффициентами формы: o5fc=o(e5,ejb). A0) Вместо новых базисных векторов е[, е'к подставим в A0) их выраже- выражения (8): Теперь, ввиду линейности формы а(х,у) по каждому из аргументов, получаем Ф'г^'к) = Yj PijPkia{ehet). Таким образом, Замечание. Выражения (I) можно получить иным способом, ис- исходя из (9). Именно, так как, согласно § 5 гл. II, то из (9) имеем Отсюда снова находим (I). Вместе с тем видно, что не только (I) сле- следует из (9), но и (9) следует из (I). Таким образом, инвариантность
112 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV формы влечет за собой закон преобразования ее коэффициентов со- согласно равенствам (I); в свою очередь преобразование коэффициентов по закону (I) гарантирует инвариантность формы. § 3. Матрица билинейной формы 1. Пусть дана произвольная билинейная форма. Запишем ее в раз- развернутом виде: а(х,у) = + 2 Н Ь Если выписать отсюда таблицу коэффициентов, то получится квадрат- квадратная матрица, которая называется матрицей билинейной формы: * _ an2 В данном базисе матрица билинейной формы полностью ее опреде- определяет, так как дает все ее коэффициенты. 2. Допустим, что совершается переход к новому базису В новом базисе форма а(х,у) имеет другую матрицу А' = ||а^||. Элементы a'ik матрицы А' выражаются формулами (I) предыдущего параграфа. Преобразуем эти формулы так, чтобы получить матричное соотношение, выражающее (I) целиком. Для этого запишем (I) в виде и введем величины Вследствие A) и (а) (a) Составим матрицу С = ||cj^||, считая, как обычно, что первый индекс дает номер строчки, второй — номер столбца. Соотношения (а) и (/3) рассмотрим с точки зрения умножения мат- матриц. При изменении индекса I величина dji пробегает строчку матри- матрицы Л, а величина Рм — строчку матрицы Р. Таким образом, в (а)
§3] МАТРИЦА БИЛИНЕЙНОЙ ФОРМЫ 113 записано произведение строки на строку. Чтобы превратить строку в столбец, достаточно транспонировать матрицу. Соответственно, в соот- соотношении (а) будем рассматривать второй множитель под знаком сум- суммы как элемент матрицы Р* (транспонированной матрицы Р). Тогда получим произведение строки матрицы А на столбец матрицы Р*. Ина- Иначе говоря, (а) эквивалентно матричному равенству С = ЛР\ (ai) Теперь рассмотрим формулу (/3). Здесь сразу замечаем, что справа имеем произведение строчки на столбец. Тем самым из (/3) следует А' = PC. (/30 Из (ai) и (/?i) получаем искомую формулу А' = РАР*. B) Формула B) выражает матрицу билинейной формы в новом базисе через матрицу этой формы в старом базисе и матрицу Р, через которую делается переход от старого базиса к новому. 3. Выводы из формулы ( 2 ). Заметим, что Р и Р* — невы- невырожденные матрицы. Отсюда и по теореме о ранге произведения мат- матриц (гл. II, §4) Rang A' = Rang A. C) Определение. Рангом билинейной формы называется ранг ее матрицы. Вследствие равенства C) ранг билинейной формы является инвари- инвариантом относительно изменений базиса и тем самым представляет собой величину, которая связана с самой формой, независимо от ее коорди- координатного представления. Несколько позже (в § 11) для ранга билинейной формы будет дано геометрическое истолкование. 4. Рассмотрим определитель матрицы билинейной формы в неко- некотором базисе: А = Det A В другом базисе А' = Det A'. Из формулы B) и теоремы о перемноже- перемножении определителей следует, что А' = A(DetPJ. D) Таким образом, определитель матрицы билинейной формы не является инвариантом, а изменяется при переходе к новому базису по форму- формуле D). 5. Пусть даны какая-нибудь билинейная форма а (ж, у) = ^CLijXiyj, у которой определитель А ф О, и произвольная линейная форма Ь(х) = = ^2biXi. Тогда можно так выбрать у, чтобы а(х,у) = b(x) для любого
114 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV х Е L (при фиксированном у). Для этого достаточно найти (?/i, ... . . ., уп) из системы определитель которой равен А ф 0. Таким образом, одна билинейная форма а(х,у) содержит в себе всевозможные линейные формы, задан- заданные в L. § 4. Квадратичные формы 1. Пусть билинейная форма а(х,у) является симметричной: а(у,х) = а(х,у). Это равносильно тому, что в любом базисе симмет- симметрична ее матрица: Л* = Л. В самом деле, Отождествим оба аргумента формы а(х,у).Тогда получим а(х,х) = = а(х, у) при у — х. Функция а(х,х) называется квадратичной формой, отвечающей данной симметричной билинейной форме а(х, у). Исходная (симметричная) билинейная форма а(х,у) называется полярной для квадратичной формы а(х, х). 2. Докажем, что полярная билинейная форма однозначно опреде- определяется своей квадратичной формой. Пусть дана числовая функция f(x) векторного аргумента. Пред- Предположим, что f(x) есть некоторая квадратичная форма, т.е. f(x) = = а(х, ж), причем а(х, у) нам неизвестна. Чтобы найти ее, рассмотрим f(x + у), где ж, у — произвольные векторы. Пользуясь свойствами би- билинейной формы и ее симметричностью, имеем f(x + y) = a(x + y,x + y) = = а(х, х) + а(х, у) + а(у, х) + а(у, у) = Отсюда получаем искомое выражение \ A) 3. Формулу A) можно принять за определение квадратичной фор- формы. Именно: можно сказать, что f(x) называется квадратичной фор- формой, если левая часть формулы A) является билинейной функцией. Следует заметить, что определение квадратичной формы не преду- предусматривает наличие базиса; тем самым, оно применимо в бесконечно- бесконечномерных пространствах. 4. Пример. Пусть L — линейное пространство функций, непре- непрерывных на отрезке [0,1].
4] КВАДРАТИЧНЫЕ ФОРМЫ 115 Рассмотрим функцию 1 = J[x(t)]2dt, аргумент которой х = x(t) Е L. Имеем ~ f(x) - f(y)] = I x(t)y(t) dt. B) Нетрудно непосредственно проверить, что в правой части равенства B) стоит билинейная форма. Таким образом, f(x) есть квадратичная форма в бесконечномерном пространстве L. В дальнейшем (§ 10) мы увидим, что отсюда можно получать важ- важные выводы, например, доказывать интегральные неравенства, опи- опираясь на чисто алгебраические теоремы. 5. Вернемся к n-мерному случаю. В n-мерном пространстве рас- рассмотрим квадратичную форму и запишем ее выражение через коорди- координаты аргументов. Пусть а(х,у) = а(у,х), х = у. Тогда f(x) = а(х,х) = ^2а{кх{хк = h + anlxnx\+ an2xnx2 H h annxnxn. Если принять во внимание симметричность коэффициентов, то чле- члены суммы C), кроме диагональных, естественно объединяются в пары. При этом получается часто употребляемая запись квадратичной фор- формы в виде /() \ 2 + 2a^xix^ + Ь 2ainxixn + +2а2зж2ж3 + h2a2n^2^n + ~г Заметим, что в первой строчке формулы D) выписаны все члены, со- содержащие Х\. 6. Матрицей квадратичной формы называется матрица ее поляр- полярной билинейной формы А = flnl
116 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV Из этого определения сразу следует, что матрица квадратичной формы преобразуется по формуле А' = РАР*, которая доказана в предыдущем параграфе. 7. Ранг квадратичной формы по определению равен рангу ее мат- матрицы: г = Rang Л. 8. Квадратичные формы имеют важные геометрические приложе- приложения, которые рассматриваются ниже, в гл. VIII и XI. Сейчас мы не бу- будем связывать с квадратичными формами какие-либо геометрические объекты и будем рассматривать их свойства с алгебраической точки зрения. 9. Если в некотором базисе окажется, что все коэффициенты а^ = = 0 при г ф к, то говорят, что в этом базисе квадратичная форма имеет канонический вид /(ж) = ацх\ + ^22^2 + Ь аппх2п. Для того, чтобы получить канонический вид квадратичной формы, базис нужно выбрать специально. В произвольном базисе форма будет полной, т.е. будет, вообще говоря, иметь все члены. Приведение квадратичной формы к каноническому виду является важной задачей как в теоретических вопросах, так и в прикладной математике. Ниже будут даны два метода приведения квадратичной формы к каноническому виду: метод Лагранжа и метод Якоби. 10. Если форма приведена к каноническому виду, то ее матрица становится диагональной: А = О О E) Так как ранг квадратичной формы есть инвариант, то он равен числу отличных от нуля диагональных элементов матрицы E). Если ранг = г < п, то после надлежащего изменения номеров мат- матрицу E) можно записать в виде О А = О О о 11. Замечание. Если привести к каноническому виду квадра- квадратичную форму, то одновременно приведется к диагональному виду и ее билинейная форма а(х, у) = ацххух + а22%2У2 Н Ь ^пп^пУп-
МЕТОД ЛАГРАНЖА 117 § 5. Приведение квадратичной формы к каноническому виду методом Лагранжа 1. Пусть дана квадратичная форма f(x) = а(х,х). Вследствие формулы D) §4 мы можем в любом базисе записать f(x) в виде f(x) = а1Хх\ + 2ai2xix2 Н Ь 2а1пх1хп + g(x2, . . . , хп), A) где g — квадратичная форма, не включающая х\. Запись вида A) позволяет доказать возможность приведения квад- квадратичной формы к каноническому виду по индукции. Теорема. Каждую квадратичную форму с помощью невырож- невырожденного линейного преобразования можно привести к каноническому виду. Замечание. Здесь речь идет о преобразовании переменных, имен- именно числовых аргументов х\, ..., хп многочлена A). Но теорему можно понимать и геометрически, поскольку всякое невырожденное преобра- преобразование переменных можно рассматривать как преобразование коор- координат при переходе к новому базису (см. гл. II). 2. Доказательство т е о р е м ы. Квадратичная форма от од- одного переменного всегда имеет канонический вид ацх\. Примем как предположение индукции, что любую квадратичную форму от (п — 1) числовых аргументов можно привести к каноническому виду невырож- невырожденным линейным преобразованием (п — 1) переменных. Рассмотрим произвольную квадратичную форму f(x) от п число- числовых аргументов: Пользуясь предположением индукции, докажем, что ее можно приве- привести к каноническому виду невырожденным линейным преобразовани- преобразованием п переменных. Возможны два случая: 1) Первый случай. В квадратичной форме f(x) хотя бы один из коэффициентов ац при квадратах переменных отличен от нуля. Не нарушая общности, можем считать, что именно ац ф 0. По данным коэффициентам формы f(x) составим следующее линейное преобра- преобразование: Н \-а1пхп B) Уп = Матрицу этого преобразования обозначим через Q: О 1 . 0 0. а1п 0
118 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV Преобразование B) невырождено, так как Det Q = ац ф 0. Отметим также, что невырожденность преобразования B) вытекает из его об- обратимости, которая в свою очередь сразу видна из формул B). Возведем в квадрат выражение у\ и разделим на ац ф 0: 1 2 1 / ч2 Ух = (aii^i + а12х2 Л V а1пхп) = а а где if — некоторая квадратичная форма аргументов х2, ..., хп, т.е. ср не включает х\. Введем еще одну квадратичную форму ф тех же аргументов х2, - - -, хп, положив ф(х2, . . ., хп) = g(x2, . . . , хп) - р(х2, . . . , жп), где g(x2j . . ., жп) дана записью f(x) в виде A). Тогда получим ,/ ч 1 2 ,/ ч J ух) — У1 * lP\x2i • • • 1 xn)i аи или, что то же самое, f(X) = — 2+ф( 2 ) По предположению индукции существует такое невырожденное пре- преобразование переменных в числе п — 1: к = 2, ..., п, C) г=2 которое приводит к каноническому виду форму ф: Дополним преобразование C) так, чтобы в нем участвовали все п переменных. Именно, положим *i = 2/1» ^п = Кп2У2 + ' ' ' + КппУп- > Преобразуем переменные #i, ..., жп в переменные у±, ..., 2/п по формулам B), а затем переменные yi, ..., уп преобразуем по форму- формулам D). В результате получим преобразование переменных xi, ..., хп в переменные zi, ..., zn, которое приводит исходную квадратичную форму к каноническому виду f{x) = —zl + h22z\ + • • • + bnnz2n. Последнее преобразование является невырожденным, так как пред- представляет собой произведение невырожденных преобразований B) и D).
§ 6] НОРМАЛЬНЫЙ ВИД КВАДРАТИЧНОЙ ФОРМЫ 119 2) Второй ел у ч аи. В квадратичной форме f(x) все диагональ- диагональные коэффициенты ац равны нулю. Тогда предыдущие рассуждения неприменимы. Но какой-нибудь из коэффициентов отличен от нуля; пусть это будет а±2. Тогда квадратичная форма имеет вид f(x) = 2а12х1х2 + . . . E) Сделаем преобразование: Х1 = Х\ + Х2 = Х\ — F) хп — хп Преобразование F) обратимо и, следовательно, является невырожден- невырожденным. Подставив величины F) в квадратичную форму E), получим f(x) = 2a12xj - 2a12xl + ... G) Слагаемое 2а\2х\ не может исчезнуть при приведении подобных чле- членов, так как все члены квадратичной формы, которые не выписаны в выражении E), не содержат произведение х\х2 и не могут в резуль- результате преобразования F) дать величину х\. Далее квадратичную форму G) можно невырожденным преобразо- преобразованием привести к каноническому виду, поскольку дело свелось к пер- первому случаю: коэффициент при х\ отличен от нуля. Тем самым рассуждения по индукции завершены и теорема дока- доказана. 3. Замечание. Из доказательства видно, что квадратичную фор- форму с действительными коэффициентами можно привести к канониче- каноническому виду с помощью невырожденного линейного преобразования, которое также имеет действительные коэффициенты. § 6. Нормальный вид квадратичной формы 1. Пусть квадратичная форма f(x) приведена к каноническому виду г f(x) = ^ацх1, A) г=1 где аи, ..., агг ф 0, г — ранг f(x). 2. Допустим, что мы имеем дело с комплексным пространством и разрешаем себе пользоваться линейными преобразованиями с ком- комплексными коэффициентами. Положим hi = y/auxi, если г ^ г, \yi = Х{, если г > г.
120 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV Из A) и B) получим f(x) = y21+--- + y2r, C) считая, что 2/i, ..., yrj yr+i, • • •, Уп ~ новые координаты вектора х. Выражение C) называется нормальным видом квадратичной формы f(x). Заметив, что преобразование B) невырождено, сделаем вывод: В комплексном пространстве всякую квадратичную форму можно с помощью невырожденного линейного преобразования привести к нор- нормальному виду C). 3. Ограничимся теперь действительными пространствами и дей- действительными линейными преобразованиями. Учитывая, что среди ко- коэффициентов аи могут быть отрицательные, положим [Vi = \yi = xi, если г ^ г, если г > г. Если первые к коэффициентов аи положительны, а остальные отри- отрицательны, то из A) и D) мы получим f(x) = у\ + • • • + у\ - у2к+1 у2г. E) Выражение E) также называется нормальным видом формы f(x). Та- Таким образом, в действительном пространстве с помощью невырожден- невырожденных действительных линейных преобразований всякую квадратичную форму можно привести к нормальному виду E). 4. В следующем параграфе мы докажем, что в действительном пространстве число положительных и число отрицательных членов в формуле E) не зависит от того, каким именно (действительным) пре- преобразованием квадратичная форма приведена к нормальному виду. § 7. Закон инерции квадратичных форм 1. Пусть в действительном пространстве дана квадратичная фор- форма ранга г: где {xi} — координаты вектора х в некотором базисе ei, ..., еп. Пусть ei, ..., ёп — какой-нибудь базис, в котором f(x) имеет нор- нормальный вид: f(x) = у\ + • • • + у\ - у2к+1 2/2. A) Здесь {yi} — координаты вектора х в базисе ei, ..., ёп. 2. Число положительных и число отрицательных членов в фор- формуле A) называется соответственно положительным и отрицательным индексом формы; разность между положительным и отрицательным индексом называется ее сигнатурой.
§7] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ 121 3. Теорема (закон инерции квадратичных форм). Положитель- Положительный и отрицательный индексы являются инвариантами квадратич- квадратичной формы, то есть не зависят от выбора базиса, в котором она име- имеет нормальный вид. Доказательство. Пусть имеется еще один базис ё\, ..., ёп, в котором форма f(x) имеет нормальный вид: f(x)=zf + ... + zl-zl+1 zl B) где {zi} — координаты х в базисе ei, ..., еп. Нужно доказать, что к = т. Предположим, что к ф т, например, к > т. Рассмотрим формулы преобразования координат Заметим, что матрица Q коэффициентов Qij невырождена. Подставим выражения C) в формулу B). Мы должны получить выражение A); таким образом, имеем тождество 4 + ' ' ' + Zm ~ *m+l 4 = Vl + ' ' ' + У к ~ Ук+1 У г D) т. е. равенство, верное при любых у\, ..., yrj yr+i, • • •, Уп, считая, что zi, ..., zn выражены через у\, ..., уп с помощью C). Составим вспомогательную однородную систему уравнений н ь Qikyk = о, Л \ E) Qmiyi Н \~ ЯткУк = 0. J В системе E) число неизвестных больше числа уравнений вследствие предположения к > т. Поэтому система E) имеет нетривиальное ре- решение 2/i, ..., уи- Подставим это решение в тождество D), взяв допол- дополнительно ук+1 = . . . = уг = уг+1 = . . . = уп = 0. F) В результате, учитывая C), E) и F), получим Однако это невозможно, так как левая часть G) строго положительна, тогда как правая либо отрицательна, либо равна нулю. Значит, к не может быть больше т. Совершенно аналогично устанавливается, что т не может быть больше, чем к. Поэтому к = т. Теорема доказана.
122 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV § 8. Приведение квадратичной формы к каноническому виду методом Якоби 1. Пусть дана квадратичная форма /(ж), которая расписана в ко- координатах в некотором базисе ei, ..., еп: f(x) = а(х,х) = Как известно, Составим матрицу квадратичной формы f(x): А = Рассмотрим так называемые главные миноры матрицы А: аи О>21 О>31 &22 ^32 ^23 ^33 ... din ... а2п ... a3n Ai = an, Д2 = an ai2 B21 ^22 Аз = ^22 ^23 A) , ..., An = Det Л. Кроме того, для удобства записи дальнейших формул введем величину До, считая До = 1. Метод Якоби проходит в предположении, что все главные миноры матрицы А отличны от нуля: Д1#0, Д2#0, ...,Д„#0. B) При этих предположениях ищется специальный новый базис такой, чтобы е' = " е2 = Л \~ C) е'п = Pniei + РП2в2 Н \~ Pnnen > Для того чтобы привести квадратичную форму f(x) к канониче- каноническому виду, достаточно для любого к A < к ^ п) обеспечить условия а(е[, е'к) = a'ik=0 при г = 1, 2, . . . , к - 1. D) Тогда а^ тоже будут равны нулю (вследствие симметричности матри- матрицы квадратичной формы), и отличными от нуля окажутся лишь коэф- коэффициенты при квадратах числовых аргументов.
МЕТОД ЯКОБИ 123 2. Заметим, что для выполнения условий D) достаточно потребо- потребовать соблюдения равенств а(е{,е'к) = О, г = 1, 2, . . ., к - 1, к = 1, 2, . . . , п. E) В самом деле, из E) и C) имеем а(е-, е'к) = a{Pile1 -\ Ь P;;e;, е'к) = = P;ia(eb е'А) + • • • + Рца{еи е'к) = 0. Для упрощения дальнейших выводов добавим к E) дополнительное равенство а(ек, е'к) = 1. F) 3. При к = 1 условия E) исчезают и остается только F), из кото- которого, с учетом первой строчки формул C), находим 1 = а(еи е[) = Рца(еи ех) Отсюда поскольку аи т^ 0. Учитывая обозначения A), можно написать р -До 4. Дальше будем проводить рассуждение по индукции. Допустим, что уже определены все коэффициенты, входящие в первые к — 1 строк формул C). Для нахождения коэффициентов, входящих в строку с но- номером к, запишем условия E) и F) вместе: а(еь е'к) =0, . . . , а(е^_ь е'к) = 0, а(ек, ек) = 1. G) Отсюда, используя C), получим для искомых коэффициентов систему уравнений Gа) + Q>kk Определитель системы Gа) совпадает с Д& и отличен от нуля вслед- вследствие предположения B). Поэтому искомые коэффициенты Pki, ... . . ., Pkk найдутся. Остается проверить, что построенное преобразова- преобразование невырождено. С этой целью найдем из системы Gа) коэффициент к- Применяя правило Крамера, получим ац . . . п\ к — 1 О a ki йк-1к-1 0 О-кк-1 1 (8)
124 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV Далее, используя треугольную структуру матрицы преобразования C), найдем определитель D этой матрицы: п- р р р - А° Al А—1 - г Таким образом, D ф О, а значит, преобразование C) невырождено. 5. Теперь мы можем определить и коэффициенты квадратичной формы в новом базисе е[, ..., е'п. Достаточно вычислить лишь диа- диагональные коэффициенты, так как остальные заведомо равны нулю. Используя C), G) и (8), находим а'кк = a(e'ki е'к) = o,(Pkiei + • • • + Рккек, е'к) = , е'к) = Ркк = Значит, в базисе, который построен по методу Якоби, %) = д-(Ж1Г + л~(Ж2) + ' ' ' + "Г § 9. Положительно определенные и отрицательно определенные квадратичные формы 1. В этом параграфе мы будем рассматривать только действитель- действительные пространства. Пусть в линейном пространстве, хотя бы бесконечномерном, задана квадратичная форма f(x). Определение 1. Форма f(x) называется положительно опре- определенной, если f(x) > 0 для всех х ф в. Заметим, что /(#) = 0 всегда. В самом деле, так как в = 0 • z и /(ж) = а(х, х), где z — произвольный вектор, а(х, у) — билинейная функция, то /@) = a@-z,0-z)=0- a(z, z) = 0. Определение 2. Квадратичная форма f(x) называется отри- отрицательно определенной, если f(x) < 0 для любого х ф в. Очевидно, что достаточно рассмотреть положительно определен- определенные формы, поскольку отрицательно определенные получаются из них сменой знака. 2. Ограничиваясь квадратичными формами в конечномерных (п- мерных) пространствах, укажем прежде всего ряд простых необходи- необходимых признаков положительной определенности. Пусть в каком-нибудь базисе ei, ..., еп дана квадратичная форма f(x) = а(х, х) = ^aikXiXk. Как нам известно, aik = a(e^, ек).
§9] ЗНАКООПРЕДЕЛЕННЫЕ КВАДРАТИЧНЫЕ ФОРМЫ 125 1) Если f(x) является положительно определенной, то ац > 0 при всех г = 1, 2, ..., п. Доказательство. ац = а(е;, е;) = /(е;) > 0. Замечание. Это условие вовсе не достаточно для положительной определенности формы. Пример: форма f(x) = х\ + 1000 Ж1Ж2 + х\ имеет ац = 1 > 0, но на векторе (—1, 1) принимает отрицательное значение. 2) Если форма f(x) положительно определена, то определитель ее матрицы положителен: А = Det A > 0. Для доказательства приведем f(x) к каноническому виду. Пусть е[, ..., е'п — канонический базис, т.е. базис, в котором f(x) имеет канонический вид: Д' = = а'„ ...а' > 0. ПП Согласно предыдущему пункту все а\{ > 0. Обозначим через А' определитель матрицы формы f(x) в канони- каноническом базисе. Имеем 0 0 ' ¦ <г С другой стороны, по формуле D) § 3 Д' = A(DetPJ, значит, А > 0. Замечание. И это условие не является достаточным для поло- положительной определенности квадратичной формы. Пример: форма имеет А > 0, однако f(x) ^ 0. 3) В n-мерном пространстве каждая положительно определенная форма имеет ранг п. Доказательство вытекает из неравенства А ф 0. 3. Теорема (критерий Сильвестра). Для положительной опре- определенности квадратичной формы необходимо и достаточно, чтобы все главные миноры ее матрицы были положительны. Доказательство необходимости. Пусть форма /(х) по- положительно определена. Возьмем произвольный базис ei, ..., е&, ... . . ., еп и построим линейную оболочку L(ei, . . ., е&). Будем теперь рассматривать квадратичную форму f(x) не на всем пространстве, а лишь на подпространстве L(ei, . . . , е&).
126 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV Если х е L(ei, . . ., ek)j то х = {хи . . ., хку О, . . . , 0} и к П*) = ' Все остальные члены, у коэффициентов которых хотя бы один из двух индексов больше к, исчезают за счет нулевых значений координат. Форма f(x) на подпространстве L(ei, . . ., ек) является положи- положительно определенной, так как она положительно определена на всем пространстве. Поэтому определитель формы /(ж), рассматриваемой на L(ei, . . ., ек), положителен: аи > 0. ак\ ... а* Но Ак — главный минор порядка к матрицы квадратичной фор- формы /(ж), индекс к может принимать значения 1, 2, ..., п. Тем самым необходимость признака доказана. Доказательство достаточности. Пусть Д/, > 0 при к = = 1, ..., п. Приведем квадратичную форму к каноническому виду методом Яко- би. Получим %) = д-(Ж1Г + л~(Ж2) + ' ' ' + "Г Ы • Если ж ф в, то хотя бы одна из координат ж^ т^ 0? и? следовательно, /(ж) > 0. Теорема доказана. 4. Обратим внимание на двумерный случай. Пусть / = ах2 + 2Ьху + су2, где на этот раз числовые аргументы формы обозначены через х, у. Условие Сильвестра сводится к неравенствам а > 0, a b b с = ас- Ь2 > 0. Разумеется, в двумерном случае теорему Сильвестра можно устано- установить без какой-либо специальной теории, поскольку для положитель- положительной определенности необходимо а > 0 и при а > 0 f = 1[(ах + ЬуJ + (ас - Ь2)у2]. а § 10. Определитель Грама. Неравенство Коши—Буняковского 1. Предположим, что в произвольном линейном пространстве L (может быть, бесконечномерном) дана квадратичная форма f(x) = = а (ж, х) и конечная система векторов pi, ..., рк.
НЕРАВЕНСТВО КОШИ-БУНЯКОВСКОГО 127 Определение. Определителем Грама для квадратичной фор- формы а(х, х) и системы векторов р\, ..., р& называется величина С определителями такого вида приходится часто иметь дело в ма- математической физике и интегральных уравнениях. 2. Теорема. Пусть пространство L действительно, а квадра- квадратичная форма а(х, х) положительно определена. Тогда, если векторы Pi, ..., ри линейно независимы, то G{p\, . . ., р&) > 0. ifo/ш векторы Pi, ..., pk линейно зависимы, то G{p\, . . ., pk) = 0. Доказательство. 1) Пусть векторы р\, ..., рк линейно неза- независимы. В таком случае они составят базис в своей линейной оболочке L(pi, . . . , pk). Произвольный вектор х Е L(pi, . . . , рк) можно запи- записать в виде х = xipi -\ Ь xkPk- Будем рассматривать f(x) на векторах из Ь(р±, . . . , р/,). В базисе pi, ..., рк имеем (даже если исходное пространство L бесконечномерно). Так как f(x) положительно определена на всем пространстве L, то она положительно определена и на подпространстве L(pi, . . . , Р&), так что ц ... а1к > 0. A) Заметим, что а^- = ft(pi5 Pj)- Отсюда и из A) G(pu ..., рк) = Ак > 0. 2) Пусть теперь р\, ..., pk линейно зависимы. Тогда найдутся числа Ai, ..., А&, не все равные нулю, для которых Учтем, что и подставим в это тождество X =Pi, H \- ХкРк = 0. а(х, в) = 0 H \- ХкРк-
128 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV Придавая г значения 1, . . ., к, получим однородную систему к линей- линейных уравнений с к неизвестными pi) Н \- Xkd(pi,Pk) = О, i) H Ь Хка(Рк,Рк) = 0. Эта система заведомо имеет нетривиальное решение Ai, ..., А&. Поэто- Поэтому ее определитель равен нулю: G(pu ...,рл) = 0. Теорема доказана. 3. Важный частный случай. В условиях доказанной тео- теоремы рассмотрим систему, состоящую из двух векторов pi, pi- Имеем PbPi) а(р1,р2) P2,Pi) a{P2,P2) Если раскрыть этот определитель, учитывая симметричность билиней- билинейной формы, то получится неравенство [a(pi, P2)f ^ a(pi, Pi) ' a(p2, р2), B) которое называется неравенством Коши-Буняковского. При этом знак равенства имеет место тогда и только тогда, когда векторы р\ и р2 линейно зависимы. 4. Рассмотрим пространство непрерывных функций, заданных на каком-нибудь отрезке t\ ^ t ^ t^- В этом пространстве рассмотрим квадратичную форму f(x) = / [x(t)r dt ti (в связи с этим см. выше, §4, п. 4). Для f(x) полярной билинейной формой является ?2 а(х,у) = / x(t)y(t)dt. Нетрудно сообразить, что f(x) положительно определена. В самом де- деле, если непрерывная функция x(t) отлична от тождественного нуля, то f[x(t)]2dt>0.
§11] НУЛЕВОЕ ПОДПРОСТРАНСТВО 129 Поэтому в данном случае можно применить неравенство A). В ре- результате получим неравенство Коши-Буняковского для интегралов: t2 x(t)y(t) dt Jl 2 t2 t2 J J 2 2 J[x(t)}2 dt • J[y(t)}2 dt. C) Знак равенства в формуле C) имеет место в том и только в том случае, когда система x(t), y(t) линейно зависима, или, проще сказать, когда одна из функций x(t), y(t) пропорциональна другой (например, y(t) = = Cx(t), С = const). Этот пример показывает, как алгебраические теоремы работают за пределами собственно алгебры и дают возможность получить резуль- результаты из анализа. Общей основой таких приложений является постро- построение в бесконечномерном функциональном пространстве конечномер- конечномерных линейных оболочек. § 11. Нулевое подпространство билинейной и квадратичной формы 1. Пусть а(ж, у) — билинейная форма, заданная в пространстве L. Определение 1. Будем называть правым нулевым подпрост- подпространством формы а(х,у) множество всех элементов у, для каждого из которых при любом х Е L соблюдается равенство а(х, у) = 0. (*) Это определение, очевидно, не зависит от размерности и может быть использовано в бесконечномерном случае. Правое нулевое подпространство будем обозначать Lq. Аналогично определим левое нулевое подпространство Lq, именно: у Е Lo, если а(у, х) = 0 при любом х G L. 2. Докажем прежде всего, что Lq на самом деле является линейным подпространством. Пусть у\,у<х G Lq. Тогда а(ж, у\) = 0, а(ж, у%) = 0 при любом х. Но отсюда следует, что а(х, у\ + 2/2) = а(х, yi) + а(х, у2) = 0, а(х, аух) = аа(х, 2/1) = 0. Таким образом, у\ + 2/2 G Lq и ау\ G Lq. Совершенно аналогично доказывается, что подпространством яв- является И Lq. 3. Далее будем рассматривать n-мерное пространство. Зафиксиру- Зафиксируем в нем базис ei, ..., еп и запишем билинейную форму в координатах: а(х> У) = где aij = а(е{, ej). 5 Н.В. Ефимов, Э.Р. Розендорн
130 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV Покажем, что у Е Щ тогда и только тогда, когда ^аИУз=й A) при всех значениях г {г = 1, 2, ..., п). Для этого напишем тождество г,3 г j Если выполняются условия A), то выполняется и (*). С другой сто- стороны, из условия (*) следует, что в правой части равенства (а) все коэффициенты при Xi обращаются в нуль, а это и дает нам систему A). Точно также, у Е Lf0 тогда и только тогда, когда = 0 B) при всех значениях j' (j' = 1, 2, ..., n). Равенства A) и B) представляют собой системы уравнений, опре- определяющие Lq и Lq в координатах. По теоремам о линейных системах (см. гл. III) (размерность Lo') = = (размерность Lf0)= п — г, где г — ранг билинейной формы а(х, у), т. е. ранг ее матрицы. Отсюда следует, что ранг билинейной формы можно определить геометрически. Именно, ранг формы а(х, у) равен разности между размерностью всего пространства и размерностью нулевого подпро- подпространства этой формы (какое здесь брать нулевое подпространство — правое или левое, — безразлично, так как их размерности одинаковы). 4. Определение 2 . Билинейная форма называется невырож- невырожденной, если размерность L'o или Lq равна нулю. В остальных случаях билинейная форма называется вырожденной. Иначе говоря, билинейная форма вырождена, если ее нулевые под- подпространства имеют ненулевую размерность, или (что то же самое) если ее ранг меньше размерности пространства: г < п, или если опре- определитель ее матрицы равен нулю: А = Det A = 0. 5. Предположим, что билинейная форма а(х, у) вырождена, т.е. ее ранг г < п. Введем в пространстве специальный базис ei, в2, ..., еп такой, чтобы er+i, ..., еп Е Lq. Для этого нужно сначала выбрать ли- линейно независимые векторы из Lq (число их как раз равно размерности Lq), а затем дополнить их до базиса во всем пространстве. Посмотрим, как при таком выборе базиса будет выглядеть матрица билинейной формы. Если j = г + 1, ..., п, то вследствие определения Lq
ill] НУЛЕВОЕ ПОДПРОСТРАНСТВО 131 Таким образом, А = а1г 0>21 О О Матрица упрощается, причем тем сильнее, чем ниже ранг билинейной формы (чем выше размерность нулевого подпространства). Если выбрать базис так, чтобы последние п — г базисных векторов попали в левое нулевое подпространство, то это тоже приведет к упро- упрощению матрицы, но теперь в нуль обратятся не столбцы, а последние строки в числе п — г: А = аг1 О О Пусть билинейная форма симметрична, тогда Lf0 совпадает с Lq (докажите). Поместим базисные векторы er+i, ..., еп в Lf0. Тогда эти же векторы окажутся в Lq , и матрица примет особенно простой вид А = air О О аг\ . . . агг О ... О о ... о о ... о о о о ... о C) Таким образом, если ранг г симметричной билинейной формы мень- меньше п, то ее рассмотрение полностью сводится к подпространству раз- размерности г (натянутому на ei, ..., ег). 6. Рассмотрим теперь квадратичную форму f(x) = а(ж, х). Определение 3. Нулевым подпространством квадратичной формы называется нулевое подпространство Lq ее полярной формы а(х, у). Различать L'o и Lq здесь нет надобности, так как L'o = Lq. Если квадратичная форма невырождена, то ее нулевое подпростран- подпространство нульмерно. Если форма вырождена, то ее ранг г < n, a Lq имеет размерность п — г.В базисе ei, ..., еп, векторы er+i, ..., еп которого помещаются в Lq, матрица квадратичной формы имеет вид C), и форму f(x) можно рассматривать в r-мерном подпространстве L(ei, . . ., ег).
132 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV Рис. 24. § 12. Нулевой конус квадратичной формы 1. Наряду с данным линейным пространством L будем рассматри- рассматривать аффинное пространство il, считая, что элементами L являются радиус-векторы точек из il. 2. Определение. Множество точек аффинного пространства называется конусом с вершиной О, если вместе с каждой своей точкой М, не совпадающей с О, оно содержит всю прямую ОМ (при п = 3 см. рис. 24). В некоторых случаях одну точку О удоб- удобно рассматривать как конус, состоящий толь- только из вершины. Простейшими примерами конусов могут служить любая плоскость, проходящая через точку О, а также все про- пространство il. 3. Пусть в пространстве L дана квадра- квадратичная форма f(x). Ее можно рассматри- рассматривать и в аффинном пространстве il, считая, что значение f(x) в точке М определяется при х = ОМ, т.е. равно f(OM). Обозначим через Ко множество всех точек аффинного простран- пространства, в которых квадратичная форма/(х) равна нулю (М Е Ко, если Пом) = о). Теорема 1. Множество Ко представляет собой конус с вершиной в начале координат. Доказательство. Может случиться, что Ко состоит из одной точки О (например, если пространство действительное, а форма f(x) положительно определена). Тогда утверждение верно, поскольку мы условились одну точку рассматривать как конус. Предположим, что существует точка М ф 0, для которой /(х)=0 Рис. 25. 7ТТ7 при х = ОМ. Проведем через О и М прямую и возьмем на ней любую точку М* (рис. 25). Положим ОМ* = х*. Тогда х* = Аж, где А — некоторое число. Следовательно, /(ж*) = f(\x) = а(\х, Хх) = \2а(х, х) = X2f(x) = 0. Таким образом, с каждой точкой М ф 0 множество Ко содержит и все точки прямой ОМ (рис. 25).
§ 13] ПРИМЕРЫ НУЛЕВЫХ КОНУСОВ 133 4. Определение. Множество Kq называется нулевым конусом квадратичной формы f(x). 5. Следует обратить внимание на то, что конус не является, вооб- вообще говоря, линейным подпространством: если f(x) = 0, f(y) = 0, то может быть f(x + у) ф 0. 6. Теорема 2. Нулевое подпространство квадратичной формы всегда является частью нулевого конуса этой формы: Lo С Ко. Замечание. Lq определено как множество векторов в линейном пространстве, a Kq — как множество точек в аффинном пространстве. Поэтому, говоря о включении Lq С Kq, нужно подразумевать, что Lq есть точечное множество концов радиус-векторов из нулевого под- подпространства. Доказательство теоремы. Пусть у ? Lq, у = ОМ. Тогда а(ж, у) = 0 для любого х. Положим х = у; получим а(у, у) = f(y) = = 0. Следовательно, у Е Kq в том смысле, что М Е Kq, где М — конец вектора у. § 13. Простейшие примеры нулевых конусов квадратичных форм 1. Рассмотрим более подробно частные случаи, встречающиеся в элементарной аналитической геометрии. Будем считать, что квад- квадратичная форма не равна нулю тождественно и приведена к нормаль- нормальному виду. 2. Действительная плоскость (п = 2). 1) f(x) — х\ — х\. Здесь г = 2 и размерность Lq равна нулю. Сле- Следовательно, Lq СОСТОИТ ТОЛЬКО ИЗ Нулевой Х\ = —Ж2 точки. Нулевой конус Kq определяется уравнением х\ — х\ — 0 и распадается на две прямые: х\ — Х2, х\ — —х^. Из-за малой размерности конус не является поверхностью, а представляет собой линию, состоящую из двух пересекающихся прямых (рис. 26). 2) f(x) = х\ + х\. Здесь также г = 2 и размерность Lq равна нулю. Нулевой конус Рис. 26. определяется уравнением х\-\-х\ — 0 и состоит из одной точки. Иногда говорят, что такое уравнение определяет мнимый конус. 3) f[x) = х\. Здесь г = 1, размерность Lq равна 1. Конус Kq опре- определяется уравнением х\ = 0, следовательно, Kq состоит из точек, для которых х\ = 0. Нетрудно сообразить, что в данном случае Lq должно совпадать с Kq. В самом деле, размерность Lq равна 1, а по преды- предыдущему Lq должно войти в нулевой конус, так что Lq и будет един-
134 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. IV ственной прямой х\ — О, содержащейся в Kq. Конус Kq определяется уравнением второй степени. В рассматриваемом случае говорят, что у Kq каждую точку оси х<± нужно считать дважды. В записи квадратичной формы участвует только один квадрат: х\. Это произошло потому, что базисный вектор е^ помещен в нулевое под- подпространство. 3. Трехмерное действительное пространство (п = 3). 1) f(x) = х\ + х\ — х\. Здесь г = 3 и размерность Lq равна нулю. Нулевой конус определяется уравнением х\ + х\ — х\ — 0. Если рассматривать пространство с элементарной точки зрения, с углами, расстояниями и т.п., то такое уравнение определяет круг- круглый конус с осью на оси х% и прямым углом между образующими. Евклидово пространство в данном случае служит моделью линей- линейного пространства. Однако нужно иметь в виду, что в линейном (и в аффинном) пространстве не определены углы, нет правила измерения расстояний и потому не имеет смысла понятие «круглый конус». Все же это не препятствует использованию евклидова пространства в каче- качестве модели линейного (или аффинного) пространства. Дополнитель- Дополнительные свойства евклидова пространства только помогают наглядности описаний. 2) f(x) = х\ + х\ + х\. Здесь г = 3, размерность Lq равна нулю, конус Kq определяется уравнением х\ + х\+х\ = 0. Это — мнимый конус; в действительном пространстве он имеет одну только нулевую точку. 3) f(x) = х\ + х\. Здесь г = 2, размерность Lo равна 1. Таким об- образом, Lq представляет собой одномерное линейное подпространство, т. е. прямую, проходящую через начало координат. Конус Kq опреде- определяется уравнением х\ + х\ = 0 и состоит из точек вида @, 0, жз), т. е. представляет собой множество точек третьей оси. Так как Lq С Ко, то ясно, что Lq — та же самая прямая (третья координатная ось). Только следует иметь в виду, что в Kq каждая точка этой прямой считается не один, а два раза. Заметим, что третий базисный вектор ез помещен в Lq. Поэтому в представлении формы исчезло все, что связано с третьей координатой. 4) f(x) — х\ — х\. Здесь г = 2, размерность Lo равна 1. Конус Kq определяется уравнением х\ — х\ — 0. Левая часть этого уравнения разлагается на два множителя первой степени, так что конус Kq со- состоит из двух плоскостей. В качестве модели линейного пространства будем рассматривать евклидово пространство. Тогда Kq изобразится в виде пары плоскостей, которые проходят через ось жз, пересекаются под прямым углом и пересекают плоскость х<$ — 0 по биссектрисам координатных углов (рис. 27).
¦13] ПРИМЕРЫ НУЛЕВЫХ КОНУСОВ 135 В этом примере подпространство Lq можно найти двумя способами: путем вычислений или из геометрических соображений. Рассмотрим оба пути. Рис. 27. Запишем полярную билинейную форму и приравняем ее нулю: xiyi - х2у2 = 0. Нужно найти такие у = (?/i, у2, Уз), для которых это уравнение соблю- соблюдается при любом х = (#i, X2-, жз). Ясно, что у\ — у2 = 0, а уз может принимать любые значения. Таким образом, Lq совпадает с третьей координатной осью. Получить этот результат геометрическим путем, как делалось в предыдущем примере, непосредственно нельзя. Известно, что Lq — прямая, проходящая через начало координат, но таких прямых в Kq много, и выделить одну из них в качестве Lq сразу не удается. Однако можно поступить иначе. Заметим, что в запись квадратич- квадратичной формы не входит третья координата. Это значит, что третий ба- базисный вектор помещен в Lq. Ввиду одномерности нулевого подпро- подпространства отсюда следует, что оно совпадает с третьей координатной осью. 5) f(x) = х\. Здесь г = 1, размерность Lq равна 2, конус Ко имеет уравнение х\ = 0 и является плоскостью х\ = 0 (дважды взятой). Геометрически Lq представляет собой ту же самую плоскость х\ — 0. 4. Замечание. Выше рассмотрены все варианты, которые могут встречаться при изучении Lq и Kq в двумерном и трехмерном действительных пространствах. В самом деле, произвольную квадра- квадратичную форму можно привести к каноническому виду, а затем, если понадобится, умножить на (—1). Тем самым дело сведется к одному из рассмотренных выше случаев.
ГЛАВА V. ТЕНЗОРНАЯ АЛГЕБРА § 1. Взаимные базисы. Контравариантные и ковариантные векторы 1. Пусть L — линейное n-мерное пространство, L* — сопряженное ему (т. е. пространство всех линейных форм, заданных на L; см. выше, §1 предыдущей главы). Введем в L произвольный базис ei, ..., еп. Координаты произвольного вектора х из L в базисе ei, ..., еп будем обозначать {ж1, . . ., хп}. В сопряженном пространстве выберем базис е1 (х), ..., еп (х) так, чтобы значения линейных форм ег (х) на векторах ej образовали единичную матрицу: е\е>) = 5), A) где Sj — символ Кронекера Ej = 1 при г = j, 81- = 0 при г ф j). Определение. Базис е1 (х), ..., еп(х) в L*, удовлетворяющий условиям A), называется взаимным с данным базисом ei, ..., еп в L. Из определения следует, что для данного базиса существует един- единственный взаимный базис и что он задается формулами е\х) = 1-х1 +0-ж2 +••• + ()-жп v е2(х) = 0-ж1 + 1'Х2 + '- + 0-хп еп(х) = 1-хг 2. В пространстве L перейдем к новому базису е[, ..., е'п. Для удобства дальнейших обозначений формулы (I) из § 5 гл. II мы запишем теперь несколько иначе, именно: e-/=Vp?,e- (I) Здесь и далее мы помечаем штрихами индексы, относящиеся к ново- новому базису; никакого другого специального смысла символам 1', 2', ... . . ., п' мы не придаем, так что V = 1, 2' = 2, ..., п' = п. Теперь в матрице Р по строкам изменяется верхний индекс, по столбцам из- изменяется нижний индекс: pi р2 туп rv rv ... rv pi p2 pn p г о' го' • • • го' г>1 р2 тэп Гп' Гп' ' ' ' Гп' Пусть произвольный вектор х из L разложен по старому и по ново- новому базисам: х = х1е\ + • • • + хпеп = х1 еу + • • • + хп еп>.
§ 1 ] КОНТРАВАРИАНТНЫЕ И КОВАРИАНТНЫЕ ВЕКТОРЫ 137 Формулу (III) из § 5 гл. II, выражающую новые координаты через ста- старые, запишем так: :/=5>*У. (II) Матрицу коэффициентов правых частей равенств (II) будем обозна- обозначать через Q. При этом нужно считать, что верхний индекс изменяется по столбцу, а нижний — по строке: Q\' Qt ••• Ql Q= Qt q% ... Qt Qi Qi ... Qi При указанной здесь расстановке индексов и в матрице Р, и в мат- матрице Q штрихованный индекс означает номер строки, нештрихованный индекс — номер столбца. Равенства Q = (P*)-\ P=(Q*)~1 B) остаются в силе, а формулы D) из § 5 гл. II принимают вид Соотношениями B) и C) мы часто будем пользоваться ниже, не огова- оговаривая этого дополнительно. 3. В сопряженном пространстве L* возьмем базис е1 (ж),..., еп (ж), взаимный с новым базисом в L, т.е. удовлетворяющий условиям ек\ег,) = 5?,'. D) Найдем формулы перехода от базиса ек(х) к базису ек' (х). Заведо- Заведомо справедливы соотношения вида kek(x) E) с некоторыми коэффициентами А\ . Поэтому дело сводится к вычис- вычислению коэффициентов А\ по заданным Р\,. Из D), E), (I) и A) имеем Следовательно, Y<P? = 4- F) Обозначим матрицу искомых коэффициентов правых частей E) через Л, считая, что штрихованный индекс означает номер строки, нештри- нештрихованный означает номер столбца, т. е. изменяется по строке. Тогда все
138 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V равенства F) равносильны одному матричному равенству ЛР* = Е, G) где, как обычно, звездочка означает транспонирование. Из G) получа- получаем = Q. Таким образом, (Г) 4. Пусть произвольная линейная форма п(ж), т.е. элемент про- пространства L*, разложена по старому и по новому базису: и(х) = Uie1(x) + Ь ипеп(х) = иуе1 (х) + • • • + ип>еп (х). Найдем формулы, которые выражают новые координаты формы и(х), т.е. коэффициенты разложения и(х) по базису ег (ж), через ее старые координаты. Для этого вспомним, что коэффициенты искомых фор- формул составляют матрицу, обратную и транспонированную к матрице формул (I*). Но обращение и транспонирование матрицы Q дает Р. Таким образом, 5. Мы видим, что формулы (I*) и (II*) получаются из известных нам формул (I) и (II), если поменять ролями матрицы Р и Q. 6. Для большей наглядности приведем следующую схему. В пространстве L х = xxt\ + • • • + хпеп G L x{l = YJQii^i x = x1 ey + • • - + xn en> G L Q = (P*r1 В пространстве L* ei\x)=YdQUi{x) u(x) = Uie1(x) + • • • ••• + unen(x) GL* u(x) = uye1 (x) + • • • Vun>en' (x) e L* P = @*)
§ 1 ] КОНТРАВАРИАНТНЫЕ И КОВАРИАНТНЫЕ ВЕКТОРЫ 139 7. Назовем сверткой элемента а = axt\ + • • • + апеп из L с элемен- элементом и(х) = и\е1{х) + • • • + ипеп(х) из L* число, которое обозначается через (а, п) или (и, а) и определяется равенством (а, п) = Очевидно, что свертка есть инвариант, поскольку она представляет собой не что иное, как значение инвариантной формы п(ж) = и\хх + • • • • • • + ппжп на векторе х — а = a^i + • • • + апеп. Инвариантность свертки можно вывести также как следствие фор- формул (II) и (II*). В самом деле, а,C к 8. Очевидно, что свертка обладает следующими двумя свойствами: А) При умножении и или х на число свертка (п, х) умножается на то же число: (аи, х) = (и, ах) = а(и, х). Б) Свертка распределительна по сложению: (и + и', х) = (п, х) + (г/, ж), (п, х + х') = (и, х) + (п, х'). 9. Обратим внимание на полную симметрию взаимоотношений L и L*. Рассмотрим свертку (п, ж) = и\хх + • • • + ипхп. Если здесь элемент и из L* фиксирован, а х = {ж1, . . ., жп} из L про- произвольно изменяется, то свертка (п, х) представляет собой линейную форму с числовыми аргументами х1, ..., хп, принятую в качестве и. При этом L можно считать координатным пространством. Ничто не мешает нам, однако, считать также и элементом координатного про- пространства, именно тем элементом, который определяется коэффициен- коэффициентами формы (п, ж), и писать и = {ni, . . ., ип}. Будем теперь предполагать, что фиксирован элемент х = {ж1, . . . . . ., х71} из L, а меняется и = {ni, . . ., ип}. В таком случае свертка (и, х) есть линейная форма с числовыми аргументами щ, ..., ип. Мы можем принять в качестве х не набор х = {ж1, . . ., х71} коэффициен- коэффициентов этой формы, а саму форму. Тем самым элементы х G L получают точно такое же истолкование по отношению к элементам и G L*, ка- какое элементы и G L* имеют по отношению к элементам х G L. Иначе говоря, если пространство L* есть сопряженное для L, то L можно рассматривать как сопряженное для L*.
140 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V 10. Симметрия взаимоотношений L и L* уже усматривалась вы- выше при переходе от формул (I), (II) к формулам (I*), (II*) (см. также таблицу, приведенную в п. 6). Наряду с этим следует иметь в виду, что одно из пространств L и L* (именно L) принято в качестве исходного. Это обстоятельство сказывается на терминологии, о которой говорится в следующем пункте. 11. Преобразование по формуле (I) с матрицей Р называется пре- преобразованием по ковариантному закону. Преобразование по формуле (II) с матрицей Q называется преобра- преобразованием по контравариантному закону. В данном пространстве L координаты каждого вектора преобра- преобразуются по контравариантному закону. В сопряженном пространстве координаты векторов преобразуются по ковариантному закону. В соответствии с этим векторы данного пространства L принято называть контравариантными, а элементы сопряженного пространства — ковариантными векторами. 12. В тензорном исчислении принято в случае ковариантного зако- закона преобразования пользоваться нижними индексами, а в случае кон- травариантного закона преобразования пользоваться верхними индек- индексами. В соответствии с этим мы пометили верхними индексами коор- координаты векторов из L. Расстановка индексов у элементов матриц Р и Q делается с таким расчетом, чтобы индекс суммирования, дважды встречающийся в вы- выражении общего члена суммы, один раз был нижним индексом и один раз — верхним (см. таблицу п. 6). Если же под знаком суммы имеются свободные индексы, по которым нет суммирования, то такие же индек- индексы (соответственно верхние или нижние) ставятся у величины, полу- полученной в результате суммирования. Соблюдение этих правил помогает определять законы преобразования величин, получаемых в результате суммирования. Вместе с тем эти правила заставляют, например, обо- обозначать верхними индексами номера базисных ковариантных векторов. 13. Ниже, в пределах этой главы, мы всюду будем считать, что выбираемые в L и L* базисы взаимны. Базис в L*, взаимный с базисом {ei} G L, будем обозначать через {ег} (упрощая прежнее обозначение ег(х)). Произвольный элемент в L* будет обозначаться через и (или v и т. п.) вместо и(х) (или v(x) и т. п.). 14. Новое определение сопряженного простран- пространства. Понятие сопряженных пространств можно изложить несколько иным способом, так что их взаимное равноправие будет видно сразу из самого определения. Пусть L и L* — два линейных пространства; ради простоты изложе- изложения мы с самого начала предположим, что они конечномерны и имеют
§ 1 ] КОНТРАВАРИАНТНЫЕ И КОВАРИАНТНЫЕ ВЕКТОРЫ 141 одну и ту же размерность = п. Предположим, что с любой парой эле- элементов х Е L, и Е L* сопоставлено число; обозначим его через (х, и) и назовем сверткой элементов х, и, если имеют место следующие свой- свойства: 1) Распределительное свойство по каждому элементу: (Х\ + #2, и) = (х\, и) + (#2, и) для любых х, Х\, X2 G L, и, U\, U2 G L*. 2) Сочетательное свойство относительно умножения любого элемен- элемента на число: (ах, и) = (х, аи) = а(х, и). 3) Свойство невырожденности: если а±, ..., ап линейно независимы в L и (ai, n) = 0, ..., (ап, и) = 0, то и есть нулевой элемент в L*. Аналогично, если Ь\, ..., Ьп линейно независимы в L* и (х, Ь\) = 0, ... . . ., (х, Ьп) = 0, то х есть нулевой элемент в L. Пространства L и L* могут быть оба действительными или оба ком- комплексными; соответственно этим двум случаям все числа, о которых здесь говорится, предполагаются действительными или комплексными. Обозначим через е\,..., еп произвольный базис в L, через ё\,..., ёп — произвольный базис в L*. Пусть х = ^жге; G L, и = ^Ukek G L*. Вследствие свойств 1) и 2) имеем / \ X ^ k i (q\ где а\ = (ei, ёк). Таким образом, свертка выражается в виде билиней- билинейной формы (8). Легко убедиться, что свойство 3), т.е. условие невы- невырожденности, означает невырожденность билинейной формы (8). Лег- Легко убедиться также, что свертки (х, и) можно задавать формулой (8) по-разному, произвольно назначая числа ак, лишь бы иметь Det ак ф 0; условия 1), 2), 3) будут при этом соблюдены. Пространства L и L* назовем (взаимно) сопряженными, если для них задана свертка и если они рассматриваются вместе с данной сверткой. При нашем теперешнем определении мы мо- можем для данного L построить бесконечно много сопряженных про- пространств L* (точнее говоря, по-разному сопряженных с L). Желая ис- исключить такую неопределенность, мы определим понятие эквивалент- эквивалентности линейных пространств, сопряженных по-разному с данным L. Обозначим через L\ и L\ два n-мерных пространства, сопряженных с L. Назовем их эквивалентными в смысле сопряженности с L, если между ними существует линейный изоморфизм такой, что (х, и) = (х, и'), (9) где х — произвольный элемент из L, и — произвольный элемент из L\, и' — соответствующий ему по изоморфизму элемент L\.
142 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V Легко убедиться, что все линейные пространства, сопряженные с данным L, эквивалентны между собой. Чтобы доказать высказан- высказанное утверждение, достаточно установить, что если для L и L* дана (произвольная) свертка, то для любого базиса ei, ..., еп Е L найдет- найдется единственный взаимный с ним базис е1, ..., еп в пространстве L*. Иначе говоря, е1, ..., еп Е L* можно найти (единственным образом) так, что (е^, ек) = 5к. Для доказательства рассмотрим произвольный базис ёк, с помощью которого задана свертка формулой (8). Будем искать первый вектор е1 базиса е1, ..., еп в виде е = а,\е + ос^е + • • • + оспеп. Мы должны иметь (ei, е1) = 1, (в2, е1) = 0, ..., (еп, е1) = 0. Отсюда + • • • + аг ап = 1, ¦«?«п = о, A0) a^ai + а2а2 + • • • + a™an = 0. , Система A0) однозначно разрешима, так как Det a\ ф 0. Аналогич- Аналогично, полагая е2 = file1 + • • • + /Зпёп, найдем е2 из условий (ei, е2) = 0, (е2? е2) = 1, ..., (еп, е1) = 0. Продолжая процесс, найдем все векторы е1, ..., еп G L* такие, что (е^, ек) = Jf. Они составят независимую систему. В самом деле, пусть Aie1 + •• • + \пеп = 0* е L*. Свертывая левую и правую части этого равенства с вектором е/. G L, найдем или А^ = 0 (к = 1, 2, ..., п), поскольку (е^, ег) = 8гк и (е^, 0*) = 0. Тем самым доказано, что для любого базиса ei, ..., еп G L существу- существует взаимный базис е1, ..., еп в пространстве L* при любом задании сопряженности между L и L*. Докажем единственность. Допустим, что для данного базиса ei, ... . . ., еп G L найдутся в пространстве L* два взаимных базиса: е\ и е|. Имеем: (е^, е^) = J^ и (е^, е2) = ^^. Отсюда (е^, е^ - е2) = 0 для всех к = 1, ..., п и при любом г = 1, 2, ..., п. Отсюда и по условию невырожденности находим е{ — е\ = 0*, или е2 = е^. Пусть теперь х = ж1в1 + • • • + хпеп GL,u = uie1 + • • - + ипеп G L*, где е^ и е^ — взаимные базисы. Формула (8) теперь принимает вид (ж, и) =хгиг + --- + хпип. A1) Вместе с тем доказана эквивалентность всех пространств, сопряжен- сопряженных с L. В самом деле, пусть L\ и L2 — два пространства, сопряженных
§2] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРОСТРАНСТВ 143 с L, ei, ..., еп — любой базис в L, е1, ..., еп — взаимный с ним базис в L<1, (е1)', ..., (епу — взаимный с ei, ..., еп базис в L\. Установим линейный изоморфизм между L\ и L^, полагая в качестве соответствующего элемента для произвольного и = uie1 + • • • + ипеп, и Е L*. Тогда вследствие A1) (ж, и) = (ж, и'). Теперь ясно, что новое определение сопряженных пространств по су- существу не отличается от ранее изложенного. Достаточно заметить, что с произвольным элементом и Е L* сопоставляется линейная форма (ж, и) = uix1 + • • • + ипхп, где ui, ..., ип — коэффициенты (постоянные координаты данного век- вектора и G L*). § 2. Тензорное произведение линейных пространств 1. Пусть даны линейные пространства L и L, одновременно дей- действительные или комплексные (возможно, бесконечномерные). С по- помощью векторов из L и L мы построим некоторые новые объекты, множество которых обозначим через Т. Прежде всего, элементами Т будем считать всевозможные пары векторов аб, где a G L, b G L . Кроме того, в качестве элементов Т будем рассматривать всевозможные наборы таких пар, взятых каждый раз в конечном числе. Никаких других элементов в Т уже не будет. Иначе говоря, любой элемент t G Т имеет вид t = {Mi, . . . , akbk], A) где ai,..., ak ? Ь, 6i,..., bk ? L. Смысл этого равенства заключается только в том, что элемент множества Т', обозначенный буквой t, есть набор пар а\Ь\, ..., akbk- Договоримся на первом месте пары всегда писать элемент из L. Ес- Если L и L совпадают, то пары векторов, которые составляют элементы множества Т, считаются упорядоченными, т.е. порядок записи векто- векторов в паре существен. Таким образом, в случае L = L,aGL,6GL, вообще говоря, ab ф Ьа. 2. Для дальнейшего оказывается более удобным пару ab называть произведением а на 6, кроме того, вместо слов «набор пар» употреблять слово сумма. Соответственно вместо A) будем писать (V)
144 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V где ai, ..., ак ? L, 61, ..., Ьк ? L. Заметим, что очень часто пару ab называют формальным произведением а на 6, а сумму (!_') — фор- формальной суммой. Далее мы увидим, что указанная арифметическая терминология имеет достаточно оснований. 3. Для множества Т мы введем три условия эквивалентности, то есть, условия, при которых некоторые элементы Т считаются рав- равными. Именно: 1) формальная сумма не зависит от порядка слагаемых; 2) (а + Ь)с = ас + be, где a, b — любые векторы из L, с — любой вектор из L; аналогично а(Ь + с) = ab + ас, где a Е L, Ь, с Е L; 3) (aa)b = a(ab), где a, b — любые векторы, взятые соответственно из L и L, а — любое число (действительное, если L и L — действитель- действительные пространства, комплексное, если эти пространства комплексны). Замечание. Мы не упомянули еще одно условие эквивалент- эквивалентности как само собой разумеющееся (его следовало бы поставить на самом первом месте), именно, что при допустимой замене векторов ai, ..., a/., &i, ..., bk элемент t подвергается допустимой замене, то есть, переходит в равный себе. 4. Условия п. 3, другими словами, означают, что мы считаем допу- допустимыми заменами элемента e T B) а) изменение порядка записи пар ai&i, ..., а&6& в сумме B); б) замену одной пары суммой пар или замену суммы пар одной парой согласно 2) п. 3; например, если а\ = а[ + а", то пару a±bi в составе t допустимо заменить суммой a[bi + a"bi] в) перенос числового сомножителя от одного вектора данной пары к другому вектору той же пары. Вместе с этим два элемента t\, t<i G Т считаются равными в том и только в том случае, когда с помощью конечного числа допустимых замен их можно привести к одному и тому же набору пар элементов из Ьи L. 5. В множестве Т мы введем линейные операции. 1. Суммой двух элементов множества Т t = ai&i + h назовем элемент этого множества, который представляет собой набор пар элемента ?, объединенный с набором пар элемента t'\ t + t' = 0161 + • • • + акЬк + а[Ь[ + • • • + a'mb'm. 2. Произведение элемента t на число а определим равенством at = (aai)fti H Ь (аак)Ьк.
§2] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРОСТРАНСТВ 145 Вследствие п. 4 сумма t + t' и произведение at инвариантны относи- относительно допустимых замен элементов tut'. Докажем, что множество Т вместе с такими линейными операция- операциями является линейным пространством. Прежде всего заметим, что аксиомы 1), 2) и 5)-8) линейного про- пространства с очевидностью соблюдаются для Т вследствие данного сей- сейчас определения линейных операций и вследствие условий 1) и 3) п. 3. Остается проверить аксиомы 3) и 4). Чтобы проверить аксиому 3), нужно обнаружить в Т нулевой эле- элемент. Покажем, что нулевым элементом в Т является пара 00, где 0 — нулевой элемент L, 0 — нулевой элемент L. Для этого предварительно установим, что каким бы ни был элемент b Е L, имеем 00 = Ob (анало- (аналогично 00 = аО для любого a Е L). В самом деле, согласно условию 3) п. 3 00 = 0@-Ь) = (О-О)Ь = ОЬ. Отсюда ab + 00 = ab + Ob = (а + 0)Ь = ab. Наконец, если t = a\bi + • • • + akbk — любой элемент из Т, то t + 00 = oi&i H Ь (акЬк + 00) = oi&i H Ь а/^ = *. Тем самым соблюдение третьей аксиомы линейного пространства для Т установлено. Четвертая аксиома проверяется без труда. Именно, для любого t G G Т противоположным элементом является (—1) • t. Действительно, t + (-1) • t = oi&i + • • • + акЬк + (-l)(oibi + • • • + акЬк) = = (ai + (-l)oiNi + • • • + (a* + (-1)оЛ)ЬЛ = = 0 • &i + • • • + 0 -bk = 00 + -- + 00 = 00. Доказательство нашего утверждения по поводу множества Т полно- полностью завершено. 6. Определение. Линейное пространство Т с учетом конст- конструкции его элементов в виде сумм произведений элементов из L и L называется тензорным произведением пространства L на L. Для его обозначения употребляется символическая запись Т = L&L. Элементы пространства Т, рассматриваемые как суммы произве- произведений элементов из L и L, называются тензорами над пространствами Ьи L. 7. Наряду с пространствами L и L рассмотрим сопряженные им пространства L* и L* и введем еще одну операцию, называемую сверт- сверткой элементов из Т с элементами из L* и L*.
146 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V Возьмем сначала в качестве элемента Т одну пару ab, a Е L, b Е Е L. Пусть и Е L*. Свертку пары ab по ее второму (правому) элементу с элементом и (правую свертку) обозначим через (аб, и) и определим равенством (об, и) = оF, и). C) Здесь F, п) есть свертка элемента b Е L с элементом u E L*, пони- понимаемая в смысле п. 7 § 1 этой главы. Так как F, п) — число, то сверт- свертка C) является вектором, коллинеарным а, т.е. вектором из L. Свертка пары (а, Ь) по ее первому (левому) элементу с элементом v Е L* обозначается и определяется согласно равенству (v, аб) = (v, a)b. Это есть вектор из L, коллинеарный с вектором Ь. Свертку элемента t = a±bi + • • • + a>kbk ? ^ например, правую с элементом n G L*, определим почленно: (oi&i H h акЬк, и) = oiFi, n) Н Ь алFл, гх). 8. Свертка элемента t G Т с элементом v G L* или с элементом uGL* инвариантна относительно допустимых замен элемента t. Доказательство. Согласно определению свертки и вслед- вследствие п. 7 § 1 этой главы свертка распределительна относительно сло- сложений элементов из Т, L и L; числовые сомножители выносятся за знак свертки. Поэтому при допустимой замене элемента t получается также допустимая замена его свертки с и или v. Следствие. Если два элемента ti, t^ G Т равны, mo свертки t\ и ti no правым элементам их пар с одним и тем же элементом и G L* также равны {разумеется, аналогичное утверждение имеет место для сверток по левым элементам). § 3. Базис в тензорном произведении. Координаты тензора 1. Пусть теперь L и L конечномерны; обозначим их размерности соответственно через пит. Пусть ei, ..., еп — базис в L, ei, ..., ёт — базис в L. Рассмотрим Т = L <S> L. Лемма. Если + • • • + endn = 00, A) где di G L, mo di = d2 = . . . = dn = 0. B) Доказательство. Рассмотрим в L* базис е1,..., en, взаимный с данным базисом в L. Возьмем левую свертку равенства A) с векто- вектором е1. На основании п. 7 § 2 мы получим равенство: (е1, ei)oi + (е1, е2)а2 + • • • + (е1, еп)ап = (е1, 0H = 0 • в = 0.
§ 3 ] БАЗИС В ТЕНЗОРНОМ ПРОИЗВЕДЕНИИ 147 Отсюда 1 • oi + 0 • а2 Н Ь 0 • ап = 0. Следовательно, а± = 0. Аналогично найдем остальные равенства B), свертывая A) с е2, ..., еп. Лемма доказана. 2. Теорема 1. Всевозможные пары eiej линейно независимы в пространстве Т'. Доказательство. Пусть имеется соотношение ijeiej = 00, C) где otij — некоторые числа. Равенство C) можно записать в виде г 3 Отсюда и из предыдущей леммы следует, что Танеев D) 3 для каждого номера г. А так как ej — векторы базиса, то из D) следует, что (Xij = 0. Теорема 1 доказана. Теорема 2. Пары eiej образуют базис в пространстве Т. Доказательство. Пусть t G Т; имеем: t = а\Ь\ + • • • + a/.bk. Разложим векторы ai, ..., а& G L по базису ei, ..., еп, а векторы bi, • • •, bk G L — по базису ei, ..., еш. Тогда после группировки членов получим п m i=l j=l где rlJ — некоторые числовые коэффициенты. Согласно E) любой эле- элемент из Т линейно выражается через пары eiej. Отсюда и из теоремы 1 следует теорема 2. Следствие. Если L и L имеют размерности пит, то тензор- тензорное произведение Т = L 0 L конечномерно и имеет размерность пт. 3. Теперь мы специально рассмотрим три случая тензорного про- произведения двух пространств, когда либо оба пространства совпадают, либо одно из них является сопряженным к другому. Пусть L — пространство размерности n, L* — сопряженное ему; пусть ei, ..., еп — базис в L; е1, ..., еп — взаимный с ним базис в L*. 1) Тензорное произведение L на L будем обозначать через Т02. Со- Согласно п. 2 любой элемент t G Tq = L 0 L имеет разложение * = Е^. (в) Элементы произведения Т02 = L&L называются двухвалентными кон- трав ариантными тензорами над пространством L.
148 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V 2) Произведение L* на L* обозначим через Т°. Элементы этого про- произведения называются двухвалентными ковариантными тензорами над L. Для любого t G Т2° = L* ® L* имеем yeV. G) 3) Произведение L на L* обозначим через Т\\ его элементы назы- называются двухвалентными смешанными тензорами над L. Для любого t еТ^ = L® L* имеем Замечание. Элементы самих пространств L и L*, т. е. контрава- ринатные и ковариантные векторы, называются также одновалентны- одновалентными тензорами (контра- и ковариантными соответственно). 4. Коэффициенты разложений F), G), (8) называются определяю- определяющими числами или координатами своих тензоров в базисе ei, ..., еп пространства L. Они помечаются верхними или нижними индексами в зависимости от структуры тензора (как именно, видно из F), G), (8)). Замечание. Поскольку тензоры определяются координатами, то часто, когда говорят «дан тензор», пишут при этом его координаты, например, тгз (подобно тому, как в аналитической геометрии говорят: дана точка (ж, у)). 5. Элементы произвольной квадратной п х n-матрицы можно при- принять за координаты некоторого тензора в данном базисе. Их заданием в виде таблицы (т. е. соответственно индексам) всегда будет определен некоторый тензор в Zq2, а также в Т® и в Т\. При переходе к новому базису координаты тензоров преобразуются по специальным законам, отвечающим Tq , T^ и Т\. Найдем эти законы. 6. Для координат тензоров из Tq = L 0 L имеет место контрава- риантный закон преобразования по обоим индексам. Это значит, что если мы в пространстве L перейдем к новому базису то новые координаты тензора t G Tq будут выражаться через его ста- старые координаты по формулам Ti'i'=-?TiiQi'QJ'. (I) Доказательство. Для формул (9) обратными являются
§ 3 ] БАЗИС В ТЕНЗОРНОМ ПРОИЗВЕДЕНИИ 149 Отсюда j' г',3 i,3 С другой стороны, t = Y,Tl'3'evey. A1) Сравнивая A0) и A1), получим (I), что и требовалось. 7. Закон преобразования (I) выведен нами как следствие инвари- инвариантности тензоров t Е Tq относительно выбора базиса в пространстве; мы воспользовались этой инвариантностью в тот момент, когда срав- сравнивали A0) и A1). Наоборот, инвариантность тензоров t Е Tq следует из (I). Подробнее: если в базисе ei, ..., еп Е L произвольно даны числа тгз (г, j = 1, 2, ..., п) и если при переходе к другому базису е^, ... . . ., еп> G L по формулам (9) они заменяются числами тг J согласно Доказательство. Применяя (9) и (I), получим 8. Для координат тензоров из Т® = L* ® L* имеет место ковари- антный закон преобразования по обоим индексам: Для координат тензоров из Т\ = L0 L* имеет место контравариант- ный закон преобразования по верхнему индексу и ковариантный по нижнему: Обе формулы (II) и (III) выводятся, исходя из инвариантности тен- тензоров вТ2°и Т\ относительно выбора базиса в L, вполне аналогично формуле (I). При этом для вывода формулы (II) нужно вместо (9) ис- использовать известные нам равенства Для вывода (III) следует использовать и равенства (9), и равенства A2). Замечание. В свою очередь инвариантность тензоров вТ2°и Т\ в том смысле, как это объяснено в п. 7 для Tq, следует из (II) и (III).
150 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V 9. Линейные операции над тензорами в Tq , Т® и Т\ выражаются в координатах по обычным правилам. 1) При сложении тензоров их координаты складываются: например, если t = J2 т»е^ ?Т02, а = J2 ^eiej ? Т02, ТО Разумеется, сложение тензоров разной структуры не определено. Если бы мы вздумали складывать их координаты, то не получили бы инвариантного результата. 2) При умножении тензора на число все его координаты умножают- умножаются на то же число; например, для t Е Tq 10. Выражение свертки в координатах требует несколько более по- подробного объяснения. Пусть даны двухвалентный контравариантный тензор t = ^r^eiCj G Т02 и ковариантный вектор и = ^п^ег G L*. Рассмотрим, например, правую свертку t с вектором и. Имеем (t, и) = (Y,Tijeiej} 5>fcefc) =^т^Аег(е,-, ек) = Таким образом, в результате этой свертки мы получаем некоторый век- вектор х = ^xlti G L, координаты которого находятся путем суммиро- суммирования по второму индексу r2J: Аналогично в случае левой свертки мы получаем вектор у = ^2ylei G L, координаты которого находятся путем суммирования по первому индексу r2J: Juk. 11. Если t = ^2rijeleJ G T^, x = ^2xkek ? ?, то правая свертка Это есть вектор и = ^п^ег G L*, т. е. вектор сопряженного к L про- пространства. Координаты его находятся путем суммирования по второму индексу Tij\ щ =
§ 3 ] БАЗИС В ТЕНЗОРНОМ ПРОИЗВЕДЕНИИ 151 Левая свертка представляет собой также вектор из L* и сводится к сум- суммированию по первому индексу т^: 12. В случае t = ^rje^e-7 G Т\ возможна свертка и с вектором х = ^2xkek G L, и с вектором и = ^2ukek Е L*. Именно: Аналогично Таким образом, если х Е L, то (?, ж) Е L. Если w G L*, то (?, u) G L*. 13. Для ? G T-j1 возможна внутренняя свертка, которая заключает- заключается в замене каждой пары aibi в составе t = a\b\ + - • - + а^6^ (а,{ G L, 6^ G G L*) сверткой (а^, 6г)« Это определение не связано с выбором базиса, поэтому внутренняя свертка смешанного тензора t есть инвариантное число, зависящее только от выбора элемента t из пространства Т\. Если обозначить внутреннюю свертку t через (?), то в произвольном базисе имеем Отсюда также можно вывести инвариантность внутренней свертки как следствие формулы (III). В самом деле, из (III) имеем 14. Мы видим, что свертка во всех случаях приводится в коорди- координатах к суммированию по одному контравариантному (верхнему) ин- индексу и по одному ковариантному (нижнему) индексу. При этом общее число валентностей, т.е. общее число индексов, которыми помечены координаты тензоров, понижается на две единицы. В тех случаях, ко- когда остается один индекс, результат свертки есть одновалентный тен- тензор (вектор из L или L*). Например, свертка ^rk^Uk = x^ оставляет один свободный индекс (верхний) и дает вектор ^2 х3 ej ^ L.*B тех слу- случаях, когда свободных индексов не остается (как в п. 13), получается числовой инвариант. Поэтому числовые инварианты часто называют тензорами нулевой валентности.
152 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V § 4. Тензоры билинейных форм 1. Пусть в линейном n-мерном пространстве L дана инвариантная билинейная форма а(х, у), ж, у Е L. Если в L задан базис ei, ..., еп, то в этом базисе форма а(х, у) имеет координатное представление а(х> У) = ^2<1цХгх3. A) Пусть делается переход к новому базису в L: В новом базисе форма а(х, у) получает другое координатное представ- представление с новыми коэффициентами а^у. Согласно §3 гл. IV Таким образом, коэффициенты билинейной формы в L преобразуют- преобразуются по ковариантному закону для каждого индекса (см. (II) п. 8 §3). Поэтому с формой а (ж, у) можно сопоставить тензор из Т^, именно ijeiej. B) Он называется тензором данной билинейной формы. Из п. 7 § 3 следует, что тензор а сопоставляется с формой а (ж, у) инвариантно (т.е. он один и тот же независимо от выбора базиса в пространстве L). Обратно, любому тензору B) из Т® отвечает билинейная форма в L. В самом деле, если сделать левую свертку B) с вектором х = = ^xlei G L, а затем найденный вектор (из L*) свернуть с вектором у = ^2ylei G L, то получится правая часть A). Тем самым с тензором а сопоставляется билинейная форма а(х, у) = ((ж, а), у) = ^(щхгу3. C) Инвариантность такого построения билинейной формы в L по заранее данному тензору в Т® очевидна, поскольку свертка есть инвариант. 2. Чтобы установить аналогичную связь с теорией билинейных форм для тензоров из Tq и Т^, нужно рассматривать билинейные формы от двух ковариантных векторных аргументов и билинейные формы, у которых один из векторных аргументов является контравариантным, другой — ковариантным. И те, и другие формы определяются как функции с числовыми значениями, линейные по каждому аргументу. Кроме того, должна быть потребована их инвариантность, т. е. независимость их числовых значений от выбора базиса (см. ниже, пп. 3, 4). 3. Билинейная форма а(и, v) с двумя ковариантными аргумента- аргументами и = ^uie1 G L*, v = ^2 Vie1 G L* имеет координатное представле- представление а(и, v) =
§4] ТЕНЗОРЫ БИЛИНЕЙНЫХ ФОРМ 153 с коэффициентами aij =a(e\ е3'). Отсюда и из (Г) п. 3 § 1 а*'*' = а(е'', е'") = $>(е\ e^)Q\'QJ' = XV'Qj'Qf • Таким образом, коэффициенты формы а(и, v) преобразуются по кон- травариантному закону для каждого индекса (см. (I) п. 6 § 3). Поэтому с формой а(и, v) инвариантно сопоставляется тензор из 7q , именно а = ^VJe;ej. Обратно, любому заранее данному тензору a ? Tq отвечает в виде свертки инвариантная билинейная форма а(и, v) = ((и, a), v) = ^alJUiVj. 4. Для билинейной формы а (ж, и) с двумя разнородными аргумен- аргументами х = Y^ x%ei ? L, и — Y Uie1 G L* имеем a(x, u) = где Отсюда 4 = Таким образом, коэффициенты формы а (ж, и) преобразуются по ко- вариантному закону для нижнего индекса и по контравариантному — для верхнего. Поэтому с формой а (ж, и) инвариантно сопоставляется тензор из T-j1, именно а = > aJ-e Обратно, любому заранее данному тензору a G Т\ отвечает билиней- билинейная форма а(х, и) = ((а, ж), n) = y^a3ixtUj. 5. Заметим, что валентности тензора формы противоположны ва- валентностям ее аргументов. Например, если некоторый аргумент формы является ковариантным, то соответствующий ему индекс тензора этой формы будет контравариантным (верхним). 6. Формулы B) и C) п. 1 устанавливают взаимно однозначное соот- соответствие между билинейными формами в L и тензорами в Т®. Очевид- Очевидно, это соответствие является изоморфизмом относительно линейных операций. Таким образом, в смысле линейной алгебры теория тензоров в Т® равносильна теории форм а (ж, у) в L. То же самое можно сказать по поводу теории тензоров в Tq и в Т\ и теории форм a(n, v) и а (ж, и).
154 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V Однако построение отдельной теории тензоров (помимо теории форм) необходимо. Во-первых, дело в том, что в рамки теории форм не укладывается операция свертки. Во-вторых, тензоры сопоставляются не только с формами, но и со многими другими объектами алгебры и геометрии (а также механики и физики). Такое сопоставление, прежде всего, позволяет общими методами строить инварианты рассматрива- рассматриваемых объектов (чаще всего в виде сверток). Кроме того, отсюда возни- возникает возможность выражать связи между объектами в виде тензорных уравнений, т.е. в виде равенств между тензорами. Важной особенно- особенностью тензорных уравнений является их инвариантность. 7. Именно, пусть имеется, например, уравнение rij = 0. D) Оно означает, что в данном базисе все координаты некоторого тензора из Tq равны нулю. Но тогда координаты этого тензора равны нулю в любом другом базисе. Арифметически это обстоятельство усматри- усматривается из формулы (I) п. 6 §3, но по существу оно непосредственно проистекает из самого определения тензоров из Tq как инвариантных объектов (уравнение D) выражает тот инвариантный факт, что тензор г = ^r^e^ej есть нулевой элемент в Tq). Разумеется, то же самое можно сказать про уравнения вида т^ = 0 и гj =0. Вследствие инвариантности тензорных уравнений для доказатель- доказательства их справедливости достаточно сделать проверку в каком-нибудь одном, по возможности удобном, базисе. Это простое соображение бу- будет часто применяться в дальнейшем. 8. Укажем один признак, позволяющий распознавать двухва- двухвалентные тензоры. Пусть некоторый объект А определен в любом базисе ei, ..., еп пространства L координатами а^, но мы не знаем, как изменяются его координаты при переходе от одного базиса к другому. Имеет место предложение: Если свертка координат а^ по какому-нибудь индексу с координа- координатами любого контравариантного вектора всегда имеет по оставше- оставшемуся свободному индексу ковариантный закон преобразования, то са- сами координаты a,ik преобразуются по ковариантному закону для каж- каждого индекса. Доказательство проведем для свертки по первому индексу. Пусть х = ^2 x%ei ~ произвольный контравариантный вектор (т. е. х Е Е L); рассмотрим свертку bk = ^2aikxl. По условию мы можем рассматривать 6/, как координаты некоторого вектора b Е L* (в базисе е1, ..., еп). Возьмем в L еще один, также
§5] ПРОИЗВЕДЕНИЕ ТЕНЗОРОВ 155 произвольный вектор у = ^2ykek- Тогда F, 1/) = $>*/ = $><**У E) есть инвариант. Следовательно, правая часть E) есть координатное представление инвариантной билинейной формы. Отсюда и вследствие п. 1 наше предложение доказано. Замечание. На основании доказанного предложения объекту А инвариантно сопоставляется тензор из Т®. Соответственно это пред- предложение можно считать признаком ковариантных двухвалентных тен- тензоров. 9. Аналогично, если является контравариантным вектором при любом выборе ковариант- ного вектора Ui, то агк есть двухвалентный контравариантный тензор. Если является контравариантным вектором при любом выборе контравари- антного вектора хг, то а\ — смешанный тензор. Оба утверждения сводятся (подобно предыдущему) к пп. 3, 4. § 5. Многовалентные тензоры. Произведение тензоров Поскольку определено тензорное произведение двух пространств, тем самым определено также тензорное произведение пространств, взя- взятых в любом числе. Достаточно перемножать их последовательно в каком-либо порядке. Если даны линейные пространства Li, L2, L3, то произведение Т = (Ь\ ® L2) ® L% имеет в качестве своих элемен- элементов формальные суммы любого конечного числа слагаемых вида (ab)c, где a Е Li, b G L2, с G L3. Условия эквивалентности и соответственно допустимые замены элементов Т получаются сочетанием условий эк- эквивалентности элементов произведения L\ 0 L2 на L$ и произведения L\ на L2. Например, ((о' + а")Ь)с = (а'Ь)с + (а"Ь)с; ((aa)b)c = (a(ab))c = (ab)ac, где а — число. Кроме того, мы дополнительно потребуем условие эк- эквивалентности ассоциативного характера (ab)c = а(Ьс). Оно означает тождество (Li 0 L2) 0 L3 = L\ 0 (L2 0 L3) и позволяет писать abc вместо (ab)c или а(Ьс). Линейные операции в Т определе- определены вместе с произведением L\ 0 L2 на L%. Одновременно определена
156 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V и свертка, левая — с элементами из L*, правая — с элементами из LJ. Можно определить также свертку по средним элементам троек с эле- элементом и Е 1^2, полагая (ai&ici Н Ь akbkck, и) = (&i, u)aici Н \- (Ьк, и)акск. Эта свертка есть элемент произведения L\ ® L3. 2. Тензорное произведение любого числа пространств определяет- определяется по индукции. 3. Пусть дано линейное пространство L. Положим Т% = (L <g> L ® . . . <g> L) 0 (L* <g> L* 0 . . . <g> L*), где имеется р сомножителей L и </ сомножителей L*. Элементы из Т^ будем называть тензорами над пространством L, контравариантными р раз и ковариантными q раз (или имеющими р контравариантных и q ковариантных валентностей). Для единообразия обозначим также L через Tq1 и L* через 7\0, что согласуется с условием, по которому элементы из L и L* называются одновалентными тензорами. 4. Поскольку каждое пространство Т? является линейным, то для тензоров в каждом из этих пространств определены линейные опера- операции. Сложение тензоров из разных пространств Т^1 и Т^ мы не опре- определяем. 5. Помимо линейных операций над тензорами в каждом Т^, мы определим произведение тензоров, взятых из каких угодно, хотя бы различных, пространств Т^1 и Т^. Пусть г G T^1, s G Т^22. Произведением г на s назовем упорядо- упорядоченную пару rs, понимаемую как элемент тензорного произведения Т^1 0 Т^22. Вообще говоря, rs ф sr. В согласии с п. 1 имеем для любых г, s, t (rs)? = r(s^). Соответственно получаем произведение трех тензоров: rst = (rs)t = = r(st). Вместе с тем определено произведение тензоров для любого числа сомножителей. 6. Допустим, что г и s могут быть представлены в одночленном виде, т.е. в виде произведения элементов из L и L*: г = oi . . . aPl &i . . . 691, s = oi . . . аР2 6i . . . 692, где oi,. . ., оР1, oi,. . ., dP2 e L, bi,...,bQl,b1,...,bQ2eL*. Тогда rs = а\ . . . aPl 6i . . . bqi a 1 . . . dP2 b\ . . . bQ2. Если rs содержит множители только из L или только из L*, то их по- порядок существенен (согласно п. 1 из §2). В общем случае условимся
§5] ПРОИЗВЕДЕНИЕ ТЕНЗОРОВ 157 выписывать в произведении rs сначала все элементы из L, затем — из L*, сохраняя в каждом из этих случаев заданный порядок сомно- сомножителей. Таким образом, rs = cli . . . aPlai . . . aP2bi . . . bqibi . . . bQ2. Тем самым вводится новое условие эквивалентности тензоров. Оно при- принято в большинстве руководств по тензорному исчислению, однако не во всех (см., например, Стернберг С. Лекции по дифференциальной геометрии. — М.: Мир, 1970. — С. 15-18). 7. Положим а = а± . . . аР1, считая, что ai, ..., аР1 могут быть какими угодно элементами из L. Если р\ = 0, то условимся считать а = = 1. Аналогично будем понимать a, b и Ь. Тогда произвольные тензоры г и s (г Е Tql-, s ? ^Т22) можно записать символически в виде: r = V^a6, s = у^ ab. На основании изложенного в п. 1 произведение rs можно получить пу- путем почленного умножения первой из этих сумм на вторую. Учитывая п. 6, имеем rs = 2^, aabb. Отсюда ясно, что rs G Т^+?*. 8. Пусть t G Т?, причем р ^ 1, q ^ 1. Аналогично предыдущему положим а = а\ . . . ар, b = b\ . . .bqj t = ^ab. Выберем среди 1, 2, ..., p некоторый номер / и среди 1, 2, ..., q — номер т. Обозначим через а' произведение всех элементов ai, ..., ар, за исключением а/, через Ь' — произведение всех элементов 6i, ..., bq, за исключением Ьт. Назовем внутренней сверткой тензора t по 1-м элементам L и по т-м элементам L* объект Здесь (а/, Ьш) — свертка элемента a/ G L с элементом Ьш G L*, т.е. число (свое для каждого слагаемого суммы). Таким образом, свертка (t)lm есть тензор из T^Zi • Если р — 1 ^ 1 и д- 1 ^ 1, то к тензору (t)lm можно в свою очередь применить операцию свертки; мы полу- получим тензор из TyZ2 • Разумеется, обе операции можно сделать сразу; например, Mi! = (Mi)! = X}(ai' ^)(tt2' ^2)аз • • • аРЬз • • -bq. Если р = q, то можно исчерпать все валентности тензора t и получить, как говорят, его полную свертку (число).
158 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V 9. Свертки двух тензоров, которые мы рассматривали выше, все- всегда можно свести к внутренней свертке одного тензора. Для этого до- достаточно данные тензоры перемножить и сделать внутреннюю сверт- свертку их произведения. Например, свертка элемента х Е L с элементом uGL* есть внутренняя свертка произведения хщ правая свертка тен- тензора t Е Tq с элементом и Е L* есть (tu)\. 10. В заключение этого параграфа мы должны сделать ряд весьма существенных замечаний по поводу операций над тензорами. Прежде всего, вследствие сказанного в п. 1, линейные операции в Т^ инвари- инвариантны относительно допустимых замен элементов в Т%. Произведение rs Е T^lXql' г ^ ^Т/' s ^ Tqz •> инвариантно относительно допустимых замен элементов г и s в Т^1 и Т^22, т. е. при таких преобразованиях оно само получает также допустимую замену в T^l+ql - ^ез этих свойств определение линейных операций над тензорами и произведения тензо- тензоров было бы бессмысленным. 11. Из сказанного в п. 1 этого параграфа и в п. 8 §2 следует, что при допустимой замене тензора t в Т? свертка (t)lm испытывает также допустимую замену в T^Z\ . Отсюда имеем: если t^ — t\, mo (^)ш = = (*i)'m. Доказательство. Равенство t<i — t\ означает, что с помощью допустимых замен тензоров t<i и t\ их можно привести к одному и тому же набору t произведений элементов из L и L*. Но тогда (t\)lm и (t2)lm с помощью допустимых замен сведутся к (t)lm. 12. В наших определениях мы нигде не использовали базисы. По- Поэтому линейные операции над тензорами, а также операции перемно- перемножения тензоров и внутренней свертки, дают результаты, инвариантные в смысле независимости от выбора базиса. В частности, полная свертка тензора есть числовой инвариант. § 6. Координаты многовалентных тензоров 1. Пусть ei, ..., еп — базис в L, е1, ..., еп — взаимный с ним базис в L*. Из теоремы 2 § 3 (по индукции) следует, что всевозможные произведения вида е^ . . . eipejl . . . eJ<? составляют базис в Т?. Таким образом, для любого t G Т? имеет место разложение t - V/1>JV' e- ejl ejq Числа г-1 '"-р определяют тензор t и называются его координатами в базисе ei, ..., еп пространства L. В данном базисе они могут задавать- задаваться произвольно, т. е. как бы ни взять числа т^1"*^р, по ним всегда будет определен некоторый тензор. При этом часто пишут: t = I т1-1/ \]
§6] КООРДИНАТЫ МНОГОВАЛЕНТНЫХ ТЕНЗОРОВ 159 говорят также: дан тензор г-1'"' ?'. Следует иметь в виду, однако, что фактическое задание какого-нибудь конкретного тензора, хотя бы толь- только трехвалентного, требует довольно сложной информации в виде таб- таблиц, поскольку численные значения координат должны быть указаны для каждой комбинации индексов. 2. При переходе к новому базису т^1 '"jp преобразуются по контра- вариантному закону для каждого верхнего индекса и по ковариантному закону для каждого нижнего индекса. Именно: где суммирование идет по нештрихованным индексам. Доказательство. Согласно (I), (Г) § 1 Для этих формул обратными являются Отсюда ^ eJl . . . eJ9. A) С другой стороны, Сравнивая A) и B), получим (*), что и требовалось. 3. Закон преобразования (*) выведен нами как следствие инвари- инвариантности тензоров t G Т? (мы воспользовались инвариантностью ?, когда сравнивали A) и B)). Наоборот, инвариантность тензоров t G G ТР следует из (*); именно, вследствие (*) ETH'"lvP-, Р;Р& pjq —S^ Т{1"Лрр- Р- Pi1 Pi* Т3Г1-3'чвг1 '"ег'Ре '"е - 2^Т31...3явг1 '"еЧе •••е ' Выводить это равенство из (*) мы не будем, отсылая читателя к п. 7 §3, где сущность дела показана в частном случае. 4. Линейные операции над тензорами, взятыми в каком-нибудь Т^ выражаются в координатах по обычным правилам: при сложении тен- тензоров их координаты складываются, при умножении тензора на число — умножаются на то же число.
160 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V 5. При умножении тензора г Е Т^1 на тензор s Е Тр* каждая координата тензора г умножается на каждую координату тензора s и все такие произведения являются координатами тензора rs Е T^l+ql' Например, если г = Y^rie\ s = SsjeJ> ris ^ Т®,то rs = ^riSjele^ G G T^; полагая rs = t = Yltijete^ получим t{j = r^Sj. Замечание. Вообще говоря, rs ф sr. Неравенство rs и sr лег- легко усмотреть также в координатах. В самом деле, полагая sr — i = = ^iijelei, получим I — ^s^r^e2 = Y^sir3e%e^• Отсюда Uj = Sirj И tij 7= 6^'. 6. Координаты свертки (t)lm получаются из координат тензора t путем суммирования по одному верхнему и одному нижнему индексу, причем верхний индекс занимает место с номером /, а нижний — с но- номером т. Сущность дела здесь лучше всего пояснить на конкретном примере. Пусть Тогда, например, j,k C Таким образом, координатами (t)\ являются суммы вида Х}а!й' г^е /з суммирование идет по первому верхнему и второму нижнему индексам. § 7. Полилинейные формы и их тензоры 1. Пусть дана инвариантная числовая функция a(xi, ..., xq, n1, . . ., ир) от векторных аргументов х\, ..., xq E L, п1, ..., ир Е L*. Такая функция называется полилинейной формой, если она линейна по каждому своему аргументу. 2. Пусть в пространстве L выбран базис ei, ..., еп, а в простран- пространстве L* — взаимный с ним базис е1, ..., еп. Тогда каждый контрава- риантный аргумент х^ Е L данной формы может быть разложен по базису еь ..., еп: Аналогично каждый ковариантный аргумент разлагается по е1,..., еп: ик = ^и^е* = и^е1 Н Отсюда О(Ж1, . . . , Xq, U1, . . ., UP) =
§8] СИММЕТРИРОВАНИЕ И АЛЬТЕРНИРОВАНИЕ 161 Тем самым вследствие линейности формы получается ее координатное представление а(Х1,..., Xq, и\..., и") = Y,«k^fA ¦ ¦ ¦ 4я • < ¦ ¦ ¦ q, и\..., и") = Y,«k^fA ¦ ¦ ¦ 4я • < ¦ ¦ ¦ <> (*) где а?;;г1=а(еп,...,е]я,е^,...,е^) B) — коэффициенты правой части A). Согласно B) они представляют собой значения формы на базисных векторах. 3. При переходе к новому базису еу, ..., еп> в L имеем Соответственно в L* В новом базисе координатное представление формы будет иметь новые коэффициенты. Вследствие инвариантности формы они также явля- являются ее значениями на базисных векторах (разумеется, новых). Таким образом, ая'.'.?; = а(еЛ' •••'е^' е*#1> •••'е^)- E) Из E) с учетом B), C) и D) найдем il'"ipOi'1 QlpPjl Pjq F) где справа суммирование идет по нештрихованным индексам. Мы видим, что закон F) преобразования коэффициентов инвари- инвариантной полилинейной формы a(xi, . . ., xq, и1, . . . , ир) совпадает с за- законом (*) §6 преобразования координат тензора в Т?. Следовательно, с каждой формой a(xi, . . ., хд,иг, . . ., ир) инвариантно сопоставля- сопоставляется тензор в Тр: он называется тензором данной полилинейной формы. Обратно, каждому тензору G) отвечает инвариантная полилиней- полилинейная форма A). Заметим, что эта форма представляет собой полную свертку произведения ах\ . . . xqux . . . ир. § 8. Симметрирование и альтернирование. Косые формы 1. Рассмотрим в базисе ei, ..., еп G L полилинейную форму а(х, у, z, . . . , t) = ^2 а^к...8х{у^к . . . ts A) и соответствующий ей (ковариантный) тензор a{jk...s- Форма A) называется симметричной по данной паре аргументов, если их 6 Н.В. Ефимов, Э.Р. Розендорн
162 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V перестановка не меняет значения формы. Например, а(х, у, z, ... . . ., i) симметрична по первому и третьему аргументам, если а(х, y,z, . . . , i) = a(z, у,х, . . . , i) при любых х, у, z, ..., t G L. Симметрия формы по данной паре аргументов влечет симметрию ее тензора по соответствующей паре индексов; в нашем примере имеем симметрию тензора по первому и третьему индексам: dijk...s = a>kji...s- В самом деле, aijk...s = а(е;, ej, ек, . . ., е8) = а(ек, ej, е», . . . , е8) = akji...s- Обратно, если, например, aijk...s — akji...s, то а(х, у, z, ...,t) = ^2 а^к...8х1уНк . . . ts = J^ akji...sxiyJzk ...ts = = 5Z ^ijk...sziyjxk ...ts = a(z, 2/, ж, ...,*). Полилинейная форма называется симметричной, если она симметрич- симметрична по каждой паре аргументов; симметричной форме соответствует симметричный тензор. 2. Форма A) называется кососимметричной по данной паре аргу- аргументов, если их перестановка меняет знак формы. Например, а(ж, у, z, . . . , t) кососимметрична по первому и третьему аргументам, если а(ж, у, z, . . . , t) = —a(z, y,x, . . . , ?) при любых ж, 2/, z, ...,?; тензор такой формы кососимметричен по первому и третьему индек- индексам, т.е. dijk...8 = -Q>kji...s- Полилинейная форма называется кососимметричной или косой, ес- если она кососимметрична по каждой паре аргументов; кососимметрич- кососимметричной форме соответствует кососимметричный тензор. Косая форма не меняет своего числового значения при любой чет- четной перестановке своих аргументов. При любой нечетной перестановке аргументов косая форма умножается на минус единицу. 3. Симметрия или косая симметрия формы от ковариантных ар- аргументов и соответственно контравариантного тензора определяется в полной аналогии с предыдущим. В случае смешанного тензора свой- свойства симметрии или косой симметрии могут иметь место для нижних индексов или для верхних индексов. Но для пары индексов, из которых один нижний, другой верхний, эти свойства не инвариантны. Напри- Например, для тензора а\ в некотором базисе возможно равенство а\ — а\ (г, к — 1, 2, ..., п); однако при переходе к другому базису оно, вообще говоря, нарушится. 4. Если а(х, у, z, . . . , t) — произвольная полилинейная форма, то с ней по определенному стандарту может быть сопоставлена симмет- симметричная форма от тех же аргументов. Именно: (а(х, у, z, ...,t)) = —- ^2<i(x, y, z, ..., t),
§8] СИММЕТРИРОВАНИЕ И АЛЬТЕРНИРОВАНИЕ 163 где сумма справа берется по всем перестановкам символов x,y,z,...,t; т — число этих символов (число аргументов). Эта операция называет- называется симметрированием и обозначается круглыми скобками. В частных случаях т = 2 и т = 3 имеем (а(х, у)) = —}{а(х, у) + а(у, ж)}, (а(х, у, z)) = — {а(х, у, z) + а(у, z, х) + a(z, x, у) + + а(у, х, z) + а(х, z, у) + a(z, у, х)}. Симметрированию формы соответствует симметрирование ее тензора; например: a(ijk) = y\aijk + CLjki + 0>kij + 0>jik + a>ikj + «fcji}. Если сама форма а — симметрична, то (а) = а. 5. С симметрированием тензора полилинейной формы приходится, например, иметь дело в тех случаях, когда аргументы этой формы отождествляются. Именно, если а(х, у) = ^aikxlyk — билинейная (вообще говоря, не симметричная) форма, и мы стро- строим квадратичную форму а(х, ж), то происходит приведение подобных членов: Коэффициентами полученной квадратичной формы называются чис- числа aBfc); они составляют ее (симметричную) матрицу. Полярной для а(х, х) является форма (а(х, у)). Аналогично a,(ijk) называются ко- коэффициентами кубичной формы а (ж, ж, ж), которая получается путем отождествления аргументов трилинейной формы а (ж, у, z). 6. Операция, альтернирования заключается в том, что с произволь- произвольной полилинейной формой а(х, у, z, . . . , t) по определенному стан- стандарту сопоставляется кососимметричная (косая) форма от тех же ар- аргументов. Она обозначается квадратными скобками и определяется ра- равенством [а(х, у, z, ..., ?)] = = ^ где первая сумма берется по всем четным перестановкам символов у, z, ..., t, вторая — по всем нечетным. Например, [а(х, у)] = ^{а(х, у) - а(уух)},
164 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V [а(х, у, z)] = ^у{а(ж, У, z) + а(у, z, х) + a(z, ж, у)- - a(y,x,z) - a(x, z,y) - a(z,y,x)}. Соответственно имеем операцию альтернирования тензора: 1 / г 1 Если форма а — косая (кососимметрична по всем аргументам), то [а] = а. 7. Отметим два простых свойства множества косых форм: 1) При отождествлении хотя бы двух аргументов косая форма об- обращается в нуль. В самом деле, пусть, например, совпадают первые два аргумента косой формы; тогда а(у, у, z, ...,t) = -a(y, у, z, ..., t). Следовательно, 2а(у, у, z, . . ., i) = 0. 2) Если число аргументов косой формы превышает размерность пространства, то форма тождественно равна нулю. В самом деле, в этом случае аргументы связаны линейной зави- зависимостью и, следовательно, один из них линейно выражается через остальные. Пусть, например, х = ay + /3z + - • - + \t. Тогда а(х, y,z, ... ...,*) = аа(у, у, z, . . ., t)I + /3a(z, у, z, . . . , t)-\ h \a(t, у, z, . . . . . ., i) и а(у, у, z, . . ., i) = 0, ..., a(t, y, z, ..., i) = 0 вследствие первого свойства. Отсюда а (ж, у, z, . . . , i) = 0. 8. Рассмотрим косые формы, у которых число аргументов равно размерности пространства. Пусть а (ж, 2/, . . ., t) — произвольная косая форма от п аргументов х, у, ..., t, принадлежащих n-мерному пространству L. Зафиксируем в L произвольный базис ei, ..., еп и разложим по нему аргументы формы. Согласно п. 2 § 7 имеем о(ж, 2/, ..., t) = 53oili2...ina;*12/i2...t*», B) где aiii2---in zz ft(eii5 ег25 • • • •> ^гп)- Из определения косой формы и свойства 1) предыдущего пункта а(е;15 е;2, . . . , ein) = 5^2..лп • fl(ei, е2, . . . , еп), то есть, ai\ii...in — di1i2...iria>12...n- C)
§ 9] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ (ВТОРОЙ ВАРИАНТ) 165 Подставив C) в B), мы видим, что в данном базисе рассматривае- рассматриваемую форму можно представить в виде а(х, у, z, . . ., t) = 012...П -А, D) где А — определитель, составленный из координат аргументов: А = >6г,го;Х{1у{2 ...& = х1 х2 ... хп У1 У2 • • • Уп t1 t2 ... tn E) Коэффициент ai2...n будем называть основным коэффициентом ко- косой формы B). Все остальные ее коэффициенты равны либо нулю, либо =bfli2...n (в соответствие с формулой C)). Если ai2...n — О, т0 косая форма а (ж, у, . . ., t) равна нулю тожде- тождественно. Еслиа12...п ^ 0,тоа(х, у, . . . , t) отлична от нуля, когда аргументы линейно независимы. Из формул D) и E) следует, что с точностью до числового множи- множителя в пространстве L существует лишь одна косая форма от п аргументов. В самом деле, если данная форма а (ж, у, . . ., t) не равна нулю тож- тождественно, b(ж, у, . . ., t) — любая другая косая форма от п аргумен- аргументов, то Ь(х, у, ...,t) = &i2...nA = Р • а(х, у, . . . , t), где Заметим, что все рассуждения этого пункта проведены в данном бази- базисе, использована лишь косая симметрия форм, но не использована их инвариантность. Этим мы воспользуемся в следующей главе при рас- рассмотрении кососимметричных полилинейных функций, числовое зна- значение которых не инвариантно по отношению к смене базиса. 9. Более детальному изучению косых форм и кососимметричных тензоров специально посвящена десятая глава. § 9. Второй вариант изложения понятия тензорного произведения двух линейных пространств 1. В начале этой главы, в § 2 мы определили тензорное произведе- произведение Т = L 0 L как множество, элементами которого являются любые конечные наборы пар, составленных элементами из L и L. Таким об- образом, если в качестве элементов L и L выбраны конкретные объекты,
166 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V то элементы L ® L также вполне конкретны (наборы пар этих объек- объектов). В конструкцию L ® L нам пришлось включить описание допу- допустимых замен и линейных операций для элементов множества L ® L, чтобы сделать его линейным пространством. Поскольку нам пришлось конструировать линейное пространство L 0 L, то изложение понятия тензорного произведения выглядело довольно сложным. Мы изложим сейчас определение тензорного произведения L (g) L снова, совершенно независимо от предыдущего. Оно будет более эко- экономно в том отношении, что в качестве L ® L будет заранее взято некоторое линейное пространство Т (смысл равенства Т = L ® L бу- будет заключаться в установлении лишь некоторых взаимоотношений между элементами L, L и Т). К сожалению, это новое определение бу- будет обладать своими недостатками. Дело в том, что в новой конструк- конструкции тензорного произведения L ® L останется значительный произвол (в отличие от старой конструкции, где элементы L ® L вполне опреде- определены элементами L и L). Поэтому первоначально далее определяется по данным L и L не одно тензорное произведение L 0 L, а множество разных. Но затем мы определим некоторое естественное понятие изо- изоморфизма этих тензорных произведений, в силу которого они окажутся изоморфными (эквивалентными) друг другу, а также тензорному про- произведению L на L в смысле нашей старой конструкции § 2. Конечно, чтобы изложить эти вещи, придется также потратить известный труд; в общем итоге экономии изложения по сравнению с первоначальным вариантом, пожалуй, не будет. 2. Мы все-таки даем этот новый вариант изложения понятия тен- тензорного произведения, имея в виду, насколько возможно, помочь чита- читателю уяснить себе следующий вопрос. Пусть сказано, что линейное пространство Т является тензорным произведением линейного пространства L на линейное пространство L. Ограничимся сейчас конечномерным случаем. Тогда размерность Т равна произведению размерностей L и L. Но, разумеется, одного лишь этого соотношения размерностей недостаточно, чтобы охарактеризо- охарактеризовать Т как тензорное произведение L ® L. Дело в том, что в конкрет- конкретных случаях конструкцию тензорного произведения, описанную в § 2, мы можем не усмотреть. Более того, все три пространства L, L и Т мо- могут быть даны с точностью до линейных изоморфизмов, а тогда фор- формальные суммы, описанные в § 2, заменятся элементами совсем другой природы. Поэтому ответ на вопрос, что значит, что Т является про- произведением L 0 L, в такой общей ситуации на основе § 2 по существу нельзя и дать. Для этого требуется само определение тензорного про- произведения высказать в более общей форме, что и будет дальше сделано. 3. Пусть даны линейные пространства L и L размерностей п и m соответственно. Пусть дано также линейное пространство Т, раз-
§ 9] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ (ВТОРОЙ ВАРИАНТ) 167 мерность которого равна произведению пт. Все пространства L, L и Т предполагаются одновременно действительными или одновременно комплексными. Пусть далее дано некоторое отображение / пары пространств L, L в пространство Т. Это значит, что с произвольной парой элементов а, а, где a Е L, a Е L, сопоставлен элемент t Е Т. Будем для простоты писать ? = аа, A) отождествляя тем самым пару аа с ее образом t = /(а, а) в простран- пространстве Т. Условимся и в дальнейшем на первом месте пары писать эле- элемент пространства L; если L совпадает с L, то пару в правой части равенства A) будем считать упорядоченной; таким образом, вообще говоря, аа ф da, то есть, элементы, которые в пространстве Т отвеча- отвечают в силу отображения / парам аа и аа, не обязаны совпадать. Предположим, что имеют место следующие свойства отображе- отображения /. 1. Распределительное свойство относительно каждого элемента пары: (а + b)d = ad + bd, B) а (а + b) = ad + ab C) для любых a, b G L, а, b G L. 2. Сочетательное свойство: (аа)а = а(аа) = а(аа) D) для любых a G L, a G L и для любого числа се (действительного или комплексного в зависимости от того, действительны или комплексны пространства L, L, Т). В силу свойств B)-D) вместо слова пара можно с достаточным осно- основанием употреблять слово произведение. Соответственно этому равен- равенство A) следует читать так: элемент t пространства Т есть произведе- произведение элемента а из L на элемент а из L. Замечание. Сейчас равенства B)-D), в отличие от сходных ра- равенств §2, выражают свойства отображения /, а не условия допусти- допустимых замен в Т. Дело в том, что допустимые замены уже заданы в Т заранее, одновременно с определением Т в качестве линейного про- пространства. 3. Свойство невырожденности отображения /:если элементы ai, ..., ап линейно независимы в L, элементы ai, ..., ап линейно независимы в L, то система aidk (г = 1, 2, ..., п; к = 1, 2, ..., т) их попарных произведений линейно независима в Т.
168 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V Согласно предыдущему некоторые элементы пространства Т явля- являются произведениями элементов пространств L и L. Например, вслед- вследствие D) нулевой элемент в Т является произведением нулевого эле- элемента L на любой элемент L, или любого элемента L на нулевой эле- элемент L. Однако не каждый элемент Т есть произведение какого-нибудь элемента L на какой-нибудь элемент L. Вместе с тем, легко доказать следующее утверждение: каждый эле- элемент t является линейной комбинацией произведений элементов из L и L. Доказательство. Пусть е±, ..., еп — базис в L, ё\, ..., ёт — базис в L. Тогда вследствие свойства невырожденности система всех попарных произведений e^e& есть базис в Т (поскольку размерность Т равна птп). Таким образом, любой элемент t Е Т может быть пред- представлен в виде * = 5>'Чё*. E) Здесь г = 1, 2, ..., щ к = 1, 2, ..., т. Утверждение доказано. Замечание. Если положить ^tlkei = а&, ё/. = а*;, то равенство E) примет вид t = ^2akdk. F) Тем самым каждый элемент t G Т можно представить в виде суммы произведений элементов из L и L. 4. Определение. Линейное пространство Т размерности пттг, рассматриваемое вместе с данным отображением / в него пары линей- линейных пространств L, L размерностей п и m соответственно, называется тензорным произведением L на L, если / удовлетворяет условиям A), B), C) п. 2. Символически Т = L ® L. Элементы пространства Т, рассматриваемые в виде линейных ком- комбинаций произведений элементов из L и L, т.е. в виде E) или в виде F), называются тензорами над L и L. Числа tlk в равенстве E) назы- называются координатами тензора t в базисе е^ё/. (или в базисах ei и е& пространств L и L). 5. Покажем, как построить отображение / со свойствами A), B), C) п. 2. Одновременно уясним себе степень произвола в этом построении. Предположим сначала, что отображение / уже дано. Пусть ei и е& — произвольные базисы в L и L. Тогда вследствие свойства 3 попарные произведения е^ё/., определяемые отображением /, составляют базис в Т. Допустим, что мы знаем ei G L, ё/. G L и е^ё/. G Т. В таком случае мы полностью знаем отображение /, т.е. для любых х G L, x G L знаем произведение хх в пространстве Т. В самом деле, ге^, х = ^ж/её/е. G)
§ 9] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ (ВТОРОЙ ВАРИАНТ) 169 Отсюда и вследствие свойств A)-C) хх = ^х1вг^хкёк = ^х1хквгёк. (8) Таким образом, если отображение / существует, то оно однозначно определяется заданием произвольных базисов е^ и ё/. в L и L и зада- заданием базиса eik в Т, элементы которого суть попарные произведения ei на ek, т.е. е^ = е^ё/. (последние равенства следует понимать так, что eik есть образ пары е^, ё/. именно при отображении /). Но легко видеть, что по этим же условиям найдется искомое отображение /. В самом деле, пусть даны ei Е L, ё/. Е L и е^ Е Т (г = 1, ..., п; А: = 1, 2, ..., т); считаем, что каждая из этих систем линейно независима в своем пространстве. Назначим е^ в качестве образов пар е^, ё/. относительно искомого отображения /, т. е. положим eiek = eik- Эти равенства обеспечить можно, так как число всех е^ равно п, число всех ё& равно т, а число всех е^ равно п?гг. После этого на произвольной паре х, х, где х и х даны равенствами G), определим / по равенству (8). Для построенного таким путем отображения / свойства 1 и 2 п. 3 с легкостью проверяются. Проверим, например, тождество B). Пусть у = Y^ytei- Тогда (х + у)х = ^(жг + 2/г)ж^е^ё^ = ^^хг хк е{ёк + ^^уг %к e>ie>k — хх-\-ух. Чуть труднее проверить третье свойство, т. е. невырожденность пост- построенного отображения /. Возьмем какую угодно новую пару базисов ai и dk в L и L. Нам нужно показать, что попарные произведения aidk (т.е. образы пар а^, dk в Т) линейно независимы. Имеем Отсюда а«ак. =^Р>,Р?,е{ёк. (9) Мы видим, что векторы a^dk1 линейно выражаются через е^ё&. Сле- Следовательно, ранг системы a^dk1 в пространстве Т не больше ранга системы eiek- Но из (9) получаем eiek=YtQ^Qkk'ai.ak.. A0) Здесь величины Q\ стандартным образом определены по Р\, (см. § 1). Аналогично определены Q% no Pfr. Из A0) заключаем, что ранг си- системы eiek не выше ранга системы а^а&- Следовательно, ранги этих систем равны. А так как система е^ё^ по условию независима в Т, то независима и система а^ а^ (так как имеет тот же ранг, равный общему числу векторов). Итак, мы доказали существование нужных нам отображений и пол- полностью выяснили произвол в их конструкции.
170 ТЕНЗОРНАЯ АЛГЕБРА [Гл. V 6. Возвращаясь к определению п. 3, заключаем, что L ® L опре- определено нами с произволом точно таким же, какой имеется в выборе отображения /. 7. Обозначим через ip произвольное взаимно однозначное отобра- отображение t' = ip(t) пространства Т на себя, которое является линейным изоморфизмом этого пространства (см. § 10 гл. I). Обозначим через /' суперпозицию отображений / и ср; символически /' = ipf. Это равен- равенство следует понимать так: сначала / переводит произвольную пару a, a (a Е L, a Е L) в элемент t пространства Т, затем ср переводит t В*' = (p(t). Определение. Тензорные произведения L на L, установленные с помощью отображений / и /', будем называть изоморфными, если /' = (/?/, где (/? — какой-нибудь линейный изоморфизм Т на себя. Тензо- Тензоры t и t' будем называть соответствующими по данному изоморфизму тензорных произведений, если t' = ip(t). Согласно этому определению все тензоры, построенные с помощью /, отображаются в тензоры, построенные с помощью /' = ipf. Чтобы пояснить, почему рассмотрение тензоров, построенных с помощью /, равносильно рассмотрению их образов при изоморфизме, встанем на арифметическую точку зрения, т.е. будем рассматривать тензоры в координатах. Пусть (е{ёкУ = (p(eiek), t = <p(t). Тогда *' = $>'*(е<ёл)', (П) где tlk — точно те же числа, что и в равенстве E). Таким образом, при изоморфизме соответствующие тензоры в соответствующих бази- базисах имеют одни и те же координаты. Итак, при изоморфизме меняется только изображение тензоров в виде тех или иных элементов пространства Т. Но координаты тензоров, а следовательно, и все уравнения, относящиеся к ним в каких-либо задачах, остаются без изменений. 8. Укажем, наконец, следующее предложение, доказательство ко- которого предоставим читателю: если / и /' — два отображения пары пространств L и L в пространство Т, удовлетворяющие условиям A), B), C) п. 3, то найдется изоморфизм ц> пространства Т на себя такой, что /' = <pf. Отсюда следует Теорема. Все тензорные произведения данного линейного пространства L на данное линейное пространство L изоморфны друг другу.
ГЛАВА VI. ПОНЯТИЕ ГРУППЫ И НЕКОТОРЫЕ ЕГО ПРИЛОЖЕНИЯ § 1. Группы и подгруппы. Распределение базисов на классы по данной подгруппе матриц. Ориентация 1. Пусть дано множество G, для элементов которого установлено понятие равенства (или допустимой замены, см. §1 гл. I), и задана некоторая операция, называемая операцией умножения. Эта операция с каждой парой элементов a, b из G, взятых в определенном порядке, сопоставляет некоторый элемент с того же множества. Символически пишут с = ab и говорят, что с есть произведение а на Ь. При этом пред- предполагают, что произведение ab инвариантно относительно допустимых замен сомножителей а и Ь. Определение. Множество G с заданной на нем операцией умно- умножения называется группой (относительно этой операции), если соблю- соблюдены требования следующих аксиом: 1. Для любых а, 6, с Е G (ab)c = а(Ьс). 2. Существует элемент е Е G такой, что для любого a Е G имеет место равенство ае = а. Элемент е называется единицей группы. 3. Для любого a G G существует х G G такой, что ах = е. Этот элемент называется обратным для а и обозначается через а. 2. Из аксиом 1, 2, 3 легко выводятся следующие предложения: а) Если ах = е, то ха = е. Доказательство. Согласно аксиоме 3 существует у G G та- такой, что ху = е. С другой стороны, если ах = е, то а = ае = а(ху) = = (ах)у = еу, откуда а = еу. Следовательно, ха = х(еу) = ху = е. б) еа — а для любого a G С Доказательство. По аксиоме 3 и по доказанному существует ж такой, что ах — е и ха = е. Таким образом, еа = (аж)а = а(ха) — ае — а. в) Если ах = е, ау = е, то у = х (единственность обратного эле- элемента а для каждого a G G). Доказательство. Имеем у — уе — у (ах) = (з/а)ж = еж = ж.
172 понятие группы и некоторые его приложения [Гл. VI Доказанные теоремы означают, что в группе нет необходимости раз- различать левый и правый обратный элементы, а также левую и правую единицы. Кроме того, в группе всегда и притом однозначно определено действие, обратное групповому умножению; именно, уравнение ах = = b имеет единственное решение: х = а6, а уравнение ха — b — единственное решение х — Ьа~х. Отсюда следует, наконец, что каж- каждая группа имеет только одну единицу. В самом деле, если ае = а и ае* = а, то е* = а~ха = е. 3. Важным примером группы является множество всех невырож- невырожденных п х n-матриц (или действительных, или комплексных) с опе- операцией умножения, которая определена в § 2 гл. II. Единицей в группе невырожденных п х n-матриц является единичная матрица Е; матри- матрица, обратная к данной невырожденной, строится согласно пп. 4-8 §3 гл. П. Проверку первой аксиомы группы для умножения матриц (т.е. ассоциативности: (ЛВ)С = Л(ВС)) предоставляем читателю. Пример матриц показывает, что умножение в группе, вообще гово- говоря, не коммутативно (см. выше, п. 3 § 2 гл. II). 4. Группа называется коммутативной или абелевой, если для лю- любых ее элементов a, b имеет место равенство ab = ba. Впрочем, в этом случае групповую операцию часто называют сложением, соответствен- соответственно вместо ab пишут а + Ь. Тогда единицу абелевой группы называют нулевым элементом. Примеры. 1) Каждое линейное пространство является абелевой группой относительно операции сложения элементов. Это ясно, по- поскольку первые четыре аксиомы линейного пространства в точности совпадают с тремя аксиомами группы при дополнительном условии коммутативности. 2) Множество всех действительных чисел, отличных от нуля, об- образует коммутативную группу относительно операции обычного умно- умножения. Единицей этой группы является число единица, элементом, об- обратным числу Л, является число Л. 5. Определение. Некоторое подмножество G элементов груп- группы называется ее подгруппой, если из a Е E, b ? G следует ab Е G и из а е G следует a G G. Отсюда, в частности, е G G. Тем самым при указанных условиях требования аксиом 1-3 п. 1 соблюдены для E, и подмножество G само является группой относительно той же операции умножения, которая задана во всей группе G'. Единица группы G является единицей любой ее подгруппы. 6. Примеры п од г ру п п. 1) В произвольной группе G единица е образует подгруппу, состоящую из одного элемента. 2) Всю группу G можно рассматривать как ее подгруппу.
il] ПОДГРУППЫ. КЛАССЫ БАЗИСОВ. ОРИЕНТАЦИЯ 173 3) Если линейное пространство L рассматривается как группа отно- относительно операции сложения, то любое его подпространство является подгруппой. Рекомендуем читателю построить пример подгруппы в L, которая не была бы подпространством. 4) В группе действительных чисел, не равных нулю (см. пример 2 п. 4), все положительные числа образуют подгруппу. 5) В этой же группе есть другая подгруппа, состоящая из двух эле- элементов — чисел Л = 1иЛ = —1. 6) В группе всех действительных невырожденных п х п-матриц рассмотрим подмножество E, состоящее из матриц с положительным определителем. Из теоремы об определителе произведения матриц (гл. II, §3) следует, что G — подгруппа. В самом деле, если Л, В Е E, то Det АВ — Det Л • Det В > О, следовательно, АВ G G. Если Л G E, то Det Л = (Det Л) > 0 и, значит, Л е G. 7) В группе всех действительных (или комплексных) невырожден- невырожденных п х n-матриц рассмотрим подмножество G, состоящее из всех мат- матриц, определитель которых имеет модуль = 1. Легко убедиться, что G является подгруппой. В самом деле, если Л, В Е G, то |DetЛБ| = = DetЛ| • |Det5| = 1, следовательно, АВ ? G; если Л Е E, то | Det Л-1| = | Det А\~х = 1; следовательно, Л G G. 7. Пусть в группе всех невырожденных n x n-матриц выделена некоторая подгруппа G. Рассмотрим линейное n-мерное пространство L (действительное, если G состоит из действительных матриц; ком- комплексное, если эти матрицы комплексны). Возьмем в L какой-нибудь базис ei, ..., еп и перейдем к другому базису 'hi a) при условии, что коэффициенты Р\, составляют матрицу Р из под- подгруппы G. Для сокращения записи вместо A) удобно писать е' = Ре, Aа) понимая Aа) как матричное равенство, в котором элементами матриц- столбцов еие' являются векторы, элементами квадратной матрицы Р — числа: е = е = Р = Pi рп рп Беря в качестве Р всевозможные матрицы из G, мы будем полу- получать, таким образом, разнообразные базисы е'; они составят некоторый класс базисов; обозначим его через ?(е). Будем говорить, что класс ?(е) порожден базисом е по данной подгруппе G.
174 понятие группы и некоторые его приложения [Гл. VI 8. Из того, что G является подгруппой, вытекает важная Теорема. Если какой-нибудь базис е' принадлежит ?(е), то класс, порожденный базисом е', совпадает с ?{е). Символически: ?(е')=?(е). Доказательство. Пусть е" — произвольный базис. Предпо- Предположим, что е" Е ?(е'). Это означает, что существует матрица Р' Е G, для которой е" = Р'е'. С другой стороны, е' Е ?(е). Соответственно имеем матрицу Р Е G, для которой е' = Ре. Отсюда е" = (Р1Р)е. Но так как G — подгруппа и так как Р Е G, P' E G, то Р'Р Е С Следо- Следовательно, е" Е ?(е). Таким образом, каждый базис из ?{е') входит в ?(е), т.е. класс ?{е') включен в класс ?{е). Заметим теперь, что в случае е' = Ре, Р е G, будет е = Р~1е/, причем Р Е G (так как G — подгруппа). Иначе говоря, если е' Е Е ?(е), то е Е ?(ef). Значит, в предыдущем рассуждении ?(е) и ?{е') можно поменять ролями. Поэтому класс ?(е) включен в класс ?{е'). Тем самым, ?{е') = ?(е) и теорема доказана. Замечание. Так как выбор базиса, порождающего класс, без- безразличен в пределах этого класса, то в дальнейшем вместо ?(е) мы часто будем писать просто ?. 9. Из доказанного в предыдущем пункте утверждения следует, что множество всех базисов в L разделяется на классы по заданной под- подгруппе G так, что каждый базис входит точно в один класс (два класса либо совсем не имеют общих базисов, либо ei полностью совпадают). Каждый класс ? инвариантен относи- относительно заданной подгруппы G; это означает, что для любого р _ базиса е Е ? и для любой мат- матрицы Р Е G будет е' = Ре Е ?. (То есть, после преобразования с помощью любой матрицы подгруппы G любой базис класса ? остается в этом классе.) 10. Пример. Пусть L — евклидова плоскость (точнее, линейное пространство лежащих в ней векторов), G — подгруппа действитель- действительных матриц второго порядка, определители которых равны по модулю единице. Тогда каждый класс ? состоит из базисов с одной и той же площадью базисного параллелограмма (рис. 28) (разным классам от- отвечают разные значения этой площади). В самом деле, пусть еу = ае\ + /Зе2, е2/ = 7ei + ^e2. B) Обозначим через S площадь базисного параллелограмма для ei, e2, О «i
§ 1 ] ПОДГРУППЫ. КЛАССЫ БАЗИСОВ. ОРИЕНТАЦИЯ 175 через S' — аналогичную площадь для еу, еу • Из B) имеем S'= S\a8 - р-у\. Если матрица Р преобразования B) принадлежит G, то \aS — Cj\ = 1 и Sr = S. Обратно, если Sr = 5, то Р е G. 11. Пусть L снова обозначает линейное n-мерное пространство. Будем предполагать его действительным. Обозначим через G подгруп- подгруппу, состоящую из всех п х n-матриц с положительным определителем. Возьмем в L произвольный базис е и построим класс ?{е) по под- подгруппе G; далее будем обозначать этот класс через ?. Очевидно, что весь класс ? не исчерпывает всех базисов пространства L. В самом деле, если Р — какая-нибудь п х n-матрица с отрицатель- отрицательным определителем, то базис е' = Ре не входит в ?. Возьмем такой базис е' и построим по подгруппе G класс ?(е'); будем дальше его обо- обозначать через ?'. Покажем, что других классов, кроме ? и ?', в данном случае нет. Для любого базиса е" пространства L найдутся невырожденные мат- матрицы Р' и Р" такие, что е" = Р"е и е" = Р'е'. Из последнего ра- равенства и соотношения е' = Ре имеем: е" = (PfР)е; следовательно, Р" = Р'Р. Отсюда DetP" = Det P* • Det Р. Так как Det P < 0, то определители матриц Р' и Р" имеют разные знаки. Значит, один из них положителен. Если Det Р" > 0, то е" е ?\ если Det P' > 0, то е" G ?', что и требовалось установить. 12. Итак, все базисы пространства L разделяются по подгруппе G (Р G G, если Det P > 0) на два класса. 13. Если два базиса пространства L принадлежат какому-нибудь одному из этих двух классов, то они называются одинаково ориенти- ориентированными. Два базиса называются противоположно ориентирован- ориентированными, если они входят в разные классы. Базисы, входящие вкакой-нибудь один из этих классов, при- принято называть также положительно ориентированными (или правы- правыми); тогда базисы другого класса называют отрицательно ориен- ориентированными (или левыми). Любой из двух классов можно выбрать в качестве класса положительно ориентированных базисов. Если этот выбор сделан, то говорят, что в пространстве L задана ориентация. 14. Разумеется, чтобы высказать понятие ориентации простран- пространства, нет необходимости предварительно говорить о группах. Мы вы- выскажем сейчас это важное понятие еще раз другими словами, так, что группы при этом упоминаться не будут. Пусть ei, ..., еп и еу, ..., еп< — два произвольных базиса про- пространства L. Имеем
176 ПОНЯТИЕ ГРУППЫ И НЕКОТОРЫЕ ЕГО ПРИЛОЖЕНИЯ [Гл. VI где коэффициенты Р?, составляют невырожденную матрицу Р, то есть, Det F^O. Если Det P > 0, то базис еу называется одинаково ориентирован- ориентированным с базисом ei] если Det P < 0, то базис еу называется противопо- противоположно ориентированным с базисом е{. 15. Имеют место следующие предложения: 1. Если базис еу одинаково ориентирован с базисом е^, то ei оди- одинаково ориентирован с еу. В самом деле, согласно C) векторы еу вы- выражены через в{ при помощи матрицы Р; обратно, векторы в{ выра- выражаются через еу с помощью матрицы Р. Таким образом, Det P~l = = (DetP) >0. 2. Если два базиса одинаково ориентированы с третьим, то они оди- одинаково ориентированы между собой. В самом деле, пусть векторы еу выражены через в{ с помощью матрицы Р, пусть векторы еу выра- выражены через ei с помощью матрицы Р' и Det P > 0, Det P' > 0. Тогда векторы еу выражаются через еу с помощью матрицы Р'Р-1 и мы получаем Det(P/P) = Det P' • Det P > 0. 3. Если два базиса противоположно ориентированы с третьим, то они друг с другом ориентированы одинаково. В самом деле, если Det Р < 0, Det Р' < 0, то Det(P/P) > 0. 16. Выберем в пространстве L произвольный базис е^ и назовем его положительно ориентированным (или правым). Назовем также по- положительно ориентированным (или правым) всякий другой базис, ко- который одинаково ориентирован с е^, назовем отрицательно ориентиро- ориентированным (или левым) всякий базис, который противоположно ориенти- ориентирован с базисом в{. Тем самым все базисы пространства L будут рас- распределены на два класса. Вследствие трех предложений, доказанных в п. 15, любые два базиса из одного класса одинаково ориентированы друг с другом; любые два базиса из разных классов ориентированы противоположно. Указанные классы равноправны, т. е. любой из них можно выбрать в качестве класса положительно ориентированных ба- базисов. Если этот выбор сделан (назначением базиса е^), то говорят, что в пространстве задана ориентация. 17. В заключение заметим, что понятие ориентации существенно связано с тем, что базис рассматривается как упорядоченный набор векторов. Если нумерация векторов базиса меняется так, что два век- вектора обмениваются номерами, а остальные сохраняют свои номера, то ориентация базиса меняется на противоположную. В самом деле, пусть базисы е{ и еу связаны соотношением C), и пусть сделано указанное изменение нумерации векторов еу. При этом в матрице Р произойдет перестановка двух строк и, следовательно, определитель этой матрицы изменит знак.
§2] ГРУППЫ ПРЕОБРАЗОВАНИЙ 177 § 2. Группы преобразований. Изоморфизм и гомоморфизм групп 1. Пусть имеется некоторое множество М, элементы которого усло- условимся называть точками. Говорят, что задано преобразование множества М, если каждой точ- точке х из М поставлена в соответствие некоторая точка у того же мно- множества М. Символически пишут У = /(*)• При этом у называют образом точки ж, а точку х — прообразом точки у. Преобразования f и g считаются равными, если g(x) = f(x) для любой точки х Е М. Преобразование / называют взаимно однозначным или обратимым, если каждая точка у Е М является образом некоторой и притом един- единственной точки х Е М. В этом случае преобразование, которое произ- произвольной точке у = f(x) ставит в соответствие ее прообраз х, называ- называется обратным для исходного преобразования / и обозначается f~1: y = f(x), x = f~1(y). Преобразование е называется тождественным, если е(х) = х для любой точки х из М. Ясно, что тождественное преобразование обратимо, причем е = е. В частном случае, когда М — числовая прямая — ос < г < +ос, понятие преобразования совпадает с понятием функции, заданной на всей прямой. Если функция t = /(т) имеет (однозначную) обратную функцию #(т), также заданную на всей прямой — ос < г < +оо, то эта обратная функция задает обратное преобразование (символически 2. Пусть (/?, / — какие-нибудь преобразования множества М. Произведением ср на / мы будем называть преобразование х, кото- которое действует по формуле Х(т) = <p[f(x)} для любой точки х из М. Символически будем писать х = </?/• В случае, когда М — числовая прямая, произведение преобразо- преобразования t = (f(r) на преобразование t = /(т) есть сложная функция t = </?[/(т)]. Произведение преобразований, вообще говоря, не комму- коммутативно (например, sh3 x ф shx3). Для любого преобразования / произвольного множества М имеем очевидные тождества /е = е/ = /, A)
178 понятие группы и некоторые его приложения [Гл. VI а если / обратимо, то Г7 = е, ff~1=e. B) Ограничиваясь рассмотрением взаимно однозначных преобразова- преобразований, укажем, что если fg = е или gf = е, то g = f~1. C) Произведение преобразований ассоциативно, то есть t/>(ipf) = tyip)f D) для любых трех преобразований ф, <р, / множества М. Это ясно, поскольку каждое из преобразований D) действует по формуле у = ФЫ/(х)}}. Если преобразования ip, / обратимы, то оба произведения ipf и ftp тоже обратимы, причем (WT^rV1- E) Взаимная однозначность каждого из преобразований ipf и ftp непо- непосредственно следует из взаимной однозначности ц> и /, формула E) также вытекает из A)-D), так как (Г V1)^/) = /"'(^"Vl/ = rlef = ГЧ = е- 3. Из определений и свойств, изложенных в пп. 1, 2, следует, что всевозможные обратимые преобразования заданного множества М об- образуют группу относительно умножений преобразований. 4. Определение. Всякая совокупность G преобразований мно- множества М называется группой преобразований этого множества, если G образуют группу относительно умножений преобразований. Из третьей аксиомы группы следует, что в любую группу преоб- преобразований могут входить только обратимые преобразования. Можно сказать поэтому, что любая группа преобразований множества М яв- является подгруппой в группе всех обратимых преобразований этого мно- множества. 5. Ниже, в пределах этой главы мы будем рассматривать только обратимые преобразования, часто не оговаривая этого дополнительно. 6. Пусть G — какая-нибудь совокупность преобразований множе- множества М. Так как равенство E) соблюдается для любых трех преобра- преобразований, то G будет группой, если: а) из принадлежности G двух преобразований /, ip следует, что ftp G G и <pf G G; б) из принадлежности G некоторого преобразования / следует су- существование и принадлежность G обратного ему преобразования /-1. Отсюда уже вытекает принадлежность G тождественного преобра- преобразования е; оно является единицей группы G (см. в связи с этим фор- формулы A) и B)).
§2] ГРУППЫ ПРЕОБРАЗОВАНИЙ 179 7. В качестве важного примера укажем группу всех невырожден- невырожденных (действительных или комплексных) линейных преобразований п переменных. Множество М в этом случае есть n-мерное координатное действительное или комплексное пространство. То, что невырожден- невырожденные линейные преобразования составляют группу, фактически пока- показано в §3 гл. II; именно, там установлено, что произведение невырож- невырожденных линейных преобразований есть невырожденное линейное пре- преобразование, и преобразование, обратное к невырожденному линейно- линейному, является таким же. Тем самым соблюдены условия а) и б) п. 6. 8. Пусть G, G' — какие-нибудь группы, и пусть группа G отобра- отображена на G'. Условимся для обозначения образов употреблять штрихи; например, a' Е G' — образ элемента a Е G. Определение. Взаимно однозначное отображение G на G' на- называется изоморфизмом, если образ произведения равен произведению образов; символически: (aft)' = а'Ъ'. F) Докажем, что при изоморфизме образ е' единицы е группы G яв- является единицей в группе G'. В самом деле, пусть а' — любой элемент группы G"; он соответствует некоторому элементу а группы G. Имеем: ае = а; следовательно, по определению изоморфизма а'е' = {ае)' = а', G) то есть, е' — единица в G'. Если существует изоморфизм G на G", то группы G и G' называют- называются изоморфными друг другу. При изоморфизме все соотношения меж- между элементами одной группы переносятся на другую. Поэтому с точки зрения теории групп изоморфные группы имеют одинаковое строение. Достаточно изучить одну, чтобы знать другую. Примеры. 1) Пусть G — группа всех действительных невырож- невырожденных п х n-матриц, G' — группа всех действительных невырожден- невырожденных линейных преобразований п переменных (рассматриваемых как преобразования координатного пространства Кп). Сопоставим с про- произвольной матрицей А из G линейное преобразование из G", имеющее матрицу А. Тем самым группа G будет взаимно однозначно отобра- отображена на G'. Установленное отображение является изоморфизмом, по- поскольку преобразование с матрицей АВ есть произведение преобразо- преобразований с матрицами А и В. При этом изоморфизме все групповые соот- соотношения, в частности, все подгруппы, переносятся из G в G'. Напри- Например, подгруппе матриц из G, определитель которых по модулю равен единице, отвечает определенная подгруппа в G'. Она состоит из ли- линейных преобразований с единичным модулем определителя. Позднее мы познакомимся с некоторыми другими важными соответствующими друг другу подгруппами в G и в G'.
180 понятие группы и некоторые его приложения [Гл. VI 2) Если линейные пространства L и L' линейно изоморфны, то они изоморфны и как группы. Обратное, вообще говоря, неверно. В самом деле, из §§ 10, 11 гл. I следует, что n-мерное комплексное пространство Сп и действительное пространство L<in размерности 2п изоморфны как группы (относительно операции сложения векторов), в то время как они не являются линейно изоморфными пространствами. 3) Используя п. 6, нетрудно проверить, что совокупность линейных функций t = Хт при всевозможных А / 0 образует группу преобра- преобразований числовой прямой —оо < г < +оо. Обозначим эту группу че- через G. Ее называют группой линейных преобразований числовой пря- прямой. Пусть G' — группа действительных чисел Л (Л ф 0) относительно умножения. Поставив в соответствие каждому преобразованию t = Хт число Л, мы получим изоморфное отображение G на G', которое яв- является частным случаем примера 1) при п = 1. Выше, в п. 6 § 1, были указаны две подгруппы в группе G'. Им соответствуют в G две под- подгруппы, определяемые условиями: 1) Л = ±1; 2) Л > 0. Первая из этих подгрупп состоит всего из двух преобразований: тождественного отображения числовой оси t = г и зеркального отоб- отображения t — —Т. Вторая подгруппа состоит из бесконечного множества преобразова- преобразований, именно, из всех линейных преобразований, сохраняющих направ- направление числовой оси. 9. Определение. Отображение группы G в группу G' называ- называется гомоморфизмом, если образ произведения любых двух элементов из G является произведением их образов в G'. Иначе говоря, требуется лишь соблюдение условия F). При этом может случиться, что а' = Ь' при а ф Ь и что некоторые элементы группы G' не являются образами каких бы то ни было элементов из G. Гомоморфизм будем символически обозначать так: G —ь G1. Ясно, что изоморфизм есть частный случай гомоморфизма. Другой частный случай гомоморфизма мы получим, поставив в со- соответствие каждому элементу произвольно выбранной группы G еди- единицу какой-либо группы G'. Тогда имеем: а' = е7, b' = е', (ab)f = е' = = a'b1', и F) соблюдено. 10. Теорема. При любом гомоморфизме G —>¦ G' образ группы G является подгруппой в G'. Доказательство. Образ группы G обозначим через G. Пусть а', Ь' — произвольные элементы из G, a, b — какие-нибудь из их про- прообразов. Вследствие F) умножение не выводит за пределы G: a'b' = (аЬ)' е G. (8) Из F) следует также, что a'ia'1)' = (аа-1)' = е'. (9)
§2] ГРУППЫ ПРЕОБРАЗОВАНИЙ 181 Аналогично п. 8 (см. формулу G)) устанавливается, что образ е' единичного элемента группы G является единицей в G'. Поэтому (9) означает, что (а') = (а)' G G. A0) Соотношения (8) и A0) показывают, что G удовлетворяет опреде- определению подгруппы. Замечание. Можно доказать, что совокупность всех прообра- прообразов единичного элемента группы G' при гомоморфизме G —>¦ G' об- образует подгруппу в G; эту подгруппу называют ядром гомоморфизма G —> G'. На доказательстве останавливаться не будем. 11. Рассмотрим некоторые примеры гомоморфизмов, важные для дальнейшего. Пусть G — группа невырожденных действительных п х п-матриц, G' — группа действительных чисел Л (Л ф 0) относительно умножения. Построим следующие отображения G в G": 1) Каждой матрице A Е G ставится в соответствие одно и то же число Л = 1. 2) Все матрицы, у которых Det А > 0, отображаются в число Л = = +1; все матрицы, у которых Det A < 0, имеют своим образом число А = -1. 3) Пусть зафиксировано любое действительное число а. Каждой матрице A Е G ставится в соответствие число Л = | Det A\a. 4) Матрице A Е G ставится в соответствие Л = |Det/L|°", если Det А > 0, Л = -| Det A\a, если Det A < 0. Во всех четырех примерах имеем гомоморфизм G —У G'. В первом — вследствие того, что вся группа G отображена в единицу группы G'. В трех остальных — вследствие теоремы об определителе произведения матриц. Вместо группы чисел Л (Л ф 0) можно взять изоморфную ей группу линейных преобразований t = Лг (Л ф 0) числовой прямой. Тогда мы получим четыре гомоморфизма, в которых образами G являются группы преобразований числовой прямой, состоящие соответственно 1) из одного тождественного преобразования: t = г; 2) из двух преобразований t = г и t = —г; 3) из всех преобразований t = Лг, у которых Л > 0; 4) из всех линейных преобразований t = Лг (Л ф 0). Оказывается, что перечисленные выше в этом пункте четыре вида отображений G и G' исчерпывают все вообще возможные гомоморфиз- гомоморфизмы G в G'. Это утверждение будет существенно использовано в следу- следующем параграфе (см. § 3, п. 8). Там же будут даны указания по поводу его доказательства.
182 понятие группы и некоторые его приложения [Гл. VI § 3. Инварианты. Осевые инварианты. Псевдоинварианты 1. Пусть дано n-мерное линейное пространство L, которое для уп- упрощения дальнейших формулировок мы будем считать действитель- действительным. Предположим, что в L выбран и зафиксирован класс базисов ? по некоторой подгруппе G невырожденных (действительных) п х п- матриц. Наряду с пространством L рассмотрим некоторое множество Т, конкретная природа элементов которого формально не имеет значе- значения. Фактически же в качестве Т нам будут встречаться совокупности геометрических объектов пространства L или каких-либо алгебраиче- алгебраических объектов, связанных с этим пространством. Пусть задана числовая функция а двух аргументов: произвольного элемента t из множества Т и произвольного базиса е из класса ?, o = V(«, е). A) Предположим, что значения функции A) действительны и для все- всевозможных t Е Т заполняют всю числовую ось — ос < а < +ос (при любом фиксированном е). Можно представлять себе, что (как часто бывает в геометрии) пра- правая часть A) есть символическая запись некоторой функции от коор- координат объекта t. Соответственно вместо A) можно написать а = ф{хи х2, • • ., xN), (Г) где #i, #2, • • • ? xn — координаты t относительно базиса е, т.е. числа, которые каким-то способом определяют объект t при задании базиса е. Пример. Объект t есть параллелограмм, построенный в евкли- евклидовой плоскости на упорядоченной паре векторов р, q: р = {хи ж2}, q = {2/i, 2/2}; в качестве (!_') напишем (в данном случае) а = xiy2 - %2У1- Здесь подразумевается, что xi, х<± и yi, y^ суть координаты ри^в некотором базисе е; тогда xi, X2, 2/1, у2 можно считать координатами t в том же базисе. Если е брать в классе ортонормированных базисов евклидовой плоскости, то число а будет ориентированной площадью параллелограмма t. 2. Пусть дано значение а = i/>(t, e). Предположим, что от базиса е мы переходим к любому другому базису е' того же класса ?: е/ = Ре, PeG. Потребуем, чтобы число а' = ф(г, е') определялось значением чис- числа а и матрицы Р без каких-либо дополнительных сведений по поводу
§3] ИНВАРИАНТЫ И ПСЕВДОИНВАРИАНТЫ 183 объекта t и исходного базиса е. Иначе говоря, мы будем считать, что а' является функцией от а и от элементов Р\, матрицы Р = ЦР//Ц. Символически: a' = f(a,P). B) Кроме того, будем предполагать, что для каждой матрицы Р из G функция B) задает обратимое преобразование числовой оси -ос < < а < +оо, которое мы будем обозначать символом /р. Мы будем часто вместо выражения B) употреблять равносильную ему запись a' = fP(a). 3. При соблюдении требований пп. 1, 2 будем говорить, что в про- пространстве L на множестве Т задана скалярная величина а отно- относительно группы G. Формула B) называется законом преобразования скалярной величины а. 4. Функцию /(а, Р) нельзя выбирать произвольно. Условия п. 2 накладывают на нее жесткие ограничения, сущность которых заклю- заключается в том, что преобразования а' = fp(a) составляют группу. Точ- Точнее, имеет место Теорема. Закон преобразования скалярной величины есть гомо- гомоморфизм группы матриц G в группу всех обратимых преобразований числовой прямой. Пояснение. Формула B) ставит в соответствие каждой матрице Р Е G преобразование а' = fp(a) числовой прямой — ос < а < +ос. Теорема утверждает, что это соответствие есть гомоморфное отобра- отображение. Обозначим через Н множество преобразований а' = /p(ft), отвечаю- отвечающих всевозможным матрицам Р из G; тогда из сформулированной тео- теоремы и пп. 10 и 4 § 2 вытекает Следствие. Множество Н есть группа преобразований число- числовой прямой — оо < а < +00. Доказательство теоремы. Поскольку обратимость каждо- каждого преобразования а' = fp(a) дана, а все обратимые преобразования числовой прямой — оо < а < +оо составляют группу, то достаточно проверить, что fp'fp = fp>p C) для любых матриц Р, Р' из G. Возьмем произвольный базис е G ? и рассмотрим базисы е' = Ре, е" = Р'е' = (PfP)e. Обозначим через а, а', а" значения скалярной величины A) в базисах е, е', е" соответ- соответственно. Согласно п. 2 имеем а" = /(о', Р') = /(о, Р'Р). D)
184 понятие группы и некоторые его приложения [Гл. VI Из B) и D) получаем условие на функцию / /(/(а, Р), Р') = f(a, P'P). E) Правой части равенства E) соответствует преобразование fp'p. Слож- Сложной функции, стоящей в левой части равенства E), соответствует пре- преобразование, равное произведению fp'fp. Поэтому соотношение E) (где а — любое число, — ос < а < +ос) равносильно формуле C). Теорема доказана. 5. Замечание. В справедливости теоремы можно убедиться с по- помощью более наглядных соображений. В самом деле, пусть матрица Р Е G дает переход от базиса е к базису е', а матрица Р' G G — переходит от базиса е' к базису е". Тогда матрица Р'Р Е G дает непосредственный переход от е к е". Пересчитаем значения нашей величины, исходя из базиса е и переходя к базису е" один раз — через посредство базиса е7, другой раз — непо- непосредственно. Если fp'fp Ф fp'Pj то мы получим разные результаты, что недопустимо, так как для каждого объекта из Т в каждом базисе класса ? значение величины должно быть однозначно определенным. Следовательно, fp'fp = fp'p-, что и требуется. 6. Каждый гомоморфизм группы G в любую группу преобразова- преобразований числовой прямой задает в пространстве L некоторую скалярную величину. Поясним это подробнее. Пусть некоторый гомоморфизм ставит в со- соответствие матрице Р Е G обратимое преобразование fp числовой прямой, т.е. функцию а' = fp(a), заданную на всей прямой и имею- имеющую обратную функцию, тоже заданную на всей прямой. Положим /(а, Р) = fp(a). Тогда из C) следует E) и D), откуда вытекает одно- однозначная определенность величины а во всех базисах класса ?. Мы должны построить множество Т, т.е. определить геометриче- геометрические объекты ?, на которых была бы задана скалярная величина а с данным законом преобразования /(ft, P). Это можно сделать по- разному. Например, в качестве t можно взять точку числовой прямой, которая имеет координату а в обычной декартовой шкале. Одновре- Одновременно следует считать, что в классе ? выбран произвольный базис е. При переходе к новому базису е' = Ре перейдем на числовой прямой к другой шкале по формуле а' = fp(a). Будем считать, что в базисе е' той же точке t отвечает ее координата а' в новой шкале. Тогда все требования пп. 1, 2 будут соблюдены. 7. Особенно часто встречаются так называемые линейные геомет- геометрические объекты или линейные скалярные величины, которые харак- характеризуются тем, что преобразования fp линейны, т.е. закон преобра- преобразования B) имеет вид а' = f(P)a.
§3] ИНВАРИАНТЫ И ПСЕВДОИНВАРИАНТЫ 185 В этом случае вместо E) имеем более простое соотношение f(p)f(p') = f(pp'), (в) наложенное только на матрицы Р, Р' (любые из G). Соотношение F) легко вывести сразу, без ссылки на E). В самом деле, если а' = f(P)a, a" = f(P')a', ТО а" = f(P)f(P')a. С другой стороны, мы должны иметь непосредственно а" = f(P'P)a. Тем самым выполняется F). 8. Пусть теперь G — группа всех действительных невырожден- невырожденных п х n-матриц (п фиксировано). Как сообщалось (без доказательства) в п. 11 § 2, все гомоморфизмы в группу действительных чисел (по умножению) сводятся к четырем видам отображений, которые перечислены в п. 11 §2. Это же утверждение можно высказать так: Если числовая функция f(P) от матричного аргумента Р удовле- удовлетворяет соотношению F) для любых Р, Р' Е G, то: 1) либо f(P) = 1 для всех Р G G; 2) либо f(P) = 1 для Р е G, Det Р > 0, и f(P) = -1 для Р е G, Det P < 0; 3) либо f(P) = | DetP|°" для всех Р G G (здесь а — какое-нибудь данное действительное число); 4) либо f(P) = ±| Det Р\а, где знак плюс имеет место для Р G G, Det Р > 0, знак минус — для Р е G, Det P < 0. Заметим, что случаи 3) и 4) включают, в частности, случаи 1) и 2) при а — 0. Заметим, что мы исключаем из рассмотрения тривиальный случай, когда f(P) является тождественным нулем (f(P) = 0 для всех PeG). Доказательство высказанного утверждения мы могли бы провести лишь с помощью некоторых средств, изложенных в дальнейших гла- главах. Поэтому мы даем это доказательство в специальном приложении (см. Приложение в конце книги). Но мы воспользуемся высказанным утверждением теперь же. Оно позволит нам перечислить все возможные виды линейных величин. Именно, существуют лишь следующие четыре вида линейных скаляр- скалярных величин.
186 ПОНЯТИЕ ГРУППЫ И НЕКОТОРЫЕ ЕГО ПРИЛОЖЕНИЯ [Гл. VI 1) Инварианты, т. е. величины, не зависящие от выбора базиса. Их закон преобразования а' = а (I) — для любой матрицы Р. Группа Н состоит из одного тождественного преобразования числовой оси. В предыдущих главах мы неоднократно предполагали, что имеем дело именно с такими величинами (например, когда рассматривали линейные, квадратичные, билинейные и полилинейные формы). 2) Осевые (или аксиальные) инварианты. Их закон преобразования таков: , Г а, если Det Р > О, . . а = \-а, если DetP < 0. ^ Здесь группа Н состоит из двух линейных преобразований а' = а и а' = —а. Название «осевые инварианты» выражает зависимость этих вели- величин от ориентации координатных осей. Они не меняются при переходе к новому базису с сохранением ориентации, но меняют знак, если ори- ориентация базиса заменяется на противоположную. Пример. К числу осевых инвариантов принадлежит ориентиро- ориентированная площадь ориентированного параллелограмма на евклидовой плоскости. Эта величина положительна, если пара векторов, опреде- определяющих параллелограмм и его ориентацию, одинаково ориентирована с базисом, отрицательна — в противном случае. Элементы множества Т — всевозможные ориентированные параллелограммы на евклидовой плоскости. 3) Псевдоинварианты веса а. Их закон преобразования имеет вид a' = a\DetP\a, (III) где а — заданное действительное число. Здесь каждой матрице Р ставится в соответствие линейное преоб- преобразование а' = Аа при А = | Det P\a. Группа Я состоит из всех линей- линейных преобразований а' = Аа с положительным коэффициентом А. Пример. Согласно § 3 гл. IV определитель матрицы инвариант- инвариантной билинейной формы преобразуется по закону А' = A(DetPJ. Таким образом, величина А относится к числу псевдоинвариантов веса а = 2. Множество Т в этом примере состоит из всевозможных инвари- инвариантных билинейных форм, заданных в пространстве L. 4) Осевые псевдоинварианты веса а: ,_Г a|DetP|a, если Det P> 0, . ~ \-a\DetP\a, если Det Р< 0, ^ ^ где а — заданное действительное число.
§4] ТЕНЗОРНЫЕ ВЕЛИЧИНЫ 187 9. Если G — какая-нибудь группа действительных п х n-матриц, то скалярные величины с законами преобразования (I), (II), (III) и (IV) называются соответственно инвариантами, осевыми (или аксиальны- аксиальными) инвариантами, псевдоинвариантами веса а и осевыми (или акси- аксиальными) псевдоинвариантами веса а относительно группы G. В слу- случае группы матриц, у которых | Det P\ = 1, псевдоинварианты не от- отличаются от инвариантов, а осевые псевдоинварианты — от осевых ин- инвариантов. Если же наложить условие Det Р = +1, то все четыре класса вели- величин становятся неразличимыми (сводятся к инвариантам относитель- относительно указанной группы). Отметим попутно, что группу матриц с определителем, равным единице, обычно называют унимодулярной группой (как в действи- действительном, так и в комплексном случаях). 10. Термин «инвариант» часто употребляется в более широком смысле, чем в пп. 8, 9. Именно, инвариантами какой-либо группы преобразований назы- называются всевозможные объекты, свойства и величины, сохраняющиеся при применении любого преобразования из данной группы. Очевидно, что каждый инвариант некоторой группы является ин- инвариантом для любой ее подгруппы. Обратное неверно: инвариант под- подгруппы может не быть инвариантом всей группы. В этом смысле мож- можно сказать, что чем обширней группа преобразований, тем меньше у нее инвариантов, но зато они отражают более устойчивые, более глубокие свойства реального мира. Геометрия распадается на ряд разделов, в каждом из которых ис- исследуются инварианты какой-нибудь определенной группы преобразо- преобразований того или иного пространства. Так, например, в элементарной геометрии рассматриваются свойства фигур в трехмерном евклидо- евклидовом пространстве, сохраняющиеся при любом движении фигуры как твердого тела (иначе говоря, инварианты группы движений трехмер- трехмерного евклидова пространства). В следующих главах мы познакомимся с несколькими важными группами преобразований и с некоторыми их инвариантами. § 4. Тензорные величины 1. Здесь мы определим некоторые классы величин, родственные тензорам и включающие их как частный случай. Геометрическим ис- истолкованием этих величин мы сейчас заниматься не будем. Мы будем только предполагать, что в каждом базисе они задаются известным набором чисел (координат) и что при переходе к новому базису эти числа преобразуются так же, как коэффициенты полилинейных форм.
188 понятие группы и некоторые его приложения [Гл. VI Чтобы не осложнять изложения громоздкими формулами, будем счи- считать, что определяющие числа (координаты величин) помечены двумя индексами (нижним и верхним). Соответственно будем рассматривать формы от двух векторных аргументов (один из которых контравари- антный, другой ковариантный). Переход к любому числу индексов три- тривиален. 2. Пусть в линейном n-мерном пространстве L дана билинейная форма а(х, и), х G L, и G L*. Если в L введен базис еь ..., еп, а в L* — взаимный базис е1, ..., еп, то х = ххе\ + V хпеп, и = и\ех + • • • • • • + ипеп, и форма а(х, и) получает координатное представление а(х, и) = ^акхгик, где ак = а(ег,ек). A) При переходе к новому базису имеем er=^2phi, ek'=Y,QUk- B) Коэффициенты координатного представления формы при этом из- изменятся. Новые коэффициенты а\, будут выражаться через старые ко- коэффициенты а\ тем или иным способом в зависимости от характера самой формы как скалярной величины. Именно, может случиться, что числовое значение а (ж, и) данной формы на произвольной паре векто- векторов ж, и заменится новым значением а'(х, и); тогда закон преобразо- преобразования а (ж, и) в а'(ж, и) определит закон преобразования а\ в а\, . Мы будем предполагать, что данная форма как скалярная величина от- относится к одному из четырех классов, указанных в п. 7 предыдущего параграфа. Соответственно рассмотрим четыре случая. 3. 1) Форма а(ж, и) является инвариантом. В этом случае ак-, = а\еу, ек') = а(е{>, ек'). Отсюда с учетом A) и B) получаем kiPhQk- a) Это есть известный нам закон преобразования координат (двухвалент- (двухвалентного смешанного) тензора. 2) Форма а(х, и) является осевым инвариантом. В этом случае ак! = а'(е;/, ек') = ±а(е*/, ек'), где имеем знак плюс, если Det P > 0, знак минус, если Det P < 0. Отсюда с учетом A) и B) 4 = ±Y,«iPi>Qk (") при том же условии насчет знака в правой части. Величины, у которых определяющие числа акпреобразуются по за- закону (II), называются осевыми (или аксиальными) тензорами.
4] ТЕНЗОРНЫЕ ВЕЛИЧИНЫ 189 3) Форма а(х, и) является псевдоинвариантом веса а. В этом слу- слуае 4' =а'(е*/, ек') = а(е{>, ek')\ Det Р\а. Отсюда с учетом A) и B) af, =\T>etP\°Y,a1pi'Qkk- (I") Величины, у которых определяющие числа акпреобразуются по за- закону (III), называются псевдотензорами веса а. 4) Форма а(х, и) является осевым псевдоинвариантом веса а. В этом случае 4' = a\ei4 ек') = ±а(е^, ek')\DetP\a и соответственно 4'=±| Det РГ5>?РД<#, (IV) где справа берется знак плюс, если Det Р > О, знак минус, если Det P < 0. Величины, у которых определяющие числа акпреобразуются по за- закону (IV), называются осевыми (или аксиальными) псевдотензорами веса а. 4. Законы преобразований (I)—(IV) для а\ выведены нами как след- следствие соответствующих законов преобразования (I)—(IV) § 3 для ска- скалярной величины а(х, и). Легко показать, что и обратно, если а\ пре- преобразуются по законам (I)—(IV), то для скалярной величины а(х, и) = y~]a!jXlUk имеют место соответственно законы преобразований (I)—(IV) § 3. 5. В этом параграфе мы считали, что преобразование B) опреде- определяется любой невырожденной матрицей Р. Можно предполагать, что матрицы Р берутся из некоторой группы G, а допустимые базисы со- составляют соответствующий класс ?. Тогда высказанные выше опреде- определения дадут нам четыре класса тензорных величин относительно груп- группы G. 6. Будем рассматривать совокупность чисел ак как точку коорди- координатного пространства К (размерности п2). Тогда любой из четырех законов (I)—(IV) определяет по заданной матрице Р G G некоторое преобразование пространства К (разумеется, свое для каждого зако- закона (I)—(IV)). Обозначим это преобразование для какого-нибудь одного закона (I)—(IV) через /р. Справедливы утверждения: а) множество всех fp (P G G) является некоторой группой Н пре- преобразований пространства К]
190 понятие группы и некоторые его приложения [Гл. VI Ь) отображение СнаЯ, при котором матрице Р Е G соответствует преобразование fp Е Я, является гомоморфизмом; именно: fp,fp = fp,P C) для любых матриц Р', Р Е G. Доказательство аналогично п. 4 §3. Соотношение C) чрезвычайно важно. Если бы оно не имело места, то законы (I)—(IV) были бы бессмысленны, так как различные пере- переходы к новому базису — непосредственно или через промежуточные базисы — давали бы разные результаты. 7. Из законов преобразования (I)—(IV) следует, что обращение в нуль всех координат тензорной величины в одном базисе влечет за собой обращение в нуль всех ее координат в любом другом базисе: если а\ = 0, то а% = 0. 8. Если определяющие числа тензорной величины (любого из че- четырех классов) помечены многими индексами, то внизу пишутся те из них, по которым в законах преобразований (I)—(IV) идет суммирование с верхними индексами элементов матрицы Р. Число нижних индексов называется ковариантной валентностью тензорной величины. Осталь- Остальные индексы пишутся сверху; число их равно контравариантной ва- валентности. Замечание 1. Скалярные величины любого из четырех классов, о которых говорилось в § 3, можно рассматривать как тензорные вели- величины (соответствующего класса) нулевой валентности. Замечание 2. Сумма ковариантной и контравариантной валент- валентностей называется валентностью тензорной величины. 9. Пусть Т означает множество всех тензорных величин какого- нибудь одного из классов (I)—(IV) и какой-нибудь одной структуры в отношении валентностей (т. е. с одним и тем же числом нижних и верхних индексов). Тогда, если над элементами Т производить линей- линейные операции, как в координатном пространстве (т.е. сумму величин строить путем сложения их соответствующих координат, произведе- произведение величины на число — путем умножения на это число всех ее ко- координат), то в результате будут получаться тензорные величины того же множества Т. Убедимся в этом, взяв для простоты в качестве Т множество двухвалентных смешанных псевдотензоров данного веса а. Рассмотрим два псевдотензора из Т с координатами af и bf в некото- некотором базисе. В новом базисе получим а\, , Ь\, . Можно считать, что а\, выражены уже написанным в п. 3 равенством (III). Аналогично Ь*'= |Det РГ$>?Р?д*'. (Ша) Складывая (III) и (Ша) почленно, получим 4'+6*/ = \Det P\° J2(ai + bi)Pi'Q к ¦
§4] ТЕНЗОРНЫЕ ВЕЛИЧИНЫ 191 Таким образом, сумма двух тензорных величин из Т имеет точно тот же закон преобразования, что и каждая из этих величин. Умножая обе части равенства (II) на произвольное число а, увидим, что аа\, выражается через аа\ по тому же закону. 10. Если две тензорные величины принадлежат Т, то равенство между ними имеет инвариантный характер. Подробнее, пусть, напри- например, для а\ и Ь\ имеем в одном базисе равенства а\ — Ь\ при любых г, к. Тогда в любом другом базисе а\, — Ь\, . Чтобы убедиться в этом, достаточно заметить, что, согласно п. 9, разность Ь\ — а\ есть тензорная величина и, следовательно, обращение ее в нуль не зависит от базиса. Замечание. Разумеется, в одном базисе равенство Ь\ — а\ воз- возможно для любых величин а\, Ь\. Но если эти величины взяты из раз- разных классов (I)—(IV), т.е. имеют разные законы преобразований, то при переходе к новым координатам равенство нарушится. 11. Произведение двух любых тензорных величин, взятых из каких-угодно классов (I)—(IV), строится путем умножения каждой ко- координаты одной величины на каждую координату другой (в одном и том же базисе). Полученная величина будет относиться к одному из классов (I)—(IV) в зависимости от выбора сомножителей. Например, если а\ есть псевдотензор веса а\,Ъ\ — псевдотензор веса сг2, то afbj1 будет (четырехвалентным) псевдотензором веса о\ + &2- В самом деле, при указанных предположениях 4 = bf = Перемножая эти равенства, получим к' глп' _ | п 1 р СГ1+СГ2 \ л пкигп pi pj глк' глт 12. Отметим, что произведение двух осевых тензоров есть обыч- обычный тензор. Произведение обычного тензора на осевой есть осевой тен- тензор. 13. Свертка по одному верхнему и одному нижнему индексу тен- тензорной величины одного из классов (I)—(IV) дает тензорную величину того же класса. Полная свертка приводит к скалярной величине того же класса. Например, свертка двухвалентного смешанного псевдотен- псевдотензора веса а есть псевдоинвариант веса а. В самом деле, из (III) имеем = | Det Р таким образом, для величины а = ^ а^ получается закон преобразо- преобразования вида (III) §3.
192 понятие группы и некоторые его приложения [Гл. VI § 5. Ориентированный объем параллелепипеда. Дискриминантный тензор 1. Пусть в линейном n-мерном пространстве L выбран некоторый базис ei, ..., еп и тем самым задана ориентация пространства (см. § 1). Возьмем в L упорядоченный набор произвольных векторов х\, х^-, ... . . ., хп, и каждый из них разложим по данному базису: \ Л Ь х^еп, хп = х1пе1 Матрицу, составленную из коэффициентов этих разложений, т.е. из координат векторов xi,..., хп по базису ei,..., еп, обозначим через X. Сопоставим с упорядоченным набором векторов xi, ..., хп число D(xi, . . ., хп), равное определителю матрицы X: х\ D(xi, ..., хп) = к При переходе к другому базису ev=Y,Phi A) мы сопоставим с тем же набором векторов xi, ..., хп число D'(х\, . . . . . ., хп), равное определителю матрицы X'\ которая составлена из ко- координат векторов xi, ..., хп по базису е^, ..., еп/. Легко найти закон преобразования величины D(x±, . . ., хп). Имен- Именно, вместе с A) мы имеем для координат любого вектора следующие равенства: Отсюда получаем матричное равенство X' = XQ*. Следовательно, D'{xu . . ., хп) = DetX' = DetXDetQ* = DetQ*D(xlj . . ., хп). Но, как мы знаем, Q* = Р. Таким образом, имеет место соотношение D'{xu . .., хп) = ±\T)etP\-1D(x1, ..., хп), B) где справа следует брать знак плюс, если Det P > 0, знак минус, если Det P < 0. Мы видим, что D(xi, . . ., хп) является осевым псевдоинвариантом веса а — — 1, который определен на всех упорядоченных наборах из п векторов каждый. Заметим, что D(xi, . . . , хп) > 0, если векторы
§5] ДИСКРИМИНАНТНЫЙ ТЕНЗОР 193 xi, ..., хп линейно независимы и упорядоченный набор х\, ..., хп ориентирован положительно (т. е. одинаково с базисом ei, ..., еп). 2. Из свойств определителей следует, что D{x\, . . ., хп) представ- представляет собой полилинейную форму, т. е. функцию, линейную по каждому своему векторному аргументу. Форма D(xi, . . . , хп) является косой, т.е. кососимметричной по любой паре аргументов (поскольку определитель меняет знак при пе- перестановке двух строк). Разлагая определитель согласно его непосредственному определе- определению, получаем координатное представление формы D(xi, . . ., хп) в базисе еь ..., еп: D(xu . . . , хп) = Здесь 8г1..лп — О, если среди индексов ii, ..., гп имеются одинаковые; $ii...in = +1? если ii, ..., in составляют четную перестановку нату- натуральных чисел 1, 2, ..., n; Si1_jn = —1, если перестановка ii, ..., гп нечетная. Отсюда и из предыдущего пункта следует, что bix...in является осе- осевым ковариантным псевдотензором веса а = —1. Ясно также, что 8i1...in кососимметричен по любой паре индексов. Замечание. Можно прямым путем убедиться, что если мы под- подвергнем 5i1...in преобразованию по чисто ковариантному закону вида (IV) § 4, то получим числа Si[..<=±\BetP\-1Y/Sh-inPi^--Pir C) точно такие же, как Si1_jn. Именно, ^...г^ — 0? если среди индексов есть одинаковые; ^...г^ = =Ы в зависимости от четности перестанов- перестановки г^, ..., г'п. Для пояснения мы заметим только, что если i[ = 1, г'2 = 2, ..., г'п = п, то сумма в правой части C) равна Det P; поэтому ^i'2'...n' — +1; остальные случаи предоставляем читателю. 3. Пользуясь формой D(xi, . . ., хп), можно построить новую ко- косую форму от xi, ..., xnj которая уже будет осевым инвариантом, т. е. будет только знаком реагировать на ориентацию базиса, сохраняя во всех базисах свою абсолютную величину. Но для этого нам придется привлечь на помощь некоторую инвариантную квадратичную форму. Возьмем по своему усмотрению какую угодно инвариантную квад- квадратичную форму а (ж, х) при единственном условии, чтобы она была невырожденной. В произвольном базисе ei, ..., еп эта форма имеет определенное координатное представление и вместе с ним определен- определенную матрицу А; при этом А = Det A / 0. При переходе к новому базису согласно A), форма а (ж, х) получит новую матрицу А''. Если А' = Det A', то, как нам известно, Д' = A(DetPJ. 7 Н.В. Ефимов, Э.Р. Розендорн
194 понятие группы и некоторые его приложения [Гл. VI Отсюда Перемножая почленно B) и D), найдем i/|A'| D'(xi, . . ., хп) = ±y/\A\D(xi, . . ., хп). Таким образом, косая полилинейная форма д/|Д| D(x\, . . ., хп) явля- является осевым инвариантом. 4. Отсюда сразу следует, что в произвольном базисе ei, ..., еп числа являются координатами некоторого осевого тензора. Его называют дис- криминантным тензором для формы а(ж, х). В гл. VIII-X дискрими- нантный тензор будет существенно использован. 5. Пусть Я — действительное аффинное n-мерное пространство, соответствующее линейному n-мерному пространству L. Возьмем произвольную точку A Е Я и произвольные векторы х\,... . . ., хп Е L в числе, равном размерности. Пусть далее М — какая- нибудь точка пространства Я, определяемая равенством AM = т\Х\ + У тпхпу где Ti, ..., тп — действительные числа. Если ti, ..., тп изменяются независимо друг от друга при условиях 0 ^ т& ^ 1 (к = 1, ..., п), то всевозможные получаемые при этом точки составляют некоторую пространственную фигуру, которая называется параллелепипедом, по- построенных на векторах xi, ..., хп, приложенных к точке А. При п = 2 параллелепипед называется также параллелограммом (см. выше, §8 гл. III). Пусть пространство L ориентировано заданием базиса ei, ..., еп. Тогда, если векторы xi, ..., хп линейно независимы, то построенному на них параллелепипеду приписывается положительная или отрица- отрицательная ориентация. Именно, параллелепипед считается положитель- положительно ориентированным, если положительно ориентирован упорядочен- упорядоченный набор векторов xi, ..., хп. 6. Мы хотим с каждым параллелепипедом сопоставить некоторое число, которое по аналогии с трехмерным евклидовым пространством естественно было бы назвать его объемом (в двумерном случае — пло- площадью). Учитывая эту аналогию, мы предъявим к искомой величине следующие требования: 1) Объем должен зависеть только от векторов xi, ..., хп, но не от точки А. 2) Объем должен быть положительным числом в случае положи- положительной ориентации параллелепипеда, отрицательным — в случае от- отрицательной ориентации; должен быть нулем, если векторы xi, ..., хп
§5] ДИСКРИМИНАНТНЫЙ ТЕНЗОР 195 линейно зависимы (тогда весь параллелепипед лежит в гиперплоско- гиперплоскости). 3) Абсолютная величина объема должна быть инвариантом. 4) При удлинении одного из векторов xi, ..., хп в а раз объем дол- должен увеличиваться в а раз. 5) Если х\ — х[ + х'{, то объем параллелепипеда, построенного на векторах х\, ..., хп, должен равняться сумме объемов параллелепи- параллелепипедов, построенных на х[, ..., хп их", ..., хп; аналогичное свойство должно иметь место в отношении остальных векторов набора xi, ... . . ., хп. Оказывается, что указанные требования по существу определяют объем как функцию от xi, ..., хп. В самом деле, они означают, что эта функция должна быть полилинейной формой от xi, ..., жп, косо- симметричной по каждой паре аргументов; как числовая величина она должна быть осевым инвариантом. Но в точности такими же свойствами обладает полилинейная форма у/\ЩD(xi, . . ., хп), приведенная в п. 3. С другой стороны, согласно изложенному в § 8 гл. V, всякая другая полилинейная форма, обладающая теми же свойствами, пропорциональна форме д/|Д| D(xi, . . ., хп). Таким образом, если объем ориентированного па- параллелепипеда, который построен на векторах х^, ..., хп, обозначить ь . . ., хп), то V{xu . . ., хп) = CV|A| D(xu ..., хп), E) где С — любая инвариантная постоянная (разумеется, отличная от нуля). 7. Мы можем менять постоянную С и форму а (ж, ж), определи- определитель А которой участвует в равенстве E). Однако множитель Сд/|Д| в правой части E) будет единственным образом определен, если мы по своему усмотрению назначим параллелепипед с единичным объемом, т.е. произвольно возьмем линейно независимые векторы ai, ..., ап и потребуем, чтобы V(ai, . . . , ап) = 1. Определяя указанным способом Сд/|Д|, получим формулу , _ Р(хи...,хп) Таким образом, измерение объемов в аффинном пространстве одно- однозначно определяется произвольным выбором единицы объема. Моти- Мотивированный выбор единицы объема естественно делается в линейных пространствах, наделенных метрикой; об этом см. гл. VIII. 8. Если при замене базисов мы будем использовать не всю груп- группу вырожденных матриц, а ограничимся ее унимодулярной подгруп- подгруппой G, то не будет надобности в квадратичной форме а (ж, ж), так
196 ПОНЯТИЕ ГРУППЫ И НЕКОТОРЫЕ ЕГО ПРИЛОЖЕНИЯ [Гл. VI как относительно G сама величина D(xi, . . ., хп) является инвари- инвариантом. При этом необходимо также ограничиться базисами из некото- некоторого класса ? относительно унимодулярной подгруппы G. Допустим, что класс ? выбран. Полагая в этом случае V{xu . . ., хп) = CD{xu . . ., хп), F) получим объем как инвариант относительно унимодулярной подгруп- подгруппы G. Так как D(eu . . ., еп) = 1, то С = Vb, где Vo = V(eu . . . . . ., еп) есть объем параллелепипеда, построенного на базисных век- векторах ei, ..., еп. Заметим еще, что можно в формуле F) взять G = 1; тогда V(ei, . . ., еп) = 1, т.е. параллелепипед, построенный на базис- базисных векторах ei, ..., еп, имеет единичный объем. В данном случае все базисы выбранного класса ? характеризуются тем, что для них V = +l. 9. Точно также вспомогательная квадратичная форма а (ж, х) не нужна, если рассматривается какой-либо класс базисов ?(е) по под- подгруппе матриц с единичным модулем определителя. В таком случае объем тоже выражается формулой F), но является осевым инвариан- инвариантом. Будем считать, как и выше, что G = 1. Тогда параллелепипед, построенный на векторах базиса е, снова будет иметь объем V = +1, а все базисы класса ? будут характеризоваться тем, что для них \V\ = 1. При этом V = +1 или V = — 1 в зависимости от ориентации произволь- произвольного базиса ?(е) по отношению к исходному базису е. Чтобы подчеркнуть зависимость знака объема от ориентации, часто употребляют термин «ориентированный объем параллелепипеда».
ГЛАВА VII. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ЛИНЕЙНЫХ ПРОСТРАНСТВ § 1. Общие сведения 1. Определение. Отображение у = Ах, х Е L, у Е L, ли- линейного пространства L в себя (или на себя) называется линейным, если А(ах! + /Зх2) = аА(хх) + /ЗА(ж2) A) для любых векторов х\, х2 G Ьи любых чисел а, C. Здесь и в даль- дальнейшем числовые множители действительны или комплексны в зави- зависимости от того, действительно или комплексно пространство L. Отображение у = Ах называют также линейным преобразованием пространства L; иногда говорят, что А(х) есть линейный оператор в L. Линейные преобразования представляют собой многомерное обоб- обобщение линейной функции одного числового аргумента f(x) = kx. Их разнообразие быстро растет с повышением размерности. При записи линейных преобразований скобки обычно опускают и вместо А(х) пишут Ах. Простейшими примерами линейных преобразований могут служить тождественное преобразование Ех = х B) и нулевое преобразование Qx = 0, где слева О есть символ линейного преобразования, которое каждому вектору х ставит в соответствие нулевой вектор. 2. Произведение двух любых линейных преобразований А и В ли- линейно: AB(axi + Рх2) = A(aBxi + рВх2) = аАВхх 3. Для линейных преобразований определяются операции сложе- сложения и умножения на числа: (А + В)х = Ах + Вх, (аА)х = аАх. C) Нетрудно показать, что преобразования А + В и а А тоже линейны и что множество линейных преобразований пространства L само явля- является линейным пространством. Роль нулевого вектора в пространстве линейных преобразований выполняет нулевое преобразование О. До- Доказательство этих утверждений предоставляем читателю.
198 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII 4. Наличие трех операций: умножения линейных преобразований, сложения и умножения их на числа — позволяет строить многочлены от преобразований: р(А) = а0Ап + агА71-1 + • • • + ап-ХА + апЕ, D) где otj — числа; степени преобразования определяются повторным умно- умножением: А2 = АА, А3 = ААА и т. п. Для любого преобразования А по определению считают, что А° = Е, E) так что слагаемое апЕ в многочлене D) играет роль свободного члена. 5. Предполагая пространство конечномерным, введем в нем базис еь ..., еп. Предположим, что нам известны образы базисных векторов Аек в данном базисе, т.е. известны коэффициенты разложений: Аек = F) Тогда известна матрица величин А%. Один из индексов поставлен свер- сверху, а другой снизу не случайно. Ниже мы покажем, что А есть тензор с такими валентностями. Положим 1 42 Ап А* = А1 Л2 Знак * поставлен потому, что гораздо чаще в приложениях линей- линейных преобразований встречается не эта матрица, а транспонированная, и для нее оставлен более простой символ А. Покажем, что, зная матрицу Л, можно для любого х вычислить у. У = Х^е* = Лх = Воспользуемся линейностью преобразования А: у = ^хкАек = ^хкА^еа. Изменив обозначение одного из индексов, получим откуда г = 1, ..., п. G) к=1 Эта координатная запись равносильна одному матричному равен- равенству У = Ах, (8)
il] ОБЩИЕ СВЕДЕНИЯ 199 где А = А\ А\ х = У = V Легко проверить, что разные матрицы А и В задают в данном ба- базисе разные линейные преобразования. Итак, линейное преобразование у = Ах векторов пространства L выражается в виде линейного преобразования переменных G), которое в матричной форме записывается т е м же самым равенством у = Ах. Оно называется координатным представлением линейного преобразования А. 6. Используя формулы C) и G), нетрудно проверить, что при сло- сложении линейных преобразований их матрицы складываются, при умно- умножении линейного преобразования на число матрица умножается на то же число, так что пространство линейных преобразований п-мерного линейного пространства L изоморфно пространству п х n-матриц. Ана- Аналогично § 2 гл. II можно показать, что при умножении двух линейных преобразований их матрицы перемножаются. Тождественному преоб- преобразованию соответствует единичная матрица Е, нулевому преобразо- преобразованию соответствует матрица, состоящая из нулей. Согласно сказанно- сказанному равенства B)-E) можно в равной мере понимать и как выражения для преобразований, и как выражения для матриц. 7. Укажем некоторые обобщения понятий, введенных в этом па- параграфе. Пусть даны два линейных пространства L и U. Линейным отображением пространства L в пространство L' или линейным опера- оператором из L в U называется функция у = Ах, которая каждому вектору х G L ставит в соответствие некоторый вектор у из U и удовлетворяет условию линейности A). При L = U получаем линейное преобразова- преобразование, определенное в п. 1. Для линейных операторов определены дей- действия сложения и умножения на число согласно формулам C); можно показать, что множество всех линейных отображений пространства L в L' само образует линейное пространство. Если каждое из пространств L и L' рассматривать как группу от- относительно сложения векторов, то любой линейный оператор L —^ L' представляет собой гомоморфизм. Если пространства L и U конечно- конечномерны и в них выбраны базисы, то линейный оператор задается матри- матрицей и выражается в виде линейного преобразования координат векто- векторов, но в отличие от п. 4 матрица, вообще говоря, будет прямоугольной. При совпадении размерностей L и V оператор А имеет квадратную матрицу.
200 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII Пусть даны три линейных пространства L, Z/, L" и пусть рассмат- рассматриваются два линейных отображения: 1) у = Вх, где х е L, у е Z/, 2) z = Ay, где у е V, z е L". Произведение АВ оператора А на оператор В определяется фор- формулой z = АВх = А{Вх) и отображает L в L". Линейность АВ доказывается так же, как в п. 1. § 2. Линейное преобразование как тензор 1. Будем считать, что пространство L является п-мерным. Рассмотрим линейное преобразование у = Ах пространства L. Оно определено инвариантно, т. е. независимо от каких-бы то ни было ба- базисов. Теперь нас интересует тензорная природа преобразования. В про- пространстве L перейдем к новому базису еу, ..., еп/. Тогда Как выражаются А\, через А\? Нетрудно сообразить, что имеет место тензорный закон преобразования, соответствующий расстановке ин- индексов. Это можно установить без всяких вычислений. Действительно, совокупность всех векторов х из L совпадает с множеством всевозмож- всевозможных одновалентных контравариантных тензоров. Свертка ^ А\хк при любом х G L дает одновалентный контравариантный тензор у1', ко- которому соответствует один вполне определенный вектор у = У^ УгCj-, независимо от базиса е{. Отсюда на основании известного признака (гл. V, §4, пп. 8, 9) заключаем, что Агк — тензор, и сразу можем напи- написать закон преобразования его определяющих чисел: 4<=?^P*Qf. A) i,k Таким образом, каждому линейному преобразованию инвариантно со- сопоставляется тензор А = ^Л\е<ек B) из Т\ — L 0 L*, где е1, ..., еп G L* — базис, взаимный с ei, ..., еп. Верно и обратное: всякому двухвалентному смешанному тензору можно инвариантно сопоставить линейное преобразование, поскольку свертка тензора B) с вектором х = х1е\-\- • • • -\- хпеп дает контравари- контравариантный вектор: У = у1е1 + --- + упеп, у1 = не зависящий от выбора базиса ei, ..., еп.
ЛИНЕЙНОЕ ПРЕОБРАЗОВАНИЕ КАК ТЕНЗОР 201 2. Можно рассматривать линейные отображения L в L*, L* в L, L* в L* и аналогично предыдущему доказать, что им также соответ- соответствуют двухвалентные тензоры. Покажем, как расставить индексы, зная уже, что преобразование представляет собой тензор. Пусть, например, и = Ах, где х Е L, и Е L*. Перейдем к коорди- координатной записи. Вектор х контравариантный, его координаты помеча- помечаются индексами сверху: {хк}. Буква А должна иметь нижний индекс к, чтобы можно было провести свертку по к. Вектор и ковариантный, его координаты помечаются индексами снизу: {ui}. Поэтому в результате свертки должен получаться ковариантный вектор. Это значит, что и другой индекс у буквы А должен быть ниж- нижним: щ = Эта запись соответствует тому, что линейное отображение простран- пространства L в сопряженное пространство L* сопоставляется с дважды кова- риантным тензором Ац*. Аналогично для преобразования и = Bv сопряженного простран- пространства L* в L имеем координатное представление вида так что соответствующий тензор Вг^ является дважды контравариант- ным. 3. Пусть А — линейное преобразование пространства L. Матрица А этого преобразования в данном базисе ei, ..., еп записывается так: А = А\ А2 При переходе к новому базису еу, ..., еп/ получится новая матрица Л', элементы которой выражаются формулой A). Запишем формулу A) в матричной символике. Для того, чтобы не спутать порядок умноже- умножения матриц, лучше написать их подробно. Строчки матрицы Р развертываются по верхнему индексу: рр Р =
202 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII Строчки матрицы Q развертываются по нижнему индексу: Q = 12 ^ ¦ Ql Ql Qt Ч\ Ч2 • • • 4n Формулу A) можно переписать так: Отсюда получаем искомое матричное выражение А' = QAP* или A' = QAQ-\ (la) где, как обычно, Q = (P*)-1. 4. Из полученных матричных формул вытекают очень важные след- следствия. Поскольку Q — невырожденная матрица, то из формулы Aа) сле- следует, что Rang Л' = Rang Л. Таким образом, ранг матрицы А есть инвариант. Далее, инвариантом является определитель линейного пре- преобразования, поскольку Det A' = Det Q Det /L(Det Q)'1 = Det A. Инвариантом является также полная свертка тензора А\ которая представляет собой след матрицы линейного преобразования. Следует заметить, что когда мы говорим «определитель матрицы» или «след матрицы», не указывая, какому объекту эта матрица отве- отвечает, то вопрос об инвариантности не ясен. Например, и определитель, и след матрицы билинейной формы не являются инвариантами. 5. Пусть А — линейное преобразование пространства, и пусть тем же символом А обозначена матрица этого преобразования в произволь- произвольно выбранном базисе. Предыдущий пункт позволяет ввести следующие определения: 1) Рангом преобразования А называется ранг матрицы А. 2) Определителем преобразования А называется определитель мат- матрицы А. 3) Следом преобразования А называется след матрицы А. Геометрический смысл ранга и определителя преобразования рас- рассмотрен в следующем параграфе.
§ 3 ] ГРУППА НЕВЫРОЖДЕННЫХ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИЙ 203 § 3. Геометрический смысл ранга и определителя линейного преобразования. Группа невырожденных линейных преобразований 1. Пусть в векторном n-мерном пространстве L задано линейное преобразование А. Предположим, что Rang Л = г. Обозначим через Л4 или через A(L) образ пространства L, т. е. мно- множество элементов у вида у = Ах, где х пробегает все L. Теорема 1. Множество Л4 = A(L) есть линейное подпростран- подпространство размерности г в пространстве L. Доказательство. Имеем у = Ах = Следовательно, М, = A(L) представляет собой линейную оболочку векторов Ае\, ..., Аеп; но, как известно, линейная оболочка данной системы векторов есть подпространство, размерность которого равна рангу этой системы векторов. Координаты векторов Ае\, ..., Аеп об- образуют строки матрицы Л, так что размерность A(L) равна рангу А. Теорема доказана. 2. Обозначим через Л/" полный прообраз нулевого вектора в при преобразовании А, т. е. множество всех тех векторов х пространства L, для которых Ах = в. Множество Л/" называют ядром преобразования А. Теорема 2. Если Rang A — r, то ядро Л/* преобразования А яв- является подпространством размерности п — г в пространстве L. Доказательство, х G Л/" тогда и только тогда, когда Ах = 0. Записав это векторное равенство в координатах в произвольном базисе е\, ..., еп, получим систему однородных линейных уравнений, ранг которой равен г: Согласно § 5 гл. III множество векторов, координаты которых удо- удовлетворяют системе A), является подпространством размерности п — г, что и требовалось доказать. 3. Теоремы 1 и 2 позволяют дать два геометрических определения ранга преобразования, эквивалентных первоначальному алгебраиче- алгебраическому определению (§ 2, п. 5). 1) Ранг линейного преобразования равен размерности образа всего пространства L.
204 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII 2) Ранг линейного преобразования равен разности между размерно- размерностью пространства и размерностью ядра преобразования (т. е. полного прообраза нулевого вектора). 4. Пусть г < п. Рассмотрим действие преобразования А с геомет- геометрической точки зрения. При этом нам будет удобно не делать разницы между линейным пространством L и соответствующим ему аффинным пространством Я, отождествляя каждую точку из Я с ее радиус-вектором. Рассмотрим неоднородную систему уравнений ^4^=у\ » = 1,...,п, B) где А = ||Аг3;|| — матрица рассматриваемого линейного преобразова- преобразования. Эта система разрешима тогда и только тогда, когда вектор у = — У1е1 + • • • + Уп^п принадлежит пространству Л4 = A(L). Для каж- каждого у Е Л4 множество решений системы B) образует плоскость раз- размерности п — г, параллельную подпространству N (см. в связи с этим §§ 6, 7 гл. III). Очевидно, что каждая точка пространства принадлежит одной из таких плоскостей. Таким образом, все пространство расслаивается на параллельные плоскости размерности п — г, каждая из которых отображается в одну точку подпространства Л4. 5. Определение. В случае, когда Rang A = п, преобразование А называется невырожденным. Можно дать другие эквивалентные условия невырожденности: 1) Det Л/0, 2) М = A(L) = L, 3) Л/* = в. Каждый элемент пространства L имеет в этом случае прообраз и притом единственный. Это можно проверить непосредственно, решив систему B) по правилу Крамера. Обозначив через Агк элементы обрат- обратной матрицы Л, получим х{ = V А\ук или в символической форме х = А~1у. C) Преобразование C) является линейным преобразованием, обрат- обратным данному. 6. Теорема 3 . Множество всех невырожденных линейных пре- преобразований образует группу преобразований пространства L. Доказательство. Из теоремы о ранге произведения матриц (гл. II, §4) следует, что преобразование АВ невырождено, если невы- невырождены А и В. Далее Det Л = (Det Л) ф 0, поэтому обратное
§4] ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 205 преобразование А~х невырождено. Таким образом, множество невы- невырожденных линейных преобразований пространства L удовлетворяет определению группы преобразований (см. §2 гл. IV). 7. Теорема 4. В п-мерном линейном пространстве невырож- невырожденное линейное преобразование А определяется однозначно, если за- заданы: произвольная система п независимых векторов х\, ..., хп в ка- качестве прообразов и произвольная система п независимых векторов 2/ъ • • • ->Уп в качестве образов. Доказательство. Векторы х\, ..., хп примем за базис в L и разложим по этому базису векторы у\, ..., уп ук = а\хх Л Yalxn. D) Матрица А искомого преобразования в базисе х\, ..., хп однозначно определяется заданием векторов D), поскольку ее столбцы образованы координатами этих векторов (Агк = агк, см. выше, п. 5 §1). Det А ф 0 вследствие независимости векторов D). Тем самым теорема 4 доказана. 8. Выясним геометрический смысл определителя линейного пре- преобразования А. С этой целью будем пользоваться понятием объема параллелепи- параллелепипеда (см. §5 гл. IV). Определим класс базисов по подгруппе матриц с единичным модулем детерминанта и возьмем один из базисов ei, ... . . ., еп этого класса. Обозначим Vb ориентированный объем паралле- параллелепипеда, построенного на векторах ei, ..., еп, и вычислим ориенти- ориентированный объем V параллелепипеда, построенного на векторах /Lei, ..., Аеп. Учитывая, что координаты векторов Aei образуют столбцы матрицы Л, получаем согласно формуле F) § 5 гл. VI V = V0BetA. E) Следовательно, при данном линейном преобразовании все объемы изменяются в одно и то же число раз, и детерминант преобразова- преобразования является коэффициентом этого изменения. В случае невырож- невырожденного преобразования получаем V ф 0, причем базисы ei, ..., еп и Лв1, ..., Аеп имеют одинаковую ориентацию, если Det A > 0, и про- противоположную ориентацию, если Det A < 0. В случае вырожденного преобразования Det А = 0, векторы /Lei, • • • ? Аеп линейно зависимы, V = 0. Заметим еще, что равенство E) может быть непосредственно выведено из теоремы об определителе произведения матриц. § 4. Инвариантные подпространства 1. Определение. Подпространство Z/ С L называется инва- инвариантным подпространством преобразования у = Ах, если Ах G L' для каждого х G L'. (Символически можно записать A(Lf) С L'.)
206 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII Примерами инвариантных подпространств могут служить подпро- подпространства Л4 и Л/", введенные в § 3. Докажем это: 1) Ах Е Л4 для любого вектора х Е L, в частности, для любого х G М, поэтому А(М) С М. 2) Если х е Л/", то Ах = в е Л/", так что Л(Л/") С ЛЛ Нулевое подпространство (состоящее только из одного вектора в) инвариантно для любого линейного преобразования Л, поскольку АО = = 0. 2. Пусть L' — подпространство, инвариантное относительно А. Тогда преобразование А не выводит за пределы V векторы, принад- принадлежащие V'. Тем самым в подпространстве U определено линейное преобразование у = Ах, х е z/, у е ь'. A) Мы будем говорить, что преобразование Л, заданное в простран- пространстве L, индуцирует преобразование A) в инвариантном подпростран- подпространстве V. Иногда удобно индуцированное преобразование обозначать другим символом (отличным от буквы А), например, А'. Тогда А'х = = Ах, если х G L'', А'х не определено, если х не принадлежит L'. Если преобразование А невырождено, то индуцированное преобра- преобразование А' тоже невырождено, и потому A(Lf) = A'(L') = L'. Это ясно, поскольку в противном случае нашелся бы вектор х G L' С L, х ф 0, для которого Л ж = #. 3. Если подпространство L не инвариантно относительно Л, то найдется вектор х G L, для которого Лж не принадлежит L. Поэто- Поэтому Л не индуцирует в подпространстве L никакого преобразования. 4. Покажем, что если известно инвариантное подпространство Z/, то можно упростить матрицу преобразования, поместив в V несколько базисных векторов. Пусть базисные векторы ei, ..., ей G L'. Тогда их образы принад- принадлежат V и разлагаются по этим же векторам: Аек = А\е1 + '- + Аккек. Дальше идут, вообще говоря, более длинные разложения: Аек+1 = Л^+1в1 + • • • + Акк+1ек + Акк%\ек+1 + • • • + Л?+ Аеп = A\ е1 + --- + Л^ ек + Л^+1е^+1 + • • • + Апп еп. Таким образом, в рассматриваемом случае матрица преобразова- преобразования (транспонированная по отношению к матрице коэффициентов вы-
И] ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 207 писанных разложений) запишется так: 1 Л1 Л1 Л1 А = А\ ... ¦•¦A* дк+l дк+l B) 5. Рассмотрим важный частный случай, когда пространство L яв- является прямой суммой двух ненулевых инвариантных подпространств V и L": L = L'®L", A(L')cLf, A(L")CL". Выберем базисы в Z/ и L": еь . . . , ек е Z/, ел+1, . . . , еп G L". Тогда по теореме 4 из § 14 гл. I векторы ei, ..., еп образуют базис пространства L. В таком базисе выкладки предыдущего пункта при- применимы икв1, ..., е & ик ek+i, ..., еп; поэтому матрица А распадается на два автономных «ящика» О А = к х к О [п - к) х (п - к) Эти «ящики» представляют собой матрицы линейных преобразований, индуцированных на L' и L". Тем самым изучение преобразования всего пространства в целом сводится к изучению его действия в V и L". 6. Ниже, в § 10, используется Лемма. Если L = L' (& L" и подпространства Z/, L" инвариант- инвариантны относительно Л, то A(L) = A(Lf) 0 A(L"). Доказательство. Если L есть сумма L' и L" (хотя бы и не прямая), то, как нетрудно проверить, A(L) = A(Lf) + A(L"). С другой стороны, вследствие инвариантности L' и L" имеем A(L') С L', А{Ь") С L". Отсюда А(Ь')ПА(Ь") cL'flL", но сумма L' и L/r прямая, поэтому L' П L/r = в. Следовательно, А(Ь') П П А(Ь") = 0 и, значит, A(L') + Л(Ь7/) = A(L') 0 A(L"), что и требова- требовалось доказать.
208 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII § 5. Примеры линейных преобразований Предварительное замечание. Рассматривая примеры пре- преобразований, удобно не делать разницы между линейным простран- пространством L и соответствующим аффинным пространством il (как в п. 4 §3). 1. Подобие. Размерность пространства L любая. Преобразова- Преобразование задается формулой Ах = Хх для любого х и некоторого фиксированного Л, называемого коэффи- коэффициентом подобия. Все векторы «растягиваются» в одинаковое число раз (при |А| < 1 — фактически сжимаются). В этом случае каждое подпространство является инвариантным. Матрица подобного преоб- преобразования n-мерного пространства при произвольном выборе базиса имеет вид Л 0 А = ХЕ = 0 Л = Лп. Тождественное преобразование Е можно рассматривать как подо- подобие с коэффициентом, равным единице, а нулевое преобразование 0 — как подобие с коэффициентом, равным нулю. В пространстве всех линейных преобразований, заданных на L, подобные преобразования А = ХЕ образуют одномерное подпространство (прямую, проходящую через точки 0 и ?"). 2. п = 3. Пусть х = {ж1, ж2, х3} — произвольный вектор, у = = {у1 •> У1 •> У3} ~ ег0 образ. Преобразование у = Ах зададим формула- формулами у1 = х1 + х2 + ж3, у2= Ж1+Ж2+Ж35 A) у3 = 2Х1 +х2 - х3. Ясно, что преобразование вырожденное, причем Rang A = 2. Образом всего пространства служит подпространство Л4 = A(L), задаваемое уравнением 2 1 У = У • Найдем полный прообраз произвольной точки у1 = а, у2 = а, у3 = = b плоскости Л4 = A(L) (рис. 29). При указанных значениях?/1, у2, у3 система A) совместна; первое уравнение можно отбросить, и останутся два уравнения, определяющие прямую: х1 + х2 + х3 = а, 2хг +х2 - х3 = 6, которую обозначим через V.
ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИИ 209 Найденная прямая и есть искомый прообраз. При разных а и b все такие прямые параллельны между собой и покрывают все простран- пространство. На рис. 29 буквой Л/" обозначена прямая, которая является пол- полным прообразом в. Точки, не лежащие на плоскости A(L), прообразов не имеют. 9 = А(ЛГ) С(а,а,Ь) = Л{Г) М = A(L) Рис. 29. 3. п = 2. Преобразование у = Ах зададим формулой Г 1 _ ? 1 i у — кх , 12 2 \ У = х . Матрица преобразования А = к 0 0 1 . Возьмем произвольную точку М и ее образ М'. Отрезок ММ' параллелен оси х1. м к — i Рис. 30. Продолжим этот отрезок до пересечения с осью х2 в точке К (рис. 30). Тогда при любом выборе точки М имеем КМ' КМ = k.
210 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII Если \к\ < 1, то отрезок КМ сжимается. Если к < 0, точки М и М' лежат в разных полуплоскостях х1 > 0 и х1 < 0 (рис. 31). Такое преобразование называется сжатием по направлению оси х1 к оси х2. Название «сжатие» условно; при \к\ > 1 следовало бы гово- говорить «растяжение». м' м к = -1 4. Преобразование с матрицей А = 1 0 0 к ?О х1 Рис. 31. у у2 = кх2 представляет собой сжатие в направлении оси х2 к оси х1 (при \к\ > 1 фактически происходит растяжение, см. рис. 32). 5. Преобразование к2х2 B) называется сжатием по направлению двух осей (см. рис. 33, на котором Матрица преобразования B) является диагональной: А = Oil , II 1 О 0 ко Положим Ai = 0 . Тогда Л = Поэтому преобразование с матрицей А можно получить как суперпози- суперпозицию сжатия в направлении оси х1 к оси х2 и сжатия в направлении оси х2 к оси ж1, произведенных в любом порядке. Преобразования такого вида часто встречаются в теории упругости. Легко проверить, что в каждом из примеров пп. 3-5 оси х1 и х2 являются инвариантными подпространствами.
ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИИ 211 6. Пусть L = L' 0 L"; размерность L какая угодно, подпростран- подпространства U и L" не нулевые. Пусть U и L" — инвариантные подпростран- подпространства преобразования Л, которое в U индуцирует тождественное пре- преобразование, а в L" — подобие с коэффициентом Л. Такое преобразо- преобразование называется сжатием с коэффициентом Л к подпространству L' в направлении подпространства L". D1 С О С Представив х в виде х = х' + х"\ х' G Z/, x" G L"', получим Ах = х' + \х". Пусть векторы ei, ..., е/. образуют базис в Z/, векторы е&+1, ..., еп базис в L"'. Тогда в базисе ei, ..., еп матрица преобразования Л
212 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII имеет вид А = О О Л гг, лю- люОтметим, что в этом примере линейная оболочка L(e бой подсистемы базиса ei, ..., еп представляет собой инвариантное подпространство. 7. Положив в предыдущем примере А = 0, получим преобразова- преобразование, которое называется проекцией пространства L на подпространство V в направлении подпространства L". Проекцию можно определить непосредственно следующим образом. Если х — любой вектор из L, то он однозначно представляется в виде х = х' + х"', где х' Е L', х" Е L". Тогда проекция х на L' в направлении L" есть Ах = ж'. Проекция является вырожденным преобразованием, образом всего L служит Z/, а полным прообразом нулевого вектора является L". 8. Далее в виде примера мы даем следующую важную для даль- дальнейшего конструкцию. Пусть в пространстве L зафиксирован базис ei, ..., еп. В этом базисе преобразование, которое мы обозначим Gn(A) или, короче, G, зададим формулами + Ge3 = Aen. > C) Матрица этого преобразования в базисе ei, ..., еп называется п-мерной жордановой клеткой, соответствующей числу А: Gn(\) = Л О 1 А А О На главной диагонали жордановой клетки стоят А, на параллельной соседней сверху диагонали — единицы, остальные элементы — нули. Подпространства вида L(ei, . . . , е&), к < п, являются инвариант- инвариантными, в каждом из них преобразование задается жордановой клеткой размерности к.
ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИИ 213 Очевидно, что преобразование Gn(X) вырождено тогда и только тогда, когда Л = 0. В этом случае Л4 = G(L) = L(ei, . . . , en_i), M=L{ei). Рассмотрим подробнее трехмерный случай при Л = 0. Преобразо- Преобразование А = G3@) задается формулой У У У 1 2 3 = 0 0 0 1 0 0 0 1 0 х1 о X X3 так что = 0. Каждая прямая, параллельная оси х1 и пересекающая плоскость х1 = 0 в точке @, а, 6), переводится в точку с координатами (а, 6, 0), расположенную на плоскости х3 = 0. Если оси х1, х2, х3 взаимно пер- перпендикулярны, то можно считать, что сначала все пространство проек- проектируется на плоскость (ж2, ж3), а затем эта плоскость накладывается М@,а,Ь) Mi@,ai,6i) О = А(О) I I I М'(а,Ь,О) = A(MN) M{(ab6i,0) i 1 bl \ЩО,Ь,-а) Рис. 34. на плоскость (ж1, х2) так, что положительная полуось х2 совмещается с положительной полуосью х1, положительная полуось х3 совмещается с положительной полуосью х2 (рис. 34).
214 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII § 6. Собственные векторы и характеристический многочлен преобразования 1. Определение. Собственным вектором данного линейного преобразования А называется всякий ненулевой вектор х, удовлетво- удовлетворяющий условию Ах = Аж, A) где А — какое-нибудь число. Число А называется собственным значением преобразования Л, соответствующим данному собственному вектору х. Для краткости говорят: «А — собственное значение данного соб- собственного вектора». Собственный вектор переходит в коллинеарный ему вектор. В действительном пространстве собственное значение по- показывает, во сколько раз собственный вектор «вытягивается» (при | А| < < 1 фактически «сжимается»). Нетрудно сообразить, что если х — собственный вектор, то ах — также собственный вектор при любом а ф О, и что линейная оболочка каждого собственного вектора представляет собой инвариантное одно- одномерное пространство (инвариантную прямую). 2. Во многих вопросах алгебры и ее приложений встречается необ- необходимость найти все собственные векторы данного линейного преобра- преобразования. Займемся этой задачей. Рассмотрим линейное преобразование у = Ах. Рассмотрим вместе с ним тождественное преобразование Е. Мы имеем Ex = x при лю- любом х Е L. Поэтому условие A), при котором х является собственным вектором данного преобразования, можно записать в виде (А-\Е)х = 0. B) Пусть преобразование у = Ах представлено в некотором базисе ei, ..., еп формулами Y1xJ> k = l,...,n. C) Так как единичная матрица Е = \\Sj\\, то вследствие C) соотноше- соотношение B) равносильно следующей системе однородных уравнений: Y,(Aj - хФх] = 0. k = l,...,n, D) где х1,..., хп — координаты собственного вектора х в базисе е±,..., еп, А — собственное значение вектора х. Определение. Матрица А — ХЕ системы D) называется харак- характеристической матрицей данного преобразования Л, ее определитель х — А А2 ... Ап 1 2 ' ' ' п р(Х) = Det(A - ХЕ) = п \
§6] СОБСТВЕННЫЕ ВЕКТОРЫ 215 называется характеристическим определителем преобразования А. Очевидно, что р(Х) есть многочлен степени п относительно Л. Его называют характеристическим многочленом матрицы А (или преоб- преобразования А). Общий план решения задачи о собственных векторах сводится те- теперь к следующему. Сначала составляется так называемое характери- характеристическое уравнение р(А) = 0. E) Равенство E) необходимо и достаточно для того, чтобы система D) имела нетривиальные решения. Поэтому в комплексном пространстве корни уравнения E) и только они являются собственными значениями преобразования А. В действительном пространстве собственными зна- значениями являются все действительные корни и только они. Допустим, что все корни Ai, ..., Лп найдены. Предположим для определенности, что мы имеем дело с действительным пространством. Тогда, отбросив все комплексные корни, будем последовательно перебирать остальные. Каждый из них подставим в систему D). Каждый раз эта система по- получит определенные числовые коэффициенты. Ранг полученной системы будет некоторым числом г, причем г < п, так что система будет иметь п — r независимых решений. Найдя их, мы найдем тем самым п — г независимых собственных векторов с одним и тем же собственным значением, равным взятому корню. Их линейная оболочка, с исключением из нее нулевого вектора, дает все собственные векторы с тем же собственным значением. Это следует из теоремы о множестве решений линейной однородной системы уравнений. Перебрав таким способом все действительные корни характеристи- характеристического уравнения, мы найдем вообще все собственные векторы данно- данного преобразования. В случае комплексного пространства нужно перебрать все корни Ai, ..., Ап. 3. Примеры. 1) Подобие представляет собой преобразование, для которого все ненулевые векторы являются собственными с одним и тем же собственным значением, равным коэффициенту подобия. 2) Преобразование Gn(Ao) (см. выше §5, п. 8) имеет только один линейно независимый собственный вектор. Действительно, для Gn(Xo) характеристический многочлен р(Х) = (Ао — А)п имеет единственный корень А = Ао кратности п. При А = Ао характеристическая матрица Gn(\o) — ХоЕ имеет ранг п — 1 (ненулевой минор порядка п — 1 по- получается вычеркиванием левого столбца и нижней строки). Поэтому система вида D), составленная для преобразования Gn(Ao), имеет при А = Ао только одно линейно независимое решение. Из формул C) § 5 видно, что собственным является вектор е±.
216 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII 3) Преобразование двумерной действительной плоскости у*= х1+2х2,\ 2 1,21 у = —х + х J не имеет собственных векторов, так как Р(А) = А2 — 2А + 3 не имеет действительных корней. Предоставляем читателю найти собственные значения и собствен- собственные векторы в остальных примерах § 5. § 7. Основные теоремы о характеристическом многочлене и собственных векторах 1. Теорема 1. Ранг характеристической матрицы при фикси- фиксированном А есть инвариант относительно изменения базиса. Доказательство. Теорема является следствием общего пред- предложения об инвариантности ранга матрицы линейного преобразова- преобразования, поскольку характеристическая матрица есть матрица преобразо- преобразования А — ХЕ. 2. Теорема 2. Характеристический многочлен р(Х) инвариан- инвариантен относительно преобразования базиса. Доказательство. Пусть А и А' — матрицы данного преобра- преобразования в базисах ei, ..., еп и е[, ..., е'п, P — матрица перехода от первого базиса ко второму, Q = (Р*). Согласно § 2 имеем А' - ХЕ = А' - ХЕ' = Q(A - XE)Q~1 A) (Ef = Е, так как тождественное преобразование в любом базисе имеет единичную матрицу). Из A) находим Det(A' - ХЕ) = Det Q Det(A - ХЕ) Det Q = Det(A - ХЕ). Замечание. Запишем характеристический многочлен в виде Р(А) = (-1)п[Хп - Р1\п~1 + Р2Хп~2 -... + (-1)"Рп]. Нетрудно проверить, что р\ — след матрицы Л, рп — Det A. Из теоремы 2 вытекает инвариантность всех коэффициентов р(А), в частности, р\ и pi- Тем самым мы получили другое доказательство инвариантности определителя и следа матрицы преобразования. 3. Теорема 3. Если L = L\ 0 L2, L\ и Li ненулевые инвари- инвариантные относительно А подпространства, то р(Х) = pi(A)p2(A), где Pi (А), рг(А) — характеристические многочлены преобразований, ин- индуцированных в L\ и Li- Доказательство. Пусть е±, ..., е/. — базис в L\, e^+i, ..., еп — базис в L2. Согласно §4 в базисе ei, ..., еп пространства L матрица
ТЕОРЕМЫ О ХАРАКТЕРИСТИЧЕСКОМ МНОГОЧЛЕНЕ 217 А — ХЕ имеет вид оц-А CL21 А-\Е = — А а1к О O-kl Gjfe+1 k+1 "A О ак+1 п Отсюда Det(A - ХЕ) = - A 0>kl кк ~ A h+l — X ... 4. Теорема 4. Если некоторому собственному значению X отвечает т линейно независимых собственных векторов, то их линейная оболочка L является т -мерным инвариантным подпространством, а индуцированное в L преобразование есть подобие с коэффициентом А. Доказательство. Пусть е±, ..., ет — линейно независимые собственные векторы, соответствующие числу А. Возьмем произволь- произвольный вектор х из L = L(e\, . . . , ет), разложим его по базису е\, ..., еш подпространства L и применим к нему данное преобразование А. Получим т) — % г\С\ т~ * * * ~г X /1вт = = x1Aei + h хшХеш — Хх G L, откуда и вытекает теорема 4. 5. В приложениях линейной алгебры очень важную роль играет вопрос об упрощении матрицы линейного преобразования за счет вы- выбора подходящего базиса. Теорема 5. Матрица преобразования А диагональна тогда и только тогда, когда базис состоит из собственных векторов. Доказательство. 1) Если базис е\,..., еп состоит из собствен- собственных векторов преобразования А, то Ае\ = Х\е\, А(х) = А(х1е1 Н Аеп = B)
218 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII где Ai, ..., Ап — собственные значения (вообще говоря, различные). Коэффициенты правых частей равенств B) образуют матрицу Л*, ко- которая в данном случае совпадает с матрицей А: А* = А2 О О = А. C) Преобразование у = Ах в этом базисе имеет координатное пред- представление: 2) Пусть дано, что в некотором базисе ei, ..., еп матрица А имеет диагональный вид А = о о • AI Тогда Л* = Л, Ле2 = А\е2, а это значит, что базисные векторы — собственные, причем А^ = А\. Теорема доказана. Замечание. Преобразование D) можно представить как произ- произведение п сжатий; сначала производится сжатие с коэффициентом Ai к подпространству L(e2, . . ., еп) в направлении L(ei), затем сжатие с коэффициентом А2 к подпространству L(ei, ез, . . ., еп) в направле- направлении L(e2) и т.д. Нетрудно проверить, что сжатия можно производить в любом порядке. (При \Х{\ > 1 фактически получаются «растяже- «растяжения».) 6. Примеры п. 3 предыдущего параграфа показывают, что бази- базиса из собственных векторов может не быть, а тогда матрицу преоб- преобразования нельзя привести к диагональному виду. Вопрос о том, как в таком случае можно упростить матрицу преобразования, рассматри- рассматривается ниже в §§ 9, 10.
§8] НИЛЬПОТЕНТНЫЕ ПРЕОБРАЗОВАНИЯ 219 § 8. Нильпотентные преобразования. Общая структура вырожденных преобразований 1. В этом параграфе рассматриваются вырожденные линейные пре- преобразования в n-мерном пространстве L, действительном или ком- комплексном — безразлично. 2. Определение. Преобразование В называется нильпотент- ным, если Вр = © для какой-нибудь положительной степени р. Иначе говоря, Врх = 0 для любого х Е L. A) Наименьшее (натуральное) число р, для которого соблюдается A), называется высотой нильпотентного преобразования. Замечание. Если Врх = в для некоторого числа р и некоторого вектора х Е L, то для этого вектора х и любого (целого) т > р имеем Вшх = Вт-р(Врх) = Вт-р0 = в. Простейшим примером нильпотентного преобразования может слу- служить нулевое преобразование 0; его высота равна единице. Всякое нильпотентное преобразование вырождено. Это ясно: если Вр = 0, то Det(Bp) = (Det B)p = 0; значит, Det В = 0. Однако нильпотентные преобразования — это не просто частный случай вырожденных преобразований; они являются основным эле- элементом в структуре любого вырожденного преобразования. Именно, справедлива Теорема. Пусть В — вырожденное линейное преобразование пространства L. Тогда L = Li0L2, B) где Li, L<2 — инвариантные подпространства, причем: 1) преобразование, индуцированное в Li, нильпотентно; 2) если подпространство Li не нулевое, то индуцированное в нем преобразование невырождено. Короче, можно сказать, что В нильпотентно в Ь\ и невырождено в L2. В частности, преобразование В нильпотентно в пространстве L, если размерность Ь\ равна п (L\ = L), а размерность Li равна нулю (/,2 = 0) и только в этом случае. Доказательство см. ниже, п. 4; оно опирается на вспомогательные предложения, изложенные в п. 3. 3. Рассмотрим последовательные степени данного вырожденного преобразования В: В,В2,В3,...,Вк,... Обозначим через Л4 ядро преобразования Вк, через A4k — образ всего пространства L при преобразовании Вк. Пусть г и — размерность
220 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII Согласно п. 1 § 3 rk = Rang (Б*). Исследуем свойства последовательностей подпространств Мк и Мк (Л = 1, 2, ...)• 1) Мк при любом к является инвариантным подпространством для преобразования В. Доказательство. Если х Е Мк•> то существует у Е L такой, что Вку = х. Отсюда находим Вх = В(Вку) = Вк+1у = Вк(Ву) G Мк. 2) Имеют место следующие включения: L D Mi D M2 Э . . . Мк Э Мк+1 D ... C) В самом деле, включения C) следуют из предыдущего свой- свойства, так как Mk+i = В(Мк) С Мк- 3) Справедливы соотношения П > П > . . . > Гр-г > Гр = Гр+1 = . . . = Гк = • • • , D) где р — некоторое натуральное число. Вместе с тем Мк = Мр при к > р. В инвариантном подпространстве Мр индуцируется невырожденное преобразование. Доказательство. Из C) видно, что rj ^ rj+i- Вследствие вырожденности В имеем г\ < п. Ранги rj неотрицательны, поэтому строгих неравенств в последовательности D) может быть лишь конеч- конечное число. Пусть р — наименьшее натуральное число, для которого соблюдается равенство Гр = Гр+!. E) Если гр = 0, то, очевидно, Гк = гр = 0, Мк = Мр = в при к > р. Пусть Гр ^ 1. Тогда из E) и C) следует, что В индуцирует в простран- пространстве Мр невырожденное преобразование, то есть, Mv+\ — В(МР) = = Мр, откуда Мр+2 = B(Mp+i) = В(Мр) = Мр. Аналогично, Мр+з = Мр, ..., Мк = Мр при любом к > р. Вместе с тем Гк = = Гр при к > р. Третье свойство доказано полностью. 4) Имеют место следующие включения: ЛсМс ...Мк сЛ4+1 с ... F) При этом Мк = Мр, если к > р, G) где р — наименьшее число, удовлетворяющее условию E). Доказательство. Включения F) очевидны. В самом деле, ес- если х е Мк, то Вкх = О и Вк+1х = В(Вкх) = О, так что х е Л4+ь
§8] НИЛЬПОТЕНТНЫЕ ПРЕОБРАЗОВАНИЯ 221 По теореме 2 § 3 размерность П& пространства Л4 равна п — Г&. До тех пор, пока ранги Г& строго убывают с ростом к, размерности П& строго возрастают. Для к ^ р все ранги Г& одинаковы; вместе с тем одинаковы и размерности np, np+i, ..., П&, ... Отсюда и из F) следу- следует G). 5) Л4 при любом к является инвариантным подпространством преобразования В. Преобразование, индуцированное вЛ4, нильпотент- но. Доказательство. Инвариантность Л4 при к = 1 следует из соотношений B(J\f\) = О Е Л/i, а при к > 1 — из включений F), по- поскольку B(J\fk) С Л4-1 С Л4- Нильпотентность преобразования, ин- индуцированного в Л4, очевидна, так как Вк{Мк) — 0. 4. Доказательство теоремы п. 2. Покажем, что L=MP®MP, (8) если р удовлетворяет условию E). Поскольку В нильпотентно в J\fp и невырождено в Л4Р, то тем самым будет получено искомое разло- разложение B) (Li = Л/"р, 1^2 = Л4р). Мы знаем, что сумма размерностей Afp и Л4Р равна п, поэтому для получения формулы (8) достаточно проверить, что Мр П Мр = 0 (9) (см. в связи с этим § 14 гл. I). Равенство (9) докажем от противного. Пусть х ф 0, х G J\fp П Л4Р. Рассмотрим векторы ж, Вх, ..., Врх = 0. A0) Все они принадлежат .Мр (вследствие инвариантности .Мр). Обозна- Обозначим через у последний из векторов системы A0), отличный от 0 [у = Вкх, где к — некоторое число, 0 ^ к < р). Тогда будем иметь уф в, Ву = в, уеМр. A1) Но A1) противоречит невырожденности преобразования В в подпро- подпространстве Л4Р. Тем самым (9) установлено и теорема доказана. 5. 3 а м е ч а н и я. 1) Из п. 3 видно, что высота нильпотентного пре- преобразования, индуцированного в пространстве Л/"р, равна р (здесь, как и выше, р — наименьшее из чисел, удовлетворяющих условию E); при к < р с ростом к происходит расширение подпространств Л4 и суже- сужение подпространств Mk] при к ^ р подпространстваЛ4 и М,к уже не изменяются). Таким образом, подпространство Mv может быть найдено как ядро преобразования Вк при любом к ^ р. Аналогично, Л4Р = Вк(Ь) при к ^ р.
222 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII 2) Нетрудно заметить также, что при к < р пересечения Л4 П Л4к содержат ненулевые векторы, поэтому суммы Л4 + М-к не являются прямыми и не исчерпывают всего пространства L. § 9. Канонический базис нильпотентного преобразования 1. Рассмотрим еще некоторые вопросы, связанные с нильпотент- ными преобразованиями. Сначала введем терминологию, важную для дальнейшего. Будем говорить, что векторы ai, а2, ..., а к образуют серию дли- длиной к относительно преобразования В (не обязательно нильпотентно- нильпотентного) , если эти векторы не нулевые, и если Ба1 = а2, Ва2 = а3, ..., Bak-i = ак, Вак = 0. A) Вектор а± будем называть старшим или первым, вектор ак — млад- младшим или последним вектором серии A). Если а ф #, В а = #, то будем говорить, что а образует серию, состоящую из одного вектора, и явля- является в ней одновременно старшим и младшим. Базис пространства L будем называть каноническим относительно преобразования Б, если он состоит из одной серии или из нескольких серий, не имеющих друг с другом общих векторов. 2. Отметим следующие свойства нильпотентных преобразований: 1) Если в пространстве L имеется серия относительно нильпо- нильпотентного преобразования В, содержащая к векторов, то высота это- этого преобразования р ^ к. В самом деле, в серии вида A) Bk~1ai = ак ф 0, откуда р > к — 1. 2) Если высота нильпотентного преобразования В равна р, то су- существует серия относительно В длиной р и нет более длинных серий. Доказательство. По определению высоты в пространстве су- существует вектор х такой, что Вр~1х ф 0. Тогда векторы ж, Вх, В2х, . . . , Bv~xx образуют серию длиной р, так как среди них нет нулевых (в противном случае Вр~гх был бы нулевым) и В(Вр~1х) = Врх = 0. Более длинной серии в пространстве быть не может по предыдущему свойству. 3) Всякая серия линейно независима. Доказательство. Напишем для (произвольной) серии A) со- соотношение Aioi + A2ft2 H \~ ^kdk = 0. (*) Подействуем на обе части этого равенства оператором Вк~х. Мы полу- получим \\ак = в, так как Вк~ха\ = ак, Вк~ха{ = О при г > 1. Поскольку ак ф 0, находим Ai = 0. Теперь, действуя на (*) оператором Вк~2, найдем А2 = 0. Продолжая процесс, получим, что все числа А& = 0. Утверждение доказано.
КАНОНИЧЕСКИЙ БАЗИС 223 Следствие. Если п — размерность пространства L, р — высо- высота нильпотентного преобразования в L, то р п. 4) Если в пространстве L для некоторого преобразования В суще- существует канонический базис, то преобразование В нильпотентно и его высота равна числу векторов в самой длинной серии этого базиса. Доказательство. Пусть е\, ..., еп — канонический базис и пусть в самую длинную из его серий входит к векторов. Тогда для каждого базисного вектора имеем: Bkej = в. Возьмем произвольный ..., еп и применим к нему вектор х Е L, разложим его по базису преобразование Вк: Вкх = Вк(х1е1 + • • • + хпеп) = х1Вке1 + • • • + хпВкеп = д. Это значит, что преобразование В нильпотентно и его высота р ^ к. С другой стороны, по свойству 1) имеем р ^ к. Следовательно, р = к. 3. Примеры. 1) Для нулевого преобразования 0 любой вектор образует серию длиной к = 1, поэтому любой базис пространства L является каноническим относительно 0. Нетрудно заметить, что ес- если преобразование В имеет высоту р = 1, то оно является нулевым (в = в). 2) Рассмотрим преобразование Gn@) (см. п. 8 §5 при Л = 0). По определению преобразования Gn@) существует базис ei, ..., еп, со- состоящий из одной серии: Gn@)en = en_i, . . ., Gn@)e2 = еь Gn@)ei = 0. Отсюда и из свойства 4) в п. 2 следует, что преобразование Gn@) ниль- нильпотентно и его высота р — п. Отметим, что матрица этого преобразования в заданном базисе ei, ..., еп — вырожденная n-мерная жорданова клетка С?„@) = о о о о 3) Пусть в базисе еь ..., еп некоторое преобразование В задается матрицей, в которой вдоль главной диагонали располагается несколько вырожденных жордановых клеток разных размерностей, а остальные элементы — нули. Эту матрицу символически запишем так: В = О О B)
224 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII Не ограничивая общности, можно считать, что к\ ^ к<± ^ . . . ^ &/, так как изменением нумерации базисных векторов можно добиться пере- перестановки клеток, идущих вдоль диагонали матрицы В. Для наглядности выпишем полностью матрицу вида B) с тремя клетками G/,. размерностей к\ = 4, к<± — 3 и к$ = 1: G4@) О 0 G3@) 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 о] Bа) Одномерная клетка Gi@) состоит из одного числа нуль. В пределах каждой из клеток Сг&@) размерности к ^ 2 над главной диагональю расположена диагональ из единиц. Между двумя соседними клетками эти единицы разделены нулем. Таким образом, одна диагональ матрицы Bа), как и вообще любой матрицы вида B), состоит из единиц, прерываемых нулями. Эта диаго- диагональ расположена непосредственно над главной диагональю матрицы. Все остальные элементы матрицы — нули. Вследствие B) базис е\, ..., еп — канонический; он состоит из / попарно непересекающихся серий, длина наибольшей из которых к\. Отсюда следует, что В — нильпотентное преобразование с высотой р = = к\. Линейная оболочка каждой серии, входящей в базис, является инвариантным подпространством. Этот пример включает в себя два предыдущих как частные случаи. Если к\ = 1, то все клетки — одномерные, каждая из них состоит из одного числа нуль; следовательно, вся матрица — нулевая, и поэтому преобразование В — нулевое. Если / = 1, то матрица В состоит из одной клетки: В = Gn@). Нетрудно видеть, что верно и обратное: если для преобразования В существует канонический базис и попарно непересекающиеся серии базиса расположены одна за другой, то матрица преобразования В в таком базисе имеет вид B). Каждой серии соответствует клетка Gka @), размерность которой ка равна числу векторов в серии. 4. Последний из рассмотренных выше примеров охватывает все- всевозможные нильпотентные преобразования. Это следует из основной теоремы (теоремы 1), которую мы чуть дальше сформулируем и докажем. 5. Лемма. Пусть дана система векторов, которая представля- представляет собой объединение нескольких серий. Тогда, если последние векторы всех этих серий составляют линейно независимую систему, то и вся данная система векторов линейно независима.
§9] КАНОНИЧЕСКИЙ БАЗИС 225 Доказательство удобнее провести после основной теоремы. Теорема 1. Для каждого нильпотентного преобразования су- существует канонический базис {далеко не единственный). Доказательство теоремы мы проведем конструктив- конструктивно, т.е. фактически покажем, как построить канонический базис. Пусть В — нильпотентное преобразование высоты р в n-мерном про- пространстве L. Рассмотрим уже знакомую нам последовательность включений М с Л/*2 с .. .Л4 с Л4+1 с ... с АГР = L, гдеЛ4 — ядро преобразования Вк. Построим следующие подпростран- подпространства: Мы имеем B(tCi) = 0. Следовательно, все /С2, А^з, ..., /Ср принадлежат Л/i (tCi С Л/i). С другой стороны, Cf» Ъ - Г) (так как B(Ni+i) сЛ/i). Таким образом, /Ср С /Ср—1 С ... С /С 2 С Л/i. Пусть &j — размерность /С/, п^ — размерность Mi. Выберем в М\ базис, векторы которого обозначим р р р—1 р—1 2 2 1 Точка с запятой разделяет две группы векторов, каждая из кото- которых имеет некоторый специальный характер; эти группы помечены верхним индексом. Выбор базиса C) проводится при следующих условиях. В качестве первой группы, т.е. еР, берется любой базис в К,р\ в качестве второй группы, т. е. еР~ , берется любое дополнение ер до базиса /Cp_i и т. д. Поскольку еР G Кр = ВР~1{МР), то все эти векторы имеют прооб- прообразы относительно Вр-1. Возьмем для вектора еР какой-нибудь прооб- прообраз е\. Имеем еР = Bp~1(ej). Вместе с тем мы получаем для каждого г (i = 1, ..., kp) серию длины р: е1 е2 — Bte1) ер — Вр~1(е1)' Вр(е1) — О Аналогично при кр < ъ ^ кр-\ векторы еР~ имеют прообра- прообразы е\ относительно Бр~2, поскольку при этих значениях % будет ер~х G G Kp-i = Bp~2(Afp-i). Соответственно для каждого г (кр < г ^ кр-\) получается серия длины р — 1: е], е2 = В(е\), ..., еР~ = Бр~2(е^); Вр~1(е]) = ^. Продолжая процесс, мы получим систему векторов, ко- g Н.В. Ефимов, Э.Р. Розендорн
226 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII торую запишем сокращенно по следующей схеме: п-2 D) < Здесь в каждой строке из каждой группы выписан только послед- последний представитель; например, в первой строке из группы ер, ..., ерк записан только е? . Кр В схеме D) некоторые группы могут не существовать. Например, если Кр совпадает с /Cp_i, то вторую группу в схеме D) следует вы- вычеркнуть. Заметим еще для пояснения, что если, например, /С 2 = ^Сз (&2 = &з), то во второй строке схемы D) выпадает группа e\2 и сле- следующая строка имеет ту же длину. В схеме D) серии расположены по столбцам и идут снизу вверх. Нижний индекс можно рассматривать как номер серии, верхний индекс дает номер вектора внутри серии. Та- Таким образом, в верхней строке расположены последние векторы серий. Они образуют базис в Л/i и, следовательно, линейно независимы; от- отсюда и по лемме заключаем, что независимы все векторы системы D). Докажем, что общее их число / равно п. Согласно построению / = щ + к2 + к3 -\ \- кр E) (напомним, что в схеме D) каждый написанный столбец на самом деле представляет собой символическое обозначение нескольких столбцов). Пусть рк — ранг преобразования Вк на подпространстве Л4+1 (кото- (которое является инвариантным относительно Вк, так как Bk(J\fk+i) — = К,к+1 c/Vi c7VA+i). Учитывая, что Л4 — ядро Вк в подпространстве Л4+ъ имеем: П2 Пр-, пр = П2 = пз = Пр = п. - Pi, - Р2, -Рр-1 &2 кз , Кр = Ри = Р2\ = Рр-1', Отсюда п = п\ + р\ + • • • + pp-i = п\ + &2 + • • • + кр. Следовательно, / = п, и теорема доказана. На рис. 35 дана иллюстрация схемы D) в случае, когда п = 4, р = 3, п\ — 2, а пространства Ki и /Сз, будучи одномерными, совпадают.
КАНОНИЧЕСКИЙ БАЗИС 227 е? = Bel Рис. 35. Замечание. Если доказывать только факт существова- существования канонического базиса, то можно ограничиться более краткими рассуждениями, воспользовавшись индукцией по высоте преобразо- преобразования. Именно, пусть в пространстве L задано нильпотентное преобразо- преобразование В некоторой высоты р + 1 ^ 2. Тогда в подпространстве Л4± = B(L) преобразование В имеет высоту р. Пусть в Л4± канонический базис найден (если р = 1, то любой базис в Л4± является канониче- каноническим). Начальные векторы серий этого базиса дополним прообразами относительно В, удлинив тем самым каждую из серий на один вектор. Затем совокупность последних векторов серий дополним до базиса в пространстве Л/i. В результате получим систему векторов в числе г\ + +п\ = п (г\ = Rang В = размерности .Mi), независимую в силу леммы и потому образующую базис в L, очевидно, канонический. 6. Вернемся к доказательству леммы. Мы всегда можем считать, что данная система векторов записана по схеме D). Составим произ- произвольную линейную комбинацию всех векторов этой системы и прирав- приравняем ее нулевому вектору. В подробной записи мы получим следующее равенство, в левой части которого все суммы берутся по индексу i: кр kp — i l$2 п\ ЕР Р | V "^ р—1 р—1 . . х "^ 2 2 | х "^ 1 1 . i i /_^ % % ' /_^ г г /_^ г г i=l i=kp-\-l кР кр-г к2 ^ р-1 р-1 . V^ р-2 р-2 . . \"^ 1 1 . а а е- + > а- е- + . . . + > а • е?- + . . . i=kp-\-l г=/гз + 1 г=1 i=l %—кр + 2. а<е г=1 F) Числа а^ — коэффициенты линейной комбинации. В равенстве F) расположение написанных сумм соответствует схеме D) и так же, как в D), кр.
228 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII Если в схеме D) какая-нибудь группа столбцов отсутствует, то в со- соответствующем столбце соотношения F) будем считать множители а\ равными нулю. Подействуем на обе части равенства F) оператором Bv~x. Мы по- получим из последней строки кр ИЛИ кр ?«Ь* = * G) г=1 (все остальные члены суммы F) при воздействии на них оператором Bv~x дадут в результате в). Если последние векторы всех серий образуют независимую систему, то и часть ер, ..., ерк этой системы независима. Тогда из G) имеем а{=0,...,а1р=0. Теперь вычеркнем в соотношении F) нижнюю строку. На оставшуюся часть подействуем оператором Вр~2. Аналогично предыдущему полу- получим, что числа а|, а], которые участвуют во второй снизу строке, все равны нулю. Продолжая процесс, установим, что вообще все ol\ = 0. Лемма доказана. 7. Пусть В — нильпотентное преобразование с высотой р. Обозна- Обозначим через lj число серий длины j в некотором каноническом базисе преобразования В. Теорема 2. Для каждого j (j ^ р) число lj является инвариан- инвариантом относительно перехода к другому каноническому базису преобра- преобразования В. Доказательство. Для базиса, который построен в доказатель- доказательстве предыдущей теоремы, имеем по построению 1Р = kp] lj = kj - kj+u 2 ^ j < р; 1г = щ - к2- Рассмотрим совершенно произвольный канонический базис. Заме- Заметим, что последние векторы всех его серий должны попасть в J\f\. Обо- Обозначим общее число этих векторов через п[, число попавших в Кр — через кр, число попавших в Кр-\ — через к/р_1 и т.д. Имеем так как в каждом случае число независимых векторов не больше раз- размерности содержащего их пространства. Пусть п' — число всех век- векторов рассматриваемого произвольного базиса. Тогда согласно доказа- доказательству предыдущей теоремы (см. равенство E)) п = п\ + к2 + \- кр.
§9] КАНОНИЧЕСКИЙ БАЗИС 229 Так как п' = п, то из (8) и (8а) находим п[ = ni, kj = kj. Но /; = *;; i'j = k'j-k'j+1, 2^j<P; /i = n;-^. Следовательно, /^ = /j при любом j. Теорема доказана. Замечание. Сущность доказательства предыдущей теоремы можно высказать в двух словах следующим образом: размерности kj и п\ подпространств Kj и Л/i инвариантны по самому определению этих подпространств; но для любого канонического базиса все /& вы- выражаются через kj и п\. Следовательно, инвариантны и все /&. 8. Нетрудно выразить Ik через ранги преобразований В^ на данном пространстве L. Обозначим ранг В^ на L через Tj. По предыдущему имеем пз = пз+1 ~ Рз- Вместе с тем Uj =П- Tj , nj + i =П- rj + i . Из написанных равенств получаем Рз =гз~гз+1- Таким образом, при 2 ^ j < р lj = kj - kj + ! = Pj-! ~ Pj = Tj-x - 2rj + 7-j + i. (9) Кроме того, /i = га - 2ri+r2, lp = rp-i. (9a) Замечание. Каждой серии канонического базиса отвечает жор- данова клетка в матрице B). Поэтому формула (9) выражает коли- количество Ik жордановых клеток размерности к в матрице B) для всех значений к A ^ к ^ п). Заметим еще, что, полагая го = п (как ранг В0 = Е) и Г& = 0 при к ^ р (поскольку при к ^ р имеем Вр = 0), мы можем вместо (9) и (9а) пользоваться только формулой (9): 1к =гк-1-2гк + гк+1; (9) здесь можно брать любое к ^ 1. 9. Отметим очевидный факт, используемый в дальнейшем. Преобразование В вырождено тогда и только тогда, когда оно име- имеет собственное значение, равное нулю. 10. Теорема 3. Для того чтобы линейное преобразование В вп- мерном пространстве L было нилъпотентным, необходимо и доста- достаточно, чтобы его характеристический многочлен имел вид р(А) = (-А)". Доказательство. Необходимость вытекает из теоремы 1, так как в случае нильпотентного преобразования В характеристическая
230 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII матрица В — ХЕ в каноническом базисе имеет на диагонали элементы — Л, а ниже диагонали — нули, и потому р(Х) = Det(B-XE) = (-X)n. Достаточность сейчас доказывать не будем, так как она вытекает из следующей, более общей теоремы. 11. Пусть В — вырожденное преобразование; пусть р(Х) = (-l)nAmi (Л - Л2)Ш2 ... (Л - \j)mf A0) — его характеристический многочлен. Корни А2, ..., Xj (вообще гово- говоря, комплексные) все разные. Согласно теореме § 8 имеем L = Li0L2, A1) причем В нильпотентно на Li, невырождено на L2 (Li и L2 инвари- инвариантны относительно В). Теорема 4. Размерность L\ равна кратности т\ нулевого кор- корня многочлена р(Х). На подпространстве L2 преобразование В име- имеет характеристический многочлен р2(А) = (—l)n~mi(A - А2)Ш2 . . . ...(А-А,-)т>. Доказательство. По теореме 3 § 7 имеем соответственно A1) p(A)=Pi(A)P2(A). A2) Пусть п\ — размерность L\. По теореме 3 (по ее уже доказанной части) Pi(A) = (-l)niAni. A3) Сравнивая A0), A2) и A3), находим: щ ^ mi. С другой стороны, если п\ < ?7ii, то р2(А) должен иметь нулевой корень кратности mi — — п\ > 0. Однако это невозможно, поскольку преобразование В на L2 невырождено. Таким образом, п\ = т\. Отсюда, а также из A0), A2) и A3) следует и второе утверждение теоремы. Замечание 1. Ясно, что достаточность в теореме 3 является частным случаем теоремы 4 при т\ — п. Замечание 2. Обозначим через р высоту преобразования В в L\. Имеем: р ^ mi, поскольку высота преобразования не превышает раз- размерности пространства. С другой стороны, мы знаем, что L\ может быть определено как ядро преобразования Вк при любом к ^ р. По- Поэтому, если кратность mi нулевого собственного значения известна, то мы можем найти L\ как ядро преобразования Bmi, не вычисляя р. § 10. Приведение матрицы преобразования к жордановой нормальной форме 1. Определение. Говорят, что матрица А имеет жорданову нор- нормальную форму, если вдоль ее главной диагонали расположены жор-
ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА 231 дановы клетки, а остальные элементы — нули: А = 0 A) о О ' " G*t(At) Не исключена возможность, что в матрице A) к{ — kj или А^ = Xj для некоторых номеров г, j. Напомним, что жорданова клетка есть ki x /^-матрица вида 1 А,; 1 GkMi) = о ¦ ¦¦' Жорданова клетка первого порядка состоит из одного числа А^: Gi(Ai) = pill, Gi@) = ||0||. 2. Теорема. В п-мерном комплексном пространстве L для каж- каждого линейного преобразования А существует базис, в котором мат- матрица этого преобразования имеет жорданову нормальную форму. При переходе к другому аналогичному базису матрица А сохраняется с точ- точностью до перестановки клеток. Базис, о котором идет речь в теореме, будем называть канониче- каноническим. Это название согласуется с терминологией §9: случай, рассмот- рассмотренный в § 9, получается, когда все А^ = 0. Замечание. Доказательство этой теоремы для нильпотентных преобразований дано в § 9. Предыдущие результаты позволяют свести изучение общего случая к рассмотрению нильпотентных преобразова- преобразований. Доказательство теоремы (вместе с вспомогательными пред- предложениями) изложено ниже. 3. Вспомогательные п ре д л оже н и я. Пусть дано линей- линейное преобразование А в n-мерном пространстве L. Положим А-аЕ = В, где а — некоторое число. Лемма 1. Если В нильпотентно в L и, следовательно, имеет канонический базис, то А в этом базисе имеет жорданову нормальную форму A), где все Xi = a. Доказательство. В каноническом базисе преобразование В имеет матрицу В = Gkl@) о о B)
232 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII Этот же самый базис ei, ..., еп является каноническим для А вслед- вследствие тождества которое в подробной записи выглядит так: а О 1 а 1 0 а 1 а 0 0 1 0 1 0 0 1 0 + а О О Вследствие B) и C) матрица преобразования А в базисе еь .... имеет жорданову нормальную форму GkM) п ^ О C) А = О Gkt{<*) Лемма 2 . Пусть Ai, ..., Xj — корни характеристического мно- многочлена преобразования А. Тогда преобразование В = А - аЕ име- имеет характеристический многочлен, корни которого суть Х\ — а, ... ..., Xj — а, причем кратность корня Xi — a равна кратности корня Xi. Доказательство. Лемма 2 вытекает из тождества Det(? - ХЕ) = Det(A - аЕ - ХЕ) = р(Х + а). Лемма 3 . Некоторое подпространство L инвариантно относи- относительно преобразования В = А — ХЕ тогда и только тогда, когда оно инвариантно относительно преобразования А. Доказательство. 1) Пусть L инвариантно относительно А. Это значит, что если х G L, то Ах G L, а тогда Вх = Ах — Хх е L. 2) Если L инвариантно относительно В, то оно инвариантно и от- относительно Л, так как А = В — (—Х)Е. 4. Докажем существование канонического базиса для произволь- произвольного линейного преобразования Л, заданного в n-мерном комплексном пространстве L. Пусть Ai, ..., Х3; — различные между собой корни характеристиче- характеристического многочлена р(Х) преобразования Л, так что Р(А) = (-1)И(А - Ax)mi(A - A2)m2 .. .(А - А,-Г', D) где rrii — кратность корня А^ (г = 1, 2, ..., j), rai + rri2 + • • • + rrij = п. Рассмотрим вырожденное преобразование В\ — А — Х\Е. Обозначим через L\ ядро преобразования В?1 = В1В1 ...В1 = (А- ХгЕ)™1
§ 10] ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА 233 и положим В™1^) = L. Мы знаем, что L = Li0L, E) причем В\ нильпотентно в L\. По теореме 1 из §9 в L\ существует базис, канонический для В\. Этот же базис является каноническим и для преобразования Л, рассматриваемого в L\ (L± и L инвариантны относительно А по лемме 3). Соответственно разложению E) имеем где по теореме 4 §9 Pi(A) = (-l)mi(A- Ai)mi, a р(\) = (-i)---i (A - A2)m2 ... (А - \j)m*. Теперь рассмотрим А в инвариантном подпространстве L и, рас- рассуждая аналогично предыдущему, получим Z = L2eZ, F) где L2 — инвариантное подпространство размерности т2, в котором существует канонический базис для преобразования В2 — А — Х2Е, а, вместе с тем, и для преобразования А. Подпространство L2 опреде- определяется как ядро преобразования Б2Ш2 = В2В2...В2 = (А- Х2Е)т2, G) рассматриваемого в L. Однако если рассматривать преобразование G) во всем пространстве L, то его ядро должно содержать L2 и иметь ту же размерность т2. Поэтому L2 — ядро преобразования G), рассмат- рассматриваемого во всем пространстве L. Из E) и F) получаем L = L\ 0 0 L2 0 Z. Продолжая этот процесс, мы после j-ro шага придем к разложению L = Li 0L20 ...®Lh (8) где Li — ядро преобразования В™1 — (А — Xi)mi; размерность Li рав- равна rrii. В каждом из Li преобразование А имеет канонический базис. Объединение этих базисов дает искомый базис всего пространства L. Замечание. Изложенное доказательство дает способ фактиче- фактического приведения А к нормальной жордановой форме, причем в дока- доказательстве указано, как найти канонический базис. Но можно написать жорданову форму преобразования Л, минуя построение канонического базиса. Такая возможность вытекает из следующего пункта. 5. Докажем однозначную определенность жордано- жордановой нормальной формы матрицы данного преобразования. Пусть ка- канонический базис ei, ..., еп найден; матрица преобразования А имеет
234 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII в нем вид A). Предположим, что жордановы клетки, соответствую- соответствующие Ai, расположены в первых г строках матрицы A). Тогда линей- линейная оболочка первых г базисных векторов образует подпространство L\ в разложениях вида E) и (8): Li = L(eb . . . , er), L = L(er+b . . . , en) = L2 0 . . . 0 Lj. Преобразование B\ — A — \\E нильпотентнов L\. Базис ei,..., er под- подпространства L\ является каноническим для B\\ количество и длины серий этого базиса (относительно Ь\) равны количеству и размерно- размерностям жордановых клеток, соответствующих числу Ai в канонической матрице преобразования А. Количество серий различной длины в ка- каноническом базисе нильпотентного преобразования определяется по формуле (9) § 9. Применительно к рассматриваемому случаю величи- величины гк равны рангам преобразований Вк, рассматриваемых в Li, или, что то же самое, размерностям подпространств Вк(Ь\). Покажем, что в формулу (9) § 9 вместо гк можно подставить ранги преобразований Вк, рассматриваемых во всем пространстве L. Пусть Rk — ранг Вк в пространстве L. Тогда Rk равно размерности B^{L). В силу невырожденности В\ в подпространстве L имеем L = B1(L) = B^(L) = ... = B^(L). Согласно п. 6 §4 находим B*(L) = Bf(Li 0 L) = Bf(Li) 0 B$(L) = Bf(Li) 0 L. (9) Обозначим через s размерность L. Из (9) получаем Rk =rk + s, так что (поскольку s не зависит от к) имеем Я*_1 - 2Rk + Rk+1 = гк-± - 2rk + rk+l A0) (правая часть A0) входит в формулу (9) §9). Аналогичные рассуждения применимы к остальным вырожденным преобразованиям В{ = А — XiE. Вывод. Пусть 1гк — количество жордановых клеток размерности к ^ 1, соответствующих собственному числу А^, в матрице данного преобразования Л, записанной в каноническом базисе. Тогда /j. = R&ng(A-\iE)-2R<mg(A-\iE) + R<mg(A-\iE)k+1. A1) Все слагаемые в правой части формулы A1) не зависят от выбора ба- базиса. Теорема п. 2 доказана полностью. 6. Пусть канонический базис найден. Тогда каждое из подпрост- подпространств Li, входящих в разложение (8), само представляется в виде прямой суммы инвариантных подпространств, в каждом из которых преобразование задается одной жордановой клеткой. Полиномы вида
§ 11] ПРЕОБРАЗОВАНИЯ ПРОСТОЙ СТРУКТУРЫ 235 (Л — \{)к, равные с точностью до знака характеристическим много- многочленам этих жордановых клеток, называются элементарными дели- делителями матрицы преобразования А; к — порядок жордановой клетки. Количество элементарных делителей данной степени к с данным собственным значением Л^ равно числу 1\, (см. A1)). В теории матриц доказывается, что элементарные делители могут быть вычислены, ес- если известны общие делители миноров порядка s матрицы А — ХЕ для s = 1, ..., п. Тем самым дается другой способ нахождения нормальной жордановой формы матрицы А. 7. Теорема п. 2 справедлива в действительном пространстве в пред- предположении, что все корни р(Х) действительны. Доказательство в точ- точности повторяет пп. 3-5. 8. Если в действительном пространстве L задано преобразование Л, у которого часть корней характеристического многочлена комплексны, а корни Ai, ..., Хш действительны, то вместо D) имеем р(Х) = (-1)п-т(Х - Ai)mi ... (А - Хк)ткр(Х), A2) где р(Х) — полином степени т, не имеющий действительных корней, mi + • • • + rrik + m = п. Соответственно разложению A2) получаем раз- разложение пространства L на инвариантные подпространства: L = L\ 0 L<± 0 . . . 0 L, где Li — подпространство размерности rrii (яд- (ядро преобразования (А — XiE)mi), в котором А имеет одно собственное значение А^, a L — подпространство размерности т, в котором А невы- невырождено и не имеет ни одного собственного вектора. В каждом из Li можно выбрать канонический базис. В L выберем базис как угодно. Тогда матрица А примет вид G<". о о где G^, ..., G^ — нормальные жордановы формы матриц преоб- преобразования А в подпространствах Li, ..., L&; А — невырожденная т х m-матрица. Вопрос о дальнейшем упрощении матрицы А (за счет специального выбора базиса в L, упрощающего клетку А) мы не будем рассматривать. § 11. Преобразования простой структуры 1. Определение. Линейное преобразование А в пространст- пространстве L называется преобразованием простой структуры, если в L су- существует базис, состоящий из собственных векторов этого преобразо- преобразования.
236 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII В случае преобразования простой структуры жорданова нормаль- нормальная форма матрицы состоит из одномерных жордановых клеток. Фак- Фактически мы уже встречались выше с преобразованиями простой струк- структуры в п. 5 § 7. Сейчас установим два признака существования базиса из собствен- собственных векторов. 2. Первый признак (достаточный). Если характеристичес- характеристический многочлен линейного преобразования А комплексного простран- пространства L не имеет кратных корней, то в L существует базис из соб- собственных векторов преобразования А. Доказательство. В условиях признака разложение (8) § 10 со- содержит п различных одномерных инвариантных подпространств Li, ..., Ln. При этом каждое Li является линейной оболочкой соб- собственного вектора е^. Согласно § 14 гл. I векторы ei, ..., еп образуют базис в L. 3. Второй признак (необходимый и достаточный). В комп- комплексном пространстве L существует базис из собственных векторов преобразования А тогда и только тогда, когда для каждого корня Xi характеристического многочлена р(\) ранг матрицы А — XiE равен разности п — rrii, где rrii — кратность этого корня, п — размерность пространства L. Доказательство. 1) Необходимость. Пусть существует базис из собственных векторов. В этом базисе матрица преобразования А диагональна (см. §7, формулу C)), а характеристическая матрица имеет вид i-A Q А2-А U A) А- ХЕ = 0 ' Ап-А так что р(Х) = Det (А - ХЕ) = (А: - А)(А2 - А)... (Ап - А). Если, например, Ai имеет кратность mi, то есть, Ai = А2 = . . . = Ami, Ami+i ф Ai, ..., Хп ф Ai, то на диагонали матрицы A) при А = Ai первые т\ элементов равны нулю, а остальные отличны от нуля, поэтому Rang (Л- ХХЕ) =п-т1. B) Ввиду инвариантности р(Х) и ранга характеристической матрицы ра- равенство B) не зависит от выбора базиса.
§12] ЭКВИВАЛЕНТНОСТЬ МАТРИЦ 237 2) Достаточность. Согласно п. 4 § 10 размерность подпро- подпространства Li равна кратности rrii корня А^. Если Rang (А - XiE) = п - rrii, C) то собственному значению А^ соответствует rrii линейно независимых собственных векторов (см. §6, п. 2). Все они находятся в подпростран- подпространстве Li и образуют в нем базис. Если C) соблюдается для каждого номера г, то объединение таких базисов для всех г = 1, ..., j дает ба- базис пространства L (см. § 14 гл. I), причем полученный базис состоит из собственных векторов. Доказательство второго признака завершено. Замечание. В условиях второго признака преобразование А дей- действует в каждом из Li как подобие с коэффициентом А^ (см. в связи с этим § 7, п. 4). 4. Оба сформулированных признака справедливы в действитель- действительном пространстве при дополнительном условии, что все корни харак- характеристического многочлена действительны. Доказательство предоставляем читателю. 5. Из результатов § 10 следует, что произвольное линейное преоб- преобразование А в комплексном линейном пространстве L (а также в дей- действительном пространстве при условии, что р(Х) имеет лишь действи- действительные корни) можно представить в виде суммы А = В + С, где В — нильпотентное преобразование, С — преобразование простой структуры (см. формулы A) и B) § 10). § 12. Эквивалентность матриц 1. Определение. Две п х n-матрицы А и В называются экви- эквивалентными, если существует невырожденная п х n-матрица Q такая, что В = QAQ~X (матрицы Л, В, Q либо все действительны, либо все комплексны). Геометрический смысл этого определения состоит в следующем: ес- если А рассматривать как матрицу некоторого линейного преобразова- преобразования в произвольно выбранном базисе ei, ..., еп, то матрица В задает то же самое преобразование в другом базисе еу, ..., еп/, причем Q = _ (р*)-1^ Где р — матрица правых частей формул: (см. формулу Aа) из §2). Нетрудно проверить, что если А эквивалентна Б, то Б эквивалент- эквивалентна Л и что две матрицы, порознь эквивалентные третьей, эквивалент- эквивалентны между собой. Тем самым вся совокупность матриц (либо действи-
238 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII тельных, либо комплексных) распадается на непересекающиеся классы эквивалентных между собой матриц. 2. Пусть Н — некоторая подгруппа матриц. Если в определении эквивалентности брать матрицы Q из Я, то получим матрицы, экви- эквивалентные относительно данной подгруппы Н. Разные матрицы, экви- эквивалентные данной относительно //, выражают одно и то же линейное преобразование в разных базисах, принадлежащих одному классу ба- базисов по подгруппе Н. 3. Из результатов § 10 следует, что для каждой комплексной п х n-матрицы А существует эквивалентная ей матрица G, имеющая нормальную жорданову форму. Перестановка клеток в матрице G пе- переводит ее в эквивалентную матрицу G", так как переходу от G к G' соответствует с геометрической точки зрения перестановка некоторых наборов векторов в одном базисе. Процесс нахождения матрицы G, эквивалентной Л, называют приведением матрицы А к жордановой нормальной форме. Две матрицы, жордановы нормальные формы которых различают- различаются собственными значениями, количеством или размерами жордано- вых клеток, не эквивалентны между собой. 4. Если для данной матрицы А известна ее нормальная жорданова форма G, то матрица Q в равенстве G = QAQ~1 A) может быть найдена следующим путем. Умножив обе части A) справа на Q и перенеся все члены в одну сторону, получим равенство GQ - QA = 0; B) его можно рассматривать как однородную систему линейных уравне- уравнений, в которой неизвестными являются элементы матрицы Q. Любое решение такой системы, удовлетворяющее дополнительному условию DetQ^O, C) дает нужную матрицу Q. При больших п этот способ становится очень трудоемким, так как система B) содержит п уравнений. Разработаны другие методы нахождения матриц G и Q по заданной матрице А; один из них фактически изложен нами в §§9 и 10 1). 5. Пример. Привести к жордановой нормальной форме матрицу А- 4 г\\ А~ -1 6 ' Решение. Составляем характеристический многочлен: 4-А 1 -1 6-А р(Х) = = А2 -10А + 25, х) Кроме того, см., например, Гантмахер Ф. Р. Теория матриц.— М.: На- Наука, 1967.
¦12] ЭКВИВАЛЕНТНОСТЬ МАТРИЦ 239 откуда Ai = Л2 = 5. Далее находим -1 1 -1 1 А-Х1Е = - Х±Е) = G = D) Сумма кратности корня Ai и ранга (А — Х±Е) превышает п = 2, поэтому для преобразования с матрицей А не существует базиса из собственных векторов. В такой ситуации (п = 2, корень Ai кратный, базиса из собственных векторов нет) для жордановой нормальной фор- формы имеется единственная возможность: двумерная жорданова клетка, соответствующая данному Ai = 5: 5 1 О 5 Можно рассуждать иначе. Нетрудно подсчитать, что (А-Х1ЕJ = в, поэтому ранги последовательных неотрицательных степеней матрицы А — Х\Е образуют такую последовательность: Го = 2, 7-1=1, Г2 = Гз = . . . = 0. Подставляя Г{ в формулу A1) § 10, находим, что число одномер- одномерных жордановых клеток в матрице G равно нулю, число двумерных — единице, что согласуется с формулой D). Найдем теперь матрицу Q. Подставив в B) A, G и Q = /21 /22 E) получим систему уравнений O11+O12 + O21 = 0, ' -Qn-Qi2 +622 = 0, O21 + O22 = 0, -021 - 022 = 0. , (Все индексы написаны внизу, так как тензорная природа формул нас сейчас не интересует.) Последние два уравнения системы E) являются следствием первых двух, из которых находим Он = ft, O12 = Ь, O21 = -а - 6, O22 = а + 6, где а, Ь — произвольные числа. Нужно обеспечить условие C): b a + b DetQ = а —а — b откуда а ф —Ь. Никаких других ограничений на a, b не накладывается. Взяв, например, а = 1, b = 0, получим 1 О -1 1 Нетрудно проверить, что равенство A) соблюдается.
240 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [Гл. VII § 13. Формула Гамильтона—Кэли 1. Прямым следствием § 10 является тождество, известное под на- названием формулы Гамильтона-Кэли. Пусть р(А) = (-1)п(Хп + Pl\n~l + ¦¦¦+ рп-гХ + рп) — характеристический многочлен линейного преобразования А. Тогда р{А) есть нулевое линейное преобразование. Подробнее: Ап + Р1 А71-1 + • • • + рп_! А + рпЕ = 0. A) 2. Доказательство. Сейчас в наших рассуждениях будем счи- считать пространство комплексным. Согласно п. 4 § 10 мы имеем р(А) = (-1)И(А - Ai)mi ... (А - А,-)'. B) Соответственно р(А) = (-1)П(Л - ХгЕO711 ... (А - \jE)m*, C) в чем легко убедиться, одновременно перемножая скобки в правых ча- частях B) и C). Используя обозначения п. 4 § 10, вместо C) можно напи- написать р(А) = (-1)пВ^...В]г\ D) Порядок сомножителей в C) и D) безразличен, потому что здесь встречаются только произведения операторов Ли Е, которые перестановочны. Пусть х — произвольный вектор из L. Так как L есть сумма Li, то можно написать разложение х = xi -\ \- Xj, где Xi e Li, % = 1, . . . , j. E) С другой стороны, по определению Bi и Li имеем B?'(Li) = 6. F) Теперь видно, что р(А)х = О вследствие D)-F), поскольку в формуле D) сомножители можно писать в любом порядке. Таким образом, формула A) доказана. Формула Гамильтона-Кэли верна не только в комплексном, но и в действительном пространстве, поскольку действительное простран- пространство всегда можно расширить до комплексного. Подробнее: имея дан- данный базис, следует позволить рассматривать векторы с комплексными координатами; линейное преобразование А при этом естественно рас- распространится на полученное комплексное пространство (его матрицу А нужно оставить без изменения) .
ГЛАВА VIII. ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ § 1. Скалярное произведение 1. Пусть L — действительное линейное пространство. Введем в пространстве L новую операцию — скалярное умножение векторов. Действие скалярного умножения ставит в соответствие каждой па- паре векторов ж, у из L действительное число, которое обозначается (ж, у) и называется скалярным произведением вектора х на вектор у. По аналогии с элементарной аналитической геометрией потребуем соблюдения следующих свойств: 1) Коммутативность: (ж, у) = (у, х). 2) Распределительность (дистрибутивность): (xi+^2, у) = (xi, y) + + (Х2, У)- 3) Однородность: (ах, у) = а(х, у) для любого действительного числа а. 4) Невырожденность: если (ж, у) = О при фиксированном х и про- произвольном у из L, то х = в. Здесь всюду ж, у, х\, х^ — произвольные векторы пространства L. 2. Обратим внимание на то, что в элементарной аналитической гео- геометрии перечисленные выше свойства скалярного произведения дока- доказываются как теоремы, а здесь мы рассматриваем эти свойства как аксиомы, включая их в определение скалярного произведения. 3. Второе и третье свойства вместе означают линейность скалярно- скалярного произведения по первому аргументу. Вследствие коммутативности имеет место линейность и по второму аргументу. Итак, скалярное произведение (ж, у) представляет собой билиней- билинейную форму, симметричную согласно первому свойству и невырожден- невырожденную вследствие четвертого свойства. Действительно, четвертое свой- свойство означает, что нулевое подпространство билинейной формы (ж, у) нульмерно, откуда и вытекает ее невырожденность (см. выше, гл. IV, §п). 4. Очевидно, справедливо и обратное утверждение: Каждую невы- невырожденную симметричную билинейную форму g(x, у), заданную в пространстве L, можно принять в качестве скалярного произве- произведения, положив (ж, у) =g(x, у) ; любых ж, у G L.
242 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Замечание. Разумеется, скалярное произведение зависит от вы- выбора формы g(x, у). Если в качестве скалярного произведения выби- выбирать разные формы, то для данной пары векторов х, у пространства L скалярное произведение будет получать, вообще говоря, разные чис- численные значения. 5. Пусть в пространстве L введено скалярное произведение (ж, у) = = g(x, у). Предполагая пространство n-мерным, возьмем в нем произвольный базис ei, ..., еп. Если х = ^ жге^, у = ^ укек, то скалярное произве- произведение запишется в координатах так: (ж, у) = g(x, у) = Y^gikXiyk, A) где gik — коэффициенты билинейной формы g(x, у) в данном базисе ei, ..., еп. Они являются значениями этой формы на базисных векто- векторах, т.е. их скалярными произведениями. Таким образом, (ei,ek)=gik, B) причем gik = gki- Равенства B) составляют таблицу умножения ба- базисных векторов. Если правые части таблицы B) даны, то тем самым однозначно определено скалярное произведение любой пары векторов ж, у (соглас- (согласно равенству A)). 6. Определение 1. Векторы ж, у называются ортогональны- ортогональными, если (ж, у) = 0. В координатах условие ортогональности векторов ж, у имеет вид Определение 2. Вектор х ортогонален подпространству Z/, если (ж, у) = 0 для любого у G L''. Заметим, что если L' имеет размерность к, то для ортогонально- ортогональности вектора х подпространству L' достаточно, чтобы х был ортогона- ортогонален к каким-нибудь независимым векторам в числе к, лежащим в V. В самом деле, если независимые вектора ai, ..., аи лежат bL'h если (ж, а\) = 0, ..., (ж, аи) = 0, то для любого у G L' имеем у = Xxai + Н Ь \как, откуда (ж, у) = А1 (ж, oi) + • • • + Хк(х, ак) = 0. Определение 3. Подпространства Z/, L" называются ортого- ортогональными, если (ж, у) = 0 для любого xGL'h любого у G L"'. Определение 4. Подпространство L" называется ортогональ- ортогональным дополнением подпространства L' в пространстве L, если L' и L" ортогональны и их прямая сумма совпадает с L.
§ 2 ] НОРМА ВЕКТОРА 243 Замечание. Подчеркнем, что ортогональность векторов и орто- ортогональность подпространств существенно зависит от того, какая имен- именно билинейная форма g(x, у) взята в качестве скалярного произведе- произведения (ж, у) в пространстве L. § 2. Норма вектора 1. Пусть в линейном пространстве L задано скалярное произведе- произведение. Определение. Нормой вектора х называется число ||ж|| = +i/(X' Х). A) Норма является обобщением понятия модуля или длины вектора, известного из элементарной геометрии. Скалярное произведение (ж, х) является действительным числом, но оно может не быть положительным, так что норма вектора может оказаться мнимой. Условимся считать, что радикал в формуле A) мо- может быть либо неотрицательным действительным числом, либо мни- мнимым числом с положительным множителем при г (ъ = +д/^Т). 2. Из определения нормы следует, что ||аж|| = \а для любого х Е L и любого числа а. В частности, ||-ж|| = ||ж||, ||0||=О. B) Ненулевые векторы, норма которых равна нулю, называются изо- изотропными. Изотропные векторы существуют тогда и только тогда, когда квадратичная форма (ж, х) не является знакоопределенной. 3. Квадратичная форма ||ж||2 = (ж, х) называется метрической формой рассматриваемого пространства. Она определяется билинейной формой (ж, у)ив свою очередь опре- определяет ее как свою полярную форму. Таким образом, задание скалярно- скалярного произведения и задание квадратичной формы для измерения норм векторов равносильны.Поэтому пространства с заданным скалярным произведением называют также пространствами с квадратичной мет- метрикой. Если пространство n-мерно, то метрическая форма в координатах имеет вид 4. Теорема. Если метрическая форма является положитель- положительно определенной, то для любых двух векторов х, у G L соблюдается неравенство C)
244 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Доказательство. Используем неравенство Коши-Буняковского (см. § 10 гл. IV) (ж, уJ ^ (ж, х) • (у, у). D) Учитывая D), находим, что \\х + у\\2 = (х + у, х + у) = (ж, ж) + 2(ж, у) + (у, 2/) ^ <С (х, х) + 2>/(ж, ж)-B/, У) + (у, У) = (Ikll откуда следует C). Замечание. Из C) следует, что если метрическая форма поло- положительно определена, то 5. Рассмотрим аффинное пространство Я, которому соответствует линейное пространство L с квадратичной метрикой. Для каждой пары точек Л, Б из Я определим расстояние р(А, Б), полагая его равным норме вектора Л В: р(А,В) = \\АВ\\. E) Имеем р(А,В) = р(В,А), р(А,А) = 0. F) Формулы F) следуют из B) и E). 6. В случае положительно определенной метрической формы (ж, х) расстояние между точками равно нулю только тогда, когда точки сов- совпадают, и, кроме того, для любых трех точек Л, Б, С из Я соблюдается неравенство треугольника: р(А,С)<:р(А,В) + р(В,С). G) Неравенство G) следует из неравенства C) и формулы E) и назы- называется неравенством треугольника. 7. Если между точками аффинного пространства Я определено расстояние по формуле E), то говорят, что в аффинном пространстве Я задана квадратичная метрика. В аффинных координатах квадрат рас- расстояния имеет выражение P2(A,B) = Y,gikD-4)D-xk1), (8) где х\, ..., х™ — аффинные координаты точки А; х\, • • •, х% ~ аффин- аффинные координаты точки В. Правую часть (8), квадратичную относительно разностей коорди- координат произвольных точек А и В, называют метрической формой про- пространства Я. § 3. Ортонормированные базисы 1. В пространстве с квадратичной метрикой базисы не равноправ- равноправны. Среди них есть такие, которые наиболее удобны с точки зрения данной метрики.
§3] ОРТОНОРМИРОВАННЫЕ БАЗИСЫ 245 Именно, базис ei, ..., еп можно выбрать так, чтобы метрическая форма g(x, х) имела в нем нормальный вид \\x\\2 = g(x, х) = (х1J + • • • + (хкJ - (хк+1J (хпJ. Тогда скалярное произведение двух векторов представится так: ху = х1у1 Н Ь хкук - xk+lyk+l хпуп. Ясно, что скалярные произведения (е^, ej) = 0, если г ф j, то есть, при г ф j базисные векторы ортогональны. При этом ||е^||2 = 1, если г = 1,..., к] \\ei\\2 = —1, если г = fc + 1,..., п. Тем самым векторы бази- базиса нормированы так, что квадраты их норм по модулю равны единице. Векторы е{ называются единичными, если г ^ к, мнимоединичными, если г ^ к + 1. Вообще вектор а называется единичным, если ||ft||2 = 1, мнимоединичным, если ||а||2 = —1. Определение. Базис е\,..., еп, удовлетворяющий перечислен- перечисленным в этом пункте условиям, называется ортонормированным. Теорема 1. В п -мерном линейном пространстве с заданной квад- квадратичной метрикой всякий набор из попарно ортогональных единич- единичных или мнимоединичных векторов общим числом п является бази- базисом, в котором метрическая форма имеет нормальный вид. Доказательство. Пусть е\, ..., еп — указанный набор векто- векторов. Убедимся, что они линейно независимы. Рассмотрим соотношение \\е\ + Л2е2 + • • • + Апеп = в. Отсюда, умножая скалярно на ei, получим Ai(eb ei) + А2(е2, ех) Н Ь Ап(еп, ег) = F>, е±). Но по условию (ei, ei) = ±1, (ej, e\) = 0 (j ф 1); кроме того, (^5 а) = 0. Следовательно, Ai = 0. Аналогично докажем, что А2 = = 0, ..., Ап = 0. Таким образом, установлено, что векторы ei, ..., еп независимы и, значит, действительно составляют базис. Так как g(e{, е{) = (еь е{) = =Ы, g{eu ej) = (e{, ej) = 0 при г ф j, то форма g(x, х) в базисе ei, ..., еп имеет нормальный вид. 2. Наряду с доказанной выше теоремой 1 мы отметим следующее утверждение. В n-мерном линейном пространстве всегда можно задать, причем единственным способом, такую квадратичную метрику, что произволь- произвольный заранее заданный базис ei, ..., е&, е&+1, ..., еп станет ортонор- ортонормированным, его векторы ei, ..., е& станут единичными, а векторы е/.+1, ..., еп — мнимоединичными; здесь к — также любое заранее за- заданное целое число от 0 до п. Доказательство. Искомая метрика однозначно определяется заданием метрической формы g(x, ж), которая в базисе ei, ..., е&,
246 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII efc+i, ...,еп имеет вид g(x, х) = (х1J + ... + (хкJ - (х^1J (хпJ. 3. Согласно закону инерции квадратичных форм число единичных и число мнимоединичных векторов не зависит от выбора базиса, орто- нормированного в данной квадратичной метрике. Определение. Число к единичных векторов ортонормирован- ного базиса называется положительным индексом пространства с дан- данной квадратичной метрикой. Если к = п или к = 0, то пространство называется евклидовым. Если 1 ^ k ^ п — 1,то пространство называется псевдоевклидовым. Особенно большое значение имеет псевдоевклидово пространство при к = п — 1. Оно называется пространством Минковского и при п = = 4 играет важную роль в теории относительности. § 4. Ортогональная проекция. Ортогонализация 1. В этом параграфе мы рассмотрим евклидово пространство L, то есть, линейное пространство со знакоопределенной метрической фор- формой. Будем считать метрическую форму положительно определенной. (Случай отрицательно определенной метрической формы отдельного рассмотрения не требует. Это будет ясно из § 5.) Размерность простран- пространства L может быть бесконечной. Пусть в L дано подпространство L'. Допустим, что вектор х Е L представляется в виде суммы х = х' + х, A) где х' Е L',ax ортогонален к L'. Тогда вектор х' называется ортого- ортогональной проекцией вектора х на подпространство L'. Ортогональная проекция вектора х на V единственна. В самом деле, пусть имеется другое разложение х = х[ + xi, где х[ G Z/, х\ ортогонален к V. В этом случае х' — х[ = х\ — х; отсюда (х1 - х[J = {х1 - х[, х' - х[) = (ж! - ж, х' - х[) = 0, (*) так как х' — х[ G Z/, а х и х\ ортогональны к V. Из (*) следует, что х' — х[ = 0, то есть, х' = х[, поскольку метрическая форма про- пространства положительно определена. Частный случай, когда L трехмерно, Z/ двумерно, показан на рис. 36. Преобразование пространства L, которое каждому вектору х ставит в соответствие вектор х' согласно формуле A), тоже называется орто- ортогональной проекцией (или ортогональным проектированием) на L'.
И] ОРТОГОНАЛЬНАЯ ПРОЕКЦИЯ.ОРТОГОНАЛИЗАЦИЯ 247 Рис. 36. Если пространство L рассматривается как точечное, a L' — как плоскость в нем, то точка М' с радиус-вектором ОМ' = х' называет- называется ортогональной проекцией на L точки М, имею- имеющей радиус-вектор ОМ — х /ж м (рис. 36). 2. Докажем, что ортого- ортогональная проекция М' точки М на L' представляет собой ближайшую к М точку L'. Пусть ON — произ- произвольный вектор подпростран- подпространства L'. Нужно доказать, что ||ж-|/||^||ж||, B) причем равенство в B) достига- достигается только тогда, когда у = х' (то есть, когда N совпадает с М', рис. 36). Положим х' — у — у\. Тогда х — у = х + yi, и \\Х~У\\2 = (^+2/1? ?+2/i) = l|?||2 + ll2/i||2+2(?, Уг) = ||?||2 + ||2/i||25 C) поскольку (ж, у\) = 0 вследствие ортогональности вектора х подпро- подпространству Z/, содержащему у'. Заметим, что ввиду положительной определенности метрической формы рассматри- рассматриваемого пространства. Поэтому B) следует из C). Равенство в B) до- достигается лишь тогда, когда у\ — в (то есть, когда у = х'). 3. Пусть L' = L{zu . . . , zk), где zi, ..., Zk — некоторая конечная независимая система векторов из L. В этом случае для нахождения ортогональной проекции х' за- заданного вектора х на подпространство L' достаточно надлежащим об- образом вычислить коэффициенты а±, ..., oik в разложении х' = OL\Z\ + • • • + (У>к%к- D) С этой целью запишем условие ортогональности вектора х = х — х' каждому из векторов zy. (x-x',Zj)=0. E) Подставив разложение D) в E) и используя свойства скалярного произведения, получаем для ctj систему линейных уравнений к \ ^G. 7 Лп/ ¦ — (т 7 Л i — 1 к ((\\ / \%П Zj)ai — \Xi Z3)-> J — ^ • • • 5 К- \У) г=1
248 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Определитель системы F) представляет собой определитель Грама для положительно определенной квадратичной формы (х, х) и незави- независимых векторов z\, ..., Zk- Поэтому он положителен (см. § 10 гл. IV), а система F) однозначно разрешима. Тем самым искомая проекция найдется. 4. Ниже нам потребуется следующая Лемма. Пусть в пространстве с положительно определенной метрической формой имеется система попарно ортогональных век- векторов а±, ..., а&, то есть, (ai, ак) = 0 при ъ ф к. Если ни один из этих векторов не нулевой, то они линейно независимы. Доказательство. Рассмотрим соотношение \\CL\ -\- ' ' ' -\- AfcCLk = и. G) Умножим G) скалярно на а±: Ai(oi, oi) + A2(oi, o2) H Ь Ал(о1, ак) = (оь в). (8) Так как а± ф в, а метрическая форма положительно определена, то (ai, a\) = ||fti||2 ф 0. Остальные скалярные произведения в левой ча- части (8) обратятся в нуль по условию леммы; (а\, в) = 0 из-за участия нулевого вектора. Следовательно, Ai = 0. Аналогично устанавливает- устанавливается, что А2 = . . . = А& = 0. Лемма доказана. 5. Пусть в пространстве L дана упорядоченная система линейно независимых векторов е±, ..., е&. Речь будет идти о замене этой системы дру- другой системой векторов, ортогональной и в некотором смысле эквивалентной данной. С этой целью проводится геометрическое построение, называе- называемое процессом ортогонализации. Оно напоминает процесс выбора базиса при приведении квадратичной формы Рис. 37. к каноническому виду методом Якоби. Новая система векторов еу, ..., е^ строится с соблюдением следу- следующих условий: 1) еу G L(ei), e^ G L(e\, е^), ..., ..., ek' E L(ei, . . . , ek). > попарно ортогональны, линейно независима. В таком случае говорят, что новая система векторов получена из первоначальной системы е\, ..., ей процессом ортогонализации. Если данная система состоит из трех векторов ei, е2, ез в трехмер- трехмерном евклидовом пространстве, то новую систему еу, еу, ез' построим так: 2) Векторы 3) Система
И] ОРТОГОНАЛЬНАЯ ПРОЕКЦИЯ.ОРТОГОНАЛИЗАЦИЯ 249 • первый вектор сохраним (еу = ei); • второй вектор проведем к нему ортогонально в плоскости, проходящей через е\ и е2; • третий вектор проведем ортогонально этой плоскости (рис. 37). Переходя к случаю большей размерности, нужно четвертый вектор располагать перпендикулярно данному трехмерному пространству и т. д. В общем случае положим еу = еь е2' = е2 + аеу, (9) y + \2е^к_2у Н Ь Xk-iey. Из формул (9) следует, что векторы е^ расположены в нужных ли- линейных оболочках и являются ненулевыми вследствие независимости векторов ei, ..., е&. Остается подобрать коэффициенты а, /3, ... так, чтобы векторы е^ были попарно ортогональны. Тогда система еу, ..., е&/ будет незави- независимой по лемме п. 4. ei = ev Рис. 38. Рис. 39. Найдем а. Мы имеем (е2/, еу) = (е2, еу) + a(ei/, ei/) = 0, отсюда а = -<;е2'е1') A0) (ei/, ey) Деление выполнимо, так как (еу, еу) = (ei,ei) 7^ 0. Вектор (—ае\) представляет собой ортогональную проекцию е2 на Ь(е±) (рис. 38). Дальше обеспечим ортогональность третьего вектора первым двум: (ез', еу) = (ез, е^) + /3(е2', ei/) + 7(ei'5 ev) — 0? (е3', е2/) = (ез, е2/) + ^(е2/, е2/) + 7(ei'5 e2') = 0.
250 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Подчеркнутые члены обращаются в нуль, а {еу, еу) ф 0 по постро- построению. Поэтому находим Формулы (9) и A1) геометрически означают, что для построения вектора еу нужно из вектора ез вычесть его ортогональную проекцию на подпространство L(ei, е2) (рис. 39). Дальше процесс идет аналогично. 6. В процессе ортогонализации иногда бывает важно обеспечить соблюдение еще двух дополнительных условий. 4) При любом j (I ^ j ^ к) система еу, ..., е^ ориентирована так же, как система ei, ..., ej. 5) ||еИ| = 1- Формулы (9) гарантируют соблюдение условия 4). В самом деле, из (9) имеем ех = еу, е2 = -аеу + ет, так что в матрице, выражающей ei через е^, левый верхний минор порядка j (при любом j ^ к) положителен (равен +1). Для того, чтобы обеспечить условие 5), достаточно после проведе- проведения ортогонализации каждый из полученных векторов разделить на его норму. Замечание. Нетрудно доказать (например, по индукции), что условия 1)-5), перечисленные в пп. 5 и 6, по данной системе ei, ..., е/. однозначно определяют систему векторов еу, ..., е&/. 7. Многочлены Лежандра.В математическом анализе и его приложениях приходится использовать разложение произвольных функций в ряды по данным функциям, рассматривая такие разло- разложения функций аналогично разложению векторов по данному базису. При этом удобно иметь аналоги ортогонального базиса; таковыми яв- являются ортогональные системы функций. Одним из простейших при- примеров ортогональных систем являются многочлены Лежандра. В пространстве непрерывных функций на отрезке [—1, 1] вводится квадратичная метрика со скалярным произведением +1 (ж, у) = J x{t)y{t)dt. A2)
§5] МЕТРИЧЕСКИЙ ИЗОМОРФИЗМ 251 Соответственно +1 ||ж||2 = f x2(t)dt. A3) -1 Мы уже рассматривали выражение A3) и доказали, что это квадра- квадратичная форма (см. §4 гл. IV). Следует обратить внимание на ее поло- положительную определенность: ||ж||2 ^ 0, причем ||ж||2 = 0 тогда и только тогда, когда непрерывная функция x(t) = О во всех точках отрезка. Возьмем систему одночленов 1, t, t2, t3, ..., tk, ... A4) и применим к ней процесс ортогонализации. В результате получим по- последовательность многочленов /„(*) = 1, h(t) = t, f2(t) = t2-\, /3(i)=i3-^, ... A5) б 5 Номера многочленов A5) выбраны так, чтобы они совпадали с их степенями. Коэффициенты многочленов вычисляются согласно фор- формулам (9) с учетом A0)—A2) и A4). После специальной нормировки вида где А& выбираются из условия получаем последовательность многочленов Pk(t) (степени к = 0, 1, 2, ...), называемых многочленами Лежандра. Можно доказать, что Учитывая замечание в п. 6, для этого достаточно проверить, что все многочлены A7) попарно ортогональны (здесь удобно применить ин- интегрирование по частям), и что они удовлетворяют условию A6). Можно доказать также, что Т Таким образом, система многочленов Лежандра ортогональна, но не нормирована (нормы р^ не равны единице). § 5. Метрический изоморфизм 1. Определение. Два пространства L и L' с квадратичной мет- метрикой называются метрически изоморфными друг другу, если между ними существует линейный изоморфизм, при котором скалярное про- произведение любой пары векторов в L равно скалярному произведению их образов в L'. Линейный изоморфизм при этом условии называется метрическим изоморфизмом (о линейном изоморфизме см. § 10 гл. I).
252 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Замечание. Метрически изоморфные пространства имеют оди- одинаковые свойства не только линейные, но и метрические, т. е. основан- основанные на понятии скалярного произведения. Поэтому достаточно среди множества метрически изоморфных пространств изучить одно, чтобы знать остальные. 2. Теорема 1. Пространства с квадратичной метрикой, имею- имеющие одинаковые размерности и одинаковые положительные индексы, метрически изоморфны между собой. Доказательство. Пусть L и V оба n-мерны и имеют один и тот же положительный индекс к @ ^ к ^ п). Согласно §4 мы можем в L найти ортонормированный базис е\, ..., еп, а в L' — ортонор- мированный базис еу, ..., еп<. Эти базисы имеют одинаковое число единичных векторов, равное к; будем считать, что в каждом из этих базисов единичными являются первые к векторов. Пусть х — произвольный вектор пространства L. Разложим его по базису ei, ..., еп: х = ххе\ + ••• + хпеп. Поставим в соответствие вектору х тот вектор х' Е L'', который в базисе еу, ..., еп< имеет та- такие же координаты: х' = ххеу + • • • + хпеп<. Тем самым между L и U установлен линейный изоморфизм (см. §10 гл. I). Рассмотрим два произвольных вектора х, у пространства L и их образы х1', у' в V'. Так как в базисах е±, ..., еп и еу, ..., еп< метрические формы про- пространств L и L' имеют одинаковые координатные представления, а ко- координаты векторов ж, у совпадают соответственно с координатами век- векторов х1\ у'\ то (ж, у) = {х1', у'). Таким образом, установленный между L и L' линейный изоморфизм является метрическим изоморфизмом. Теорема доказана. Для пространств L и V с квадратичной метрикой справедлива так- также следующая Теорема 2. Если пространство L имеет размерность п и по- положительный индекс к @ ^ к ^ п), а пространство V метрически изоморфно ему, то V также имеет размерность п и положитель- положительный индекс к. Доказательство. Пусть е\, ..., еп — ортонормированный ба- базис в L, первые к векторов которого единичные; пусть векторы еу, ... . . ., еп> G L' соответствуют векторам е\, ..., еп по изоморфизму. Так как метрический изоморфизм является линейным изоморфизмом, то, повторяя доказательство теоремы 2 § 10 гл. I, найдем, что размер- размерность V равна п и что еу, ..., еп/ составляют базис в V. Из определе- определения метрического изоморфизма сразу следует, что базис еу, ..., en/ G G L' ортонормированный и что первые к его векторов и только они единичны. Теорема доказана.
§ 6 ] К-ОРТОГОНАЛЬНЫЕ МАТРИЦЫ И ГРУППЫ 253 Следствие. Псевдоевклидовы пространства с различными раз- размерностями или с различными положительными индексами не изо- изоморфны. Евклидово пространство не изоморфно никакому псевдоев- псевдоевклидову. Замечание. Однако нет надобности отдельно изучать п-мерные квадратично-метрические пространства с положительными индекса- индексами к и п — к. Достаточно у одного из них сменить знак квадратичной формы, чтобы получить другое. § 6. /^-ортогональные матрицы и /^-ортогональные группы 1. Рассмотрим n-мерное пространство с квадратичной метрикой с данным положительным индексом к (О ^ к ^ п). Пусть в этом базисе берутся два любых базиса ei, ..., еп и еу, ..., еп< при условии, что оба они ортонормированные и в каждом из них единичными являются первые к векторов. Напишем по обычному стандарту формулы перехода от первого ба- базиса ко второму: Матрица Р, составленная из коэффициентов этих формул, в дан- данном случае обладает специальной природой. Постараемся ее выяснить. С этой целью напишем метрическую форму пространства в базисе ^1 5 * * * 1 ^"П ' \\Х\\2 = (ж1J + • • • + (Xkf - (Xk+lf (хПJ. A) Наряду с этой формой рассмотрим матрицу Ек = О о • -1 у которой на первых к местах по главной диагонали стоит +1, на осталь- остальных местах главной диагонали —1, а все остальные элементы равны ну- нулю. Очевидно, что матрица G метрической формы в базисе ei, ..., еп совпадает с матрицей Е^: G = Ek. В силу наших условий относительно рассматриваемых базисов мет- метрическая форма в базисе еу, ..., еп< имеет точно такой же вид A), как и в базисе ei, ..., еп. Поэтому матрица G' метрической формы в базисе еу, ..., еп/ также равна ?&: G' = Ек.
254 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII С другой стороны, согласно общему закону преобразования матри- матрицы квадратичной формы имеем Gf = PGP*. Отсюда получаем следующий вывод: если матрица Р является матри- матрицей перехода от одного ортонормированного базиса к другому орто- нормированному базису, то РЕкР* = Ек; B) существенно, что в обоих базисах именно первые к векторов являются единичными (остальные — мнимоединичными). Легко понять, что одновременно доказано обратное утверждение: если матрица Р удовлетворяет условию B), если исходный базис ei,... . . ., еп является ортонормированным и если первые к его векторов единичные (остальные — мнимоединичные), то базис еу, ..., еп<, полу- полученный по формуле (I), будет тоже ортонормированным, и его первые к векторов также будут единичными. 2. Определение. Всякая п х n-матрица Р, удовлетворяющая условию B), называется к-ортогональной (О ^ к ^ п). Заметим, что это определение имеет чисто алгебраический харак- характер; его можно было бы высказать вне связи с геометрией квадратично- метрических пространств. 3. Всякие /^-ортогональные матрицы невырожденные. В самом де- деле, очевидно, что Det Ек = =Ы. Отсюда и из B) получаем Det P-Det P* = 1, C) следовательно, Det Р ф 0. Из C) видно также, что Det Р — =Ы. 4. Вследствие B) имеем Р~хЕк — ЕкР*, или (так как ЕкЕк — Е) Р-1 = ЕкР*Ек. D) Мы видим, что операция обращения матрицы, трудоемкая в общем случае, для /^-ортогональных матриц сводится к операциям транспо- транспонирования и умножения на Ек (последнее означает только смену знака некоторых элементов). 5. Теорема. В группе всех невырожденных п х п-матриц к -ортогональные матрицы составляют подгруппу. Мы обозначим ее через Ок и будем называть /^-ортогональной под- подгруппой (или группой). Доказательство. Пусть Ок обозначает пока просто множе- множество всех /^-ортогональных п х n-матриц. Возьмем из Ок две любые матрицы Рь Р2; тогда PiEkP? = Ekj P2EkP? = Ек. Отсюда (PiP2)Ek(P1P2y = Р!{Р2ЕкР*)Р* = РгЕкР? = Ек, поскольку ЕкЕк = Е. Итак, если Pi G Ок, Р2 Е Ок, то Р1Р2 Е Ок.
§ 6 ] К-ОРТОГОНАЛЬНЫЕ МАТРИЦЫ И ГРУППЫ 255 Возьмем из Ok произвольную матрицу Р; тогда PEkP* = Еь- От- Отсюда и вследствие D) P^EuiP-1)* = Р~1Ек(ЕкР*Ек)* = = Р Ek(EkPEk) = Р EkPEk = Ek, поскольку ЕкЕк = Е. Таким образом, если Р G О и, то Р G О к- Теорема доказана. Замечание. Согласно п. 3 все Ok @ ^ к ^ п) входят в подгруп- подгруппу п х n-матриц с единичным модулем определителя. 6. Множество всех ортонормированных базисов в пространстве с квадратичной метрикой с данным положительным индексом представ- представляет собой не что иное, как класс базисов, который определен по груп- группе Ok каким-нибудь ортонормированным базисом этого пространства (см. § 1 гл. IV). Геометрия пространства с квадратичной метрикой имеет предметом своего изучения инварианты относительно группы Ok в классе ортонор- ортонормированных базисов. Говоря об инвариантах, мы понимаем этот термин в широком смысле; именно, мы имеем в виду не только инвариантные числовые величины (как, например, скалярное произведение, норма вектора), но также инвариантные объекты (например, плоскости) и ин- инвариантные отношения (например, отношение ортогональности). 7. Заметим теперь, что любой класс базисов по группе Ok является классом ортонормированных базисов в некоторой (вполне определен- определенной) квадратичной метрике. В самом деле, пусть ei, ..., еп — произвольный базис линейного пространства L. Согласно п. 2 §3 существует (вполне определенная) квадратичная метрика, в которой базис ei, ..., еп является ортонор- ортонормированным и имеет в качестве единичных первые к своих векторов. Тогда класс базисов, определенных по группе Ok базисом ei, ..., еп, будет состоять из ортонормированных базисов именно в этой метрике. 8. Вывод. Таким образом, множество всех базисов линейного п- мерного пространства расслаивается на классы по группе Ok так, что каждому классу отвечает своя квадратичная метрика, в которой бази- базисы этого класса являются ортонормированными. Одновременно определяется бесконечное множество квадратично- метрических пространств на одном и том же, образно говоря, линейном «каркасе» L. Все они метрически изоморфны между собой; геометрии этих пространств алгебраически тождественны, так как все они име- имеют своим предметом инварианты группы Ok- Однако с точки зрения линейного пространства L эти квадратично-метрические пространства различны, поскольку одна и та же пара векторов ж, у пространства L имеет в них разные численные значения скалярного произведения. Все сказанное мы поясним чуть позднее на примерах (см. §§ 7, 8).
256 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII 9. Будем считать, что квадратичная метрика выбрана. Пусть /^-ортогональная матрица Р определяет переход от ортонормирован- ного базиса ei, ..., еп к ортонормированному базису еу, ..., еп/. Од- Одновременно рассмотрим соответствующее преобразование координат jV. E) Матрица этого преобразования Q = (Р*). Убедимся, что матри- матрица Q также является /^-ортогональной. С этой целью напишем следу- следующую цепочку равенств: QEkQ* = (Р*)-1Екр-г = (РЕкР*)~г = Е-1 = Ек. Мы получили соотношение QEkQ* = Ek] тем самым /^-ортогональ- /^-ортогональность Q установлена. Итак, при переходе от одного ортонормированного базиса к друго- другому координаты произвольного вектора подвергаются (как переменные) линейному преобразованию с /^-ортогональной матрицей. Замечание. Линейные преобразования E) переменных ж1, ... . . ., хп в переменные х1 , ..., хп с /^-ортогональной матрицей Q мо- могут быть охарактеризованы без обращения к преобразованию базисов и соответственно без обращения к матрице Р. Именно такие линейные преобразования и только они сохраняют нормальный вид квадратич- квадратичной формы; иначе говоря, если матрица Q является /^-ортогональной (и только в этом случае), то имеет место тождество в левой части которого х1 , ..., хп выражены по формулам E). 10. Из предыдущего ясно, что множество всех линейных преобра- преобразований переменных с /^-ортогональными матрицами составляет груп- группу, изоморфную группе О&, причем изоморфизмом может служить отображение, которое матрице Р G Ok относит линейное преобразо- преобразование с матрицей Q = (Р*). В этом же можно убедиться с помощью формальных действий с матрицами. В самом деле, если Pi, P^ G Ok и Qi = №)-]_, Qi = (Pir\ то qxq2 = (рггчр?)-1 = (Pip?)-1 = = ((Р1Р2)*) 1. Мы видим, что произведению матриц Pi, P2 отвечает произведение их образов, что служит условием изоморфизма. § 7. Группа евклидовых поворотов 1. В двумерном случае существуют два метрически неизоморфных пространства, соответственно положительным индексам к = 1 и к = 2. Если к = 2, то в ортонормированном базисе метрическая форма имеет вид
ГРУППА ЕВКЛИДОВЫХ ПОВОРОТОВ 257 Ей отвечает геометрия обычной евклидовой плоскости (где скалярное произведение дается известной формулой (х, у) = х1у1 + х2у2 и где определен угол между векторами, а тригонометрические функции уг- углов даются в координатах хорошо известными формулами элементар- элементарной аналитической геометрии). Если к = 1, то II ||2 _ / 1ч2 _ /2x2 /о\ Метрической форме B) отвечает двумерная геометрия Минковско- го. 2. Здесь мы займемся формой A). Начнем с рассмотрения /^-ор- /^-ортогональных матриц. Впрочем, сразу же оговоримся, то при п = 2, к = 2 (как и вообще при к = п) /^-ортогональные матрицы просто называются ортогональными. При п = 2, к = 2 имеем ?& = ?\ Поэтому общее условие PEkP* = = ?& для /^-ортогональности матрицы Р в данном частном случае при- принимает вид: РР* = Е. Пусть /3 Р = 7 Согласно сказанному, эта матрица ортогональна тогда и только тогда, когда а 7 Р 5 а 7 5 1 0 0 1 Отсюда = 0, C) Здесь три различных уравнения. Ввиду простоты этой системы не со- составляет труда найти все ее решения. В самом деле, вследствие второго уравнения системы C) мы можем написать: j = — А/3, 5 = +Асу, где А — новая неизвестная. Подставляя эти выражения в последнее уравне- уравнение системы, получим Таким образом, А = =Ы. Чтобы выяснить геометрический смысл вы- выбора знака, подсчитаем определитель матрицы Р: DetP = а -хр Р Ха Следовательно, значениям А = =Ы отвечают преобразования базиса соответственно с сохранением или с нарушением ориентации. Используем теперь уравнение а2+/32 = 1. Вследствие этого уравне- уравнения а = cos 0, Р = sin 0, где 0 — произвольный параметр. Одновремен- Одновременно имеем: j = — Asin#, 5 = Acos#. Тем самым найдены все решения Н.В. Ефимов, Э.Р. Розендорн
258 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Р = D) системы C) и соответственно все ортогональные матрицы (разумеется, только при п = 2). Ограничимся случаем Л = +1. Тогда cos 0 sin 0 — sin 0 cos 0 Формула D) дает все ортогональные матрицы, для которых Det P > > 0 (т. е. Det P = +1). Легко понять, что они сами по себе составляют группу (подгруппу всей ортогональной группы). Это же обстоятель- обстоятельство усматривается из следующих двух равенств: sin в\ cos 02 sin 02 cos 0i - sin 02 cos 02 COS0 — sin -l cos(#i + 62) -sin@i +02) sin@i cos(#i 62) 02) cos(-0) sin(-0) 0 cos0 ~ -sin(-0) cos(-0) Они легко проверяются и выражают тот факт, что произведение мат- матриц D) и обращение матрицы D) приводят к матрицам того же вида. 3. Возьмем на евклидовой плоскости ортонормированный базис ei, в2] см. рис. 40, где изображены ортогональные друг другу векторы ei, в2, которые исходят из начала координат и имеют концы на единичной окружности (х1J + (х2J = 1. Перейдем к новому базису с помощью матрицы Р вида D): cos 0 , ^ , , E) е2, = — е1 sin в 2 sin e/, > COS0. Рис. 40. В силу первого из этих равенств вектор еу является единичным и составляет с вектором е\ угол в при обычном условии относительно ориентации углов (т. е. угол понимается с уче- учетом знака, как принято в тригонометрии). Второе равенство можно написать в виде е2, = е1 cos ув-\ J +e2sinf#H J . Отсюда следует, что вектор еу •> будучи единичным, составляет с векто- вектором е\ угол 6+ -|. Значит, с вектором в2 он составляет такой же угол 0, как вектор ву с вектором в\. Иначе говоря, базис еу, еу получается поворотом на угол в базиса ei, в2 целиком. Таким образом, ортонормированный базис ei, в2, произвольно взя- взятый в евклидовой плоскости, определяет по группе матриц D) класс базисов, которые получаются поворотом базиса ei, 62 на всевозможные углы; все они ортонормированы и одинаково ориентированы с базисом ei, e2.
ГРУППА ЕВКЛИДОВЫХ ПОВОРОТОВ 259 Замечание. Чтобы получить, исходя из базиса ei, в2, класс ба- базисов по всей ортогональной группе, нужно добавочно построить класс базисов по группе матриц D), взяв в качестве исходного базис ei, — е^- 4. Преобразованию базиса по матрице Р отвечает преобразование координате матрицей Q = (Р*). В данном случае РР* = Е. Отсюда Q = Р. Следовательно, если базис преобразуется по формулам E), то координаты произвольного вектора преобразуются по формулам с той же матрицей: х1 = х1 cos 0 + х2 sin#, 1 / г F) х2 = — х1 sin в + х2 cos#. J 5. Сейчас мы рассматривали соотношения F) как формулы преоб- преобразования координат данного вектора х = ххе\ -\-x2e<i при повороте ба- базиса ei, в2 (рис. 41, а). Эти же формулы можно рассматривать с другой точки зрения. Именно, можно считать, что базис ei, в2 не меняется, но что формулы F) сопоставляют с произвольным вектором х = х1е± + + х2в2 новый вектор х' = х1 е\ + х2 е^- В этом смысле формулы F) являются координатным представлением в базисе ei, в2 некоторого ли- линейного преобразования евклидовой плоскости; мы обозначим его /#. Согласно формуле F) вектор х' = Iqx имеет ту же норму, что и век- вектор х, и получается путем поворота вектора х на угол (—в) (рис. 41, б). Так как угол в — общий для всех векторов, то при линейном преоб- преобразовании х' = Iqx все векторы поворачиваются одинаковым образом. Поэтому линейное преобразование Iq называют поворотом евклидовой плоскости на угол (—в). О б) Рис. 41. Множество всех поворотов (т. е. на всевозможные углы) составляет группу поворотов евклидовой плоскости или, как еще говорят, группу вращений. Она изоморфна группе матриц вида D), которая поэтому также называется группой поворотов или вращений. 6. Преобразование, сохраняющее метрику пространства, называ- называется изометрическим (или изометричным). 9
260 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Сейчас мы ограничимся некоторыми примерами, а в следующей главе изучим изометрические преобразования подробнее. 7. При любом повороте х' = Iqx метрические свойства образов совпадают с метрическими свойствами прообразов (норма образа рав- равна норме прообраза: ||ж'|| = ||ж||; скалярное произведение образов рав- равно скалярному произведению прообразов: (xf, у') = (ж, у)). Поэтому всякий поворот Iq является изометрическим преобразованием. К чис- числу изометрических преобразований относятся также зеркальные от- отражения относительно некоторой прямой; например, преобразование х1' = ж1, х2' = -х2. Ниже, в §§ 7, 8 гл. IX доказано, что на двумерной евклидовой плос- плоскости произвольное изометрическое преобразование определяется в ор- тонормированном базисе координатным представлением с произволь- произвольной ортогональной матрицей (с определителем любого знака); оно яв- является либо вращением плоскости на некоторый угол, либо зеркальным отражением, либо произведением некоторого вращения на зеркальное отражение. Замечание. Мы не учитываем параллельные сдвиги евклидовой плоскости, смещающие начало координат, поскольку евклидову плос- плоскость рассматриваем сейчас как векторное пространство. 8. В геометрии евклидовой плоскости рассматриваются инвариан- инварианты ортогональной группы. При этом сам факт инвариантности имеет чисто алгебраическую природу; например, инвариантность норм век- векторов означает тождество (х1 J + (х2 J = (х1J + (х2J как следствие формул F) или формул х1 = х1, х2 = —х2. С геометрической же сто- стороны дела здесь возможны два воззрения. Если ортогональная груп- группа рассматривается как группа, порождающая класс ортонормирован- ных базисов, то инвариантность относительно этой группы означает равноправие таких базисов. Если ортогональная группа рассматрива- рассматривается как группа, порождающая изометрические линейные преобразо- преобразования, то инвариантность относительно этой группы означает сохра- сохранение метрических свойств фигур (систем векторов) при поворотах и зеркальных отражениях. 9. Выше мы указывали, что в одном и том же линейном простран- пространстве можно по-разному ввести метрику, принимая за скалярное произ- произведение различные билинейные формы. Проиллюстрируем это на при- примере евклидовой плоскости. Согласно элементарной геометрии на евклидовой плоскости можно сравнивать длины и измерять углы; пусть единица масштаба выбрана и в качестве базиса взяты векторы ai, a<i единичной длины, ортого- ортогональные с элементарной точки зрения. Тогда можно ввести скалярное
§7] ГРУППА ЕВКЛИДОВЫХ ПОВОРОТОВ 261 произведение (ж, у), полагая (ж, у) = х1у1 + х2у2, G) где х = хха\ + х2а2, у = з/1^ + у2а2. Согласно §§ 1, 2 будут определе- определены длины всех векторов, понятие ортогональности, а по известной из элементарной аналитической геометрии формуле можно будет выра- выразить угол между векторами через их длины и скалярное произведение. При этом длины и углы, определенные посредством скалярного произ- произведения G), заданного в базисе ai, а2, совпадут с длинами и углами, определяемыми в элементарной планиметрии. Теперь на этой же плоскости наряду с ее естественной геометрией мы рассмотрим другую геометрию, введенную искусственно. Для этого наряду с базисом ai, а2 возьмем какой-нибудь неортонормированный базис ei, e2; см. рис. 42, где для удобства дальнейшего изложения мы берем в качестве е2 единичный вектор, а в качестве е\ — вектор длиною больше единицы и ортогональный вектору е2. Исходя из этого базиса, мы построим класс базисов по группе матриц D), т. е. по формулам E). Введем на плоскости новую квадра- е2 = «2 тичную метрику, определив скалярное произведение той же самой формулой G), но считая теперь, что ж1, ж2, у1, у2 — координаты векторов ж, у в ба- базисе ei, в2, изображенном на рис. 42. В новой метрике векторы ei, e2 Риг 49 ортогональны и имеют длины, равные 1 ии* ^* единице; также ортонормированным будет базис е^, е2>, определяе- определяемый формулами E) при любом значении в. Короче говоря, в новой мет- метрике повторится все, что говорилось до настоящего пункта. Но изоб- изображается все это с точки зрения старой метрики в искаженном виде. Например, единичная окружность, которая в базисе ei, e2 рис. 42 да- дается уравнением (х1J + (х2J = 1, в смысле старой метрики являет- является эллипсом. Произвольный ортонормированный базис, определяемый формулами E), составлен векторами ei/, e2>, которые в старой метри- метрике не ортогональны, а идут по двум сопряженным диаметрам эллипса (х1J + (х2J = 1. Чтобы убедиться в справедливости этих замечаний, достаточно установить метрический изоморфизм между евклидовой плоскостью с ее первоначальной метрикой и этой же плоскостью с ее новой метрикой. Согласно § 5 (см. доказательство теоремы 1) мы полу- получим метрический изоморфизм, если установим линейный изоморфизм, при котором базисы, изображенные на рис. 40 и 42, соответствуют друг другу. Ради наглядности будем считать, что евклидова плоскость дана в двух экземплярах Щ и Щ соответственно рис. 40 и рис. 42. Располо-
262 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Рис. 43. жим 111 и П2 в трехмерном евклидовом пространстве так, как изобра- изображено на рис. 43. Именно, совместим векторы, которые в плоскостях Щ и Щ обо- обозначены через в2 (что можно сделать, так как мы взяли эти векторы одной и той же длины, равной единице), после чего, поворачивая плос- плоскость П2 вокруг в2, приведем ее в такое расположение, чтобы концы векторов, обозначенных через ei, оказались на одном перпендикуляре к плоскости 111. Теперь каждому вектору х плоскости Щ мы поставим в соответствие такой вектор х' плоскости П2, который ортогонально проектируется на плоскость Щ в вектор х. Очевидно, это соответствие является линейным изоморфизмом; вместе с тем оно является метрическим изоморфизмом, так как ортонормированному базису плоскости 111 соответствует базис плоскости П2, ортонормированный в ее новой метрике. Из нашей конструкции сразу усматривается справедливость сделанных выше замечаний. Именно, что единичная окружность в новой метрике плоскости Щ является в ее старой метрике эллипсом; что базисы, ортонормированные в новой метрике, составлены векторами, которые идут по сопряженным диа- диаметрам этого эллипса. В качестве новых метрических свойств векто- векторов в плоскости П2 берутся свойства их прообразов в плоскости Щ (именно, в качестве нормы вектора в плоскости Щ берется норма его прообраза в плоскости Щ; в качестве скалярного произведения двух векторов на Щ берется скалярное произведение их прообразов 111). Отметим, в частности, что линейное преобразование /#, которое име- имеет в базисе ei, в2 плоскости Щ координатное представление F), есть поворот плоскости П2 в смысле новой метрики; в первоначальной же метрике это преобразование есть так называемый эллиптический по- поворот евклидовой плоскости. Название это связано с тем, что если па- параметр в изменяется, то образ х' = Iqx фиксированного вектора х описывает своим концом эллипс, проходящий через конец вектора х; различным векторам х, у, z отвечают эллипсы, подобные и подобно расположенные (см. рис. 44; все сказанное сейчас легко понять, если снова обратиться к рис. 43). На рис. 44 заштрихованы две фигуры, одна из которых переводится в другую некоторым эллиптическим по- поворотом. В геометрии, искусственно введенной нами на плоскости, эти
§7] ГРУППА ЕВКЛИДОВЫХ ПОВОРОТОВ 263 две фигуры следует считать одинаковыми (конгруэнтными), то есть наложимыми одна на другую. 10. Можно было бы базис ei, в2 взять совершенно произвольно и, считая, что х = xxt\ + ж2в2, у = у1е\ + У2^2, ввести скалярное произведение по формуле 2 (х, у) = g(x, у) = Y, ai3xiVJ I (8) где билинейная форма g(x, у) выбрана как угодно, лишь бы квадра- квадратичная форма g(x, x) была положительно определена. Из § 5 следу- следует, что мы получим двумерное пространство, метрически изоморфное евклидовой плоскости. Исполь- А' зуя положительную определен- определенность g(x, ж), нетрудно дока- доказать, что окружности, то есть линии ||ж||2 = g(x, x) = const Рис 44 на плоскости со скалярным произведением (8), с элементарной точки зрения являются эллипсами. Итак, мы видим, что на одной и той же плоскости можно задать бесконечно много различных евклидовых метрик. Чтобы более нагляд- наглядно представить себе это обстоятельство, следует заметить, что любой эллипс с центром в нулевой точке является единичной окружностью в одной (вполне определенной) евклидовой метрике. Таким образом, различных евклидовых метрик на плоскости «столько же, сколько» различных эллипсов с общим центром. 11. Разумеется в линейных пространствах большей размерности тоже можно вводить разные изоморфные между собой метрики. Так, например, в пространстве функций, непрерывных на отрезке [—1, 1], можно ввести скалярное произведение 1 (х,у) = J<p(t)x(t)y(t)dt, (9) -1 где ip(t) — произвольно выбранная положительная непрерывная функ- функция. Тогда вместо формулы A3) §4 будем иметь 2 = Jv(t)x2(t)dt. -1 Полученное пространство метрически изоморфно пространству непре- непрерывных функций со скалярным произведением A2) § 4, заданных на [— — 1, 1]. Метрическим изоморфизмом между ними является, например, отображение, переводящее x(t) в x(
264 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Отметим попутно, что пары функций, для которых обращается в нуль скалярное произведение (9), называют ортогональными с весом ip(t) на отрезке [-1, 1]. § 8. Группа гиперболических поворотов 1. Теперь мы займемся (двумерной) геометрией Минковского. Все наши построения будем вести на обычной евклидовой плоскости. Возь- Возьмем на ней ортонормированный базис ei, е2 и введем метрику Минков- Минковского с помощью квадратичной формы = (X 1\2 -О*2) 2\2 A) в базисе ei, e2. Соответственно имеем формулу для скалярного произ- произведения (ж, у) = х1у1 - х2у2. B) В этой метрике ||ei||2 = 1, ||е2||2 = -1, (ei, e2) = 0. Таким образом, базис ei, e2 является ортонормированным и в метрике A), при этом вектор е± оказывается единичным, вектор е2 — мнимоединичным. Чтобы сразу же почувствовать особен- особенность метрики A), целесообразно начать с рассмотрения единичной окружности. Так мы называем геометрическое место концов всевозможных векторов, нормы которых по абсолютной величине равны Рис. 45. единице (считая, что все векторы приложены к нулевой точке). В данном базисе единичная окружность определяется уравнением {(х1J - (х2J\ = 1. Отсюда либо (ж1J - - (ж2J = 1, либо (ж1J - (х2J = -1. В евклидовой геометрии два последних уравнения определяют в базисе ei, e2 сопряженные равно- равносторонние гиперболы, общими асимптотами которых служат биссек- биссектрисы координатных углов. Таким образом, единичная окружность в метрике Минковского состоит из двух евклидовых гипербол; на одной из них лежат концы единичных, на другой — мнимоединичных векто- векторов (рис. 45). В отличие от нашей терминологии единичной окружно- окружностью иногда называют только первую из этих двух гипербол, а другую — мнимоединичной. Рассмотрим произвольный вектор х = х1е± + ж2е2, идущий по какой-нибудь асимптоте этих гипербол; в этом случае \х1\ = |ж2|, сле- следовательно, ||ж||2 = 0. Таким образом, на асимптотах лежат изотроп- изотропные векторы, т.е. векторы с нулевой нормой.
ГРУППА ГИПЕРБОЛИЧЕСКИХ ПОВОРОТОВ 265 2. Важное замечание. На плоскости Минковского не соблю- соблюдается неравенство треугольника. Это сразу видно на примере тре- треугольника О АВ (рис. 46), где векторы О А и АВ изотроп- изотропны (параллельны асимптотам гипербол). Если обозначить О А = ж, АВ = у, то \\х + + 2/11 > \\х\\ + IMI = 0 или, в терминах расстояний, Р(О,В)> ¦р(А,В) = Рис. 46. Можно доказать, что в любом псевдоевклидовом пространстве найдутся три точки, для кото- которых аксиома треугольника не соблюдается. Доказательство предостав- предоставляем читателю. 3. Пусть ж, у — два неизотропных вектора. Предположим, что они перпендикулярны друг другу в смысле Минковского, и постараемся описать, что означает такая их перпендикулярность с евклидовой точ- точки зрения. Из B) мы имеем (ж, у) = ххух — х2у2 = 0; тогда ((ж1J — -{х2J)-{{у1J-{у2J) = -(х2у1-х1у2J. Отсюда следует, что ||ж||2 = = (х1J - (х2) 2\2 = (у1J — (у2J суть числа разных знаков. Зна- Значит, если один из векторов х, у имеет в метрике Минковского дей- действительную норму, то другой — мнимую; в евклидовом смысле это означает, что векторы ж, у либо их продолжения пересекают разные гиперболы (х1J — (х2J = ±1. Так как сейчас нас интересуют только направления векторов х,у,то без потери общности мы можем считать, что концы их лежат на единичной окружности метрики Минковского. Пусть, например, (ж1J - (х2J = 1, (з/1J - (у2J = —1. Если при этом (ж, у) = ххух — х2у2 — 0, то (у1 - х1J - (у2 — х2J = 0 и, обратно, из последнего соотношения следует (ж, у) = 0. Но равенство {у1 — — х1J — (у2 — х2J = 0 означает, что разность у — х векторов ж, у есть изотропный вектор, т. е. направлена по некоторой координатной биссектрисе. А это равносильно тому, что векторы ж, у симметричны относительно другой биссектрисы. Итак, векторы ж, у ортогональны друг другу в смысле Минков- Минковского в том и только в том случае, когда в евклидовом смысле они расположены на лучах, симметричных относительно какой-нибудь из координатных биссектрис (рис. 47). Заметим, что изотропный вектор х (лежащий на биссектрисе) ор- ортогонален сам себе; в самом деле, (ж, х) = ||ж||2 =0.
266 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII 4. Изложенное в предыдущем пункте позволяет дать евклидово описание всех базисов, ортонормированных в рассматриваемой метри- метрике Минковского. Именно, произвольный ортонормированный базис со- составлен векторами еу, еу •> концы которых лежат на гиперболах (х1 J — — (х ) = =Ы симметрично относительно одной из них (общих) асимп- асимптот (рис. 48). Рис. 47. Рис. 48. 5. Рассмотрим теперь /^-ортогональные матрицы (п = 2, к = 1), со- соответствующие двумерной метрике Минковского. Запишем любую из а таких матриц в виде Р = ности имеем а Р 7 S 7 о 1 О О -1 согласно определению &-ортогональ- а 7 в 5 1 О О -1 Отсюда а2 - Р2 =1, 7а - 5C =0, а7- /W = 0, 72-<*2 = 1. C) Найдем общее решение этой системы (трех уравнений). Вследствие второго уравнения системы C) мы можем написать 7 = А/3, 6 = \а, D) где А — новая неизвестная. Подставляя эти выражения в последнее уравнение, получим Таким образом, А = =Ы. С другой стороны, DetP = а Л/3 = Л(а2 -/З2) = Л. Следовательно, значениям А = =Ы соответствуют преобразования ба- базиса с сохранением или с нарушением ориентации.
§8] ГРУППА ГИПЕРБОЛИЧЕСКИХ ПОВОРОТОВ 267 Используем теперь уравнение а2 — /З2 = 1. Его общее решение имеет ВИД , E) где в — произвольный параметр. Однако можно считать, что если а > О, то a = ch#, /3 = sh#, -oo < в < +ос, Eа) а если а < О, то а = - ch 0, /3 = - sh 0, -ос < 0 < +ос, E6) поскольку остальные случаи E) сводятся к Eа) или E6) заменой в на -в. Формулы D), Eа) и E6) с учетом того, что А = =Ы, дают все ре- решения системы C). Тем самым найдены все /^-ортогональные матрицы при п = 2, к = 1. Подвергая исходный базис ei, е2 преобразованию с произвольной /^-ортогональной матрицей, мы получим новый базис е^, e<ir- ev = aei +/3e2,l е2, = je± + ?в2, J у которого вектор е^ является единичным: |Ы|2=а2-/32 = +1, а вектор в2' — мнимоединичным: Це2'||2 = 72-<52 = -1- Отсюда видно, что преобразование F) не может перевести вектор, ко- конец которого лежит на одной из гипербол (ж1J — (ж2J = =Ы, в вектор с концом на другой гиперболе. 6. Выясним евклидов геометрический смысл условий а > О и а < 0. Так как базис ei, e^ ортонормирован в евклидовой метри- метрике плоскости, то, беря евклидовы скалярные произведения, получим (ei/, ei) = а(еь ех) + /3(е2, ei) = a. G) Таким образом, при а > 0 векторы е^ и ei составляют острый угол, при а < 0 — тупой. Отсюда заключаем: если а > 0, то вектор е^ имеет конец на той же ветви гиперболы (х1J — (х2J = 1, что вектор е\ (на рис. 48 это — правая ветвь); если а < 0, то концы векторов ei, ву лежат на разных ветвях этой гиперболы. 7. Аналогично G) можно /3, j, S выразить через евклидовы ска- скалярные произведения векторов: Р = (ev, е2), 7 = (в2', ei), S = (е2', е2). Разные случаи расположения базиса еу, еу в зависимости от знаков А, а и Р показаны на рис. 49 и 50.
268 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ А = +1 [Гл. VIII р > о Р < О Рис. 49. Л = -1 р > о р < о Рис. 50. 8. Рассмотрим матрицы Р при Л = +1, а > 0. Согласно предыду- предыдущему ch в sh
ГРУППА ГИПЕРБОЛИЧЕСКИХ ПОВОРОТОВ 269 При переходе от ортонормированного (в метрике Минковского) бази- базиса ei, в2 к новому базису с помощью матрицы Р вида (8) получается ортонормированный базис еу, е2> с той же ориентацией, что и ei, е2\ кроме того, концы векторов еу, е2< лежат на тех же ветвях гипербол (ж1J — (ж2J = =Ы, на каких лежат концы соответствующих векторов ei, е2. В двумерной геометрии Минковского матрицы вида (8) играют такую же роль, что и матрицы D) § 7 в евклидовой двумерной геомет- геометрии. 9. Матрицы вида (8) составляют подгруппу всей /^-ортогональной группы при к = 1, п = 2. В самом деле, имеют место равенства sh 0i ch 6»i ch<9 she shO ch<9 ch#2 sh<92 ch#2 f#2) e2) <92) () ch(-0) Они легко устанавливаются и означают, что произведение матриц вида (8) и обращение матрицы вида (8) приводит к матрицам того же вида. 10. Преобразованию базиса по матрице Р отвечает преобразова- преобразование координат с матрицей Q = (Р*): х1' = x1ch0-x2sheA х2' = -xlshe + x2che. J С другой стороны, аналогично п. 5 § 7 мы можем считать, что базис ei, в2 не меняется, но что формулы (9) сопоставляют с произвольным век- вектором х = х1 е± + х2е2 новый век- вектор х' = х1 е\ + х2 е2. В этом смысле формулы (9) являются координатным представлением в базисе ei, e2 некоторого ли- линейного преобразования плоскости. Мы обозначим его Hq. По от- отношению к метрике Минковского это есть изометрическое преоб- преобразование, аналогичное повороту Рис. 51. х' = Iqx плоскости с евклидовой метрикой. Поэтому преобразование х' = Hqx называют гиперболическим поворотом плоскости; название «гиперболический» связано с тем, что при фиксированном х и при из- изменяющемся е конец вектора х' = Hqx скользит по гиперболе (х1J — -(х2J = \\x\\2 (рис.51).
270 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Пусть на плоскости задана произвольная геометрическая фигу- фигура W. Гиперболический поворот Но переводит ее в некоторую новую фигуру W. По определению считают, что фигуры W и W конгруэнт- конгруэнтны в метрике Минковского. В евклидовой метрике они, вообще говоря, не конгруэнтны (т.е. не наложимы). Простейший пример показан на рис. 52, где фигура и ее образ обозначены W и W' и показаны штри- штриховкой. 11. Мы убедимся сейчас, что аналогия между гиперболическим и обычным (евклидовым) поворотом идет весьма далеко. С этой целью выясним геометрический смысл параметра в в гиперболическом повороте х' = Hqx. Предположим для простоты выкладок, что х = {ж1, х2} — единичный вектор, т. е. что его конец лежит на гиперболе (ж1J - (ж2J = 1. Обозначим через S@) площадь криволинейного треугольника, который ограничен векторами ж, х' = Hqx и дугой гиперболы между их концами (рис. 53). Будем считать, что S > О, если поворот от х к х' происходит против часовой стрелки, S < 0 в противном случае. Пусть х" — Н/±$х'\ AS — приращение площади SF) при переходе от х' к х"] Лет — ориентированная площадь параллелограмма, построенная на векторах х' и х" (рис. 53). Тогда Рис. 52. Аа = 1' Л" х 2' = -{х1'J sh АО + (ж2'J sh АО = - sh АО; здесь использованы формулы (9) с заменой в на Д# и уравнение ги- гиперболы (ж1J - (ж2J = 1. С другой стороны, A<T shA0nA0, где приближенные равенства имеют место с точностью до величин выс- высшего порядка малости относительно Д#. Отсюда dS = ~\d0. Таким образом, если учесть, что S = 0 при в = 0, то получим равенство в = -25. Заметим, что когда совершается обычный (евклидов) поворот плос- плоскости на угол в, то каждый единичный вектор скользит концом по
ГРУППА ГИПЕРБОЛИЧЕСКИХ ПОВОРОТОВ 271 единичной окружности, причем угол в по абсолютной величине равен удвоенной площади, которую заметает поворачиваемый вектор. Как видно из только что приведенных выкладок, аналогичное явление име- имеет место и при гиперболическом повороте. Единичный (или мнимо- единичный) вектор скользит концом по одной из гипербол (ж1J — (ж2J = = =Ы и заметает площадь, равную по абсолютной величине половине «гиперболического угла» в. 12. Из формул (9) непосред- непосредственно видно, что гиперболический поворот имеет собственные векторы, направленные по (общим) асимптотам гипербол (ж1J — (ж2J = =Ы. В самом деле, если вектор х = {ж1, х2} лежит на первой асимптоте, то х1 = х2 Рис. 53. и тогда х1 = х2 ; таким образом, для первой асимптоты х' = Hqx = = \\х, где, как легко видеть, Ai =ch# -sh0. Аналогично для второй асимптоты х = {ж1, —х2} и х' = Hqx = А2ж, где А2 =ch0 + sh#. Существенно заметить, что AiA2 = 1. A0) При в > 0 имеем Ai < 1, А2 > 1; в этом случае плоскость сжимает- сжимается в Ai раз к прямой ж2 = —х\ и вследствие A0) во столько же раз растягивается в ортогональном направлении от прямой х2 — ж1, что показано на рис. 54 на примере нескольких точек. При этом все точки плоскости, не лежащие на инвариантных прямых х2 = dzx1, скользят по гиперболам (х1J — (х2J = const, что наглядно ясно (вследствие A0)) вне зависимости от рассуждений предыдущих пунктов. Если в < 0, то направления растяжения и сжатия меняются ролями сравнительно со случаем в > 0, и направление движения точек по гиперболам изменяется на противоположное. 13. Заметим в заключение, что на одной и той же евклидовой плос- плоскости можно задать бесконечно много различных метрик Минковско- го. Каждой из них соответствует своя пара сопряженных гипербол в качестве единичной окружности; обратно, любая пара сопряженных гипербол служит единичной окружностью для некоторой (вполне опре- определенной) метрики Минковского.
272 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Если гиперболы, составляющие единичную окружность некоторой метрики Минковского, не яв- являются равносторонними, то указанная выше евклидова характеристика ортогонально- ортогональности двух векторов в смысле Минковского (их симметрия относительно одной из асимп- асимптот) теряет силу. Более общим (во всех случаях верным) является следующее утверждение: два вектора ортогональны в данной мет- метрике Минковского в том и только в том случае, когда они идут по двум сопря- Рис. 54. женным диаметрам гипербол, составляющих в этой метрике единичную окружность. На доказательстве этого утверждения мы оста- останавливаться не будем. Снабжая плоскости различными метриками Минковского, мы по- получаем различные квадратично-метрические пространства. Но, разу- разумеется, все они метрически изоморфны друг другу. Их геометрии тож- тождественны с алгебраической точки зрения, поскольку имеют своим пред- предметом инварианты одной и той же /^-ортогональной группы. § 9. Тензорная алгебра в пространствах с квадратичной метрикой 1. Мы снова будем рассматривать квадратично-метрические про- пространства любой размерности. В этом параграфе мы изложим тензор- тензорную алгебру в таких пространствах. Точнее сказать, здесь будут ука- указаны специальные положения тензорной алгебры, связанные с наличи- наличием метрики. Заметим, что тензорный аппарат оказывается полезным во многих задачах теории квадратично-метрических пространств, осо- особенно в тех случаях, когда обстоятельства вынуждают употреблять произвольные (не ортонормированные) базисы. 2. Пусть Rn — линейное n-мерное пространство с заданной метри- метрической формой 11 т 11 — о~(т т\ — \ сг ¦ 1 тг т (Л\ IIх II — 8\х? х) — / ; ёгкХ X 1 \*-) где х — ^2 x%e% в произвольном базисе ei, ..., еп. Соответственно для скалярного произведения имеем: , у) = g(x, у) = У B)
§9] МЕТРИЧЕСКАЯ ТЕНЗОРНАЯ АЛГЕБРА 273 Тензор квадратичной формы A) или, что то же самое, билинейной формы B) называется метрическим тензором пространства Rn. Это есть ковариантный двухвалентный симметричный тензор, определяю- определяющие числа которого в базисе ei, ..., еп даются таблицей умножения базисных векторов: (ei, ej) = gij. 3. Матрицу метрического тензора в базисе ei, ..., еп, т.е. матри- матрицу формы B), обозначим G = ||#гА;||- Вследствие невырожденности формы g(x, у) имеем Det G ф 0. Поэтому существует обратная матри- матрица G~x. Элементы G~x по принятому стандарту обозначают буквами g с индексами сверху: о~г = \\gik\\. По определению обратной матрицы имеем Y,gtkgkj = 5). C) 4. Теорема 1. Величины glk являются определяющими числа- числами двухвалентного контравариантного тензора. Замечание. Утверждение теоремы означает, что при переходе к новому базису имеет место закон преобразования /*'=5><*Q{'Q*', D) где gl k — элементы матрицы, обратной матрице | \gi>kr \ | ковариантно- го метрического тензора в новом базисе. Равенство D) надлежит вы- вывести как следствие закона преобразования gi'k' = J2s^pi'p^ Da) который нам известен вместе с определением метрического тензора. Однако прямой вывод D), исходя из Dа), технически затруднителен. Поэтому далее дается доказательство теоремы, основанное на ранее изложенном признаке тензорных величин (см. гл. V, §4). Доказательство теоремы. Рассмотрим пространство Rn , сопряженное пространству /2П, и в нем базис е1, ..., еп, взаимный с базисом ei, ..., еп G Rn. Построим преобразование и = G(x), которое каждому вектору х = = ^2xkek ? Rn ставит в соответствие вектор и = ^п^ег G Rn по формуле Ui=Y^gikXk. E) Так как валентности здесь согласованы, то преобразование и = G(x) инвариантно. С другой стороны, ввиду того, что Det G ф 0, образом пространства Rn служит все пространство Rn. Это значит, что для каждого вектора
274 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII и Е Я* найдется такой вектор х Е Rn, что и = G(x). Этот вектор х однозначно определяется формулой X = ик. F) Для получения F) достаточно решить систему уравнений E), счи- считая хк неизвестными, U{ — известными числами. Формула F) показывает, что при свертке glk с произвольным кова- риантным вектором ии получается одновалентный контравариантный тензор. По известному признаку тензорной величины заключаем, что gtk _ тен3ор, валентности которого соответствуют расположению ин- индексов. Теорема доказана. 5. Тензор glk называется контравариантным метрическим тензо- тензором. 6. В пространствах с квадратичной метрикой удобно использовать вместе с данным базисом еще так называемый взаимный ему базис. Определение. Базисы е\, ..., еп и е1, ..., еп в Rn называются взаимными, если (ег, ej) = Sj. Замечание. В отличие от гл. V, здесь данный и взаимный ба- базис берутся в одном пространстве. Ниже будет показано, что понятие взаимных базисов в одном квадратично-метрическом пространстве по существу сводится к понятию взаимных базисов, лежащих в данном и сопряженном пространстве. На рис. 55 изображены взаимные базисы ei, в2 и е1, е2 на плоско- плоскости с обычной евклидовой метрикой. Согласно определению взаимных 62 - базисов мы имеем в этом случае четыре условия: (е1, ei) = l, (е2, ei)=0, (е1,е2) = (е2,е2) = Из них следует, что вектор е1 перпенди- перпендикулярен к вектору в2, а вектор е2 — к вектору е\\ кроме того, так как (е1, е\) > > 0 и (е2, ег) > 0, то векторы е1, ei, a Рис. 55. также е2, в2, составляют острые углы. Точный учет на рисунке условий (е1, е\) = 1, (е2, е^) — 1 требует задания масштабной единицы (этими условиями определяются длины векторов е1, е2 по данным векторам ei, e^). В двумерном евклидовом случае геометрически ясно, что данный базис однозначно определяет взаимный ему. Вместе с тем справедлива следующая общая теорема. Теорема 1. Для, произвольно заданного базиса ei, ..., еп в Rn взаимный базис е1, ..., еп определяется всегда и однозначно.
§9] МЕТРИЧЕСКАЯ ТЕНЗОРНАЯ АЛГЕБРА 275 Доказательство. Векторы искомого взаимного базиса можно представить в виде ек=^Лкаеа, G) где Ака — неизвестные числовые коэффициенты. Правую и левую части равенств G) умножим скалярно на е^. Учи- Учитывая, что (ек,е{) = 6%, (eoc,ei)=gai, (8) получим г)к — \^ Лка Р- ¦ Произведение неизвестной матрицы Л = ||Afea|| на известную невы- невырожденную матрицу G дает единичную матрицу Е = \\5к\\. Отсюда А = G, то есть Ака = gka. Таким образом, получаем единственно возможные равенства е* = $>*аеа. (9) Так как Det(gka) ф 0, то векторы е1, ..., еп, определяемые со- согласно (9), линейно независимы и, значит, составляют базис. Остается непосредственной проверкой убедиться, что этот базис действительно является взаимным с данным. Имеем (рк \_\^ ка/ р\_Г^> . _ zk \С> 1 е>г) — / J ё \еа? ег) — / J 8 ё oil — °i •> что и требуется. Теорема доказана. 7. Обращая формулы (9), получим ek = J2skaea. A0) 8. Умножая формулы (9) скалярно на ег, получим Отсюда находим таблицу умножения векторов взаимного базиса (e\ek)=gik. A1) Правые части этой таблицы дают определяющие числа контрава- риантного метрического тензора. 9. Пусть (ж, у) — произвольные векторы из Rn. Разложим их по взаимному базису, причем координаты по этому базису (здесь и в даль- дальнейшем) будем помечать нижними индексами. Умножая скалярно х на у и пользуясь формулами A1), получаем Одновременно имеем \\x\\2 = Y,gikXi*k. A3) Формулы A2), A3) взаимны с формулами B), A).
276 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII 10. Пусть даны два вектора х, и Е Rn. Разложим х по базису X = 2_^ х%ei- Вектор и разложим по взаимному базису е1, ..., еп\ и = ^икек. Составим скалярное произведение (и, х) = ^икхг(ек, е{) = ^икхг5к = ^икхк = иххх + • • - + unxn. Мы видим, что в координатах вектора х по данному базису, а вектора и — по взаимному базису скалярное произведение (п, х) выражает- выражается в виде свертки. Разумеется векторы и и х здесь можно поменять ролями; соответственно получим (и, х) = ихх\ + • • • + ипхп. 11. В пространстве Rn каждой линейной форме и(х) однозначно соответствует некоторый вектор и Е Rn так, что и(х) = (и, х). Иначе говоря, в Rn каждая линейная форма единственным образом пред- представляется в виде скалярного произведения. В самом деле, в базисе ei, ..., еп имеем и[х) — uix1 + • • • + ипхп', где ui, ..., ип — вполне определенные коэффициенты формы и(х). Отсюда и(х) = (и, ж), где и = ^ uie1 (е1, ..., еп — взаимный базис). 12. Линейные формы пространства Rn являются элементами со- сопряженного пространства R^- Согласно предыдущему пункту каждой форме и(х) G Я* отвечает вектор и G Rn так, что и(х) = (и, х). Очевидно, что это есть взаимно однозначное соответствие между /2* и Rn. Легко убедиться также в том, что оно представляет собой линейный изоморфизм. В самом деле, если и(х) = (п, х) и v(x) = = (v, х), то и(х) + v(x) = (и + v, х) и аи(х) = (аи, х), где а — любое число. 13. Мы можем теперь не различать /2* и Яп, если элементы /2* заменить их образами в Rn при только что указанном изоморфизме. Тогда каждый вектор из Rn одновременно является вектором из Д*. Соответственно говорят, что пространство с квадратичной метрикой является самосопряженным (Rn = R^)- Если х и и — любые векторы Дп, но один из них рассматривается как вектор из Дп, а другой — как вектор из /t^, то свертка их в смыс- смысле § 2 гл. V совпадает со скалярным произведением (и, х); при этом нужно считать, что ei, ..., еп G Дп, е1, ..., еп G Д*. 14. Пусть данный базис ei, ..., еп преобразуется с помощью мат- матрицы Р по формулам
§9] МЕТРИЧЕСКАЯ ТЕНЗОРНАЯ АЛГЕБРА 277 Если при этом вводится базис е1 , ..., еп , взаимный с новым бази- базисом в]./, ..., еп/, то е*'=Y,QU\ A5) где, как обычно, Q = \\Q]'\\ = (Р*). Доказывать формулы A5) нет необходимости. В самом деле, согласно п. 13 определение взаимных базисов в Rn сводится к определению взаимных базисов в Rn и /2*; поэтому для установления формул A5) достаточно сослаться на ре- результаты § 1 гл. V. 15. Пусть х — произвольный вектор из Rn. Мы можем разложить его как по базису ei, ..., еп, так и по взаимному базису е1, ..., еп: Из формул A4) и A5) следует, что при переходе к новому базису координаты хг преобразуются по контравариантному закону, а коор- координаты Xk — по ковариантному: Поэтому х1 и Xk называют, соответственно, контравариантными и ко- вариантными координатами вектора х. Из A6), (9) и A0) вытекают формулы хк =^2gkix\ A7) '***, A8) которые выражают (в данном базисе) ковариантные координаты век- вектора через его контравариантные координаты, а также контравари- антные координаты через ковариантные. Что касается самого вектора ж, то его в равной мере можно считать как контравариантным, так и ковариантным (поскольку /2* = Rn). Из сказанного в этом пункте следует, что каждый одновалентный тензор (контравариантный хг или ковариантный хи) можно инвари- инвариантным образом представить в виде вектора в Rn (^ xlei или ^ хиек). Одновалентные тензоры хг и х^ представляют собой один и тот же век- вектор в Rn в том и только в том случае, когда они связаны условием A7) или A8) (что безразлично, поскольку из A7) следует A8) и наоборот). 16. Теперь нетрудно сообразить, что в Rn и многовалентные тензо- тензоры можно по желанию задавать ковариантными, контравариантными или смешанными координатами. Пусть, например, а = ^2агке{ек — двухвалентный контравариантный тензор, т. е. элемент тензорного произведения Rn 0 Rn. Заменяя е/. согласно A0), найдем a =
278 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Положим A9) Тогда тот же тензор представится в виде т. е. в виде элемента тензорного произведения Rn ® /2*. Формулы A9) выражают такими словами: второй верхний индекс тензора а спущен с помощью метрического тензора. Из A9) и C) следует здесь нижний индекс снова поднят наверх. В тензорных выкладках иногда приходится многократно поднимать и опускать индексы (образно говорят — «жонглировать» индексами). Чтобы при этом не нарушить их первоначального расположения, мож- можно закреплять соответствующие места точками; например, в формуле A9) вместо агк лучше написать агк, чтобы подчеркнуть, что вниз спу- спущен второй индекс, а первый остался наверху. 17. Выше мы говорили, что go* и glk являются соответственно ко- вариантным и контравариантным метрическими тензорами. Однако вследствие формул C) и A0) имеет место тензорное равенство ike e = 2_^g егек. Поэтому лучше говорить, что есть один метрический тензор, a gik и glk суть его ковариантные и контравариантные координаты. 18. Пусть теперь дано, что Rn имеет положительный индекс к (О ^ к ^ п); пусть ei, ..., еп — ортонормированный базис в Rn при условии, что первые к его векторов единичные (остальные — мнимо- единичные). Тогда G = \\gik\\ = Ек = -1 о о -1 B0) (см. §3, п. 1). Отсюда G-1 = \\gV\\ = Ek=G. B1) Вследствие B1) базис е1, ..., еп, взаимный с базисом ei, ..., еп, также является ортонормированным и также имеет в качестве единич- единичных первые к векторов. Кроме того, из B0) и (9), или из B1) и A0),
§10] УРАВНЕНИЕ ГИПЕРПЛОСКОСТИ 279 следуют соотношения е'= а, * = 1, 2, ...,*; ег = —ei, г = к + 1, . . ., п. Таким образом, единичные векторы взаимных ортонормированных базисов соответственно совпадают, мнимоединичные — отличаются зна- знаком. Наряду с этим, согласно формулам A7) и A8), имеем JU JU о ч и J-ч ^ ч •••• *^1 хг = —Xi, г = к + 1, . . ., п. Аналогичные равенства имеют место для тензоров любой валент- валентности; мы напишем их в частном случае трехвалентного тензора, у ко- которого опускается первый индекс: af = aijl, г = 1, 2, ..., к; af = -aijl, i = Jk + 1, ..., п. 19. В следующем параграфе мы укажем некоторые примеры при- приложений тензорной алгебры в пространствах с квадратичной метри- метрикой. § 10. Уравнение гиперплоскости в пространстве с квадратичной метрикой 1. Мы будем здесь рассматривать аффинное квадратично-метри- квадратично-метрическое пространство, т. е. аффинное пространство il, соответствующее линейному пространству L с квадратичной метрикой (см. §2, п. 5). Пусть в il задана система аффинных координат с любым началом и произвольным базисом ei,..., еп. Пусть в этой системе координат дано уравнение какой-нибудь гиперплоскости + --- + Апхп + С = 0 или, коротко, + C = 0. A) При переходе к новому базису (с сохранением начала координат) мы имеем Отсюда Y, Лкхк + С = Y, АкР?,хк' + С = Y, Ак'Хк' + С, B) где положено Y? C)
280 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Последнее выражение в цепочке равенств B) представляет собой левую часть уравнения той же гиперплоскости в новой системе коорди- координат. Из B) и C) следует, что с левой частью уравнения гиперплоскости инвариантно сопоставлен вектор п = {Аи . .., Ап] с ковариантными координатами А\, ..., Лп, то есть, п = Л^1 Н \- Апеп, где е1, ..., еп — базис, взаимный с данным базисом ei, ..., еп. Что касается текущих координат х1, ..., хп произвольной точки плос- плоскости, то они по своему определению являются контравариантными, поскольку представляют собой координаты радиус-вектора этой точ- точки в данном базисе: х = xlei + • • • + хпеп. Согласно сказанному левая часть уравнения гиперплоскости может быть написана в инвариантном виде с помощью скалярного произве- произведения (п,х) + С = 0. D) 2. Если (#о, • • • •> хо) — какая-нибудь фиксированная точка гипер- гиперплоскости и хо — ее радиус-вектор, то С = — (п, #о), и уравнение D) принимает вид (п, х — хо) = 0 E) или в развернутой форме А^х1 - xl) + • • • + Ап(хп - О = 0. Из E) следует, что вектор п ортогонален к любому вектору х — хо, лежащему в гиперплоскости. Таким образом, вектор п есть нормаль к гиперплоскости, заданной уравнением A). Контравариантные координаты нормали, т.е. координаты векто- вектора п в данном базисе ei, ..., еп, даются формулами Ai = Y^glkAk, F) где glk — метрический тензор. 3. Задача. В двумерном пространстве в некоторой системе ко- координат дана метрическая форма прямая (одномерная плоскость) Зж1 + Ах2 + 10 = 0 и точка ЛA, 1). Найти основание перпендикуляра, опущенного на данную прямую из точки А в данной метрике.
УРАВНЕНИЕ ГИПЕРПЛОСКОСТИ 281 Решение. Имеем матрицу метрической формы: G = Отсюда G~x — 2 1 1 1 1 -1 -1 2 rii _ , следовательно, g±J- = 1, g22 = 2. Из уравнения прямой находим ее нормаль п = {3, 4} в базисе е1, е2. Чтобы получить координаты нормали в данном базисе ei, в2, применим формулы F) А1 = ёпАг + g12A2 = -1, А2 = §21Аг + g22A2 = 5. Отсюда получаем (в данной системе координат) уравнение перпен- перпендикуляра к заданной прямой, проходящего через ЛA, 1): х1 - 1 х2 - 1 -1 5 Решая это уравнение совместно с уравнением прямой M7V, найдем точку В B, —4) — искомое основание перпендикуляра. Рис. 56. Если на плоскости (ж1, х2) построен эллипс ||ж|| = 1 (единичная окружность в заданной метрике), то направления прямой MN и пер- перпендикуляра АВ являются сопряженными относительно этого эллипса вследствие пп. 9, 10 § 7 (рис. 56). Задача. В пятимерном псевдоевклидовом пространстве с поло- положительным индексом к = 3 дана гиперплоскость х1 + х2 + х3 + х4 + + ж5 = 1 и точка ЛA, 1, 1, 1, 1). Найти основание перпендикуляра, опущенного на эту плоскость из точки А. Известно, что система ко- координат определена ортонормированным базисом, первые три вектора которого единичные. Решение. Из уравнения гиперплоскости находим ее нормаль п = {1, 1, 1, 1, 1} в базисе е1, ..., е5. Отсюда п = {1, 1, 1, -1, -1}
282 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII в базисе ei, ..., е$ (см. §9, п. 18); таким образом, имеем уравнения перпендикуляра x1-l_x2-l_x3-l_x*-l_x6-l 1 ~ 1 ~ 1 ~ -1 ~ -1 Решая их совместно с уравнением данной гиперплоскости, найдем искомую точку: х1 = —3, х2 = —3, х3 = —3, х4 = 5, хъ — 5. § 11. Евклидово пространство. Ортогональные матрицы. Ортогональная группа 1. Определение. Евклидовым линейным пространством на- называется n-мерное линейное пространство с квадратичной метрикой при условии, что его метрическая квадратичная форма g(x, x) поло- положительно определена. Евклидовым называют также n-мерное аффинное пространство, если соответствующее ему линейное пространство является евклидо- евклидовым. В дальнейшем мы будем считать, что имеем дело именно с таким про- пространством. Тем самым мы сможем рассматривать и векторы, и точки. Евклидово n-мерное пространство будем обозначать Еп. Для нор- нормы вектора будем пользоваться символом модуля: \х . 2. В евклидовом пространстве имеет место неравенство Коши-Буняковского поэтому (х, Х)у/(у, у) причем равенство достигается тогда и только тогда, когда векторы х, у коллинеарны (линейно зависимы). Пользуясь этим обстоятельством, можно ввести угол между векто- векторами. Именно, если ж, у — ненулевые векторы, то углом между ними назовем число ip, определяемое формулой Заметим, что ip = 0 тогда и только тогда, когда векторы коллине- коллинеарны и одинаково направлены, a ip = тг означает, что векторы направ- направлены противоположно. Используя угол, можно записать скалярное произведение так, как это делается в элементарной векторной алгебре: (ж, у) = \х\ • \у\ -cos</?.
§11] ЕВКЛИДОВО ПРОСТРАНСТВО 283 3. В ортонормированном базисе ei, ..., еп имеем (ж, у) = х1у1 + х2у2 Н Ь хпуп. Таким образом, известные формулы аналитической геометрии для дли- длины вектора и скалярного произведения непосредственно переносятся в многомерный случай. 4. Для произвольного единичного вектора е можно ввести углы ai, ..., ап, которые он образует с векторами ортонормированного ба- базиса ei, ..., еп. Косинусы этих углов coso^, ..., cosan называются направляющими косинусами вектора е (в данном базисе). Нетрудно сообразить, что е = е\ cos а\ + е2 cos а2 + • • • + en cos an и что cos2 ai + cos2 а2 + h cos2 an = 1 в полной аналогии с хорошо известными соотношениями элементарной аналитической геометрии. 5. По определению n-мерное евклидово пространство является квадратично-метрическим пространством с положительным индексом к = п. В пространстве Еп каждый ортонормированный базис состоит только из единичных векторов (мнимоединичных нет). Если ei, ..., еп — произвольный ортонормированный базис в Еп, то новый базис будет также ортонормированным в том и только в том случае, когда матрица Р = ЦР^/Ц удовлетворяет условию /^-ортогональности при к = п (см. §6, равенство B)). Но при к = п матрица, обозначенная в § 1 символом Еь, превращается в единичную матрицу Е. Отсюда за- заключаем: в евклидовом пространстве преобразование A) ортонорми- ортонормированного базиса ei, ..., еп дает снова ортонормированный базис е^, ..., eni тогда и только тогда, когда РР* = Е. B) 6. Определение. Всякая п х n-матрица, удовлетворяющая усло- условию B), называется ортогональной. 7. Согласно § 6 ортогональные п х n-матрицы составляют подгруп- подгруппу в группе всех невырожденных п х п-матриц. Ее называют ортогональной группой п х n-матриц. Далее она обо- обозначается буквой О. 8. Множество всех ортонормированных базисов в данном евклидо- евклидовом пространстве Еп представляет собой не что иное, как класс базисов
284 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII по ортогональной группе, порожденный каким-нибудь одним ортонор- мированным базисом. Если дано линейное пространство Ln без метрики, то все базисы в Ln расслаиваются на классы относительно группы О. Каждый из этих классов можно считать состоящим из ортонормированных бази- базисов, если в Ln ввести некоторую вполне определенную евклидову мет- метрику, отвечающую именно этому классу. Евклидовы пространства, в которые превращается Ln заданием в нем таких метрик, будучи раз- различными, метрически изоморфны между собой. Их геометрии алгеб- алгебраически тождественны в том смысле, что имеют предметом своего рассмотрения инварианты одной и той же группы О. В § 7 аналогичные вещи были подробно изложены для двумерного случая. 9. Вследствие равенства B) (Det РJ = 1. Отсюда для каждой ор- ортогональной матрицы DetP = ±1. Таким образом, ортогональную группу можно рассматривать в ка- качестве подгруппы в группе матриц с единичным модулем определителя (как и все /^-ортогональные группы, что уже отмечалось раньше). Матрицы Р Е О, для которых Det Р = +1, составляют подгруппу О+ группы О. Матрицам из О+ соответствует преобразование ортонормирован- ортонормированных базисов с сохранением ориентации, что в некоторой мере анало- аналогично повороту (двумерного) базиса на евклидовой плоскости (см. § 7). Такие преобразования базисов в пространствах любой размерности при- принято называть вращением (вокруг неподвижного начала координат). В связи с этим группу О+ часто называют группой вращений (см. так- также §§7, 8 гл. IX). 10. Преобразованию ортонормированного базиса в Еп по форму- формулам A) п. 5 соответствует преобразование координат с матрицей Q = \\Qi\\ = (Р*). Вследствие равенства B) имеем Q = P. Таким образом, в евклидовом пространстве переходу от одного орто- ортонормированного базиса к другому по формулам A) с ортогональной матрицей Р соответствует преобразование координат с той же самой ортогональной матрицей: Q = Р. 11. Преобразование вида C) переменных ж1, ..., хп в переменные х1 , ..., хп называется ортогональным, если ортогональна его матри- матрица. Ортогональные преобразования переменных можно охарактеризо-
286 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Это есть подробная запись формул A) с помощью направляющих коси- косинусов новых базисных векторов. Вместе с тем выписана и матрица Р. Таким образом, любую ортогональную матрицу с помощью направля- направляющих косинусов можно записать в виде COS СУ i COS^i COS «2 COS P2 COS71 COS 72 р _ В связи с такой записью отметим следующее характеристическое свойство ортогональных матриц (присущее им и только им). Именно, в случае ортогональной матрицы сумма квадратов элементов одного столбца или одной строки равна единице (вследствие нормировки ба- базисов); сумма произведений соответствующих элементов двух столб- столбцов или двух строк равна нулю (вследствие ортогональности каждого из базисов). 14. Так как Р = Р*, то coscei cosce2 ... cosan cos Pi cos P2 ... cos Pn cos 71 cos 72 ... cos 7n 15. Из предыдущих двух пунктов и вследствие равенства Q = Р имеем формулы преобразования координат Ху = Xi COS Qi + Х2 COS /?i + • • • + Xn COS 71, Xn> — Xi COS an + X2 COS Pn + • • • + Xn COS Jn Обратные формулы Xi = Xy COS Qi + Xy COS OL2 + V Xn> COS an, xn = xy cos 71 + xy cos 72 + • • • + xni cos 7n получаются из условия Q~x — Q* (или Q~x — P). § 12. Нормальное уравнение гиперплоскости в евклидовом пространстве 1. Пусть в Еп дана система координат с произвольным базисом ei, ..., еп и в этой системе задано уравнение гиперплоскости здесь п = /Lie1 + • • • + Лпеп — нормаль гиперплоскости, е1, ..., еп — взаимный базис (см. § 10).
¦12] НОРМАЛЬНОЕ УРАВНЕНИЕ ГИПЕРПЛОСКОСТИ 287 Если в качестве п берется единичная нормаль по, а свободный член отрицателен (либо нуль), то уравнение A) при таких условиях назы- называется нормальным. Положив в этом случае свободный член С = — р (р ^ 0), напишем нормальное уравнение в виде (п0, х)-р = B) где х = ххе\ + • • • + хпеп — радиус-вектор текущей точки гиперплос- гиперплоскости. Чтобы привести общее уравнение A) к нормальному виду, доста- достаточно умножить его на нормирующий множитель т = ±—- \п\ выбрав знак с учетом условия тС < 0; тогда р = —тС > 0 (если G = 0, можно условиться брать т со знаком плюс). Очевидно, что По = тип а есть единичный вектор. Обозначим через ip угол между п0 и х] из B) п0 C) р = (п0, х) = \х\ cos (р. Как в элементарной аналитической геометрии, так и в многомерном евклидовом пространстве такая вели- величина называется проекцией вектора х на нормаль с положительным направ- Рис. 57. лением по вектору по- Вместе с тем, нетрудно сообразить, что р яв- является расстоянием от начала координат до гиперплоскости; в самом деле, из C) р ^ \х\ и р = \х\, если cosy? = 1 (ip = 0). Таким образом, р есть длина самого короткого из радиус-векторов, имеющих концы на данной гиперплос- гиперплоскости. Частный случай двумерной плоскости в трехмерном простран- пространстве показан на рис. 57. Если х* — радиус-вектор некоторой точки М*, не лежащей на ги- гиперплоскости, то число 6 = (по,х*)-р D) представляет собой расстояние от М* до данной гиперплоскости, взя- взятое с некоторым знаком (со знаком минус, если М* и начало коорди- координат О лежат по одну сторону от гиперплоскости, со знаком плюс, если М* и О лежат от нее по разные стороны).
288 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Чтобы убедиться в этом, рассмотрим текущую точку М гиперпло- гиперплоскости; если х — ее радиус-вектор, то из C) и D) 8 = (п0, ж*) - (п0, х) = = -(п0, х - ж*) = (п0, ATM), следовательно, \8\ ^ |М*М|, поэто- поэтому \8\ есть длина самого короткого из векторов М*М (см. рис. 58, на х* котором размерность пространства равна трем). ^ис* **"• 2. В частном случае, когда базис ei, ..., еп ортонормирован, взаимный ему базис совпадает с ним, и все рассмотренные соотношения получают полное сходство с хорошо из- известными фактами из элементарной аналитической геометрии. В этом случае ±1 т = а нормальное уравнение может быть написано в виде х\ cos а + х2 cos /3 + • • • + хп cos 7 — Р = 0, E) где cos a, cos/3, ..., cos7 — направляющие косинусы вектора по- В произвольном (косом) базисе форма записи E) нормального урав- уравнения не имеет смысла. Но принципиальная сторона задачи о приведе- приведении общего уравнения к нормальному виду и задачи о расстоянии от точки до гиперплоскости не усложняется. Нужно только иметь в виду, что нормирующий множитель следует вычислять по общей формуле т = F) (см. §9, п. 9). 3. Задача. На евклидовой плоскости дана прямая бж1 + 8х2 — — 5 = 0 и точка М*B, 1). Найти расстояние от данной точки до данной прямой. Метрический тензор известен: gn = 2, gi2 = #21 — 1, #22 = 1 (в заданной системе координат). Решение. Прежде всего проверим, что указанный метрический тензор определяет евклидову метрику. Имеем: 2(ж1J + 2ж1ж2 + (ж2J = = (х1J + (х1+х2J ^ 0, причем знак равенства здесь достигается толь- только в случае х1 = х2 = 0. Значит, метрический тензор действительно евклидов. Обращая матрицу G, найдем: g11 = 1, g12 = g21 = -1, g22 = 2.
§ 13] ОБЪЕМ ПАРАЛЛЕЛЕПИПЕДА Далее, А\ — 6, Л 2 — 8. Отсюда, согласно F), 289 Таким образом, 8 = -^т^- §13. Объем параллелепипеда в евклидовом пространстве. Дискриминантный тензор. Векторное произведение 1. Пусть метрика пространства Еп определена заданием в некото- некотором базисе ei, ..., еп метрической формы Положим g = Det ||#гА;||- Так как в Еп метрическая форма поло- положительно определена, то g > 0. Рассмотрим в Еп произвольный ориентированный паралле- параллелепипед П, построенный на векторах х±, ..., хп. Согласно § 5 гл. VI мы можем определить ориентированный объем V параллелепипеда П, полагая . . ., хп); A) здесь с — некоторая постоянная, общая для всех параллелепипедов. Выбор постоянной с означает выбор единицы объема. То обстоятель- обстоятельство, что в формуле A) использован дискриминант метрической фор- формы, поможет нам связать единицу объема с единицей длины. Именно, в качестве единицы мы возь- возьмем объем n-мерного куба с единичной стороной, иначе говоря, — объем паралле- параллелепипеда, построенного на векторах ортонормированного базиса. Пусть е°, ..., е° — какой-нибудь ортонормирован- = VgO = 1 О Рис. 59. ный базис, go — определитель метрической формы в базисе ej, ..., е°п. Очевидно, go = 1. С другой стороны, матрица, составленная из координат базисных векторов по этому же базису, является единичной; в базисе ej, ..., е\ имеем D(ei, . . ., е^) = 1. Наконец, по нашему условию объем парал- параллелепипеда, построенного на векторах ej, ..., е^, равен единице. В си- силу всех этих обстоятельств из формулы A) находим с = 1. Таким об- образом, при нашем выборе единицы объема V = B) 1Q Н.В. Ефимов, Э.Р. Розендорн
290 ПРОСТРАНСТВА С КВАДРАТИЧНОЙ МЕТРИКОЙ [Гл. VIII Отсюда следует, что объем параллелепипеда, построенного на ба- базисных векторах ei, ..., еп, дается формулой V = y/g. C) 2. Так как в ортонормированном базисе g = 1, то для ортонорми- рованных базисов формула B) приобретает более простой вид V = D(xu . . ., хп). 3. Соответственно формуле B) и согласно § 5 гл. VI имеем дискри- минантный тензор евклидова пространства в любом базисе ei, ..., еп ?ii...in =VgSi!...in. D) Так как дискриминантный тензор кососимметричен по всем индексам, то система равенств D) равносильна одному равенству: ?i2...n — yfg (поскольку Si2...n — !)• При п = 3 см. рис. 59. В ортонормированных базисах Si!...in = ^ii...in. 4. Всякое линейное подпространство L& размерности к, лежащее в Еп, само является евклидовым ^-мерным пространством. В самом деле, для L& определено скалярное произведение любой пары векто- векторов, поскольку оно определено вообще во всем пространстве Еп\ метри- метрическая форма |ж|2 положительно определена в L/,, поскольку |ж|2 > 0 для любого х G Еп, х ф в. 5. В силу сказанного в L& определен объем любого параллелепи- параллелепипеда (/^-мерный объем). Если в L& дана ориентация (заданием какого- нибудь базиса ai, ..., а&), то в Lfc определен также ориентированный объем ориентированных параллелепипедов. 6. Легко получить формулу, которая выражает ^-мерный объем параллелепипеда, построенного на произвольной системе независимых векторов а\,..., аи в Еп. С этой целью примем а\,..., а^ в качестве ба- базиса в линейной оболочке L& этих векторов. Метрический тензор под- подпространства Lk в базисе ai, ..., а/, имеет координаты 7ij = (&г5 dj). Отсюда и вследствие формулы C) , oi) (oi, o2) . • • (ai, a,k) , fli) (o>2, a2) . .. (a2, ak) = DetM м (аи, ai) (аи, a2) • • • (ak, ak) Таким образом, квадрат искомого /^-мерного объема дается опреде- определителем Грама векторов ai, ..., а&. 7. В заключение параграфа укажем одно применение дискрими- нантного тензора. Рассмотрим в трехмерном евклидовом пространстве векторное произведение z = [х х у] вектора х = ххе\ + х2в2 + х3е$ на вектор у = г/1 ei + ?/2е2 + у3е$. Оказывается, что ковариантные координаты векторного произведения z = zie1 + ^e2 + ^зе3 даются
¦13] ОБЪЕМ ПАРАЛЛЕЛЕПИПЕДА 291 следующей простой формулой: zi — 2^1 Ei<*px У ' (^) Из E) сразу же получается формула, которая дает контравариант- ные координаты векторного произведения, т. е. его координаты в дан- данном базисе ei, e2, ез: z — / jb bka!sJb У • \y) Подчеркнем, что формулы E) и F) позволяют вычислять векторное произведение в любом (вообще говоря, не ортонормированном) базисе. Для доказательства форму- рис go. лы E) заметим прежде всего, что обе ее части являются одновалентны- одновалентными ковариантными осевыми тензорами (левая часть есть осевой тензор ввиду определения векторного произведения, поскольку оно меняет знак при смене ориентации базиса; правая — ввиду участия дискри- минантного тензора, поскольку он является осевым). Равенства тензорных величин инвариантны, поэтому достаточно проверить E) в каком-нибудь специально выбранном базисе. Если х и у зависимы, то формула E), очевидно, верна, так как левая и правая ее части равны нулю. Пусть х и Возьмем базис с векторами е\ — х, в этом случае у независимы, первыми двумя е2 = у. В каче- ез О Z = [X Л 1 1 X У] = Se3 ^/ —-^ |ез| = Рис. 61. стве ез возьмем единичный вектор, ортогональный векторам ei, e^ (рис. 60). Тогда векторное произведение z — 5ез, где S — площадь параллелограмма (ei, 6%) (рис. 61). Из определения взаимных базисов е3 = ез. Поэтому z = Se3; значит, слева следует, что в данном случае е3 в E) мы имеем Z\ =0, Z2 = 0, = S. Так как х = ех = {1, 0, 0}, у = е2 = {0, 1, 0}, то Поэтому справа в E) имеем при г = 1, 2, 3 числа ?112 — 05 «^212 = 0, ?312 = ^123 = л/g • Но yfg есть объем параллелепипеда (ei, e2, ез). А так как вектор ез единичный и ортогональный к е± и е2, то этот объем равен площади S. Таким образом, ^J~g — S, и формула E) доказана. 10
ГЛАВА IX. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА § 1. Сопряженное преобразование 1. Рассмотрим в n-мерном (действительном) евклидовом простран- пространстве Еп линейное преобразование у = Ах. * Определение. Линейное преобразование у = Ах называется сопряженным данному преобразованию Л, если для любых х и z из Еп имеет место следующее равенство скалярных произведений: {Ах, z) = (ж, Az). A) 2. Теорема. По данному преобразованию А сопряженное преоб- * разование А определяется всегда и однозначно. Доказательство. Для данного вектора z будем искать век- вектор / так, чтобы соблюдалось равенство (Ах, z) = (х, /) B) * при любом х Е Еп. Найдя такой вектор /, положим Az = /. Нужно доказать, что / существует, определяется однозначно и линейно зави- зависит от z. С этой целью введем базис ei, ..., еп и взаимный ему базис е1, ..., еп. Положим х = ек\ тогда, если искомый вектор / существует, то (Aek,z) = (ek,f). C) Скалярное произведение (ек, /) равно координате fk вектора / в базисе еь ..., еп, поэтому из C) находим fk = (Аек, z)\ значит, искомым вектором / может быть только вектор Az = Y^{Ae\ z)ek. D) * Покажем, что если / = Az дается формулой D), то условие B) соблюдается для любого х G Еп. Разложим х по взаимному базису: х = х\ех + • • • + хпеп; подставив это разложение в левую часть равен- равенства B), получим (Ах, z) = 5>fc04efc, z) = Y,xkf = (х, /) = (х, Az). Здесь использовано выражение для скалярного произведения двух век- векторов, один из которых разложен по данному базису, а другой — по взаимному. * Проведенные выкладки дают формулу D) для вектора Az и по- * казывают, что другого значения для Az быть не может, так что су-
§ 1 ] СОПРЯЖЕННОЕ ПРЕОБРАЗОВАНИЕ 293 * ществование Az и его единственность установлены. Линейность пре- * образования Az вытекает из формулы D) и линейности скалярного произведения по аргументу z. Теорема доказана. 3. Выше в седьмой главе было доказано, что линейному преобра- преобразованию А соответствует смешанный тензор А\. В пространстве без метрики верхний и нижний индекс тензора никак не связаны между собой. Сейчас мы рассматриваем пространство с квадратичной метри- метрикой и можем поднимать и опускать индексы любого тензора согласно § 9 восьмой главы. Операции подъема и спуска индексов неоднократно ис- используются ниже. Поэтому мы должны принять соглашение о том, какой из индексов тензора Агк считать первым, а какой — вторым. Условимся, например, что верхний индекс тензора линейного пре- преобразования является первым, и наряду с символом А\ будем писать А\к (считая А\к = А\). Спустив верхний индекс, мы получим ковариантные координаты тензора преобразования Подняв нижний индекс, получим контравариантные координаты тен- тензора преобразования А 4. Пусть в произвольном базисе ei, ..., еп дана матрица А = = \\A\\\ = \\Аг/к\\ преобразования у = Ах. Найдем в этом же бази- * се матрицу сопряженного преобразования Л, которую мы обозначим \\Ак\\ = ЦА/.Ц. Для этого рассмотрим скалярное произведение (Ах, z) = ? gakAajXjzk. a,j,k Кроме того, рассмотрим другое скалярное произведение (ж, Az) = Y, SajXjAakzk. a,j,k Мы получили две билинейные формы, которые должны быть равны тождественно. Это возможно лишь тогда, когда совпадают все их ко- коэффициенты: а а Свертывая обе части равенства E) с контравариантным метрическим тензором gli и используя формулу C) §9 гл. VIII, получаем искомые * выражения элементов матрицы преобразования А: «kg^A%. F)
294 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX Вместе с тем это есть выражение тензора сопряженного преобразова- преобразования через тензор данного преобразования. Формулу F) можно записать короче: 5. Наиболее простой вид связи между данным и сопряженным пре- преобразованием получается в ковариантных координатах. Именно, из E) имеем Ajk = Akj. Таким образом, ковариантные координаты тензора сопряженного пре- преобразования равны ковариантным координатам тензора данного пре- преобразования с транспонированными индексами. Сопряженное преобразование является очень важным понятием; оно часто встречается в различных разделах математики и ее при- приложений. Поэтому понятие сопряженного преобразования положено в основу приведенной ниже классификации. 6. Выделим те преобразования, которые наиболее просто связаны со своими сопряженными преобразованиями: * 1) А — А — самосопряженные преобразования; * 2) А — —А — кососопряженные или косые преобразования; 3) А — А~х — эти преобразования, как мы покажем дальше, совпа- совпадают с изометрическими. В дальнейшем будет доказано, что любое линейное преобразование в евклидовом пространстве сводится к произведению самосопряженно- самосопряженного и изометричного преобразований; в связи с этим самосопряженные и изометричные преобразования мы исследуем особенно подробно. Косые преобразования играют важную роль в механике. Мы разбе- разберем геометрический смысл косого преобразования в трехмерном слу- случае (§6). § 2. Лемма о характеристических корнях симметричной матрицы 1. Пусть даны действительная матрица А — \\А^\\ и ее характе- характеристический многочлен р(Х) = Det(/L — ХЕ). Справедлива Лемма. Если действительная матрица А симметрична, то все корни ее характеристического многочлена действительны. 2. Доказательство. Пусть Л — произвольный корень много- многочлена р(Х). Тогда, во-первых, система ik - X5ik)xk = О, г = 1,.. ., п,
§3] САМОСОПРЯЖЕННЫЕ ПРЕОБРАЗОВАНИЯ 295 имеет ненулевое решение (х\, . . ., хп); во-вторых, число Л тоже яв- является корнем р(А), так как коэффициенты многочлена действитель- действительные (здесь Л — комплексное число, сопряженное числу Л; аналогичный смысл верхняя черта имеет и дальше). Докажем, что числа (afi, . . . . . ., ~хп) образуют решение (очевидно, нетривиальное) системы ik - X Sik)xk = О, г = 1,. . ., п. к В самом деле, согласно правилам действий над комплексными числа- числами, имеем ik - XSik)xk = Y^(Aik ~^Sik)xk = ^2(Aik - XSik)xk = 0. к к к Таким образом, к к Первое из этих равенств умножим на а^, второе на Х{ и просумми- просуммируем по г: Матрица А{к симметрична, поэтому i, к i, к i, к и, значит, XJ2\xi\2 = XJ2\xi\2. Но решение (xi, . . ., xn) не нулевое, т.е. ^ \xi\2 ф 0. Следователь- Следовательно, Л = Л. Таким образом, Л — действительное число. Лемма доказана. § 3. Самосопряженные преобразования 1. Самосопряженное преобразование А характеризуется условием А = А. Вследствие равенства E) § 1 матрица ||^4J^|| самосопряженного пре- преобразования, данная в произвольном базисе, характеризуется соотно- соотношением Отсюда Ajk = Akj. B) Таким образом, отличительным признаком самосопряженного преоб- преобразования является симметрия матрицы ковариантных координат его тензора.
296 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX 2. Вследствие A) матрица самосопряженного и только такого пре- преобразования симметрична в ортонормированном базисе: А\ = А\. Ина- Иначе говоря, в ортонормированном базисе условие самосопряженности преобразования выражается матричным равенством Л* = Л, где А — матрица преобразования, а звездочка — символ транспонирования. 3. Лемма 1. Все корни характеристического многочлена само- самосопряженного преобразования действительны. Доказательство. Мы знаем, что характеристические корни преобразования инварианты относительно изменения базиса. Перей- Перейдем к ортонормированному базису. Тогда матрица преобразования ста- станет симметричной, и утверждение леммы 1 последует из результатов предыдущего параграфа. Лемма 2 . Пусть е — собственный вектор самосопряженного преобразования Л, подпространство Le — ортогональное дополнение линейной оболочки вектора е. Тогда Ье является инвариантным под- подпространством для А. Доказательство. Пусть х Е Ье. Это значит, что (х, е) = 0. Вследствие самосопряженности (Ах, е) = (х, Ае). Воспользуемся тем, что е — собственный вектор. Имеем (Ах, е) = (х, Ае) = (х, Ае) = Х(х, е) = 0. Иначе говоря, Ах G Ье; лемма 2 доказана. Теорема. Для всякого самосопряженного преобразования най- найдется хотя бы один ортонормированный базис, состоящий из соб- собственных векторов. Доказательство проведем по индукции. В одномерном слу- случае всякий ненулевой вектор является собственным, поэтому для п = 1 теорема справедлива. Пусть п > 1 — любое натуральное число. Пред- Предположим, что теорема справедлива для всякого самосопряженного пре- преобразования в Еп-\. Пусть А — самосопряженное преобразование в Еп. Так как все корни Р(Х) действительны, то найдется хотя бы один собственный вектор е. Построим ортогональное дополнение Le линейной оболоч- оболочки вектора е. Подпространство Le имеет размерность п — 1 и являет- является инвариантным подпространством относительно преобразования А. Поэтому А можно рассматривать не на всем Еп, а только на Le, где А, очевидно, тоже является самосопряженным. По предположению ин- индукции, в Ье найдется ортонормированный базис в2, ..., еп, состоя- состоящий из собственных векторов. Добавим к нему единичный вектор е\, коллинеарный собственному вектору е. Вектор е\ ортогонален ко всем векторам в2, ..., еп, поэтому в результате мы получим искомый базис ei, в2, ..., еп. Теорема доказана.
САМОСОПРЯЖЕННЫЕ ПРЕОБРАЗОВАНИЯ 297 Следствие. Всякое самосопряженное преобразование в некото- некотором ортонормированном базисе приводится к диагональному виду. Как мы знаем, матрица А в этом базисе записывается так: А = О О C) где Ai, ..., An — совокупность всех корней характеристического мно- многочлена р(А) = (-1)И(А - Ai)(A - А2)... (А - А„); D) при этом собственное значение А& соответствует собственному векто- вектору Ck (базисному вектору с тем же номером к). 4. Лемма 3 . Собственные векторы, соответствующие различ- различным по числовому значению характеристическим корням, ортогональ- ортогональны друг другу. Доказательство. Пусть Ах = Х\х, Ау = Х2у, где Ai ф Х2. Первое равенство скалярно умножим на у, второе — на ж и вычтем одно из другого: (Ах, у) - (Ау, х) = Хх(х, у) - Х2(у, х) = (Ах - Х2)(х, у). Вследствие самосопряженности (Ах, у) - (Ау, х) = (Ах, у) - (у, Ах) = О, отсюда (х, у) = 0. Лемма 3 доказана. Лемма 4 . Если X — корень кратности т характеристического многочлена самосопряженного преобразования А, то Rang(/L — ХЕ) = = п — т, так что корню X соответствует т линейно независимых собственных векторов. Доказательство. Согласно п. 3 существует базис, в котором матрица преобразования А имеет диагональный вид C). В этом же базисе характеристическая матрица А — ХЕ имеет вид Ai - A Ао - А А- ХЕ = 0 E) Ап — А Пусть, например, Ai является корнем кратности т характеристи- характеристического многочлена D), то есть Ai = А2 = . . . = Хт, Am+i ф Х\, ... . . . ? Ап ф Х\. Тогда в матрице E) первые т диагональных элементов обращаются в нуль, а остальные диагональные элементы не равны ну- нулю, так что Rang(/L - \\Е) = п — т. F)
298 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX Согласно § 2 гл. VII равенство F) справедливо в любом базисе. Со- Согласно § 6 гл. VII корню Ai соответствует т независимых собственных векторов. Лемма 4 доказана. 5. Для построения ортонормированного базиса, состоящего из соб- собственных векторов самосопряженного преобразования, прежде всего нужно найти корни характеристического многочлена Ai, A2, ..., Ап. Все они вещественны, но могут быть кратными. Отметим, какие из них имеют одинаковые значения. Пусть, например, Ai имеет кратность т: Ai = A2 = . . . = Am = A , Am+i имеет кратность к: Am+i = ... = Am_|_& = А и т. д. Корню А' соответствует т линейно независимых собственных векторов ei, ..., em, координаты которых получаются из однородной линейной системы уравнений с матрицей А — \'Е. Линейную оболочку векторов ei, ..., ет обозначим Ь'ш. Подпространство Ь'ш инвариантно, и преобразование действует в нем как подобие с коэффициентом А'. Поэтому каждый вектор из Ь'ш является собственным. Выберем в Ь'ш произвольный ортонормированный базис ei, ..., ёт. Он может быть получен путем ортогонализации системы векторов ei, ..., ет или из каких-нибудь других соображений. Далее находим собственные векторы em+i, ..., em+^, соответству- соответствующие корню А"; обозначим через L'l их линейную оболочку. Подпро- Подпространство L'l является инвариантным, так же как и L'm. Выберем в L'j. произвольный ортонормированный базис em+i, ..., ёш+&. Векторы em+i, ..., em+k являются собственными векторами преобразования, соответствующими корню А". По лемме 3 каждый из этих векторов ортогонален любому вектору из L'm (иначе говоря, L'mLL'l). Следовательно, векторы ei, ..., em, em+i, ..., ет+^ вместе обра- образуют ортонормированную систему. Затем переходим к следующему корню, строим инвариантное под- подпространство соответствующей размерности и ортонормированный ба- базис в нем. Продолжая этот процесс, после конечного числа операций получим искомый базис. Пример 1. В трехмерном пространстве дан ортонормированный базис ei, в2, ез и в нем задано преобразование где ставить индексы у координат — сверху или снизу, безразлично, поскольку базис ортонормированный (см. гл. VIII, § 11, п. 12).
САМОСОПРЯЖЕННЫЕ ПРЕОБРАЗОВАНИЯ 299 Матрица этого преобразования симметрична: А = 1 2 -4 2 -2 -2 -4 -2 1 В ортонормированном базисе симметричность матрицы служит при- признаком самосопряженного преобразования. Построим ортонормированный базис из собственных векторов. Пи- Пишем систему ? j = 0. G) р(А) = = -(Л3-27Л-54). В данном случае она имеет вид A — X)xi + 2х2 — 2хх + (-2- \)х2 - -4ж1 - 2х2 + A - Составляем характеристический многочлен 1 - А 2 -4 2 -2-А -2 -4 -2 1-А Его корни Ai = 6, А2 = A3 = —3. Подставляя Ai = 6 в систему G), находим решение (вектор): ei={2, 1, -2}. Затем подставляем Х2 = Аз = —3. Получается система ранга один с двумя независимыми решениями. Эти решения нетрудно выбрать так, чтобы они давали ортогональные векторы: е2 = {1, 2, 2}, е3 = {2, -2, 1}. Нормируя все найденные собственные векторы, получим искомый базис: ei = {2/3, 1/3,-2/3}, е2 = {1/3, 2/3, 2/3}, ё3 = {2/3, -2/3, 1/3}. Матрица А преобразования А в новом базисе выписывается сразу без вычислений: она имеет диагональный вид; по диагонали стоят соб- собственные значения, идущие в том же порядке, в каком идут в базисе соответствующие им векторы: 6 0 0 А= 0 -3 0 0 0-3 Пример 2 . Размерность п = 2, базис ei, e2 произвольный. В та- таком случае должна быть задана его метрическая характеристика,
300 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX т. е. определяющие числа метрического тензора. Пусть gn = (еь ех) = 1, gi2 = (ei, е2) = 1, g2i = (е2, ei) = 1, #22 = (e2j e2) = 4. Базис «косой». Поэтому валентности существенны и нужно следить за правильной расстановкой индексов. Пусть дано самосопряженное линейное преобразование у = Ах: Требуется привести его к ортонормированному базису из собствен- собственных векторов. Прежде всего мы должны проверить, действительно ли соблюда- соблюдается условие самосопряженности. Именно, мы должны убедиться, что матрица А = А\ А\ 1 4 1 1 2 Л2 станет симметричной (см. B)) после того, как будут спущены индексы с помощью метрического тензора. Иначе говоря, тензор должен быть симметричен. Фактически достаточно сравнить две компоненты этого тензора: А\2 и А<ь\. Вычисляем их: = 5, ? = g21A{ + g22A\ = 5. a=l a=l Таким образом, А\ч — A<i\. Самосопряженность данного преобразова- преобразования установлена, и можно применять общую теорию. Система уравнений ^{Ак- — XSj)xj = 0 распишется так: Ах2 = 0, 1 A)^2 =0. J A - + Характеристический многочлен 1-А 1-А = А2 - 2А - 3 имеет корни Ai = —1, А2 = 3. При А = Ai получаем х1 = 2, х2 = — 1 и тем самым собственный вектор 1\ = {2, —1}. При А = А2 имеем собственный вектор \<i — {2, 1}.
4] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ 301 Эти векторы ортогональны в заданной метрике согласно лемме 3. Вычислим нормы этих векторов: Il'ill2 = ?^ia/i =4- ll'ill = 2; 1Ы|2 = $>«/з^ = 12, ||/2|| = 2л/3. Разделив векторы 1\ и 1^ на их нормы, получим искомый базис В этом базисе рассматриваемое преобразование имеет матрицу Л~ 0 3 В многомерном случае аналогичная задача требует гораздо боль- больших вычислений. § 4. Приведение квадратичной формы к каноническому виду в ортонормированном базисе 1. Мы знаем, что каждую квадратичную форму можно привести к каноническому виду в некотором базисе. Теперь задача ставится с дополнительным ограничением: решение нужно провести, не выходя из класса ортонормированных базисов. Пусть в ортонормированном базисе ei, ..., еп задана квадратичная форма /(ж, х) = У j CLijXjXj. Введем вспомогательное линейное преобразование у = Ах, которое в исходном базисе ei, ..., еп имеет такую же матрицу, как квадратич- квадратичная форма, т. е. А) = ац. В силу ортонормированности базиса имеем А1- = A{j (см. §9 гл. VIII). Кроме того, a,ij = а^. Значит, преобразование у = Ах будет само- самосопряженным, поэтому можно найти базис ei, ..., ёп, состоящий из собственных векторов этого преобразования. При переходе к базису ei, ..., ёп матрица преобразования у = Ах примет вид A = QAQ~\ а матрица квадратичной формы — А1 = РАР*. Но старый и новый базисы ортонормированные, поэтому матрица Р ортогональна; следовательно,
302 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX Отсюда следует, что и в новом базисе матрицы квадратичной формы и вспомогательного линейного преобразования совпадают: А' = А. В базисе вид ёп матрица преобразования А имеет диагональный о А = А. поэтому квадратичная форма запишется в каноническом виде ж, х) = Ь Здесь Ai, ..., Ап — характеристические корни преобразования Л, соответствующие его собственным векторам ei, ..., ёп. Вывод. С каждой квадратичной формой, заданной в ортонор- мированном базисе, естественно сопоставляется самосопряженное пре- преобразование. Приведение этого преобразования к ортонормированно- му базису автоматически вызывает приведение квадратичной формы к каноническому виду. 2. Пример. В ортонормированном базисе трехмерного евклидо- евклидова пространства дана квадратичная форма /(ж, х) = х\ + 4ж1Ж2 - — 2х\ — 1 2 -4 2 -2 -2 -4 -2 1 Требуется привести ее к каноническому виду также в ортонормирован- ортонормированном базисе. Решение. Матрица квадратичной формы А = В предыдущем параграфе был рассмотрен пример самосопряжен- самосопряженного преобразования именно с такой матрицей; поэтому мы можем вос- воспользоваться готовым результатом и записать ответ: /(ж, х) = 6xf — Ъх\ — Ъх\ в ортонормированном базисе ei = {2/3, 1/3,-2/3}, ё2 = {1/3, 2/3, 2/3}, ё3 = {2/3, -2/3, 1/3}.
§ 5 ] ПРИВЕДЕНИЕ ДВУХ КВАДРАТИЧНЫХ ФОРМ 303 § 5. Совместное приведение к каноническому виду двух квадратичных форм 1. Пусть в линейном пространстве (без метрики) фиксирован про- произвольный базис ei, ..., еп и в нем даны две квадратичные формы: /(ж, х) = ^2aikxlxk, g(x, x) = ^2,gikXlxk. Ставится вопрос, можно ли найти базис, в котором обе квадратич- квадратичные формы примут канонический вид. Теорема. Если хотя бы одна из двух квадратичных форм по- положительно определенная, то найдется базис, в котором обе формы получат канонический вид. Доказательство. Пусть положительно определенной являет- является форма g(x, x). Введем в линейном пространстве евклидову метри- метрику, приняв форму g(x, x) в качестве метрической. Если в получен- полученном евклидовом пространстве мы возьмем произвольный ортонорми- рованный базис, то метрическая форма g(x, x) получит нормальный вид. Затем перейдем к другому ортонормированному базису так, чтобы форма /(ж, х) привелась к каноническому виду. При этом нормальный вид метрической формы, очевидно, не нарушится. Теорема доказана. 2. При практическом совместном приведении двух квадра- квадратичных форм к каноническому виду нет необходимости поиски нуж- нужного базиса разбивать на два этапа, как это сделано в доказательстве теоремы. Согласно § 4 квадратичную форму можно привести к каноническо- каноническому виду, оставаясь в классе ортонормированных базисов. Такое приве- приведение осуществляется с помощью некоторого самосопряженного пре- преобразования. Факт самосопряженности преобразования не зависит от выбора базиса. Поэтому поступим следующим образом. Примем g(x, x) за метрическую форму и по коэффициентам фор- формы /(ж, х) будем искать в данном базисе вспомогательное самосопря- самосопряженное преобразование у = Ах. Его ковариантный тензор Aij должен быть симметричным и должен определяться тензорным равенством Aij = dij, которое справедливо в любом базисе. Теперь для нахожде- нахождения матрицы преобразования А нужно только поднять индекс тензо- тензора А^ с помощью метрического тензора: Лк' — V^ Л ¦ сгка — Х^ сгка п ¦ A\ Все величины в правой части этого равенства даны, поэтому дело свелось к нахождению собственных значений Ai, ..., Ап и ортонор- мированного базиса из соответствующих собственных векторов ei, ... . . ., ёп самосопряженного преобразования с известной матрицей ЦЛ^Ц; см. п. 5 S3.
304 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX 3. Можно сделать дальнейшие упрощения. Оказывается, что для нахождения векторов ei, ..., ёп и собственных значений Ai, ..., Ап нет необходимости подсчитывать Ак- = Ак-. В самом деле, учитывая A), мы имеем поэтому система уравнений ^2(Akj - XSk)xj = 0 C) при любом А эквивалентна системе 5>fei-Agfej>J'=0. D) Именно, вследствие A) и B) имеют место равенства / V ^^ i /\U a I гЛ> — / >ц 3 a 3 из которых, очевидно, вытекает эквивалентность систем C) и D). Таким образом, дело сводится к решению системы D). При этом вместо характеристического многочлена р(А) приходится рассматри- рассматривать многочлен q(X) = Det(akj - Xgkj). Но он имеет в точности те же корни (с учетом кратности), что и характеристический многочлен Действительно,вследствие B) q{\)=g-p{\) при любом А, где g = Det G ф 0. Таким образом, q(X) отличается от р(Х) только множителем, который не включает А. Поэтому q(X) то- тоже иногда называют характеристическим многочленом. Следует заме- заметить, что q(X) и система D) пишутся сразу по данным квадратичным формам. 4. Подведем и то г и . Итак, пусть в произвольном базисе ei,... . . ., еп даны две квадратичные формы: /(ж, х) = ^aijXlxJ, g(x, x) = ^gijXlxJ, причем g(x, x) — положительно определенная. Для совместного их приведения к каноническому виду решаем характеристическое урав- уравнение = Det(akj-Xgkj)=O.
ПРИВЕДЕНИЕ ДВУХ КВАДРАТИЧНЫХ ФОРМ 305 Пусть Ai, ..., А& — его корни (все они действительны). Эти корни поочередно подставляем вместо А в систему D) и для каждого корня находим решения {ж-7} этой системы, причем если крат- кратность корня А равна т, то найдется т линейно независимых решений (см. лемму 4 из §3). Эти решения нужно выбирать так, чтобы они об- образовывали ортонормированную систему в метрике g(x, х). Тогда все найденные решения дадут матрицу координат векторов искомого базиса ei, ..., ёп. Если нумерация правильна, т. е. вектор е& отвечает корню А&, то в базисе ei, ..., ёп данные квадратичные формы примут вид 5. Пример, п = 2; даны формы /(ж, х) = 2(х1J + Юх^2 + 8(ж2J, g(x,x)= (x1J+ 2х1х2+4(х2J. Привести их совместно к каноническому виду. Легко проверить, что g(x, x) — положительно определенная фор- форма; это видно, например, из равенства g(x, х) — (х1 + х2J + 3(ж2J. Совместное приведение возможно; его можно проводить по изложен- изложенному рецепту. Выпишем матрицы квадратичных форм F = 2 5 5 8 G = и составим характеристический многочлен q(X) = Det(F - XG) = 2-А 5-А 5- А 8-4А Его корни Ai = —1, А2 = 3. Система D) имеет вид B-А)^1 + E- Х)х2 =0,1 При А = Ai = —1 находим решение х1 = 2, х2 = — 1 и пишем его в виде вектора 1\ = {2, —1}; при А = А2 = 3 находим решение /2 = {2, 1}. Векторы 1\ и /2 ортогональны в метрике g, потому что они являются собственными векторами вспомогательного оператора, самосопряженного в метрике g, и соответствуют разным собственным значениям. Базис, в котором даны формы, не ортогональный в мет- метрике g. Поэтому ортогональность векторов 1\ и 1^ сразу не видна. Но для контроля вычислений читатель может убедиться, что (/i, /2) — Подсчитываем в метрике g нормы векторов 1\ и ^: ||/i|| = V^('i.'i) = 2, 1Ы| =
306 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX Нормируем базис: ei = {1, -1/2}, ё2 = {2/^12, 1/V12}. В базисе ei, ё2 квадратичные формы имеют вид Замечание. Векторы 1\ и /2 тоже образуют базис, в котором обе формы имеют канонический вид, но с другими коэффициентами при квадратах. Нормировка векторов 1\ и /2 в метрике g нужна для того, чтобы можно было выписать приведенные квадратичные формы без дополнительного вычисления их коэффициентов, используя най- найденные ранее корни характеристического уравнения. § 6. Кососопряженные преобразования 1. Напомним, что линейное преобразование z — Ay в евклидовом * пространстве называется кососопряженным или косым, если А — —А. Расписав это соотношение в каком-нибудь базисе, получим A.k — ~А.к- Поэтому условие того, что А является кососопряженным, в коорди- координатах (в произвольном базисе) записывается так: или Aik = -Аы. В ортонормированном базисе валентности тензоров равноправны, и матрица косого преобразования тоже будет кососимметричной. Заметим, что линейное преобразование всегда можно записать так, чтобы оно определялось ковариантными координатами. Для этого нуж- нужно аргумент у представить в данном базисе: у = у1е1 + у2е2 Н Ь упеп, а функцию z разложить по взаимному базису z = zie1 + z2e2 + • • • + znen. Тогда преобразование z = Ay записывается в виде где Aik — ковариантный тензор преобразования А.
§6] КОСОСОПРЯЖЕННЫЕ ПРЕОБРАЗОВАНИЯ 307 2. Докажем, что в трехмерном случае косое преобразование z — Ay можно представить в виде векторного умножения фиксированного век- вектора а на вектор у. Теорема. Если z = Ay — кососопряженное преобразование в трехмерном евклидовом пространстве, то существует единствен- единственный вектор а такой, что z = [а х у]. Замечание. Так как преобразование Ау инвариантно относи- относительно изменения базиса, то в равенстве Ay = [a x у] вектор а не инвариантный, а аксиальный (одновалентный аксиальный тензор). Доказательство теоремы. Мы знаем, что С другой стороны, если z = [a x у], то где Siak — дискриминантный тензор (см. гл VIII, § 13). Для того чтобы доказать теорему, нужно обеспечить следующие равенства: где Aik — данный тензор, A^i — —Aik (h k = 1, 2, 3), a = {a1, a2, a3} — искомый вектор. Для трех координат вектора а получилась систе- система девяти линейных уравнений. Нужно доказать ее совместность, ис- используя косую симметрию данного тензора Aik и специальный вид ле- левой части. Система уравнений записана в виде тензорного равенства, поэтому можно проверять равенство в любых координатах, и за счет специального выбора координат упростить задачу. Для этого восполь- воспользуемся следующим соображением. Определитель кососимметричной матрицы нечетного порядка все- всегда равен нулю. (В трехмерном случае, который мы рассматриваем, это свойство очевидно.) Поэтому билинейная форма соответствующая тензору Aik, является вырожденной, и ее нулевое подпространство имеет размерность не меньше единицы. Выберем ортонормированный базис ei, в2, ез так, чтобы вектор ез находился в нулевом подпространстве билинейной формы (в правом или в левом — безразлично). Тогда матрица Aik упростится следующим образом: О An О Агк = -An 0 0 0 0 0
308 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX Основная компонента дискриминантного тензора ?123 = 1, потому что базис ортонормированный. Отсюда, как легко подсчитать, 0 а3 2 — а -а3 0 а1 а2 -а1 0 Теперь очевидно, что для совпадения матриц ||Л^|| и || У^?iafcftQ1l нужно положить а = {а1, а2, а3} = {О, О, -А12}. Никакой другой вектор не пригоден. Теорема доказана. 3. Механическая интерпретация. Фиксируем в трехмер- трехмерном евклидовом пространстве точку О и проведем через нее прямую, коллинеарную вектору а. Примем эту прямую за ось вращения. Найдем распределение линейных скоростей точек твердого тела, вращающего- v = [а х у] ся вокруг этой оси с постоянной угловой скоростью и = \а\. Линейная скорость v зависит только от по- положения, которое движущаяся точка занимает в данный момент времени. Это положение характеризуется радиус- вектором ОМ — у (движущаяся точка тела проходит геометрическую точку М в пространстве). Скорость v орто- 0 тональна плоскости, в которой лежат Рис. 62. вектора а и у. Численная величина линейной скорости \v\ равна произведению угловой скорости |а| на рас- расстояние точки от оси вращения, а это произведение совпадает с пло- площадью параллелограмма, построенного на векторах а и у (рис. 62). Поэтому при надлежащем выборе ориентации базиса скорость любой точки вращающегося тела выражается формулой v = [a x у]. Таким образом, всякое косое преобразование Лу в Е% можно интер- интерпретировать как распределение скоростей равномерно вращающегося твердого тела: точка с радиус-вектором у имеет мгновенную линейную скорость v = Лу; вектор а угловой скорости (и тем самым ось враще- вращения) находятся согласно п. 2. § 7. Изометричные преобразования 1. Определение. Линейное преобразование / называется изо- метричным или изометрическим, если оно сохраняет норму любого вектора: \\1х\\ = \\х\\. A)
§7] ИЗОМЕТРИЧНЫЕ ПРЕОБРАЗОВАНИЯ 309 В дальнейшем будем считать, что речь идет о линейных преобра- преобразованиях в евклидовых пространствах. 2. Из определения вытекает, что если изометричное преобразова- преобразование существует, то оно невырождено, поскольку вырожденное преоб- преобразование должно какой-нибудь ненулевой вектор обратить в нулевой. Поэтому изометричное преобразование z = Iy имеет обратное преоб- преобразование у = I-1 z, которое тоже является изометричным. Замечание. Для обратимости изометричного преобразования существенно считать, что пространство конечномерно. 3. Теорема. Если I — изометричное преобразование, то Aх, 1у) = (х, у) для любой пары векторов х, у. Следствие. Поскольку изометричное преобразование сохраня- сохраняет нормы и скалярные произведения, то оно сохраняет также угол между любыми двумя векторами, т. е. угол между ними равен углу между их образами. Доказательство теоремы. Подставим в формулу A) сум- сумму х + у вместо вектора х и возведем обе части в квадрат: или A(х + у), 1(х + у)) = (х + у, х + у). Используя линейность преобразования /, получим Aх, 1х) + 2A х, Iy) + (Iy, Iy) = (х, х) + 2(х, у) + (у, у). Но здесь Aх, 1х) = \\Ix\\2 = (ж, х), (Iy, Iy) = \\Iy\\2 = (у, у), поэтому Aх,1у) = (х,у). B) Теорема доказана. 4. В дальнейшем будем считать, что рассматриваемое евклидово пространство является n-мерным и будем обозначать его через Еп. В формуле B) положим Iy = z. Тогда у = I~1z; отсюда (Ix, z) = (x, rxz). B1) Когда вектор у пробегает все пространство Еп, вектор z тоже про- пробегает все Еп вследствие невырожденности /. Таким образом, равен- равенство B') соблюдается для любых векторов х, z из Еп. Это значит, что Г1 = I. C) Замечание. Нетрудно проверить, что три условия A), B) и C) эквивалентны, т. е. каждое из них влечет два других.
310 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX 5. Соотношение C) можно переписать так: /*/ = //* = Е, где Е — тождественное преобразование. Отсюда следует, что матрица преобразования / является ортогональной в ортонормированном бази- базисе. Поэтому изометричные преобразования — это те и только те, кото- которые в ортонормированном базисе имеют ортогональные матрицы. 6. Пусть ei, ..., еп — ортонормированный базис; пусть + /2ie2 H h Ien = /inei + hn^2 H h Inn^ Векторы /ei, ..., Ien тоже образуют ортонормированный базис, так как изометричное преобразование переводит единичные векторы в еди- единичные, а ортогональные — в ортогональные. Согласно предыдущему матрица преобразования \\Iik\\ ортого- ортогональна. Таким образом, всякому изометричному преобразованию можно по- поставить в соответствие ортогональную матрицу, и всякой ортогональ- ортогональной матрице — изометричное преобразование. Для любой пары орто- нормированных базисов существует единственное изометричное пре- преобразование, переводящее один из данных базисов в другой. 7. Отметим некоторые свойства изометричных преобразований: 1) Если преобразование / имеет собственный вектор е, т.е. если /е = Ае, е ф 0, то А = =Ы (это сразу вытекает из сохранения нор- нормы вектора). 2) Det / = =Ы. В самом деле, определитель ортогональной матри- матрицы всегда равен =Ы, a Det / — инвариант; поэтому для доказательства этого свойства достаточно рассмотреть преобразование / в ортонорми- ортонормированном базисе. Если Det / = +1, то базисы ei, ..., еп и /ei, ..., Ien одинаково ориентированы, и мы имеем преобразование, аналогичное движению твердого тела. Если Det / = —1, то базисы ei, ..., еп и /ei, ..., Ien имеют раз- различные ориентации, и мы имеем преобразование типа зеркального от- отражения. 3) Если е — собственный вектор, Le — ортогональное дополнение линейной оболочки вектора е, то Le — инвариантное подпространство. Доказательство. Пусть х G Le, тогда (/ж, /е) = (ж, е) = 0. С другой стороны, (/ж, /е) = А(/ж, е), так что (/ж, е) = 0, то есть, 1х е Le.
ИЗОМЕТРИЧНЫЕ ПРЕОБРАЗОВАНИЯ 311 8. Рассмотрим примеры. Будем считать, что матрицы преобразо- преобразований выписываются в ортонормированных базисах. Ортогональность матриц (а следовательно, изометричность приведенных ниже преобра- преобразований) устанавливается несложной проверкой, которую мы предо- предоставляем читателю. 1) Тождественное преобразование является изометричным. 2) Зеркальное отражение n-мерного пространства относительно гиперплоскости х\ — О переводит произвольный вектор х = х\е\ + + Ж2в2 + • • • + хпеп в вектор 1х = —х\е\ + х^г + • • • + хпеп. Матрица этого преобразования имеет вид / = -1 О О 1 Подпространство х\ — О является инвариантным, индуцированное в нем преобразование — тождественным. 3) п = 1. В одномерном пространстве изометричное преобразование либо тождественно: 1х = ж, либо является зеркальным отражением: 1х = —х. Действительно, в одномерном случае матрица / состоит из един- единственного элемента /ц; учитывая второе свойство предыдущего пунк- пункта, находим /ц = Det ||/ц|| = ±1. 4) п = 2. Поворот плоскости на угол в является изометричным пре- преобразованием (см. §7 гл. VIII). 5) п = 3. Поворот пространства на угол в вокруг оси х% задается матрицей cos в — sin в О sin в cos в О О 0 1 Вектор ез является собственным, подпространства Ь(ез), L(ei, e^) — инвариантными. 6) Многомерным обобщением предыдущего примера является пово- поворот n-мерного пространства вокруг (п — 2)-мерного подпространства L(e3, . . ., еп): cos в - sin в sin в cos в 1 / = / = О О Подпространство Ь(ез, . . ., еп) остается неподвижным, в нем ин- индуцируется тождественное преобразование.
312 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX cos а sin а 0 0 — sin а cos а 0 0 0 0 COS/3 sin В 0 0 — sin cos 7) п = 4. Преобразование с матрицей / = можно рассматривать как одновременный поворот пространства Е± в двух взаимно ортогональных направлениях: на угол а вокруг плос- плоскости Ь(ез, 64), на угол /3 вокруг плоскости L(ei, e^). Плоскости L(ei, e<i) и Ь(е%, е^) являются инвариантными подпро- подпространствами. Если углы су, Р не кратны тг, то преобразование / не име- имеет собственных векторов, так как его характеристический многочлен р(А) = (A2 -2Acosc* + l)(A2-2Acos/3 + l) имеет лишь комплексные корни. 9. Чтобы лучше почувствовать специфику изометричных преобра- преобразований в пространствах, размерность которых больше трех, сравним последний пример с поворотом трехмерного пространства. Будем считать, что пространства вращаются равномерно, а матри- матрицы в примерах 5) и 7) п. 8 характеризуют поворот за единицу времени. Тогда поворот за время t в трехмерном случае задается матрицей cos Ot — sin Ot О sin Ot cos Ot 0 0 0 1 I(t)= матрицей cos at sin at 0 0 — sin at cos at 0 0 0 0 cos sin а в четырехмерном О О — sin/3t cos f3t Очевидно, что в трехмерном случае все точки оси вращения непо- неподвижны, а остальные точки пространства описывают окружности, у ко- которых центры лежат на оси вращения; плоскости этих окружностей перпендикулярны к оси вращения. Каждая точка совершает полный оборот за одно и то же время Т = 2тг/'0. В четырехмерном случае картина иная. Неподвижной точкой явля- является только начало координат. Точки инвариантных плоскостей L(ei, e<i) и Ь(ез, е^) движутся по окружностям с центром в начале ко- координат, но периоды обращения вокруг начала координат в этих двух плоскостях различны: в плоскости L(ei, е^) период 7\ = 2тг/се, в плос- плоскости Ь(ез, e±) период Тч = 2тг//3. Если углы а и /3 несоизмеримы, то каждая точка пространства, не принадлежащая ни одной из этих двух плоскостей, совершает движение по некоторой незамкнутой траекто- траектории, не имеющей самопересечений, и никогда не возвращается в ис- исходное положение. Действительно, для того, чтобы точка вернулась
КАНОНИЧЕСКИЙ ВИД ПРЕОБРАЗОВАНИЯ 313 в исходное положение, необходимо и достаточно, чтобы ее проекции на плоскости L(ei, е2) и Ь(е^, е±) одновременно вернулись в свои исход- исходные положения, что невозможно вследствие несоизмеримости перио- периодов 7\ иТ2. Если углы а и /3 соизмеримы, то периоды 7\ и Т2 также соизме- соизмеримы, и в этом случае траектории всех точек замкнуты, но они не будут, вообще говоря, окружностями. В этом случае период обраще- обращения точек, не принадлежащих плоскостям L(ei, е2) и Ь(е^, е^), равен наименьшему общему кратному периодов 7\ и Т2. § 8. Канонический вид изометричного преобразования 1. Теорема. Для каждого изометричного преобразования I в п- мерном евклидовом пространстве Еп существует ортонормирован- ный базис ei, ..., еп, в котором матрица преобразования имеет сле- следующий канонический вид: / = О О A) Через Iq здесь обозначена матрица поворота двумерной плоскости на угол в: cos в — sin в sin в cos в Знак ± перед первым диагональным элементом матрицы A) совпада- совпадает со знаком определителя преобразования. Клетки Iq1 могут отсут- отсутствовать вовсе {см. первые три примера п. 4 предыдущего параграфа) или же заполнять всю диагональ (см. пример 7 из п. 4 § 7). Доказательство теоремы см. ниже п. 8 этого параграфа. 2. Выясним геометрический смысл сформулированной теоремы. Нетрудно проверить, что матрицу A) можно представить в виде про- произведения О о о / = о о О B)
314 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX Формула B) показывает, что преобразование / сводится к следую- следующему. Если Det / = —1, то сначала совершается зеркальное отражение относительно гиперплоскости, которая в базисе ei, ..., еп имеет урав- уравнение х\ — О (если Det / = +1, то отражения не происходит). Затем линейная оболочка первых п—2к базисных векторов Ь(е±, . . . . . ., еп-2к) остается неподвижной, а все пространство последователь- последовательно поворачивается на углы в\, ..., #& вокруг (п — 2)-мерных подпро- подпространств L(eb . . ., en-2k, en_2fc+3, . . ., еп), ..., L(elj . . ., en_2). Все двумерные плоскости L(en_2^+i, en_2^+2), • • •, L(en_i, en), в на- направлениях которых происходят эти повороты, ортогональны между собой и ортогональны подпространству L(e\, . . ., еп-2к)- 3. Следствия из теоремы п.1. 1) Пусть изометричное пре- преобразование / имеет Det / = — 1. Тогда у него существует собственный вектор, а при четном п — по крайней мере два независимых вектора. 2) В двумерном евклидовом пространстве возможны лишь три вида изометричных преобразований: а) тождественное; б) зеркальное отражение относительно некоторого одномерного под- подпространства; в) поворот на угол в (О < в < 2тг). 3) В трехмерном евклидовом пространстве возможны лишь сле- следующие четыре вида изометричных преобразований: а) тождественное; б) зеркальное отражение относительно некоторого двумерного под- подпространства; в) поворот на угол 0 (О < 0 < 2тг) вокруг некоторого одномерного подпространства; г) произведение зеркального отражения относительно некоторого двумерного подпространства на поворот вокруг его ортогонального до- дополнения. 4. Переходим к доказательству теоремы, сформулированной в п. 1. Сначала (в пп. 5-7) установим вспомогательные предложения, которые имеют также и самостоятельный интерес. 5. Лемма 1. В действительном линейном пространстве L для любого линейного преобразования существует либо одномерное инва- инвариантное подпространство, либо двумерное инвариантное подпрост- подпространство, причем такое, что индуцированное в нем преобразование име- имеет положительный детерминант. Доказательство. Если характеристический многочлен р(Х) имеет действительный корень Ai, то, согласно §6 гл. VII, этому корню
КАНОНИЧЕСКИЙ ВИД ПРЕОБРАЗОВАНИЯ 315 соответствует собственный вектор, линейная оболочка которого явля- является инвариантным подпространством. Пусть р(Х) не имеет действительных корней. Тогда преобразова- преобразование А не имеет ни одного собственного вектора. В произвольном базисе ei,..., еп запишем соотношение (А—\Е)х = = в, подставив в качестве Л комплексный корень а + г/3 характери- характеристического многочлена р(Х). Получится однородная система линейных уравнений с неизвестными х1, ..., хп и с комплексными коэффициен- коэффициентами, которую в матричной форме можно записать так: C) -(a + iC)E) x1 xn = 0 0 Определитель системы C) равен нулю: Det(A - (а + ifi)E) = р(а + г/3) = О, поэтому система C) имеет нетривиальное решение Выделим у него действительную и мнимую части 1 +IZ1 X' и рассмотрим векторы izn = У1 уП + г z1 D) у = у1е1 z = z1e1 + упеп е L, \- znen G L. Теми же символами у и z будем обозначать элементы (у1, . . ., уп) и (z1, . . ., zn) координатного пространства Кп. Подставив решение D) в систему C), получим О : = (А - (а + ifi)E)(y + iz) = (Ay - ay + fiz) + i(Az - az - /3$/), 0 откуда Л?/ = аУ ~ fiz, Az = f3y + az. Равенства E) получены алгебраически как соотношения между эле- элементами координатного пространства Кп. Геометрически формулы E) выражают действие преобразования А на векторы у, z € L, записан- записанные в базисе ei, ..., еп. Но преобразование не зависит от выбора ба- базиса, поэтому E) можно рассматривать как инвариантные векторные равенства в пространстве L. E)
316 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX Покажем, что векторы у и z линейно независимы. Прежде всего, z ф 9, так как в противном случае первое из равенств E) означало бы наличие в L собственного вектора у (Ay = ay). Поэтому, если между у и z существует линейная зависимость, то У = jz. F) Подставив F) во второе из уравнений E), получим Az = (а + / что также противоречит отсутствию собственных векторов преобразо- преобразования А. Итак, у и z линейно независимы, их линейная оболочка L(y, z) дву- двумерна. Формулы E) показывают, что L(y, z) является инвариантным под- подпространством преобразования Л, и позволяют найти определитель преобразования, индуцированного в L(y, z). Этот определитель а -Р Р а поскольку Р заведомо отлично от нуля (иначе корень Л = а + %Р был бы действительным). Лемма 1 доказана. 6. Лемма 2 . Пусть в евклидовом пространстве Еп задано изо- метричное преобразование /, и пусть подпространство Е' инвари- инвариантно относительно I. Тогда ортогональное дополнение Е" подпро- подпространства Е' также является инвариантным подпространством. Доказательство. Лемма 2 следует из того, что изометричное преобразование невырождено и сохраняет ортогональность векторов. Действительно, если х Е Е'', у Е Е"', то (ж, у) = 0 и (/ж, 1у) = 0. Когда вектор х пробегает все подпространство Е1', его образ 1х также пробегает все Е' (см. п. 2 §4 гл. VII); значит, вектор 1у ортогонален подпространству Е' и потому входит в Е". Вектор у из Е" можно взять произвольно. Таким образом, 1{Е") С Е"'. 7. Лемма 3 . В двумерном евклидовом пространстве всякое изо- изометричное преобразование I с положительным определителем пред- представляет собой поворот на некоторый угол в. Доказательство. Возьмем ортонормированный базис ei, e<i- Пусть вектор 1е\ образует угол в с вектором е\. Так как длина 1е\ равна длине ei, то 1е\ получается из е\ поворотом на угол в. Вектор /в2 ортогонален /ei, и ориентация нового базиса /ei, Ie<i такая же, как у исходного (поскольку Det / > 0); следовательно, Ie<i получается из в2 поворотом на такой же угол в. Преобразование / сохраняет длины всех векторов и угол между любыми двумя векторами, поэтому все векторы поворачиваются на один и тот же угол в. В частности, при в, кратном 2тг, преобразование является тождественным.
КАНОНИЧЕСКИЙ ВИД ПРЕОБРАЗОВАНИЯ 317 8. Доказательство т е о р е м ы . Леммы 1 и 2 позволяют раз- разложить пространство Еп в прямую сумму одномерных и двумерных инвариантных подпространств. Именно, по лемме 1 существует инва- инвариантное подпространство Е^у, по лемме 2 его ортогональное допол- дополнение Е также инвариантно, к нему снова можно применить лемму 1 и т. д. В результате получим е = е{1) е#B) е...е#(р), G) где р = п — к (к — число двумерных подпространств в сумме G)). Будем считать, что в правой части формулы G) сначала выписа- выписаны одномерные подпространства, в которых преобразование / имеет собственные значения +1, затем одномерные подпространства, в кото- которых собственные значения равны —1, и, наконец, двумерные подпро- подпространства, в которых собственных значений нет (а определитель инду- индуцированного преобразования положителен в соответствии с леммой 1). Преобразования, индуцированные в двумерных подпространствах, вхо- входящих в сумму G), представляют собой повороты на некоторые углы #1, ..., Ok вследствие леммы 3. В каждом из подпространств i?(i), ... . . ., Е(р) выберем ортонормированный базис. Их объединение даст ор- тонормированный базис ei, ..., еп пространства Еп, поскольку все E(j) попарно ортогональны. В базисе ei, ..., еп матрица преобразова- преобразования примет вид О О (8) Заметив, что !* = C0S7T sinvr — sinvr C0S7T -1 0 0 -1 (9) мы можем четное число минус единиц, стоящих на диагонали матри- матрицы (8), заменить вдвое меньшим числом клеток вида (9). Геометрически это означает, что произведение двух зеркальных от- отражений плоскости относительно взаимно перпендикулярных прямых равно повороту плоскости на угол тг. Если число минус единиц нечетно, то одна из них не войдет в клетки вида (9), и ее можно переставить в начало диагонали, изменив нуме- нумерацию базисных векторов.
318 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX В результате матрица / примет вид A) (число к, вообще говоря, из- изменится по сравнению с формулой (8) за счет появления новых клеток вида (9)). Теорема доказана. § 9. Движение твердого тела с одной неподвижной точкой 1. Рассмотрим в трехмерном евклидовом пространстве движение твердого тела с одной закрепленной точкой О. Примем точку О за начало координат с ортонормированным базисом ei, e2, ез- Пусть произвольная точка тела в начальный момент времени зани- занимала положение М, а за время t переместилась в точку Mt. Положим ОМ = ж, 0Mt = у и обозначим через I(t) преобразование, которое вектору х ставит в соответствие вектор у: У = I(t)x. Твердое тело принимается как абсолютно недеформируемое. Геометрически это означает, что каждый прямолинейный отрезок, об- образованный точками тела, в процессе движения переходит в прямоли- прямолинейный отрезок такой же длины. Поэтому можно построить переменный ортонормированный базис citi e2t, е-ш-, движущийся вместе с телом, в котором координаты век- вектора OMt сохраняют постоянные числовые значения. Переход от базиса еь е2, е3 к базису еи, e2t, e3t при каждом фикси- фиксированном t задается некоторой ортогональной матрицей. Из сказанно- сказанного следует, что преобразование I(t) линейно и изометрично при каж- каждом t. В базисе ei, e2, е3 это преобразование запишется так: У к = Предположим, что определяющие числа Ika(t) являются диффе- дифференцируемыми функциями времени t. Найдем распределение линейных скоростей v точек тела в произ- произвольный момент времени t. Иначе говоря, мы хотим найти v для каж- каждой точки Mt, т. е. v как функцию от у. Для каждой точки имеем - + + - — 3 3 ^ • Таким образом, Символически это можно записать так: V = l'tX,
§9] ТВЕРДОЕ ТЕЛО С ОДНОЙ НЕПОДВИЖНОЙ ТОЧКОЙ 319 где 1[ — линейное преобразование, матрица которого получается диф- дифференцированием элементов матрицы / по аргументу t. Заметив, что х = 1~ху = 1у, получим искомую функцию в виде линейного преобразования 2. Преобразование А = 1[1 исследуем более внимательно. Най- * дем сопряженное ему преобразование А. Воспользуемся тем, что в ор- тонормированном базисе для перехода к сопряженному преобразова- преобразованию достаточно транспонировать матрицу, а транспонирование произ- произведения двух матриц осуществляется по известной формуле: (IftI*)* = _ (/*)*(/^)* Двукратное транспонирование приводит к исходной мат- матрице, а дифференцирование элементов матрицы по t, очевидно, пере- перестановочно с операцией транспонирования. Поэтому имеем матричные равенства А* = (ПП* = I(r)'t; A) С другой стороны, имеем равенство I(t) • I(t) = Е для преобразо- преобразований и вместе с тем равенство I(t)-I*(t) = E B) для их матриц, которые соблюдаются тождественно по t. Можно дока- доказать, что произведение матриц дифференцируется по такому же пра- правилу, как и произведение функций, поэтому из B) имеем: (II*)'t = I'tI* + I(I*)'t = E't = 0. C) Из A) и C) следует, что ^ Л + А = 0. Тем самым мы установили, что линейное преобразование v = Ау * является кососопряженным (А = —А). В § 6 было показано, что постоянное кососопряженное преобразо- преобразование дает мгновенное распределение скоростей тела, вращающегося с постоянной угловой скоростью вокруг некоторой неподвижной оси, и может быть представлено формулой v = [а х у]. В рассматриваемом случае преобразование А и вектор а зависят от времени. Вывод. Когда твердое тело движется, имея одну закрепленную точку О, то в каждый момент времени поле мгновенных линейных ско- скоростей его точек такое же, как если бы тело вращалось вокруг некото- некоторой оси с постоянной угловой скоростью, но эта ось и угловая скорость зависят от выбора момента времени.
320 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX В связи с этим вместо слов «движение тела с неподвижной точ- точкой» в механике часто употребляется термин «вращение тела вокруг неподвижной точки». Вектор а = a(t) называется угловой скоростью мгновенного вра- вращения тела. Прямая, проходящая через точку О в направлении векто- вектора &(?), называется осью мгновенного вращения тела. Изменение оси мгновенного вращения со временем можно наглядно проследить, наблюдая за вращающимся волчком. § 10. Кривизна и кручение пространственной кривой 1. Пусть в трехмерном евклидовом пространстве дана кривая S. Для наглядности будем считать, что S — траектория точки М, которая движется с единичной скоростью, т. е. за единицу времени проходит по S дугу, длина которой равна единице. При таком условии потраченное время численно совпадает с длиной пройденного пути. Эту длину мы обозначим через s и будем рассматривать как независимый аргумент. Вектор мгновенной скорости точки М обозначим через t. Он на- направлен по касательной к кривой S в сторону движения и является единичным, т. е. (*. *) = 1- A) Если линия не прямая, то вектор t меняет свое направление в простран- пространстве. Поэтому точка М испытывает ускорение, равное производной от вектора скорости, т. е. равное t's. Можно доказать, что скалярное произведение векторов дифферен- дифференцируется по такому же правилу, как произведение функций. Диффе- Дифференцируя равенство A) по s, находим, что ускорение ортогонально скорости: (t, t)'s = 2(t, О = 0. Положим k(s) = \t's\ и, считая, что k(s) ф 0, введем единичный вектор п, по направлению совпадающий с t's (рис. 63). Тогда t'8 = kn. B) Величина к носит название кривизны кривой в данной точке М. По опреде- определению к ^ 0. Вектор п называется вектором главной нормали, а плос- плоскость, проходящая через точку М параллельно векторам tun, назы- называется соприкасающейся плоскостью кривой S в точке М. Построим единичный вектор b = [t x n]. Он перпендикулярен к со- соприкасающейся плоскости и носит название вектора бинормали в точ- точке М (рис. 63).
§ 10] КРИВИЗНА И КРУЧЕНИЕ КРИВОЙ 321 Тройка единичных векторов t, n, b при каждом значении аргумен- аргумента s образует ортонормированный базис, естественным образом свя- связанный с геометрическими свойствами кривой в окрестности точки М. Базис t, n, b называется триэдром Френе. 2. Векторы триэдра Френе будем откладывать в пространстве от фиксированной точки О. Тогда при изменении аргумента s триэдр Френе вращается вокруг точки О как твердое тело. Вектор скорости мгновенного вращения триэдра Френе называется вектором Дарбу. Обозначим его через d = d(s). Для произвольного вектора п, твердо связанного с триэдром Френе, согласно результатам предыдущего параграфа имеем u's = [dxu]. C) В частности, t's = [dxt]. D) Посмотрим, как расположен вектор Дар- Дарбу по отношению к триэдру Френе. Введем обозначение а = (d, t), и из формулы D) найдем проекции вектора d на направления п и Ь. Для этого в равенство D) подставим разложение d = at + An + fib с неопределенными коэффициентами Л, /i. Учитывая, что t's = кп, получаем кп = a[t х t] + Х[п х t] + /л[Ь х t] = — Xb + /in, откуда Л = 0, /i = к. Итак, d = at + kb E) (рис. 64). Функция а = (j(s) называется кручением кривой S. Подставив вы- выражение E) в равенство C), получим u's = a[t х и] + k[b x и]. F) Формула F) показывает, что мгновенное вращение триэдра Френе раскладывается на сумму двух вращательных движений — вокруг ка- касательной и вокруг бинормали. Первая из этих компонент вращения имеет угловую скорость, равную кручению кривой, а вторая — угло- угловую скорость, равную кривизне кривой. Угловая скорость суммарного вращения триэдра равна |d| = Vk2 + a2. 3. Подставляя в формулу F) вместо и векторы п и 6, найдем разло- разложения их по базису ?, n, b. Вместе с соотношением B) эти разложения \\ Н.В. Ефимов, Э.Р. Розендорн
322 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX образуют так называемые формулы Френе t'8 = кп, n's = — kt + ah, b's = — an, имеющие важное значение в теории кривых. § 11. Разложение произвольного линейного преобразования в произведение самосопряженного и изометричного преобразований 1. Цель этого параграфа — любое линейное преобразование в ев- евклидовом пространстве представить в виде суперпозиции самосопря- самосопряженного преобразования и изометричного преобразования. 2. Определение. Самосопряженное преобразование А называ- называется неотрицательным, если (Ах, х) ^ О при любом х. Лемма 1. Если самосопряженное преобразование неотрицатель- неотрицательно, то все корни его характеристического многочлена неотри- неотрицательны. Замечание. То, что преобразование самосопряженное, здесь очень существенно: в этом случае мы заведомо знаем, что все характе- характеристические корни действительны. Доказательство леммы 1. Пусть Л — характеристический корень, х — соответствующий ему собственный вектор. Тогда Ах = = Хх и (Ах, х) = Х(х, х) = Х\\х\\2 ^ О, так как (Ах, х) ^ 0. Отсюда А ^ 0. Лемма 2 . Если А — неотрицательное самосопряженное преоб- преобразование, то найдется неотрицательное самосопряженное преобра- преобразование В такое, что А — ВВ. Замечание. Преобразование В называют квадратным корнем из преобразования А. Доказательство леммы 2. Вследствие самосопряженности преобразования А найдется ортонормированный базис, в котором мат- матрица А имеет диагональный вид: А = Al. 0 0 •• А„ По лемме 1 все А^ ^ 0, поэтому д/А7 — действительные неотрица- неотрицательные числа.
§11] РАЗЛОЖЕНИЕ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 323 В том же базисе определим преобразование В матрицей 41 "о"'- Базис ортонормированный, матрица В диагональная, поэтому пре- преобразование В самосопряженное (В = В). Из формулы для В ясно, что для матриц имеем соотношение В В = Л, поэтому такое же соот- соотношение справедливо и для преобразований. Запишем у = Вх в коор- координатах: У\ — v Ai#i, Уп — у Апжп. Отсюда (Вх, х) = (у, х) = Ж12/1 Н Ь жп?/п = л/\[х\ Н Ь л/Кх2п ^ О, так что преобразование Б неотрицательно. Лемма 2 доказана. Замечание. Рассмотрим скалярное произведение (Ах, х). Если эта квадратичная форма положительно определенная, то пре- преобразование А называется положительно определенным или положи- положительным. В этом случае А невырожденно, и все его характеристи- характеристические корни положительны. Из доказательства леммы 2 видно, что квадратный корень из положительного преобразования также являет- является положительным преобразованием. 3. В этом параграфе для обозначения сопряженного преобразова- преобразования мы будем ставить звездочку не сверху, а сбоку, как при обозна- обозначении транспонирования матрицы, то есть обозначать символом Л* преобразование, сопряженное А. Такая символика будет удобнее для выкладок, но при этом нужно помнить, что если той же буквой А обозначена матрица преобразования Л, то транспонированная матри- матрица Л* будет матрицей сопряженного преобразования Л*, вообще гово- говоря, лишь в ортонормированном базисе. Ниже нам понадобятся тождества, справедливые как для матриц, так и для преобразований: 1) (АВ)* = Б*Л*, 2) (Л*)* = Л, 3) (АВ)-1 =В-гА-\ 4) (Л*) = (Л)*. Сначала нужно проверить справедливость этих формул для мат- матриц (см. §§ 2, 3 гл. II), а затем рассмотреть все преобразования в ор- ортонормированном базисе. В таком базисе перечисленные формулы для преобразований сразу следуют из матричных равенств. 11 *
324 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX 4. Теорема. В п-мерном евклидовом пространстве Еп для лю- любого невырожденного линейного преобразования А существует самосо- самосопряженное преобразование В и изометричное преобразование I такие, что А = 1В. A) Замечание. Аналогично существуют самосопряженное преоб- преобразование В\ и изометричное 1\ такие, что А — В\1\. Доказательство теоремы. Рассмотрим преобразова- преобразование Л*Л. Оно является самосопряженным: (Л* Л)* = А*(А*У = А* А. Оно является невырожденным, так как Л по условию невырожденное. Кроме того, преобразование А* А является положительно определен- определенным: (А*Ах, х) = {Ах, Ах) = ||Лж||2 > О, если х ф д. По лемме 2 можно извлечь квадратный корень из преоб- преобразования А* А: VA*A = Б, А*А = ВВ, где В — положительно определенное самосопряженное преобразова- преобразование. Поэтому А = (А*)~1ВВ. Положив / = (Л*)Б, получаем для Л следующее представление: Л = IB. Остается доказать, что / — изометричное преобразование. Для этого вычислим /*, используя самосопряженность В: /* = Б*((Л*))* = 1 Далее имеем По построению преобразования В (А" А)-1 = так что /*/ = ВВ~1В~1В = Е, откуда и вытекает изометричность преобразования /. Теорема доказана. 5. Самосопряженное преобразование В в разложении A) будем на- называть существенной частью преобразования Л.
§ 12] ТЕНЗОР ДЕФОРМАЦИЙ И ТЕНЗОР НАПРЯЖЕНИЙ 325 § 12. Приложения к теории упругости. Тензор деформаций и тензор напряжений 1. Рассмотрим сплошную упругую среду. Зафиксируем в ней точ- точку О и выделим некоторый объем, содержащий эту точку. Предпо- Предположим, что в отсутствие внешних сил этот объем представляет собой шар U с центром О, а под воздействием внешних сил он деформирует- деформируется и смещается. Однако, отвлекаясь от параллельного перемещения в пространстве, мы можем считать, что точка О остается неподвижной. Произвольная точка М в шаре U характеризуется вектором х — ОМ. Пусть в результате деформации точка М переходит в положение М'. Положим ОМ' = у. Эксперименты показывают, что у = Сх + г(х), A) где С — линейное невырожденное преобразование с положительным определителем, а вектор г = г(х) при малом х представляет собой бесконечно малую высшего порядка, т. е. Нш Щ = О- B) Ию \х\ Если шар U мал, то вектором г можно пренебречь, и тогда вместо преобразования A) можно рассматривать линейное преобразование У = Сх. C) Замечание. Если соблюдается условие B), то линейное преоб- преобразование C) называется дифференциалом нелинейного преобразова- преобразования A). Линейное преобразование С при данной деформации упругой сре- среды зависит, вообще говоря, от выбора точки О. 2. По теореме, доказанной в предыдущем параграфе, линейное пре- преобразование С можно разложить на два сомножителя: С = 1С, где С — самосопряженное преобразование (существенная часть С), / — изометричное преобразование, причем Det / = +1. Преобразование С характеризует деформацию упругой среды вбли- вблизи точки О. Оно представляет собой сжатие по трем взаимно перпен- перпендикулярным направлениям и потому переводит шар U в некоторый эллипсоид V (рис. 65). Преобразование / характеризует поворот эллипсоида V как твер- твердого тела вокруг точки О (рис. 66). В большинстве реально встречающихся случаев эллипсоид V ма- мало отличается от шара U. Так, например, в металлах при нагрузках, не выводящих за пределы упругих деформаций, полуоси эллипсоида
326 ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВА ПРОСТРАНСТВА [Гл. IX V отличаются от радиуса шара U обычно только на доли процента. Поэтому преобразование С близко к единичному преобразованию Е, и его представляют в виде суммы С = Е + В. Здесь В (как нетрудно доказать) — тоже самосопряженное преобразо- преобразование. м М = С(М) =/1{ОМ) Рис. 65. Рис. 66. Пусть ei, в2, ез — ортонормированный базис. Запишем в нем мат- матрицу В = \\bij\\. Дважды ковариантный тензор bij называется тензором деформа- деформаций. з Величина 0 — ^ Ьц (след оператора В) называется коэффициен- коэффициентом изменения объема. Это название связано с тем, что собственные значения оператора В малы и отношение объема эллипсоида V к объе- объему шара U приближенно равно 1 + 0 (с точностью до величины порядка квадрата собственных значений оператора В). 3. При деформации упругого тела в нем возникают напряжения. Рис. 67. Проведем через точку О плоскость, ориентированную единичной нор- нормалью п, и рассмотрим малые точки упругой среды, примыкающие к этой плоскости вблизи точки О. Фактическое взаимодействие этих частей заменим приложенными к ним силами.
§ 12] ТЕНЗОР ДЕФОРМАЦИЙ И ТЕНЗОР НАПРЯЖЕНИЙ 327 Сила воздействия одной части упругого тела на другую, отнесен- отнесенная к единице площади сечения, называется напряжением в данной точке О при данной ориентации п и обозначается р (рис. 67). Зави- Зависимость напряжения р от направления п в данной точке О с высокой точностью выражается формулой вида p = F(n), где F — некоторое линейное преобразование, зависящее, вообще го- говоря, от выбора точки О. Пусть \\fij\\ — матрица преобразования F в ортонормированном базисе ei, в2, ез- Тензор fij называется тензо- тензором напряжений. 4. Если упругое тело однородно и изотропно, то есть имеет одина- одинаковые механические свойства во всех точках и по всем направлениям, а деформации достаточно малы, то связь между тензором деформаций и тензором напряжений дается законом Гука F = ХвЕ или в координатах fik = XOSik Здесь Л и /i — константы, характеризующие механические свойства упругой среды, в — коэффициент изменения объема (см. выше, п. 2).
ГЛАВА X. ПОЛИВЕКТОРЫ И ВНЕШНИЕ ФОРМЫ § 1. Альтернация 1. Пусть а, 6, с, ...— произвольные векторы данного линейного пространства L. Мы будем рассматривать произведения векторов из L, понимая эти произведения как контравариантные тензоры, т. е. как элементы линейных пространств Tq, Tq и т.д.; само L при этом есть Tq1 (см. главу V). Таким образом, например, a Е Tq1, ab G Tq , abc G Tq и т.д. Назовем альтернацией произведения векторов действие, которое, будучи обозначено квадратной скобкой, определяется следующими ра- равенствами: [а] = а, [ab] = -^(ab-ba), [abc] = —(abc + bca + cab — bac — acb — cba). Для любого числа произвольных векторов ai, а2, • • •, ^m ? L по- полагаем ш. v i 2 / где ^ означает сумму всех произведений, которые получаются из про- 1 изведения п\п2 . . . ат при четных перестановках индексов 1, 2, ..., т; 5^ имеет аналогичный смысл соответственно нечетным перестановкам. 2 Иначе можно написать [oiO2...Om] = —j5Z*i2J2.mJmflJiai2 - ..fljmJ A) //б. где сумма справа берется по всем индексам ji, J2, • • • ? Jm5 каждый из которых независимо от остальных пробегает все значения от 1 до т; ^1232т3т = +^' если jiJ2 . . . jm есть четная перестановка набора чисел 1, 2, ..., т; ^i2J2mJm — — 1? если jij2 • • • jm есть нечетная перестановка набора 1, 2, ..., m; ^i2J2.'mJm = 0> если среди значений ji, j2, ..., jm имеется пара одинаковых. 2. Альтернация произведений векторов обладает следующими свой- свойствами: 1) Линейность по любому сомножителю; например (по первому сомножителю), [(аа[ + /За")а2 . . . ат] = а[а[а2 . . . ат] + ^[о'/о2 . . . ат].
§ 1] АЛЬТЕРНАЦИЯ 329 2) Косая симметрия по любой паре сомножителей; например (по первой паре), [aiCL2(i3 . . . ат] = -[CL2CL1CL3 . . . ат]. Эти свойства легко усматриваются из определения альтернации; доказывать их мы не будем. 3. Если среди векторов ai, ^2, ..., ат имеется пара одинаковых, то [aid2 • • • dm] — 0; символом 0 здесь обозначается нулевой тензор про- пространства Т™. Утверждение ясно, так как при обмене местами оди- одинаковых векторов альтернация [а\п2 - - - dm] не меняется, но в то же время меняет знак. 4. Если векторы а\, d^,..., dm линейно зависимы, то [d\ d^ . . . am] = = 0. В самом деле, предполагая для простоты, что ai, ..., dk является максимальной независимой подсистемой системы векторов ai, ..., am, имеем a^+i = а\п\ + • • • + otkUk- Но отсюда по свойству линейности и вследствие п. 3 получаем [ai . . . am] = ai[di . . . a^ai . . . am] + h a^fai . . . a^a^ . . . am] = = ai -OH h«fc -0 = 0. 5. Будем далее предполагать, что данное пространство L является п-мерным. 6. Тогда, если m > n, то \a-\_a2 - - - dm] = 0 (утверждение непосред- непосредственно следует из п. 4). 7. Пусть х — произвольный тензор из Т$ . Согласно определению Т$ тензор х представляет собой сумму произведений некоторых векторов пространства L, содержащую к векторных сомножителей в каждом своем слагаемом. Напишем соответственно Ж = а«41) ...а« + ... + a[NLNK..aiN\ B) где df G L. Назовем альтернацией тензора х (х G Tq) тензор той же валентности, который, будучи обозначен через [х] ([х] G Tq), опреде- определяется равенством [х] = [а^М1)-а^)] + - + [а[К)а^...аП C) 8. Альтернация тензора не зависит от способа его записи в виде B). Иначе говоря, если х' = ж, то [х'\ = [х]. В самом деле, пусть х' = ь^ь{21К..ь^ + ... + ь[м)ь{2мК..ь[м\ D) тогда по нашему определению [х1] = [Ь^ЬР ... 6«] + • ¦ • + [b{MhiM) ... b[M)]. E)
330 поливекторы и внешние формы [Гл. X Допустим, что х' = х. Это означает, что сумма B) сводится к сум- сумме D) с помощью допустимых замен (см. гл. V). Но вследствие ли- линейного свойства альтернации, каждой допустимой замене в сумме B) отвечает точно такая же допустимая замена в сумме C). Поэтому сум- сумма C) сведется к сумме E) с помощью таких же допустимых замен, какие приводят сумму B) к сумме D). Таким образом, [xf] = [х]. 9. Имеет место тождество [[а1а2 . . . ат]] = [oio2 . . . am], F) то есть повторная альтернация произведения векторов совпадает с пер- первоначальной. Убедимся в справедливости тождества F) сначала в двух простей- простейших случаях т = 1 и т = 2. Здесь тождество очевидно: = у ( 2[(aifl2 - fl2fli) - ^y(«2«i - a1a2)j = = — (aid2 - CL2CL1) = [^1^2]. В общем случае имеем, согласно A) и C), [[0102... am]\ = ^ ? st:im [°л • - • o*J- G) Но легко видеть, что в сумме, написанной здесь справа, все слагае- слагаемые одинаковы и каждое из них равно [а±а2 . . . аш]- В самом деле, ввиду косой симметрии по любой паре верхних индексов величины ^i!.'.mm и ВВИДУ косои симметрии по любой паре индексов альтернации [dj! . . .djm] мы можем в каждом слагаемом суммы G) обменять ме- местами любую пару индексов в наборе j\ . . . jm; слагаемое при этом не изменится. Значит, во всех слагаемых, не меняя их, можно привести индексы к натуральному расположению. Так как <Jj;;;JJJ = 1, то каждое слагаемое сведется к [aici2 . . . am]. Поскольку число слагаемых в сумме равно т!, то из G) вытекает F). Замечание. Теперь ясно, почему при определении альтернации выгодно брать не просто алгебраическую сумму произведений векто- векторов, а эту сумму, деленную на т\. 10. Вследствие тождества F) имеем для любого тензора х G Tq 11. Если к > п, то для любого х G Tq имеем [х] = 0 (см. п. 6).
§ 1] АЛЬТЕРНАЦИЯ 331 12. Пусть ei, в2, ..., еп — базис в L. Тогда, как мы знаем, все- всевозможные произведения е^е^2 . . . eik составляют базис в Т$ и для любого тензора х G Т$ имеет место разложение ¦22 ' ' •' Отсюда получаем выражение альтернации тензора х в данном (про- (произвольном) базисе \rr\ — L J Ж J L. - -1- -^J "/\/J 13. Мы будем дальше употреблять символ <^*'"/*, понимая его сле- следующим образом. Будем считать, что индексы ii, ..., г&, ji, ..., j^ принимают любые значения из набора 1, 2, ..., п (где п — размерность пространства L); число всех нижних индексов (или верхних), то есть, число к может быть любым. Если все численные значения ii, ..., %k различны, то SJl'jk = +1 в том случае, когда j\ . . . jk есть четная перестановка набора чисел ii, ..., г&; дЦ"^ — ~1? если Ji • • -jk есть нечетная перестановка набора ii, ..., %k\ во всех остальных случаях ($^'"/* = 0. Таким образом, ^"/^ = 0, если среди численных значе- значений ii, ..., %k (или ji, ..., jk) имеется пара одинаковых или если среди численных значений ji, ..., jk есть такое, какого нет среди ii, ..., %k (и наоборот). В частности, SJl'jk = 0 в случае к > п. Согласно высказанному определению множество чисел 8Ц'"^к об- обладает косой симметрией как по верхним, так и по нижним индексам. Иначе говоря, при обмене местами двух верхних индексов или двух нижних индексов ЗЦ'"^ меняет знак. 14. Легко убедиться, что из формулы A) следует равенство (9) где индексы ii, ..., %k фиксированы, а сумма справа берется по всем значениям индексов ji, ..., jk из набора 1, 2, ..., п. Тем самым правая часть (9) есть разложение тензора [е^ . . . е^ J по базису в простран- пространстве Т^] числа -^ЬЦ'1 (при фиксированных ii, ..., ik) являются ко- координатами этого тензора. 15. Перепишем формулу (8) с помощью формулы (9): Введем обозначение
332 поливекторы и внешние формы [Гл. X Иначе говоря, мы полагаем = х\ xjki + xkij - xjik - xikj - x = (x Согласно A0) получаем Y[jl-Jk]eh...ejk. A1) Операция, которая определена равенством A0), называется альтер- альтернацией координат тензора х; ее также называют альтернацией индек- индексов ji, ..., 2к- С ней мы уже встречались в гл. V. Сравнивая (8) и A1), мы видим, что для получения альтернации тензора х можно поступить любым из двух способов: 1) либо в разложении тензора х заменить все произведения базис- базисных векторов е{г . . . в{к их альтернациями [е^ . . . е^ J, оставив прежние коэффициенты хг1~Лк] 2) либо коэффициенты хг1"Лк заменить соответствующими альтер- альтернациями х^п"Лк\ оставив без изменений произведения базисных век- векторов е{г . . . eik. Равносильность этих операций мы покажем ради на- наглядности еще раз в частном случае к = 2. Если х = ^ x^e^ej, то = 2! ^2 xiJ6i6j ~ 2! 5- xiJ6j6i = = 2\2-^х eiei~2\2-^x eieJ = 2-^x eiej- 16. Равенство A1) является разложением тензора [х] по базису в Tq . Следовательно, альтернации х^1'"^^ координат тензора х суть координаты его альтернации [х]. 17. Из A0) следует, что альтернации х^1'"^^ координат произволь- произвольного тензора х G Tq обладают косой симметрией по любой паре ин- индексов. 18. Определение. Тензор х (х G Ток) назовем косым, если [ж] = х. Из этого определения и из п. 16 следует, что для координат косого тензора имеют место равенства Таким образом, координаты косого тензора обладают косой сим- симметрией по любой паре индексов. Обратно, если координаты хгг"Лк
§ 2] ПОЛИВЕКТОРЫ. ВНЕШНЕЕ ПРОИЗВЕДЕНИЕ 333 какого-нибудь тензора х Е Tq обладают косой симметрией, то из A0) получим A2) (точно такими же рассуждениями, какими было доказано тождество F) в п. 9); отсюда [х] = х. Таким образом, определение косого тензора х посредством условия [ж] = х равносильно определению по свойству косой симметрии его координат (см. гл. V, §8). Замечание. Так как для любого тензора х из Tq1 имеет место равенство [х] = ж, то все одновалентные тензоры следует относить к числу косых. § 2. Поливекторы. Внешнее произведение 1. Рассмотрим множество ??, элементами которого являются все контравариантные косые тензоры всевозможных валентностей (в том числе одновалентные), заданные над n-мерным линейным простран- пространством L. Определение. Внешним (или альтернированным) произведе- произведением косых тензоров ж, ?/, х Е Tq, у Е Tq называют тензор простран- пространства Т^+/, который обозначается символом х А у и выражается фор- формулой Квадратными скобками обозначена альтернация обычного произведе- произведения тензоров ху. В частном случае двух произвольных контравариантных векторов ж, у Е L имеем х Л у = ху — ух. 2. Альтернация всегда дает косой тензор, поэтому внешнее умно- умножение не выводит из множества Q. Нетрудно проверить, что совокуп- совокупность косых тензоров данной валентности m образует подпространство в Tq1 , которое мы обозначим Gm; таким образом, сложение тензоров и умножение их на числа также не выводит за пределы множества Q. Ненулевые тензоры, входящие в Q, считаются равными элемента- элементами этого множества тогда и только тогда, когда они принадлежат од- одному пространству Т™ и равны как элементы Т™. Кроме того, в Q входят нулевые элементы пространств Т™ при всех натуральных т. Нулевые тензоры всех валентностей считаются равными элементами множества б; будем обозначать их символом 0. Очевидно, что жЛО = 0 для любого х G Q. Согласно п. 6 §1 имеем х Л у = 0, если х G Tq , у еТ^ k + l > п.
334 поливекторы и внешние формы [Гл. X 3. Множество Q с указанным выше равенством элементов и опреде- определенными в нем операциями внешнего умножения, умножения на число, а также сложения тензоров одинаковых валентностей будем называть алгеброй Грассмана над пространством L1). Контравариантные ^-валентные косые тензоры, рассматриваемые как элементы алгебры Грассмана, называются контравариантными к- векторами или контравариантными поливекторами. Число к называют порядком поливектора. Элемент 0 называется нулевым поливектором. Порядку нулевого поливектора можно приписать любое натуральное значение. Все поливекторы порядка к > п равны нулевому. Таким образом, все нулевые поливекторы принадлежат пространствам Tq1, ^о ? • • • •> TR• 4. Простейшие свойства внешнего умножения. 1) (ах) Л у = х Л (ау) = а(х Л у) для любого числа а и любых х, у G б, поскольку числовой множитель можно выносить как за знак обычного умножения тензоров, так и за знак альтернации. 2) (х + у) Л z = х Л z + у Л z, так как и обычное умножение и альтернация произведения тензоров распределительны относительно сложения. 3) Внешнее умножение косокоммутативно. Именно хЛу = (-1)к1уЛх, B) если х Е То^, у G Tq. Доказательство. В координатной записи имеем % rp^l • • '^к р . р . • «^ С" 1,1 • • • С" 1, и -I У = х) Высказанное здесь определение алгебры Грассмана недостаточно. Дело в том, что в множествах, называемых алгебрами, операция сложения опре- определена для любых элементов. Поэтому в рассматриваемом множестве Q, помимо указанных нами операций, следовало бы определить сложение тензоров разных валентностей. Это делается путем построе- построения формальных сумм элементов из разных пространств Т™. Кроме того, в Q обычно включают тензоры нулевой валентности, т. е. скаляры (инвари- (инварианты). В результате Q становится линейным пространством размерности 2П, изоморфным прямой сумме подпространств Grn\ где через G0 обозначена совокупность тензоров нулевой валентности. Мы не проводим подробно эту конструкцию, поскольку нам не придется пользовать- пользоваться сложением тензоров разной валентностей. Отметим еще, что множество Q часто называют алгеброй Грассмана над пространством L*, сопряженном данному пространству L, в связи с тем, что элементы множества Q можно отождествить с полилинейными формами, аргументами которых являются векторы пространства L*. Общее определение алгебры Грассмана читатель может найти в книге: Бишоп Р., Кригптпенден Р. Геометрия многообразий. - М.: Мир, 1967.
§ 2] ПОЛИВЕКТОРЫ. ВНЕШНЕЕ ПРОИЗВЕДЕНИЕ 335 откуда ———— Аналогично 7/ д т — V ~*~ /' Здесь еь ..., еп — базис в L, индексы н, ..., г&, ji, ..., j/ меня- меняются от 1 до п независимо друг от друга, суммирование ведется по всем этим индексам, квадратные скобки, как и выше, обозначают аль- альтернацию. Для того, чтобы перевести перестановку индексов (ii, . . . • • • ,ik,ji, • • • ,ji) в перестановку (jb . . ., jh iu . . . ,ik), нужно совер- совершить kl транспозиций соседних индексов. Поэтому и в силу опреде- определения альтернации каждое слагаемое суммы D) отличается от соот- соответствующего слагаемого суммы C) множителем (—l)kl, откуда сле- следует B). Следствие. Если х — поливектор нечетного порядка, то х А х = 0. 4) Внешнее произведение ассоциативно, т. е. для любых поливекто- поливекторов х,у, z G Q: (х Л у) Л z = х Л (у Л z). Для доказательства этого тождества нам придется сделать ряд пред- предварительных заключений. 5. Рассмотрим два произвольных набора базисных векторов: е^,... . . ., Cik и ej15 ..., Cjr Возьмем их альтернации; мы получаем два по- поливектора \Р. Р. 1 — _ Перемножим их согласно обычному правилу перемножения тензо- тензоров и проальтернируем полученное произведение: Heii • • • eik\ieji • • • eji\\ = i ^ "^ ?О6~\ .. .Обь Сит ... ui Г ~\ /г\ > ()••()• • \ р р р ft p ft (fl) Допустим сначала, что среди индексов ii, ..., г&, а также среди индексов ji, ..., j/, нет одинаковых. Тогда в сумме E) достаточно рас- рассмотреть лишь те слагаемые, где а± . . . ак есть перестановка набора индексов ii, ..., г&, a /?i . . . /3/ есть перестановка ji, ..., ji (остальные слагаемые равны нулю). Но очевидно, что все такие слагаемые одина-
336 поливекторы и внешние формы [Гл. X ковы, причем для любого из них имеем Очевидно также, что общее число этих слагаемых равно А;! Л. Сле- Следовательно, [[e*i • • • e*J[eji • • • tji]] = [*ii • • • eikeh • • • eji\- F) Теперь ясно, что равенство F) справедливо вообще, так как при наличии одинаковых индексов среди ii, ..., гк или среди ji, ..., ji обе его части равны нулевому поливектору. 6. Из F) сразу следует свойство ассоциативности для внешнего произведения базисных векторов. Именно, мы имеем ei A ej = 2! [eiej]. Далее, ^ (е{ Л ej) Лек = ^уу[е; Л ej,ek] = 3! [[е^е*] = 3! [е{е^ек\. Аналогично ei Л {ej Л ек) = 3! [e^e/.]] = 3! [е^е*]. Таким образом, (е^ Л ej) Л ек = е{ Л (ej Л ек)- Тем самым определяется ei Л ej Л ек = (е{ A ej) А ек = е{ A (ej А ек)- Отсюда и по индукции (с использованием F)) получаем eil A ei2 А . . . Л eim = ml [e^e^ . . . eim]. G) Написанное здесь слева внешнее произведение многих базисных векто- векторов может быть определено, как обычно в таких случаях, путем любого последовательного сочетания сомножителей. Из F), G) и A) следует также, что (eh A ei2 А . . . Л eik) A (ejt A eJ2 А . . . Л ejt) = = ei1 A ei2 A . . . Л eik А е^ Л ej2 А . . . Л е^. (8) 7. Пусть х — произвольный поливектор из Т$: x = Ydxil-ikeil...eih. (9) Согласно определению поливектора мы имеем х = [х] и, следователь- следовательно, можем написать г — X — Отсюда и вследствие G) Х= ^YsXil"Akeii Aei* A"-Aeik- A0) Здесь суммирование идет по всем индексам, и каждый из них, неза- независимо от других, принимает значения 1, 2, ..., п. Те слагаемые этой
§ 2] ПОЛИВЕКТОРЫ. ВНЕШНЕЕ ПРОИЗВЕДЕНИЕ 337 суммы, где имеется хотя бы одна пара одинаковых индексов, равны нулю. Рассмотрим все слагаемые, отвечающие всевозможным переста- перестановкам какого-нибудь одного набора различных индексов. Таких сла- слагаемых для данного набора индексов имеется &!, и все они равны друг другу. Поэтому вместо A0) можно написать х — * / j х егг /\ . . . /\ е%к, \11) где сигма со звездочкой впереди есть знак суммирования по всем на- наборам индексов ii, ..., ik при условии i\ < i2 < - - - < ik- 8. Как мы знаем, все поливекторы данного порядка к образуют в пространстве Tq подпространство, обозначенное выше через Gk- Из вы- выражения A1) вытекает важный вывод: внешние произведения е{г А ... Л вгк базисных векторов пространства L, отвечающие все- всевозможным наборам индексов i\ < i2 < - - - < ik, составляют базис в подпространстве Gk- В самом деле, согласно A1) каждый поливектор х G Gk разлага- разлагается по внешним произведениям е^ Л . . . Л в{к (i\ < ... < ik)- С дру- другой стороны, легко убедиться, что эти внешние произведения линейно независимы в Gk- Именно, допустим, что существуют числа хп"Лк, где i\ < i2 < - - - < ik, для которых формула A1) дает х = 0. Определим х%\..лк для лю5ых порядков расположения индексов ii, ..., ik по усло- « 91Ч к 194 к вию косой симметрии; иначе говоря, мы положим х = — х и т. д. Тогда вместо разложения A1) можно написать эквивалентное ему разложение (9), где суммирование идет по всем индексам, а коэффи- коэффициенты хгг"Лк являются координатами тензора х. Мы имеем х = 0; следовательно, хгг"Лк = 0 — как координаты нулевого тензора. Тем самым линейная независимость внешних произведений ei± A ei2 А . . . Л eik (н < i2 < . . . < ik) доказана. 9. Следствие. Размерность подпространства Gk равна С^. В самом деле, число всех внешних произведений е^ Л е^2 Л . . . Л е^, i\ < i2 < . . . < ik, равно числу сочетаний из п элементов по к, что и есть С*. 10. Вернемся к вопросу об ассоциативном свойстве внешнего про- произведения любых поливекторов. Доказательство этого свойства выте- вытекает из тождества (8). Чтобы упростить запись доказательства, введем обозначение ezi...u = eil Aei2 А . . . A eik.
338 поливекторы и внешние формы [Гл. X Тогда тождество (8) примет вид Рассмотрим любые поливекторы х Е Tq , у Е Tq. Мы можем написать их в виде {1~Лке{1..Лк, у = Отсюда и вследствие A1) и A2) Здесь, в отличие от A1), сигма со звездочкой впереди есть знак суммирования по всем наборам индексов %\ . . . г& и ji . . . ji при условии i\ < %2 < ••• < ik и 3i < 32 < • • • < 3h однако в общем наборе ii, ... 5 Н, 3i 1 • • • 3i эти индексы могут и не быть расположены в порядке возрастания. Пусть z G Т™ — еще один поливектор: Sl-SmeSl...Sm. A4) Из A3) и A4), снова применяя A2), находим \Х l\y) l\ Z — * 2^Х У z eii...ik3i...ji /х es1...sm — ~ / ; У C^l...tkJl...JlSl...Srn- С другой стороны, х Л (у Л z) = * V x^'"ihyh"^1 z8^"8meix...ih Л e h...jl8l...8m = A6) В формулах A5) и A6) символ * ^ употребляется в таком же смысле, как в формуле A3). Сравнивая A5) и A6), получаем: (х Л у) Л z = = х А (у A z), и ассоциативное свойство доказано. 11. Теперь обычным образом определяется внешнее произведение любого числа любых контравариантных поливекторов: xAyAzA. . .Aw. Например, х А у A z A t = ((х А у) A z) A t = (х А у) A (z A t) = х А (у A (z A t)). § 3. Бивекторы 1. Бивектором пространства L называется поливектор второго по- порядка. Здесь, как и раньше, речь идет о контравариантных поливек- поливекторах. Таким образом, говоря сейчас о бивекторах, мы имеем в виду поливекторы из Tq.
§ 3 ] БИВЕКТОРЫ 339 2. Бивектор р называется простым, если он равен внешнему про- произведению двух векторов: р = а1Аа2, A) где ai, п2 G L. Если ai, a<i линейно зависимы, то р = 0. Если ai, ^2 независимы, то р ф 0. В самом деле, в случае независимости векторов ai, п2 их можно дополнить до базиса ai, б&2, аз> • • • ? ^п- Но тогда внеш- внешние произведения а,{ Л a,j, i < j, составляют базис в подпространстве бивекторов над L (см. п. 8 § 2). Следовательно, ни одно из этих внешних произведений, в том числе а\ Ла2, не может быть нулевым бивектором. Таким образом, простой бивектор A) равен нулю тогда и только тогда, когда векторы ai, a^ линейно зависимы. 3. Допустим, что р ф 0 и, следовательно, ai, a<i независимы. При этом условии векторы ai, a<i определяют в пространстве L двумер- двумерное подпространство Li, представляющее собой их линейную оболочку: L2 = L(ai, ^2). Пусть 6i, 62 — любые два вектора из L^* Вследствие независимости ai, a^ мы имеем 2, 1 62 = OL21CL1 + СУ22&2, J где а^' ~~ числовые коэффициенты. Рассмотрим бивектор q = h Л 62. C) Из B) и C) получаем по правилам внешнего умножения q = 61 Л 62 = (anai + «12^2) Л («21^1 Л «22^2) = = «11(^22(^1 А ^2) + «12^21(^2 A ai) = = (аца22 — ^12<^2l)(fll А Й2). Таким образом, D = «22 D) т. е. бивектор q пропорционален бивектору р, и множитель пропорци- пропорциональности D = Det H^ijll- Обратно, допустим, что q = b\ Л Ь^ — Ар, где Л — некоторое чис- число (Л ф 0). В таком случае 6i, 62 G L2, т. е. имеют место равенства B); при этом Л = D из D). Докажем это утверждение. Для доказательства рассмотрим три произвольных вектора ci, С2, сз- Если они зависимы, то ci Л с2 Л с3 = 0. (а) Именно, если с\ — c<i — с$ = #, то (а) очевидно. Если же ci, C2, С3 линейно зависимы и не все равны в, то хотя бы один из них линейно
340 поливекторы и внешние формы [Гл. X выражается через два других (гл. I, §4). Пусть, например, сз = olc\ + + /Зс2- Тогда, используя свойства, изложенные в п. 4, можем проделать следующие вычисления: с\ А с2 Л с3 = (ci Л с2) Л (aci + /Зс2) = = a(ci Л с2 Л с3) + /3(ci Л с2 Л с3) = = —ас2 Л (ci Л ci) + ySci Л (с2 Л с2) = = -ас2 ЛО + ^ci Л 0 = 0. Если с\, с2, сз независимы, то с\ Л с2 Л сз т^ 0. В самом деле, незави- независимые векторы ci, с2, сз можно дополнить до базиса ci, с2, сз, ..., сп. Но тогда все внешние произведения вида С{г Л С{2 Л с^3, %\ < г2 < гз, составят базис в G% (см. §2, п. 8). Следовательно, все они отличны от нуля. Таким образом, равенство (а) необходимо и достаточно для за- зависимости векторов ci, с2, сз- Пусть теперь Ь\ Л 62 = A(ai Л а2), где А / 0, ai Ла2 / 0. Умнож;им обе части этого равенства внешним образом на Ь\. Мы получим слева Ь\ Л Ь\ Л 62 = 0; следовательно, 6i Л а\ Л а2 = 0. Отсюда, согласно сказанному выше о произвольных векторах ci, c2, сз, заключаем, что 6i, ai, а2 зависимы. Значит, Ъ\ G L2 = L(ai, a2). Ана- Аналогично 62 G L2 = L(ai, a2). После этого ясно, что X = D. 4. Итак, если aiAa2/ 0, то 6Х Лб2 = A(oi Ло2), А ^ 0, E) в том и только в том случае, когда 6i, 62 независимы и 6i, 62 G L2 = = L(ai, a2). При этом А = Det Цсе^Ц, где Цсе^Ц есть матрица, состав- составленная из координат векторов 6i, 62 по базису ai, a2. 5. В частности, 6i Л 62 = а\ Л а2 в том и только в том случае, когда 6i, 62 G L2 = L(ai, a2) и Det ||a^-|| = 1. 6. Подпространство L2 = L(ai,a2) называется подпространством простого бивектора ai Л a2. Говорят, что бивектор ai Л а2 лежит в подпространстве L2. Говорят также, что а± Л а2 есть направляющий бивектор этого подпространства (подобно тому, как обычный вектор, лежащий на прямой, называют направляющим вектором этой прямой). 7. Предположим, что линейное пространство L снабжено евклидо- евклидовой метрикой. Ради наглядности будем представлять себе ненулевой бивектор Ь\ Л 62 в виде ориентированного параллелограмма, построен- построенного на упорядоченной паре векторов 6i, 62 (рис. 68). Площадь этого
БИВЕКТОРЫ 341 ез параллелограмма будем называть площадью бивектора Ь\ Л Ь2. Бивек- Бивектор, площадь которого равна еди- единице, назовем единичным. Пусть теперь а\1\а2 — единичный бивектор. Тогда Det ||а^|| = =bc", где а — площадь бивектора Ь\ Л Ь2, и соотношение E) принимает вид Л b2 = ±cr(ai Л аг). F) Знаки =Ь здесь соответствуют случа- случаям, когда бивектор Ь\ Л Ь2 ориенти- ориентирован в L2 одинаково с бивектором а\ Л а2 или противоположно ему. Рис. 68. Если считать, что само подпространство L2 ориентировано упоря- упорядоченной парой векторов ai, a2, то вместо F) можно написать Ь\ Л b2 = S(ai Л а2), G) где S = Det ||«ij|| есть ориентированная площадь бивектора Ь\ Л Ь2. 8. Итак, простые бивекторы, лежащие в L2, изображаются в ви- виде ориентированных параллелограммов подпространства L2. Соглас- Согласно F) (или G)) параллелограммы равной площади и одинаково ориен- ориентированные в L2 изображают один и тот же бивектор (рис. 69). а\ Л п2 = Ь\ Л 62 = с\ Л С2 Рис. 69. 9. Считая L евклидовым пространством, возьмем в L ортонорми- рованный базис ei, ..., еп. Рассмотрим произвольные векторы 6i, 62 ? G L. Имеем Выберем какую-нибудь пару различных базисных векторов е^, е3;, пред- предполагая г < j. Они определяют некоторую двумерную координатную плоскость; обозначим ее через ?^j (точнее следовало бы говорить, что E{j есть двумерное подпространство, именно L(e^, ej)). Будем счи- считать, что плоскость ориентирована бивектором е^ Л ej, ъ < j - Назовем проекцией бивектора Ь\ Л Ь2 на ^j бивектор Л Л
342 ПОЛИВЕКТОРЫ И ВНЕШНИЕ ФОРМЫ [Гл. X где Sli = х\х32 — х\х\ есть ориентированная площадь параллелограм- параллелограмма, построенного в E{j на векторах х{е{ + x{ej и х\е{ + xJ2ej, то есть на проекциях векторов Ь\ и Ъ2. Вместе с тем по правилам внешнего умножения находим ЬглЬ2 = *^Sijei/\eh (8) где, как и раньше, звездочка означает суммирование при условии г < j. Из (8) заключаем, что в ортонормированном базисе координата- координатами простого бивектора Ь\ А Ъ2 являются ориентированные площади Sli его проекций на двумерные координатные плоскости E{j, г < j (см. рис. 70, где п = 3). Рис. 70. 10. В трехмерном случае базис состоит из трех векторов ei, в2, ез и сумма (8) также имеет три слагаемых: 6Х Л b2 = S12(e1 Л е2) + S13(ei Л е3) + S23(e2 Л е3). Поэтому с каждым бивектором Ь\ Л Ь2 трехмерного евклидова про- пространства L можно сопоставить вектор с из того же пространства L, приняв
j 3 ] БИВЕКТОРЫ 343 Вектор с определен бивектором Ь\ Л 62 инвариантно относительно переходов к другим ортонормированным базисам с той же ориентацией, какую имеет базис ei, e2, е%. Легко понять, что вектор с vc = b\ х 62 = S23ei - S13e2 + S12e3 есть векторное произведение Ь\ на 62 (рис. 71): С = [&i X 62]. 11. Обратимся к произволь- произвольным бивекторам (не обязатель- обязательно простым) в n-мерном линейном пространстве L; наличия евклидо- евклидовой метрики в L мы пока предполагать не будем. Пусть ei, ..., еп — какой-нибудь базис в L. Тогда е\ А е2, ..., еп-\ А еп составляют ба- базис в пространстве бивекторов над L. Для любого бивектора и имеем разложение и = * > игз ej А е^ = = и12е1Ле2 + и13е1 Ле3-\ Ь и1п ех Л еп + + п23е2Ле3 + ---+ п2п е2Леп + ... ... + nn"lnen_iAen. (9) Таким образом, любой бивектор разлагается в сумму простых би- бивекторов. 12. Вследствие соотношений ei Л ej = e^ej — е^е^ равенство (9) можно заменить разложением и по базису в Tq : = 0 • ii +0 • е2е2 Н h + unlenex Л h un~lnen-ien + 0 • enen. Здесь при г > j положено uli — —и^г\ на диагонали расположены нулевые компоненты (с коэффициентами и11 — 0). 13. Ранг матрицы ||^2J||, составленной из коэффициентов разложения A0), т.е. из координат бивектора и по базису e^ej, называется рангом бивектора и. Мы будем обозначать ранг через г (г = Rang ||nZJ||). 14. Ранг бивектора и является также рангом билинейной формы u(?,i V) = ^2ut^iVj с ковариантными аргументами ? = (?]_, . . ., ?п), г) = (rji, . . ., г)п), ^, г) G L*. Эта форма, будучи полной сверткой,
344 поливекторы и внешние формы [Гл. X есть инвариант и потому ее ранг инвариантен. Отсюда следует инвари- инвариантность ранга бивектора, т. е. независимость ранга от выбора базиса еь ..., еп Е L. 15. Рассмотрим линейный оператор U, который произвольному век- вектору ? из L* ставит в соответствие его правую свертку с бивектором и: Запишем преобразование U в координатах: ^' (и) где хг — координаты вектора х по любому базису ei, ..., еп простран- пространства L, ?j — координаты ? по взаимному базису е1, ..., еп простран- пространства L*. Матрица преобразования U совпадает с матрицей \\игЦ\ би- бивектора и. Поэтому ранг преобразования U (определяемый как ранг его матрицы) совпадает с рангом бивектора и (Rang U = г). Пусть Lr = U(L*) — образ всего пространства L*. Согласно §3 гл. VII Lr является подпространством размерности г в пространстве L. Подпространство Lr будем называть ранговым подпростран- подпространством бивектора и. Предположим, что базисные векторы ei, ..., ег выбраны в Lr. Тогда они образуют базис в Lr и каждый вектор х = U? расклады- раскладывается по векторам ei, ..., ег. Иначе говоря, в этом случае имеем х^1 = . . . = хп = 0. A2) Равенства A2) соблюдаются при любом ? G L*, поэтому из A1) и A2) имеем игз = 0, если г ^ г. Отсюда иг^ = 0, если j ^ г, поскольку uli — -ujt. Итак, если базис еь ..., еп таков, что еь ..., er G Lr, то матрица координат бивектора и по базису e^ej G Tq (to есть матрица коэффициентов разложения A0)) имеет вид 0 0 0 (*) где через Аг обозначена квадратная клетка г х г; остальные места матрицы (*) заняты нулями. Очевидно, что Dr = Det Ar ф 0, иначе ранг бивектора и был бы меньше г. 16. Пусть Lq — нулевое подпространство билинейной формы и(^ V) (размерность Lq равна п — г). Из п. 15 следует, что если х Е Lr, ?gLS,to (х, О = 0; (**) если (**) соблюдается для любого ? G Lq, то х Е Lr; если (**) со- соблюдается для любого х Е Lr, то ? Е Lq. Таким образом, если свертку рассматривать как аналог скалярного произведения, то Lr и Lq анало- аналогичны подпространству и его ортогональному дополнению. (Конечно,
§ 3 ] БИВЕКТОРЫ 345 нужно иметь в виду, что Lr и Lq находятся в разных подпростран- подпространствах.) Чтобы убедиться в справедливости сказанного, достаточно заме- заметить, что Lq есть ядро преобразования U, и что если векторы ei, ..., ег выбраны в Lr, то векторы er+1, ..., еп взаимного базиса окажутся в Lq (cm. A1) с учетом (*)) и составят в нем базис. 17. Теорема 1. Ранг любого бивектора есть четное число. Доказательство. Если бы число г было нечетным, то мы бы имели Dr = 0, так как всякий кососимметричный определитель нечет- нечетного порядка равен нулю. (Чтобы убедиться в справедливости послед- последнего утверждения, достаточно умножить на (—1) каждую строку ко- сосимметричного определителя, а затем его транспонировать.) 18. Теорема 2. В трехмерном пространстве всякий бивектор простой. Доказательство. Если L трехмерно, то, согласно предыдущей теореме, для любого бивектора и над L возможны лишь два случая: г = 0иг = 2.В первом случае и — нулевой бивектор, и, следовательно, можно написать и = аЛа, где а — любой вектор из L. Во втором случае ранговое подпространство Lr бивектора и двумерно. Поэтому, если мы возьмем в L базис ei, в2, ез при условии ei, е2 Е Lr, то разложение A0) примет вид и — u12ei Л е2. Теорема доказана. 19. Теорема 3. В пространстве любой размерности каждый ненулевой бивектор и может быть представлен в виде суммы про- простых бивекторов, число которых равно половине ранга г бивектора и\ u = p1Aq1-\ \-pk А Як, %к = г, A3) причем векторы р\, q\, ..., ри, qu линейно независимы. Доказательство. Прежде всего заметим, что если разложе- разложение вида A3) имеет место, то независимость векторов pi, qi, ... ,Pk, qk обязательна. В самом деле, допустим, что эти векторы зависимы. То- Тогда их линейная оболочка L имеет размерность s < г и векторы pi, </i, ..., pk, qk могут быть разложены по базису ei, ..., es E L. Под- Подставляя их разложения в A3), мы получим для и разложение вида A0) по базису Cij в Tq над L, т. е. при г, j = 1, 2, ..., s < г. Но в этом слу- случае ранг и окажется меньше г, вопреки условию. Заметим еще, что в силу аналогичных соображений число простых бивекторов в сумме вида A3) меньше \г быть не может. Возможность разложения A3) докажем по индукции. Ясно, что для любого бивектора и ранга = 2 разложение вида A3) существует;
346 поливекторы и внешние формы [Гл. X именно, и = р Л q, где р, q — некоторые независимые векторы, лежа- лежащие в двумерном ранговом подпространстве. Предположим, что воз- возможность разложения A3) установлена для всех бивекторов ранга 2, 4, ..., г — 2; тогда покажем, что такое разложение возможно и для бивектора ранга г. Тем самым доказательство будет завершено. Пусть базис ei, ..., еп в L выбран при условии ei, ..., er Е Lr; соответственно имеем и = u12ei А е2 + и1Ъех Л е3 Н V и1гег Л ег+ + и23е2 Л е3 + • • • + и2ге2 Л ег + . . . ... + nr~lrer_i Лег. Положим ei = pi, и12е2 + п13ез + ••• + nlrer = q\. Отсюда и из предыдущего разложения находим, что ранг бивектора и — р\ Л q\ не больше числа векторов в наборе е2, ез, ..., ег, т.е. не больше г — 1. Но ранг любого бивектора — четное число. Следовательно, ранг би- бивектора и — р\ Л q\ не больше г — 2. Поэтому и по предположению ин- индукции существуют векторы р2, q2, ..., р/,, <//,, где 2к ^ г (т.е. число пар р^, </i не больше половины числа г — 2), такие, что и — р\ /\ q\ = = р2 Л #2 + * * * + Рк A qu- Отсюда получаем разложение A3). При этом 2к = г, так как в действительности 2к < г невозможно вследствие замечания, сделанного в начале доказательства. Теорема доказана. 20. Если в линейном n-мерном пространстве L задана евклидова метрика, то можно считать, что L* совпадает с L; при этом под сверт- сверткой (ж, ?) двух элементов ж, ? из L следует понимать их скалярное произведение. Отсюда и на основании рассуждений п. 16 заключаем: для бивектора в евклидовом пространстве L как ранговое подпростран- подпространство Lr, так и нулевое подпространство Lq определены в самом L (по понятным соображениям мы пишем Lq без звездочки). Подпростран- Подпространства Lq и Lr являются ортогональными дополнениями друг друга. 21. Пусть у = Ах — линейное преобразование, заданное в евкли- евклидовом n-мерном пространстве L. В координатной записи имеем yi = = ^2 Ais%s 1 где xs — контравариантные координаты вектора ж, yi — ковариантные координаты вектора у] при этом Ais суть ковариантные координаты тензора данного линейного преобразования. Этот тензор мы будем обозначать также через А, а само преобразование напишем в виде у = (А, х) . Круглые скобки здесь обозначают правую сверт- свертку тензора А с вектором х. Мы называем линейное преобразование косым, если Ais = — Asi (см. гл. IX, § 2, п. 6, а также § 6 и п. 2 в § 9). Определения и теоремы, изложенные выше для контравариантных бивекторов, непосредственно переносятся на ковариантные бивекторы (косые двухвалентные ковариантные тензоры). В случае косого преоб- преобразования тензор А есть ковариантный бивектор, ранг которого равен
§ 3 ] БИВЕКТОРЫ 347 рангу этого преобразования. Отсюда и согласно п. 19 имеем предложе- предложение. Пусть у = Ах — косое линейное преобразование в евклидовом про- пространстве L; если его ранг равен г, то в пространстве L найдутся независимые векторы Pi, qi, ..., Pk, Qk, где к = \r, такие, что дан- данное преобразование представится в виде У = (piAqi, х)-\ Ь (рк Aqk, х). Здесь (pi Л </i, х) — правая свертка бивектора pi Л qi с вектором х: (pi Л qi, х) = Pi(qi, х) - qi(pi, х); (qi, x) и (pi, x) — скалярные произведения. 22. В частности, если L — трехмерное евклидово пространство, у = Ах — произвольное косое преобразование ненулевого ранга, задан- заданное в L, то найдутся независимые векторы р, q такие, что у = (pAq, x). Полагая а = — [р х </], получим у = [а х х]. В самом деле, [а х х] = = [х х [р х q]] = p(q, x) - </(р, х) = (р Л ^, ж). Таким образом, в трех- трехмерном евклидовом пространстве всякое косое преобразование пред- представляется в виде векторного произведения (в том числе преобразова- преобразование нулевого ранга — при а = в). Этот результат уже был установлен раньше в гл. IX. 23. В заключение параграфа мы приведем еще одно предложение, известное под названием леммы Картана: Пусть в линейном пространстве L даны две системы векторов: Р\, ..., pk и q\, ..., qk, причем система pi, ... ,Pk линейно независима. Пусть PiAqi + --+Pkf\qk=O. A4) Тогда векторы q±, ..., qk линейно выражаются через р\, ..., pk соот- соотношениями ^2isps A5) с симметричной к х к-матрицей \\а{8\\, то есть, a{s = as{. Обратно, если имеют место равенства A5) и матрица ||o^s|| симметрична, то имеет место также A4). Доказательство. 1) Сначала докажем второе (обратное) утвер- утверждение. Пусть соотношения A5) даны и ais = asi. Тогда Pi ^qi = ^2 aispi Л ps = * ^2(ai8 - asi)pi Л ps = 0, г ,s=l т.е. A4) соблюдено.
348 поливекторы и внешние формы [Гл. X 2) Пусть теперь дано A4). Дополним систему векторов pi, ..., рк до базиса pi, ..., pk, Pfc+i, • • • •> Рп в L. Тогда можно написать разложения к Qi = /2aisPs + aik + lPk + l + ' ' ' + OLinPn- 8 = 1 Отсюда и вследствие A4) к к ^2 Pi Л qi = * ^ (а** - <x8i)pi Л ps + г=1 i,s=l к + $^(«г A+lP* А Рк+1 Н •" ainPi Л г=1 Но внешние произведения pi Л ps, г < s, образуют базис в подпро- подпространстве бивекторов над L. Поэтому и вследствие A7) ais = a8i, если г, s = 1, 2, ..., &, кроме того, ais = 0 при s > к. Таким образом, соотношения A6) сводятся к соотношения вида A5) и матрица а{8 сим- симметрична. Все доказано. § 4. Простые поливекторы 1. Простым контравариантным поливектором в пространстве L на- называется внешнее произведение нескольких векторов, взятых в L: р = а\ Л п2 Л . . . Л dk- Число к называется порядком поливектора р. Говорят также, что р есть ^-вектор в L. 2. Мы сообщим сейчас ряд предложений о простых поливекторах любого порядка, которые естественным образом обобщают предложе- предложения о простых бивекторах, изложенные в пп. 2-9 §3. Доказательства этих предложений, подробно изложенные нами для частного случая к = 2, тривиально переносятся на общий случай. 1) р = 0 тогда и только тогда, когда векторы ai, ..., а/, линейно зависимы. 2) Пусть ai, ..., uk независимы; соответственно р ф 0. Тогда векто- векторы ai, ..., uk определяют ^-мерное линейное подпространство L& в L, именно свою линейную оболочку: L& = L(ai, . . ., a&). Говорят, что L& есть линейное подпространство поливектора р или что поливектор р лежит в L&. Говорят также, что р есть направляющий поливектор под- подпространства L&. Возьмем в Lk произвольные векторы 6i, ..., bk- Имеем Ь H Ь а1как, -\ h
§4] ПРОСТЫЕ ПОЛИВЕКТОРЫ 349 где aij — числовые коэффициенты. Пользуясь распределительным свойством внешнего умножения и его косой симметрией, легко дока- доказать, что q = 61 Л 62 Л . . . Л bk = Det ||a^-||(ai Л a2 Л ... Л ак). B) В самом деле, при почленном перемножении правых частей A) нуж- нужно учитывать только те слагаемые ацг . . . a^a^ Л ... Л а^, где ин- индексы ii, ..., %k все разные (остальные слагаемые равны нулю). Но для написанного (произвольного) слагаемого имеем «izi • • -<Xkiha>n Л . . . Л aik = Sil,,jkalil . . .ак{ках Л ... Л a*. Поэтому Ь1А...АЬк= (^2 sii...ikaih • • • akih) а1Л...Лак = = Det ||q^j||gi Л ... Л ак. В последнем равенстве мы воспользовались формулой A) из § 3 гл. II (строго говоря, упомянутая формула дает определитель транспониро- транспонированной матрицы ||а^-||, поскольку здесь ведется суммирование по вто- вторым индексам элементов а^-, а не по первым, как в § 3 гл. II). Подчеркнем еще раз, что множитель Det ||o^j|| получается вслед- вследствие линейности произведения по каждому аргументу и косой сим- симметрии произведения по каждой паре аргументов. В дальнейшем мы будем неоднократно проводить аналогичные вычисления, не останав- останавливаясь так подробно на деталях. Таким образом, q = Dp, т.е. поливектор q пропорционален поли- поливектору р, и множитель пропорциональности D = Det ||«^-||. Обратно, если q = 61 Л 62 Л . . . Л Ьк = Ар, где Л — некоторое число, Л ф 0, то &]_, ..., Ьк независимы и принадлежат L&, т.е. имеют место равенства A); при этом Л = D = Det ||а^'||- 3) В частности, Ь\ Л 62 Л . . . Л bk = d\ Л п2 Л . . . Л ак в том и только в том случае, когда 6i, ..., bk E L^ = L(ai, . . ., ак) и Det H^ijll = 1- 3. Предположим, что линейное пространство L снабжено евклидо- евклидовой метрикой. Пусть 6i, ..., bk E Lk — L(ai, . . ., a^). Будем представ- представлять себе ненулевой поливектор Ь\ Л 62 Л. . . Л bk в виде ориентированно- ориентированного /^-мерного параллелепипеда в L&, построенного на упорядоченном наборе векторов 6i, 62, ..., 6/.. Объем (^-мерный) этого параллелепипе- параллелепипеда будем называть объемом поливектора Ь\ Л 62 Л . . . Л 6&. Поливектор, объем которого равен единице, назовем единичным. Объем произволь- произвольного простого поливектора вычисляется согласно п. 6 § 13 гл. VIII.
350 поливекторы и внешние формы [Гл. X Допустим, что исходный поливектор а\ Л а^ Л . . . Л а^ единичный и что подпространство L& = L(ai, . . ., а^) ориентировано упорядочен- упорядоченным набором векторов ai, ..., а/.. Тогда Det ||ce;j|| = V, где V — ори- ориентированный ^-мерный объем поливектора Ь\ЛЬ^Л. . . Л6&. Равенство B) теперь может быть написано в виде Ь\ Л 62 А . . . Л bk = V • сц Л п2 Л . . . Л аи- C) 4. Итак, простые поливекторы порядка А;, лежащие в L&, изоб- изображаются в виде ориентированных параллелепипедов подпростран- подпространства L&. Согласно C) параллелепипеды равного объема и одинаково ориентированные в L&, изображают один и тот же поливектор (при к = 3 см. рис. 72). а' р = a' Ab' Ac' Рис. 72 5. Возьмем в L ортонормированный базис ei, ..., еп. Рассмотрим набор произвольных векторов 6i, ..., bk G L&. Имеем Выберем какие-нибудь базисные векторы е^, ..., е^, считая U < ^2 < • • • < Н- Они определяют ^-мерную координатную плос- плоскость; обозначим ее через E{1^jk (точнее следует сказать, что E{1^jk есть линейная оболочка векторов е^,..., е{к). Будем считать, что плос- плоскость E{1..jk ориентирована поливектором е^ Л е^2 Л . . . Ле^. Рассмот- Рассмотрим любой вектор bj из набора 6i, ..., 6^; обозначим через 6j проекцию вектора 6j на плоскость Егг^^к: Назовем проекцией поливектора Ь\Л62Л. . .Лbk на ^-мерную плоскость Е{г..лк поливектор Ь\ Л Ь^ Л ... Л bk- Согласно C) Ь1ЛЬ2Л...ЛЬк = У^2-Лкег1 Aei2A...Aeik. Здесь Vlll2'"lk — ориентированный ^-мерный объем параллелепипеда, построенного в Е{г{2.„{к на векторах 6i, ..., 6^, т. е. на проекциях век- векторов &i, ..., bk- Вместе с тем для самого поливектора Ь\ Л Ь% Л ... Л bk
§5] ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ 351 по правилам внешнего умножения находим fti Л Ь2 Л . . . Л Ьк = * ^ Vili2-ikeh Л ei2 Л . . . Л eik, E) где, как обычно, звездочка означает суммирование при условии %\ < Из E) заключаем, что в ортонормированном базисе координатами простого поливектора Ь\ Л Ь2 Л ... Л 6& являются ориентированные ^-мерные объемы уггг2"Лк его проекций на ^-мерные координатные плоскости Е;л;п ;, : (в) 6. В предыдущем пункте речь шла о проекциях и объемах. Однако алгебраические выкладки, приводящие к формулам E)-F), от метри- метрики не зависят. Поэтому, если в линейном пространстве L в каком- нибудь базисе ei, ..., еп заданы формулы D), то для поливектора Ь\ Л hi Л . . . Л bk справедлива формула E) с коэффициентами F). § 5. Векторное произведение 1. С помощью простых поливекторов можно естественно распро- распространить понятие векторного произведения на случай любого числа к векторных сомножителей в евклидовом пространстве Еп любой раз- размерности п (п > к). Сначала вспомним, что в Е% координаты векторного произведения z = [х х у] в произвольном базисе выражаются так: Здесь gli — контравариантный метрический тензор, €ар7 — ковари- антный дискриминантный тензор, e'aZ, — смешанные координаты дис- криминантного тензора, получающиеся путем подъема последнего ин- индекса (см. §§9 и 13 гл. VIII). Пусть теперь xi, ..., хи — какие-нибудь векторы в Еп, заданные в числе к < п, {х?} — координаты вектора Х{ в произвольном бази- базисе ei, ..., еп пространства Еп. Построим тензор согласно следующей формуле: ..in-k _ V^ • -п..лп-к аг „ак — — / fcoti-.-otfe- • xi ---^к ~ ii/3! ik/3k аг ак Здесь, как обычно, ?ii...in — дискриминантный тензор, gli — метри- метрический тензор пространства Еп. Дискриминантный тензор является
352 поливекторы и внешние формы [Гл. X осевым и обладает косой симметрией по всем индексам. Поэтому z — аксиальный поливектор, то есть осевой кососимметричный тензор (валентности п — к). Согласно общим правилам (см. §9 гл. VIII) мы можем записать его в ковариантных координатах. Получим более про- простую формулу Zi!...in-k = /_^?a1...ani1...in-k%i 1 • • • % к . B) Поливектор z порядка п — к, определяемый формулой B), назо- назовем векторным произведением векторов xi, ..., хк, взятых в данном порядке, и будем обозначать символом [х\ х . . . х хк]. Иначе говоря, z = [Xl х ... х хк] = ^2zil-in~keil ...ein_k. C) Покажем, что по своим свойствам поливектор z представляет собой многомерный аналог обычного векторного произведения. 2. Свойства векторного произведения (их доказательство см. ни- ниже, п. 3). 1) Векторное произведение линейно по каждому своему сомножи- сомножителю. Например, для первого сомножителя имеем [(ах[ + fix") х х2 х . . . х xk] = = а[х[ X Х2 X . . . X Xk] + Р[х" X Х2 X . . . X Xk]. 2) Векторное произведение кососимметрично по любой паре сомно- сомножителей. Например, для первой пары сомножителей имеем [Х\ X Х2 X . . . X Xk] = — [Х2 X Xi X ... X Xk]. 3) [xi x . . . х Xk] = 0 тогда и только тогда, когда сомножители линейно зависимы. 4) Векторное произведение есть простой поливектор. Точнее, суще- существуют векторы 2/i, ..., yn-k E Еп такие, что [xi х х2 х ... х хк] = У\ Л ?/2 Л ... Л Уп-к- 5) Если векторы xi, ..., Xk линейно независимы, то векторы 2/i, ..., Уп-к тоже линейно независимы; тем самым вполне определены подпространства Lk = L(x1, . . . , хк) и Ln-k = L{yu . . . , уп-к)- Эти подпространства Ьк и Ьп-к являются ортогональными дополнениями друг друга. 6) Если векторы xi, ..., хк линейно независимы, то ориентации xi, ..., хк в Ьк и 2/i, • • •, Уп-к в Ln-k таковы, что объединенная систе- система векторов xi, ..., Xk, у 1ч • • •, Уп-к одинаково ориентирована с бази- базисом ei, ..., еп (т. е. с тем базисом в Еп, по которому даны координаты в исходных равенствах A)).
§5] ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ 353 7) (п —&)-мерныйобъем поливекторам = у\/\у2^- • -/\Уп-к численно равен /^-мерному объему параллелепипеда, построенного на векторах хи ..., хк. 3. Доказательство. Свойства 1) и 2) непосредственно выте- вытекают из равенства B). Докажем теперь свойство 3). Из свойств 1) и 2) следует, что z = О, если xi, ..., хк линейно зависимы. Пусть теперь xi, ..., хк линейно независимы. В линейной оболочке Lk = L(xi, . . ., Xk) выберем какой-нибудь ортонормированный базис а\,..., ак, одинаково ориентированный с системой векторов х\,..., хк, и дополним его до ортонормированного базиса ai, ..., ак, ..., ап во всем пространстве Еп, ориентированного так же, как исходный базис ei, ..., еп. Имеем разложения вида Х{ = аца,1 -\ Ь aikak, причем Det ||c^ij|| = У'•> гДе У > 0 есть /^-мерный объем параллелепипе- параллелепипеда, построенного в L& на векторах х\, ..., хк- Вследствие линейности и косой симметрии векторного произведения получаем [х\ х Х2 х . . . х Xk] = Det H^ijll [ai x 6&2 x . . . х ак] = = У[а\ х п2 х . . . х a,k]. Отсюда и из A) z — v Тензорное равенство D) справедливо в любом базисе, ориентиро- ориентированном так же, как ei, ..., еп. В частности, в ортонормированием ба- базисе ai, ..., ап имеем glC = 8гC', af = Sf, так что в этом базисе Отсюда следует, что поливектор z имеет при %\ < %i < . . . < in-k единственную ненулевую координату, именно zk+l-n = Vel...kk+1...n = V. E) Из E) видно, что в случае линейно независимых сомножителей [х\ х . . . х Xk] ф 0. Тем самым свойство C) доказано. Докажем теперь свойства 4)-7). Заметим, что может существовать не более одного простого поливектора, обладающего свойствами 5)-7) из п. 2 (так как эти свойства задают подпространство, объем и ориен- ориентацию поливектора). Построим простой поливектор п, равный вектор- векторному произведению z и обладающий свойствами 5)—7). Положим u = {Vcik+i) Л CLk+2 Л ... Л ап. По формуле E) §4 находим, что uk+l...n = у (б) 12 нв- Ефимов, Э.Р. Розендорн
354 поливекторы и внешние формы [Гл. X и что остальные координаты иг1"Лп-к при условии %\ < %2 < . . . < in-i равны нулю. Сравнивая E) и F), получаем и = z. Поэтому, полагая, 2/1 = ^0*5 + 1, 2/2=^+2, -.., Уп-к=О>п, мы увидим, что все свойства 4)-7) п. 2 соблюдаются. 4. Понятие векторного произведения помогает в произвольном (в частности, косоугольном) базисе решать следующие геометрические задачи. а) В евклидовом (векторном) пространстве Еп дано подпростран- подпространство L&. Найти его ортогональное дополнение Ln-k- б) В евклидовом (точечном) пространстве Еп дана точка А и к- мерная плоскость Щ, не проходящая через А. Провести через точку А плоскость Tln-k размерности п — к, ортогональную Щ. в) В условиях задачи б) опустить из точки А перпендикуляр на Щ (то есть, найти прямую, ортогональную Щ, проходящую через точку А и пересекающую Щ). г) В условиях задачи б) найти кратчайшее расстояние от точки А до плоскости Щ. д) В пространстве Еп даны скрещивающиеся плоскости Щ и П/. Построить их общий перпендикуляр. е) В условиях задачи д) найти кратчайшее расстояние между Щ и П/. Не останавливаясь на деталях, рассмотрим схемы решения пере- перечисленных задач. Для решения задачи а) достаточно взять какой-нибудь базис xi, ... . . ., Xk в Lk и построить подпространство Ln-k поливектора [х\ х . . . х Xk]- О вычислениях, которые для этого нужно проделать, см. ниже, пп. 5-6. Задача б), очевидно, сводится к задаче а). Пусть Пп-к — плоскость, полученная в результате решения зада- задачи б). Нетрудно установить (например, с помощью теоремы 5 § 7 гл. III), что Hn-k пересекается с Щ, и доказать, что точка их пересечения един- единственна. Обозначим эту точку через В. Тогда прямая АВ будет иско- искомым перпендикуляром в задаче в), а длина отрезка АВ — искомым расстоянием в задаче г). Решение задачи д) представляет собой многомерное обобщение по- построения общего перпендикуляра к двум скрещивающимся прямым Именно, рассмотрим направляющие подпространства Lk и L/ плос- плоскостей Щ и П/ соответственно. Построим их сумму L' = Lk + L\ и ее
ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ 355 ортогональное дополнение L. Нахождение последнего сводится к ре- решению задачи а). Пусть пересечение L& П L/ имеет размерность т. Тогда размерность L = п — (к + I — т). Через произвольную точку М плоскости Щ проведем плоскость П в направлении подпространства L = L& 0 L (рис. 73). Размерность П равна к + р = п + т — I. В силу построения L пересечение L П П L/ совпадает с пересечением L& П L/ и потому имеет размерность т. Применяя теорему 5 § 7 гл. III, находим, что плоскость П пересекает- пересекается с плоскостью П/. Пусть С — какая-нибудь точка их пересечения. Можно показать, что при т ^ 1 точка С не единственна в отличие от хорошо известного трехмерного случая. Рис. 74. Проведем через точку С плоскость П в направлении подпростран- подпространства L. Отметим, что П зависит от выбора точки С в плоскости П/ П П (см. рис. 74, где п = 4, Щ = L& = L(ei, в2), П/ проходит в направ- направлении L(e2, ез), П одномерна). Рассматривая Щ и П как плоскости в (к + р)-мерном аффинном пространстве П и еще раз применяя тео- теорему 5 из § 7 гл. III, установим, что Щ и П пересекаются в некоторой точке D (рис. 73-74). Прямая CD пересекает Щ и П/. Она содержится в П, так что ее направляющий вектор принадлежит L и потому ортого- ортогонален всем векторам из L& и L/. Таким образом, прямая CD является искомым общим перпендикуляром к Щ и П/ (вообще говоря, не един- единственным). Предоставляем читателю доказать, что длина отрезка CD является кратчайшим расстоянием между Щ и П/, так что попутно получается решение задачи е). Обратим внимание на то, что отыскание подпространств, плоско- плоскостей и точек, о которых шла речь, сводится к решению некоторых си- систем линейных уравнений. 12
356 ПОЛИВЕКТОРЫ И ВНЕШНИЕ ФОРМЫ [Гл. X 5. Вернемся к задаче а). Предположим, что L& задано как линей- линейная оболочка независимых векторов еь ..., еп: , разложенных по базису { = у ^ Согласно пп. 1-2 имеем z = [xi х . . . х хк] = А . . .Ауп-к = . . .ei где z ll---tn- к определяются формулой A), векторы 2/ь ..., уп-к образу- образуют базис в искомом подпространстве Ln-k. Запишем разложения век- векторов 2/ь-.., Уп-к по базису еь ..., еп: Уг = G) с неизвестными нам коэффициентами {yj}, и составим матрицу Л п.П- Y = 2/1 • • Уп-к Аналогично п. 5 § 4 можно доказать, что каждая из координат zll---ln-k поливектора z равна определителю порядка п — к, образованного столб- столбцами матрицы Y с номерами ii, ..., in-k- Поэтому, хотя мы и не зна- знаем числовых значений элементов матрицы У, но нам известны число- числовые значения всех ее миноров порядка (п — к). Для простоты дальней- дальнейших обозначений предположим, что левый (отмеченный) минор мат- матрицы G) является базисным, т.е. что A = zl...n-k ^0< Вектор и = ^2 и%ег принадлежит Ln_/, тогда и только тогда, когда п — к = п — к. (8) \Уп-к Составим минор М порядка (п — к + 1) матрицы (8), образованный столбцами с номерами 1, ...,п — &,/, где п — к < I ^ п. Такой минор заведомо равен нулю. Алгебраическое дополнение элемента nJ в мино- миноре М обозначим jij. Разложив минор М по первой строке, мы получим для координат вектора и линейное уравнение Jnu1 + ji2u2 Н 7/п-кип~к + Аи1 = 0. Полагая затем I = п — & + 1, ...,п, получим однородную систему уравнений Лп = 0, (9)
:Д io v А о; "А; §5] ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ 357 имеющую к х n-матрицу вида А = Важно, что все ненулевые элементы матрицы А суть некоторые из ко- координат хЪх"Лп-к поливектора z. Любой вектор и Е Ln-k удовлетво- удовлетворяет системе (9). Но Rang Л = к, поэтому векторы из Ln-k образуют всю совокупность решений системы (9). Итак, система (9) определяет искомое подпространство и дает тем самым решение задачи а). Разумеется, задачи а)-е) можно решать по-другому, например, ис- используя §4 гл. VIII. 6. Пусть теперь е\,..., еп — ортонормированный базис в Еп. Тогда имеют место следующие равенства: [eil х ei2 x х eik] = Л eJ2 Л . . . Л ejn_k, A0) где объединенный набор индексов (*i, . . ., г&, ji, . . ., jn-k) является четной перестановкой натурального набора A,2, . . . , п). Чтобы убе- убедиться в справедливости равенств A0), достаточно заметить, что про- простой поливектор ejtAej2Л. . .AeJn_fc по отношению к векторному произ- произведению [ei1 х ei2 x . . . х eik] обладает свойствами 4)-7) п. 2. Но такими свойствами может обладать только один поливектор. Формулы A0) дают таблицу умножения базисных векторов ei, ... . . ., еп и позволяют вычислить векторное произведение любых векто- векторов путем почленного перемножения их разложений по базису ei, ... . . ., еп. С их помощью можно в некоторых случаях находить сомножи- сомножители yi, ..., yn-ki входящие в выражение z — у\/\. . .Луп-к-> непосред- непосредственно, минуя решение системы (9). Вместе с тем получается другой путь решения задачи а). Пример. В четырехмерном евклидовом пространстве в ортонор- мированном базисе ei, в2, ез, е^ даны векторы х\ — 2е\ + е^ + ез, х2 = ei + в4- Найти направляющий бивектор ортогонального дополне- дополнения линейной оболочки L(xi, x2)- Решение. В качестве искомого бивектора можно взять вектор- векторное произведение [х\ х ж2]- Перемножая векторы xi, x2 почленно и
358 поливекторы и внешние формы [Гл. X пользуясь формулами A0), найдем = [Bех + е2 + е3) х (ех + е4)] = = [е2 х ei] + [е3 х ei] + 2[ei х е4] + [е2 х е4] + [е3 х е4] = = е4 Л е3 + е2 Л е4 + 2е2 Л е3 + е3 Л е\ + ei Л е2 = = ei Л е2 — 2е3 Л е2 — е4 Л е2 — е\ Л е3 + 2е3 Л е3 + е4 Л е3 = = (ех - 2е3 - е4) Л (е2 - е3). Таким образом, ортогональным дополнением для L(xi, х2) является 2/2), где 2/i = ei — 2е3 - е4 , ?/2 = е2 - е3. § 6. Внешние формы и действия над ними 1. Пусть L — линейное n-мерное пространство, xi, ..., хк — набор произвольных векторов из L, lj(xi, . . . , хи) — полилинейная форма с векторными аргументами xi, ..., Xk- Назовем альтернацией формы lj(xi, . . ., Xk) полилинейную фор- форму, которую будем обозначать через (lo(xi, . . . , Xk)) и определять ра- равенством (w(xu ..., хк)) = 1 Y,6(Т.кЫхп,xj2,..., xjh), A) где суммирование по каждому из индексов ji, ..., jk идет от 1 до к. В частности, для линейной формы и(х) имеем (ш{х)) = ш{х); B) для билинейной формы lj(x, у) (и(х, у)) = ^(^(ж, у) - и (у, х)); для формы трех аргументов (и(х, у, z)) = д[(^(ж, 2/, ^) + ш(у, z, х) + + U)(Z, X, у) - (л)(у, X, Z) - U(X, Z, у) - U)(Z, У, х)). Из формулы A) ясно, что 1) (uj) действительно является полилинейной формой, т. е. обладает свойством линейности по каждому аргументу; например, по первому аргументу: (и)(ах[ + fix", x2, • • • , хк)) = = а(и(х[, х2, • • • , хк)) + Р{и(х", х2, • • • , хк)). 2) (u)(xi, . . . , Xk)) обладает косой симметрией по любой паре своих аргументов; например, по первой паре: (о;(ж1, х2, хз, • • •, Xk)) = -(u)(x2, xi, ж3, . . ., хк)).
§6] ВНЕШНИЕ ФОРМЫ И ДЕЙСТВИЯ НАД НИМИ 359 2. Форму и будем называть косой, если (и) = и. Согласно равенству B) каждая линейная форма, то есть форма од- одного аргумента, должна быть отнесена к числу косых. Из определения альтернации следует, что косая форма обладает косой симметрией по любой паре своих аргументов. Обратно, если полилинейная форма и обладает косой симметрией по любой паре своих аргументов, то она является косой в смысле данно- данного выше определения, то есть (и) = и. Доказательство предоставляем читателю. 3. Пусть u)(xi, . . ., Xk) — косая форма. Если векторы xi, ..., хи линейно зависимы, то соответствующее им значение формы uj равно нулю. Утверждение следует из свойств линейности по каждому аргументу и косой симметрии по каждой паре аргументов. 4. Если число аргументов косой формы и превышает размерность пространства (к > п), то и тождественно равна нулю. Утверждение является следствием п. 3. 5. Важно понять, что косая форма w(xi, . . . , Хк) является функ- функцией простого поливектора р = х\ Л . . . Л хи. Иначе говоря, значение uj не изменится, если векторы xi, ..., Xk мы заменим другими векторами 2/1, ..., у к при условии ух Л . . .Лук = X! Л . . .Ахк. Докажем это утверждение. Вследствие пп. 3, 4 достаточно рассмот- рассмотреть случай, когда xi, ..., хк линейно независимы. Тогда равенство У\ Л ... Л уи = х\ Л . . . Л Xk равносильно тому, что имеют место разло- разложения ух = ацхх Н Ь aikXk, Л \ C) Ук — OLklXi + Ь OLkkXk, J где Det||o^j|| = 1 (см. п. 2 §4). Из равенств C), а также из свойств линейности и косой симметрии формы и имеем о;B/ь . . ., Ук) = Det||aij|| w(#i, . . . , хк) = oj{xu . . . , хк). Этим наше утверждение доказано. 6. Согласно п. 5 областью определения косой формы cj(xi, ... . . . 5 Хк) = ш(р) является множество всех простых поливекторов порядка к. Определение. Косая форма как функция поливектора назы- называется внешней формой. Порядок к аргумента р условно называется степенью внешней формы ш(р). Говорят также, что oj(p) есть &-форма. Для обозначения &-формы часто употребляется символ ик(р).
360 поливекторы и внешние формы [Гл. X 7. Внешние формы данной степени к образуют линейное подпро- подпространство в пространстве всех полилинейных форм с аргументами Х\, . . . , X к. В самом деле, внешние формы одной и той же степени можно скла- складывать и умножать на числа, и в результате будут получаться внешние формы той же степени (поскольку линейная комбинация косых форм от xi, ..., хи есть косая форма от этих же аргументов, что очевидно). 8. Определим внешнее произведение двух внешних форм любых степеней. Внешним произведением формы оок(р), р = х\ Л . . . Л хк, на фор- форму 0Jl(q), q = (xk+i Л ... Л Xk+i), называется внешняя форма степени к + I, которая обозначается ujk{p) Л ojl(q) и определяется следующим равенством шк (р) Л и1 (q) = ^'(шк(хи ..., хк)и1(хк+и ..., xk+t)), где (ujk(xi, . . ., Xk) ul(xk+i, • • •, Xk+i)) есть альтернация полилиней- полилинейной формы степени к + /, получаемой обычным умножением сок на а/. Докажем, что сок(р) Л u)l(q) есть внешняя форма степени к + I от поливектора р Л q: Доказательство. То, что ujk (p)/\ojl (q) есть косая форма степе- степени к + /, непосредственно следует из определения альтернации. Далее имеем шк(р) Л uj\q) = ujk+l(Xl, . . . , хк+{) = ик+1(Х1 Л ... Л хк+1) (см.п. 5). Но согласно пп. 10, 11 § 2 хх Л . . . хк Л хк+1 Л ... Л хкМ = = (ж1 Л . . . Л хк) Л (жЛ+1 Л ... Л жЛ+/) = pAq, что и требуется. 9. Ниже мы докажем, что внешнее произведение внешних форм обладает следующими свойствами: 1) (аик)/\и1 = ик/\{аи1) = а(ик /\и1) для любого числа а и любых внешних форм ик ио;1. 2) (cjf +cj|)Acj/ = оик /\ и1 + ои% /\ и1 для любых внешних форм сок, 3) Внешнее умножение внешних форм косокоммутативно, именно для любых сок, uj1 . Отсюда следует, в частности, что при ujk = uj1 будет ujk Л uj1 = 0 при любом нечетном &.
§7] ВНЕШНИЕ ФОРМЫ И КОВАРИАНТНЫЕ ПОЛИВЕКТОРЫ 361 4) Внешнее умножение внешних форм ассоциативно: для любых шк, со1, иош. 10. Таким образом, для внешних форм получается полный аналог с алгеброй Грассмана1), которая была определена нами по отношению к контравариантным поливекторам, т.е. поливекторам в L. Однако мы покажем в следующем параграфе, что здесь имеется не только аналогия, а в точности алгебра Грассмана, но только ковари- антных поливекторов, т. е. поливекторов в пространстве L*, сопряжен- сопряженном данному пространству L. Тем самым будут доказаны свойства, перечисленные в п. 9. § 7. Внешние формы и ковариантные поливекторы 1. Пусть дана полилинейная форма i1...ihx{1 ...хгкк, A) где xj — координаты вектора Xj по какому-нибудь базису ei, ..., еп в L. Мы знаем, что с каждой такой формой инвариантно и взаимно однозначно сопоставляется ее тензор: где е1, ..., еп — базис в L*, взаимный с базисом ei, ..., еп в L (см. § 7 гл. V). Численное значение полилинейной формы A) на конкретно взятых векторах xi, ..., х^ есть полная свертка тензора B) с этими вектора- векторами, причем вектор х\ свертывается с еп, вектор х<± свертывается с ег2 и т.д. Вспомним теперь, что каждый вектор сопряженного пространства L* является линейной формой от векторного аргумента из L. Кроме того, значение этой линейной формы на данном векторе х из L и есть как раз свертка вектора х с тем вектором из L*, который изображает эту форму. В данном случае для вектора Xj = х^е\ + • • • + xjen вследствие взаимности базисов ei, ..., еп и е1, ..., еп имеем e\xj) = х)е\е{) + • • • + х)е\е{) + • • • + х]е\еп) = х). C) Теперь вместо A) мы можем написать w(Xl, ...,хк) = 5>п-<*е<1(*1).. .eik(xk). D) Формула D) показывает, что произвольная полилинейная форма u)(xi, . . . , хк) разлагается в сумму произведений независимых форм х) См. подстрочное примечание на стр. 334.
362 поливекторы и внешние формы [Гл. X е1(х), ..., еп(х) совершенно также, как тензор и этой формы разлага- разлагается в сумму произведений одновалентных тензоров е1, ..., еп. Этим выражается уже давно известный нам изоморфизм между полилиней- полилинейными формами и их тензорами, благодаря которому все, что говори- говорилось о поливекторах, можно непосредственно перенести на внешние формы. При этом, однако, нужно иметь в виду два обстоятельства: 1) В §§ 1-4 мы имели дело с контравариантными поливекторами. Сейчас мы имеем дело с полилинейными формами, которым отвеча- отвечают ковариантные тензоры. Таким образом, мы прежде всего должны определить ковариантные поливекторы. Это определение следует сде- сделать по абсолютной аналогии с определением контравариантных поли- поливекторов, то есть ковариантным поливектором называть косой ковари- антный тензор, а косой тензор определить как совпадающий с альтер- альтернацией. 2) Альтернация форм определена нами без непосредственной ана- аналогии с альтернацией тензоров, почему в § 5 и был введен символ ( ) вместо [ ]. Поэтому нам нужно доказать следующее утверждение. Если u)(xi, . . ., Xk) — произвольная полилинейная форма A), и — ее тензор B), то тензор альтернации этой формы равен альтернации ее тензора (т. е. форма (uj(xi, . . ., Xk)) имеет тензор [о;]). Докажем это. Альтернация формы определена в § 6 с помощью пе- перестановок аргументов xi, ..., Xk, именно (и(хи ..., Хк)) = ^] Отсюда и из D) имеем (и>(Х1, ..., хк)) = ^ В равенстве E) индексы ii, ... ,ik принимают всевозможные значения от 1 до п, индексы ji, ..., jk образуют всевозможные перестановки чисел 1, ..., к. С другой стороны, по определению альтернации тензора и вслед- вследствие формул (8) из (9) § 1 имеем \ix ik] В последней сумме все индексы ii, ..., г&, ai, ..., а& независимо друг от друга пробегают значения 1, ..., п. Нужно доказать, что формула F) дает тензор полилинейной фор- формы E). Мы знаем, что F) является тензором полилинейной формы ^ G)
§7] ВНЕШНИЕ ФОРМЫ И КОВАРИАНТНЫЕ ПОЛИВЕКТОРЫ 363 Поэтому нужно установить совпадение полилинейных форм E) и G). Очевидно, для этого достаточно проверить равенство Зк \ — ) — при любых фиксированных значениях индексов ii, ..., г&, считая , что все они различны (иначе (8) дает 0 = 0, см. п. 13, § 1). В правой части (8) отличны от нуля лишь те слагаемые, для которых индексы а±, ..., a.k образуют какую-нибудь перестановку номеров ii, ..., г&. Поэтому в правой и левой частях (8) одинаковое число А;! ненулевых слагаемых. Между ними имеется естественное взаимно однозначное соответствие. Именно, пусть ji, ..., jk — какая-нибудь произвольно выбранная перестановка номеров 1, ..., к. Тогда, переставляя в соответствующем слагаемом левой части (8) формы еп (xj1 ),..., еЪк (xjk), получим новый порядок их расположения: e^(xh)... e^(xjk) = e^(Xl). ..е^(хк). (9) Ему соответствует вполне определенное слагаемое правой части (8). Это соответствие взаимно однозначно, поскольку разные перестановки (ji • • • jk) ДаДУт в (9) разные перестановки (а± . . . «&). Остается только заметить, что коэффициенты при соответствую- соответствующих слагаемых слева и справа в (8) равны между собой. Но действи- действительно, переходя от левой части тождества (9) к его правой части, мы переставляем сомножители ell(xj1), ..., elk(xjk) так, чтобы они рас- расположились в порядке возрастания номеров их аргументов; эта же пе- перестановка сомножителей переводит индексы (ii, . . . , i^) в индексы («1, . . ., аи)- Значит, так как, согласно сказанному, подстановки, которые стоят в A0) слева и справа, имеют одну и ту же четность. Таким образом, установлена справедливость равенства (8), откуда следует, что [со] является тензо- тензором формы (lj(xi, . . ., Xk))- 2. Теперь больше нет смысла сохранять символ ( ), и в дальней- дальнейшем альтернацию полилинейной формы мы будем обозначать квад- квадратными скобками, так же как и альтернацию тензора, т.е. считать, что [и(хи . . . , хк)] = M^i, • • •, хк)). (И) 3. После изложенного мы можем непосредственно перенести на формы основные результаты и соотношения, установленные в §§ 1-4 для поливекторов. 1) Пусть имеются линейные формы (каждая от одного аргумента) ), ^2(^2), • • •, Uk(xk)- Альтернацию их произведения можно за-
364 ПОЛИВЕКТОРЫ И ВНЕШНИЕ ФОРМЫ [Гл. X писать в виде [Ul(x1)u2(x2) . . . Uk(xk)] = — Y; Sll.::'kkuii (^l) • • • игЛХк)- Обратим внимание читателя на то, что в формуле A2) аргументы #1, ..., хк во всех слагаемых расположены в натуральном порядке. Согласно пункту 13 из § 1 справедливо тождество Из A2) и E) следует, что для базисных форм е1, ..., еп, взятых в любом числе к и при любом их расположении, имеем • • • е*-(хк)] = 1 ))\-)kkeJ1{x1)...eJk{xk). A3) 2) Если u)(xi, . . ., хк) — любая форма, записанная в виде D), то [U)(xi, . . . , Xk)] = 5J^n...u[en(^l) • • • е1к(хк)] = = ^2и^1.-лк]ег1(х1) • • • егк(хк). В связи с этим см. п. 15 § 1. 3) Косые формы могут быть охарактеризованы условием U21...U =^[21...U], т. е. условием косой симметрии их коэффициентов по любой паре ин- индексов (см. § 1, п. 18). 4) Внешнее произведение нескольких базисных форм е1(х), ... ..., еп(ж), взятых в любом числе и в любом порядке, может быть вы- выражено формулой е11(Х1) Л ei2(x2) Л ... Л eik(xk) = k\ [eil(x1)ei2(x2) . . . eih(xk)]. A4) Формула A4) доказывается аналогично формуле G) § 2, поскольку мы можем понимать альтернацию в смысле формулы A3) (которая имеет такое же строение, как и (9) из § 1). 4. Из формул A4), A3) и C) получаем eh(Xl) Л ei2(x2) Л ... Л eik(xk) = Здесь ™3к _ •Хк - A5) Xh — минор порядка к матрицы X =
§7] ВНЕШНИЕ ФОРМЫ И КОВАРИАНТНЫЕ ПОЛИВЕКТОРЫ 365 составленной из координат векторов х\,..., Xk- Индексы ii,..., ik ука- указывают номера столбцов матрицы X, участвующих в миноре уг1"Лк. Следует оговориться, что слово «минор» мы здесь употребляем в услов- условном смысле, поскольку не предполагается, что индексы ii, ..., ik идут в порядке возрастания. Формула A5) дает численные значения одночленных внешних форм, представляющих собой внешние произведения базисных форм е1(ж), ..., еп(х). Эти одночленные формы, как всякие внешние фор- формы, являются функциями простого поливектора, в данном случае по- поливектора р = х\ А х2 А . . . Л Xk- Числа Угг"Лк совпадают с координа- координатами простого поливектора р (см. §4, пп. 5, 6). Если в пространстве L введена евклидова метрика и базис ei, ..., еп ортонормированный, то угг.'Лк ПрИ ^! < г2 < . . . < ifc суть ориентированные объемы проекций поливектора р на координатные плоскости (см. § 4, п. 5). 5. Произвольная внешняя форма ик(р), р = Ж1ЛЖ2Л. . .Лж^, может быть выражена следующим образом через базисные формы (аналогич- (аналогично п. 7 §2): Напомним, что звездочка означает суммирование при условии i\ < < i2 < . . . < ik- Из A5) и A6) имеем ик{р) = *Уиг1..ЛкУ^-Лк. A6а) 6. Поскольку значение линейной формы ег на произвольном век- векторе х = xxt\ + • • • + хпеп равно координате хг значают линейную форму ег(х) = хг и вместо A6) пишут п..лкхгг Ах12 А ...Ахгк. A7) 7. Для внешней формы второй степени (или, как иногда говорят, внешней квадратичной формы) разложение A6) в трехмерном про- пространстве имеет вид oj = CxJi2e1(xi) А е2{х2) + oj2^e2{xi) А е3{х2) + ooi^e1{xi) А е3{х2). A8) Наряду с этим, учитывая п. 6, можно написать также и = ю\2хх А х2 + ш2ъх2 А х3 + +а;1зж1 Л х3. A9) Записи A8) и A9) выражают одно и то же в разных способах обо- обозначения. Запись вида A7) или A9) условная и может вызвать недо- недоразумения. Поэтому, употребляя ее, нужно помнить, что ж1, х2, ... не являются координатами векторов, а обозначают линейные формы; например: x1Ax2 = e1(Xl)Ae2(x2)= e^Xl\ e\\Xl\ = Х\ Х\ с \ 2/ с V ^/ ^2 2
366 поливекторы и внешние формы [Гл. X Для исчерпывающего разъяснения возьмем числовые данные. Пусть = —lei Тогда х Ах — 2 3 1 5 = 13. Здесь найдено числовое значение формы х1 А х2 = е1 Л е2 на кон- конкретной паре векторов. Но нужно, конечно, помнить, что сама форма е1 Л е2 как элемент алгебры Грассмана не есть число. 8. В интегральном исчислении и в теории дифференциальных урав- уравнений используются внешние формы, аргументами которых являются дифференциалы переменных. Тогда в выражениях вида A7), A9) вме- вместо х1, ..., хп пишут соответственно dx1, ..., dxn. Так, например, часто встречается внешняя форма вида A9) в записи и = Р dx1 A dx2 + Q dx2 A dx3 + R dx3 A dx1, где коэффициенты Р = CJ12, Q = c^23, R = —^13 сами являются функ- функциями аргументов ж1, ж2, х3. 9. Запись внешней формы в виде A7) удобна в тех случаях, когда приходится переходить к новому базису и даны выражения старых ко- координат через новые: B0) Тогда имеет место следующее равенство: xh Axi2 A ...Axik = * J2 A ... Л xjk, B1) где Dll,'"lk — минор матрицы , стоящий на пересе- ТУП М' • • • ik и столбцов с номерами j[, ..., j'k чении строк с номерами ii, ... U'l<32 <¦¦¦<&)¦ Доказательство формулы B1) проводится путем почленного пере- перемножения линейных форм х11,..., хЪк, которые следует рассматривать как линейные комбинации форм xJl, ..., х^п согласно равенствам B0).
§8] СЛУЧАЙ ТРЕХМЕРНОГО ПРОСТРАНСТВА 367 При этом получаем xh A xi2 А . . . A xik = I 7 pll pik^j 1 к I j>Ji Д Д j.Jfg __ Замечание. Формула B1) может быть написана сразу же на основании пп. 5, 6 § 4. Достаточно в формуле E) указанного параграфа в качестве векторов Ь\, ..., bu взять формы х11, ..., х%к, а в качестве векторов ei, ..., еп взять формы х1 , ..., хп . 10. В заключение параграфа сформулируем три важные теоремы о внешних формах, которые получаются из определений и результатов § 3 заменой L на L*. Теорема 1. Ранг г всякой внешней формы второй степени есть четное число, не превышающее размерности пространства (г = 2т ^ п). Теорема 2. Если uj2{x Л у) — внешняя форма второй степе- степени ранга г = 2т, то найдется система независимых линейных форм рь ..., рт, qu ..., qm такая, что и2(х Лу) =pi(x) Aqi(y) -\ \-Рт(х) Aqm(y). Теорема 3 (Лемма Картана для внешних форм). Пусть р\ [х), ... . . ., Ps{x), qi(x), ..., qs{x) — линейные формы, причемр\(х), ..., ps(x) линейно независимы. Для того, чтобы рх(х) Aqi(y) -\ Ь ps(x) A qs(y) = О, необходимо и достаточно, чтобы существовали разложения вида qi(x) = ацрх{х) Н Ь aisps(x), где oiij = otji (aij — числовые коэффициенты). § 8. Внешние формы в трехмерном евклидовом пространстве 1. В качестве геометрической иллюстрации материала двух преды- предыдущих параграфов рассмотрим внешние формы в трехмерном евкли- евклидовом пространстве Е% и покажем, что они тесно связаны с известны- известными операциями элементарной векторной алгебры. Будем считать, что ei, в2, ез — ортонормированный базис, а, Ь, р, q — зафиксированные векторы, х, у, z — переменные векторы, пробегающие все Е%. Коор- Координаты векторов будем обозначать нижними индексами, так как рас- расположение индексов не имеет значения в силу ортонормированности
368 ПОЛИВЕКТОРЫ И ВНЕШНИЕ ФОРМЫ [Гл. X базиса (в таком базисе контравариантные координаты векторов равны ковариантным, см. гл. VIII). Согласно п. 4 §6 нам нужно рассмотреть &-формы лишь при к = = 1,2,3. 2. Напомним (см. гл. VIII), что всякая линейная форма в евкли- евклидовом пространстве может быть представлена в виде скалярного про- произведения постоянного вектора а на переменный вектор х, и каждый вектор аЕ^з определяет линейную форму (а, х), которую мы сейчас обозначим oj\(x): oj\{x) = (a, x) = а\Х\ + а2х2 + а%х%. A) Формула A) устанавливает линейный изоморфизм между простран- пространством ?з, рассматриваемым как множество векторов а, и простран- пространством линейных форм. Полагая а = е^, мы получим базисные линейные формы и>\о кото- которые будем сокращенно обозначать ио\: ш\ = (еь х) = х{, г = 1, 2, 3. B) Формулу A) можно рассматривать как разложение формы и^ по базису B) и переписать в виде 1 1 . 1 . 1 ^Q"\ 3. Рассмотрим смешанное произведение (а, ж, у), в котором пер- первый сомножитель зафиксирован, а два других меняются. Оно линейно по каждому из аргументов и кососиммет- рично по х и у ((а, у, х) = -(а, ж, у)), так что представляет собой 2-форму, которую мы обозначим со^(хЛу). Из элементарного курса аналитической геометрии известно, что числовое значение оо^(х Л у) равно произве- произведению площади S бивектора х Л у на длину \а\ вектора а и на косинус угла а между заданным вектором а и стандартно ориентированной нормалью бивектора х Л у (рис. 75). Таким образом, и2(х Л у) = (а, х, у) = S\a\ cos a. D) Обозначим через X матрицу, составленную из координат векторов ж, у: У\ У2 Уз и положим Xi Уг X -- X j Уз 1 i, j = 1, 2, 3, E)
СЛУЧАИ ТРЕХМЕРНОГО ПРОСТРАНСТВА 369 Тогда по известной формуле для смешанного произведения имеем и2а(х Ay) = 01V23 + «2^31 + a3V12. F) Мы знаем (см. §7, формулы A6)—A9)), что произвольная 2-форма uj2{x А у) в Е3 имеет вид Возьмем вектор а с координатами CL\ = 0J23, CL2 = ~dJi3, CL3 — 6^12- (8) Тогда правые части формул G) и F) совпадут. Вывод. Любая внешняя форма второй степени в трехмерном ев- евклидовом пространстве может быть представлена в виде смешанно- смешанного произведения (а, х, у) при надлежащем выборе зафиксированного вектора а, который однозначно определяется формулами (8). 4. Полагая а = е^, получим 2-форму uj2. , которую сокращенно обо- обозначим и2 (г = 1, 2, 3). Используя формулы B), E), F) и учитывая пп. 5-7 § 7, можем написать: uj\(x А у) = V23 = — V32 = ш\(х) А оо1(у), "| 0J2(xAy) = V31 = -V13 =w31WAo;11(i/), > (9) w32(a;Ai/) = Vi2 = -V21 = и\(х) Аы\(у). ) Численное значение каждой из 2-форм (9) равно площади проек- проекции бивектора хАу на соответствующую из координатных плоскостей. Геометрически ясно, что должно быть именно так. Например, произ- произведение площади бивектора х А у на косинус угла 7 между базисным вектором ез и нормалью бивектора х А у равно площади проекции би- бивектора х А у на координатную плоскость Е\2, натянутую на векторы е\ и е2 (см. рис. 76). Длина вектора, участвующая в формуле D), в данном случае равна единице (а = ез). х3, Рис. 76. Используя (9), разложение F) можно переписать так: 2 S\ \ \ Auj\ \ A uj\. A0)
370 поливекторы и внешние формы [Гл. X Формула A0) устанавливает линейный изоморфизм между множе- множеством векторов а и пространством 2-форм с аргументами из Е%. Имен- Именно, сложению форм и^ и и^ соответствует сложение векторов умножение формы на число отвечает умножение вектора на число 5. Смешанное произведение трех переменных векторов (ж, у, z) представляет собой внешнюю форму третьей степени, которую мы обо- обозначим ш\: и\(х Ay Az) = (ж, у, z). Ее значение на поливекторе х А у A z равно ориентированному объе- объему V этого поливектора. Поскольку пространство внешних форм тре- третьей степени одномерно (к = п, см. в связи с этим гл. V, §8, п. 8), то мы имеем и>3(х, у, z) = \и\(х А у Az) = А (ж, у, z), т. е. произвольная внешняя форма третьей степени пропорциональна смешанному произведению ее аргументов и однозначно определяется числовым множителем А. 6. Покажем, что внешнему умножению линейных форм соответ- соответствует векторное умножение векторов. Именно, справедлива следую- следующая формула: =^ ахЬ ](хАу), A1) где [а х 6], как обычно, обозначает векторное произведение. Доказательство. Пользуясь свойствами внешнего умножения, перечисленными в п. 9 § 6, находим Л^+ I1 I2 u\Au\. A2) Сравнивая A2) и A0), получаем A1). Обратим внимание на то, что выкладка A2) с алгебраической точки зрения совпадает с выводом формулы векторного произведения через координаты сомножителей, хорошо известным из элементарного курса аналитической геометрии. 7. Формула A1) позволяет дать другое доказательство того, что произвольная 2-форма uj2{x А у) в Е% представляется в виде смешан- смешанного произведения (а, ж, у). Именно, по теореме 2 из п. 10 § 7 найдутся две линейные формы, которые, согласно п. 2 этого параграфа, можно записать в виде и1 и о;*
§8] СЛУЧАЙ ТРЕХМЕРНОГО ПРОСТРАНСТВА 371 такие, что w2{xAy)=w1p{x)Mj1q{y). A3) Полагая а = [р х q], из A3), A1) и D) получаем и2(х Ay) = и2а(х Ay) = (a, x, y). 8. Внешнему умножению линейной формы на 2-форму соответ- соответствует скалярное умножение векторов, именно иЦх) A ьо2(у Az) = (a, Ъ)ьо\(х AyAz) = (a, b)(x, y, z). A4) В самом деле, согласно C) и A0) имеем разложения = 61^2 Auj\ + 62^3 Auj\ + Ь%и\ A uj\. Перемножаем почленно выражения A5) и, используя свойства внеш- внешнего умножения, находим и\ Aul = (ai&i + a2&2 + а»ъЬз)(и\ А ш\а\). A6) Аналогично формуле A5) § 7 можно показать, что значение 3-формы uj\AujIAujI на поливекторе xAyAz равно определителю, составленному из координат векторов ж, у, z, то есть, и>1 Аи>1 Аи>1 =и)\. A7) Из A6) и A7) следует A4).
ГЛАВА XI. ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА § 1. Общее уравнение гиперповерхности второго порядка 1. Пусть дано действительное n-мерное аффинное пространство iln и в нем система аффинных координат с началом О и базисом е±,..., еп. Гиперповерхностью второго порядка в iln называется геометриче- геометрическое место точек М Е iln, у которых радиус-вектор х — ОМ удовле- удовлетворяет уравнению а(х, х) + 2Ь(х) + с = 0, A) где а(х, х) — квадратичная форма, Ь(х) — линейная форма, с — по- постоянная. Формы а(ж, х) и Ь(х) предполагаются инвариантными отно- относительно изменения базиса. 2. Если положить х = ОМ = х\е\ + • • • + хпеп, то уравнение A) получит координатную запись: ikXiXk + 2 ^2 bi%i + с = 0. B) Здесь xi, ..., хп — координаты точки М. Их называют текущими ко- координатами, считая М любой точкой. Квадратичная форма а(х, х) = = ^2 o>ijXiXj называется группой старших членов уравнения A) или B). Линейная форма 2Ь(х) = 2^М; называется группой членов первой степени. Постоянная с называется свободным членом уравнения. Замечание. Всюду в пределах этой главы мы будем помечать координаты нижними индексами, так как пользоваться тензорной ал- алгеброй не придется. 3. Может случиться, что в действительном Ип для некоторого урав- уравнения вида B) нет ни одной удовлетворяющей ему точки. Все-таки и про такое уравнение говорят, что оно есть уравнение гиперповерхности второго порядка. Иногда при этом гиперповерхность называют мнимой (или нулевой). Например, говорят, что уравнение х2 + у2 + z2 + 1 = 0 есть уравнение мнимой сферы (в евклидовом пространстве с системой декартовых прямоугольных координат х, у, z). Разумеется, за таки- такими словами не содержится определенного геометрического смысла, по- пока мы остаемся в действительном пространстве. Но единообразие тер- терминологии удобно по формально-алгебраическим соображениям. Дело в том, что предметом теории, которой посвящена эта глава, по суще- существу являются не столько гиперповерхности, сколько сами уравнения. В теории этих уравнений невыгодно какие-либо случаи исключать из
§ 2 ] ПЕРЕНОС НАЧАЛА КООРДИНАТ 373 рассмотрения, во-первых, потому, что заранее не ясно, определяет ли уравнение какое-нибудь непустое множество точек или нет; во-вторых, даже в том случае, когда оно определяет пустое множество, его левая часть может иметь какой-либо механический или физический смысл. 4. Можно доказать, что в комплексном аффинном пространстве всякое уравнение вида B) определяет непустое множество точек. Одна- Однако мы ограничиваемся действительным iln. Лишь в некоторых случаях мы будем говорить о комплексных точках (например, если совместное решение уравнений прямой и гиперповерхности приводит к комплекс- комплексным значениям искомых координат). 5. Уравнение B) с буквенными коэффициентами называется об- общим уравнением гиперповерхности второго порядка. Оно содержит \(п + 1)(п + 2) членов. Число это при сколько-нибудь значительных п весьма велико. Поэтому непосредственное исследование гиперповерх- гиперповерхности по ее уравнению, написанное в произвольной системе координат, оказывается затруднительным. Далее будут указаны приемы, которые позволяют общее уравне- уравнение B) привести к некоторым специальным видам, когда уравнение является неполным и называется каноническим. § 2. Изменение левой части уравнения при переносе начала координат 1. Всю левую часть уравнения гиперповерхности второго поряд- порядка обозначим символом 2F, рассматривая F как функцию текущих координат: 2F(a?i, . . ., хп) = ^2а{кх{хк + 2^6^ + с. Согласно § 2 гл. III при переносе начала координаты меняются по формуле xi = xi + х®, где (xi) — старые координаты произвольной точки, (х{) — ее новые координаты, (х®) — координаты нового начала в старой системе координат. Подставим эти выражения в функцию F и перегруппируем слагае- слагаемые, собрав члены со вторыми и первыми степенями новых координат. При этом существенно используем симметричность матрицы квадра- квадратичной формы (dik = CLki)'- 2F(xu ...,xn) = Y, a^i + хо{)(хк + x°k) + 2 Y, bi{xi + х0{) + с =
374 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI Если функцию F в новых координатах запишем по старому стан- стандарту: IF = Х^ п •/ tti + 2 Х^ hr ¦ А- с ТО aik = aik, (I) / \ 6<, (П) ix°i+c. (HI) 2. Величина с представляет собой левую часть первоначального уравнения, в которую вместо координат текущей точки подставлены координаты нового начала: Обратим внимание на то, что формулу (II) можно записать иначе: Здесь частная производная функции F по аргументу Х{ подсчитана по координатам нового начала (х\, . . ., х°п). 3. Для более компактной записи формул A)-(Ш) введем матрицы a>in 0>п1 В = din a>ni апп Ьп Ьп с Матрицу В и другие матрицы порядка п + 1 будем выделять спе- специальным шрифтом. Соотношение (I) в матричной форме запишется так: А = А. Aа) Функцию F с помощью искусственного приема удобно записать в виде квадратичной формы. Для этой цели введем дополнительную ко- координату жп+1, употребляя ее как условный символ и всюду считая, что хп+1 = 1. Кроме того, будем считать, что bi = a^n+i = &n+ib с = an+in+i. Тогда формулы Xk = Xk + х®к можно записать в виде следующих соотношений: rfb Z» _|_ _|_ /v»0^ «Лу J_ «Лу J_ | | «Лу 1 «Лу ^ /^» /^» I I /"V» /^» A) Хп — Хп+1 = Х
ИЗМЕНЕНИЕ ОРТОНОРМИРОВАННОГО БАЗИСА 375 Последнее равенство показывает, что xn+i = 1, так же как жп+ь За счет введения дополнительной координаты все формулы преоб- преобразования координат становятся однородными (без свободных членов). Кроме того, сама левая часть уравнения B) § 1 становится однородной. Именно, в новых обозначениях, можно написать 2F = ^2 aikXiXk i,k=l an+ln+1xn+1xn+1 = п+1 = ? i, k=l Получилась квадратичная форма с матрицей В. Матрица преобразования A) выражает старые координаты через новые и согласно стандарту должна обозначаться Р*: р* = О О Рассматривая функцию F как квадратичную форму аргументов #1, ..., жп+ь мы можем применить известную формулу для преобра- преобразования матрицы квадратичной формы. В результате получим мат- матричное равенство В = РВР*, B) которое охватывает все формулы A)-(Ш). Матричная формула B) позволяет сформулировать важную тео- теорему. Теорема 1. Определитель матрицы В и ее ранг являются ин- инвариантами относительно переноса начала координат, то есть, Det В = Det В, Rang В = Rang В. Доказательство. Непосредственно видно, что Det P* = = Det P = 1, поэтому теорема вытекает из формулы B). Замечание. Что касается матрицы Л, то при переносе начала координат она сама является инвариантом, то есть все ее элементы сохраняются. § 3. Изменение левой части уравнения при изменении ортонормированного базиса 1. Чтобы не усложнять вычислений, будем в дальнейшем считать, что мы находимся в евклидовом пространстве (точечном) и пользуемся ортонормированными базисами.
376 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI Допустим, что мы делаем переход от одного ортонормированного базиса к другому: Н У /nien, е'п = /inei H У Ортогональная матрица / = ||/ij|| записана так, что возрастание первого индекса идет по строке. Координаты точек преобразуются по формулам хх = 111х[ Л У hnx'n, Л Матрица hi • • • hn /* = также является ортогональной. Формулы A) — однородные (не содержат свободных членов), так как начало координат сохраняется на месте. 2. Перейдем в левой части уравнения B) § 1 к новым координатам по формулам A). Имеем 2F(Xl, ...,хп) = ^<кФ'к+^Ь'^ + с', где штрихами обозначены новые коэффициенты. Вследствие однород- однородности формул A) группы членов разных степеней преобразуются ав- автономно. В частности, свободный член сохраняется без изменения: с' = с. Аналогично Отсюда в матричной записи получим А1 = IAI*. Вследствие ортогональности матрицы / ее транспонированная мат- матрица равна обратной: /* = 7; поэтому А' = 1АГ1. Из этого матричного равенства аналогично п. 4 § 2 гл. VII получается Теорема 1. При переходе от одного ортонормированного базиса к другому левая часть уравнения имеет инварианты Det Л, Rang Л и характеристический многочлен р(Х) матрицы А.
§3] ИЗМЕНЕНИЕ ОРТОНОРМИРОВАННОГО БАЗИСА 377 Замечание 1. Многочлен р(А) содержит Det А в качестве од- одного из коэффициентов, поэтому инвариантность Det А вытекает из инвариантности р(А). Замечание 2 . Если напишем р(А) подробно Р(А) = (-1)п{Хп - Pl\n~l + Р2Хп~2 + ¦¦¦ + (-1)>„}, то увидим, что pi, р2? • • • ? Рп инвариантны; т.е. при переходе к ново- новому ортонормированному базису сохраняются суммы главных миноров первого порядка матрицы Л, суммы главных миноров второго порядка и т. д. Таким образом, Rang Л' = Rang Л, р[ =p1,...,p/n_1 =pn_i, Det Л'= Det A. 3. Найдем закон преобразования матрицы В. Снова введем обозна- обозначения bi = Oin+ъ с = fln+in+i- Тогда п+1 2F = ^ aikXiXk, i,k=l где xn+i = 1. Припишем к формулам A) еще одно равенство и полу- полученные формулы сокращенно запишем так: \ } B) хп+1 — Хп+1' Матрица формул преобразования B) имеет вид ... hn О О ... О 1 Нетрудно сообразить, что Действительно, последнее из соотношений B) обращается триви- тривиально: нужно только поменять местами левую и правую части. Что касается формул A), то их обращению соответствует транспонирова- транспонирование матрицы /*. Таким образом искомая формула преобразования матрицы В квад- квадратичной формы 2F имеет вид: В/ = 1В1* или В/ = 1ВГ1. C) Из формулы C) получается Теорема 2. При переходе от одного ортонормированного базиса к другому определитель и ранг матрицы В инвариантны: Det В' = Det В, Rang В' = Rang В.
378 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI 4. Из формулы Aа) § 2, теоремы 1 § 2 и теорем 1-2 § 3 вытекает Следствие. При общем преобразовании координат, состоящем из переноса начала и перехода от старого ортонормированного базиса к новому ортонормированному базису, инвариантами являются DetB, Rang В, Dei A, Rang Л и характеристический многочлен р(Х) матрицы А. § 4. Центр гиперповерхности второго порядка 1. Центром гиперповерхности второго порядка обычно называют такую точку пространства iln, относительно которой все точки гипер- гиперповерхности расположены симметрично парами. Таким образом, когда говорят о центре, то подразумевают центр симметрии (рис. 77). К сожалению, в действительном пространстве это определение те- теряет силу в тех случаях, когда для уравнения гиперповерхности нет ни одной удовлетворяющей ему точки. Однако и в таких случаях могут быть точки, которые целесообразно считать центрами по алгебраическим соображениям. Например, цен- центром мнимой сферы х2 + у2 + z2 + 1 = 0 является начало координат. Поэтому мы предпочтем определить понятие центра гиперповерхности второго порядка иным способом. 2. Рассмотрим неполное уравнение Xk + c = 0. A) Если точка (х±, . . ., хп) лежит на гиперповерхности A), то и сим- симметричная ей точка (—х\, . . . , — хп) тоже лежит на гиперповерхно- гиперповерхности A). Следовательно, если существуют точки, удовлетворяющие уравне- уравнению A), то начало координат является центром симметрии гиперпо- гиперповерхности A). Исходя из этого, мы дадим следующее формально-алгебраическое определение центра. Центром произвольной гиперповерхности второго порядка мы бу- будем называть такую точку, что если поместить в нее начало координат, то уравнение гиперповерхности примет неполный вид A). Таким обра- образом, мы объявляем центром всякую точку, относительно которой левая часть уравнения обладает центральной симметрией (не меняется при замене х\, ..., хп на —х\, ..., — хп).
5] КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЯ 379 3. Пусть дано общее уравнение второй степени: ikXiXk + 2 ^2 bi^i + с = 0. Мы хотим выяснить, существует ли центр, и найти его. Перенесем начало координат в точку О (ж?, . . . , ж^); получим уравнение 2 ^2 bi%i + с = 0. Новое начало будет центром в том и только в том случае, когда Ь{ = 0, г = 1, ..., п. B) Равенства B) с учетом равенств (II) § 2 дают так называемые уравне- уравнения центра (уравнения, определяющие центр) bi = 0. В подробной записи уравнения центра выглядят так: ? Н \-а1пх°п = -&1, 1 > C) H h ftnn^° = -Ьп. ) Матрица системы C) совпадает с матрицей Л. Если Det Л ф 0, то система C) имеет единственное решение. Тогда гиперповерхность имеет единственный центр. Такая гиперповерхность называется центральной. Если Det А = 0, то система C) несовместна, и тогда центров нет (как, например, у параболы), либо совместна, и тогда центров беско- бесконечно много (как у круглого цилиндра или пары параллельных плос- плоскостей). 4. Само определение центра подсказывает первый шаг упрощения уравнения: нужно перенести начало координат в центр. 5. Введем два символа: 6 = Det A, A = Det В. Признаком центральной поверхности является неравенство S ф 0. § 5. Приведение к каноническому виду общего уравнения гиперповерхности второго порядка в евклидовом пространстве 1. Гиперповерхности второго порядка распределяются на несколь- несколько классов, для которых получаются разные простейшие, как говорят, канонические формы уравнений. 2. В теоретическом изложении мы не будем стремиться к экономии операций и начнем с поворота системы координат. При практических вычислениях, если поверхность центральная, то лучше в качестве пер- первого этапа перенести начало координат в центр.
380 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI 3. Будем рассматривать гиперповерхность в евклидовом простран- пространстве и пользоваться только ортонормированными базисами. Пусть да- дано общее уравнение 2F(xi, . . . , хп) = 0. Прежде всего рассмотрим самосопряженное преобразование с матрицей Л, которая является мат- матрицей квадратичной формы — группы старших членов. Все корни Ai, ..., Ап характеристического многочлена этого преобразования дей- действительны, и существует ортонормированный базис из собственных векторов е[, ..., е'п, причем вектору е'к соответствует собственное зна- значение А&, к = 1, ..., п (см. гл. IX, § 3). Перейдем к этому базису, сохраняя пока прежнее начало координат. Тогда группа старших членов примет канонический вид ^2,aikXiXk = Ai(^iJ H Ь Ап(ж'пJ, а левая часть уравнения гиперповерхности упростится так: 2F = AiKJ + • • • + An«J + 2b[x[ + • • • + 2b'nx'n + с. Коэффициенты членов первой степени изменились; поэтому они поме- помечены штрихами. Свободный член с остался без изменений. 4. Дальше нужно рассмотреть несколько случаев. 1) Все характеристические корни отличны от нуля: Тогда нужно выделить полные квадраты: ААDJ + 26,4 = А* (х'к + ^) - Затем сделаем перенос начала координат по формулам После этого членов первой степени не будет, поэтому новое начало ко- координат является центром поверхности. Получим Ai?2 + -.. + An?2 =#, (I) где Уравнение (I) относится к числу канонических. 2) Ai ф 0,..., \г ф 0, Ar+i = . . . = Ап = 0; г — ранг квадратичной формы старших членов; г ^ п — 1. Здесь обстановка несколько усложняется, и чтобы избежать слиш- слишком больших вычислений преобразование формы старших членов нуж- нужно провести с некоторым расчетом.
§5] КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЯ 381 Прежде всего найдем собственные векторы, отвечающие Ai, ..., Лг. Как нам известно, их можно выбрать так, чтобы они образовали орто- нормированную систему е[, ..., е'г (см. § 3 гл. IX). Остальные базисные векторы определим позже. Пусть мы имеем первоначальное уравнение в исходных координа- координатах ^2 UikXiXk + 2 ^2 bi^i + с = 0. Его линейная часть однозначно определяется заданием вектора b = {&i, 62, • • •, Ьп}. Разложим вектор b на две составляющие, одна из которых лежит в линейной оболочке е[, ..., е'г, а другая ортогональна к указанной линейной оболочке: Для этого нужно положить ft = F, ei), ...,0г = (Ь,е'г), p = -b + Y,fce'i- г=1 Так построенный вектор р ортогонален подпространству L(e[, . . . , е'г). Если р ф в, то е'п мы направим по вектору р. Тогда где \i — числовой коэффициент. Вектор е'п берется единичным. Его можно направить так, что будет /i = |р|, или так, что будет /i = — |р|. Векторы е'г+1, ..., е'п_1 возьмем таким образом, чтобы они обра- образовали вместе с ранее построенными векторами ортонормированную систему: е[, е'2, ..., e'r, e'r+lJ ..., е'п_х, е'п. В остальном выбор векторов е^,+1, ..., е'п_1 произволен. Если р = 0, то векторы е^,+1, ..., е'п возьмем как угодно, лишь бы система е[, ..., е'п была ортонормированной. Заметим, что и в этом случае соблюдается равенство но только ц = \р\ = 0. Итак, Группы членов второй степени, первой степени и нулевой при пе- переходе к новому базису преобразуются автономно. Группа старших членов в новом базисе примет вид = Ai(^iJ + ••• + Xr(x'rJ.
382 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI Группу членов первой степени естественно записать в виде скаляр- скалярного произведения ^Ькхк = F, х). Вследствие равенства A) F, х) = (/3iei + • • • + f3re'r - /ie'n, x) = plX[ + • • • + /3rx'r - ц,х'п, так как в ортонормированном базисе скалярное произведение любого вектора на базисный равно соответствующей координате: (е^, х) — х\. Таким образом, после перехода к новому базису получается 2F = AiKJ + • • • + \r{x'rf + 2^х[ + • • • + 2prx'r - 2fj,x'n + с = 0. Свободный член с остался прежним. Далее выделяем полные квадраты при к = 1, ..., г: л,DJ + 2/3.4 = Afc D + f* V - -L/32. \ А/. / Л/. Затем делаем перенос начала (только в направлении координатных осей с номерами 1, ..., г): , _ ~ _ Л , _ ^ Х^ — Х\ , X г_|_1 — %r-\-li м После этого уравнение принимает вид \\х\ + h Лгж2 - 2/хжп = Я. Если \i = 0, то получим уравнение Ai?? Н \- Хгх2г = Я, (*) которое относится к числу канонических. Если /х ф 0, то напишем 2/хжп + Я = 2/i ( жп + V ^ Сделаем дополнительный перенос начала координат по направле- направлению оси хп на величину —¦?-. Обозначений координат менять не будем, чтобы не осложнять запись. Уравнение примет вид \\х\ + Ь \гх2г — 2{ixn = 0. (**) И это уравнение является каноническим. Никаких других случаев, кроме рассмотренных выше, быть не мо- может. Остается только навести порядок: составить каталог и раскласси- расклассифицировать гиперповерхности второго порядка.
КЛАССИФИКАЦИЯ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 383 § 6. Классификация гиперповерхностей второго порядка в евклидовом пространстве 1. На основании упрощения уравнений, проведенного выше, есте- естественно выделяются следующие классы гиперповерхностей: I) S = Det А ф 0. Это значит, что ни одно А; не равно нулю. Сюда попадают все случаи, помеченные номером (I) и только они. Имеем каноническое уравнение \ix\ + --- + \nxl = H. (I) Здесь и в дальнейшем мы пишем текущие координаты без дополни- дополнительных пометок. II) 8 = Det А = 0, \i ф 0, г = Rang А = п — 1. Имеем соответствую- соответствующее каноническое уравнение \\х\ Н Ь An-i^.-L - 2/^хп = 0 (II) (оно получается из (**) § 5 при г = п — 1). I') S = 0, \i = 0. (Так как S = 0, то г < п.) В этот класс входят поверхности с каноническими уравнениями вида (*) § 5, то есть, Ai^ + ... + Ar^ = #. (Г) где 1 ^ г ^ п — 1. II') ? = 0, /J, ф 0, г < п — 1. Сюда попадают поверхности с канониче- каноническими уравнениями вида (**) § 5 при г < п — 1, то есть, \ix\ + • • • + \rx2r - 2/лхп = 0. (II7) Здесь 1 ^ г ^ п — 2. Указанные классы исчерпывают все возможности. Случаи, когда уравнение имеет вид (I) или (II), являются основными. Случаи (V) и (II') повторяют основные случаи, но только в подпространстве мень- меньшей размерности. 2. Запишем матрицы Л и В для основных случаев. Случай I. А = Случай 1 = Ai 0 Ai о'- II. О An О о в = в = Ai О Ai О О -я О О О
384 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI Определение. Гиперповерхность второго порядка называется невырожденной, если невырождена матрица В, т.е. если А = Det В ф 0. Очевидно, невырожденными являются поверхности (I) при усло- условии, что Я/0, а также все поверхности (II). 3. Согласно п. 4 §3 величины S = Det Л, А = Det В, г = Rang Л, Rang В и характеристический многочлен р(Х) матрицы А являются инвариантами левой части уравнения в классе орто- нормированных координатных систем. Все эти величины могут быть найдены по ле- левой части общего уравнения гиперповерхности, заданной в любых ортонормированных координатах. Кроме того, мы знаем уравнения центра в любых координатах. Поэтому, не переходя к каноническому уравне- уравнению, мы можем опреде- определить, является гиперповерх- гиперповерхность центральной или нет, является она вырожденной Рис. 78. или нет, найти множество всех центров и вычислить все корни Xj ха- характеристического многочлена матрицы А. Кроме того, для гиперповерхности типа (I) можно определить Н. В самом деле, из п. 2 имеем -#А!...АП = А. При этом Ai . . . An = 8 ф 0. Отсюда Для гиперповерхности типа (II) имеем -/i2Ai ...An_i = A. Но произведение Ai . . . An_i, взятое со знаком минус, равно в слу- случае Ап = 0 коэффициенту рп-\ характеристического многочлена р(Х). При этом следует считать, что характеристический многочлен написан так, как указано в замечании 2 п. 2 § 3. Отсюда находим A)
6] КЛАССИФИКАЦИЯ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 385 Подкоренное выражение в формуле A) положительно, поскольку су- существование и действительность /i установлены предыдущими иссле- исследованиями. 4. Для невырожденных гиперповерхностей случая I имеем Rang/L = n, RangB = n + l. B) Из первого равенства B) и теоремы Кронекера—Капелл и, примененной к системе уравнений центра, заключаем, что все они являются цен- центральными. Рассмотрим их подробнее. 5. Если Ai, ..., Ап и Н — числа одного знака, то гиперповерх- гиперповерхность (I) называется (п — 1)-мерным эллипсоидом. Его уравнение мож- можно переписать так: Величины ai называются полуосями эллипсоида (ai > 0). Нетрудно проверить, что эллипсоид расположен в параллелепипеде, определяе- определяемом неравенствами \х{\ ^ а^, i = 1, ..., п. (При п = 3 см. рис. 78, при п = 2 см. рис. 79.) Обратим внимание на то, что ^-мерный эллипсоид при к = 1 представляет собой эллипс (рис. 79), при к = 0 — пару точек х\ — ±ai (рис. 80). Трудно наглядно изобразить на рисунке эллипсоид C) при п > 3. Одна- Ж2 1 О р ко сопоставление рис. 80, 79 и 78 поможет читателю представить себе, как усложняется ^-мерный эллипсоид с ростом его размерности к. Если а\ = . . . = ап — R, то эллипсоид C) называют (п — 1)-мерной сферой радиуса R. 6. Если Ai, ..., Ап одного знака, Н — другого знака, то поверх- поверхность (I) называется мнимым эллипсоидом. В действительном про- пространстве он не имеет точек. 7. Если Ai, ..., Ап разных знаков -а± о «i x\ и Я/0, то поверхность (I) называ- называется гиперболоидом. В этом случае, Сф разделив обе части уравнения (I) на Я, можно привести его к виду ^2 „2 Г2 2 ^1 + • • • + ^ - fe+1 ^- - 1 ( Величины ai,..., ak называются действительными полуосями, 6i,... . . ., bn-k — мнимыми полуосями гиперболоида D) (ai > 0, bi > 0). 13 нв- Ефимов, Э.Р. Розендорн
386 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI В зависимости от сигнатуры левой части уравнения D) гиперболоиды имеют разное геометрическое строение. В элементарном курсе аналитической геометрии для исследования формы поверхностей рассматривают их сечения различными плоскостями (см., например, рис. 82, 83). Сейчас мы применим такой же прием для того, чтобы составить представление о строении разных гиперболоидов. Рассмотрим частные рис 81 случаи, начиная со знакомых объектов в пространствах малых размерностей: х2 х2 1) При п = 2 уравнение D) принимает вид -| 1 = 1 и задает гиперболу (рис. 81). Рис. 82. Рис. 83. 2) При п = 3 имеются две возможности: двуполостный гиперболоид (рис. 82): Ju -| Ju n Ju о a1 o1 o2 E)
§6] КЛАССИФИКАЦИЯ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 387 и однополостный гиперболоид (рис. 83): 9 9 9 —L _| ?. ± — 1 9 * 9 I 9 af ^2 of 3) n = 4. Здесь нужно рассмотреть три случая: а) Двуполостный гиперболоид 9 9 9 9 /у* ^ ГУ* ^ ГУ* ^ ГУ* ^ _1 _ _2_ _ _3. _ _4 _ 1 /f?\ «? Ъ\ Ь\ Ь\~ { ' аналогично гиперболе и гиперболоиду E) состоит из двух отдельных частей, расположенных в полупространствах х\ ^ а\ и х\ ^ —а\. С гиперплоскостями вида х\ — const при \х\\ > а\ он пересекается по эллипсоидам, полуоси которых увеличиваются с ростом \х\\. С осталь- остальными гиперплоскостями вида Х{ = const (г = 2, 3, 4) гиперболоид F) пересекается по двуполостным гиперболоидам вида E). б) Уравнение 2 2 2 2 Х1 . ^2_ _ ^_3_ _ ^_4_ _ -1 9 ' 9 i 9 i 9 aj ^2 6j Ъ\ задает новый вид гиперболоида, который характеризуется тем, что с каждой из гиперплоскостей вида Х{ = const он пересекается либо по некоторому гиперболоиду (однополостному или двуполостному) либо по некоторому конусу. (Понятие конуса введено в § 12 гл. IV; подроб- подробнее о конусах второго порядка см. ниже, п. 9.) Нужно иметь в виду, что типичным сечением здесь является гиперболоид. Конусы появля- появляются лишь в отдельных гиперплоскостях (\х\\ = ai, \^i\ — ^2); их можно рассматривать как вырожденные гиперболоиды. В трехмерном пространстве нет аналогичной поверхности, а для пространств более высокой размерности это наиболее типичный случай. в) Гиперболоид, аналогичный однополостному: 2 2 2 2 Х1 ¦ Х2 ¦ Х3 Ж4 _ -1 9 9 9 /9 а\ а\ ^з  Со всеми гиперплоскостями х^ = const он пересекается по двумерным эллипсоидам, полуоси которых увеличиваются с ростом |#4|; с осталь- остальными гиперплоскостями Xi = const он пересекается по гиперболоидам (однополостным или двуполостным), которые вырождаются в конусы, если Xi = ±a^. Наглядно изобразить на чертеже гиперболоиды в четырехмерном пространстве затруднительно. Однако можно представить их себе по аналогии со случаями меньших размерностей, показанными на рис. 81-83. При этом нужно учесть, что сечения гиперплоскостями имеют вид поверхностей, изображенных на рис. 78, 82, 83 и 25 (см. также рис. 77 и 88). 13 *
388 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI В общем случае имеем такие возможности: а) п ^ 2, к = 1 — двуполостный гиперболоид, состоящий из двух частей, расположенных в полупространствах х\ ^ а\ и х\ ^ —а\. Гиперплоскости х\ = const (\x\\ > а±) пересекают его по (п — 2)- мерным эллипсоидам, остальные гиперплоскости Х{ = const (г = 2, ... . . ., п) — по двуполостным гиперболоидам. б) п ^ 4, число положительных, а также число отрицательных чле- членов в левой части уравнения E) не меньше двух. Такой гиперболоид с каждой из гиперплоскостей Х{ = const пересекается по некоторому гиперболоиду меньшей размерности (быть может, вырождающемуся в конус). в) п^З, к = п — 1 — гиперболоид, аналогичный однополостному. Все гиперплоскости хп = const пересекают его по (п — 2)-мерным эл- эллипсоидам, остальные гиперплоскости Х{ — const (i = 1, ..., п — 1) — по гиперболоидам или конусам. Нетрудно доказать, (например, индукцией по размерности прост- пространства), что все гиперболоиды, за исключением двуполостных, содер- содержат прямолинейные образующие. Обратим еще внимание на то, что каждая ^-мерная плоскость вида Xk+i = С/.+1, ..., хп — сп (ci = const) пересекает гиперболоид D) по (к — 1)-мерному эллипсоиду, а среди (п — &)-мерных плоскостей вида xi = ci, ..., Xk = Ck (ci = const) имеются такие, которые пересекают гиперболоид D) по (п — к — 1)-мерным эллипсоидам. Можно доказать, что на гиперболоиде D) имеются r-мерные эллипсоиды всевозможных размерностей г ^ тах(^-1, п — к — 1) и нет эллипсоидов более высокой размерности. При п = 2, 3 это видно из сопоставления рис. 79-83. Рассматривать общий случай мы не будем. Если в пространстве, кроме данной евклидовой метрики, ввести другую квадратичную метрику со знакопеременной квадратичной фор- формой, то роль сфер в ней будут выполнять гиперболоиды. В связи с этим двуполостный гиперболоид в четырехмерном пространстве имеет важ- важное значение в теории относительности. 8. Все поверхности с каноническими уравнениями вида (II) явля- являются невырожденными и называются параболоидами. Любой из параболоидов не имеет ни одного центра: по теореме Кронекера-Капелли система уравнений центра в случае параболоидов несовместна, так как ранг основной матрицы А равен п — 1, а ранг рас- расширенной матрицы равен п (см. матрицы Л и В, подробно написанные в п. 2). Различных видов параболоидов много из-за разных сочетаний зна- знаков А^. Их можно исследовать по образцу предыдущего пункта. 9. Рассмотрим теперь вырожденные поверхности, т.е. те, для ко- которых А = Det В = 0.
КЛАССИФИКАЦИЯ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 389 Их удобно разбить на три группы. 1) Случай (I) при условии, что Н = 0. Тогда Rang Л = Rang В = п, и гиперповерхность является центральной. Уравнение имеет вид \ --- + \nx2n = Q. G) Мы знаем, что однородное уравнение второй степени задает конус (см. §12 гл. IV). Если все А^ одного знака, то конус называется мни- мнимым. (Следует иметь в виду, что у него есть одна действительная точка — его центр.) Если Xi разных знаков, то конус называют действительным в том смысле, что у него есть действительные точки, помимо центра. Измене- Изменением нумерации координат и сменой знака левой части уравнения G) можно добиться, чтобы было Ai > 0, Ап < 0, и число отрицатель- отрицательных членов не превышало числа положительных. Тогда уравнение G) приведется к виду _L + I ? — bl = o, (8)  ик и1 ип-к где к ^ т?. Если к = п — 1, то гиперплоскость хп = const ф 0 пе- пересекает конус (8) по (п — 2)-мерному эллипсоиду, а если к < п — 1, то по гиперболоиду (последнее возможно лишь при п ^ 4). Нетрудно проверить, что конус (8) состоит из всевозможных прямых, проходя- проходящих через начало координат и через точки поверхности, по которой он пересекается с гиперплоскостью хп = const ф 0. 2) Рассмотрим уравнение (Г). Пусть Е* — подпространство размер- ности г, натянутое на базисные векторы e странстве уравнение (V) определяет гиперповерхность типа (I), которую мы обозначим S. В случае любой размерности урав- уравнение (V) определяет гиперповерхность, которую называют цилиндром. Объяс- Объясним положение дел подробнее. Обозначим .Е** ортогональное до- дополнение подпространства Е* (Е** = = L(er+i, . . ., еп)). Возьмем произволь- произвольный вектор а из Е** и сдвинем гиперповерхность (Г) на вектор а. Тогда у каждой ее точки изменятся лишь те координаты, которые не входят ., ег. В этом подпро- подпроРис. 84. в уравнение (Г), то есть, жг+1, ..., хп. Поэтому точки, получающи- получающиеся при любом таком смещении, тоже удовлетворяют уравнению (V).
390 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI Таким образом, гиперповерхность (V) получается путем параллельно- параллельного перенесения гиперповерхности S по всевозможным направлениям в подпространстве Е**. Эта конструкция есть многомерное обобщение того, как цилиндр х2 + у2 = 1 в Е$ получается в результате параллель- параллельного переноса окружности вдоль оси z (рис. 84). Роль прямолинейных образующих на цилиндре (V) выполняют (п — г)-мерные плоскости, параллельные Е**. Все цилиндры (Г) имеют бесконечно много центров. Нетрудно про- проверить, что совокупность всех центров совпадает с подпространст- подпространством Е**. 3) Уравнения вида (II') определяют поверхности, называемые пара- параболическими цилиндрами. Обозначим (г + 1)-мерное подпространство, натянутое на векторы ei, ..., ег, еп, через ?", его ортогональное до- дополнение— через Е". В подпространстве Е' уравнение (II') определяет параболоид, который мы аналогично предыдущему обозначим через S. Гиперповерхность AГ) образована путем параллельного перенесения параболоида S на всевозможные векторы подпространства Е". Пара- Параболические цилиндры не имеют центров. § 7. Аффинные преобразования 1. Допустим, что в аффинном пространстве iln введена некото- некоторая система аффинных координат и рассматривается преобразование произвольной точки M(xi, . . . , хп) в точку M/(x/lJ . . ., xfn), заданное следующими формулами: х[ = оцЖ1 + Ь х'п = ап\Х\ Л V аппхп + Ьп. Будем предполагать, что п х n-матрица А = ||а^|| невырождена, то есть Det А ф 0. Такое преобразование пространства iln называется аффинным. Вследствие невырожденности матрицы А аффинное преобразова- преобразование является взаимноднозначным. Легко проверить, что если две формулы вида A) отличаются хотя бы одним коэффициентом, то аффинные преобразования, которые они задают в какой-либо системе аффинных координат, различны (в смыс- смысле п. 1 § 2 гл. VI). 2. Определение класса аффинных преобразований инвариантно от- относительно выбора аффинных координат. В самом деле, если мы перейдем к другим аффинным координатам, то старые координаты точки М и ее образа М' выразятся через новые координаты формулами первой степени, а все соотношения, с которы- которыми придется иметь дело, однозначно обратимы. Поэтому при переходе
§7] АФФИННЫЕ ПРЕОБРАЗОВАНИЯ 391 к другим аффинным координатам мы не выйдем из класса однозначно обратимых формул вида A). 3. Пусть в аффинном пространстве имеется геометрическая фигу- фигура Л, задаваемая некоторым уравнением вида F(x) = О, B) где символом х обозначены координаты текущей точки. Пусть задано аффинное преобразование, которое мы символически обозначим х' = ф). C) Найдем уравнение образа Л' фигуры Л. Из C) находим, что х = = ip~1(x/). Подставив это выражение в B), получим уравнение F(v-1(x'))=0, D) которому удовлетворяют все точки фигуры Л!. Ввиду взаимной од- однозначности преобразования C) никаких лишних точек не получится (точки, не принадлежащие Л', уравнению D) не удовлетворяют). Систему координат в пространстве мы не меняем, поэтому для ко- координат текущей точки удобно сохранить прежний символ х (а не ж', как в D)). Окончательно для Л! получаем уравнение Замечание. Фактически использована лишь взаимная однознач- однозначность преобразования C). Поэтому мы воспользуемся результатами этого пункта в гл. XII при рассмотрении преобразований более общих, чем аффинные. 4. Аффинные преобразования сохраняют степень алгебраического уравнения; именно, если координаты точки М удовлетворяют алгебра- алгебраическому уравнению к-и степени, то координаты точки М' удовлетво- удовлетворяют уравнению такой же степени. Доказательство. Так как формулы A) первой степени, то ни один член уравнения не может повысить свою степень в результате пре- преобразования. Понизиться степень тоже не может, так как в противном случае произошло бы повышение степени при обратном преобразова- преобразовании. Следствие. При аффинном преобразовании гиперплоскость пре- преобразуется в гиперплоскость. 5. Теорема 1. При аффинном преобразовании всякая плоскость размерности к переходит в плоскость той же размерности. Доказательство. Пусть ^-мерная плоскость Щ задается ли- линейной системой ранга п — к, содержащей п — к уравнений. Запишем эту систему в матричной форме Sx = s,
392 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI где S есть (п — к) х n-матрица, s обозначает матрицу-столбец свобод- свободных членов. Аффинное преобразование A) также запишем в матрич- матричной форме: х' = Ах + Ь. Используя п. 2, находим матричное уравнение образа П^ плоскости Щ: SA^x = ё, E) где s = s + SA~1b — новый столбец свободных членов. Система E) тоже содержит п — к уравнений относительно координат текущей точ- точки х. Согласно п. 3 §4 гл. Пи вследствие невырожденности А имеем RangSA'1 = RangS = п- к. Значит, система E) совместна и определяет плоскость той же раз- размерности к, что и требовалось установить. 6. Очевидно, что аффинные преобразования сохраняют параллель- параллельность гиперплоскостей. В самом деле, если до преобразования две ги- гиперплоскости не имели пересечения, то и их образы не будут пере- пересекаться вследствие взаимной однозначности преобразования; отсюда следует параллельность их образов (см. §6 гл. III). 7. Справедливо более общее утверждение: Аффинное преобразование сохраняет параллельность плоскостей любых размерностей. Доказательство предоставляем читателю. 8. Теорема 2. Аффинное преобразование в п-мерном аффинном пространстве Ип определяется однозначно, если в качестве прообразов задана произвольная упорядоченная система точек Mq, Mi, ..., Мп в числе п + 1, находящихся в общем положении, а в качестве их образов — произвольная аналогичная система Nq , TVi, ..., Nn. Доказательство. Введем в iln аффинную систему координат, приняв Мо за начало, векторы MqMi, ..., М$Мп за базис. (Эти век- векторы независимы, поскольку точки находятся в общем положении; см. п. 5 § 3 гл. III). Искомое аффинное преобразование задается в этих ко- координатах формулами вида A), в которых столбец свободных членов состоит из координат точки TVq, а столбец коэффициентов при Х{ со- состоит из координат вектора NoNi. Условие Det А ф 0 выполняется вследствие того, что точки Nj находятся в общем положении. Таким образом, искомое преобразование существует и единственно. 9. Рассмотрим два преобразования: 1) Линейное преобразование F) аппх I
§7] АФФИННЫЕ ПРЕОБРАЗОВАНИЯ 393 2) Параллельный перенос х[ = х\ + &i, 1 | G) хп = жп + on. J При параллельном переносе все точки одновременно сдвигаются на один и тот же вектор {6i, . . ., bn}. Всякое преобразование вида A) есть суперпозиция преобразова- преобразований F) и G) и обратно. Поэтому всякое аффинное преобразование есть суперпозиция ли- линейного преобразования F) при условии его невырожденности и па- параллельного переноса G). 10. Пусть теперь рассматривается евклидово пространство. Вслед- Вследствие предыдущего пункта и § 11 гл. IX всякое аффинное преобразова- преобразование представляется как суперпозиция самосопряженного преобразова- преобразования, изометрического преобразования и параллельного переноса. Об изометрическом преобразовании (коротко — об изометрии) мож- можно говорить в несколько более широком плане, чем в гл. IX. Именно, рассматривать его не как линейное преобразование, а как преобразо- преобразование вида A), сохраняющее расстояние между точками. Тогда и ли- линейное изометрическое преобразование, и параллельный перенос явля- являются изометриями, и их суперпозиция является изометрией. Поэтому аффинное преобразование представляет собой произведение сжатий по п ортогональным направлениям и некоторой изометрии. 11. Важно отметить, что всевозможные аффинные преобразова- преобразования пространства iln образуют группу. Ее называют аффинной груп- группой пространства iln. Согласно § 2 гл. IV для доказательства этого достаточно проверить, что: 1) аффинное преобразование обратимо и обратное к нему преобра- преобразование тоже является аффинным; 2) произведение двух аффинных преобразований снова является аф- аффинным преобразованием. Оба свойства с очевидностью следуют из п. 1. 12. Определение. Две фигуры Л и Л' в аффинном простран- пространстве называются аффинно эквивалентными, если одна из них является образом другой при некотором аффинном преобразовании. Так как аффинные преобразования составляют группу, то имеют место следующие свойства аффинной эквивалентности фигур: 1) если Л эквивалентна Л', то Л! эквивалентна Л; 2) если Л эквивалентна Л! и Л! эквивалентна Л", то Л эквивалент- на Л"; 3) каждая фигура эквивалентна сама себе.
394 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI Пример. На двумерной евклидовой плоскости каждый эллипс аффинно эквивалентен единичной окружности. Предоставляем читателю самостоятельно доказать, что в простран- пространстве iin любые две плоскости одинаковой размерности к A ^ к ^ п — 1) аффинно эквивалентны. § 8. Аффинная классификация гиперповерхностей второго порядка 1. Мы установим, что в аффинном пространстве iln все гиперпо- гиперповерхности второго порядка распределяются в конечное число классов, так что в каждом классе все поверхности аффинно эквивалентны друг другу. Такое распределение на классы называется аффинной класси- классификацией гиперповерхностей второго порядка. (Говорят также, что это есть классификация относительно аффинной группы.) 2. Возьмем произвольную гиперповерхность второго порядка. При- Приведем ее уравнение к каноническому виду. Алгебраически это значит, что мы преобразуем левую часть уравнения по некоторым формулам вида A) § 7. Если эти формулы мы рассматриваем не как формулы преобразования координат, а как аффинное преобразование, то полу- полученное каноническое уравнение дает некоторую гиперповерхность, аф- аффинно эквивалентную исходной. Если дополнительно сделать еще одно аффинное преобразование, заключающееся в сжатии по направлениям координатных осей, то все не равные нулю коэффициенты в каком бы то ни было каноническом уравнении можно свести к +1 или — 1. Поэтому в случаях (I) и (V) § 6 при Н ф 0 мы получим ±x\±xl±...±x2r = l (l^r^n); A) в случаях (I) и (V) § 6 при Н = О получим ±x\±x\±...±x2r = Q (l^r^n); B) в случаях (II) и (II') получим ±х\±х\± ...±х2г-2хп = 0 A^г^п-1). C) Поверхности, задаваемые различными уравнениями вида A), B) и C), нельзя перевести друг в друга аффинным преобразованием вслед- вследствие закона инерции квадратичных форм. Различными здесь следует считать уравнения, которые нельзя перевести друг в друга умножени- умножением на (—1) и изменением нумерации координат. Таким образом, мы получили искомые классы аффинно эквива- эквивалентных гиперповерхностей, каждая из которых имеет своего пред- представителя среди уравнений A), B), C).
ПЕРЕСЕЧЕНИЕ ПРЯМОЙ С ГИПЕРПОВЕРХНОСТЬЮ 395 § 9. Пересечение прямой второго порядка. Асимптотические направления 1. Пусть даны: гиперповерхность 2F = + 2 i + С = О A) и произвольная точка Mq с координатами (х®, . . ., х®п). Через точку Mq в направлении некоторого вектора / = {/i, . . ., ln} проведем пря- прямую. Будем искать точки пересечения прямой и гиперповерхности A). Координаты текущей точки М на указанной прямой даются урав- уравнениями Xk = х°к + rlk, -ос < г < +оо. B) Для нахождения точек пересечения нужно решить совместно урав- уравнения A) и B). Подставляя B) в A), получим г2 Y "ikli 2т Y, 2F(x°i> ¦ ¦ ¦, 4) = О- C) У Нужно исследовать уравнение C). 2. Если ^(likhlk Ф 05 то уравнение C) является квадратным. В этом случае имеются две точки пересечения, причем это могут быть две разные действительные точки, две разные комплексно сопряжен- сопряженные точки, и, наконец, они могут быть слившимися. В последнем слу- случае говорят, что прямая имеет с поверхно- поверхностью кратную точку пересечения. Пример. На евклидовой плоскости окружность х2 + у2 = 1 и прямая х = = —2 не имеют действительных точек пересечения (рис. 85). Несложный подсчет дает координаты комплексно сопряженных точек их пересечения (—2,±гд/3)- Для того, чтобы увидеть эти точки, -2 - Рис. 85. рассмотрим окружность х2 + у2 = 1 на двумерной комплексной плос- плоскости. Возьмем в качестве модели двумерной комплексной плоскости четырехмерное действительное пространство (см. § 11 гл. I). Положим х = и + г?, у = v + irj. D) Подставив эти выражения в уравнение окружности и выделив действи- действительную и мнимую части, получим U +V ~4 + «n = o' | E) Система E) показывает, что окружность х2 + у2 = 1, рассматривае- рассматриваемая на двумерной комплексной плоскости D), изображается в четы-
396 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI рехмерном пространстве переменных (и, v, ?, ту) в виде пересечения гиперболоида и конуса. Прямая х = —2 изображается в пространстве переменных (n, v, ?, ту) в виде двумерной плоскости и = -2, = 0. F) Рассмотрим в четырехмерном пространстве трехмерное подпростран- подпространство ? = 0. Плоскость F) целиком содержится в нем, а окружность E) пересекается с этим прост- пространством по фигуре tjv = 0, | состоящей из обычной ок- окружности и2 + v2 = 1, ту = 0 (именно ее мы и видим на действительной евклидо- евклидовой плоскости) и гипербо- гиперболы 2 2-i U — TJ = 1, v = 0 (рис. 86). Плоскость F) и гис. 8о. фигура G) пересекаются в тех самых точках и = —2, v = 0, ту = ±д/3, ° которых шла речь выше. 3. Если Y^aikUh =0, (8) то в качестве C) мы будем иметь либо уравнение первой степени, ли- либо противоречивое равенство, либо тождество. В первом из этих трех случаев говорят, что прямая пересекает гиперповерхность один раз в конечной точке и другой раз на — бесконечности. Во втором слу- случае говорят, что прямая имеет с гиперповерхностью двукратное пере- пересечение на бесконечности. В третьем случае прямая целиком лежит на гиперповерхности. Во всех трех случаях говорят, что прямая имеет асимптотическое направление относительно данной гиперповерхности. Асимптотическое направление дается вектором / = {/i, . . . , /п} при условии (8). Все прямые, имеющие асимптотические направления и проходящие через одну точку, образуют конус (рис. 87). Из (8) и B) получаем урав- уравнение конуса асимптотических направлений, вершина которого нахо-
10] СОПРЯЖЕННЫЕ НАПРАВЛЕНИЯ 397 дится в точке - х°к) = 0. Из уравнений центра следует, что если точка Mq находится в центре гиперповерхности, а вектор / имеет асимптотическое направление, то уравнение C) принимает вид 0 • т2 + 0 • т + + 2F(x°1, . . ., х°п) = 0. Тогда, если F{x\^ . . . , хоп) ф 0, то прямые, образующие этот ко- конус, не встречают гиперповерхность ни в одной конечной точке. Такие прямые можно назвать асимптотами, а конус — асимптотическим. Рис. 87. Примерами могут служить асимптотические конусы гиперболои- гиперболоидов в трехмерном пространстве (рис. 88) и асимптоты гиперболы при п = 2. § 10. Сопряженные направления 1. Предположим, что вектор / имеет неасимптотическое направле- направление. Тогда любая прямая, проходящая в направлении вектора /, пересе- пересекает гиперповерхность в двух точках М\ и Mi- Пусть Mq — середина хорды M\M<i. Определение середины отрезка в случае действитель- действительного аффинного пространства см. в п. 3 §8 гл. III. Если Mi, Mi — комплексно сопряженные точки, то середину Mq хорды M\M<i следует
398 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI понимать как точку, координаты которой являются средними ариф- арифметическими координат концов. Точка Mq является действительной также и в этом случае. Рассмотрим все прямые, параллельные вектору /, и на каждой из них найдем середину хорды М\Мъ. Оказывается, что геометри- геометрическое место этих середин является ги- гиперплоскостью. Докажем это. Име- Имеем а) б) Рис. 88. М0М2 = т2/, где Т2 = —т\. Если М\ и М<х — действитель- действительные точки, то равен- равенство Т2 = —т\ усмат- усматривается с геометри- геометрической очевидностью. Если Mi, M2 — ком- комплексно сопряженные точки, то вместо каждого из векторных равенств A) можно написать п координатных равенств. Из них легко последует, что и в этом случае Т2 = -Т\. Таким образом, Ti + т2 = 0. B) Вернемся к уравнению C) § 9. Так как прямая имеет неасимптоти- неасимптотическое направление, коэффициент при квадрате неизвестной отличен от нуля. По теореме Виета и вследствие B) коэффициент при первой степени неизвестной в уравнении C) § 9 должен обратиться в нуль. По- Поэтому $><**?** +5>*/* = о. (з) Для того, чтобы получить уравнение для всех середин, нужно счи- считать, что Мо — любая середина, и рассматривать ее координаты как текущие координаты (xi, . . ., хп). Тогда из C) имеем A) = 0. D) Положим Тогда соотношение D) примет вид N±x\ Н Ь Nnxn D = 0.
§10] СОПРЯЖЕННЫЕ НАПРАВЛЕНИЯ 399 Легко доказать, что среди чисел Ni есть отличные от нуля. В самом деле, допустим, что при всех г = 1, ..., п. Умножая равенства F) на Ц и складывая, полу- получим вопреки предположению, сделанному в начале параграфа. Поскольку среди чисел TVi, ..., Nn есть отличные от нуля, соотно- соотношение E) является уравнением гиперплоскости. 2. Гиперплоскость E) называется диаметральной гиперплоскостью, сопряженной направлению I относительно данной гиперповерхности. Она делит пополам каждую хорду, параллельную /. 3. Числа TVi, ..., Nn образуют координаты некоторого вектора N = {NU ...,Nn}. Будем считать, что координаты в пространстве — ортонормирован- ные. Тогда вектор N ортогонален к диаметральной гиперплоскости E), т.е. является ее нормальным вектором. N = AL Рис. 89 Соотношения Ni = ^2aiklk (i = 1, . . ., п) можно рассматривать как линейное преобразование N = А1, переводящее вектор / в вектор N (рис. 89). Это как раз и есть то самосопряженное линейное преобразование, которым мы занимались, когда исследовали общее уравнение гиперпо- гиперповерхности второго порядка. 4. Мы знаем, что в процессе приведения уравнения гиперповерх- гиперповерхности к каноническому виду нужно направить координатные оси по собственным векторам преобразования Л.
400 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [Гл. XI Теперь легко понять по геометрическим соображениям, почему имен- именно эти направления выгодны для упрощения уравнения гиперповерх- гиперповерхности. Допустим для простоты, что мы рассматриваем собственное на- направление, которое не является асимптотическим. Тогда сопряженная ему диаметральная гиперплоскость существует и перпендикулярна это- этому направлению. Поэтому она является плоскостью симметрии данной гиперповерхности. Отсюда, по крайней мере, в случае невырожденной центральной ги- гиперповерхности, ясно, что, приводя ее к каноническому виду, мы при- принимаем в качестве координатных плоскостей ортогональную систему ее плоскостей симметрии.
ГЛАВА XII. ПРОЕКТИВНОЕ ПРОСТРАНСТВО § 1. Однородные координаты в аффинном пространстве. Бесконечно удаленные точки 1. Рассмотрим n-мерное аффинное пространство iln. Пусть в нем задана система аффинных координат с началом О и базисом е±,..., еп, и пусть xi, ..., хп — координаты произвольной точки М. Мы введем сейчас в iln так называемые однородные координаты. Будем говорить, что ?ь ..., ?та, ?n+i (fn+i ф 0) являются однород- однородными координатами точки M(xi, . . . , хп), если Sl Sn /I \ = хи . .., = хп. A) Sn+1 Sn+1 Ясно, что точка М числами (?]_, . . ., ?n, ?n+i) определена. Будем писать M(^i, . . . , ?n+i)- Ясно также, что со своей стороны точка М не вполне определяет свои однородные координаты. В самом деле, если мы умножим все однородные координаты на одно и то же не равное нулю число, то при этом точка не изменится. Иначе говоря, набор чисел (?i, . . ., ?n+i) и набор чисел (A?i, . . ., A?n+i) при А ф 0 определяют одну и ту же точку. 2. Согласно предыдущему однородные координаты произвольно взятой точки зависят от выбора аффинной системы координат, то есть, от выбора начала О и базиса ei, ..., еп. Перейдем к новому началу и к новому базису. Тогда аффинные (неоднородные) координаты изме- изменятся по формулам вида x[=Q11X1-\ l-Qln^n + Qln+l, 1 > B) х'п = QnlXi -\ Ь QnnXn + Qnn+lj J где свободные члены Qin+ь • • • ? Qnn+i являются новыми координа- координатами старого начала О; матрица ||Qij|| (h j — 1? •••? ^) известным нам образом определяется по старому и новому базису (см. §5 гл. II). Формулы B), как мы видим, вообще говоря, не однородны. Из A) и B) получим соответствующие формулы преобразования однородных координат: C)
402 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII где последнее равенство ?^+1 = ?n+i принято по нашему желанию. С равным успехом можно было бы написать + • • • + Qnnin + D) где А ф 0 — любое число, не равное нулю. Мы видим, что формулы преобразования однородных координат сами являются однородными, т. е. не имеют свободных членов. 3. Рассмотрим произвольную гиперплоскость в iln: Аххх + • • • + Апхп + Лп+1 = 0. Переходя к однородным координатам, получаем уравнение Aifi + • • • + Anin + Лп+1^п+1 = 0. E) Таким образом, в однородных координатах гиперплоскость опреде- определяется однородным уравнением первой степени. Соответственно плос- плоскость любой размерности к определяется системой линейных однород- однородных уравнений ранга г = п — к. 4. Рассмотрим в iln произвольную гиперповерхность второго по- порядка: п п ^2 AijXiXj + 2 ^2 Ain+iXi + Ап+1 n+i = 0. Переходя к однородным координатам, получим п п Yl Aij€i€j +2 YlAi n+iiiin+i + ап+1 или n+1 a, /3=1 Мы опять получили однородное уравнение. Уже здесь видно удоб- удобство употребления однородных координат, поскольку уравнение гипер- гиперповерхности второго порядка записалось более компактно, так что его левая часть стала квадратичной формой. По существу, мы уже упо- употребляли однородные координаты в § 2 предыдущей главы и получили от них некоторую помощь. 5. Пополним аффинное пространство iln новыми элементами, ко- которые будем называть бесконечно удаленными точками. Мы не будем давать им никаких наглядных описаний, а будем только считать, что бесконечно удаленная точка есть объект, определяемый однородными
§ 1 ] БЕСКОНЕЧНО УДАЛЕННЫЕ ТОЧКИ 403 координатами (?]_, . . . , ?n, ?n+i) при условии, что бг+1 = 0, G) а среди чисел (?i, . . ., ?п) хотя бы одно отлично от нуля. При этом будем считать, что наборы (A?i, . . ., А?п, 0) при всех А / 0 задают одну и ту же бесконечно удаленную точку; непропорциональные набо- наборы определяют разные точки. Будем говорить, что некоторая бесконечно удаленная точка при- принадлежит данной гиперплоскости или данной гиперповерхности вто- второго порядка и т.д., если ее координаты удовлетворяют соответствен- соответственно уравнению этой гиперплоскости или этой гиперповерхности и т. д. При изменении исходной аффинной системы координат будем считать, что координаты произвольно выбранной бесконечно удаленной точки изменяются по формулам C) или D), где последняя строчка есть тож- тождество 0 = 0. 6. Мы будем считать, что каждое однородное линейное уравнение в координатах ?]_, ..., ?n+i, т.е. каждое уравнение вида E), опреде- определяет некоторую гиперплоскость. К числу таких уравнений относится и уравнение G). Соответственно этому считается, что все бесконечно удаленные точки составляют гиперплоскость. Ее называют бесконечно удаленной. 7. Возьмем в iln две параллельные гиперплоскости Aifi + • • • + Ап^п + А'та+1?та+1 = 0 и Пересечение каждой из них с бесконечно удаленной гиперплоско- гиперплоскостью дается одной и той же системой уравнений (8) Отсюда следует, что параллельные гиперплоскости имеют общие бес- бесконечно удаленные точки. Поскольку система (8) имеет ранг г = 2, то множество всех бесконечно удаленных точек, общих для двух па- параллельных гиперплоскостей, следует считать (бесконечно удаленной) плоскостью размерности п — 2. (См. рис. 90; здесь и в дальнейшем мы будем пользоваться условным изображением бесконечно удален- удаленных элементов и пересечения геометрических фигур в бесконечно уда- удаленных точках.) 8. Считая, что каждая однородная система линейных уравнений ранга г — п — k задает в однородных координатах некоторую плоскость размерности к, можно установить аналогично предыдущему пункту,
404 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII что две параллельные плоскости одинаковой размерности к пересека- пересекаются на бесконечности по бесконечно удаленной плоскости размерно- размерности к — 1. В частности, любые две параллельные прямые пересекаются в одной бесконечно удаленной точке (рис. 91). Рис. 90. Рис. 91. 9. Аффинное пространство iln, указанным способом пополненное бесконечно удаленными элементами, называется n-мерным проектив- проективным пространством. Однако точнее следовало бы говорить, что это одна из конкретных моделей n-мерного проективного пространства, общее понятие которого излагается в следующем параграфе. § 2. Понятие проективного пространства 1. Рассмотрим множество каких-либо объектов, природа или внеш- внешний вид которых для нас безразличны. Мы будем только предполагать, что каждый из этих объектов однозначно задается упорядоченной си- системой чисел (?i, . . ., ?n+i)- Эти объекты будем называть точками и обозначать обычным образом, например, M(?i, . . ., ?n+i)- Множество будем называть n-мерным проективным пространством и обозначать через Рп, если соблюдены следующие два условия: А) Любой упорядоченный набор чисел (?i, ..., ?n+i) определяет некоторую точку M(?i, . . ., ?n+iM если хотя бы одно из чисел ?i, ... . . ., ?n+i не равно нулю. Набор, состоящий из одних нулей, никакой точки не определяет. Б) Если Л — любое число, не равное нулю (Л ф 0), то два пропорци- пропорциональных набора (?i, . . ., ?n+i) и (A?i, . . ., A?n+i) определяют в Рп одну и ту же точку. Непропорциональные наборы определяют различ- различные точки в Рп. Числа ?i, ..., ?п называют однородными координатами точки М вРп. Важное замечание. Мы рассматриваем сказанное сейчас как определение n-мерного проективного пространства. Однако обычно
§2] ПОНЯТИЕ ПРОЕКТИВНОГО ПРОСТРАНСТВА 405 в определение проективного пространства включают описание некото- некоторых специальных подмножеств, называемых /^-мерными плоскостями (& = 0, 1, ..., п) с соблюдением у системы этих подмножеств опреде- определенных свойств. Эти свойства выражаются аксиомами проективного пространства. В одном и том же множестве точек подмножества та- такого рода (плоскости) можно назначить по-разному, или, как принято говорить, на одном и том же множестве можно задавать разные про- проективные структуры. Мы позволяем себе ограничить определение про- проективного пространства всего лишь двумя аксиомами А) и Б), потому что в дальнейшем мы введем системы подмножеств, называемых плос- плоскостями, по одному совершенно определенному стандарту (с помощью систем линейных уравнений), от которого никогда не будем отступать. Замечание. Аксиомы проективного пространства мы не приво- приводим. Аксиоматическое определение проективного пространства гораз- гораздо сложнее, чем знакомое нашему читателю аксиоматическое опреде- определение линейного пространства, данное в § 1 гл. I. 2. Сразу же обратим внимание читателя на то, что проективное пространство не является векторным, поскольку в нем не будут опре- определены линейные операции. 3. Проективное пространство называется действительным, если для его точек M(?i, . . . , ?n+i) допускаются только действительные значения координат (?i, . . . , ?n+i)- Если же в качестве ?& берутся так- также и комплексные числа, то проективное пространство называется ком- комплексным. 4. Пусть даны соотношения (i) при условии, что (n + 1) x (n + 1)-матрица Q = ||Qij|| невырождена и A^O. Тогда по произвольно заданному набору чисел (?i, . . ., ?n+i) опре- определяется новый набор чисел (\?[, . . ., А?^+1). При этом, если среди чисел ?ь есть хотя бы одно, отличное от нуля, то и среди чисел ?'к также найдется отличное от нуля вследствие невырожденности матрицы Q. Будем считать, что числа (?[, . . . , ?^+i) являются новыми коор- координатами той точки, которая раньше была определена координатами (?i, . . . , ?n+i)- При этом по отношению к новому набору чисел ?' тре- требования А) и Б) соблюдены, в чем легко убедиться. Формулы A) при любом задании матрицы Q будем рассматривать как формулы преоб- преобразования координат. О геометрическом смысле этих преобразований пока задумываться не будем (он будет рассмотрен ниже, в следующем параграфе).
406 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII Таким образом, наряду с исходными координатами ?]_, ..., ?n+i мы вводим множество других координатных систем. Мы будем назы- называть их проективными системами координат в Рп. Каждая новая система определяется заданием матрицы Q. Исходные координаты ?]_, ..., ?n+i не имеют никакого преимуще- преимущественного положения среди других координатных систем, вводимых формулами A). В самом деле, формулы A) можно обратить, и тогда старые координаты будут выражены через новые формулами тако- такого же вида. Кроме того, если мы по формулам вида A) с матрицей Q перейдем от координат ?]_, ..., ?n+i к координатам ?[, ..., ?^+1, а затем по аналогичным формулам с матрицей Q перейдем от коор- координат ?(, ..., ^+1 к координатам |ь ..., |п+ь то |ь ..., |n+i будут выражаться через ?i, ..., ?n+i по формулам вида A) с матрицей QQ. Коротко говоря, равноправие всех указанных координатных систем яв- является следствием того обстоятельства, что преобразования вида A) составляют группу (известную нам группу линейных преобразований переменных). 5. Формулы вида A) можно рассматривать с иной точки зрения. Можно считать, что система координат не изменяется, а сама точка М(?ь . . . , fn+i) преобразуется в точку М'(?(, . . . , <^+i)- ФоР" мулы A), рассматриваемые с этой точки зрения, задают некоторое взаимно однозначное преобразование проективного пространства. Всякое преобразование такого вида в пространстве Рп называется проективным преобразованием. Все проективные преобразования пространства Рп (то есть, отвечающие всевозможным невырожден- невырожденным матрицам Q) составляют группу. Ее называют проективной группой пространства Рп. 6. Ошибочно было бы думать, что проективная группа простран- пространства Рп изоморфна группе невырожденных (п + 1) х (п + 1)-матриц. Дело в том, что формулы вида A) с матрицами Q и aQ (a — любое число, не равное нулю) определяют одно и то же проективное преоб- преобразование. В частности, при Q = аЕ, а ф 0, независимо от а получа- получаем тождественное проективное преобразование, которое оставляет все точки на своих местах. 7. Предметом проективной геометрии, т. е. теории проективных про- пространств, являются объекты, свойства и величины, инвариантные от- относительно проективной группы. Рассмотрим некоторые инварианты проективной группы. 8. Назовем гиперплоскостью в проективном пространстве Рп лю- любое множество точек, которое определяется в некоторой заданной си- системе координат каким-либо однородным уравнением первой степени Ai?i + ... + An+i?n+i=0. B)
§2] ПОНЯТИЕ ПРОЕКТИВНОГО ПРОСТРАНСТВА 407 Преобразуем уравнение B) соответственно проективному преобра- преобразованию A) (см. п. 5). Обращая A), найдем п+1 ^;- C) Подставляя это выражение в B), получим А[& + ¦¦¦ + А'п+1?'п+1 = 0, D) где через (?[, . . . , ?^+1) обозначены текущие координаты точки в той же самой координатной системе, в которой задана гиперплоскость B), а коэффициенты А'к выражаются формулой п+1 A'k=\Y,PkiM- E) 1 = 1 Поскольку среди А\ есть отличные от нуля, Л ф 0 и матрица Р невы- невырождена, то и среди А'к есть отличные от нуля. Поэтому D) не тожде- тождество. Следовательно, D) есть уравнение первой степени. Обратно, если в уравнение D) подставим A), то, учитывая E), получим уравнение B). Мы видим, что точки, удовлетворяющие уравнению B), переходят в точки, удовлетворяющие уравнению D), и обратно. Поэтому образы точек гиперплоскости B) заполняют всю гиперплоскость D). Вывод. При проективном преобразовании любая гиперплоскость переходит в гиперплоскость. Таким образом, множество всех гиперплоскостей в Рп есть объект, инвариантный относительно проективной группы. Поэтому гиперплос- гиперплоскости относятся к предмету проективной геометрии. Замечание. Переход от уравнения B) к уравнению D) можно рассматривать с иной точки зрения, именно как переход к уравнению той же самой гиперплоскости в другой системе проективных коорди- координат. Отсюда видно, что уравнение гиперплоскости во всех проективных системах координат является линейным и однородным. Легко понять, что вообще проективная инвариантность класса объектов равносильна инвариантности класса уравнений этих объектов относительно перехо- перехода от одной проективной системы координат к другой. 9. Назовем к-мерной проективной плоскостью в Рп любое мно- множество точек, которое определяется в некоторой заданной системе ко- координат какой-либо однородной линейной системой уравнений ранга г = п — к: H Ь oi n+iCn+i = 0, "I > F) н ь ftrn+i^n+i = о. I
408 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII Обозначим прямоугольную матрицу системы F) через А. Преобра- Преобразуя систему F) по формулам C), получим систему Пусть А' — матрица системы G). Аналогично п. 9 § 5 гл. III имеем из F) и C) А' = \АР*. (8) Из (8) следует, что Rang A' = Rang Л, поэтому система G) задает плос- плоскость той же размерности к. Из этих выкладок видно, что при проективном преобразовании к- мерная плоскость переходит в ^-мерную плоскость. Таким образом, множество всех ^-мерных плоскостей в Рп есть объект, инвариантный относительно проективной группы. Поэтому ^-мерные плоскости от- относятся к предмету проективной геометрии. 10. Две плоскости в проективном пространстве называются скре- скрещивающимися, если они не имеют общих точек. Рассмотрим в Рп плоскости Щ и П/ размерностей к и /, заданные системами однородных линейных уравнений; объединим все их урав- уравнения в одну систему. Если объединенная система имеет только три- тривиальное решение, то Щ и П/ скрещиваются, так как набор @, . . . , 0) не определяет никакой точки. В противном случае плоскости пересе- пересекаются. Отсюда нетрудно подсчитать, что две плоскости в Рп могут скрещиваться лишь при условии, что сумма их размерностей меньше размерности пространства: к + I < п. Из п. 9 и взаимной однозначности проективных преобразований следует, что при проективных преобразованиях пересекающиеся плос- плоскости переходят в пересекающиеся, а скрещивающиеся переходят в скрещивающиеся. Замечание. При пополнении аффинного пространства iln бес- бесконечно удаленными точками не исключено, что плоскости, скрещи- скрещивающиеся в iln, могут превратиться в пересекающиеся плоскости по- пополненного пространства (о скрещивающихся плоскостях в iln см. выше, § 7 гл. III). 11. Назовем гиперповерхностью второго порядка в проективном пространстве Рп любое множество точек, которое определяется в неко- некоторой проективной системе координат каким-либо однородным урав-
§2] ПОНЯТИЕ ПРОЕКТИВНОГО ПРОСТРАНСТВА 409 нением второй степени п+1 Аналогично предыдущему можно показать, что множество всех ги- гиперповерхностей второго порядка в Рп есть объект, инвариантный от- относительно проективной группы. Поэтому гиперповерхности второго порядка относятся к предмету проективной геометрии. 12. Проективная геометрия изучает такие свойства гиперплоско- гиперплоскостей, ^-мерных плоскостей, гиперповерхностей второго порядка и т. п., которые инвариантны при любых проективных преобразованиях. К числу таких свойств относится, например, размерность плоскости. 13. Одномерная проективная плоскость называется проективной прямой. Рассмотрим произвольную прямую в Рп. Она определяется линей- линейной однородной системой уравнений ранга п — 1 относительно п + 1 переменных. Следовательно, в данном случае фундаментальная си- система решений состоит из двух независимых решений. Обозначим их (ui, . . ., nn+i), (г>1, . . . , vn+i). Им отвечают две точки U, V на пря- прямой. Пусть M(?i, . . ., ?n+i) ~~ произвольная точка этой прямой. По- Поскольку любое решение линейно выражается через фундаментальное, то имеем ?i = [iUi + i/Vi, i = l, ...,n + l, (9) где /i, v — некоторые числа (не равные одновременно нулю). Формула (9) выражает тот геометрический факт, что прямая одно- однозначно определяется любыми двумя своими точками и что через две произвольные точки U, V Е Рп можно провести прямую. Числа /i, v можно рассматривать как однородные координаты точ- точки М на данной прямой. Вместе с тем заключаем, что прямая в про- проективном пространстве сама является одномерным проективным про- пространством. Ограничиваясь случаем действительного пространства Рп, поло- положим с— —. , ас — cos a. vc = sina. Тогда из (9) имеем c?,i — Ui cos a + Vi sin a, A0) где c^i — координаты той же самой точки М. Изменяя а в пределах от —оо до +оо, мы получим всевозможные точки на данной прямой. При этом, ввиду периодичности косинуса и синуса каждая точка М повторится бесконечно много раз. Формула A0) показывает, что на- наглядной моделью действительной проективной прямой может служить
410 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII простая замкнутая кривая, например, обычная окружность. В самом деле, при изменении а от 0 до тг точка М один раз пробегает проек- проективную прямую и возвращается в исходное положение. Отметим, что при пополнении аффинного пространства бесконечно удаленными точ- точками каждая прямая пополняется одной точкой, которая и делает ее замкнутой линией (рис. 92). / 1 \ \ и V \ \ / / Рис. 92. Аналогичное представление действительной двумерной проектив- проективной плоскости в виде сферы оказывается ошибочным. В связи с этим см. п. 13 следующего параграфа. 14. В случае ^-мерной проективной плоскости вместо формулы (9) получаем & = Aii«i1} + /i2tif) + ¦ ¦ ¦ + »k+iu\k+1), A1) где {и\ }, {и\ }, ..., {и\ } — фундаментальная система решений линейной системы уравнений вида F), /ii, ..., /i/e+i — числа, среди которых есть отличные от нуля. Их можно рассматривать в качестве однородных координат точки ^-мерной плоскости. Отсюда ясно, что ^-мерная плоскость в Рп сама является ^-мерным проективным пространством (действительным или комплексным в за- зависимости от того, действительно или комплексно Рп). 15. Вернемся к рассмотрению произвольной прямой (9) в проек- проективном пространстве Рп. Вместе с точками U, V рассмотрим еще две точки на этой же прямой: точку М с координатами ?i = fJLUi + l/V{ A2) и точку TV с координатами гц = jiui + i>Vi, A3) считая, что они отличны от точек U, V. Число v v [1 ' р, называется сложным или двойным отношением, в котором упорядо- упорядоченная пара точек М, N делит упорядоченную пару точек U, V. Для обозначения g употребляется символ (UVMN). Таким обра- образом, (UVMN) = -:-. A4) fJL Д
§2] ПОНЯТИЕ ПРОЕКТИВНОГО ПРОСТРАНСТВА 411 Заметим, что каждое из простых отношений — и -^ не определяется точками U,V,MnU,V,N. Это ясно, поскольку однородные коорди- координаты любой из этих точек можно умножить на произвольное не равное нулю число. Однако двойное отношение имеет вполне определенное численное значение, зависящее только от задания на прямой упорядоченных пар точек U, V и М, N. В самом деле, если координаты точек U, V, М, N умножим со- соответственно на четыре любых множителя ф О, то дроби is/ /j, и is/jl умножатся на один и тот же множитель, который в выражении A4) сократится. Более того, двойное отношение не меняется при переходе к любой новой системе проективных координат пространства. Это утверждение равносильно тому, что двойное отношение инвариантно относительно любых проективных преобразований; доказательство см. в п. 16. Рассмотрим подробнее геометрический смысл двойного отношения. Возьмем на обычной прямой четыре различные точки U, V, М, N. Бу- Будем считать, что на этой прямой введена аффинная координата ж, при- принимающая в указанных точках соответственно значения xi, x2j %з, ^4 (рис. 93). N xi М х2 Х4 U Ж3 V Рис. 93. Перейдем к однородным координатам (?, rj) по формуле х = %/г), rj ф Ф 0. Полагая rj = 1, будем иметь следующие однородные координаты рассматриваемых точек: U(x1} 1), V(x2, 1), М(х3, 1), N(x4, 1). Тогда формулы A2) и A3) примут вид Х3 = ЦХ\ + ISX2, 1 Х4 = flXi + VX2-, \ 1 = /л +i/, J 1 = Д +Р. J Из систем A5) найдем /i, г/, //, is и, подставив их в A4), получим ^^^^ A6) Из элементарной аналитической геометрии известно, что дроби в пра- правой части формулы A6) суть отношения Л и Л, в которых М и N соответственно делят отрезок UV: _ UM _ х3 - х\ ~ _ UN_ _ х4 -х\ MV ~ x2-x3' NV ~ х2-х4' [ }
412 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII Таким образом, для любых четырех различных точек на аффинной прямой. 16. Двойное отношение двух пар точек является величиной, инва- инвариантной относительно проективной группы. Для доказательства рассмотрим произвольное проективное преоб- преобразование. По формулам C) имеем & = А?^, щ = \^,Рц^, Vi^X^P^'y A8) Вследствие невырожденности матрицы ЦР^'Н из A8) и A2) получаем ? = К + "«<. A9) где и[, v[, ^[ суть координаты точек Uf, V и М7, которые являются образами точек U, V и М соответственно. Аналогично получаем коор- координаты образа N' точки N ^ = ?< + i>t;J. B0) Из A9) и B0) находим (U'V'M'N1) = -:- = (UVMN), что и требовалось установить. 17. В конце предыдущего параграфа мы указывали, что пополнен- пополненное бесконечно удаленными элементами аффинное пространство iln является моделью общего понятия n-мерного проективного простран- пространства. Нужно заметить при этом, что если мы рассматриваем попол- пополненное аффинное пространство как проективное и допускаем в нем любые преобразования вида A) § 2, то мы должны не обращать внима- внимания на особое положение бесконечно удаленных элементов и считать, что они равноправны с обычными, поскольку с помощью проективного преобразования любую бесконечно удаленную точку можно перевести в обычную. К тому же в определении проективного пространства не делается выделения каких-либо объектов в качестве бесконечно уда- удаленных. Поэтому множество бесконечно удаленных точек в пополненном аффинном пространстве не является объектом, инвариантным отно- относительно проективной группы. Следовательно, понятие о бесконечно удаленных точках не относится к предмету проективной геометрии. 18. С помощью преобразования координат в Рп можно добиться того, чтобы любая наперед заданная гиперплоскость получила урав- уравнение ?п+1 = 0, и можно условиться считать ее бесконечно удаленной.
§3] СВЯЗКА ПЛОСКОСТЕЙ 413 Указание того, какая именно гиперплоскость принята в качестве бес- бесконечно удаленной, можно рассматривать как возвращение от проек- проективного пространства к аффинному. 19. Если в аффинном пространстве введены однородные коорди- координаты, то, как нетрудно проверить, любое аффинное преобразование задается формулами вида D) § 1, и любое преобразование вида D) § 1 с невырожденной матрицей коэффициентов является аффинным. Если сравнить формулы D) § 1 с формулами A) настоящего параграфа, то будет ясно, что аффинные преобразования пространства iln можно считать частным случаем проективных преобразований в пополненном аффинном пространстве, то есть, в Рп. Именно, аффинными можно считать все преобразования вида A), которые сохраняют бесконечно удаленные точки в качестве бесконечно удаленных. В самом деле, если из условия ?n+i = 0 обязательно получается, что ?n+i = 0, то проективное преобразование должно иметь вид C) § 1. Ес- Если мы интересуемся лишь точками самого пространства iln, то ?n+i Ф Ф О, и из C) §1 получаем формулы B) §1, выражающие аффинное преобразование. Важное следствие. Группа всех аффинных преобразований в iln является подгруппой в проективной группе пространства Рп. Замечание. Для этой формулировки весьма существенно, что мы условились аффинными считать некоторые специальные проектив- проективные преобразования. Таким образом, мы включили аффинные преоб- преобразования в число проективных. Из-за того, что запас проективных преобразований богаче запаса аффинных преобразований, проективная группа имеет меньше инва- инвариантов, чем аффинная: каждый инвариант проективной группы явля- является инвариантом аффинной группы, но обратное неверно. Например, каждое из соотношений A7) является аффинным инвариантом, но не является инвариантом проективным (последнее без всяких вычислений вытекает из п. 3 § 5). С другой стороны, проективная геометрия по сравнению с геомет- геометрией аффинной (и тем более с метрической) изучает свойства геомет- геометрических фигур, более устойчивые в том смысле, что они сохраняются при любых преобразованиях более обширной группы. 20. Все изложенное в пп. 8-19 служит иллюстрацией нашей крат- краткой формулировки п. 7. § 3. Связка плоскостей в аффинном пространстве 1. Рассмотрим в (п + 1)-мерном аффинном пространстве iln+i мно- множество всех плоскостей всех размерностей (в том числе прямых), про- проходящих через зафиксированную точку О. Это множество называется
414 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII связкой с центром О. Дальше мы связку и ее центр будем обозначать одной и той же буквой О. Примем точку О в качестве начала аффинной системы координат с произвольно выбранным базисом ei, ..., en+i. Начало координат мы менять не будем, поэтому будем отождествлять iln+i и соответствую- соответствующее ему линейное пространство Ln+i- Каждая прямая связки однозначно определяется заданием какой- нибудь своей точки М, отличной от точки О. Пусть (?]_, . . . , ?n+i) — координаты точки М в базисе ei, ..., en+i. Тогда точка (A?i, . . . . . ., A?n+i) при любом А ф О определяет ту же самую прямую ОМ. Прямую, рассматриваемую как элемент связки, назовем точкой, числа (?i, . . . , ?n+i) ~~ ee однородными координатами. Тогда ясно, что множество таких точек (то есть, прямых связки О) представляет собой n-мерное проективное пространство Рп. Ясно также, что каж- каждая (к + 1)-мерная плоскость связки О является ^-мерной проективной плоскостью в Рп, поскольку она проходит через начало координат и, следовательно, определяется системой однородных линейных уравне- уравнений ранга г = (п + 1) — (к + 1) = п — к. Таким образом, мы получили еще одну геометрическую модель про- проективного пространства Рп — в виде связки в аффинном пространстве размерности п + 1. В отличие от § 1, здесь не требуется какого-либо по- пополнения новыми точками; все элементы рассматриваемого множества (прямые связки) геометрически равноправны. 2. Рассмотрим совместно обе известные нам модели n-мерного про- проективного пространства. Это поможет выяснить геометрический смысл преобразований координат и проективных преобразований в Рп, кото- которые были определены алгебраически в § 2. а о Рис. 94. Рис. 95. В качестве n-мерного аффинного пространства iln возьмем какую- нибудь гиперплоскость в пространстве Яп+ъ не проходящую через центр связки О. Пополним iln+i бесконечно удаленными элементами согласно пп. 5-8 § 1. Тогда iln+i превратится в проективное простран-
СВЯЗКА ПЛОСКОСТЕЙ 415 ство Рп+ъ а гиперплоскость iln превратится в проективное простран- пространство размерности п, которое мы будем обозначать Ип. Каждая прямая а связки О (пополненная бесконечно удаленной точкой) пересекает Ип в некоторой точке А (рис. 94). Будем говорить, что точка А соответствует прямой а. Это соответствие является взаим- взаимно однозначным благодаря прове- проведенному пополнению iln+i; именно, если прямая в аффинном простран- пространстве параллельна гиперплоскости iln, то точка А является бесконечно удаленной (рис. 95). Пусть ОМ — какой-нибудь на- направляющий вектор прямой а, ОМ = = Ciei + *• • + ?n+ien+i- Числа (A?i, ... . . ., A?n+i) (А ф 0), пропорциональные координатам вектора ОМ, примем за однородные координаты точки А в iln, соответствующей прямой а (рис. 96). Они совпадают с однородными координатами этой прямой, определенными согласно п. 1. Ясно, что выбором базиса ei, ..., en+i в iln+i полностью опреде- определяются проективные координаты в связке О и в гиперплоскости iin. Эта система проективных координат сохраняется при подобном преоб- преобразовании базиса ei (т. е. при переходе к базису вида ае±, ..., аеп+ь а ф 0). Обратим внимание на част- частный случай, когда векторы ei, ..., еп параллельны iln. В этом случае обозначим через О' точку пересечения Рис. 97. гиперплоскости iln с той пря- прямой связки О, направляющим вектором которой служит en+i. Введем в iln аффинные координаты с началом О' и базисом ei, ... . . ., еп (рис. 97). Тогда аффинные координаты (жь . . ., хп) произ- произвольной точки A G iln и ее однородные координаты (?]_, . . ., ?n+i) будут связаны формулами A) § 1, то есть, Х{ — ^/^n+i, г — 1, ..., п, ? -/¦ П 4,72 + 1 / lJ• 3. Вернемся к рассмотрению общего случая. Пусть е[, ..., е^+1 — новый базис в itn_|_]_. Тогда п+1 е7- = j = 1, ..., n + 1. A)
416 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII Если ОМ — произвольный ненулевой вектор на прямой а, имеющий в старом базисе координаты ?]_, ..., ?n+i, а в новом координаты ?[, ... •••>?п+ьто п+1 Zi = Y,Q*&> i = l, ...,n + l. B) Предположим, что числа (?i, . . ., ?n+i) являются старыми однород- однородными координатами точки Л; тогда числа (?[, . . ., ?^+i) будут ее но- новыми однородными координатами в iin. Поэтому формулы B) можно рассматривать как преобразование однородных координат точек в по- пополненной гиперплоскости iln (а вместе с тем и в связке О) при только что описанном изменении координатной системы пространства iln+i- Вместо B) можно написать формулы A) § 2, поскольку однородные координаты определяются с точностью до множителя пропорциональ- пропорциональности. 4. Пусть теперь в n-мерном проективном пространстве Рп зада- задано формулами A) § 2 какое-нибудь преобразование проективных ко- координат. Отождествляя Рп со связкой О в iln+i и положив в форму- формулах A) §2 Л = 1, получим формулы B). Их можно рассматривать как формулы такого преобразования координат в iln+i, при котором начало координат остается на месте, а базис преобразуется по форму- формулам A). 5. Подводя итог, можно сказать, что проективные координаты в Рп определяются заданием базиса ei, ..., en+i в iln+i, а формулы A) §2 выражают переход к новой проективной системе координат в Рп, задаваемой новым базисом е[, ..., е^+1 в iln+i. При этом безразлич- безразлично, какую из двух моделей Рп рассматривать: связку О или гиперплос- гиперплоскость Ип. 6. Аналогичным образом можно истолковать формулы A) § 2, если считать, что они задают проективное преобразование в Рп. Для этого нужно рассмотреть в iln+i аффинное преобразование, которое остав- оставляет на месте точку О и задается формулами B). При этом произволь- произвольная точка М Е iln+i с координатами (?]_, . . ., ?n+i) переходит в точку ^'(?1? • • • •> ?n+i)- Если нас не интересует сама по себе точка М', а ин- интересует только прямая ОМ', в которую переходит прямая ОМ, то мы можем в соотношениях B) числа ?i, ..., ?n+i или числа ?[, ..., ?^+1 умножить на любое число Л / 0. Если мы поставим множитель Л в ле- левых частях формул B), то получим формулы A) § 2. Таким образом, можно сказать, что любое проективное преобра- преобразование в пополненной гиперплоскости Ип индуцируется некоторым аффинным преобразованием в iln+i, оставляющим на месте точку О (или, что то же самое, невырожденным линейным преобразованием в Ln+1).
§3] СВЯЗКА ПЛОСКОСТЕЙ 417 Если же в качестве модели проективного пространства Рп взять связку О, то можно сказать, что проективные преобразования в Рп есть просто аффинные преобразования в iln+i, сохраняющие точку О, не забывая при этом, что точками Рп являются прямые связки О. 7. Чтобы придать полную наглядность всему сказанному о модели проективного пространства в виде связки О в iln+i и о проективных преобразованиях на этой модели мы порекомендуем читателю вообра- вообразить себе, что он наблюдает пространство iln+i из центра связки О. Тогда все точки этого пространства, лежащие на каком-нибудь луче его зрения, он увидит как одну точку. Поэтому если читатель будет следить из точки О за перемещением точек при каком-нибудь невы- невырожденном линейном преобразовании в Ln+i = iln+i, то на самом де- деле он увидит проективное преобразование в связке или в какой угодно гиперплоскости, не проходящей через точку О. Отметим, что разные линейные преобразования Ах и \iAx (fi — любое число ф 0) в iln+i являются одним и тем же проективным пре- преобразованием в связке О. 8. В качестве приложения рассмотренных выше конструкций вы- выясним условия, однозначно определяющие проективное преобразова- преобразование в Рп. Введем важное для дальнейшего определение. Определение. Система г + 1 точек в Рп находится в общем по- положении, если они не принадлежат одной (г — 1)-мерной (проективной) плоскости. Очевидно, что общее число точек такой системы не может быть больше п + 1. Замечание. Если в качестве Рп рассматривается связка О в iln+i, то точки ai, ..., ат Е Рп находятся в общем положении в пространстве Рп тогда и только тогда, когда направляющие векторы прямых ai, ..., ат Е iln+i линейно независимы в iln+i. Чтобы убе- убедиться в этом, достаточно вспомнить, что в такой модели ^-мерные (проективные) плоскости пространства Рп суть (к + 1)-мерные плос- плоскости связки О. Пусть в Рп произвольно задана система точек ai, ..., ап+ъ ап+2 в числе п + 2 такая, что любые п + 1 из этих точек находятся в общем положении. Пусть далее в Рп произвольно задана другая аналогичная система точек а[, ..., ft^+1, ^+2- Докажем, что справедлива Теорема 1. Существует и притом единственное проективное преобразование пространства Рп, которое переводит ai в а\ для всех номеров г = 1, ...,п + 2. Доказательство. В качестве модели проективного простран- пространства Рп снова возьмем связку О в iln+i. Пусть в связке О прямые а\,..., an+i, ftn+2 заданы в качестве точек-прообразов, а прямые а[,... 14 Н.В. Ефимов, Э.Р. Розендорн
418 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII . . ., а^+1, ^n+2 ~~ B качестве точек-образов. Возьмем какой-нибудь на- направляющий (ненулевой) вектор еп+2 прямой ап+2 5 возьмем любые на- направляющие (ненулевые) векторы ё{ прямых а^ (г = 1, ..., п + 1). По условию прямые ai, ..., an+i как точки Рп находятся в общем по- положении; значит, векторы ё{ (г = 1, ..., п + 1) составляют базис вЯп+ь Поэтому существует разложение Докажем, что ни одно из чисел А^ не равно нулю: Аг^О, г = 1,...,п + 1. C) Предположим противное. Пусть, например, Ai = 0. Тогда еп+2 линейно выражается через векторы в2, ..., en+i, поэтому система в2, ..., en+i, еп+2 линейно зависима, что противоречит условию, по- поскольку точки ^2, ..., ап+ъ ^n+2 ? Рп находятся в общем положении. Итак, Ai ф 0. Аналогично устанавливаются остальные неравенства C). Положим ei = \ie{, i = 1, ..., п + 1. Тогда еп+2 = ех Н Ьеп+Ь D) Из независимости векторов ei, ..., en+i и неравенств C) следует, что векторы ei, ..., en+i тоже независимы. Аналогично доказывается, что найдутся векторы е[, лежащие соответственно на прямых aj, такие, что en+2 = ei + -" + е/п+1, E) причем е[, ..., е^+1 линейно независимы в iln+i. Отсюда и из п. 7 § 3 гл. VII следует, что в iln+i = Ln+i существует невырожденное линей- линейное преобразование х' = Лж, для которого е\ — Ле^, г = 1, ..., п + 1. Используя E), находим, что Н h en+i) = Леп+2. Тем самым е^ = Aei для всех г = 1, ..., п + 1, п + 2, то есть, линей- линейное преобразование ж' = Ах в iln+i переводит данные прямые ai, ... . . ., an+2 в данные прямые ai, ..., а'п+2 и, следовательно, индуцирует искомое проективное преобразование в связке О, которое мы обозна- обозначим через /. Докажем единственность. Пусть имеется еще одно проективное пре- преобразование ер в связке О, для которого ip(ai) = а[, г = 1, ..., п + 2. Согласно пп. 6-7 оно индуцируется некоторым невырожденным линей- линейным преобразованием В пространства Яп+ъ которое также переводит прямые ai в а\ (г — 1, ..., п + 2). В таком случае е'( = Bei = fiiefi, F)
§3] СВЯЗКА ПЛОСКОСТЕЙ 419 где Hi — какие-то числа; г = 1, ..., п + 2. При этом вследствие D) и F) имеем еп+2 = Ве>п+2 = Вех Л V Веп+1 = /iiei H Ь /in+ie'n+1. G) С другой стороны, используя E) и F), находим, что еп+2 = ^п+2б'та+2 = /^n+2ei H Ь /in+2e'n+1. (8) Из G) и (8) следует /^п+2 = /il = /i2 = • • • = jMn+Ъ (9) поскольку векторы е[, ..., е^+1 независимы. Полагая /in+2 = АЬ полу- получим Bei = /ie^ = fiAei, i = 1, . . ., n + 1. Но тогда Вж = [i Ax для любого вектора ж из iln+i, а это и значит, что (/? = /. Тем самым теорема 1 доказана. 9. Выше было указано, что координаты в Рп определяются зада- заданием базиса в iln+i. Однако базис в iln+i является объектом, внешним по отношению к пространству Рп. Желательно иметь другой способ задания проективных координат, опирающийся лишь на рассмотрение объектов самого проективного пространства. Пусть в Рп произвольно выбрана и зафиксирована система точек в числе п + 2 ЛЬЛ2,..., Ап+г,В A0) такая, что любые п + 1 из этих точек находятся в общем положении. Теорема 2. В п-мерном проективном пространстве Рп найдется единственная система проективных координат, в которой точки A0) имеют следующие однородные координаты: М A,о,..., о), А2 @,1,..., 0), (И) Ап+1@, 0, ..., 1), В A,1,..., 1). Доказательство. В качестве модели Рп рассмотрим связку О в iln+i. Так же, как в доказательстве теоремы 1, найдем направляющие векторы ei, ..., en+i, еп+2 прямых А\, ..., Ате+1, В связки О такие, что: а) en+2 = ei Н Ь en+i; б) ei, ..., en+i линейно независимы в iln+i. Примем векторы ei, ..., en+i за базис в iln+i. Тогда, согласно п. 1, в Рп определятся однородные координаты точек, причем условия A1) будут выполнены (последнее из них — вследствие а)). 14 *
420 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII Докажем единственность. Пусть некоторая проективная система координат в Рп задана другим базисом ei,..., en+i пространстваЯп+ъ и пусть условия A1) снова соблюдены. Тогда в силу A1) векторы ei,..., en+i необходимо являются направляющими для прямых А±,... . . ., Лп+1 связки О, то есть, ё{ = о^г (&i ф 05 i = 1? • • • •> п + 1); п+1 кроме того, ^2 ei = ап+2?п+2, с^п+2 7^ 0? поскольку вектор ё\ + • • • г=1 • • • + en+i должен быть направляющим для прямой В Е О. Далее аналогично выкладкам G)-(9) устанавливается, что а± = . . . = an+i. Отсюда следует, что однородные координаты (?]_, . . . , ^n+i) точки X, задаваемые с помощью базиса ei, ..., en+i, пропорциональны ее ко- координатам (?]_, . . ., ^n+iM полученным, исходя из базиса ei, ..., en+i. Теорема 2 доказана. 10. Замечание. Для иллюстрации геометрического смысла тео- теоремы 2 рассмотрим в качестве модели Рп пополненное аффинное про- пространство iln, считая, что однородные координаты (?]_, . . . , ?n+i) вво- вводятся, согласно пп. 1-5 § 1, исходя из некоторой аффинной системы координат (#i, . . . , хп) в iln. Тогда точки, имеющие координаты A1), выполняют следующие роли: An+i@, . . . , 0, 1) служит началом аффинной системы координат Ai, Л2, ..., Ап являются бесконечно удаленными точками коор- координатных осей xi, x<i-, ..., хп соответственно; их выбор определяет направление координатных осей; точка ВA, . . ., 1, 1), называемая точкой единиц, определяет собой выбор базисных векторов на каждой из осей х\, ..., хп (рис. 98). Л1A,0,...,0) Л2@,1,0, ..., Рис. 98. 11. В заключение параграфа укажем еще одну весьма популярную геометрическую модель для действительного проективного простран- пространства Рп. Будем считать, что в iln+i введена евклидова метрика, и на- наряду со связкой О рассмотрим n-мерную сферу S с центром О (опре- (определение n-мерной сферы см. в п. 5 §6 гл. XI). Каждая прямая связки
И] ЦЕНТРАЛЬНОЕ ПРОЕКТИРОВАНИЕ 421 пересекает сферу в двух диаметрально противоположных точках (при п = 1 см. рис. 99). Отождествим такие точки, то есть, каждую пару диаметрально противоположных точек сферы S будем рассматривать как одну точку нового множества. Так полученное множество по по- построению взаимно однозначно соответствует связке О и, следователь- следовательно, может рассматриваться в качестве Рп. Каждая ^-мерная проек- проективная плоскость изображается в этой модели в виде ^-мерной сферы с отождествленными диаметрально противоположными точками, по- поскольку каждая (А; + 1)-мерная плоскость связки О пересекает сферу S по некоторой сфере размерности к (см. рис. 100, где п = 2, к = 1). Рис. 100. Рис. 101. Заметим, что в частном случае п = 1 (и только в этом случае) мож- можно изобразить Рп в виде одномерной сферы, то есть в виде окружности, не отождествляя диаметрально противоположных точек. Именно, рас- рассмотрим на двумерной плоскости связку О (иначе говоря, пучок пря- прямых, проходящих через точку О) и окружность S, проходящую через эту же точку (рис. 101). Точке О на окружности S поставим в соответ- соответствие прямую о, касающуюся окружности в этой точке. Любой другой точке A Е S поставим в соответствие прямую О А. Мы получим вза- взаимно однозначное соответствие между прямыми связки О и точками окружности S, позволяющее рассматривать окружность как модель проективной прямой (см. в связи с этим п. 13 §2). § 4. Центральное проектирование 1. Выше мы рассматривали проективные преобразования в данном пространстве Рп. Это понятие можно обобщить и рассматривать про- проективное отображение одного n-мерного проективного пространства Рп на другое n-мерное проективное пространство Р'п, считая, что это отображение дается формулами A) § 2 при условии, что (?i, . . ., ?n+i)
422 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII — координаты прообраза в пространстве Рп, (?[, . . ., ?^+1) — коорди- координаты образа в пространстве Р'п. В этом параграфе мы рассмотрим важ- важный частный случай: так называемое центральное проектирование. 2. Из п. 10 § 2 следует, что в Рп любая прямая и любая гиперплос- гиперплоскость пересекаются. Нетрудно проверить, что если прямая а не лежит целиком в гипер- гиперплоскости П, то у них имеется единственная общая точка. Для дока- доказательства добавим уравнение гиперплоскости П к системе уравнений ранга п — 1, определяющих прямую а. Если а и П имеют две разные об- общие точки, то объединенная система уравнений имеет два независимых нетривиальных решения, так что ее ранг г ^ п — 1. Но это возможно лишь тогда, когда уравнение гиперплоскости П является следствием уравнений прямой а, то есть, когда а С П. 3. Пусть теперь в Рп выбраны какие-нибудь две различные гипер- гиперплоскости ПиП'и зафиксирована произвольная точка О, не принад- принадлежащая ни одной из этих гиперплос- гиперплоскостей. Через произвольную точку М гипер- гиперплоскости П и через точку О проведем прямую ОМ. Вследствие п. 2 прямая ОМ пересекает ГГ в единственной точке М', и для каждой точки М' Е ГГ найдется единственная точка М Е П такая, что М, О и М' лежат на одной прямой (рис. 102). Точку М' будем называть проекцией гис. IDz. точки М из центра О на гиперплос- гиперплоскость ГГ. Будем писать также М' = /(М). Взаимно однозначное отоб- отображение М' = /(М) гиперплоскости П на гиперплоскость ГГ называ- называется центральным проектированием гиперплоскости П на гиперплос- гиперплоскость ГГ из центра О. 4. Вместо гиперплоскостей П, ГГ можно рассматривать две плос- плоскости Щ, П^ произвольной одинаковой размерности к и определить центральное проектирование одной из них на другую, но при этом тре- требуется специальное взаимное расположение плоскостей Щ, П^ и точ- точки О. Именно, предположим, что Щ, П^ и О принадлежат какой-нибудь одной (А; + 1)-мерной проективной плоскости Щ_|_1 в пространстве Рп. Кроме того, будем считать, что плоскости Щ и П^ не совпадают, и точ- точка О им не принадлежит. Тогда полностью применимы рассуждения и построения пп. 2, 3, поскольку Щ и П^ можно рассматривать как гиперплоскости в (к + 1)-мерном проективном пространстве, которым является плоскость Щ+i (см. рис. 103, на котором к = 1).
4] ЦЕНТРАЛЬНОЕ ПРОЕКТИРОВАНИЕ 423 5. Теорема. Центральное проектирование плоскости Щ на плос- плоскость П'к A ^ к ^ п — 1) есть проективное отображение. Доказательство. Мы знаем, что Щ и П^ можно рассматри- рассматривать как проективные пространства (§ 2, п. 14) и что центральное про- проектирование М' = /(М) является взаимно однозначным отображе- отображением Щ на П^ (при к ^ п — 2 вследствие специального взаимного расположения плоскостей). Поэтому нам достаточно выяснить вид формул, задающих это отображение. Выберем в Рп систему координат так, чтобы точка О имела коорди- координаты ?i = . . . = ^ = 0, ?^+1 ф 0. Согласно формуле A1) из §2 произ- произвольная точка М G Щ имеет координаты t (!) , , О + 1) где и\ — некоторые числа. Аналогично произвольная точка М' G П^ имеет координаты При этом (/ii, . . . , /Xjfe+i) можно считать однородными координатами М внутри Щ, а (/л[, . . ., A*]fe+i) ~~ однородными координатами М' внут- внутри П^. Если точки О, М, М' лежат на одной прямой, то # = а&+0?, г = 1, ...,п + 1. A) Здесь а ф 0 и /3 ф 0, так как ни одна из точек М(&) и М'(^[) не совпадает с точкой О(^). При г = 1, ..., п получаем а& + @^[ = О, но a?n+i + @i'n+i Ф 0- Обратно, если равенства A) обеспечены для некоторых чисел а ф 0, /3 ф 0 при г = 1, ..., п и если «^n+i + @?,'п+1 Ф Ф 0, то точки M(?i) и М'(^) лежат на одной прямой с точкой О. Таким образом, если мы хотим найти проекцию М' по данной точке М, то должны решить систему уравнений B) г = 1,2, ..., п, \ считая /ib ..., /i/e+i, пг- \ и^ и А / 0 данными, а /х'1? ..., /xjfe+1 — искомыми. Тогда в качестве о; ^ Ои/3 / 0 можно будет взять любые числа при условии Л = — %. Кроме того, мы должны иметь 0+1) Ф ) Мы заведомо знаем, что точка М' существует и единственна. По- Поэтому система B) однозначно разрешима, а неравенство C) соблюда- соблюдается. Кроме того, матрица, составленная из столбцов v \ \
424 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII где г = 1, 2, ..., п, имеет ранг к + 1 (см. п. 14 § 2). Поэтому у нее есть базисный минор D порядка к + 1. Предположим для простоты изло- изложения, что минор D составлен первыми к + 1 строчками. Тогда мы возьмем в системе B) первые к + 1 уравнений, а остальные отбросим. Решая полученную систему по правилу Крамера, получим D) л = А где Dj/ есть определитель, полученный из D заменой столбца с но- номером j столбцом с номером и\ (г = 1, ..., к + 1). Мы видим, что /л[, ..., /^+1 выражаются (с точностью до множителя Л) линейны- линейными и однородными формулами через /ii, ..., /x^+i- Коэффициенты этих формул, т. е. -^Dji, составляют невырожденную матрицу, так как в противном случае можно подобрать не все равные нулю числа /ii, ... . . ., /i/e+i, для которых будет /л[ = . . . = /i^+1 = 0. Но это означает, что некоторая точка М G Щ не имеет проекции на П^ вопреки усло- условию. Таким образом, мы установили, что центральное проектирование Щ на П^ из центра О задается линейными однородными формулами D) с невырожденной матрицей коэффициентов. Теорема доказана. Рис. 104. Итак, центральное проектирование является частным случаем про- проективного отображения. Отсюда, по-видимому, происходит название проективных отображений. 6. В качестве упражнения рекомендуем читателю доказать, что ес- если возможно (взаимно однозначное) центральное проектирование плос- плоскости Щ на плоскость П^ из центра О, то Щ, П^ и О содержатся в некоторой (к + 1)-мерной плоскости пространства Рп.
§5] ПРОЕКТИВНАЯ ЭКВИВАЛЕНТНОСТЬ ФИГУР 425 7. Результаты, установленные в § 2 о проективных преобразовани- преобразованиях, автоматически переносятся на случай проективных отображений. Поэтому из доказанной в п. 5 теоремы вытекает следующее предложе- предложение. Пусть дана прямая а в плоскости Щ и прямая a' Е Tl'k, которая является образом а при проектировании Щ на Т['к из некоторого цен- центра О. Пусть далее U, V', М, N — четыре точки на прямой a; U'', V, М', N' — их проекции на а' {рис. 104). Тогда (U'V'M'N1) = (UVMN). Иначе говоря, двойное отношение является инвариантом относительно центральных проектирований. § 5. Проективная эквивалентность фигур 1. Две фигуры в проективном пространстве Рп (т.е. два множе- множества, состоящие из точек, прямых и ^-мерных плоскостей) называются проективно эквивалентными, если одна из них переводится в другую с помощью некоторого проективного преобразования. Так как все проективные преобразования образуют группу, то име- имеют место следующие предложения: 1) Если фигура Л проективно эквивалентна фигуре Л', то Л1 экви- эквивалентна Л. 2) Если фигура Л эквивалентна Л! и фигура Л! эквивалентна Л!', то Л эквивалентна Л". 3) Каждая фигура эквивалентна самой себе. В проективной геометрии проективно эквивалентные фигуры не различаются, подобно тому, как в метрической геометрии не разли- различаются конгруэнтные фигуры. 2. Теорема 1. В п-мерном проективном пространстве любые две плоскости одинаковой размерности проективно эквивалентны. Доказательство. Пусть произвольная ^-мерная плоскость Щ задана системой уравнений + 1- ai n+iCn+i = 0, ari?i н ь ftrn+i^n+i = о, ранг которой равен числу уравнений (г = п — к). Рассмотрим проек-
426 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII тивное преобразование B) где коэффициенты выражений ??+1, ..., ?n+i взяты как угодно, лишь бы матрица преобразования B) была невырожденной (такой выбор возможен, поскольку система A) имеет ранг г = п — к). Плоскость Щ преобразованием B) переводится во вполне определенную плос- плоскость ?[ = О, ..., ^'г = 0, которую мы обозначим через П^. Аналогично предыдущему устанавливается, что любая другая ^-мерная проектив- проективная плоскость ГЦ проективно эквивалентна плоскости П^. Отсюда сле- следует, что Щ и ГЦ эквивалентны между собой. 3. Рассмотрим проективную прямую. На ней всевозможные упоря- упорядоченные тройки различных точек проективно эквивалентны между собой вследствие теоремы 1 §3; выясним, при каких условиях проек- проективно эквивалентны четверки точек. Докажем, что справедлива Теорема 2. Для того, чтобы упорядоченные четверки различ- различных точек U, V, М, N и U', V', М', Nf на одной прямой были проек- проективно эквивалентны, необходимо и достаточно равенство их двойных отношений (UVMN) = (U'V'M'N1). C) Доказательство. Необходимость равенства C) следует из про- проективной инвариантности двойного отношения. Докажем достаточ- достаточность. Пусть равенство C) соблюдается. По теореме 1 §3 существует проективное преобразование / такое, что U' = f(U), V' = f(V), M' = f(M). Положим /(TV) = TV". Тогда {U'V'M'N") = (UVMN) = (U'V'M'N') вследствие проективной инвариантности двойного отношения и усло- условия C). Но если заданы различные точки U', V, М' и двойное отноше- отношение (U'VM'N') = g, то точка N' определяется однозначно, так как ее однородные координаты выражаются однозначно (с точностью до множителя) из формул п. 15 §2 через g и координаты U', V и М'. Поэтому N" = N'. Теорема доказана. 4. Говорят, что упорядоченная пара точек MN гармонически разделяет упорядоченную пару точек UV (расположенных на прямой M7V), если (UVMN) = -1. D)
§5] ПРОЕКТИВНАЯ ЭКВИВАЛЕНТНОСТЬ ФИГУР 427 В этом случае говорят также, что четверка точек U, V, М, N яв- является гармонической и что точка N — четвертая гармоническая для (упорядоченной) тройки точек U, V, М. Гармоничность четверки не нарушится, если: 1) поменять местами пары точек М, N и U, V; 2) поменять местами точки внутри любой из этих пар. Эти свойства сразу следуют из формулы D) и формул п. 15 § 2. 5. Пусть аффинная прямая пополнена бесконечно удаленной точ- точкой N. Рассмотрим на этой прямой отрезок А В; обозначим через М его середину. А@) N{oo) Рис. 105. i 2/ / 1 \ /А о в\ 4 \ Рис. 106. Теорема 3. Пара точек МN гармонически разделяет пару то- точек АВ. Иначе говоря, середина отрезка АВ является четвертой гармони- гармонической для Л, В, TV, где N — бесконечно удаленная точка. Доказательство теоремы. Введем на прямой аффинную координату х так, чтобы х = 0 в точке А и х — 1 в точке В. Тогда х = 1/2 в точке М (рис. 105). Введем, кроме того, однородные коорди- координаты (?, г]), полагая х = %/rj. Мы получим следующие однородные ко- координаты рассматриваемых точек: Л@, 1), МA, 2), ВA, 1), NA, 0). Отсюда с помощью формул A2)—A4) § 2 находим (ABMN) = -1. 6. Перейдем к рассмотрению некоторых фигур на двумерной про- проективной плоскости. Трехвершинником называется совокупность трех точек, не лежа- лежащих на одной прямой, и трех прямых, попарно соединяющих эти точки (рис. 106). Поскольку при проективном преобразовании прямая переходит в пря- прямую, из теоремы 1 § 3 вытекает проективная эквивалентность любых двух трехвершинников на проективной плоскости. 7. Понятие трехвершинника помогает наглядно проиллюстриро- проиллюстрировать некоторые геометрические свойства действительной проективной плоскости. Перечислим эти свойства, не останавливаясь на доказатель- доказательствах.
428 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII Один трехвершинник разбивает всю действительную проективную плоскость на четыре треугольника, которые на рис. 106 и 107 помече- помечены цифрами 1, 2, 3, 4 (на рис. 107 проективная плоскость изображена в виде сферы с отождествлени- отождествлением диаметрально противоположных точек). Если на аффинной плоскости какой-нибудь многоугольник разбит на треугольники, то можно так выбрать направление обхода каждого из этих треугольников, чтобы обходам любых двух соседних треугольников соответствовали противоположные на- направления движения по их общей сто- Рис. 107. роне (рис. 108). Такой выбор обхода треугольников можно сделать дву- двумя разными способами, что соответствует двум различным ориентаци- ям аффинной плоскости. На проективной плоскости, разбитой на треугольники, такого со- согласованного обхода всех треугольников выбрать невозможно. Напри- Например, если мы согласуем обходы первого и второго треугольников (рис. 107), а затем второго и третьего, то обходы первого и третьего треугольников оказываются не согласованными между собой. Говорят поэтому, что действительная проективная плоскость не ори- ориентируема. Замечание. На аффинной плоскости нельзя разместить не толь- только четыре, но даже и три треугольника с таким взаимным прилеганием сторон, какое наблюдается в трехвершиннике. Однако в трехмерном аффинном простран- пространстве можно построить модель взаимного расположения любых трех треугольников трехвершинника с помощью так называемого листа Мёбиуса (т.е. поверхности, склеенной из изогнутого прямоугольника, как показано на рис. 109). К краю листа Мёбиуса можно подклеить и четвертый треуголь- треугольник трехвершинника и получить модель всей проективной плоскости в виде поверхности, если допускать де- деформацию склеиваемых треугольников и самопересечение поверхно- поверхности. Это самопересечение можно ликвидировать за счет выхода в че- четырехмерное пространство. 8. Фигура на проективной плоскости, составленная четырьмя точ- точками, из которых никакие три не лежат на одной прямой, и шестью Рис. 108.
ПРОЕКТИВНАЯ ЭКВИВАЛЕНТНОСТЬ ФИГУР 429 прямыми, соединяющими попарно эти точки, называется полным че- тырехвершинником. С В А а) Рис. 109. Указанные точки называют вершинами, прямые, которые их попар- попарно соединяют, — сторонами четырехвершинника. На рис. 110 изображен четырехвершинник ABCD. Сторо- Стороны, не имеющие общей вершины, называются противоположными. Так, четырехвершинник ABCD обладает тремя парами противоположных сто- сторон: АВ и CD, AC и BD, ВС и AD. Точки пересечения противопо- противоположных сторон называют диагональ- диагональными точками четырехвершинника. На рис. 110 диагональные точки суть Р, Q, R- Из теоремы 1 § 3 следует, что любые два четырехвершинника проек- тивно эквивалентны (тогда как системы из пяти точек на проективной плоскости, вообще говоря, не эквивалентны между собой). Обратим внимание на то, что все три диагональные точки четы- четырехвершинника равноправны между собой: любую из них можно пере- перевести в любую другую таким проективным преобразованием, которое Рис. ПО.
430 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII переводит четырехвершинник в себя. Например, если мы хотим пере- перевести точку Р в точку Q (см. рис. ПО), то нам достаточно взять такое проективное преобразование /, при котором f(A) = A, f(B) = С, f(C) = B, f(D) = D. Тогда прямая ЛВ перейдет в прямую ЛС, прямая CD — в прямую BD так, что точки Р и Q поменяются местами, а четырехвершинник ABCD преобразуется в этот же четырехвершинник. 9. Пусть дан четырехвершинник ABCD. Через две его диагональ- диагональные точки Р и Q проведем прямую и обозначим через Е и F точки ее пересечения с теми двумя сторонами четырехвершинника, которые проходят через третью диагональную точку R (рис. 111). Рис. 111. Теорема 4. Если выполнено указанное построение, то следую- следующие четверки точек являются гармоническими P,Q,E,F; A,D,E,R; B,C,F,R. Доказательство. Будем считать, что проективная плоскость получена в результате пополнения аффинной плоскости бесконечно удаленными точками. Сделаем проективное преобразование, перево- переводящее точки Л, Б, С и D соответственно в вершины Л', В1', С и D' некоторого параллелограмма. Тогда точка Р перейдет в центр Р' па- параллелограмма А'В'СD' (рис. 112), точки Q и R перейдут в беско- бесконечно удаленные точки Q' и R' прямых А'В' и A'D' соответственно. Прямая PQ перейдет в прямую, параллельную А1В1\ точки Е и F — в середины Е' и F' противоположных сторон A'D' и В'С, а точка Р' окажется серединой отрезка Е'F''. Поэтому с учетом теоремы 3 п. 5 и проективной инвариантности двойного отношения имеем (PQEF) = {P'Q'E'F') = -1, (ADER) = {A'D'E'R') = -1, (BCFR) = {B'C'F'R') = -1, что и требовалось доказать.
§6] КЛАССИФИКАЦИЯ ГИПЕРПОВЕРХНОСТЕЙ 431 10. Покажем, как геометрически построить четвертую гармониче- гармоническую точку N для трех заданных точек U, V, М на евклидовой плос- плоскости (U, V, М — три различные точки на одной прямой). Через точку U проведем прямую, перпендикулярную UV и отложим на ней отрезки AU = UD (рис. 113). Обозначим через В и С точки пересечения прямых DM и AM с перпендикуляром к прямой UV, проходящим через точку V. /\ А Тогда прямые DC и АВ, очевидно, Рис. 113. пересекают UV в одной точке, которая является искомой вследствие теоремы 4. § 6. Проективная классификация гиперповерхностей второго порядка 1. Теорема. Для того, чтобы две гиперповерхности второго по- порядка в действительном Рп были проективно эквивалентны, необхо- необходимо и достаточно, чтобы левые части их уравнений имели одинако- одинаковые ранги и равные по абсолютной величине сигнатуры. Доказательство. Пусть даны гиперповерхности «(?, О = О, Ь(?, О = О, A) где а(?, ?), 6(?, ?) — квадратичные формы относительно однородных координат (?ь . . . , fn+i) = f. Геометрический смысл каждого из уравнений A) не изменится, ес- если обе части уравнения умножить на —1. Поэтому можно предпола- предполагать, что канонический вид каждой из квадратичных форм содержит отрицательных членов не больше, чем положительных. Тогда сигна- сигнатура положительна и равенство рангов и сигнатур двух квадратич- квадратичных форм равносильно равенству их рангов и положительных индек- индексов. Учитывая это соображение, докажем сначала достаточность, за- затем необходимость. 1) Пусть квадратичные формы а(?, ?) = 0 и 6(?, ?) = 0 имеют один и тот же ранг г и один и тот же положительный индекс к. Рассмотрим квадратичную форму <?,?)=&+¦¦¦+?-?+!—е B) и вместе с ней третью гиперповерхность с(?, ?) = 0. Мы знаем, что существует невырожденное линейное преобразова- преобразование переменных, которое форму а(?, ?) переводит в форму вида B). Это значит, что существует проективное преобразование, которое пе- переводит гиперповерхность а(?, ?) = 0 в гиперповерхность с(?, ?) = 0,
432 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII то есть указанные гиперповерхности проективно эквивалентны. Точно так же гиперповерхность 6(?, ?) = 0 проективно эквивалентна гипер- гиперповерхности с(?, ?) = 0. Следовательно, гиперповерхности A) проек- проективно эквивалентны между собой. 2) Пусть а(?, ?) и 6(?, ?) проективно эквивалентны. Это значит, что существует линейное преобразование переменных ? в переменные ту, которое переводит форму а(?, ?) в квадратичную форму 6(ту, ту). Но тогда ранги и положительные индексы квадратичных форм а(?, ?) и 6(?, ?) одинаковы. Теорема доказана. Замечание. В n-мерном комплексном проективном простран- пространстве гиперповерхности а(?, () = 0 и 6(?, ?) = 0 проективно эквива- эквивалентны тогда и только тогда, когда квадратичные формы а(?, ?) и 6(?, ?) имеют одинаковый ранг г. Доказательство аналогично преды- предыдущему. 2. Определение. Гиперповерхность второго порядка а(?, ?) = = 0 в n-мерном проективном пространстве называется невырожден- невырожденной, если невырождена квадратичная форма а(?, ?), то есть если ее ранг г = п + 1. Замечание. Сформулированное определение согласуется с тер- терминологией предыдущей главы. 3. В действительном Рп всякая невырожденная гиперповерхность проективно эквивалентна одной из гиперповерхностей вида где ^2~^ к ^ п +1. Поэтому при четном п в пространстве Рп имеется т^ + 1 проективно различных невырожденных гиперповерхностей вто- второго порядка, а при нечетном п число их равно ^ (п + 3). 4. В двумерном проективном пространстве, которое называется проективной плоскостью, имеются (в действительном случае) две про- проективно различные невырожденные гиперповерхности второго поряд- порядка, которые, впрочем, в этом случае гораздо естественнее называть кривыми (что все и делают). Именно: 1) кривая которая на действительной плоскости совсем не имеет точек и потому называется нулевой; 2) кривая Й + Й-42 = о, (з) которая имеет действительные точки и носит название овальной.
КЛАССИФИКАЦИЯ ГИПЕРПОВЕРХНОСТЕЙ 433 5. Будем считать, что проективная плоскость получена из обычной плоскости добавлением бесконечно удаленной прямой ?з = 0. Прямая ?3 = 0 не пересекает кривую C), и мы можем в уравнении C) перейти к неоднородным координатам х =?, У =? • Получаем эллипс х2 + у2 = 1. 6. Предположим теперь, что бесконечно удаленной является пря- прямая ^2 = 0. Она пересекает кривую C) в двух различных действи- действительных точках (±А, 0, А). Исключая их из рассмотрения, перейдем к неоднородным координатам х = ? , У =1^- Получим гиперболу х2-у2 = 1. Рис. 114. Рис. 115. 7. Теперь сделаем на проективной плоскости следующее преобра- преобразование однородных координат: т = - Ь Тогда уравнение C) примет вид ц\ - 6, + 6- = о. (За) Будем считать, что бесконечно удаленной является прямая rjs = = 0. Эта прямая пересекает кривую (За) в двукратной точке @, А, 0). Исключая ее из рассмотрения, положим х =^-, у —^г- Получим пара- параболу у — х2.
434 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII 8. Таким образом, аффинно различные эллипс, гипербола и пара- парабола получаются из одной и той же овальной кривой в зависимости от того, как она расположена по отношению к той прямой, которая является (или считается) бесконечно удаленной. Рис. 116. В тех моделях проективной плоскости, где не выделена бесконечно уда- удаленная прямая, такого различия нет. Так, например, если в качестве Р<± взята связка О в Из, то овальная кривая представляет собой обычный конус. Переходя от связки к плоскости И^ согласно п. 2 §3, мы полу- получим эллипс, гиперболу или параболу в зависимости от расположения плоскости IX2 по отношению к рассматриваемому конусу (см. рис. 114, 115, 116). 9. Согласно п. 3 в трехмерном действительном проективном про- пространстве имеются три различные невырожденные поверхности второ- второго порядка. Перечислим их. 1) ^ + ?| + ?з + ?f = 0 — нулевая поверхность (мнимый эллипсоид), у нее нет действительных точек. 2) ?^ + ?| + ?| — ?| = 0 — овальная поверхность. Этот тип включает эллипсоид, эллиптический параболоид и двуполостный гиперболоид. Здесь полная аналогия с овальной кривой, рассмотренной выше. 3) ?f + ?! ~~ ?з ~~ ?f = 0 — кольцевидная поверхность. Надлежащим подсчетом нетрудно проверить, что при переходе к аффинному про- пространству кольцевидная поверхность превращается либо в однополост- ный гиперболоид, либо в гиперболический параболоид. Разница состо- состоит в том, что однополостный гиперболоид пересекает бесконечно уда- удаленную плоскость по овальной кривой, а гиперболический параболоид пересекает бесконечно удаленную плоскость по двум прямолинейным образующим. Наглядной моделью кольцевидной поверхности может служить тор. Не останавливаясь на доказательстве, ограничимся лишь рис. 117, на котором параллелям тора а, /3, 7> ^ соответствуют пря- прямолинейные образующие кольцевидной поверхности, помеченные теми
КЛАССИФИКАЦИЯ ГИПЕРПОВЕРХНОСТЕЙ 435 же буквами; меридианам тора /, //, ///, IV, V соответствуют оваль- овальные кривые на кольцевидной поверхности, помеченные теми же циф- цифрами. Одному меридиану ABCD, взятому на торе, соответствует бес- бесконечно удаленная овальная кривая кольцевидной поверхности. Она условно изображена в двух экземплярах; нужно представить себе, что точки на ней, помеченные одинаковыми буквами, отождествляются. D \^l ,-—- >^^ 7 -*• \ \ \ Рис. 117. Из изложенного в п. 9 §6 гл. XI следует, что в четырехмерном аф- аффинном пространстве существуют два различных вида действитель- действительных конусов второго порядка. Можно проверить, что один из этих ко- конусов изображает овальную поверхность, а другой — кольцевидную, если в качестве модели Рз рассматривается связка в П4. 10. Заметим еще, что при рассмотрении вырожденных поверхно- поверхностей нужно иметь в виду, что в проективном пространстве исчеза- исчезает разница между цилиндрами и конусами. Прямолинейные образую- образующие цилиндра, параллельные с аффинной точки зрения, пересекают- пересекаются в одной бесконечно удаленной точке. Так, например, уравнение C) в трехмерном действительном проективном пространстве задает дей- действительный конус. При переходе к аффинному пространству этот ко- конус в зависимости от положения бесконечно удаленной плоскости пре- превращается в одну из следующих четырех поверхностей, различных в аффинной классификации: конус х2 + у2 — z2 = 0, эллиптический ци- цилиндр, параболический цилиндр или гиперболический цилиндр.
436 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII 11. Вернемся к двумерному случаю. Нетрудно заметить, что при переходе от аффинной плоскости к проективной кривая второго по- порядка пополняется бесконечно удаленными точками тех и только тех Рис. 118. прямых, которые имеют асимптотические направления относительно рассматриваемой кривой (рис. 118, 119). На рис. 119 (как и на рис. 116) показана парабола и модель овальной кривой в виде конуса а в связ- связке О. Параболе соответствует конус а, за исключением одной прямо- прямолинейной образующей а. Ось параболы и все параллельные ей прямые плоскости IX2 имеют общую бесконечно удаленную точку Л, которой в связке О соответствует прямая а. Точка А является бесконечно уда- удаленной точкой рассматриваемой параболы. \я2 \ \ У ¦'¦( а Рис. 119. ! \ : \ \. 12. Утверждение, сформулированное в п. 11, мы докажем сразу для n-мерного случая. Если мы считаем точки ?n+i = 0 бесконечно удаленными, то для нахождения всех бесконечно удаленных точек, лежащих на гиперпо- гиперповерхности второго порядка, достаточно в ее уравнении положить ?n+i = = 0. Вернемся к уравнению F) § 1. При ?n+i = 0 получим Уравнение D) с точностью до обозначений совпадает с уравнением (8) §9 гл. XI, которое определяет координаты векторов, имеющих асимп-
§ 7] поляры 437 тотические направления относительно рассматриваемой гиперповерх- гиперповерхности. Отсюда следует, что прямые асимптотических направлений и есть те прямые, на которых находятся бесконечно удаленные точки данной гиперповерхности. § 7. Пересечение гиперповерхности второго порядка и прямой. Поляры 1. Пусть в n-мерном проективном пространстве Рп дана гиперпо- гиперповерхность второго порядка п+1 и прямая ?i= fJLUi+l/Vi (i = 1, . . . , П + 1), A) проходящая через какие-нибудь две точки U(ui, . . ., nn+i), V(vi, ... . . ., vn+i) пространства Рп. Для нахождения точек пересечения пря- прямой A) с гиперповерхностью (а) нужно подставить выражения A) в уравнение (а). Мы получим уравнение вида Л/i2 + 2Bfj,i/ + Си2 = 0, B) где п+1 п+1 п+1 А= ^2 a>ijUiUj, В= ^2 aijuivj, С = ^2 aijViVj. C) г, .7 = 1 *,J = 1 *,J = 1 Уравнение B) определяет искомые точки пересечения. Исследуем уравнение B). Решение ц = и = 0 дает ?i = ... = = ?п+1 = 0, так что ему не соответствует никакая точка в Рп. Нужно искать лишь те решения, для которых ц и v не обращаются в нуль одновременно. В зависимости от коэффициентов Л, В, С возможны следующие три случая: 1) АС —В2 ф 0. Покажем, что в этом случае имеются две различные точки пересечения. Предположим сначала, что А ф 0. Тогда, если v — 0, то /i = 0. Поэтому будем считать, что v ф 0 и, разделив B) на г/2, получим квадратное уравнение для отношения /л/i/, которое имеет два разных корня. Обозначим их Ai и А2. В результате получим два семейства ре- решений уравнения B) /л = Ai*/, \i = А2^, D) где v — свободное неизвестное. При v ф 0 из D) и A) находим одно- однородные координаты двух разных точек пересечения гиперповерхности (а) и прямой A).
438 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII Если при этом dij, Ui, vi действительны, но АС — В2 < О, то для {^i} получаются комплексно сопряженные значения. Тогда, даже если рассматривается действительное пространство Рп, говорят, что пря- прямая A) пересекает гиперповерхность (а) в двух комплексно сопряжен- сопряженных точках. Пусть теперь А = 0. Геометрически это означает, что точка U нахо- находится на гиперповерхности (а) (см. первое из равенств C)). Точке U со- соответствует семейство решений (/л, 0) уравнения B). Из условия АС — — В2 = — В2 ф 0 следует, что В ф 0, поэтому, кроме точки U, есть еще одна точка пересечения, координаты которой определяются из A) при УСЛОВИИ 2B/LL + Си — 0. 2) АС — В2 = 0, но среди коэффициентов Л, Б, С по крайней мере один отличен от нуля. Рассуждая аналогично предыдущему, нетрудно проверить, что уравнение B) имеет два семейства решений, слившихся в одно семейство решений либо вида v = A/i, А ф 0, либо вида ц = Аг/, А ф 0; оно дает единственную точку, принадлежащую прямой A) и гиперповерхности [а). В этом случае говорят, однако, что имеется двойная точка пересе- пересечения. Если такая точка не является особой точкой гиперповерхности (как, например, вершина конуса), то в этой точке прямая A) касается гиперповерхности. 3) А = В = С = 0. Уравнение B) обращается в тождество. Это значит, что прямая A) целиком принадлежит гиперповерхности (а), т.е. является ее прямолинейной образующей. Замечание. В проективном пространстве, в отличие от аффин- аффинного, любая гиперповерхность второго порядка пересекается с любой прямой, и понятие асимптотического направления не имеет смысла. 2. Заменим квадратичную форму в левой части уравнения поляр- полярной билинейной формой п+1 ^2 aiju^j = 0, E) считая, что (ni, . . ., un+i) — координаты произвольно выбранной за- зафиксированной точки (/Gfn, (d, ..., ?n+i) ~~ текущие координаты. Уравнение E) определяет гиперплоскость, за исключением особого случая, когда обращаются в нуль коэффициенты при всех ^, т. е. когда \ F) H Ь an+i n+i^n+i = 0. J Но однородные координаты (ui, . . . , ип+\) не обращаются в нуль од-
§ 7] поляры 439 новременно, поэтому из F) имеем Det||oij|| =0. G) Далее, умножив уравнения F) на ui, ..., ^n+i соответственно и затем сложив, получим п+1 ^2 aijuiuj = 0- (s) Соотношения G) и (8) показывают, что E) может обратиться в тож- тождество лишь тогда, когда гиперповерхность (а) вырождена, а точка U принадлежит (а). Более того, для точки U не просто соблюдается уравнение (8), а со- соблюдаются по отдельности все уравнения F); такая точка U называет- называется особой точкой гиперповерхности (а). Особыми точками обладают вырожденные гиперповерхности и только они. Типичный пример осо- особой точки — вершина конуса. Итак, E) обращается в тождество тогда, когда гиперповерхность (а) вырождена, а точка U принадлежит ей и является ее особой точкой. Во всех остальных точках равенство E) определяет некоторую гиперплоскость. Определение. Гиперплоскость E) называется полярой точки U относительно гиперповерхности (а). Непосредственно из определения следует, что если точка U распо- расположена на гиперповерхности (а) и имеет поляру, то эта поляра прохо- проходит через точку U; если же U не принадлежит (а), то поляра точки U не проходит через эту точку. Если гиперплоскость П является полярой точки U, то точка U на- называется полюсом гиперплоскости П (относительно рассматриваемой гиперповерхности (о?)). Легко показать, что произвольная гиперплос- гиперплоскость П имеет единственный полюс относительно любой невырожден- невырожденной гиперповерхности второго порядка. В самом деле, пусть дана гиперплоскость Aifi + ••• +Лп+1^п+1 =0. Для отыскания полюса этой гиперплоскости получаем из уравнения E) систему + Ь ап+цип+1 = \ (9) Вследствие невырожденности данной гиперповерхности второго по- порядка имеем Det ||а^|| ф 0. При этом условии система уравнений (9) имеет и притом единственное решение (ui, . . ., nn+i), что и требова- требовалось.
440 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII 3. Высказанное выше определение поляры как гиперплоскости, ко- которая дана для точки U{u\, . . ., nn+i) уравнением E), связано с неко- некоторой системой проективных координат. Нужно показать, что это опре- определение имеет инвариантный (геометрический) смысл, т. е. что поляра данной точки U относительно данной гиперповерхности второго по- порядка не зависит от выбора системы проективных координат. Допустим, что мы переходим от старых координат & к новым коор- координатам ?[ по формулам вида A) п. 4 § 2; без потери общности можем считать в этих формулах Л = 1. По терминологии тензорной алгеб- алгебры формулы такого вида определяют контравариантный закон преоб- преобразования. По таким формулам, в частности, преобразуются старые координаты Ui точки U в новые координаты и\ той же самой точки. Преобразуя левую часть уравнения данной гиперповерхности второго порядка, мы получим тождество п+1 п+1 вследствие которого новые коэффициенты а'- выражаются через ста- старые dij по ковариантному закону. Но в таком случае п+1 п+1 Е <№= Е «wth A0) поскольку полная свертка двухвалентного ковариантного тензора с дву- двумя контравариантными тензорами есть инвариант. Из равенства A0) п+1 п+1 видно, что уравнения ^ а'-и[^=0и J^ aijU^j; = 0 соблюдаются одновременно и, следовательно, определяют одну и ту же плоскость. Тем самым инвариантность определения поляры, т. е. независимость поляры от выбора проективных координат, доказана. Заметим теперь, что формулы вида A) п. 4 § 2 можно рассматривать с другой точки зрения, а именно как формулы проективного преобразования. Поэто- Поэтому нами доказана следующая теорема. Теорема 1 (проективная инвариантность поляры). Если при про- проективном преобразовании гиперповерхность (а) переходит в некото- некоторую гиперповерхность (а'), а точка U — в точку U', то поляра точки U относительно (а) переходит в поляру точки U' относительно {а'). 4. Выше, в § 5 были определены гармонические четверки точек. Для дальнейшего нужно распространить это понятие на случай, когда точки одной из двух гармонически разделенных пар сливаются. Временно будем считать, что проективная прямая с четверкой то- точек М, TV, U, V получена в результате пополнения аффинной прямой бесконечно удаленной точкой U. Тогда (MNUV) = -1, если V яв- является серединой отрезка MTV (см. §5, п. 5). Пусть теперь точка N
§ 7] поляры 441 стремится к М, а точка V остается четвертой гармонической для упо- упорядоченной тройки М, TV, U. Тогда V тоже стремится к М. Исходя из этого, будем вообще считать, что если М = TV, то чет- четвертая гармоническая точка V для упорядоченной тройки М, TV, U совпадает с М и N и будем писать в этом случае (MNUV) = (UVMN) = -1. 5. Пусть точка U не принадлежит гиперповерхности (а), и пусть прямая а проходит через U. Согласно п. 1 прямая а пересекает гиперповерхность в двух точках М, N (различных, совпадающих или комплексно сопряженных). Определение. Точки U и V на прямой а расположены гармо- гармонически относительно гиперповерхности (су), если {UVMN) = —1. Замечание. Этим определением можно пользоваться и тогда, когда пространство действительно, а точки М, N комплексно сопря- сопряженные (здесь мы используем терминологию, принятую нами в п. 1 § 7). С помощью формул п. 15 § 2 можно доказать, что в этом случае, если точка U является действительной, то и точка V действительна. 6. Теорема 2. Если точка U не принадлежит гиперповерхно- гиперповерхности (а), то поляра точки U есть геометрическое место всех таких точек V, что пары UV расположены гармонически относительно (а). Доказательство. Пусть V — четвертая гармоническая для то- точек М, TV, U. Координаты произвольной точки на прямой а, отличной от U, можно представить в виде ?i = \Ui+Vi A1) (см. A) при v ф О, Л = fi/iy). Точки М и N определяются из A1) при А = Ai, Л = Л2, где Ai, А2 — корни квадратного уравнения п+1 п+1 п+1 i,j = l i,j = l г, ,7=1 которое получается при подстановке A1) в (а). Предположим, что Ai ф \^. Тогда точки М и N различны, и в силу выбора точки V имеем (MNUV) = (UVMN) = ^- = -1. A3) А2 Значит, Ai + А2 = 0, и по теореме Виета п+1 °>ijuivj = 0- A4) Равенство A4) показывает, что точка V принадлежит поляре точки U.
442 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII Если Ai = А2, то М = TV, а согласно п. 4 V = М = TV, и из A1) находим, что Ai = А2 = 0 (эти же равенства можно получить и из A2), учитывая, что точка V находится на гиперповерхности {а)). Таким образом, снова имеем Ai + A2 = 0, A5) откуда, как и выше, получаем A4). Пусть теперь точка V принадлежит поляре, то есть соблюдает- соблюдается A4). Из A4), A2) и теоремы Виета следует A5). Дальше имеются две возможности: либо Ai = А2 = 0, тогда V = М = N вследствие A1), и (UVMN) = = — 1 согласно п. 4; либо Ai ф А2, и тогда применима формула A3). Теорема 2 доказана. 7. Теорема 1 является геометрически очевидным следствием тео- теоремы 2. Чтобы пояснить это, рассмотрим случай, когда точка U не ч п принадлежит гиперповерхности ~^-^ (а). Тогда для построения поляры - _ _ ^ N точки U достаточно найти п ^__^_^ "" ^О точек Vi, ..., Vn, находящихся \ \ \ I ^ ^ * в общем положении и таких, ^ ^'/ что все пары UVi расположены ^" /' гармонически относительно (а). ^ - ^ Гиперплоскость, проходящая через \ точки Vi, V2, ..., Vni и будет по- Рис. 120. лярой точки U. При проективном преобразовании она перейдет в поляру образа точки U относительно образа гиперповерхности (а) вследствие проективной инвариантности двойного отношения. 8. Пусть точка U не принадлежит гиперповерхности (а) и распо- расположена на некоторой гиперплоскости, принимаемой за бесконечно уда- удаленную. Тогда из теоремы 2 и п. 5 § 5 (с учетом § 10 гл. XI) следует, что поляра П точки U представляет собой диаметральную гиперплоскость, сопряженную направлению тех параллельных прямых, которые пере- пересекаются в точке U (рис. 120). 9. Рассмотрим частный случай, когда гиперповерхность имеет урав- уравнение вида С]?2 + • • • + сп+]?2 = 0 A6) где Ci ф 0 для всех г = 1, ...,п + 1,ав качестве точки U берется точка Aj с координатами О = 1> &=0 ПРИ ъФ5 A7) (j — некоторый фиксированный номер, 1 ^ j ^ п + 1).
ПОЛЯРЫ 443 Согласно формуле E) полярой точки Aj является гиперплоскость 0 = о. Напомним, что выбор точек с координатами вида A7) и точки еди- единиц ВA, . . ., 1) однозначно определяет систему координат в Рп (§3, п. 9). В данном случае система точек А\, ..., An+i обладает следу- следующим свойством, характеризующим специальное расположение этих точек относительно гиперповерхности A6). Каждая из точек Aj является полюсом гиперплоскости, проходя- проходящей через остальные точки Ль ..., Д,_ь Д,+ъ • • •, ^п+ь Такая система точек называется автополярной. Можно доказать, что указанное свойство не только необходимо, но и достаточно для того, чтобы уравнение невырожденной гиперповерх- гиперповерхности второго порядка приняло вид A6), а за счет выбора точки единиц можно добиться, чтобы \с{\ = 1 при г = 1, ..., п + 1. 10. Рассмотрим еще некоторые свойства поляр. Теорема 3 (принцип взаимности в теории поляр). Если точка V расположена на поляре точки U, то поляра точки V проходит через точку U. Доказательство. Теорема 3 следует из определения поляры и симметричности матрицы \\dij\\ коэффициентов уравнения (а). Теорема 4. Если точка U лежит на гиперповерхности (а) и имеет поляру П, то каждая прямая в поляре П, проходящая через точку U, касается этой гиперповерхности в точке U, являясь, быть может, ее прямолинейной образующей (рис. 121). Доказательство. Если прямая вида A) не имеет с гиперпо- гиперповерхностью (а) других общих точек, кроме точки U, то она является касательной согласно пп. 1, 2. Поэтому достаточно доказать, что если на прямой A), кроме U, есть еще точка V, принадлежащая и гиперпо- гиперповерхности (а) и ее поляре E), то прямая A) целиком принадлежит ги- гиперповерхности. Пусть точки U, V принадлежат гиперповерхности (а) п+1 п+1 ijUiUj =0, п / \ / / ( у \ \\ \\ \\ 1 / 1 L - - ¦ 1 / 0 \ \ \ 1 1 ' 1 у '/ \ \ \ v \ Рис. 121. и пусть, кроме того, точка V находится на поляре точки U п+1 °>ijuivj = 0- A9)
444 ПРОЕКТИВНОЕ ПРОСТРАНСТВО [Гл. XII Используя A8), A9), A) и (а), находим, что п+1 п+1 dij(iiUi + Wi)(iiUj + Wj) = n+l n+l n+l = /i2 2_^ CLijUiUj + 2/iJ/ 2_^ CLijUiVj + IS2 2^ CLijViVj = 0, при любых /i, г/, то есть прямая ?/Кявляется прямолинейной образую- образующей гиперповерхности (а). Теорема 4 доказана. Следствие. Если точка на проективной плоскости принадле- принадлежит овальной кривой, то поляра этой точки является касательной Q к овальной кривой. 11. В качестве приложения изложен- изложенных выше результатов рассмотрим сле- следующую задачу. Пусть на двумерной евклидовой плос- плоскости дан эллипс и точка U вне его. Тре- Требуется построить касательные к эллипсу, проходящие через точку U. Построение. Через точку U про- проведем какие-нибудь две прямые, каждая из которых пересекает эллипс в двух раз- различных (действительных) точках Л, Б и С, D соответственно (рис. 122). Пусть Q — точка пересечения прямых AD и ВС] Р — точка пересечения прямых АС и ВD; К и L — точки пересечения эллипса с прямой PQ. Тогда прямые UK и UL являются искомыми касательными. Доказательство легко проводится с помощью теоремы 4 из п. 9 § 5, теорем 2-3 этого параграфа и следствия, сформулированного в предыдущем пункте. Рис. 122.
ПРИЛОЖЕНИЕ 1 Доказательство теоремы о классификации линейных величин 1. Утверждение, которое мы высказали в главе VI в конце § 2 и в п. 8 § 3 и оставили там без доказательства, может быть сформулировано в виде следующей теоремы. Теорема. Пусть Gn — группа всех действительных невырожден- невырожденных п х п-матриц, /(Р) — действительная числовая функция, заданная на Gn. Пусть и = /(Р) — гомоморфизм группы Gn в группу (по умножению) всех действительных чисел без нуля, т. е. f(pp') = f(P)f(P') (i) для любых Р, Р' G Gn- Тогда либо /(Р) = | Det Р\а, а = const, B) либо f(P) = ±\ Det P\a, C) где знак плюс отвечает случаю Det P > 0, а знак минус — случаю Det P < 0. Замечание 1 . Обе функции B), C) удовлетворяют условию A) вследствие хорошо известного свойства определителя произведения матриц. Поэтому сущность теоремы заключается в гарантии, что, кроме B) и C), нет других функций, удовлетворяющих условию A). Замечание 2. В приведенной выше формулировке теоремы упуще- упущены теоретико-функциональные условия. Мы докажем теорему, предполагая, что функция /(Р) непрерывна на Gn. Замечание 3. Дальше мы можем забыть, что и = /(Р) есть гомо- гомоморфизм Gn в группу по умножению действительных чисел без нуля, а тре- требовать только соблюдения A). Дело в том, что если исключить неинтересный случай тождественного равенства /(Р) = 0, то из условия A) само собой сле- следует, что /(Р) ф 0 для всех Р Е Gn- В самом деле, допустим, что есть хотя бы одна матрица Ро Е Gn-, для которой /(Ро) = 0. Тогда для любой Р Е Gn имеем /(Р) = /(РР0~1)/(Р0) = = 0. Отсюда находим важное следствие условия A): НЕ) = 1, D) где Е — единичная матрица. Равенство D) вытекает из соотношения /(Р) = = f(PE) = f(P)f(E), поскольку f(P) ф 0. Из D) получаем /(P-1) = {/(P)}-1, E) поскольку /(Р-1)/(Р) = f(E) = 1.
446 ПРИЛОЖЕНИЕ 1 2. Доказательство теоремы проведем сначала для случая п = 1. При п = 1 имеем /(*») = /(*)/ы, (в) где х, у ? R. Через Я обозначена числовая ось, из которой выброшен нуль. Отметим несколько простых следствий равенства F): 1) Если ж > О, то /(ж) > 0. Дело в том, что /(ж) = f(y/x)f(y/x) = {/(л/х)}2 > 0. 2) Если есть число хо < 0, для которого /(жо) < 0, то f(x) < 0 для любого х < 0. Поясним это: если х < 0, то f(x)f(xo) = f(xxo) > 0. При этом же предположении при ж < 0 имеем /(ж) = —/(|ж|). В самом деле, вследствие E) находим {/((ж!)} = /([ж]); отсюда поскольку /(-1)/(-1) = /A) = 1 и /(-1) < 0. 3) Если есть число жо < 0, для которого /(жо) > 0, то /(ж) > 0 для всех ж G Я, причем всегда /(ж) = /(|ж|). Именно, для ж < 0 в этом случае имеем ж = Ажо, где А = -^- > 0; поэтому f(x) = /(Ажо) = /(А)/(жо), так как /(жо) > 0 по условию, а /(А) > 0 по свойству 1). Кроме того, аналогично предыдущему найдем, что 0 < /(—1) = = л/А1) = !> так чт0 /(И) = /(-1 ' ж) = /(-!)/(ж) = /(ж)- ПРИ ж > 0 равенство /(ж) = /(|ж|) очевидно. Вследствие свойств 1), 2), 3) дело сводится к рассмотрению полуоси ж > 0. 4) Для любого рационального числа г > 0 и для любого ж > 0 f(xr) = {f(x)}r. G) В самом деле, если г = п (п — натуральное), то вследствие F) /(*") = f(xx ...x) = f(x)f(x) . . . f(x) = (f(x))n. (8) Если г = 1/т (т — натуральное), то вследствие (8) {/(ж1/т)}т = /(ж); отсюда f{x"m) = {f{x)f'm. (9) Из (8) и (9) получаем f(xn/m) = {f(x)}n/m. Тем самым G) доказано. Возьмем теперь какое-нибудь фиксированное число а, а > 0, а ф 1. Положим Ъ = /(а); при наших условиях Ъ > 0. Мы можем написать Ъ = = а*7, а = const. Пусть ж — любое положительное число. Мы также можем написать ж = а и считать, что к есть предел некоторой последовательности рациональных чисел гп: к = lim rn. п—)- + оо Согласно G) /(аг") = {/(а)}г". Отсюда и вследствие непрерывности функции /(ж) имеем /(ж) = f(ak) = /(limar») = lim/(ar») = Hm{/(a)}r» = {/(a)}* = = bk = aak = (ak)a = xa. Тем самым при п = 1 теорема доказана. Именно, либо /(ж) = \х\а при любом ж G Я, либо /(ж) = dz^l*7, где знаки плюс и минус отвечают случаям ж > 0 и ж < 0 (ж G Я).
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ О КЛАССИФИКАЦИИ ЛИНЕЙНЫХ ВЕЛИЧИН 447 3. Обратимся к группе Gn при любом п. Допустим, что существует чис- числовая функция /(Р), Р G Gn, удовлетворяющая условию A). Заметим прежде всего, что на эквивалентных матрицах рассматриваемая функция принимает одно и то же значение. В самом деле, если = АР1А то вследствие A) и E) Поэтому мы можем считать, что рассматриваемая функция /(Р) определе- определена на множестве всех невырожденных линейных преобразований некоторо- некоторого n-мерного действительного линейного пространства Ln. Символ Р при этом будем понимать по своему усмотрению либо как обозначение линейно- линейного преобразования, либо как обозначение его матрицы (безразлично, в каком базисе). Введем в пространстве Ln евклидову метрику. Тогда для любого Р имеем P = JB, A0) где J — некоторое изометричное линейное преобразование, В — самосопря- самосопряженное преобразование (см. §11 гл. IX). Мы можем считать, что Det J > 0 (следовательно, Det J = +1). Рассмотрим подгруппу j(t) группы Gn, составленную матрицами вида о (к) 0 cos t — sin t sin t cos t (П) считая, что клетка (к) занимает на диагонали какое-нибудь фиксированное место. Убедимся, что f(j(t)) = 1 при любом t. В самом деле, функция и = = f(j(t)) отображает сегмент 0 ^ t ^ 2тг на некоторый сегмент а ^ и ^ 6, [а, Ь] С Я, причем, так как /(j@)) = f(E) = 1, тоО<а^1^6 (здесь следует учесть замечание 3 п. 1). Отсюда, если есть значение ?, для которого f(j(t)) Ф 1? т0 а < ^- Кроме того, так как j(t) — подгруппа, то вместе с каждым своим элементом она содержит обратный ему. Поэтому из равенства E) следует, что а < 1 < Ь. Пусть j есть такой элемент j(t), что f(j) = b. Мы имеем f(j2) = b2 > 6, что невозможно, поскольку j2 принадлежит j(t) и b есть наибольшее значение f(j(t)). Остальную часть доказательства мы разделим на два пункта. 1) Согласно §8 гл. IX (с учетом, что Det J = +1) матрица J представ- представляется в виде J = ji . . . js, где ji, . . ., js — матрицы вида A1) при разных расположениях клетки (к). Отсюда и на основании предыдущего = /(ii)-••/&) = !• A2) 2) Положим 0 Ьк(х) = A3) о
448 ПРИЛОЖЕНИЕ 1 где х занимает на диагонали к-е место. При данном х и при разных к выра- выражение A3) дает эквивалентные матрицы. Следовательно, функция <р(х) = f(bk(x)) не зависит от к. Заметим далее, что b\{x)b\{y) = bi(xy). Отсюда и из основ- основного равенства A) находим ip(xy) = ip(x)ip(y), ж, у Е R. Поэтому и на основании п. 2 имеем: либо ip(x) = \х\а, а = const, либо ip(x) = =Ь|а:|сг, где знаки плюс и минус соответствуют случаям х > 0 и х < 0. Согласно § 3 гл. IX линейное преобразование В в некотором базисе пред- представляется диагональной матрицей; пусть Ai, . . ., Ап — числа, стоящие на диагонали этой матрицы. Тогда имеем: В = 6i(Ai) . . . bn(Xn). Отсюда либо = |А1...АПГ, A4) либо }{В) = p(Ai).. . ?>(An) = ±|Ai . .. А„Г. A5) Равенство A5) получается, если (р(х) = =Ь|ж|°\ Тогда в A5) знак минус возникает в случае, если среди чисел Ai, . . ., Ап имеется нечетное число от- отрицательных, т. е. если Ai . . . Ап < 0. Но Ai . . . An = Det В = Det P. Отсюда и из равенств A0), A2), A4), A5) получаем утверждение теоремы.
ПРИЛОЖЕНИЕ 2 Эрмитовы формы. Унитарное пространство 1. Пусть L — комплексное линейное пространство. Наряду с линейными функциями, изученными выше, в §1 гл. IV, в пространстве L можно рас- рассматривать так называемые линейные функции второго рода, определяемые следующими аксиомами: 1) Ь(х + у) = Ь(х) + Ь(у) для любых векторов ж, у из L; 2) b(ax) = ~ab(x) для любого вектора ж из L и любого комплексного числа а. В отличие от введенных сейчас функций, обычные линейные функции называют линейными функциями первого рода. Нет необходимости строить отдельную теорию линейных функций вто- второго рода: если а(х) — линейная функция первого рода, то Ь(х) = а(х) — ли- линейная функция второго рода; если Ь(х) — линейная функция второго рода, то а(х) = Ь(х) — линейная функция первого рода. Однако наличие двух ти- типов линейных функций (форм) влечет за собой существование разных типов полилинейных форм, а именно таких, которые являются линейными перво- первого рода по некоторому набору своих аргументов и второго — по остальным аргументам. В частности, возникают четыре типа билинейных форм: 1) линейные первого рода по каждому из аргументов (они изучены выше, в гл. IV); 2) линейные первого рода по первому аргументу и второго рода — по второму; 3) линейные второго рода по первому аргументу и первого рода — по второму; 4) линейные второго рода по обоим аргументам. Нетрудно заметить, что четвертый из этих типов получается комплекс- комплексным сопряжением из первого, а третий — из второго. Предметом нашего рассмотрения будет сейчас некоторый класс билиней- билинейных форм второго типа, имеющий важные приложения (в частности, в тео- теории функций комплексных переменных и в квантовой физике), а также свя- связанные с ним геометрические вопросы. Определение. Билинейная форма второго типа а (ж, у) называет- называется эрмитовой, если а{у, х) = а(ж, у) для любых векторов ж, у из L. (Черта над комплексным числом, как и раньше, обозначает переход к сопряженному числу.) Таким образом, функция а(ж, у) называется билинейной эрмитовой фор- формой, если 1) а(х\ + Ж2, у) = a(xi, у) + а(жг, у) для любых векторов х\, Х2, У из L; 2) а(ах, у) = аа(х, у) для любых векторов ж, у из L и любого комплекс- комплексного числа а; 3) а(у, х) = а(ж, у) для любых векторов ж, у из L. 15 нв- Ефимов, Э.Р. Розендорн
450 ПРИЛОЖЕНИЕ 2 Пример. Пусть L — линейное пространство непрерывных комплекс- нозначных функций, заданных на отрезке t\ ^ t ^ t^ действительной оси. Положим а(ж, у) = x (t)y(t)dt. Тогда функция а (ж, у) представляет собой билинейную эрмитову форму. 2. Пусть а(ж, у) — билинейная эрмитова форма. Тогда функция /(ж) = = а (ж, ж) называется квадратичной эрмитовой формой, или просто эрмито- эрмитовой формой. Исходная билинейная эрмитова форма а (ж, у) называется полярной для эрмитовой формы f(x) = а(ж, х). Непосредственно из определения следует, что (квадратичная) эрмитова форма принимает только действительные значения (/(ж) = /(ж)). Эрмитова форма /(ж) называется неотрицательной (неположитель- (неположительной), если /(ж) ^ 0 (/(ж) ^ 0) для любого ж из L, и положительно опреде- определенной (отрицательно определенной), если /(ж) > 0 (/(ж) < 0) для любого хфв. Теорема 1 . Эрмитова форма /(ж) однозначно определяет полярную ей билинейную форму а (ж, у). Доказательство. Мы должны выразить неизвестную нам били- билинейную эрмитову форму а (ж, у) через заданную функцию /(ж), пользуясь тем, что а(ж, ж) = /(ж). Имеем: /(ж + у) = а(х + у, х + у) = а(ж, ж) + а(г/, г/) + а(ж, у) + а(г/, ж) = = fix) + /(!/) + 2 Re а(ж, у), откуда Reа(ж, ?/) = |[/(* + ?/) - /(ж) - f(y)]. A) Далее, /(ж + гу) = а(х + г г/, ж + гг/) = а(ж, ж) + а(гг/, гг/) + а(ж, гг/) + а(гг/, ж) = = а(ж, ж) + а(у, у) - га(ж, у) + га(ж, у) = /(ж) + /(у) + 21та(ж, у), откуда Im а(ж, ?/) = \[{(х + ty) - /(ж) - /(у)]. B) Из A) и B) получаем «(^, 2/) = \{f(* + У) + if(* + iy) ~ A + *)[/(*) + /(У)]}- C) Теорема 1 доказана. Замечание. Формуле C) можно придать более симметричную за- запись, заменив в ней у на —у и вычтя из C) почленно полученное равенство. В результате будем иметь: а(ж, у) = ^{f(x + y)~ f(x -у) + г[/(ж + гу) - /(ж - iy)]}. D)
ЭРМИТОВЫ ФОРМЫ. УНИТАРНОЕ ПРОСТРАНСТВО 451 Формулу D) можно принять за определение эрмитовой формы: функция f(x) называется (квадратичной) эрмитовой формой, если правая часть фор- формулы D) представляет собой билинейную эрмитову форму. Аналогичная си- ситуация имела место и в теории квадратичных форм (см. выше, §4 гл. IV). Здесь, однако, уместно обратить внимание на отличие формул C) и D) от соответствующей им формулы A) из § 4 гл. IV и на сходство этой последней с формулой A) настоящего пункта. 3. Предположим теперь, что комплексное пространство L является п- мерным, и пусть ei, ..., еп — какой-нибудь его базис. Разложив векторы ж, у по этому базису (ж = ^ х3 еэ;, у = ^ у3 ej) и пользуясь определением били- билинейной эрмитовой формы а (ж, у), получим ее координатное представление: а(х, У) = ^2<ijkx3yk, E) где ajk = o(ej, ek) = a^j- F) Вместе с тем f(x) = а(ж, х) = ^2 ajkx3xk. G) Матрица А = Ца^Н называется матрицей эрмитовой формы G) и ее полярной билинейной формы E) в данном базисе. Формулу E) можно дать в матричной записи: а(ж, у) = х*Ay; Ea) здесь ж, у — матрицы-столбцы (п х 1-матрицы). Звездочкой сбоку мы по- прежнему обозначаем операцию транспонирования матрицы. Черта над мат- матрицей у означает, что все ее элементы нужно заменить комплексно-сопряжен- комплексно-сопряженными числами. Рангом эрмитовой формы называется ранг ее матрицы. Эрмитова форма называется невырожденной, если ее ранг равен п. Инвариантность ранга относительно выбора базиса будет доказана в следующем пункте. Отметим попутно, что комплексная п х n-матрица А = Ца^Н называется эрмитовой, если она удовлетворяет условию akj = ~ajk, или в матричной записи А* = X (8) Из (8) следует, что определитель любой эрмитовой матрицы действителен: (Det A) = Det A = Det A* = Det A. (9) Из (8) следует также, что матрица А симметрична тогда и только тогда, когда она эрмитова и действительна. 4. Выясним закон преобразования коэффициентов эрмитовой формы при преобразовании базиса. От исходного базиса ei, ..., еп переходим к новому: Из F) и A0) находим Итак, 15
452 ПРИЛОЖЕНИЕ 2 В матричной записи формула A1) имеет вид А' = РАР*. A2) Из формулы A2) сразу следует инвариантность ранга эрмитовой формы, поскольку Det Р / 0 и Det P* = (Det P) / 0. 5. Покажем, что закон преобразования коэффициентов, даваемый фор- формулой A1), гарантирует инвариантность билинейной эрмитовой формы. Именно, пусть функция а(ж, у) в некотором базисе ei, ..., еп задана формулой E), а при переходе к новому базису A0) ее коэффициенты пре- преобразуются по формуле A1). Проверим, что числовое значение а(ж, у) на произвольной паре векторов ж, у сохраняется. Для этого наряду с коорди- координатной формой записи удобно использовать матричные формулы Eа) и A2). Пусть а\х, У) = ^2ajfkfXJ yk' = (х'УА'(у'). Согласно §5 гл. II, х = Р*х', у = Р*у', поэтому а(х, у) = х*Ау = (Р*х')*А(Р*у') = (x')*PAP*yf = (х'УА'у' = а'(х, у), что и требовалось установить. Заметим еще, что формула E) обеспечивает для функции а(ж, у) линей- линейность первого рода по первому аргументу и линейность второго рода — по второму. Если при этом dkj = Щк, то а(у, х) = а(х, у). Таким образом, фор- формула E) с учетом всех указанных обстоятельств дает общий вид билинейных эрмитовых форм в n-мерном комплексном пространстве. 6. Пусть в некотором базисе матрица эрмитовой формы f(x) такова, что djk = 0 при j ф к. Тогда говорят, что в этом базисе эрмитова форма f(x) имеет канонический вид: f(x) = ацж1жг+а22Ж2?Н Ь аппхп~х". A3) Обратим внимание на то, что все коэффициенты cljj вещественны, посколь- поскольку вообще dkj = Щп (в любом базисе). Почти дословно повторяя рассуждения и выкладки из §§ 5-9 гл. IV, мы установим следующее: 1) Эрмитову форму можно привести к каноническому виду невырожден- невырожденным преобразованием переменных, например, методом Лагранжа. Примечание. Нужно учитывать, что вместо квадратов (ж-7'J мы имеем здесь дело с величинами х3xi (см. ниже пример в п. 6). 2) Если все главные миноры матрицы эрмитовой формы отличны от нуля, то приведение к каноническому виду можно осуществить методом Якоби. Примечание. Главные миноры эрмитовой матрицы всегда действи- действительны вследствие (9), поскольку каждый из них сам является определите- определителем некоторой эрмитовой матрицы. 3) Для каждой эрмитовой формы f(x) количество положительных, от- отрицательных и нулевых коэффициентов cljj в ее каноническом виде A3) не зависит от выбора базиса, дающего форме канонический вид (закон инерции эрмитовых форм). 4) Эрмитова форма является положительно определенной тогда и только тогда, когда главные миноры ее матрицы положительны (критерий Сильве- Сильвестра для эрмитовых форм).
ЭРМИТОВЫ ФОРМЫ. УНИТАРНОЕ ПРОСТРАНСТВО 453 7. Пример. Эрмитову форму / = A + 3i)xx^ + A - 3i)x2^ A4) приведем к каноническому виду методом Лагранжа. Поскольку ац = а22 = = 0, сначала применим преобразование 2 1 2 х = z — z с целью получить хотя бы один отличный от нуля коэффициент на глав- главной диагонали матрицы формы /. Подставив A5) в A4), после надлежащей группировки находим / = 2z1JT-6iz1^2~+6iz2JT-2z2J2~. A6) Теперь мы оказались в ситуации, соответствующей первому случаю из § 5 гл. IV. Полагаем \ = 2Z+6lZA A7) Тогда эрмитова форма g = /— \у1у1 we содержит у1 и потому зависит о только от у ; именно: g = f - \уХ? = -20г2^ = -20у2Р вследствие A6) и A7). Вместе с тем, f = \y1?-^v4- (is) Теперь, выразив из A5) z1 и z2 и подставив их в A7), находим: у1 = | 1 2 ? A9) У = Итак, эрмитова форма A4) приведена к каноническому виду A8) невырож- невырожденным линейным преобразованием переменных A9). Соответствующее пре- преобразование базиса в двумерном комплексном пространстве можно выписать согласно § 5 гл. II. 8. Пусть эрмитова форма f(x) приведена к каноническому виду A3). Полагая далее xJ = ^/\a,jj\x\ если ац ф 0, ж-7 = х\ если ац = 0, мы невы- невырожденным преобразованием переменных приведем форму / к нормальному виду. Опуская тильду, его можно записать так: B0) где е равны ±1 или нулю.
454 ПРИЛОЖЕНИЕ 2 9. Пусть в линейном пространстве L (комплексном, но не обязательно конечномерном) задана положительно определенная эрмитова форма g(x). Рассмотрим полярную билинейную эрмитову форму а(х, у)иназовем ее значение на произвольной паре векторов х, у их скалярным произведением: (х,у) = а(х,у). B1) Соответственно этому определим норму вектора: ||ж|| = д/(ж, ж) = y/g(x), а также введем понятие ортогональности, считая векторы хну ортогональ- ортогональными тогда и только тогда, когда их скалярное произведение равно нулю ((*,!/) =0). Определение. Пространство L с заданным скалярным произведе- произведением B1) называют унитарным, а эрмитову форму g(x) — метрической формой этого пространства. Говорят также, что в пространстве L введена унитарная метрика. Норма произвольного вектора х в унитарном пространстве представляет собой неотрицательное действительное число (||ж|| ^ 0), которое, вследствие положительной определенности метрической формы g(x), равно нулю тогда и только тогда, когда вектор х — нулевой. При этом ||аж|| = у/(ах, ах) = = y^a~a~g\x) = \а\ • \\x\\ для любого числа а и любого вектора ж; ниже, в п. 11, мы увидим, что неравенство треугольника тоже соблюдается. Согласно теореме 1, задание метрической формы g(x) однозначно опре- определяет скалярное произведение любой пары векторов. Свойства скалярного произведения здесь несколько отличаются от действительного случая. В са- самом деле, имеем: (х\ + Ж2, у) = (ж1, у) + (#2, г/); (ж, у± + у2) = (ж, г/i) + + (ж, J/2); (ах, у) = аа(х, у); но (ж, ау) = а(х, у) и (у, х) = (ж, у). Число- Числовые значения скалярного произведения, вообще говоря, комплексны. Ортогональность вектора подпространству, ортогональность подпрост- подпространств и ортогональное дополнение определяются в унитарном пространстве по аналогии с евклидовым. Замечание. Иногда отказываются от требования положительной определенности метрической эрмитовой формы ^(ж). При этом получает- получается класс пространств, более общий, чем класс унитарных. Такие простран- пространства называют пространствами с эрмитовой метрикой. Останавливаться на них мы не будем. 10. П р и м е р . О д н о м е р н ое унитарное пространство. Чтобы его построить, нужно задать положительно определенную эрмито- эрмитову форму ?"(ж) в одномерном линейном комплексном пространстве L\. В качестве L\ возьмем координатное пространство, которое можно представ- представлять себе как обычную плоскость комплексного переменного; его элементы ж, у, ... суть комплексные числа. Матрица искомой эрмитовой формы g со- содержит единственный элемент оц, который должен быть действительным числом (ац = aii). Согласно критерию Сильвестра an > 0. Пусть вы- выбрано an = а2, а > 0. Примем положительно определенную эрмитову форму g(x) = а2х~х в качестве метрической формы пространства L\. Тогда 11ж11 = а|ж|, так что элементы пространства L\ с данной нормой \\x\\ заполня- заполняют на комплексной плоскости окружность |ж| = ^||ж|| (рис. 123). Скалярное произведение в полученном унитарном пространстве выражается формулой (ж, у) = а2ху. B2)
ЭРМИТОВЫ ФОРМЫ. УНИТАРНОЕ ПРОСТРАНСТВО 455 Для того, чтобы выяснить его геометрический смысл, положим х = и + iv, у = ? + щ. Тогда B2) примет вид (ж, у) = а vrj) - % = а (г — г<т). B3) Здесь через т обозначено скалярное произведение радиус-векторов Ох и О г/, рассматриваемых как векторы евклидовой плоскости, через а — ориентиро- ориентированная площадь параллелограмма, построенного на этих векторах (рис. 124). Рис. 123 Рис. 124. Из формулы B3) видно, что (ж, у) = 0 тогда и только тогда, когда т = а = = 0, т. е. когда ж = 0 или у = 0. Итак, мы наглядно видим, что в одномер- одномерном унитарном пространстве не может быть двух ненулевых ортогональных векторов. Вместе с тем, это пространство естественно изображается в виде двумерной евклидовой плоскости, причем нормы его элементов пропорцио- пропорциональны, а при надлежащем выборе масштаба (при а = 1) р а в н ы длинам соответствующих им векторов евклидовой плоскости. 11. Докажем, что во всяком конечномерном унитарном пространстве су- существует ортонормированный базис, т. е. такой базис, все векторы которого попарно ортогональны и имеют единичные нормы. В самом деле, таковым является любой базис , в котором метрическая форма g(x) имеет нормаль- нормальный вид: д.(т\ — \\т\\2 — ri"Tf I . . . 4- тп~т™ — V^ \rj\2 B4") (СМ. B3) При ?j = 1, j = 1, . . . , п). В унитарном пространстве, как и в евклидовом, ортонормированный ба- базис определен не однозначно. В примере предыдущего пункта в качестве (единственного) вектора, составляющего ортонормированный базис, можно взять при а = 1 любое комплексное число с единичным модулем (ei = cos <p-\- + г sin ip). В любом ортонормированном базисе унитарного пространства скалярное произведение вследствие B4) выражается формулой (ж, у) = х1у1 -\ Ь жпу". B5) Пользуясь ортонормированными базисами, нетрудно проверить (анало- (аналогично тому, как в § 5 гл. VIII), что унитарные пространства одинаковой раз- размерности метрически изоморфны.
456 ПРИЛОЖЕНИЕ 2 12. Для того чтобы яснее представить себе геометрию унитарного про- пространства в n-мерном случае, воспользуемся сопоставлением n-мерного ком- комплексного пространства Сп и действительного пространства Еъп вдвое боль- большей размерности (см. § 11 гл. I). Пусть Сп ~ унитарное пространство, ei, ... . . . , еп — ортонормированный базис в нем. Произвольный вектор ж из Сп разложим по этому базису и у каждой координаты хк выделим действитель- действительную и мнимую части: х = и + iv . Мы можем понимать Сп как коорди- координатное пространство, записывая его элементы в виде х = {и + iv , и + iv , . . . , ип + ivn}. Наряду с базисом ei, ..., еп рассмотрим векторы /& = ге^, к = 1, ..., п. Тогда x = u1ei-\ \-ипеп + v1h -\ \-vnln. Теперь вектор х запишем так: х = {и\ v\ u\ v\ ..., ип, vn}, рассматривая его как элемент действительного координатного пространст- пространства Е2п- Именно такое сопоставление в несколько иных обозначениях встре- встречалось нам в § 11 гл. I. Согласно § 11 гл. I пространства Сп и Еъп изоморфны с точки зрения операций сложения и умножения на действительные множи- множители. Сейчас мы будем считать, что пространство Е^п евклидово, что базис ei, /i, в2, /2, -.., еп, 1п ортонормирован в нем, и сравним скалярные про- произведения в пространствах Сп и Ечп. Кроме вектора ж, возьмем еще один произвольный вектор у = ^2ykek G Сп, ук = $,к + irjk, и тоже рассмотрим его как элемент пространства Еъп'- Обозначим через (ж, у)е скалярное произведение в Е^п- Имеем: (ж, у)Е = и1^ + v1^1 + u2f + v2V2 + • • • + ипС + vnVn. B6) С другой стороны, скалярное произведение (ж, у)с тех же самых векторов ж, у, но рассматриваемых как элементы унитарного пространства Сп, согласно формуле B5) выразится следующим образом: с5 у)с = ^Хкук = ^2(uk + ivk)(?k - irjk) = Е/ ktk . к к\ \~^ ик vk [и t + v ri ) — г у .к к B7) Сопоставляя B6) и B7), мы видим, что (ж, у)е = 11е(ж, у)с- Отсюда ясно, что векторы, ортогональные в унитарном пространстве Сп, ортогональны и с точки зрения евклидова пространства Е^п. Обратное неверно: векторы, ортогональные в Еъп, могут быть не ортогональны в Сп. Так будет, если Re(x, у)с = 0, но 1т(ж, у)с ф 0. Важно заметить, что несмотря на отличие скалярных произведений (ж, у)с и (ж, у)е-, норма ||ж||с вектора ж в унитарном пространстве Сп сов- совпадает с его евклидовой нормой ||ж||#: Ikll^E^ + E^^INk- B8)
ЭРМИТОВЫ ФОРМЫ. УНИТАРНОЕ ПРОСТРАНСТВО 457 Итак, пространства Сп и Ечп изометричны, но скалярное произведение в унитарном пространстве Сп несет в себе большую информацию о сомно- сомножителях — за счет своей мнимой части. Можно ожидать поэтому, что гео- геометрические свойства унитарного пространства окажутся более хрупкими, чем в изометричном ему евклидовом пространстве, т. е. что группа сохраня- сохраняющих их линейных преобразований уже. В п. 16 мы увидим, что дело обстоит именно так. Между прочим, из формулы B8) следует, что в унитарном пространстве имеет место неравенство треугольника Цз + !/||с<||а:||с + |М|О) B9) поскольку в евклидовом пространстве B9) заведомо выполняется. Отметим еще, что четномерное евклидово пространство Ечп можно сле- следующим образом превратить в изометричное ему унитарное пространство Сп вдвое меньшей размерности. Выберем в Ечп какой-нибудь ортонормиро- ванный базис ei,..., en, en+i,..., е^п и, взяв половину векторов этого базиса, например, ei, ..., еп, определим для каждого из них операцию умножения на мнимую единицу, полагая %е\ = en+i, . . . , ien = е^п. Тогда, как легко видеть, для любого вектора х из Еъп будет определено его произведение на любое комплексное число, причем так, что Ечп превра- превратится в комплексное линейное пространство размерности п. Если мы усло- условимся векторы ei, ..., еп по-прежнему считать ортонормированными, то формулой B4) будет определена норма любого вектора, а значит, опреде- определится и скалярное произведение B5). В результате мы получим унитарное пространство Сп, рассмотренное выше. (Мы получим полное совпадение с обозначениями, введенными в начале этого пункта, полагая Ik = геи = еп+?;, & = 1, ..., п). Таким образом, унитарное пространство Сп с точностью до изоморфизма есть действительное евклидово пространство Е^п-, снабженное некоторыми дополнительными свойствами. 13. Переходим к изучению важнейших классов линейных преобразова- преобразований в унитарных пространствах. Пусть в унитарном пространстве L задано линейное преобразование А. Определение. Линейное преобразование А называется сопряжен- сопряженным преобразованию Л, если (Ах, z) = (ж, Az) для любых векторов ж, z пространства L. Существование и единственность сопряженного преобразования А мож- можно доказать аналогично случаю евклидова пространства (см. §1 гл. IX), предварительно установив существование и единственность взаимного ба- базиса (как в п. 6 гл. VIII). Можно поступить несколько иначе, ограничившись рассмотрением преобразований в ортонормированном базисе; тогда взаим- взаимный базис совпадает с заданным и рассуждения несколько упрощаются. Пусть А — матрица заданного преобразования у = Ах в каком-либо ортонормированном базисе. Тогда, согласно B5), скалярное произведение (у, z) можно записать в матричной форме: (у, z) =^*Ax, C0)
458 ПРИЛОЖЕНИЕ 2 где х и z — матрицы-столбцы (п х 1-матрицы). В том же базисе мы рас- рассмотрим преобразование В с матрицей А*, получаемой из матрицы А транс- транспонированием и заменой ее элементов комплексно сопряженными числами. Покажем, что В = А. Аналогично C0) вычисляем скалярное произведение: (х, Bz) = (Bz, х) = [х*Л*z]* = ([гМж]) = z*Ах = (у, z). Таким образом, в ортонормированием базисе матрица сопряженного преоб- преобразования задается формулой Из C1) следует, что преобразование А сопряжено преобразованию А. 14. Определение. Линейное преобразование А в унитарном про- пространстве называется нормальным, если АА = АА. C2) Замечание. В евклидовом пространстве понятие нормального пре- преобразования также вводится посредством формулы C2). Теорема 2 . Линейное преобразование А в п-мерном унитарном про- пространстве нормально тогда и только тогда, когда существует ортонор- мированный базис из собственных векторов преобразования А. Доказательство теоремы 2 см. ниже, в конце этого пункта. Предвари- Предварительно установим две леммы. Лемма 1 . Перестановочные линейные преобразования А и В (АВ = = В А) в п-мерном комплексном линейном пространстве L всегда имеют собственный вектор. Доказательство леммы 1 . Поскольку пространство L ком- комплексно, преобразование А имеет в нем собственный вектор х {Ах = Хх, х ф 9). Вследствие перестановочности А и В каждый из ненулевых векто- векторов вида ж, Вх, В2х, ..., Bkx, ... C3) является собственным вектором преобразования А. В самом деле, АВкх = ВкАх = ВкХх = ХВкх. C4) Пусть в последовательности C3) первые р векторов линейно независимы, а (р + 1)-й вектор Врх через них линейно выражается. Тогда линейная обо- оболочка L = L(x, Вх, . . . , Вр~гх) является инвариантным подпространством преобразования В. Преобразование В имеет в L некоторый собственный век- вектор у. Согласно C4) вектор у является собственным и для преобразования А. Лемма 2 . Если в унитарном пространстве L некоторое подпро- подпространство L' инвариантно относительно линейного преобразования А, то его ортогональное дополнение L" инвариантно относительно сопряэюенно- го преобразования А. Доказательство леммы 2. Пусть х ? L', у Е L". Тогда Ах Е GL'h (Ах, у) = 0. Но (Ах, у) = (х, Ау), и следовательно, вектор Ау орто- ортогонален вектору х. Ввиду произвольности вектора х из L' отсюда следует, что Ay E L".
ЭРМИТОВЫ ФОРМЫ. УНИТАРНОЕ ПРОСТРАНСТВО 459 Доказательство теоремы 2 . Пусть А и А перестановочны. Тогда по лемме 1 они имеют общий собственный вектор х\. Его линейная оболочка L\ = L(xi) инвариантна относительно А и А. Значит, по лемме 2 ортогональное дополнение L[ подпространства L± тоже инвариантно отно- сительно А и А. В нем по лемме 1 найдется общий собственный вектор Х2 преобразований А и А, очевидно ортогональный к х\. Далее рассматрива- рассматриваем линейную оболочку L^ = L(x±, xi) и ее ортогональное дополнение //2', в нем находим общий собственный вектор х% и т. д. Продолжая этот процесс, получим систему из п попарно ортогональных общих собственных векторов Ж1, ..., хп преобразований А и А. Нормировав эти векторы, получим иско- искомый базис. Примечание. Тот факт, что система из п попарно ортогональных ненулевых векторов образует в n-мерном унитарном пространстве базис, до- доказывается рассуждениями, проведенными выше в п. 1, §3 гл. VIII для дей- действительного случая. Пусть теперь дано, что преобразование А имеет ортонормированный ба- базис из собственных векторов. Тогда согласно п. 5 §8 гл. VII матрица преоб- преобразования А в этом базисе диагональна. Вследствие C1) вместе с ней диа- гональна и матрица преобразования А. Но диагональные матрицы всегда * перестановочны. Поэтому перестановочны и преобразования А и А. Теорема доказана. 15. Определение. Линейное преобразование А в унитарном про- пространстве называется самосопряженным или эрмитовым, если А = А. Непосредственно из определения следует, что самосопряженные преоб- преобразования являются частным случаем нормальных. Теорема 3. Нормальное преобразование А в п-мерном унитарном пространстве является самосопряженным тогда и только тогда, когда все его собственные значения действительны. Доказательство. Теорема 3 очевидна: достаточно записать пре- преобразование А в ортонормированном базисе из собственных векторов и ис- использовать формулу C1). Замечание 1 . Установленная здесь теорема показывает, что в 71- мерном унитарном пространстве самосопряженное преобразование действу- действует так же, как в евклидовом: оно представляет собой растяжение с действи- действительными коэффициентами по п взаимно ортогональным направлениям. Замечание 2. Из формулы C1) видно, что преобразование А яв- является самосопряженным тогда и только тогда, когда в произвольном орто- ортонормированном базисе его матрица эрмитова (А* = А). 16. Определение. Линейное невырожденное преобразование Л в унитарном пространстве называется унитарным, если А = А~г. Унитарные преобразования также являются частным случаем нормаль- нормальных, поскольку А и А~г заведомо перестановочны (АА~г = А~гА = Е). Совершенно аналогично рассуждениям, проведенным в пп. 2—4 § 7 гл. IX, устанавливается, что в n-мерном унитарном пространстве унитарными яв- являются те и только те линейные преобразования, которые сохраняют норму векторов и скалярное произведение. Отсюда сразу следует, что унитарные преобразования образуют группу. Ее называют унитарной группой (n-мерного пространства).
460 ПРИЛОЖЕНИЕ 2 В евклидовом пространстве изометрическое преобразование может не иметь ни одного собственного вектора. В унитарном пространстве дело об- обстоит иначе: вследствие теоремы 2 всякое унитарное преобразование имеет ортонормированный базис из собственных векторов. Теорема 4. Линейное преобразование А в п -мерном унитарном про- пространстве является унитарным тогда и только тогда, когда существует ортонормированный базис из его собственных векторов, а все собственные значения по модулю равны единице. Доказательство. Существование ортонормированного базиса е±, ..., еп из собственных векторов преобразования А следует из теоремы 2. Если все собственные значения Xj по модулю равны единице (Aej = Xjej, \Xj\ = 1), то для произвольного вектора х = ^ х3ej имеем: Ах = ^ х3 Aej = = ^2 х3 Xjej, \\Ax\\2 = ^2 \х3Xj\2 = ^2 \х3 \2 = ||ж||2. Таким образом, преобра- преобразование А изометрично и потому унитарно. Если дано, что преобразование А унитарно, то АА = Е. Поэтому для произвольного собственного вектора у имеем (у, у) = (АА, у) = (Ау, Ау) = (Ху, Ху) = XJ(y, у). Следовательно, АЛ = |Л|2 = 1. Теорема 4 доказана. 17. Определение. Невырожденная (комплексная) nxn-матрица U называется унитарной, если она удовлетворяет условию и~1 = и*. C5) Условие C5) можно переписать так: UU* = Е или U*U = Е. Отсюда видно, что унитарность матрицы U означает ортонормированность системы ее строк и системы ее столбцов в смысле скалярного произведения B5). Из C5) следует, что унитарные матрицы составляют группу. В самом деле, 1) если матрица U унитарна, то U~x тоже унитарна: (и-1)'1 = U = W)* = (tT31)*; 2) если матрицы U\ и U2 унитарны, то U1U2 унитарна: (C/iC/a) = С/а C/f1 =Th*W = (C/1C/2)*. Сопоставляя C1) и C5), мы видим, что все унитарные матрицы и только они задают унитарные преобразования в ортонормированных базисах. От- Отсюда тоже следует, что унитарные п х n-матрицы образуют группу, причем группу, изоморфную унитарной группе n-мерного пространства. 18. Теорема 5. Ортогональная группа п-мерного евклидова про- пространства изоморфна некоторой подгруппе унитарной группы п-мерного унитарного пространства. Эта последняя в свою очередь изоморфна неко- некоторой подгруппе группы вращений Bп)-мерного евклидова пространства, совпадающей со всей группой вращений в единственном частном случае п = = 1. Доказательство. Первое утверждение теоремы сразу вытекает из того, что ортогональные матрицы являются частным случаем унитар- унитарных: матрица ортогональна тогда и только тогда, когда она унитарна и ве- вещественна. Отметим попутно, что при любом п ортогональная группа не исчерпывает всей унитарной группы, поскольку имеются унитарные, но не
ЭРМИТОВЫ ФОРМЫ. УНИТАРНОЕ ПРОСТРАНСТВО 461 ортогональные п х n-матрицы. Таковой является, например, любая диаго- диагональная матрица, у которой \cljj\ = 1 для всех j, но хотя бы одно из чисел djj не является вещественным. При п = 1 унитарная матрица U имеет единственный элемент аи, при- причем |ац| = 1, так как в этом случае матричное равенство UU = Е сводится к числовому равенству ацТгц = 1. Пространством здесь служит плоскость комплексного переменного со скалярным произведением (ж, у) = ху. В ка- качестве ортонормированного базиса можно взять на ней число е = 1. Преоб- Преобразование, задаваемое в этом базисе матрицей U = ||«и|| = || cos tp + i sin (р\\, есть не что иное, как поворот комплексной плоскости на угол (р. Поскольку угол здесь может быть любым, мы установили, что при п = 1 унитарная группа фактически совпадает с группой вращения двумерной евклидовой плоскости. Далее, считая п ^ 2, воспользуемся конструкцией п. 12. Эта конструк- конструкция позволяет одно и то же пространство рассматривать как унитарное Сп и как евклидово Ечп. Вместе с тем она позволяет каждое унитарное преоб- преобразование в Сп рассматривать как изометричное линейное преобразование в Е2п- Пусть U — некоторое унитарное преобразование в Сп. По теореме 4 для него найдется ортонормированный базис ei, ..., ёп из собственных векторов, а собственные значения имеют вид cos (pk + i sin <?>&, к = 1, ..., п. Положим 1к = iek, Lk = L(ek, Iк) ? E2n- Преобразование U, рассматриваемое в Е^п, действует в двумерной плоскости Lk как поворот на угол (рк, к = 1, ..., п, причем все плоскости Lk попарно ортогональны. Таким образом, преобра- преобразование U, рассматриваемое в Ein, принадлежит группе вращений этого пространства. Вместе с тем в этой группе вращений есть элементы, которые нельзя рассматривать как унитарные и даже как линейные преобразования в Сп- Таковым является, например, вращение В, переводящее векторы бази- базиса ei, /i, в2, h, • • •, en, ln в векторы ei, ег, —/i, /2, • • •, en, /n соответственно, т.е. поворачивающее плоскость L(/i, ei) на угол ^ и оставляющее на месте остальные векторы базиса ei, ..., /п. В самом деле, в комплексном простран- пространстве Сп из линейности преобразования А и условия Ае± = е± следовало бы Ah = A(iei) = zA(ei) = /1, но никак не Ah = еч. Теорема 5 доказана полностью. Примечание. Действие вращения В при п = 2 схематически пока- показано на рис. 125. 19. Пусть L — комплексное n-мерное пространство. Аналогично пп. 6-9 §6 гл. VIII, устанавливается следующее: 1) Если в L введена унитарная метрика, то совокупность всех ортонор- мированных в ней базисов образует класс базисов по унитарной группе. 2) Для каждого класса базисов по унитарной группе можно указать уни- унитарную метрику, в которой базисы этого класса будут ортонормированными. 3) Если унитарная метрика выбрана, то при переходе от одного ортонор- ортонормированного базиса к другому, тоже ортонормированному, преобразование координат задается унитарной матрицей. 20. Аналогично §§ 4-5 гл. IX можно доказать, что эрмитову форму мож- можно привести к каноническому виду A3) преобразованием переменных с уни- унитарной матрицей и что пару эрмитовых форм можно привести к канони- каноническому виду невырожденным преобразованием переменных, если хотя бы одна из них положительно определена.
462 ПРИЛОЖЕНИЕ 2 /2 = ie2 = Bl2i V////////////A f e2 = h = -h = Be2 Рис. 125. Замечание. Пусть А — матрица эрмитовой формы / в исходном базисе е. Для приведения формы к каноническому виду нам понадобится вспомогательное эрмитово преобразование с матрицей А = А* (в том же ба- базисе е). Пусть ё = Ре — ортонормированный базис из собственных векторов этого преобразования. В базисе ё матрица А рассматриваемого преобразова- преобразования диагональна и вещественна, причем А = QAQ~1 = QAP* согласно §2 гл. VII. При переходе от базиса е к базису ё матрица формы / преобразуется по формуле A2): А' = РАР*. Поскольку матрица Р унитарна, Р~х = Р*, имеем: Q = (P-1)'=~P, P = Q. C6) Учитывая сказанное выше, мы видим, что А' = PAP* = QAP = (QAP*) = (А) = А, C7) так что форма / имеет в базисе е канонический вид. Пример. Пусть эрмитова форма / в ортонормированном базисе ei, e2 задана формулой A4), т. е. Требуется привести ее к каноническому виду, оставаясь в классе ортонорми- рованных базисов. Для вспомогательного эрмитова преобразования с матри- матрицей Л~ Л ~ || 1 + Зг 0 || находим характеристический многочлен Det(A* — ХЕ) = Det(A-XE) = А2 — — 10, его корни Ai,2 = ±л/ТП и собственные векторы ё\ и ё2 с собственными значениями Ai и А2 соответственно: _ _ 1 - Зг 1 2л/5 л/2 ' . ( v 1 1 + Зг > C8)
ЭРМИТОВЫ ФОРМЫ. УНИТАРНОЕ ПРОСТРАНСТВО 463 Векторы C8) здесь уже пронормированы: ||ei|| = \\e2\\ = 1; они образуют искомый базис, в котором Учитывая C6), легко выписать преобразование координат: 1 1 + Зг 1 1 2 2л/5 у/2 2 1 1 , 1 -Зг /2 л/2 2л/5 21. В заключение отметим, что аналогично §11 гл. IX доказывается сформулированная ниже важная теорема. Теорема 6 . В п -мерном унитарном пространстве для любого невы- невырожденного линейного преобразования А существуют самосопряженное пре- преобразование Н и унитарное преобразование U такие, что А = UН.
СПИСОК ЛИТЕРАТУРЫ 1. Александров П. С. Лекции по аналитической геометрии, пополненные необходимыми сведениями из алгебры с приложением собрания задач, снаб- снабженных решениями, составленного А. С. Пархоменко.— М.: Наука, 1968. 2. Бурбаки Н. Алгебра (Алгебраические структуры, линейная и полили- полилинейная алгебра). — М: Физматгиз, 1962. 3. Бурбаки Н. Алгебра (Модули, кольца, формы).— М.: Наука, 1966. 4. Гантмахер Ф. Р. Теория матриц.— М.: Наука, 1967. 5. Гельфанд И. М. Лекции по линейной алгебре.— М.: Наука, 1966. 6. Ефимов Н. В. Высшая геометрия.— М: Физматгиз, 1961; М.: ФИЗМАТ- ЛИТ, ЛБЗ, 2003. 7. Курош А. Г. Курс высшей алгебры.— М.: Наука, 1968. 8. Леш С. Алгебра.— М.: Мир, 1968. 9. Мальцев А. И. Основы линейной алгебры.— М.: Наука, 1970. 10. Проскуряков И. В. Сборник задач по линейной алгебре.— М.: Наука, 1967. 11. Рашевский П. К. Риманова геометрия и тензорный анализ.— М: Гос- техиздат, 1953. 12. Розенфельд Б. А. Многомерные пространства.— М.: Наука, 1966. 13. Спивак М. Математический анализ на многообразиях.— М.: Мир, 1968. 14. Тышкевич Р. //., Феденко А. С. Линейная алгебра и аналитическая геометрия.— Минск: Выш. шк., 1968. 15. Фаддеев Д. К., Соминский И. С. Сборник задач по высшей алгебре. Изд. 9-ое.- М.: Наука, 1968. 16. Фаддеев Д. К. и Фаддеева В. Н. Вычислительные методы линейной алгебры. — М.: Физматгиз, 1963. 17. Шилов Г. Е. Введение в теорию линейных пространств.— М.: Гостех- издат, 1956. 18. Шилов Г. Е. Математический анализ. Конечномерные линейные пространства.— М.: Наука, 1969. 19. Шрейер О., Шпернер Е. Введение в линейную алгебру в геометриче- геометрическом изложении.— ОНТИ, 1934. 20. Юдин Д. Б., Голъштейн Е. Г. Линейное программирование (Теория, методы и приложения).— М.: Наука, 1969. 21. Manning H. P. Geometry of four dimensions.— New York, 1955. 22. Reichardt H. Vorlesungen iiber Vektor- und Tensorrechnung.— Berlin, 1968. 23. Sommervillie D. M. Y An introduction to the geometry, of N dimensions.— New York, 1958.