Текст
                    И. Р. ШАФАРЕВИЧ, А. О. РЕМИЗОВ
ЛИНЕЙНАЯ
АЛГЕБРА
И
ГЕОМЕТРИЯ
Рекомендовано Научно-методическим советом по математике
Министерства образования и науки Российской Федерации
в качестве учебного пособия для студентов высших учебных
заведений, обучающихся по направлению
0101- "Математика"
и 0107 - "Физика"
МОСКВА
ФИЗМАТЛИТ
2009


УДК 512.64 ББК 22.143 ШЗО Шафаревич И. Р., Ремизов А. О. Линейная алгебра и геометрия. — М.: ФИЗМАТЛИТ, 2009. - 512 с. - ISBN 978-5-9221-1139-3. Книга представляет собой курс линейной алгебры и геометрии, основанный на лекциях, которые на протяжении многих лет читались одним из авторов на механико-математическом факультете Московского государственного университета. Изложение предмета начинается с теории линейных уравнений и матриц и далее ведется на языке векторных пространств. В книге также изложена теория аффинных и проективных пространств. Кроме того, включены некоторые темы, естественно примыкающие к линейной алгебре, но обычно в таких курсах не рассматриваемые: внешние алгебры, геометрия Лобачевского, топологические свойства проективных пространств, теория квадрик в многомерных аффинных и проективных пространствах, разложения конечных абелевых групп и конеч- нопорожденных периодических модулей (аналогичные теореме о жордановой нормальной форме линейного преобразования). Изложение сопровождается примерами, иллюстрирующими применение изучаемой теории. Рассматриваются ее связи с другими разделами математики, включая теорию дифференциальных уравнений, дифференциальную геометрию и механику. Книга рассчитана на студентов и преподавателей математических и физико-математических специальностей. Рекомендовано Научно-методическим советом по математике Министерства образования и науки Российской Федерации в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению 0101 — «Математика» и 0107 — «Физика». © ФИЗМАТЛИТ, 2009 ISBN 978-5-9221-1139-3 © И. Р. Шафаревич, А. О. Ремизов, 2009
ОГЛАВЛЕНИЕ Предисловие 6 Предварительные сведения 7 § 1. Множества и отображения 7 § 2. Некоторые топологические понятия 13 Глава 1. Линейные уравнения 19 § 1.1. Линейные уравнения и функции 19 § 1.2. Метод Гаусса 24 § 1.3*. Примеры 32 Глава 2. Матрицы и определители 40 § 2.1. Определители второго и третьего порядков 40 § 2.2. Определители произвольного порядка 45 § 2.3. Характеристика определителя его свойствами 51 § 2.4. Разложение определителя по столбцу 53 § 2.5. Правило Крамера 56 § 2.6. Перестановки, симметрические и антисимметрические функции ... 58 § 2.7. Полное развертывание определителя 64 § 2.8. Ранг матрицы 67 § 2.9. Операции над матрицами 73 § 2.10. Обратная матрица 83 Глава 3. Векторные пространства 90 § 3.1. Определение векторного пространства 90 § 3.2. Размерность и базис 97 §3.3. Линейные преобразования векторных пространств 111 § 3.4. Замена координат 116 § 3.5. Изоморфизм векторных пространств 120 § 3.6. Ранг линейного преобразования 126 § 3.7. Сопряженное пространство 129 § 3.8. Формы и многочлены от векторов 136 Глава 4. Линейные преобразования пространства в себя 141 § 4.1. Собственные векторы и инвариантные подпространства 141 § 4.2. Комплексные и вещественные пространства 149 § 4.3. Комплексификация 156 § 4.4. Ориентация вещественного пространства 161 Глава 5. Жорданова нормальная форма 168 § 5.1. Корневые векторы и циклические подпространства 168 § 5.2. Жорданова нормальная форма (разложение) 172 § 5.3. Жорданова нормальная форма (единственность) 176 § 5.4. Вещественные векторные пространства 179 § 5.5*. Приложения 182
4 Оглавление Глава 6. Квадратичные и билинейные формы 196 § 6.1. Основные определения 196 § 6.2. Приведение к каноническому виду 202 § 6.3. Комплексные, вещественные и эрмитовы формы 208 Глава 7. Евклидовы пространства 217 § 7.1. Определение евклидова пространства 217 § 7.2. Ортогональные преобразования 226 § 7.3*. Ориентация евклидова пространства 232 § 7.4*. Примеры 236 § 7.5. Симметрические преобразования 247 § 7.6*. Приложения к механике и геометрии 257 § 7.7. Псевдоевклидовы пространства 268 § 7.8. Лоренцевы преобразования 278 Глава 8. Аффинные пространства 290 § 8.1. Определение аффинного пространства 290 § 8.2. Аффинные подпространства 295 § 8.3. Аффинные преобразования 301 § 8.4. Евклидовы аффинные пространства и движения 309 Глава 9. Проективные пространства 318 § 9.1. Определение проективного пространства 318 § 9.2. Проективные преобразования 327 § 9.3. Двойное отношение 333 § 9.4*. Топологические свойства проективных пространств 337 Глава 10. Внешнее произведение и внешняя алгебра 346 § 10.1. Плюккеровы координаты подпространства 346 § 10.2. Соотношения Плюккера и грассманианы 350 § 10.3. Внешнее произведение векторов 354 § 10.4*. Внешняя алгебра 363 § 10.5*. Приложения 370 Глава 11. Квадрики 379 § 11.1. Квадрики в проективном пространстве 379 § 11.2. Квадрики в комплексном проективном пространстве 388 § 11.3. Изотропные подпространства 391 § 11.4. Квадрики в вещественном проективном пространстве 402 § 11.5. Квадрики в вещественном аффинном пространстве 407 § 11.6. Квадрики в аффинном евклидовом пространстве 418 § 11.7*. Квадрики на вещественной плоскости 421 Глава 12. Геометрия Лобачевского 426 § 12.1*. Пространство Лобачевского 427 § 12.2*. Аксиомы геометрии на плоскости 436 § 12.3*. Некоторые формулы геометрии Лобачевского 447 Глава 13. Группы, кольца, модули 458 § 13.1. Группы и гомоморфизмы 458 § 13.2. Разложение конечных абелевых групп 466 § 13.3. Единственность разложения 471 § 13.4*. Конечнопорожденные периодические модули над евклидовым кольцом . .473
Оглавление 5 Глава 14. Элементы теории представлений 485 § 14.1. Основные понятия теории представлений 485 § 14.2. Представления конечных групп 491 § 14.3. Неприводимые представления 496 § 14.4. Представления коммутативных групп 498 Историческая справка 502 Список литературы 504 Предметный указатель 506
Предисловие Настоящая книга следует содержанию лекций по линейной алгебре и геометрии многомерных пространств, которые читались в 1950-70-х годах И. Р. Шафаревичем на механико-математическом факультете Московского университета. Некоторая часть конспекта лекций до сих пор хранится в библиотеке этого факультета, и эти записи были положены в основу книги. Кроме того, мы включили некоторые вопросы, разбиравшиеся на студенческих семинарах, которые проводились в то время. Обработка всего материала является результатом совместного труда обоих авторов. В этой книге мы используем без доказательства некоторые результаты из алгебры многочленов, которые обычно доказываются в стандартном курсе алгебры (хронологически их изложение помещается приблизительно между 2-ой и 5-ой главами книги). Этих алгебраических фактов, которыми мы пользуемся без доказательства, совсем немного: возможность деления одного многочлена на другой с остатком; теорема о том, что многочлен с комплексными коэффициентами имеет комплексный корень; что каждый многочлен с вещественными коэффициентами может быть разложен в произведение неприводимых сомножителей первой и второй степени; теорема о том, что число корней не равного тождественно нулю многочлена не превосходит его степени. Наглядную основу данного курса давал предшествовавший ему вводный курс аналитической геометрии, на который мы будем эпизодически ссылаться. Кроме того, в книгу включены некоторые примеры и сюжеты, не являющиеся неотъемлемой частью курса линейной алгебры и геометрии и носящие в основном иллюстративный характер. Соответствующие параграфы при желании могут быть опущены, они отмечены звездочкой. Для удобства читателя в книге принята следующая система обозначений. Для векторных пространств будет использоваться рубленый шрифт: L, M, N,..., для векторов — жирный: x,y,z,... Линейные преобразования мы будем обозначать рукописными буквами: д/,&,&,..., а соответствующие им матрицы — обычными: А,В,С,... Авторы очень благодарны М. И. Зеликину, Д. О. Орлову и Я. В. Татарино- ву, прочитавшим части предварительного варианта этой книги и сделавшим ряд полезных замечаний и предложений. Авторы глубоко благодарны также редактору книги С. Кулешову, очень внимательно прочитавшему рукопись. По его советам был сделан ряд важных изменений и дополнений. В частности, некоторые разделы книги не появились бы в теперешнем виде без его участия. Авторы
ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ В этой книге мы будем использовать некоторые теоретико-множественные понятия. Они присутствуют в большинстве математических курсов, так что, возможно, некоторым читателям уже знакомы, но для удобства мы их сейчас напомним. § 1. Множества и отображения Под множеством мы будем понимать совокупность совершенно произвольных объектов, выделенных четко сформулированными свойствами (например, множество всех чисел, множество положительных чисел, множество решений некоторого уравнения, множество точек, составляющих некоторую геометрическую фигуру, множество волков или деревьев в лесу и т.д.). Если множество содержит конечное число элементов, то оно называется конечным, в противном случае оно называется бесконечным. Мы будем пользоваться общепринятыми теперь обозначениями, обозначая множество натуральных чисел через N, множество целых чисел через Z, множество рациональных чисел через Q, множество вещественных (или, что то же самое, действительных) чисел через R, множество комплексных чисел через С. Множество натуральных чисел, не превосходящих данного числа п, т. е. состоящее из 1,2, ...,п, мы обозначим через Nn. Объекты, составляющие множество, называются его элементами или точками. То, что х является элементом множества М, обозначается как х £ М. Если же нужно указать, что х не является элементом множества М, то пишут х £ М. Множество S, содержащееся в множестве М (т. е. каждый элемент множества S является элементом множества М) называется его подмножеством. Это записывается как S С М. Например, NncN для любого п, а также NcZ, ZcQ, Qcl и Re С. Подмножество, состоящее из элементов ха е М (где индекс а пробегает конечное или бесконечное множество), обозначается {ха}. К числу подмножеств множества М удобно причислять и подмножество, не содержащее ни одного элемента. Оно называется пустым и обозначается символом 0. Пусть М и N — два произвольных множества. Совокупность тех элементов, которые содержатся и в М, и в N, называется пересечением М и N и обозначается как М П N. Если М П N = 0, то говорят, что множества М и N непересекающиеся. Совокупность тех элементов, которые содержатся хотя бы в одном из множеств М и N, называется объединением М и N и обозначается через М U N. Наконец, совокупность тех элементов, которые содержатся в множестве М, но не содержатся в iV, называется дополнением N в М и обозначается символом M\N.
8 Предварительные сведения Говорят, что на множестве М задано отношение эквивалентности, если для каждой пары элементов х и у этого множества определено одно из двух: либо элементы х и у эквивалентны (что обозначается как х ~ у), либо они не эквивалентны (х </> у), при этом должны быть выполнены следующие условия: 1) каждый элемент эквивалентен сам себе: х ~ х (рефлексивность). 2) если х ~ у, то у ~ # (симметричность). 3) если х ~ у и у ~ z, то х ~ z (транзитивность). Если на множестве М задано отношение эквивалентности, то множество М представимо в виде объединения (конечного или бесконечного) подмножеств Ма, называемых классами эквивалентности и обладающих следующими свойствами: а) Каждый элемент х Е М содержится в некотором подмножестве Ма, причем только в одном. Другими словами, разные подмножества Ма не пересекаются и их объединение (конечное или бесконечное) дает все множество М. б) Элементы х и у эквивалентны (х ~ у), если и только если они принадлежат одному и тому же подмножеству Ма. Очевидно, что и наоборот, если задано представление множества М в виде объединения подмножеств Ма, удовлетворяющее свойству а), то, положив х ~ у, тогда и только тогда, когда эти элементы принадлежат одному и тому же подмножеству Ма, мы получим некоторое отношение эквивалентности на М. Из приведенных рассуждений видно, что данное определение эквивалентности совершенно абстрактно — в нем не указано, каким именно образом устанавливается, эквивалентны ли друг другу элементы х и у, или нет. Нужно лишь, чтобы были выполнены общие свойства 1-3. Поэтому на одном и том же множестве М могут быть заданы совершенно различные отношения эквивалентности. Приведем несколько примеров. Пусть М — множество натуральных чисел N. Тогда на нем можно задать отношение эквивалентности, определив х ~ у, если они имеют одинаковый остаток от деления на некоторое число п Е N. Очевидно, что свойства 1-3 при этом выполняются, и N представимо в виде объединения п классов (при п — 1 все натуральные числа эквивалентны друг другу, при п — 2 есть два класса — четных и нечетных чисел и т.д.). Пусть М — множество точек на плоскости или в пространстве. Можно задать на нем отношение эквивалентности, положив х ~ у, если точки х и у находятся на одинаковом расстоянии от некоторой фиксированной точки О, тогда классы эквивалентности — это все окружности (в случае плоскости) или сферы (в случае пространства) с центром в точке О. Если же, например, считать эквивалентными точки, расстояние между которыми одинаково, то отношение эквивалентности не получится, так как свойство транзитивности при этом не выполнено. В нашем курсе мы не раз встретимся с различными отношениями эквивалентности (например, на множестве квадратных матриц). Отображением множества М в множество N называется правило, по которому каждому элементу множества М сопоставляется определенный эле-
1. Множества и отображения 9 мент из N. Например, если М — множество всех медведей, живущих сейчас на земном шаре, и N — множество положительных чисел, то сопоставление каждому медведю его веса (измеренного, например, в килограммах) является отображением М в N. Отображение множества М в N мы будем называть также функцией на М со значениями в N. Чаще всего сам способ сопоставления обозначается буквами /,#,... или F, G,.... Отображение множества М в N обозначают стрелкой и записывают в виде f:M—>N. При этом элемент у Е N, сопоставляемый элементу х Е М, называется значением функции / в точке х. Это записывается с помощью стрелки /: х ь-> у, или равенства у = /(х). Далее мы часто будем изображать отображения множеств в виде диаграмм: М —^—► N. В случае, если множества М и N совпадают, /: М —> М называется отображением М в себя. Отображение множества М в себя, которое сопоставляет каждому элементу х Е М этот же элемент, называется тождественным или единичным. Оно обозначается буквой е или, если важно подчеркнуть, о каком именно множестве М идет речь, через ем- Таким образом, в наших обозначениях ем'- М ^ М и ем(х) = х для любого х Е М. Отображение f:M—>N называется вложением, если разным элементам множества М сопоставляются разные элементы множества N, т. е. из равенства f(x\) = f(x2) следует, что х\ = #2- Если S С N — некоторое подмножество и /: М —> iV — отображение, то совокупность всех элементов ж Е М, для которых /(х) Е 5, называется прообразом подмножества S и обозначается f~l(S). В частности, если 5 состоит из одного элемента у е JV, то f~](S) называется прообразом элемента у и обозначается символом f~l{y). Используя этот термин, мы можем сказать, что отображение f:M^N является вложением в том и только том случае, когда для любого элемента y£N его прообраз f~l(y) состоит не более чем из одного элемента. Слова «не более чем» означают, что для некоторых элементов у е N прообраз может быть пустым. Например, пусть М = N = К и отображение / сопоставляет каждому числу х значение f(x) = aictgx. Тогда / является вложением, причем прообраз f~l(y) состоит из одного элемента, если \у\ < 7г/2, и является пустым множеством, если \у\ ^ 7г/2. Если S С М — некоторое подмножество и f: M —> N — отображение, то совокупность тех элементов у Е N, для которых у = f(x) при некотором х Е S, называется образом подмножества S и обозначается как f(S). В частности, подмножество S может совпадать со всем М, тогда /(М) называется образом отображения /. Заметим, что образ / не обязан совпадать со всем множеством N. Например, если M = N = Rnf — операция возведения в квадрат, то /(М) является множеством всех неотрицательных чисел и не совпадает со всем множеством Ш. Если S С М — некоторое подмножество и /: М —> N — отображение, то, будучи применено только к элементам множества S, оно определяет отображение /: S —» N, называемое сужением или ограничением отображения / на S. Другими словами, ограничение заключается в том, что для каждого элемента х Е S мы определяем f(x) так же, как и прежде, а для
10 Предварительные сведения всех х £ S отображение не рассматриваем. Напротив, если изначально мы имели отображение /: 5 —> iV, заданное только на подмножестве 5, но потом каким-то образом определили значения f(x) для всех остальных элементов х Е М \ S, то в результате мы получим отображение /: М —► N, которое называется продолжением f на М. Отображение f: M -* N называется взаимно-однозначным, если оно является вложением и образ /(М) совпадает со всем множеством iV, т. е. /(М) = iV. Это равносильно тому, что для каждого элемента у £ N существует, причем ровно один, элемент х Е М, для которого у = /(ж). В этом случае можно определить отображение множества N в М, которое сопоставляет каждому элементу у Е N тот единственный элемент х Е М, для которого f(x) = у. Такое отображение называется обратным к / и обозначается Пусть теперь заданы множества M,N,L и их отображения /: М —> 7V и g: N -* L, см. диаграмму: М —^—* N —9—> L. W Тогда последовательное выполнение /и j определяет некоторое отображение М в L по очевидному правилу — первое отображение f:M^>N ставит в соответствие каждому элементу х Е М элемент у Е N, а второе отображение д: N —> L ставит в соответствие этому элементу у некоторый элемент z E L. Полученное таким образом отображение М в L называется произведением отображений /иди обозначается д • /, или короче, gf. Согласно сделанным обозначениям, оно определяется формулой (<?•/)(*) = <?№)) (2) для любого х Е М. Заметим, что в формуле (2) буквы /ид, обозначающие отображения, стоят в порядке, противоположном тому, который был в диаграмме (1). Как мы позже убедимся, такой порядок записи имеет ряд преимуществ. В качестве примера произведения отображений приведем очевидные равенства едг • / = /, / • ем = /, справедливые для любого отображения /: М —► N, а также равенства / * f~l =ejv, . f~l • f = eM, справедливые для любого взаимно-однозначного отображения /: М —± N. Произведение отображений обладает важным свойством. Пусть кроме отображений, изображенных на диаграмме (1), имеется еще отображение h: L—> К, где К — произвольное множество. Тогда выполнено соотношение h-(g-f) = (h-g)-f. (3) Проверка сразу следует из определений. Прежде всего, очевидно, что в обеих частях равенства (3) стоят отображения множества М в К. Следовательно, нам нужно доказать, что, будучи примененными к любому элементу х Е М,
/. Множества и отображения 11 они дают один и тот же элемент множества К. Согласно определению (2), для левой части равенства (3) мы имеем h ■ {д ■ /)(*) = h((g ■ /)(*)), (д ■ f)(x) = </(/(*)). Подставляя второе равенство в первое, окончательно получаем h-(g-f)(x) = = h(g(f(x))). Аналогичное рассуждение показывает, что для правой части соотношения (3) имеет место точно такое же выражение. Свойство, выраженное формулой (3), называется ассоциативностью. Ассоциативность играет важную роль как в нашем курсе, так и в других разделах математики, поэтому сейчас мы остановимся на ней подробнее. При этом для общности мы будем рассматривать множество М произвольных объектов (ими могут быть числа, матрицы, отображения и т.д.), для которых определена операция произведения, сопоставляющая двум элементам а Е М и Ъ Е М некоторый элемент ab Е М, называемый их произведением, и обладающая свойством ассоциативности: (ab)c = a(bc). (4) Смысл условия (4) заключается в том, что без него мы можем вычислить произведение элементов ai,...,am при га > 2, только если указана расстановка скобок, позволяющая каждый раз перемножать два соседних элемента. Например, при га = 3 мы имеем два варианта расстановки скобок: (а\а2)аз и a\(a2as)j при га = 4 — пять вариантов: ((aia2)a3)a4, (ai(a2a3))a4, (а^Хазец), ^1(^203)04), al(a2(«3«4)) и т. д. Оказывается, если для случая трех сомножителей (га = 3) произведение не зависит от способа расстановки скобок (т.е. выполнено свойство ассоциативности), то оно не будет зависеть от способа расстановки скобок и при любом числе сомножителей. Это утверждение легко доказывается индукцией по га. Действительно, пусть оно верно для всех произведений га и меньше элементов. Рассмотрим произведение га + 1 элементов а\,... , am,am+i при всех возможных способах расстановки скобок в нем. Как легко видеть, при этом возможны два альтернативных случая: либо между элементами аш и am+i нет скобки, либо она есть. Так как, по предположению индукции, утверждение верно для ai,...,am, то в первом случае мы получим произведение {а\ •••am_i)(amam+i), а во втором— (а\ •••am)am+i = ((ai • • •am_i)am)am+i. Введя обозначения: а = а\ • • • am_i, Ь = ат и с = am+i, мы получим произведения а{Ъс) и (ab)c, равенство которых следует из свойства (4). В частном случае, когда а\ = • • • = ат = а, произведение а\ • • • ат обозначается ат и называется т-ой степенью элемента а. С произведением отображений связано и другое важное понятие. Пусть R — некоторое фиксированное множество. Обозначим через #(М, R) совокупность всех отображений М —> R и, аналогично, через $(N, R) — совокупность всех отображений N —> R. Тогда с каждым отображением f:M-±N связано определенное отображение /*: $(N,R) —> $(M,R), которое называется сопряженным к / и задается следующим образом. Каж-
12 Предварительные сведения дому отображению (р е $(N, R) оно ставит в соответствие отображение f*(<p) € $(M,R) по формуле /*(*>) = ¥>•/• (5) Формула (5) означает, что для любого элемента х е М выполнено равенство f*(<p)(x) = <р • f(x), что можно выразить также в виде следующей диаграммы: М Пя>) Мы встречаемся здесь с важным общематематическим фактом: функции отображаются в противоположную сторону по сравнению с элементами множеств, на которых они заданы. Это явление проявится и в нашей книге, и позже, в других курсах по отношению к более сложным объектам (например, дифференциальным формам). Сопряженное отображение /* обладает следующим важным свойством: если мы имеем отображения множеств, изображенные на диаграмме (1), то (<?•/)* = /*•<?*• (6) Действительно, мы имеем сопряженные отображения: $(L,R) -^—> $(N,R) -£— $(M,R). По определению, для g • /: М —► L сопряженное отображение (д • /)* является отображением $(L,R) в $(M,R). Как видно из (2), /* • д* также является отображением тех же множеств. Нам остается доказать, что (д • /)* и f*-g* переводят каждый элемент ф е #(L, R) в один и тот же элемент множества j(M, R). Согласно определению (5), мы имеем (<?-/)*(V0 = V> •(<?•/)• Аналогично, с учетом (2), получаем соотношение Г ■ д*(Ф) = Пд*Ш = ПФ •g) = W-9)-f- Таким образом, для доказательства равенства (6) достаточно проверить свойство ассоциативности: ф • (д • /) = (ф • д) • /. До сих пор мы рассматривали отображения (функции) от одного аргумента. Определение функций от нескольких аргументов сводится к этому понятию с помощью операции произведения множеств. Пусть Mi,...,Mn — произвольные множества. Рассмотрим упорядоченные наборы (х\,... ,хп), где xi — произвольный элемент множества Щ. Слово «упорядоченные» означает, что в наборах учитывается порядок следования элементов Х{. Например, в случае п = 2 и М\ = Мъ пары (х\,Х2) и (х2,х\) считаются разными, если х\ ^ х<±. Множество, состоящее из всех упорядо-
2. Некоторые топологические понятия 13 ченных наборов (х\,... ,хп), называется произведением множеств М\,..., Мп и обозначается М\ х • • • х Мп. В частном случае, когда М\ = • • • = Мп = М, произведение Mi х • • • х Мп обозначается через Мп и называется п-ой степенью множества М. Теперь мы можем определить функцию от любого числа аргументов, каждый из которых принимает значения из «своего» множества. Пусть М\,..., Мп — произвольные множества, положим М = М\ х • • • х Мп. По определению, отображение /: М —> N ставит в соответствие каждому элементу х G М некоторый элемент у е N, т. е. ставит в соответствие п элементам х\ е М\,... ,хп Е Мп, взятым в определенном порядке, элемент у = f(x\,... ,хп) множества N. Это и есть функция от п аргументов xi, каждый из которых принимает значения из «своего» множества М{. § 2. Некоторые топологические понятия До сих пор мы говорили о множествах произвольной природы, не предполагая для них существование никаких дополнительных свойств. Обычно этого слишком мало. Например, предположим, что нам нужно сравнить две геометрические фигуры и определить, насколько они «похожи» или «не похожи» друг на друга. Представим себе эти фигуры как множества, элементами которых являются точки плоскости или пространства. Если пытаться ограничить себя лишь введенными выше понятиями, то естественно считать «похожими» такие множества, между которыми существует взаимно-однозначное отображение. Однако в конце XIX в. Кантор показал, что существует взаимно однозначное соответствие между точками отрезка и квадрата1). Тогда же Дедекинд предположил, что наше интуитивное представление о «похожести» фигур связано с возможностью установить между ними непрерывное взаимно однозначное соответствие. Но для этого должно быть определено, что значит, что отображение непрерывно. Область математики, в которой определяется непрерывность отображений абстрактных множеств и все объекты рассматриваются с точностью до непрерывных взаимно однозначных соответствий, называется топологией. Используя слова Германа Вейля, можно сказать, что «горный хребет топологии будет маячить на горизонте» этой книги. Точнее говоря, мы будем только эпизодически пользоваться некоторыми топологическими понятиями, причем лишь самыми простыми. Мы их сейчас сформулируем, но апеллировать к ним будем редко, только для того, чтобы указать на связь рассматриваемых нами объектов с другими разделами математики, с которыми читатель может более подробно познакомиться в соответствующих курсах или учебниках. Такие места при желании можно пропустить или лишь просмотреть — они не будут использоваться в остальной части книги. Для определения непрерывности отображения f:M—*N необходимо сначала определить понятие сходимости на множествах М и N. В некоторых случаях мы будем определять сходимость на множествах (например, в про- 1) Этот результат настолько поразил его, что, как Кантор пишет в одном письме, он долго сам себе не верил.
14 Предварительные сведения странствах векторов, матриц или проективных пространствах), основываясь на понятии сходимости в R или С, которое предполагается известным читателю из курса математического анализа. В других случаях мы воспользуемся понятием метрики. Множество М называется метрическим пространством, если задана функция г: М2 —> R, ставящая в соответствие каждой паре точек х,у Е М число г(х,у) и обладающая следующими свойствами: 1) г (ж, у) > О при х ^у и г(х, х) = О для любых х,у Е М\ 2) г(х,у) = г(у,х) для любых х,у е М; 3) для любых трех точек ж, у, z E M справедливо неравенство r{x, г) < r(x, у) + г (у, z). (7) Такая функция г (ж, у) называется метрикой или расстоянием в М, а перечисленные в его определении свойства являются аксиоматизацией привычных свойств расстояния, известных из курса элементарной или аналитической геометрии. Например, совокупность вещественных чисел R (а также любое его подмножество) является метрическим пространством, если для двух чисел х и у ввести расстояние г(х,у) = \х — у\ или г(х,у) = л/\х — у\. Для любого метрического пространства автоматически определено понятие сходимости его точек: последовательность точек Xk сходится к точке х (это обозначается Xk —> х) при к —> оо, если r(xk,x) —> 0 при к —> оо. Точка х при этом называется пределом последовательности ж/-. Пусть IcM- некоторое подмножество и М — метрическое пространство с метрикой г(х, у), т. е. отображением г : М2 —> R, которое удовлетворяет трем перечисленным выше свойствам. Очевидно, что ограничение г(х,у) на подмножество X2 с М2 тоже удовлетворяет этим свойствам, и следовательно, является метрикой на X. Говорят, что X является метрическим пространством с метрикой, индуцированной метрикой объемлющего пространства М, или что X с М — метрическое подпространство. Подмножество X называется замкнутым в М, если оно содержит предел любой сходящейся последовательности содержащихся в нем точек, и называется ограниченным, если существуют такая точка х Е X и число с > 0, что г(х, у) ^ с для всех у Е X. Пусть М и N — множества, в каждом из которых каким-то образом определено понятие сходимости (например, М и N — метрические пространства). Отображение f: М -* N называется непрерывным в точке х Е М, если для любой сходящейся последовательности Xk —> х точек множества М выполнено условие f(xk) —► /(ж). Если отображение f:M—*N непрерывно во всех точках х Е М, то говорят, что оно непрерывно на множестве М или просто непрерывно. Отображение f:M—>N называется гомеоморфизмом, если оно взаимно однозначно, непрерывно и обратное к нему отображение f~l: N —> М также непрерывно1). Множества М и N называются гомеоморфными или тополо- х) Подчеркнем, что последнее условие существенно: из непрерывности /, вообще говоря, не следует непрерывность /_1.
2. Некоторые топологические понятия 15 гически эквивалентными, если существует гомеоморфизм f:M—>N. Легко видеть, что свойство множеств быть гомеоморфными (при фиксированном определении сходимости) задает отношение эквивалентности. Если имеются два бесконечных множества М и N, в которых изначально никак не определено понятие метрики, то, задавая в них метрики разными способами, мы получим разные понятия гомеоморфизма /: М —» N, и может оказаться, что для одной метрики М и N гомеоморфны, а для другой — нет. Например, для любого множества рассмотрим так называемую дискретную метрику, определенную равенствами г(х, у) = 1 для любых х ф у и г(х9 х) — 0. Очевидно, что при таком определении все свойства метрики выполнены, но понятие гомеоморфизма f:M-+N становится бессодержательным: оно просто совпадает с понятием взаимно однозначного отображения. Действительно, в дискретной метрике последовательность Xk сходится к ж, если начиная с некоторого номера к все точки Xk совпадают с х. Как следует из данного выше определения непрерывного отображения, это значит, что любое отображение /: М —»JV является непрерывным. Например, согласно теореме Кантора, отрезок и квадрат с дискретной метрикой гомеоморфны, но если рассматривать их, например, как метрические подпространства плоскости, на которой расстояние задано так, как это делалось в курсе элементарной геометрии (скажем, с помощью системы декартовых координат), то они уже не будут гомеоморфны. Это показывает, что дискретная метрика не отражает некоторых важных свойств расстояния, с которыми мы привыкли иметь дело в курсе геометрии, в частности, того, что для любого, сколь угодно малого числа е > 0 найдутся две различные точки х и у, для которых расстояние г(х,у) = е. Таким образом, для того, чтобы правильно сформулировать наши интуитивные представления о «геометрическом сходстве» множеств М и N, нужно рассматривать их не с произвольными метриками, а именно с теми, которые удовлетворяют этим геометрическим представлениям. Мы не будем углубляться в этот вопрос, так как для наших целей он и не нужен — в этой книге мы всегда будем «сравнивать» множества М и N, по крайней мере одно из которых (для определенности, N) является геометрической фигурой на плоскости (или в пространстве), где расстояние определено привычным для нас образом, и метрика в N индуцирована метрикой объемлющей плоскости (или пространства). Нам остается только определить метрику (или сходимость) на множестве М таким образом, чтобы М и N были гомеоморфными. В этом и состоит смысл сравнения. Если фигуры М и N являются метрическими подпространствами плоскости или пространства с расстоянием, определенным известным из элементарной геометрии способом, то для них существует следующая весьма наглядная интерпретация понятия топологической эквивалентности. Представим себе, что фигуры М и N сделаны из резины. Тогда гомеоморфность означает, что мы можем деформировать М в N без разрывов и склеиваний точек. Это последнее условие («без разрывов и склеиваний») делает понятие гомеоморфизма существенно более сильным, чем просто взаимно однозначное отображение множеств.
16 Предварительные сведения Например, любая непрерывная замкнутая кривая без самопересечений (в частности, граница треугольника или квадрата) гомеоморфна окружности. С другой стороны, непрерывная замкнутая кривая с самопересечением (скажем, «восьмерка») не гомеоморфна окружности (рис. 1). Л-П-О-8'* Рис. 1. Гомеоморфные и негомеоморфные кривые (знак ~ означает, что фигуры гомеоморфны, а знак <fi — что нет) На рис. 2 представлены также некоторые примеры гомеоморфных и не гомеоморфных друг другу фигур в пространстве. пирамида сфера сфера с ручкой тор сфера с двумя (гиря) (баранка) ручками Рис. 2. Гомеоморфные и негомеоморфные поверхности В заключение введем еще несколько простейших топологических понятий, которые будут использоваться в нашем курсе. Путем в произвольном метрическом пространстве М называется непрерывное отображение f: I —> М, где / — некоторый отрезок вещественной прямой. Без ограничения общности можно считать, что / = [0,1]. При этом точки /(0) и /(1) называют началом и концом пути. Две точки х,у G М называются непрерывно деформируемыми друг в друга, если существует путь, имеющий х началом и у концом. Такой путь будем называть деформацией х в у, г сам факт непрерывной деформируемости х в у будем обозначать символом х ~ у. Свойство элементов пространства М быть непрерывно деформируемыми задает отношение эквивалентности на М, так как условия 1-3 в определении отношения эквивалентности для него выполняются. Действительно, свойство рефлексивности очевидно. Для доказательства симметричности нужно заметить, что если /(£) — деформация х в у, то /(1 — t) — деформация у в х. Проверим транзитивность. Пусть х ~ у и у ~ z, f(t) — деформация х в у и g(i) — деформация у в z. Тогда отображение h: I —> М, определенное равенством h{t) — f{2t) при te [0,1/2] и равенством h(t) — g(2t — 1) при t G [1/2,1], непрерывно, и для него выполнены равенства h(0) = /(0) = х, 7i(l) = g(l) = z. Таким образом, h(t) задает непрерывную деформацию точки х в z и, следовательно, х ~ z. Если любые два элемента метрического пространства М непрерывно деформируемы друг в друга (то есть отношение ~ задает единственный класс эквивалентности), то пространство М называется линейно связным.
2. Некоторые топологические понятия 17 Если же это не так, то для каждого элемента х е М рассмотрим класс эквивалентности Мх, состоящий из всех элементов у е М, таких, что х ~ у. По определению отношения эквивалентности, метрическое пространство Мх будет линейно связным. Оно называется линейно связной компонентой пространства М, содержащей точку х. Таким образом, отношение эквивалентности, задаваемое непрерывной деформируемостью, разбивает М на линейно связные компоненты. Во многих важных случаях их оказывается конечное число, и мы получаем представление М — М\ U • • • U М*., где Mi П Mj = 0 при i/j и все Мг линейно связны. Как легко видеть, такое представление единственно. Множества Mi называются линейно связными компонентами пространства М. Например, однополостный гиперболоид, сфера и конус являются линейно связными, а двуполостный гиперболоид — нет: он имеет две линейно связные компоненты. Множество вещественных чисел, заданных условием 0 < \х\ < 1, имеет две линейно связные компоненты (соответствующие положительным и отрицательным х), а множество комплексных чисел, заданное тем же условием, линейно связно. Свойства; сохраняющиеся при гомеоморфизмах, называются топологическими. Так, например, топологическим является свойство линейной связности, а также число линейно связных компонент. Пусть М и N — метрические пространства (метрики в них обозначим г и г' соответственно). Отображение /: М —> 7V называется изометрией, если оно взаимно однозначно и сохраняет расстояние между точками, т. е. r(xi,x2)=r'(f(xl),f(x2)) (8) для любых двух точек х\,х2 G М. Из соотношения (8) автоматически вытекает, что изометрия является вложением. Действительно, если бы существовали такие точки х\ ф х2 множества М, для которых было бы выполнено равенство f(xi) ~ f(x2), то в силу условия 1) в определении метрического пространства левая часть равенства (8) была бы отлична от нуля, а правая равна нулю. Таким образом, требование взаимной однозначности здесь сводится к условию, что образ /(М) совпадает со всем множеством N. Метрические пространства М и N называются изометричными или метрически эквивалентными, если существует изометрия /: М —► N. Легко видеть, что изометрия является гомеоморфизмом и обобщает понятие движения твердого тела в пространстве: в данном случае мы не можем произвольно деформировать множества М и N друг в друга, как если бы они были резиновыми («без разрывов и склеиваний»), но можем лишь обращаться с ними как с твердыми телами или сделанными из гибких, но не сжимаемых и не растягиваемых материалов (например, изометрией листа бумаги является его изгибание или сворачивание в трубку). На плоскости или в пространстве с расстоянием, определенным известным из элементарной геометрии способом, примерами изометрий являются параллельные переносы, повороты и преобразования симметрии. Таким образом, например, два треугольника на плоскости изометричны в том и только том случае, когда они «равны» (в том смысле, как это определяется в курсе
18 Предварительные сведения школьной геометрии — равенство сторон и углов), а два эллипса изометрич- ны, если и только если у них совпадают длины большой и малой полуосей. В заключение заметим, что в определении гомеоморфизма, линейной связности и линейно связных компонент понятие метрики играло лишь вспомогательную роль. Оно было использовано нами для того, чтобы определить понятие сходимости последовательностей точек, что позволяет говорить о непрерывности отображений и, таким образом, вводить опирающиеся на нее понятия. Именно сходимость и является основным топологическим понятием. Она вполне может определяться разными метриками, а также может быть определена и другим способом, вообще без использования метрики, как это обычно и делается в топологии.
Глава 1 ЛИНЕЙНЫЕ УРАВНЕНИЯ § 1.1. Линейные уравнения и функции В этой главе мы будем заниматься системами уравнений первой степени. При этом как число уравнений, так и число неизвестных будет произвольным. Прежде всего выберем удобные обозначения. Так как число неизвестных у нас может оказаться довольно большим, то для их обозначения может не хватить букв алфавита: x,y,z и т.д. Поэтому мы будем все неизвестные обозначать одной буквой, а различать их индексами: х\, Ж2,..., хп, где п — это число неизвестных. Коэффициенты уравнений будут обозначаться по тому же принципу, и одно уравнение первой степени запишется в виде а\х\ +CL2X2 Н \-апхп = Ь. (1.1) Уравнения первой степени называются также линейными. Чтобы различать разные уравнения, мы применим тот же прием. Но так как один индекс уже использован для обозначения коэффициентов при неизвестных, то мы введем второй индекс. Коэффициент при неизвестном Xk в г-ом уравнении будем обозначать а^. За правой частью г-ro уравнения закрепим символ fy. Таким образом, г-ое уравнение запишется в виде ацх\ + di2X2 H Ь Q>inxn = bi, (1.2) а система из т уравнений с п неизвестными будет выглядеть так: а\\х\ + а\2Х2 Н V а\пхп = Ь\, a2\Xi + CL22X2 Н h CL2nXn ="Ь21 0>mlX\ + dm2^2 H Ь ^тп^п = Ьт. Числа bi,...,bm называются свободными членами системы (1.3). Иногда бывает полезно сконцентрировать внимание на коэффициентах при неизвестных в системе уравнений (1.3), тогда их записывают в виде таблицы fan a\2 ••- а\п\ &2\ а22 * • * &2' \п (1.4) \CLm\ Q"m2 ' ' ' Q"mn/ имеющей т строк и п столбцов. Такая прямоугольная таблица, составленная из чисел, называется матрицей типа (т,п), а числа а^ — ее элементами.
20 Гл. 1. Линейные уравнения Если т = п, то матрица называется квадратной порядка п. В этом случае говорят, что элементы ац,а22, ••• ,&7m, стоящие в строках и столбцах с одинаковыми номерами, образуют ее главную диагональ. Написанная нами матрица (1.4), элементами которой являются коэффициенты при неизвестных системы (1.3), называется матрицей этой системы. Наряду с матрицей (1.4) часто бывает необходимо рассматривать матрицу, включающую в себя и свободные члены: /ац а\2 ••• а\п Ъ\\ I a<i\ а22 ••• а2п b2 I \Q>ml &т2 ' ' ' Q"mn "т/ Она содержит на один столбец больше, чем матрица (1.4), и следовательно, является матрицей типа (т,п+ 1). Матрица (1.5) называется расширенной матрицей системы (1.3). Обсудим подробнее левую часть уравнения (1.1). Мы здесь обычно предполагаем, что речь идет об отыскании вполне конкретных значений неизвестных х\,...,хп, которые удовлетворяли бы соотношению (1.1). Но на выражение а\х\ + а2Х2 + • • • + апхп можно посмотреть и с другой точки зрения. Мы можем подставлять в него вместо неизвестных х\,Х2,... ,хп произвольные числа Xi =Сь Х2 = С2, ..., Хп = Сп, (1.6) каждый раз получая в результате некоторое число а\с\ +а2С2 Н \-апсп. (1.7) С такой точки зрения мы имеем дело с частным случаем функции. В данной ситуации тот исходный элемент, которому мы что-то сопоставляем, есть набор значений (1.6), который определяется просто набором чисел (cj,C2,... ,сп). Такой набор чисел мы будем называть строкой длины п. Это то же самое, что матрица типа (1,п). Мы сопоставляем каждой строке (ci,C2,... ,Сп) выражение (1.7), которое является числом. Таким образом, используя обозначения со с. 9, мы получаем функцию на множестве М со значениями в N, где М — множество всех строк длины n, a N — множество всех чисел. Определение. Функция F на множестве всех строк длины п со значениями во множестве всех чисел называется линейной, если существуют такие числа а\,а2,... ,ап, что она сопоставляет каждой строке (сьсг,...,*^) число (1.7). Дальше мы будем обозначать строку одной буквой, например, с, а сопоставляемое ей линейной функцией F число — через F(c). Таким образом, если с= (ci,C2,...,Cn), то F(c) = а\с\ -\-а2С2 Н Ь апСп. В случае, когда п = 1, линейная функция совпадает с хорошо знакомым из средней школы понятием прямой пропорциональности. Таким образом, понятие линейной функции — это естественное обобщение понятия прямой пропорциональности. На этот общий случай обобщаются и известные свойства прямой пропорциональности. Для того, чтобы подчеркнуть аналогию,
/./. Линейные уравнения и функции 21 вводят определение некоторых действий над строками длины п, аналогичных арифметическим действиям над числами. Определение. Пусть end — строки одинаковой длины п, т.е. с= (сьег,...,^), d= (d\Jd2,.^jdn). Их суммой называется строка (с\ + d\yC2 + cfc, ••• ,cn + dn), она обозначается через с + d. Произведением строки с на число р называется строка (рс\,рс2,... ,рсп), она обозначается как рс. Теорема 1.1. Функция F на множестве строк длины п является линейной тогда и только тогда, когда она обладает следующими свойствами: F(c + d)=F(c) + F(d), (1.8) F(pc)=pF(c). (1.9) для всех строк c,d и всех чисел р. Свойства (1.8) и (1.9) — это непосредственный аналог известных свойств прямой пропорциональности. Доказательство свойств (1.8) и (1.9) совсем очевидно. Пусть линейная функция F сопоставляет каждой строке с= (ci,C2,... ,сп) число (1.7). Согласно данному нами выше определению, суммой строк с— (ci,...,cn) и d — (d\,..., dn) является строка c + d= {c\ + d\,..., сп + dn) и, следовательно, F(c + d) = a\(c\ +d\) Н Ь ап(сп + dn) = = {<ol\c\ + a\d\) 4 h {cinCn + andn) = = (a\c\ 4 h anCn) + {a\d\ H h andn) = F(c) + F(d), т.е. равенство (1.8). Точно так же мы получаем F(pc) = ai(pci) H h an(pcn) = p(axci H Ь апСп) = pF(c). Докажем теперь обратное утверждение: любая функция F на множестве строк длины п с числовыми значениями, обладающая свойствами (1.8) и (1.9), является линейной. Для доказательства рассмотрим строки е$, в которых все входящие числа, кроме г-го, равны нулю, а г-ое равно 1, т.е. ei = (0,..., 1,... ,0), где 1 стоит на г-ом месте. Положим F{ei) = ai и докажем, что для любой строки с = (с\,...,Сп) выполнено равенство: F(c) = а\с\ Н Ь апСп. Этим и будет доказано, что функция F — линейная. Для этого убедимся в том, что с = с\е\ -\ Ь спеп. Это почти очевидно: посмотрим, какое число стоит на г-ом месте в строке с\е\ + • • • + Спеп. В любой строке ek при к ф г на г-ом месте стоит 0, значит, то же верно и для Cfcefc, а значит, и для их суммы по всем к ф г. В строке е* на г-ом месте стоит 1, значит, в строке Qe; на г-ом месте стоит элемент q. В результате во всей сумме с\е\ Н h Спеп на г-ом месте стоит q. Это верно для любого г, и значит, исследуемая сумма совпадает со строкой с.
22 Гл. 1. Линейные уравнения Теперь рассмотрим F(c). Применяя п раз свойства (1.8) и (1.9), мы получим, что F(c) = F(cie{) + F{c2e2 + h cnen) = ciF(ei) + F(c2e2 + ••• + cnen) = = a\c\ + F{c2e2 -\ h Cnen) = a\c\ + a2c2 + ^(сзе3 Н h Cnen) = • • • • • • = a\c\ + a2C2 H h anCn> как и утверждалось. Скоро мы убедимся в полезности этих свойств линейной функции. Определим операции над линейными функциями, которые нам дальше будут встречаться. Определение. Пусть F и G — две линейные функции на множестве строк длины п. Их суммой называется функция F + G на том же множестве, определенная равенством (F + G)(c) = F(c) + G(c) для каждой строки с. Произведением линейной функции F на число р называется функция pF, задаваемая соотношением (pF)(c) = р • F(c), Применяя теорему 1.1, мы получаем, что как F + G, так и pF также являются линейными функциями. Теперь вернемся к системе линейных уравнений (1.3). Очевидно, ее можно записать в виде „ , х ( F{(x) = Ьь | (1.10) где F\(x)j... ,Fm(a?) — линейные функции, определенные соотношениями ^г(ж) = ацх\ + а^2^2 Ч Ь cbinxn. Строка с называется решением системы (1.10), если после замены х на с все уравнения превращаются в тождества, т. е. F\(c) = Ьь ..., Fm(c) = 6m. Обратите внимание на слово «если»! Не всякая система уравнений имеет решение. Например, система из двух уравнений с 100 неизвестными Г х\ +х2-\ \-x\qo = 0, \ Х\ +Х2-\ Ь^ЮО = 1, очевидно, не может иметь решения. Определение. Система, имеющая хотя бы одно решение, называется совместной, а не имеющая ни одного решения — несовместной. Если система совместная, и имеет только одно решение, то она называется определенной, если же она имеет больше, чем одно решение, то — неопределенной. Определенная система также называется однозначно разрешимой, так как она имеет ровно одно решение. Определенные системы уравнений встречаются часто — когда из других соображений ясно, что решение есть только одно. Например, пусть мы хотим найти точку, лежащую на прямых, задаваемых уравнениями х = у и х + у = 1 (рис. 1.1). Очевидно, что эти прямые не параллельны и, следовательно,
1.1. Линейные уравнения и функции 23 (1.11) Рис. 1.1. Пересечение прямых имеют в точности одну точку пересечения. Значит, система, составленная из уравнений прямых, является определенной. Легко и вычислением найти ее единственное решение. Для этого надо условие у = х подставить во второе уравнение. Получается 2х — 1, т. е. х = 1/2, а так как у = х, то и у = 1/2. Неопределенные системы уже встречались в средней школе; например, — система х - 2у = 1 Зх — 6у = 3. Очевидно, что второе уравнение получено умножением первого на 3. Поэтому оно выполнено для всех х и у, удовлетворяющих первому. Из первого мы можем получить 2у = х — 1, т. е. у = (х — 1)/2. Таким образом, можно придать х любое значение и положить у — (х — 1)/2. Наша система имеет бесконечно много разных решений и, значит, неопределенна. Итак, мы видели примеры систем уравнений, которые а) не имеют ни одного решения (несовместны), б) имеют одно-единственное решение (совместные и определенные), в) имеют бесконечно много решений (например, система (1.11)). Докажем, что только эти три случая и возможны. Теорема 1.2. Если система линейных уравнений совместна и неопределенна, то она имеет бесконечно много решений. Доказательство. По условию теоремы, мы имеем систему линейных уравнений, которая совместна и имеет более одного решения. Значит, у нее есть по крайней мере два разных решения: end. Построим бесконечное число ее решений. Для этого для любого числа р рассмотрим строку г =рс+ (1 —p)d. Докажем прежде всего, что строка г тоже будет решением. Будем считать нашу систему записанной в виде (1.10). Тогда нам нужно доказать, что Fi(r) = Ъ{ для всех г — 1,... ,т. Применяя свойства (1.8) и (1.9), мы получаем, что Fi(r) = Fi(pc+(l -p)d)=pFi(c) + (1 -p)Fi(d) =pb{ + (1 -p)bi = bi9 так как cud являются решениями системы (1.10), т. е. Fi(c) = Fi{d) — bi для всех г— 1,..., т. Остается проверить, что при разных числах р мы получим разные решения — тогда будет доказано, что мы имеем их бесконечно много. Предположим, что неравные числа р и р1 дают одно и то же решение рс+ (1 — p)d = = p'c+(l — pf)d. Отметим, что мы здесь можем обращаться со строками так же, как с числами: переносить в другую сторону равенства, выносить за скобку общий числовой множитель. Это оправдано, так как действия над строками мы определили, исходя из действий над входящими в них числами. В результате мы получаем соотношение {р — р1)с = (р — p')d. Так как по предположению р фр1, то мы можем сократить множитель р — р'. После этого
24 Гл. 1. Линейные уравнения получаем, что с = d, в то время, как по предположению end — различные решения. § 1.2. Метод Гаусса Наша цель — указать способ, каким можно было бы для каждой системы линейных уравнений сказать, к какому из трех типов, рассмотренных в предыдущем параграфе, она принадлежит, т. е. совместна ли она, и если да, то определенна ли. Если она является совместной и определенной, то нужно найти ее единственное решение, а если она является совместной и неопределенной, то нужно записать все ее решения в какой-то одной форме. Для этого существует очень простой и эффективный во всех конкретных случаях метод. Он называется методом Гаусса, его мы здесь и изложим. При этом мы будем поступать как в доказательстве по индукции, т. е. исходить из простейшего случая, когда число уравнений га = 1, потом переходить к случаю т = 2 и т.д. Так что, разбирая случай системы га линейных уравнений, будем предполагать, что ответ для систем с числом уравнений, меньшим, чем га, уже известен. Метод Гаусса основан на замене данной нам системы линейных уравнений другой системой, имеющей те же самые решения. Рассмотрим наряду с системой (1.10) другую систему линейных уравнений от того же числа п неизвестных: Г Gl(x) = fl, I (1Л2) I Gl(x) = fl, где G\(x),... ,Gi(x) — какие-то другие линейные функции от п неизвестных. Система (1.12) называется эквивалентной системе (1.10), если обе системы имеют одни и те же решения, т.е. любое решение системы (1.10) является решением системы (1.12), и наоборот. Идея метода Гаусса состоит в том, чтобы использовать некоторые простые (так называемые элементарные) преобразования системы, заменяющие ее эквивалентной, но более простой системой, для которой ответы на приведенные выше вопросы уже очевидны. Определение. Элементарным преобразованием типа I системы (1.3) или (1.10) называется перестановка двух ее уравнений. Чтобы не оставалось неопределенности, уточним, что при этом преобразовании все уравнения системы, кроме г-го и fc-ro, не меняются, а г-ое и k-ое меняются местами. Таким образом, элементарных преобразований типа I существует столько же, сколько существует пар i,k (г ^ fc), т.е. их число равно числу сочетаний из га по 2. Определение. Элементарным преобразованием типа II называется замена системы другой, в которой все уравнения, кроме г-го, остаются
1.2. Метод Гаусса 25 прежними, а к г-му уравнению прибавляется к-ое, умноженное на число с. В результате г-ое уравнение (в системе (1.3)) приобретает вид (ац + сак\)х\ + {ai2 + Cdk2)x2 H Ь (din + сакп)хп = bi + сЪк. (1.13) Элементарное преобразование типа II зависит от выбора индексов г и к и числа с, так что их существует бесконечно много. Теорема 1.3. После применения к системе элементарного преобразования типа I или II получается система, эквивалентная исходной. Доказательство. Это утверждение совершенно очевидно в случае элементарного преобразования типа I: то, какие решения имеет система, никак не зависит от нумерации ее уравнений (в порядке системы (1.3) или (1.10)). Мы могли бы уравнения вообще не нумеровать, а написать, например, каждое на отдельном листке бумаги. В случае элементарных преобразований типа II утверждение также довольно очевидно. Всякое решение с— (ci,...,cn) первой системы после подстановки превращает в тождества все уравнения системы, полученной этим элементарным преобразованием, кроме быть может г-го, — просто потому, что они совпадают с соответствующими уравнениями исходной системы. Остается решить вопрос об г-ом уравнении. Так как с было решением исходной системы, то имеют места равенства Г ацс\ + ai2C2 H Ь aincn = b{, \ dkic\ + ак2С2 Н Ь акпсп = Ък. Прибавив к первому из них второе, умноженное на число с, мы получаем равенство (1.13) для х\ = с\,...,хп = сп. Значит, с обращает в тождество и г-ое уравнение новой системы, т. е. является ее решением. Остается доказать обратное утверждение: что любое решение системы, полученной преобразованием типа II, является и решением исходной системы. Для этого заметим, что, прибавив к уравнению (1.13) fc-oe уравнение, умноженное на число —с, мы получим г-ое уравнение первоначальной системы. То есть исходная система получается из новой элементарным преобразованием типа II, связанным с числом —с. Таким образом, предыдущее рассуждение доказывает, что и любое решение новой системы, полученной элементарным преобразованием типа II, является решением исходной системы. Приступим теперь к изложению метода Гаусса. В качестве первой операции совершим в системе (1.3) элементарное преобразование типа I, переставив первое уравнение и любое другое, в которое х\ входит с коэффициентом, отличным от 0. Если таково первое уравнение, то никакого преобразования совершать не надо. Однако может оказаться, что х\ во все уравнения входит с коэффициентом 0 (т.е. вообще не входит в систему). Тогда мы можем изменить нумерацию неизвестных и обозначить через х\ то неизвестное, которое входит с ненулевым коэффициентом в какое-то уравнение. После совершенного элементарного преобразования мы будем иметь ац Ф 0. Конечно, следует рассмотреть и тот крайний случай, когда все неизвестные входят во все уравнения с нулевыми коэффициентами. Но тогда все ясно:
26 Гл. 1. Линейные уравнения уравнения приобретают вид 0 = Ъ{. Если все b{ = 0, то это — тождества 0 = 0, которые удовлетворяются при всех значениях ж$, т.е. система совместна и неопределенна. Если же хоть одно Ь{ ф 0, то г-ое уравнение не выполняется ни при каком значении неизвестных, и система несовместна. Теперь совершим ряд элементарных преобразований типа II, прибавив ко второму, третьему, и т. д. до га-ro уравнения первое уравнение, умноженное каждый раз на такое число С2, сз,..., Cm, чтобы в результате коэффициент при х\ в каждом из этих уравнений оказался равным 0. Очевидно, что для этого нужно положить С2 = —а2\а^1, сз = — аз!^1,..., Сщ = — amia["11, что возможно, так как ац ф 0 по предположению. В результате неизвестное х\ не будет входить ни в одно уравнение системы, кроме первого. Тем самым мы получили систему, которую можно записать в виде ( а\\х\ + + а\пхп = Ь\, а22^2 Н Ь ^2пхп — ^2> 1 (1.14) I 0>т2х2 + * • • + о!шпХп = Ъ'т. Так как система (1.14) получилась при помощи элементарных преобразований из исходной системы (1.3), то согласно теореме 1.1 она ей эквивалентна, т.е. решение произвольной системы (1.3) свелось к решению более простой системы (1.14). В этом и состоит идея метода Гаусса. Он фактически сводит весь вопрос к изучению системы из га — 1 уравнений: ( а'22Х2 Н Ь a'2nxn = Ъ'2 \ \\\\\\\\\\\\\\\\\\\\\\\ (1Л5> [ а,т2х2 + -' + а!гппхп = Ъ,гп. Действительно, если система (1.15) несовместна, то, очевидно, несовместна и большая система (1.14). Если же система (1.15) совместна и нам известны ее решения, то мы можем найти все решения системы (1.14). А именно, если Х2 = С2, ••• ,хп = Сп — любое решение системы (1.15), то нам остается подставить их в первое уравнение системы (1.14). В результате первое уравнение системы (1.14) приобретает вид а\\х\ +а\2С2 -\ \-a\nCn = Ь\, (1.16) и мы имеем одно уравнение первой степени для остающегося неизвестного х\, которое можно решить по известной формуле х{ = aj"i (b\ - а\2С2 a>inCn), что возможно, так как ац ф 0. Это рассуждение, в частности, применимо к случаю га = 1 (если сравнивать метод Гаусса с рассуждением по индукции, то это дает нам базу индукции). Таким образом, метод Гаусса сводит исследование произвольной системы из га уравнений с п неизвестными к исследованию системы из га — 1 урав-
1.2. Метод Гаусса 27 нений сп-1 неизвестными. Мы проиллюстрируем это, доказав несколько общих теорем о системах. Теорема 1.4. Если число неизвестных системы больше числа уравнений, то она несовместна или неопределенна. Иначе говоря, согласно теореме 1.2 мы знаем, что для числа решений произвольной системы линейных уравнений возможны лишь значения 0,1 и оо. Если же число неизвестных больше числа уравнений, то теорема 1.4 утверждает, что остаются возможными лишь значения 0 и оо. Доказательство. Докажем теорему индукцией по числу т уравнений системы. Сначала рассмотрим случай га = 1, когда мы имеем одно уравнение: а\х\ +<22Ж2 + ••• + anxn = Ь\. (1.17) По условию п > 1, и если хоть одно щ ф 0, то можно выбрать нумерацию неизвестных так, что а\ Ф 0. Тогда получится случай уравнения (1.16). Мы видели, что при этом система совместна и неопределенна. Но нам осталось разобрать еще случай, когда все а* = 0 при г = 1,...,п. Если при этом Ъ\ ф 0, то, очевидно, мы имеем несовместную «систему» (состоящую из одного противоречивого равенства). Если же и Ъ\ = 0, то решением является любой набор чисел х\ — с\,Х2 = С2,...,хп — Сп, т. е. «система» (состоящая из равенства 0 = 0) неопределенна. Теперь рассмотрим случай га > 1 уравнений. Мы воспользуемся методом Гаусса, т.е., записав нашу систему в виде (1.3), сведем ее к эквивалентной системе (1.14). Число неизвестных в системе (1.15) равно п — 1 и, следовательно, больше числа неизвестных т — 1, так как по условию теоремы п> т. Значит, условие теоремы выполняется для системы (1.15), и, по индукции, мы можем считать для нее теорему справедливой. Если система (1.15) несовместна, то, тем более, несовместна содержащая ее система (1.14). Если же она неопределенна, т. е. имеет больше, чем одно решение, то и в исходной системе будет более одного решения, т.е. система (1.3) будет неопределенна. Обратим внимание на важный частный случай теоремы 1.4. Система линейных уравнений называется однородной, если все свободные члены равны 0, т.е. в записи (1.3) Ь\ = • • • = Ът = 0. Однородная система всегда совместна: она имеет очевидное решение, в котором х\ = • • • = хп = 0. Такое решение называется нулевым. Из теоремы 1.4 мы получаем: Следствие. Если в однородной системе число неизвестных больше числа уравнений, то она имеет решение, отличное от нулевого. Если обозначать (как мы и делаем) число неизвестных через п, а число уравнений — через т, то мы рассмотрели случай п> т. Теорема 1.4 утверждает, что при п> т система линейных уравнений не может быть однозначно разрешимой. Теперь перейдем к случаю п = т. Оказывается, имеет место удивительное обстоятельство: Теорема 1.5. Если в системе линейных уравнений число неизвестных равно числу уравнений, то свойство быть однозначно разрешимой
28 Гл. 1. Линейные уравнения определяется только значениями коэффициентов при неизвестных, т. е. не зависит от свободных членов. Доказательство сразу получается с помощью метода Гаусса. Пусть система записана в виде (1.3), причем п = т. Разберем отдельно случай, когда все коэффициенты а^ = 0 (во всех уравнениях). Тогда система не может быть однозначно разрешимой ни при каких свободных членах bi. Именно, если хоть одно hi ^ О, то г-ое уравнение дает противоречивое равенство, а если все bi — 0, то любые значения для xi дают решение, т. е. система неопределенна. Докажем теорему 1.5 индукцией по числу уравнений (га = п). Мы уже разобрали случай, когда все коэффициенты а^ = 0. Поэтому можно считать, что среди коэффициентов а^ есть ненулевые и систему можно переписать в эквивалентом виде (1.14). А решения системы (1.14) полностью определяются системой (1.15). В системе (1.15) опять число уравнений равно числу неизвестных (оба равны га — 1). Поэтому, рассуждая по индукции, мы можем считать теорему доказанной для этой системы. Однако мы видели, что совместность или определенность системы (1.14) равносильна тому же свойству для системы (1.15). В заключение остается заметить, что коэффициенты a!ik системы (1.15) получаются из коэффициентов системы (1.3) по формулам / «21 / «31 / «ml a2k — a2k «lb «3fc — a3fc «lb ••• , «mfc = «mfc «lfc- «11 «11 «11 Таким образом, вопрос об однозначной разрешимости определяется коэффициентами исходной системы (1.3). Теорему 1.5 можно сформулировать и так: если число уравнений равно числу неизвестных и система однозначно разрешима при некоторых значениях свободных членов bi, то она будет однозначно разрешима и при любых других значениях свободных членов. Но в частности, в качестве этих «некоторых» значений свободных членов мы можем взять нулевые значения. Тогда мы получим систему с теми же коэффициентами при неизвестных, что и в исходной системе (1.3), но теперь уже однородную. Такая система называется однородной системой, ассоциированной с системой (1.3). Таким образом, мы видим, что если число уравнений равно числу неизвестных, то система однозначно разрешима тогда и только тогда, когда однозначно разрешима ассоциированная с ней однородная система. Поскольку однородная система всегда обладает нулевым решением, то однозначная разрешимость для нее равнозначна отсутствию ненулевых решений, и мы приходим к следующему результату. Следствие. Если в системе уравнений число уравнений равно числу неизвестных, то она будет однозначно разрешимой тогда и только тогда, когда ассоциированная с ней однородная система не имеет других решений, кроме нулевого. Это утверждение представляется неожиданным, так как из отсутствия решения, отличного от нулевого, оно выводит существование и единствен-
1.2. Метод Гаусса 29 ность решения другой системы (с другими свободными членами). В анализе аналогичный результат называется альтернативой Фредгольма1). Для того, чтобы выделить идею метода Гаусса, мы подчеркнули его «индуктивный» характер: он сводит изучение системы линейных уравнений к аналогичной системе, но содержащей меньше уравнений и неизвестных. Понятно, что в конкретных примерах мы должны его опять применять к этой последней системе и так двигаться до тех пор, пока процесс не остановиться (т. е. его уже нельзя будет применять). Теперь уясним себе, к какому же виду система в результате приведется. Когда мы приведем систему (1.3) к эквивалентной системе (1.14), то может оказаться, что в соответствующую ей систему (1.15) входят не все неизвестные Х2,...,хп, т.е. некоторые из них могут иметь нулевые коэффициенты во всех уравнениях. Причем об этом было нелегко догадаться по исходной системе (1.3). Обозначим через к первый номер неизвестного, которое входит с отличным от нуля коэффициентом хоть в одно уравнение системы (1.15). Очевидно, что к > 1. Теперь мы можем применять точно такие же преобразования к этой системе. В результате мы получим эквивалентную систему ( а\\х\ + + а\пхп = Ь\, а'2кхк + + а!2пхп = &2> I <4ixi + + а3пхп = Ь%, ^ amlxl "г + атпхп ~ Яш» где мы уже выбрали I > к таким, что в системе, получающейся отбрасыванием двух первых уравнений, неизвестное х\ входит с отличным от нуля коэффициентом хотя бы в одно уравнение. При этом мы будем иметь ац ф О, а'2к фО, а'г1фО и1> к> I. Мы будем применять этот процесс до тех пор, пока это возможно. Когда же мы будем вынуждены остановиться? Тогда, когда после элементарных преобразований, цель которых — обратить в нуль коэффициенты при очередном неизвестном (скажем, при 5-ом), мы обратим в нуль и коэффициенты при всех следующих неизвестных, вплоть до n-го. Система тогда примет вид: 1) Точнее говоря, альтернативой Фредгольма называется совокупность нескольких утверждений, одно из которых аналогично доказанному выше.
30 Гл. 1. Линейные уравнения ( а\\х\ + + а\пХп = Ьь «2/c^fc + + «2n#n = &2, asm + + азп^п = Ьз» < (118) I CLrsxs -j- г arnxn = Oj*, 0 = 6r+i, При этом 1 < A: </<•••< 8. В результате может оказаться, что г = га, и поэтому уравнений вида 0 = 6; в системе (1.18) не будет. Если же г < га, то может оказаться, что Ьг+\ = 0,...,ЬШ = 0, и может, наконец, быть, что одно из чисел br+i,...,bm отлично от нуля. Определение. Про систему (1.18) говорят, что она имеет ступенчатый вид. Тот же термин применяется и к матрице системы. Теорема 1.6. Всякая система уравнений первой степени эквивалентна системе, имеющей ступенчатый вид (1.18). Доказательство. Действительно, так как мы привели исходную систему к виду (1.18) при помощи ряда элементарных преобразований, то, согласно теореме 1.3, система (1.18) эквивалентна исходной системе. Так как всякая система (1.3) эквивалентна системе (1.18) ступенчатого вида, то вопросы совместности и определенности достаточно исследовать для систем ступенчатого вида. Начнем с вопроса о совместности. Очевидно, что если система (1.18) содержит уравнение 0 = Ъ^ с Ъ^ ^ 0, то эта система несовместна, так как равенство 0 = && нельзя удовлетворить никакими значениями неизвестных. Докажем, что если таких уравнений в системе (1.18) нет, то эта система совместна. Таким образом, мы сейчас полагаем, что в системе (1.18) последние га — г уравнений превращаются в тождества 0 = 0. Назовем неизвестные x\,Xk,xu... ,х8, с которых начинаются первое, второе, третье, ..., r-ое уравнения системы (1.18), главными, а все остальные неизвестные (если такие есть) — свободными. Так как каждое уравнение в системе (1.3) начинается со своего главного неизвестного, то число главных неизвестных равно г. Напомним, что мы предполагаем for+i = • • • = Ът = 0. Придадим свободным неизвестным произвольные значения и подставим их в уравнения системы (1.18). Так как r-е уравнение содержит только одно главное неизвестное xs, и притом с коэффициентом ars, отличным от нуля, то мы получим для xs одно уравнение с одним неизвестным, которое имеет единственное решение. Подставив это решение для xs в предпоследнее
1.2. Метод Гаусса 31 уравнение, мы получим для предпоследнего главного неизвестного опять одно уравнение с одним неизвестным, которое тоже имеет единственное решение. Поднимаясь так снизу вверх по системе (1.18), мы покажем, что значения главных неизвестных определяются однозначно при любым образом заданных значениях свободных неизвестных. Таким образом, нами доказана Теорема 1.7. Для того, чтобы система уравнений первой степени была совместна, необходимо и достаточно, чтобы после приведения к ступенчатому виду в системе не оказалось уравнений вида О = bk с Ь& ф 0. Если это условие выполнено, то свободным неизвестным можно придать произвольные значения, а главные неизвестные — при заданных значениях для свободных — однозначно определяются из системы. Выясним теперь, когда система будет определенной, в предположении, что выведенное нами условие совместности выполнено. На этот вопрос легко ответить, исходя из теоремы 1.7. Действительно, если в системе (1.18) имеются свободные неизвестные, то система заведомо не определенна — мы можем придать свободным неизвестным любые значения, и по теореме 1.7, значения главных неизвестных определяются тогда из системы. Если же свободных неизвестных нет, то все неизвестные являются главными. Согласно теореме 1.7, они определяются из системы однозначно, и значит, система является определенной. Следовательно, необходимым и достаточным условием определенности является отсутствие свободных неизвестных в системе (1.18). Это, в свою очередь, равносильно тому, чтобы в этой системе все неизвестные были главными. А это, очевидно, эквивалентно равенству г = п, так как г — это число главных неизвестных, an — число всех неизвестных. Итак, мы доказали следующее утверждение: Теорема 1.8. Для того, чтобы совместная система (1.3) была определенна, необходимо и достаточно, чтобы в системе (1.18), получающейся после приведения к ступенчатому виду, было выполнено равенство г = п. Замечание. Любую систему с п уравнениями и п неизвестными (т.е. при т = п), приведенную к ступенчатому виду, можно записать как (а\\х\ +а\2Х2 + + а\пХп = Ь\, 0,22^2 + + Щп^п = &2> < (1.19) (однако, не всякая система вида (1.19) ступенчатая, поскольку некоторые из а,ц могут быть равны нулю). Действительно, запись (1.19) означает, что в системе к-е уравнение не содержит неизвестных Х{ с г < к, а это условие заведомо выполнено для системы ступенчатого вида. Система, имеющая вид (1.19), называется верхнетреугольной. Тот же термин применяется и к матрице системы (1.19).
32 Гл. 1. Линейные уравнения Пользуясь этим замечанием, можно придать теореме 1.6 в случае т = п другую форму. Условие г — п означает, что все неизвестные х\,Х2,... ,хп — главные, а это значит, что в системе (1.19) коэффициенты а\\ Ф О,...,апп ф 0. Нами доказано Следствие. Система (1.3) в случае т = п совместна и определенна тогда и только тогда, когда после приведения ее к ступенчатому виду мы получаем верхнетреугольную систему (1.19) с коэффициентами ац ф0, Мы видим, что это условие не зависит от свободных членов системы и тем самым получаем другое (хотя основанное на той же идее метода Гаусса) доказательство теоремы 1.5. § 1.3*. Примеры Приведем некоторые примеры применения метода Гаусса и получения с его помощью новых результатов для исследования конкретных задач. Пример 1.1. Выражение / = ао + а\х + а2Х + ... + апхп, где ец — некоторые числа, называется многочленом от неизвестной х. Если ап ф 0, то число п называется степенью многочлена /. Придавая х некоторое численное значение х = с, мы получаем число ао + а\с + а^(? + ... + апсп, которое называется значением многочлена при х = с и обозначается через /(с). Часто встречается следующая задача: даны два набора чисел: ci,...,cr и fci,...,fer, причем ci,...,cr попарно различны. Можно ли найти такой многочлен /, что /(с$) = ki для всех г= 1,...,г? Процедура построения такого многочлена называется интерполяцией. Эта задача встречается, когда экспериментально измеряются значения некоторой величины (например, температуры) в различные моменты времени ci,...,cr. Если интерполяция возможна, то она дает единую формулу, охватывающую наши измерения. Можно нагляднее изобразить задачу интерполяции, сказав, что мы ищем такой многочлен f(x) степени п, что график функции у = f{x) проходит через данные точки плоскости с координатами (cf,fcj) при г = 1,... ,г (рис. 1.2). Рис. 1.2. График многочлена, проходящий через заданные точки
1.3. Примеры 33 Запишем условия задачи в виде явных формул: ао + а\с\ Н Ь and[ = k\, ао + aic2 H Ь anC2 = /с2, . . ао + aicr H Ь anc™ = fcr. Для искомого многочлена / мы получаем соотношения (1.20), являющиеся линейными уравнениями. В них ао,... ,an — неизвестные. Число неизвестных равно п+ 1 (нумерация начинается не с а\, как обычно, а с ао). Числа 1 и cf являются коэффициентами при неизвестных, а к\,..., кг — свободными членами. Если г = п + 1, то мы находимся в условиях, когда применима теорема 1.5 и ее следствие. Таким образом, при г = п + 1 задача интерполяции тогда и только тогда имеет решение, причем единственное, когда однородная система, ассоциированная с системой (1.20), имеет только нулевое решение. Эту ассоциированную систему можно записать в виде /(ci) = 0, /(С2):°' (1-2D /Ы = о. Число с, для которого /(c) = 0, называется корнем многочлена /. Простая теорема алгебры (следствие так называемой теоремы Безу) утверждает, что многочлен не может иметь больше различных корней, чем его степень (кроме случая, когда все а; = 0, и степень не определена). Значит, (если числа с* отличны друг от друга, что естественно предполагать) при г = п + 1 уравнения (1.21) могут выполняться, только если все щ = 0. Мы получаем, что при этих условиях система (1.20) (т.е. задача интерполяции) имеет решение, и оно единственно. Впрочем, не представляет особого труда выписать и явную формулу для коэффициентов многочлена /, что будет сделано в §§ 2.4 и 2.5. В следующем примере задача несколько сложнее. Пример 1.2. Многие физические вопросы (например, о распределении тепла в теле, если на его поверхности поддерживается известная температура; или о распределении электрического заряда в теле, если на поверхности поддерживается известное распределение заряда и т.д.) приводят к одному и тому же дифференциальному уравнению, так называемому уравнению Лапласа. Это дифференциальное уравнение в частных производных, но нам нет нужды его здесь описывать. Достаточно упомянуть об одном его следствии, называемом «теоремой о среднем», согласно которому значение искомой величины (удовлетворяющей уравнению Лапласа) в каждой точке равно среднему арифметическому ее значений в «близких» точках. Нам здесь не нужно и уточнять, что значит «близкие точки» (их на самом деле бесконечно много, и свойство это формулируется при помощи интеграла). Но мы изложим метод приближенного решения уравнения Лапласа. Причем (исключительно для упрощения изложения) заменим «трехмерный» случай — «двумерным», 2 А. О. Ремизов, И. Р. Шафаревич
34 Гл. 1. Линейные уравнения т.е. вместо пространственного тела и его поверхности будем рассматривать плоскую фигуру и ее границу (рис. 1.3, а). Для построения приближенного решения на плоскости строится решетка из одинаковых квадратиков (чем меньше сторона квадрата, тем точнее получается приближение), а контур фигуры заменяется наиболее близким контуром, состоящим из сторон квадратиков (рис. 1.3, б). Мы рассматриваем искомую величину (температуру, заряд и т.д.) только в вершинах квадратиков. Теперь понятие «соседних точек» приобретает вполне ясный смысл: у каждой вершины квадратика решетки есть ровно 4 ближайшие, т. е. «соседние» вершины. Например, на рис. 1.4 для точки а соседние вершины — это точки 6, с, d, е. Мы считаем заданными некоторые величины ха для всех вершин а квадратиков, находящихся на границе (прямые жирные линии на рис. 1.3, б), и ищем их для вершин квадратиков, находящихся внутри контура. А приближенным аналогом «теоремы о среднем», например, для точки а из рис. 1.4 является соотношение Х\) -г Хс ~г Xd Н- Хе Л / / ( \] 4s <ггт т Lpi -Us тГ "1 1 1 4-L vis J \х t\ ± а) б) Рис. 1.3. К приближенному решению уравнения Лапласа Хп (1.22) d-Q с <УЪ- Рис. 1.4. Таким образом, у нас есть столько неизвестных, сколько вершин внутри контура, и каждой точке такой вершины соответствует уравнение типа (1.22). Значит, мы имеем систему линейных уравнений, в которой число уравнений равно числу неизвестных. Если одна из вершин Ь, с, d или е находится на стороне контура, то соответствующая величина хъ, хС1 Xd или хе должна быть задана, и уравнение (1.22) в этом случае неоднородно. Утверждение из теории линейных уравнений, которое мы докажем, заключается в том, что как бы ни задать значения на границе контура, система линейных уравнений всегда имеет единственное соответствующая решение. Мы явно находимся в условиях, когда применимо следствие теоремы 1.5, согласно которому нам достаточно проверить, что однородная система, ассоциированная с нашей, имеет только нулевое решение. Ассоциированная однородная система соответствует тому случаю, когда все значения на границе контура равны нулю. Предположим, что она имеет решение x\,...,xn (где N — число уравнений), отличное от нулевого. Если среди чисел Х{ есть хоть одно положительное, то обозначим через ха наибольшее из них. Тогда уравнение (1.22) (в нем хъ,хс,х<1 или хе будет равняться нулю, если точка
1.3. Примеры 35 JL- Рис. 1.5. Простой контур для приближенного решения уравнения Лапласа Ъ, с, d или е лежит на контуре) может выполняться, только если хъ = хс = = Xd = хе = ха (поскольку среднее арифметическое чисел не превосходит максимального из них). Аналогичное рассуждение можно провести и для точки Ъ и найти, что значения всех соседних с ней точек равны ха. Двигаясь так вправо, мы дойдем когда-то до некоторой точки р границы контура, для которой получим хр = ха > 0 — а это противоречит тому, что значение хр для точки р на границе контура равно нулю. Например, для простого контура из рис. 1.5 мы получим равенства хъ = ха, хс — хь = ха, Xd = ха, хе = ха и хр — ха, последнее из которых невозможно, так как ха > О, хр — 0. Если же все числа xi в нашем решении неположительные, но не все равны нулю, то это же рассуждение следует провести, взяв за ха наименьшее из них. Приведенное нами рассуждение может быть применено к доказательству существования решения уравнения Лапласа (путем предельного перехода) *). Пример 1.3. Он касается электрических сетей. Такая сеть (рис. 1.6) состоит из проводников, каждый из которых мы будем считать однородным, соединенных друг с другом в точках, называемых вершинами. В одной точке к сети подводится постоянный ток заданной силы г, в другой — отводится ток силы j. Ввиду однородности каждого проводника в нем возникает постоянный ток. Проводники мы будем обозначать греческими буквами а,/?,7, •••, а силу тока в проводнике а — символом га. Требуется, зная силу тока г, найти все силы токов га,г^,г7,... для всех проводников цепи а,/3,7, ••• и силу тока j. Вершины сети мы будем обозначать латинскими буквами а, Ь, с,... Здесь необходимо еще одно уточнение. Так как ток по проводнику течет в определенном направлении, то естественно его силу снабдить знаком. Для этого в каждом проводнике произвольно выбирается определенное направление, обозначаемое стрелкой. Вершины, соединяемые проводником, называются началом и концом, причем стрелка направлена от начала к концу. Начало проводника а будет обозначаться о!, а конец — а". Сила тока ia считается Рис. 1.6. Электрическая сеть положительной, если ток течет в направлении, указанном стрелкой, и отрицательной — в противном случае. Будем говорить, 1) Такое доказательство принадлежит Л. А. Люстернику и, как и предыдущее рассуждение, изложено в книге И. Г. Петровского «Лекции об уравнениях с частными производными» (М.: 1961, с. 316). 2*
36 Гл. 1. Линейные уравнения что ток га вытекает из вершины а (втекает в вершину а), если существует проводник а с началом (концом) а. Например, на рис. 1.6 ток га вытекает из а и втекает в 6, т. е., согласно нашим обозначениям, о! = а и а" = Ъ. Мы будем предполагать дальше, что рассматриваемая сеть удовлетворяет следующему естественному условию: любые две вершины а и Ъ можно связать при помощи некоторых вершин с\,..., сп так, что каждая из пар а и с\, с\ и С2, ..., сп-\ и Сп, сп и Ъ соединена некоторым проводником. Это свойство мы будем называть связностью сети. Не удовлетворяющая ему сеть распалась бы на несколько меньших сетей, вершины которых не соединены между собой никакими проводниками (рис. 1.7). Мы могли бы тогда рассматривать каждую меньшую сеть отдельно. Замкнутым контуром называется такой набор вершин сети ai,...,an и соединяющих их проводников ai,...,an, что проводник а\ соединяет вершины ai и а2, проводник од соединяет вершины а2 и аз, ..., проводник ап-\ соединяет вершины ап-\ и ап, а проводник ап соединяет вершины ап и а\. Например, на рис. 1.6 в качестве замкнутого контура можно выбрать вершины а, 6, с, d, h и проводники а,/3,7, £,?? или, например, вершины е, g,h,d и проводники /i, #, £, 5. Распределение токов в замкнутом контуре определяется двумя известными из физики законами Рис. 1.7. Распавшаяся цепь Кирхгофа. / закон Кирхгофа относится к каждой вершине сети и утверждает, что сумма сил токов, втекающих в эту вершину, равна сумме сил токов, вытекающих из нее. Точнее говоря, сумма сил токов в проводниках, для которых данная вершина а является концом, равна сумме сил токов в тех проводниках, для которых она является началом. В виде формулы это можно записать так: х;*а- х^=0 (L23) а'=а (3"=а для каждой вершины а. Например, на рис. 1.6 для вершины е мы получим уравнение г£ — is — i\-ifl = 0. // закон Кирхгофа относится к любому замкнутому контуру, состоящему из проводников сети. А именно, если проводники а/ образуют такой контур С, то в нем нужно выбрать определенное направление обхода, и закон выражается уравнением ^2±Paiiai=01 (1.24) где pai — это сопротивление проводника щ (являющееся постоянным положительным числом, так как проводники однородны), при этом знак «плюс» берется, если выбранное (отмеченное стрелкой) направление в проводнике а\ совпадает с направлением обхода, и знак «минус» берется, если оно
1.3. Примеры 37 противоположно направлению обхода. Например, для замкнутого контура С с вершинами e,g,h,d (рис. 1.6) и заданным этим порядком направлением обхода II закон Кирхгофа дает уравнение -PfiV + Р№ ~ Р$Ч + Р8Ч = 0. (1.25) Таким образом, мы получаем систему линейных уравнений, в которых неизвестными будут га,г^,г7, ... и j. Такая же система уравнений встречается во многих задачах: задаче о распределении грузов в транспортной сети, о распределении воды в системе каналов и т. д. Наша цель заключается в том, чтобы показать, что полученная система уравнений (при заданной сети и силе подведенного тока г) имеет одно-единственное решение. Прежде всего, заметим, что сила вытекающего тока j равна г. Это очевидно из физических соображений, но нам нужно вывести это из уравнений, соответствующих законам Кирхгофа. Для этого сложим все уравнения (1.23), соответствующие I закону Кирхгофа для всех вершин а нашей сети. Сколько раз мы столкнемся в полученном уравнении с проводником а? Один раз, когда будем рассматривать уравнение, соответствующее вершине а = а', и другой раз — когда а = а". Причем сила тока га входит в оба уравнения с противоположными знаками и, значит, в результате сократится. В результирующем уравнении останется только сила тока г (для той точки, в которой ток подводится) и — j (для той точки, где ток отводится). Это и дает равенство г — j = 0, т. е. г = j. Теперь заметим, что не все уравнения (1.24), соответствующие II закону Кирхгофа, независимы. Назовем замкнутый контур с проводниками а\,... ,an ячейкой, если любая пара его вершин соединяется только проводником из а\,...,ап и никаким другим. Каждый замкнутый контур может быть разбит на несколько ячеек. Например, на рис. 1.6 контур С с вершинами e,g,h,d и проводниками ji, #,£, 5 может быть разбит на две ячейки: с вершинами е, д, h и е, h, d и проводниками /х, #, Л и Л, £,5 соответственно. При этом уравнение (1.24), соответствующее контуру, оказывается суммой уравнений, соответствующих отдельным ячейкам (при надлежащем выборе направлений обходов). Например, уравнение (1.25) для контура С с вершинами e,g,h,d есть сумма уравнений -Pfiifj, + Р&Ч + P\h = 0, ~P\i\ - р$ц + psis = 0, соответствующих ячейкам с вершинами е, д, h и е, h, d. Таким образом, мы можем ограничиться только уравнениями для ячеек сети. Докажем, что тогда во всей системе уравнений (1.23) и (1.24), соответствующих I и II законам Кирхгофа, число уравнений будет равно числу неизвестных. Обозначим через Ля, TVn и Л^в число ячеек, проводников и вершин сети соответственно. Число неизвестных га и j равно 7Vn + 1- Каждая ячейка и каждая вершина дает одно уравнение. Значит, число уравнений равно Л^я + NB, и нам нужно доказать равенство Nn + NB = Nn + 1. (1.26)
38 Гл. 1. Линейные уравнения Это равенство хорошо известно, оно относится к элементам топологии и называется теоремой Эйлера. Доказательство его очень простое. Заметим, здесь существенно, что сеть расположена на плоскости: проводники не обязаны быть прямолинейными отрезками, но должны быть непересекающимися кривыми на плоскости. Используем индукцию по числу ячеек. В одной из «внешних» ячеек уничтожим ее «внешнюю» сторону (например, сторону (Ь, с, d) на рис. 1.8, а). При этом число ячеек Nr уменьшится на 1. Если в «стертой» стороне было к проводников, то число iVn уменьшится на к, а число NB — на к — 1. В результате число ЛГЯ — Nu + NB — 1 не изменится. При этом свойство связности не нарушится. Ведь любые две вершины исходной сети можно связать при помощи указанной в определении последовательности вершин с\,...,Сп. Если бы даже часть этой последовательности состояла из вершин «стертых» сторон нашей ячейки, то мы могли бы заменить их последовательностью вершин «нестертых» ее сторон. Этот процесс сводит доказательство к случаю i\fe = 0, т. е. к сети, вообще не содержащей замкнутых контуров. Нам надо доказать, что для нее NB — Nu — 1. Тут мы применим индукцию по числу iVn. Удалим какой-нибудь «крайний» проводник, хотя бы один конец которого не является концом другого (например, проводник а на рис. 1.8, б). Тогда оба числа iVn и NB уменьшатся на 1, и число Nu — NB не изменится. Как легко убедиться, при этом свойство связности опять сохранится. В результате мы придем к случаю Nu — 0, но NB > 0. Так как сеть должна быть связной, то Л^в = 1, и равенство NB — Nu — 1 очевидно. а) б) Рис. 1.8. К доказательству теоремы Эйлера Теперь отметим важное свойство сетей, удовлетворяющих соотношению (1.24), которое вытекает из II закона Кирхгофа (при заданных силах токов га). Для них каждой вершине а можно сопоставить такое число га, что для любого проводника а с началом а и концом Ъ выполнено равенство Paia =Га-ГЬ. (1.27) Для определения этих чисел га выберем некоторую вершину х и зададим число гх произвольно. Потом для каждой вершины у, соединенной некоторым
1.3. Примеры 39 проводником а с х, положим гу — тх —paia> если х является для а началом, а у — концом, и гу — гх + рага в противном случае. Затем точно так же определим число rz для каждой вершины, соединенной проводником с одной из рассмотренных вершин ж, у и т.д. Ввиду свойства связности мы в конце концов дойдем до каждой вершины t нашей сети и определим для нее число rt. Но нужно еще доказать, что это число rt не зависит от того пути, которым мы пришли отхк^ (т.е. какую точку выбрали в качестве у, потом — в качестве z и т.д.). Для этого достаточно заметить, что пара разных путей, соединяющих вершины х и t, образует замкнутый контур (рис. 1.9), и нужное соотношение прямо следует из II закона Кирхгофа (уравнения (1.24)). Теперь уже просто доказать, что система линейных уравнений, полученных из I закона Кирхгофа (1.23) для всех вершин и II закона Кирхгофа (1.24) для всех ячеек, имеет одно- единственное решение. Для этого, как мы знаем, достаточно показать, что ассоциированная с ней однородная система имеет только нулевое решение. Эта однородная система получается при г = j = 0. Конечно, «физически» совершенно очевидно, ЧТО если МЫ не подведем К сети никакого Рис. 1.9. Замкнутый контур, содер- тока, то в ее проводниках тоже никаких токов жащий вершины xwt не возникнет, но нам-то надо доказать, что это вытекает именно из законов Кирхгофа. Для этого рассмотрим сумму СРа*а» распространенную на все проводни- а ки нашей сети. Слагаемое ра12а разобьем на два множителя: pai2a = (рага) • ia- Первый множитель на основании соотношения (1.27) заменим на га — гъ, где а — начало, Ъ — конец проводника а. Мы получим сумму ХХга — ч)^а и со- берем в ней слагаемые, в которых первый множитель га или — гъ относится к некоторой вершине с. Тогда число гс можно вынести за скобки, внутри которых останется сумма Y1 *<* ~~ 1С */?» которая равна нулю, на основании I закона Кирхгофа (1.23). В результате мы получаем, что СРс^а = 0, а так а как сопротивления ра положительные, то все токи га = 0. Заметим в заключение, что сети, которые мы рассматривали, в математике называются графами, при этом «проводники» называются ребрами графа. В случае, когда на каждом ребре графа выбрано определенное направление (расставлены стрелки), граф называют ориентированным. Доказанная нами теорема относится к области математики, называемой теория графов. Эта теорема верна не для произвольных графов, а только для тех, которые, подобно рассматриваемым нами сетям, могут быть изображены на плоскости без пересечения ребер (мы опускаем точное определение). Такие графы называются планарными.
Глава 2 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ § 2.1. Определители второго и третьего порядков Рассмотрим систему двух уравнений с двумя неизвестными: Г а\\х\ + ai2x2 = Ьь \ a2ixi +а22^2 = &2- Чтобы определить х\, постараемся исключить х2 из системы. Для этого достаточно умножить первое уравнение на а22 и прибавить к нему второе, умноженное на —а\2. Мы получим: (аца22 - а2\а\2)х\ = Ь\а22 - Ъ2а\2. Рассмотрим сейчас случай, когда а\\а22 — а2\а\2 ф 0. Тогда мы получим, что fria22 — Ъ2а\2 xi = а\\а22 - а2\а\2 (2.1) Аналогично, чтобы найти значение х2, умножим второе уравнение на а\\ и прибавим к нему первое, умноженное на — а2\. При том же предположении (ana22 — а2\а\2 ф 0) мы получим, что х2 Ь2ап -Ъ\а2\ (2.2) а\\а22 - а2\а\2 Выражение аца22 — а\2а2\, стоящее в знаменателе формул (2.1) и (2.2), называется определителем матрицы I п 12 ] (или определителем 2-го порядка) и обозначается как а\\ а\2 0>2\ а22 an a\2 0>2\ а22 . Таким образом, по определению a>UQ>22 — «21^12- (2-3) Мы видим, что и в числителях формул (2.1) и (2.2) тоже стоит выражение вида (2.3). Используя введенное обозначение, мы можем переписать эти
2.1. Определители второго и третьего порядков 41 формулы следующим образом: х\ = |&1 \ь2 |«п |«21 «12| «221 «121 «221 Х2 |«11 |«21 «11 «21 bi 1 ь2 «12I «221 (2.4) Выражение (2.3) полезно не только для симметричной записи решений двух уравнений с двумя неизвестными. Оно встречается во многих случаях и именно поэтому заслужило особое название и обозначение. Например, рассмотрим на плоскости две точки: А с координатами (х\,у\) и В с координатами (ж2,уг) (Рис- 2.1). Нетрудно видеть, что площадь треугольника ОАВ равна (х\у2 — у\Х2)/2. Например, можно вычесть из площади прямоугольного треугольника OBD площади прямоугольника ACDE и треугольников ABC и ОАЕ. Таким образом, мы получим АОАВ = 1 х\ У\ Х2 2/2 Имея формулы для решения системы двух уравнений с двумя неизвестными, мы можем решать и некоторые другие системы. Рассмотрим, например, однородную систему линейных уравнений с тремя неизвестными: а\\х\ + а\2Х2 + «13^3 = О, а2\Х\ + CL22X2 + «23^3 = 0. (2.5) Е D Рис. 2.1. Треугольник Нас интересует ненулевое решение этой системы, в котором, следовательно, хоть одно из Xi не равно нулю. Пусть, например, #з Ф 0. Разделив обе части на — х<$ и положив —x\jxz — у\, —X2/X3 — у2, мы запишем систему (2.5) в виде «112/1 +а\2У2 = «13> «21 У\ + «222/2 = «23, который относится уже к рассмотренному типу. Если мулы (2.4) дают выражения «11 «12 «21 «22 Ф 0, то фор- У\ = Х\_ «13 «12 «23 «22 «11 «12 «21 «22 У2 Х2 £3 «11 «13 «21 «23 «11 «12 «21 «22 Не удивительно, что мы определили из системы (2.5) не х\,Х2 и хз, а только их отношения: из однородности системы легко следует, что если (с\,С2,сз) —
42 Гл. 2. Матрицы и определители решение и р — любое число, то (рс\,рс2,рсз) тоже будет решением. Поэтому мы можем положить Х\ = «13 «12 «23 «22 Х2 «И «13 «21 «23 Хз «11 «12 «21 «22 (2.6) и сказать, что любое решение получается из этого умножением всех Х{ на некоторое число р. Для того, чтобы придать ответу несколько более симметричный вид, заметим, что всегда Это очень легко проверить с помощью формулы (2.3). Поэтому (2.6) можно записать в виде хх = «12 «13 «22 «23 Х2 = - «И «13 «21 «23 ХЗ = «11 «12 «21 «22 (2.7) Формулы (2.7) дают значения для х\,Х2,хз, если из матрицы системы (2.5) вычеркнуть поочередно первый, второй и третий столбец, а потом взять получающиеся определители 2-го порядка с чередующимися знаками. Напомним, что эти формулы были выведены нами в предположении, что и 12 \ф 0. Нетрудно проверить, что доказанное утверждение верно, если хотя бы один из трех входящих в (2.7) определителей не равен нулю. Если все три определителя равны нулю, то, конечно, формулы (2.7) опять дают решение, именно нулевое, но теперь мы уже не можем утверждать, что все решения получаются из этого умножением на число (да это и не верно). Перейдем теперь к случаю системы трех уравнений с тремя неизвестными: а\\х\ + а\2Х2 + «13^3 = Ь\ СЬ2\Х\ + а22#2 + «23^3 = &2 аз l^i + аз2^2 + «зз^з = Ьз- Мы хотим опять исключить из этой системы Х2 и хз, чтобы получить значение для х\. Для этого умножим первое уравнение на с\, второе — на С2, третье — на сз и сложим их. Мы подберем с\,С2 и сз так, чтобы в получающемся уравнении члены с Х2 и хз обратились в 0. Приравнивая к 0 соответствующие коэффициенты, мы получим для с\,С2 и сз следующую систему уравнений: «12^1 + «22^2 + «32^3 = О «13^1 + «23^2 + «33^3 = 0. Эта система относится к тому же типу, что и (2.5). Поэтому мы можем воспользоваться выведенной формулой (2.6) и взять с\ «22 «32 «23 «33 С2 = ~ «12 «32 «13 «33 сз «12 «22 «13 «23
2.1. Определители второго и третьего порядков 43 В результате получим для х\ уравнение «и «22 «32 «23 «33 -«21 «12 «32 «13 «33 + «31 «12 «13 «22 «23 «22 «23 «32 «33 -ь2 XI = «12 «32 «13 «33 + Ь3 «12 «13 «22 «23 (2.8) Коэффициент, стоящий в (2.8) при х\, называется определителем матрицы и обозначается (ац а\2 «13^ «21 «22 «23 ^«31 «32 «ЗЗУ «11 «12 «13 «21 «22 «23 «31 «32 «33 Таким образом, по определению «И «12 «13 «21 «22 «23 «31 «32 «33 = ап «22 «23 «32 «33 -«21 «12 «13 «32 «33 + «31 «12 «13 «22 «23 (2.9) Легко заметить, что правая часть в равенстве (2.8) получается из коэффициента при х\ заменой ац на Ь$, i = 1,2,3. Поэтому равенство (2.8) можно записать в виде 'Ь\ «12 «13 &2 «22 «23 Ьз «32 «зз Предположим, что коэффициент при х\, т. е. определитель (2.9), отличен от нуля. Тогда \Ь\ «12 «13| &2 «22 «23 т «32 «331 «11 «21 «31 «12 «22 «32 «13 «23 «33 Xi = XI = «11 «12 «13 «21 «22 «23 «31 «32 «33 Легко провести те же вычисления для Х2 и жз. Мы получим (Ьл «11 «12 «21 Г о Х2 = Т-11 — «11 «12 «13 «21 «22 «23 «31 «32 «33 Аналогично тому, как определители 2-го определители 3-го порядка входят в некоторые объем тетраэдра с вершинами в точках О (начале (2.10) |«п h «21 Ь2 |«31 &3 «13 «23 «33 Т.о =
44 Гл. 2. Матрицы и определители ординатами (жьуь^), (#2> 2/2*^2), (^з»Уз»^з) соответственно (см. рис. 2.2), равен х{ ух z\ Х2 У2 *>2 ^3 УЗ *3 Рис. 2.2. Тетраэдр Это показывает, что введенное нами понятие определителя встречается в различных задачах математики. Вернемся к вопросу о решении системы п линейных уравнений с п неизвестными. Очевидно, что мы можем применить те же рассуждения к системе, состоящей из четырех линейных уравнений с четырьмя неизвестными. Для этого нам нужно сначала вывести формулы, аналогичные (2.7), для решения однородной системы трех уравнений с четырьмя неизвестными, исходя из формулы (2.9). Потом в системе четырех уравнений с четырьмя неизвестными исключить Х2,хз,Х4, умножая уравнения на множители сьС2,сз,С4 и складывая. Множители С1,С2,сз,С4 будут удовлетворять однородной системе из трех уравнений, которую мы сможем решить. Это нам даст однозначно разрешимые линейные уравнения на неизвестные х\,...,х\. Коэффициент при неизвестных (как и в предыдущих случаях двух и трех переменных, он оказывается одним и тем же для всех неизвестных) мы назовем определителем четвертого порядка. Разрешая полученные линейные уравнения, придем к формулам, выражающим значения неизвестных х\,...,Х4, аналогичным формуле (2.10). Так можно последовательно искать решения систем с неограниченно увеличивающимся числом уравнений и таким же числом неизвестных. Для того, чтобы указать формулу для решения системы п уравнений с п неизвестными, нам надо будет ввести понятие определителя квадратной матрицы fa\\ a\2 ••• а\п\ а>2\ 0,22 ••• а>2п \а>п\ &п2 (2.11) J порядка п или, короче, определителя п-го порядка. Предшествующие рассуждения подсказывают мысль дать это определение по индукции: для п = 1 считать, что определитель матрицы (ац) равен числу а\\ и, предполагая, что определитель порядка п — 1 уже определен, ввести понятие определителя порядка п. Формулы (2.3) и (2.9) подсказывают, как это сделать. В обеих формулах определитель п-го (т. е. 2-го и 3-го) порядка выражался в виде алгебраической суммы произведений элементов первого столбца матрицы (2.11) (т.е. элементов ац,а2ь... ,ani) Ha определители (n-l)-ro порядка. Определитель (п— 1)-го порядка, на который умножался каждый элемент первого столбца, получается вычеркиванием из исходной матрицы первого
2.2. Определители произвольного порядка 45 столбца и той строки, в которой расположен данный элемент. При этом все п произведений брались с чередующимися знаками. Мы дадим общее определение определителя n-го порядка в следующем параграфе. Все предшествующие рассуждения были приведены только для того, чтобы сделать понятным это определение. Формулы, выведенные в этом параграфе, не будут дальше использоваться. Наоборот, они сами получатся как частный случай формул, которые будут доказаны для определителей произвольных порядков. § 2.2. Определители произвольного порядка Определитель квадратной матрицы n-го порядка А = а>21 а\2 а>22 «In G2- \ \ап\ ап2 - - • апп/ — это число, сопоставляемое этой матрице. Оно определяется индукцией по п. При п = 1 определителем матрицы (ац) считается число ац. Предположим, что мы можем найти определитель любой матрицы (п — 1)-го порядка. Определителем матрицы А называется выражение |А| = anDi - a2iD2 + a3lD3 - a4lD4 + • • • + (-l)n+1a„i£>n, (2.12) где Dk — определитель матрицы {п — 1)-го порядка, получающейся из матрицы А вычеркиванием первого столбца и fc-й строки. (Проверьте, что при п = 2 и п = 3 мы приходим к тем же формулам для определителей 2-го и 3-го порядка, которые были выведены в предыдущем параграфе.) Введем еще несколько полезных обозначений и терминов. Определитель матрицы А обозначается через ац а\2 ••• а\п CL2\ CL22 '" CL2n Q"n\ &п2 ' * " &ПП или, более коротко, через \А\. Если в матрице А вычеркнуть г-ю строку и j-й столбец, а порядок остальных элементов оставить прежним, то получится квадратная матрица (п — 1)-го порядка. Ее определитель обозначается через Mij и называется минором матрицы А, а более точно — минором, соответствующим элементу ац. В этих обозначениях формулу (2.12) можно записать в виде \А\ = аиМп - a2iM21 + a3lM3l - • • • + (-l)n+lanlMnl. (2.13) Словами она выражается так: определитель квадратной матрицы n-го порядка равен алгебраической сумме произведений элементов первого столбца на соответствующие миноры, причем произведения берутся с чередующимися знаками, начиная с плюса.
46 Гл. 2. Матрицы и определители П р и м е р 2.1. Если у квадратной матрицы А порядка п все элементы первого столбца, кроме элемента, стоящего в первой строке, равны нулю, т. е. А = /а\\ oi2 ••• а\п\ О а22 ••• а2п V 0 ап2 aTi г) то в формуле (2.13) все слагаемые, кроме первого, равны нулю. Формула (2.13) дает тогда равенство |A|=on|A'|, (2.14) где матрица ^22 а>2п А' = \0"п2 ' ' ' 0"пп/ имеет порядок п — 1. У соотношения (2.14) есть полезное обобщение, которое мы сейчас докажем. Теорема 2.1. Для определителя квадратной матрицы А порядка п + т, у которой на пересечении первых п столбцов и последних т строк стоят нули, имеет место формула: \А\ = «и аП1 О О «In Q"nn 0 0 «ln+1 • ann+l Ьп • bm\ • &\п+т Q"nn-\-m Umm — а\\ <*>п\ а\п Ьп Ь\Т . (2.15) Доказательство. Мы опять воспользуемся определением, т.е. формулой (2.13), для определителя порядка n + m, а также индукцией по числу п. В нашем случае последние га слагаемых в формуле (2.13) равны нулю, так что она дает \А\ = аиМп - а2{М21 + а31М31 - • - • + {-\)п+1апХ~Мп1. (2.16) Здесь, очевидно, Мц являются определителями матриц такого же вида, как и А, но порядка п — 1 + га. Поэтому мы можем предполагать для них теорему верной, т. е. написать \Ьц ••• Ъ\т \Мц\=Мц >т\ (2.17) где Мц имеет тот же смысл, что и в формуле (2.13) для определителя |А|. Подставляя выражения (2.17) в формулу (2.16) и воспользовавшись формулой (2.13) для \А\, мы и получим соотношение (2.15). Теорема доказана.
2.2. Определители произвольного порядка 47 Замечание. Естественно спросить, почему в данном нами определении особую роль играет первый столбец и что за выражение мы получили бы, применив то же определение не к первому, а ко второму, третьему и т.д. столбцу. Мы увидим дальше, что таким образом получится выражение, отличающееся от определителя, самое большее, знаком. Теперь приступим к выводу основных свойств определителей. Дальше мы увидим, что в теории определителей, также как в теории систем линейных уравнений, большую роль играют элементарные преобразования. Заметим, что элементарные преобразования как типа I, так и типа II можно применять к строкам матрицы совершенно независимо от того, является ли она матрицей какой-то системы уравнений. Теорема 1.6 показывает, что любая матрица элементарными преобразованиями приводится к ступенчатому и к треугольному виду. Поэтому нам будет полезно выяснить, как элементарные преобразования строк матрицы влияют на ее определитель. В связи с этим мы введем специальные обозначения для строк матрицы А: обозначим через щ ее г-ю строку, г — 1,...,п. Таким образом, Дальше мы докажем несколько важных свойств определителей. Свойства 1, 2 и 3 будем доказывать индукцией по порядку п определителя. Для п = 1 (или, в свойстве 2, для п = 2) эти свойства очевидны, и мы пропустим проверку. Мы можем, следовательно, предполагать в доказательстве, что для определителей порядка п — 1 эти свойства верны. Согласно определению (2.13), определитель является функцией, которая сопоставляет матрице А некоторое число \А\. Мы предположим теперь, что все строки матрицы А, кроме одной — скажем, г-й, — зафиксированы, и выясним, как определитель зависит от элементов г-й строки щ. Свойство 1. Определитель матрицы является линейной функцией элементов любой строки этой матрицы. Доказательство. Предположим, мы хотим доказать это свойство для г-й строки матрицы А. Воспользуемся формулой (2.13) и покажем, что каждое слагаемое в ней является линейной функцией элементов г-й строки. Для этого достаточно подобрать такие числа d\j,d2j,... ,dnj, что ±CLj\Mji = dijCLn + 6?2jaz2 H Ь dnj(Lin для всех j = 1,2,... , п (см. определение линейной функции на с. 20). Начнем с слагаемого ±ацМц. Так как минор Мц не зависит от элементов г-й строки — при его вычислении г-я строка вычеркивается, то это просто число. Положим du = ±Мц и с?2г = с?3г = * * * = dni = 0- Тогда первое слагаемое представляется в требуемом виде и действительно является линейной функцией от г-ой строки матрицы А. Для слагаемого ±aj\Mj\, когда j ф г, элемент а^\ не входит в г-ю строку, но все элементы г-й строки матрицы А, кроме ац, входят в какую-то строку минора Mj\. Поэтому по индуктивному предположению
48 Гл. 2. Матрицы и определители Mj\ является линейной функцией этих элементов, т.е. Mji = d'2jai2 H Ь d!njain при некоторых числах dL»... ,d'-. Обозначив d2j = ajid^j, ..., dnj — aj\dfn- и d\j = О, мы убедимся, что aj\Mj\ является линейной функцией г-й строки матрицы А, а значит, это верно и для функции ±aj\Mj\. Таким образом, |А| является суммой линейных функций элементов г-й строки и, следовательно, сама является линейной функцией (см. стр. 22). Следствие. Если применить теорему 1.1 к определителю, как функции г-й строки, то мы получим такие утверждения: 1. При умножении всех элементов г-й строки матрицы А на число р ее определитель \А\ умножается на то же число. 2. Если все элементы г-й строки матрицы А имеют вид а^ — bj + Cj, то ее определитель \А\ равен сумме двух определителей, в каждом из которых все элементы, кроме элементов г-й строки, те же, что и в исходном, в г-й строке первого определителя вместо элементов Oij стоят числа bj, а в г-й строке второго — числа Cj. Свойство 2. При перестановке двух соседних строк определитель меняет знак. Доказательство. Будем опять исходить из формулы (2.13). Предположим, что мы поменяли местами строки с номерами j и j + 1. Рассмотрим сначала член ацМц, где г ф j и г ф j + 1. Тогда перестановка j-й и (j + 1)-й строк не затронет элемента ац. Что касается минора Мц, то в него входят элементы и j-й, и (j + 1)-й строки исходной матрицы (кроме первых элементов строк), причем они заполняют в нем опять две соседние строки. Поэтому при их перестановке по индуктивному предположению минор Мц изменит знак. Итак, любой член ацМц агф j к 1ф j +\ меняет знак при перестановке j-u и (j + 1)-й строк. Оставшиеся члены имеют вид (-1)''+1аяМл + (-\y+2aj+nMj+u = {-\)j+\ajXMjX - aj+nMj+n). (2.18) При перестановке j-й и (j + 1)-й строк члены aj\Mj\ и а^цМ^ц, очевидно, поменяются местами, а значит, все выражение (2.18) изменит знак. Это доказывает свойство 2. В дальнейшем изложении важную роль будет играть квадратная матрица (2.19) Е /1 0 ••• 0\ 0 1 ••• 0 \0 0 ••• 1/ у которой все элементы на главной диагонали равны 1, а все остальные — нулю. Такая матрица Е называется единичной. Разумеется, для каждого натурального числа п имеется своя единичная матрица порядка п, и когда хотят указать этот порядок в явном виде, часто обозначают ее как Еп.
2.2. Определители произвольного порядка 49 Свойство 3. Определитель единичной матрицы любого порядка равен 1. Доказательство. В формуле (2.13) ац = О, если i^l иац = 1. Поэтому \Е\ = М\\. Определитель М\\ имеет то же строение, что и \Е\, но его порядок равен п— 1. По индуктивному предположению мы можем считать, что М\\ — 1, а значит, |£"| = 1. При выводе свойств 1, 2 и 3 нам необходимо было использовать определение (2.13). Теперь мы докажем ряд свойств определителя, которые уже формально вытекают из первых трех его свойств. Свойство 4. Если все элементы некоторой строки равны 0, то определитель равен 0. Доказательство. Пусть ац = а# = • • • = din = 0. Мы можем положить &ik — pbik, где р = 0, bik ф 0, к = 1,... ,п, и применить первое утверждение следствия свойства 1. Мы получим, что \А\ = р\А'\, где \А'\ — некоторый другой определитель и число р = 0. Значит, \А\ = 0. Свойство 5. Если переставить любые две (а не только соседние) строки определителя, то он изменит знак. Доказательство. Переставим г-ю и j-ю строки, причем г < j. Того же результата можно добиться, переставляя несколько раз соседние строки. Именно, переставим сначала г-ю и (г+1)-ю строку, потом (г + 1)-ю и (г + 2)-ю и т.д., пока не поставим г-ю строку рядом с j-й, на (j — l)-e место. Мы совершим j — г — 1 перестановок соседних строк. После этого мы переставим (j — 1)-ю и j-ю строки, увеличив, таким образом, число сделанных перестановок до j — г. Потом переставим j-ю строку опять со всеми соседними, чтобы она заняла г-е место. В результате мы поменяем местами г-ю и j-ю строки, а порядок остальных строк останется неизменным. В ходе рассуждения мы меняли местами соседние строки (г — j — 1) + 1 + (г — j — 1) = 2(г — j — 1) + 1 раз. Это нечетное число. Так как, согласно свойству 2, при каждой перестановке соседних строк знак определителя менялся на противоположный, то в результате всех перестановок он тоже изменится. Свойство 5 можно выразить и так: при элементарном преобразовании типа I над строками определитель меняет знак. Свойство 6. Если в определителе |А| две строки равны, то он равен нулю. Доказательство. Поменяем в \А\ местами две равные строки. Очевидно, он от этого не изменится. Но с другой стороны, согласно свойству 5, он изменит знак. Таким образом, \А\ = —\А\, т.е. 2\А\ = 0 и, значит, \А\ = 0. Свойство 7. Определитель не меняется, если над его строками произвести элементарное преобразование типа И. Доказательство. Пусть после прибавления к г-й строке определителя \А\ его j-й строки, умноженной на число с, получится определитель \А'\. Его г-я строка есть сумма двух строк, и согласно второму утверждению следствия свойства 1, мы имеем равенство \Af\ — D\ + Z?2> где D\ = \A\. Что касается определителя £>2, то он отличается от |А| тем, что на месте г-й строки
50 Гл. 2. Матрицы и определители стоит j-я строка, умноженная на с. Множитель с можно вынести за знак определителя, ввиду первого утверждения следствия свойства 1. После этого получится определитель, у которого г-я и j-я строки равны. Но по свойству 6, такой определитель равен нулю. Значит, D^ = 0 и \А!\ = \А\. Заметим, что доказанные свойства дают возможность весьма просто вычислить определитель n-го порядка. Для этого нужно элементарными преобразованиями привести матрицу А к верхнетреугольному виду: А = /ац а\2 '" а\п\ 0 CL22 • • • «2? V о о 0"пп/ Предположим, что в процессе приведения мы совершили t элементарных преобразований типа I и какое-то количество преобразований типа II. Так как ни одно из преобразований типа_П не меняет определителя, а преобразование типа I умножает его на —1, то \А\ = (—1)Ь\А\. Покажем, что \А\ = аца22 ••• аГ{ (2.20) Тогда \А\ = (-1)*ацо22 •" ап (2.21) Это и есть формула для вычисления \А\. Докажем формулу (2.20) индукцией по п. Так как в матрице А все элементы первого столбца, кроме ац, равны нулю, то, согласно формуле (2.14), мы имеем равенство \А\ = ап\А (2.22) в котором определитель \А'\ = «22 «23 * 0 а3з • 0 0 «2п «Зп имеет структуру, аналогичную определителю \А\. По индуктивному предположению для него выполнено равенство \А | = а22 азз • • • Опп- Подставляя это выражение в (2.22), мы и получим формулу (2.20) для \А\.
2.3. Характеристика определителя его свойствами 51 Доказанные нами свойства определителя дают возможность получить одну важную теорему о линейных уравнениях. Теорема 2.2. Система п уравнений с п неизвестными имеет единственное решение тогда и только тогда, когда определитель матрицы этой системы отличен от нуля. Доказательство. Приведем систему к треугольному виду: ( а\\Х\ +а\2Х2 + +~а\п%п = &ь «22^2 + + ЩпХп = &2> < Согласно следствию из теоремы 1.8, система тогда и только тогда имеет единственное решение, когда Sn^O, a227^0, ..., апп^0. (2.23) С другой стороны, определитель матрицы системы равен ац022 • • • апП1 и следовательно, он отличен от нуля тогда и только тогда, когда выполнено условие (2.23). Следствие. Однородная система п уравнений с п неизвестными имеет ненулевое решение тогда и только тогда, когда определитель матрицы этой системы равен нулю. Следствие очевидным образом вытекает из теоремы, так как система однородных уравнений всегда имеет хотя бы одно решение — нулевое. Определение. Квадратная матрица, определитель которой отличен от нуля, называется невырожденной. И наоборот, матрица, определитель которой равен нулю, называется вырожденной. В § 2.1 мы интерпретировали определитель второго порядка как площадь треугольника, а определитель третьего порядка — как объем тетраэдра (с соответствующими коэффициентами). Очевидно, что площадь треугольника обращается в нуль, только если он вырождается в отрезок, а объем тетраэдра равен нулю, только когда тетраэдр вырождается в плоскую фигуру. Приведенные примеры дают некоторое представление о геометрическом смысле вырожденности матрицы. Смысл вырожденности станет более ясен в § 2.10, где будет введено понятие обратной матрицы, и главное, в последующих главах, где рассматриваются линейные преобразования векторных пространств. § 2.3. Характеристика определителя его свойствами В предыдущем параграфе мы видели, что определитель — это функция, сопоставляющая каждой квадратной матрице некоторое число, и доказали два важных свойства определителя:
52 Гл. 2. Матрицы и определители 1) определитель является линейной функцией от элементов каждой строки; 2) при перестановке двух строк определитель меняет знак. Докажем, что определитель по существу полностью характеризуется этими свойствами, что формулируется в следующей теореме. Теорема 2.3. Пусть F(A) — функция, сопоставляющая каждой квадратной матрице А порядка п некоторое число. Если эта функция обладает свойствами 1) и 2), то существует такое число к, что F(A) = k\A\. (2.24) При этом число к = F(E), где Е — единичная матрица. Доказательство. Прежде всего заметим, что из свойств 1) и 2) следует, что функция F(A) не меняется, если над матрицей А произвести элементарное преобразование типа II, и меняет знак, если над ней произвести элементарное преобразование типа I. Это доказывается, исходя из свойств 1) и 2), дословно так же, как и соответствующие свойства определителей (свойства 5 и 7 из § 2.2). Приведем матрицу А при помощи элементарных преобразований к ступенчатому виду. Получившуюся матрицу мы запишем в виде /ац а\2 ••• а\п\ О <*22 ••• 0>2п (2.25) \ О 0 • •• апп/ где, однако, теперь не утверждается, что ац Ф 0, ...,апп ф 0. Такая запись всегда возможна, так как у квадратной матрицы ступенчатого вида все элементы ац с г > j, т. е. расположенные под главной диагональю, равны нулю. _ Предположим, что при переходе от А к А мы сделали t элементарных преобразований типа I, а остальные преобразования были типа И. Так как при элементарных преобразованиях типа II ни F{A), ни \А\ не меняются, а при элементарных преобразованиях типа I оба выражения меняют знак, то |А| = (-1)*|А|, F(A) = (-lYF(A). (2.26) Для того, чтобы доказать формулу_(2.24) в общем случае, нам достаточно теперь проверить ее для матрицы А вида (2.25), т.е. установить равенство F(A) = k\A\, которое, в свою очередь, очевидно следует из соотношений \Л\ = ац а22 • • • апп, F(A) = F{E) • ац а22 • • • апп. (2.27) Заметим, что первое из них — это в точности равенство (2.20), выведенное в предыдущем параграфе. Кроме того, оно является следствием второго, так как определитель \А\, как мы доказали, тоже является функцией типа F(A), обладающей свойствами 1) и 2) и, следовательно, доказав второе равенство в (2.27) для любой функции F(A), обладающей данными свойствами, мы тем самым установим его еще раз для определителя.
2.4. Разложение определителя по столбцу 53 Итак, нам остается только доказать второе равенство в (2.27). Ввиду свойства 1) мы можем вынести из F(A) сомножитель апп: F(A) ■F О VVо о ••• 1 у/ Теперь прибавим к 1-й, 2-й, ..., (п— 1)-й строке последнюю строку, умноженную на число —а\п, —а2п> ••• > —йп-ы соответственно. При этом все элементы, кроме элементов последнего столбца, не изменятся, а все элементы последнего столбца станут равными нулю, за исключением n-го, который останется равным 1. Затем подвергнем аналогичным преобразованиям матрицу меньшего размера с элементами, расположенными на пересечении первых п — 1 строк и столбцов, и т. д. Каждый раз число ац выносится из F, и рассуждения повторяются. Проделав это п раз, мы получим, что I (\ ° •'• °\\ F(A) = ann--au-F О 1 О \\о о ... \)) т.е. второе равенство в (2.27). § 2.4. Разложение определителя по столбцу На основании теоремы 2.3 мы можем ответить на вопрос, который возник еще в § 2.2: играет ли первый столбец особую роль в формулах (2.12) и (2.13) для определителя n-го порядка? Для того, чтобы ответить на него, составим выражение, аналогичное (2.13), но взяв вместо первого столбца j-й столбец. Иначе говоря, рассмотрим функцию F(A) = aXjMXj - a2jM2j + • ■ • + (-l)n+lanjMnj. (2.28) Очевидно, что эта функция ставит в соответствие каждой матрице А порядка п определенное число. Проверим, что она удовлетворяет условиям 1) и 2) из предыдущего параграфа. Для этого надо просто еще раз просмотреть доказательства свойств определителя из § 2.2 и убедиться, что мы ни в одном месте не пользовались тем, что умножали элементы именно первого столбца на их миноры. Другими словами, доказательства этих свойств дословно сохраняются для функции F(A). Согласно теореме 2.3, F(A) = k\A\, и нам остается только определить число к по формуле к = F(E). Для матрицы Е все элементы ау = 0, если г ф j, a элементы cljj = 1. Поэтому формула (2.28) сводится к равенству: F(a) = ±Mjj. Так как в формуле (2.28) знаки чередуются, то член cljjMjj входит в нее со знаком (—I)-7"1"1. Очевидно, что Mjj — определитель единичной матрицы Е порядка п— 1, поэтому Mjj = 1. В результате мы получаем, что к = (—1)J"+1 и, значит, aijMij - a2jM2j + ••• + (-!) 71+1 anjMnj = (-iy+l\A\.
54 Гл. 2. Матрицы и определители Перенесем множитель (—1)J+1 в левую часть: \А\ = (-1)'+1ауМу + (-iy+2a2jM2j + - - - + {-\)^nanjMnj. (2.29) Мы видим, что элемент ац умножается на выражение (— l)*+J"My, которое называется его алгебраическим дополнением и обозначается через А^. Таким образом, нами получен следующий результат: Теорема 2.4. Определитель матрицы А равен сумме произведений всех элементов любого ее столбца на их алгебраические дополнения: \А\ = a\jA\j + a2jA2j H Ь anjAnj. (2.30) В этом утверждении все столбцы играют уже одинаковую роль. Для первого столбца оно превращается в определение определителя. Формулы (2.29) и (2.30) называются разложением определителя по j-му столбцу. В качестве приложения теоремы 2.4 мы можем получить целую серию новых свойств определителей. Теорема 2.5. Свойства 1-7 и все следствия из них имеют место не только для строк, но и для столбцов определителей. Доказательство. Из формулы (2.30) следует, что определитель является линейной функцией элементов j-ro столбца при j = 1,...,п. Следовательно, свойство 1 имеет место для столбцов. Свойство 2 докажем индукцией по порядку п определителя. При п = 1 оно бессодержательно, при п = 2 может быть проверено при помощи формулы (2.3). Пусть п > 2. Предположим, что мы переставили столбцы с номерами к и к + 1. Воспользуемся формулой (2.30) при j ф к, к+ 1. Тогда в каждый минор Mij (г = 1,...,га) входит и fc-й, и (к + 1)-й столбец. По индуктивному предположению, при перестановке двух столбцов каждый минор изменит знак, значит, и весь определитель изменит знак, что доказывает свойство 2 для столбцов. Заметим, что в свойстве 3 речь вообще не идет о столбцах или строках, а все остальные свойства формально вытекают из первых трех. Таким образом, свойства 1-7 и все следствия из них справедливы и для столбцов определителей. По аналогии с теоремой 2.3, из теоремы 2.5 следует, что полилинейная антисимметрическая функция столбцов матрицы также пропорциональна ее определителю. Следовательно, имеет место аналог формулы (2.24), где функция F(A) удовлетворяет свойствам 1) и 2), переформулированным для столбцов. При этом значение к, как легко видеть, остается тем же. В частности, для любого индекса г = 1,... ,п имеет место формула, аналогичная (2.30): |А| = ацАц + ai2Ai2 + ... + ainAin. (2.31) Она называется формулой разложения определителя \А\ по г-й строке. Формула разложения определителя по столбцу или строке имеет широкое обобщение, называемое теоремой Лапласа. Оно состоит в том, что имеет место аналогичное разложение определителя квадратной матрицы порядка п не по одному столбцу (или строке), а по любому их числу тот 1 до п— 1.
2.4. Разложение определителя по столбцу 55 Для этого нужно лишь определить алгебраическое дополнение не одного элемента, а минора произвольного порядка га. Теорему Лапласа можно было бы доказать, например, индукцией по числу га, но мы не будем этого делать, а отложим ее точную формулировку и доказательство до § 10.5 (стр. 374), где она будет получена как частное следствие более общих понятий и результатов. Пример 2.2. В примере 1.1 (стр. 32) мы доказали, что задача интерполяции, т. е. поиск многочлена степени п, график которого проходит через п + 1 заданных разных точек, имеет единственное решение. Теорема 2.2 показывает, что определитель матрицы соответствующей линейной системы (1.20) отличен от нуля. Теперь мы можем явно вычислить этот определитель и еще раз проверить это свойство. Определитель матрицы системы (1.20) при г — п+ 1 имеет вид \А\ = С2 1 Сп 1 cn+i 4 ьп+1 Чг+1 (2.32) Он называется определителем Вандермонда порядка п+ 1. Покажем, что этот определитель равен произведению всех разностей а — Cj при г > j, т. е. записывается в виде формулы м = !!(«-<*)■ (2.33) i>j Докажем формулу (2.33) индукцией по числу п. При п = 1 она очевидна: 1 С! 1 С2 = с2 -сх. Для доказательства общего случая мы воспользуемся тем, что определитель не меняется при элементарных преобразованиях типа II (свойство 7 из § 2.2, причем, ввиду теоремы 2.5, это свойство верно как для столбцов, так и для строк. Последним мы и воспользуемся — вычтем из (гс+ 1)-го столбца n-й столбец, умноженный на с\, из n-го столбца — {п — 1)-й, умноженный на ci, и так далее вплоть до второго столбца, из которого вычтем первый, умноженный на с\. Согласно указанному свойству, определитель при этих
56 Гл. 2. Матрицы и определители преобразованиях не изменится, но, с другой стороны, он примет вид \А\ = О С2-С1 О с2(с2 -ci) О сГ[(с2-С1) 1 Сп-С\ Cn(Cn-Ci) 1 cn+i - a cn+i(cn+i - с\) С- l(Cn-Ci) <£+i(c*+i -ci) Воспользовавшись теоремой 2.5, применим к первой строке полученного определителя (содержащей один-единственный ненулевой элемент) аналог формулы (2.12). В результате мы получим, что |А| = С2-С1 C2(c2-Ci) сп-С{ сп{сп-с\) Сп+\ - С\ Сп+\{сп+\ - С\) сГ\с2-сх) Сп (Cn-Cl) <Й(с*+1 -с{] Применим к последнему определителю следствие свойства 1 из § 2.2 и вынесем из каждой строки ее общий множитель. Мы получим, что \А\ = \А\ = (с2 -ci)---(cn- ci)(cn+i - a) 1 с2 1 Сп 1 Cn+i Лп-1 'п+1 (2.34) Последний определитель является определителем Вандермонда порядка п, и, по предположению индукции, мы можем считать формулу (2.33) для него верной. Подставляя в (2.34) выражение (2.33) для определителя Вандермонда порядка п, мы получим искомую формулу (2.33) для определителя Вандермонда порядка п+1. Так как мы предполагаем все числа ci,...,cn+i различными, то произведение их разностей а — Cj при г > j отлично от нуля, и мы получаем новое доказательство того, что задача интерполяции имеет единственное решение. § 2.5. Правило Крамера Теперь мы можем вывести явные формулы для решения системы п уравнений с п неизвестными, ради которых мы и развили теорию определителей. Матрица А такой системы — квадратная порядка п, и мы будем предполагать, что она невырождена. Лемма. Сумма произведений элементов а^ любого (j-го) столбца определителя на алгебраические дополнения А^ соответствующих элементов
2.5. Правило Крамера 57 любого другого столбца равна нулю: a\jA\k + a2jA2k H h anjAnk = О при к ф j. Доказательство. Заменим к-й столбец в нашем определителе \А\ его же j-м столбцом. В результате этого мы получим определитель \А'\, который, согласно свойству 6 из § 2.2, переформулированному для столбцов, равен нулю. С другой стороны, разложим определитель \А'\ по fc-му столбцу. Так как при образовании алгебраических дополнений этого столбца элементы fc-ro столбца вычеркиваются, то мы получим те же самые алгебраические дополнения А{к, что и в нашем исходном определителе \А\. Таким образом, имеем \А!\ — a\jA\k + a2jA2k H Ь anjAnk = О, что и требовалось доказать. Теорема 2.6 (правило Крамера). Если определитель матрицы системы п уравнений с п неизвестными отличен от нуля, то ее решение задается формулами хк = —, к = 1,...,п, (2.35) где D — определитель матрицы системы, a Dk получается из D заменой к-го столбца столбцом свободных членов. Доказательство. Согласно теореме 2.2 мы знаем, что существует один единственный набор значений для xi,...,xn, обращающий систему ацЯ1 Н \-о,\пхп = Ь\, в тождество. Найдем значение для к-ro неизвестного хк. Для этого мы будем поступать точно так же, как и в случае систем двух и трех уравнений в § 2.1: умножим г-е уравнение на алгебраическое дополнение А{к и сложим все уравнения. После этого коэффициент при хк будет иметь вид о>\кМк Н Ь апкАпк = D. Коэффициент при Xj для j ф к будет иметь вид aljA\k + • • • + anjAnk. Это число равно нулю ввиду леммы. Наконец, в качестве свободного члена мы получим выражение Ь\А\к Н \-ЬпАпк. Но именно такое выражение мы получим, если разложим определитель Dk по fc-му столбцу. Таким образом, в результате приходим к уравнению Dxk = Dki а так как по условию D ф 0, то хк = Dk/D. Это и есть формула (2.35).
58 Гл. 2. Матрицы и определители § 2.6. Перестановки, симметрические и антисимметрические функции Детальное изучение свойств определителей приводит к некоторым важным общематематическим понятиям, которые относятся к произвольным конечным множествам, так что, собственно говоря, их можно было бы изложить и раньше. Напомним, что в § 1.1 мы изучали линейные функции как функции от строк длины п. В § 2.2 определитель рассматривался как функция квадратной матрицы. Если же мы интересуемся зависимостью определителя от строк этой матрицы, то его можно считать функцией от ее п строк: \А\ = F(ai,a2,... ,ап), где для матрицы /an а\2 ••• а\п\ I «21 «22 * * * «2п \ап\ «п2 * * * &пп/ мы обозначили через щ ее г-ю строку: Здесь мы сталкиваемся с понятием функции F(a\, a<i,..., ап) от п элементов множества М как правилом сопоставления любым п элементам из М, взятым в определенном порядке, некоторого элемента другого множества N. Таким образом, F является отображением Мп —>• N (стр. 13). В нашем случае М — это множество всех строк фиксированной длины п, а N — множество всех чисел. Введем необходимые для дальнейшего обозначения. Пусть М — некоторое конечное множество, состоящее из п элементов ai,a2,... ,an. Определение. Функция от п элементов множества М называется симметрической, если она не меняется при любой перестановке аргументов. Перенумеровав эти п элементов множества М индексами 1,2, ...,п, мы можем считать, что расположили их в определенном порядке (порядке возрастания значений индексов). Перестановка их может рассматриваться как расположение в другом порядке, который мы будем записывать следующим образом. Пусть j\,J2,-~,3n ~~ это те ж^ числа 1,2, ...,п, только, быть может, расположенные в другом порядке. В этом случае мы будем говорить, что Ui>h>--->3n) — перестановка чисел (1,2,... ,п). Аналогично, мы будем говорить, что icLjl9aj2,...,ajn) — это перестановка элементов (ai,a2,... ,an). Таким образом, определение симметрической функции может быть записано как равенство F(ajx, a,j2,..., ajn) = F(a\, a2,..., an) (2.36) для всех перестановок (ji,J2>--->Jn) чисел (1,2, ...,n).
2.6. Перестановки, симметрические и антисимметрические функции 59 Для того, чтобы выяснить, является ли функция симметрической, не обязательно проверять равенство (2.36) для всех перестановок (J\, J2,..., jn), а можно ограничиться некоторыми, наиболее простыми. Определение. Перестановка двух элементов из набора (а\,а,2,• •, ап) называется транспозицией. Транспозицию, при которой переставляются г-й и j-й элементы (т. е. щ и a,j), будем обозначать через т^. Очевидно, всегда можно считать г < j. Верен следующий простой факт о произвольных перестановках. Теорема 2.7. Из любого расположения (гьгг,... ,гта) различных натуральных чисел, каждое из которых заключено между 1 и п, можно получить произвольную перестановку (j\,J2>--->jn), произведя несколько транспозиций. Доказательство. Будем использовать индукцию по п. При п = 1 утверждение теоремы тавтологично: существует только одна перестановка, и никаких транспозиций производить не нужно. В общем случае (п > 1) предположим, что j\ стоит в перестановке {i\,i2, ••• An) на fc-ом месте, т.е. 2\ — ik- Совершим в этой перестановке транспозицию т\^- Если j\ = i\, то никакой транспозиции совершать не надо. Мы получим перестановку (л »*2» ••• »*ь ••■ »*п)» гДе 3\ стоит на первом, a i\ — на fc-м месте. Теперь нам нужно с помощью транспозиций получить из перестановки 0'ьг2,...,гь...,гп) вторую, заданную в условии перестановку (JuJ2,>-Jn)- Если мы вычеркнем из обеих j\, то останутся перестановки чисел а, таких, что 1 ^ а ^ п и а ф j\. К этим двум перестановкам, содержащим уже только п — 1 чисел, мы можем применить предположение индукции и получить из первой — вторую. Начиная с транспозиции т\^ мы можем таким образом получить из перестановки (гьг2,...,гп) перестановку (ji,J2>---,jn)- В некоторых случаях нам не нужно применять транспозицию (например, если j\ =ii). Может встретиться крайний случай, когда транспозицию не надо будет применять ни разу. Легко видеть, что это будет только при i\ = ji, ^2 — J2> •••> in = jn- Утверждение теоремы справедливо и в этом случае, но множество применяемых при этом транспозиций пусто. Это очень простое рассуждение можно иллюстрировать так. Предположим, что на концерте в первом ряду расселись приглашенные гости, но не в таком порядке, как это указано в списке у администратора. Как ему восстановить нужный порядок? Очевидно, он найдет гостя, который должен сидеть на первом месте и попросит его поменяться местами с тем, кто на это место сел. Потом он будет так же поступать с гостями, которые должны занимать второе, третье и т.д. место, и под конец добьется нужного ему порядка. Из теоремы 2.7 следует, что в определении симметрической функции достаточно проверить равенство (2.36) для перестановок, получающихся из (1,2,... ,п) транспозицией, то есть проверить, что F(a\,..., аь ..., а,-,..., ап) = F(a\,..., a,j,..., щ,..., ап)
60 Гл. 2. Матрицы и определители для любых ai,... ,an, г и j. Действительно, если это свойство выполнено, то, последовательно применяя к аргументам функции F(ai,... ,an) различные транспозиции, мы будем все время получать равную функцию, а на основании теоремы 2.7 в конце концов можем получить функцию F(cljx, ... , aJn). Например, при п = 3 мы имеем три транспозиции: т^тг.з и г1,з- Для функции jP(ai,a2,a3) = aia2 + aia3 + a2a3> например, при транспозиции т\$ член aia2 не изменится, а два других поменяются местами. Так же обстоит дело и с другими транспозициями. Поэтому наша функция — симметрическая. Теперь мы рассмотрим класс функций, в некотором смысле противоположных симметрическим. Определение. Функция от п элементов множества М называется антисимметрической, если при любой транспозиции элементов она меняет знак на противоположный. Иначе говоря, F{a\,..., щ,..., a,j,..., ап) = —F(a\,..., a,j,..., a*,..., ап) для любых а\,..., an, г и j. Понятия симметрической и антисимметрической функции играют очень большую роль в математике и математической физике. Например, в квантовой механике состояние некоторой физической величины в системе, состоящей из п (обычно очень большого числа) элементарных частиц pi,...,pn одного и того же типа, описывается так называемой волновой функцией ф(р\,... ,рп), зависящей от этих частиц и принимающей комплексные значения. В некотором смысле «общий случай» состоит в том, что волновая функция или симметрическая, или антисимметрическая — а какая именно из этих двух возможностей реализуется, зависит только от типа частиц: фотоны, электроны и т.д. Если волновая функция является симметрической, то частицы называются бозонами, и в этом случае говорят, что рассматриваемая кванто- во-механическая система подчиняется статистике Бозе-Эйнштейна. Если же волновая функция — антисимметрическая, то частицы называются ферми- онами, и говорят, что система подчиняется статистике Ферми-Дирака1). К обсуждению понятий симметрической и антисимметрической функции мы еще вернемся в заключительных главах этой книги. Сейчас нам нужно ответить на вопрос: как меняется антисимметрическая функция при произвольной перестановке индексов? Иначе говоря, мы хотим выразить F(a^,... ,сцп) через F(a\,... ,ап) при любой перестановке (ii,...,zn) индексов (1,...,п). Для этого снова применим теорему 2.7. Согласно этой теореме, перестановку (гь ... ,гп) можно получить из перестановки (1,... ,п) при помощи некоторого числа (скажем, к) транспозиций. Определение же антисимметрической функции сводится к тому, что при транспозиции двух аргументов она меняет знак. После к транспозиций она, таким образом, приобретает знак (— 1)к, и мы О Например, бозонами являются фотоны, а фермионами — частицы, составляющие атом: электрон, протон и нейтрон.
2.6. Перестановки, симметрические и антисимметрические функции 61_ получаем соотношение F(ail,...,aiJ = (-l)kF(al9...,an), (2.37) где набор элементов а^,...,^ множества М получен из набора ai,...,an с помощью рассматриваемой нами перестановки, состоящей из к транспозиций. Соотношение (2.37) несколько двусмысленно. А именно, в нем к обозначает число транспозиций, которые надо произвести, чтобы перейти от (1,..., п) к перестановке (ц,... ,гп). Но такой переход, вообще говоря, можно совершить различными способами, и число к нужных для этого транспозиций может оказаться различным. Например, чтобы перейти от (1,2,3) к перестановке (3,2,1), можно произвести сначала транспозицию т\$ и получить (2,1,3), затем — транспозицию Т2,з и прийти к перестановке (2,3,1), и наконец, вновь осуществив транспозицию т\д, получить искомую перестановку (3,2,1). Всего мы произвели 3 транспозиции. Но, с другой стороны, можно ограничиться одной транспозицией т\$, после которой из (1,2,3) сразу получается (3,2,1). Однако заметим, что это не противоречит равенству (2.37), так как оба числа (3 и 1) нечетны, и множитель (— 1)к в обоих случаях получается один и тот же. Покажем, что четность числа транспозиций, применяемых при переходе от одной перестановки к другой, зависит только от самих перестановок и не зависит от выбора транспозиций. Предположим, что мы имеем антисимметрическую функцию F(a\,..., an), зависящую от п элементов произвольного множества М и не равную нулю тождественно. Последнее означает, что существует такой набор aj,...,an различных элементов множества М, что F(a\,... 9ап) Ф 0. Применив к этому набору элементов перестановку (гь...,гп), мы получим набор (а^,... ,сцп), при этом значения F(a\,... ,ап) и F(a,i{,... ,щп) связаны между собой соотношением (2.37). Если мы можем получить перестановку (ii,...,zn) из (1,...,п) двумя разными способами, с помощью к и I транспозиций, то из формулы (2.37) следует равенство (— \)к = (— 1)*, так как F(a\,... ,an) ф 0, и следовательно, числа к и I имеют одинаковую четность, т. е. либо оба четные, либо оба нечетные. Но одна функция, обладающая таким свойством, нам известна — это определитель (как функция строк матрицы)! А именно, свойство 5, доказанное в § 2.2, утверждает, что он является антисимметрической функцией своих строк. Эта функция не равна нулю при некоторых ai,...,an, например, \Е\ = 1. Иными словами, для доказательства нашего утверждения нам достаточно рассмотреть определитель матрицы Е как антисимметрическую функцию п ее строк е^ — (0,..., 1,... ,0), где 1 стоит на г-м месте, а на всех остальных стоят нули, г = 1,...,п. (Эти строки в ходе рассуждения нужно переставлять, так что реально рассматриваются и определители более сложных матриц, чем Е.) Таким образом, довольно окольным путем, через свойства определителей, мы получаем следующее свойство перестановок: Теорема 2.8. При любых способах перехода от перестановки (1,... ,п) к перестановке J = (j\,... ,jn) при помощи транспозиций (что возможно, согласно теореме 2.7) четность числа транспозиций будет одна и та же.
62 Гл. 2. Матрицы и определители Итак, все перестановки делятся на два класса: одни получаются из перестановки (1,...,п) при помощи четного числа транспозиций, другие — нечетного. Перестановки первого типа называются четными, а второго — нечетными. Если для перестановки J соответствующее число транспозиций равно fc, то вводится обозначение e(J) = (-l)k. Иными словами, для четной перестановки J число e(J) = 1, а для нечетной e(J) = -l. Мы доказали непротиворечивость понятия четной и нечетной перестановки довольно обходным путем — используя свойства определителя. Собственно, нам достаточно было предъявить любую антисимметрическую функцию, отличную от нуля, и мы воспользовались тем, что она нам известна: определитель как функция строк. Можно указать и более простую функцию. Пусть М — это множество чисел, и для х\,... ,хп е М положим F(x\,...,xn) = (х2 -х\)(хг -xi)---(xn-x\)---(xn-xn-i) = Y[(xi-Xj). i>j (2.38) Проверим, что эта функция — антисимметрическая. Для этого мы воспользуемся следующим утверждением. Лемма. Любая транспозиция может быть получена как результат нечетного числа транспозиций соседних элементов, т. е. транспозиций вида Tk,k+i- По сути, этот результат был нами уже доказан в § 2.2, когда мы выводили свойство 5 из свойства 2. Там мы не использовали термин «транспозиция», и речь шла о перестановках строк определителя. Но это, очень простое, доказательство применимо и к элементам любого множества, поэтому мы не будем еще раз его повторять. Таким образом, нам достаточно доказать, что функция (2.38) меняет знак при перестановке х\~ и Xk+\- Но при этом множители (х{ — Xj) с г ^ к, к + 1, j Ф к, к + 1 в правой части равенства вообще не меняются. Множители [х{ — Xk) и (xi — x/c+i) при г > к + 1 поменяются местами, точно так же, как (xk — Xj) и (xk+i — Xj) при j < к + 1. Остается один множитель (xk+i — Хк), который изменит знак. Очевидно также, что функция (2.38) отлична от нуля для любых различных между собой значений х\,...,хп. Мы можем теперь применить формулу (2.37) к функции, заданной соотношением (2.38), тем самым доказав теорему 2.8 и, значит, непротиворечивость понятия четности перестановки. Заметим однако, что наш «более простой» путь очень близок к тому «окольному» пути, с которого мы начали, так как формула (2.38) задает определитель Вандермонда порядка п (см. формулу (2.33) в § 2.4). Выберем числа Х{ так, что х\ < х2 < • • • < хп (например, положим xi = г). Тогда в правой части соотношения (2.38) все множители будут положительными. Теперь запишем аналогичное соотношение для F{xil,...,Xin). Так как перестановка (гь ... ,гп) ставит в соответствие числу х^ число Х{к, то из (2.37)
2.6. Перестановки, симметрические и антисимметрические функции 63 получаем F(xil9...Jxin) = Y[(xik -xit). (2.39) k>i Знак F(xil,...iXin) определяется количеством отрицательных сомножителей в правой части соотношения (2.39). Именно, F(xi{,... ,Xin) > О, если их число четно, и F(xil,...,Xin) < 0, если оно нечетно. Отрицательные сомножители (xik — Хц) получаются в том случае, когда Xik < X{v и ввиду выбора х\ < Х2 < < - - • < хп это означает, что г& < ц. Следовательно, отрицательным сомножителям (xik — Хц) соответствуют такие пары чисел к и I, что к > I и г& < ц. В этом случае говорят, что числа г& и ц в перестановке (i\,...,in) стоят в «обратном порядке», или образуют инверсию. Таким образом, перестановка является четной или нечетной в зависимости от того, четно или нечетно число инверсий в ней. Например, в перестановке (4,3,2,5,1) инверсии образуют пары (4,3), (4,2), (4,1), (3,2), (3,1), (2,1), (5,1). Их число равно 7, и значит, F(4,3,2,5,1) < 0, и перестановка (4,3,2,5,1) нечетная. Пользуясь введенными понятиями, мы можем теперь сформулировать теорему. Теорема 2.9. Определитель квадратной матрицы порядка п является единственной функцией F(ai,a2,... ,ап) от п строк длины п, которая удовлетворяет следующим условиям: а) линейна как функция произвольной строки; б) антисимметрична; в) F(e\,e2,... ,еп) = 1, где е* — строка, у которой на г-ом месте стоит 1, а на всех остальных — нули. Это самое «научное», хотя далеко не самое простое определение определителя. В этом параграфе мы не доказали ни одного нового свойства определителя, а только обсудили подробно его свойство как антисимметрической функции строк. Причина заключается в том, что свойство антисимметричности определителя связано с очень многими вопросами математики. Например, в § 2.1 мы ввели понятия определителей второго и третьего порядка. Они имеют важный геометрический смысл и выражают, соответственно, площадь и объем простейших геометрических фигур (рис. 2.1 и 2.2). Но здесь мы сталкиваемся с парадоксальным обстоятельством: иногда для площади (и объема) получается отрицательное значение. Легко видеть, что мы получаем положительное или отрицательное значение площади треугольника ОАВ (или объема тетраэдра О ABC) в зависимости от порядка его вершин А, В (или А, В, С). Точнее говоря, площадь треугольника ОАВ положительна, если мы можем получить луч О А из луча ОБ, вращая его по часовой стрелке, и эта площадь отрицательна, если вращение происходит против часовой стрелки (считая, что угол между лучами О А и О В меньше п). Таким образом, определитель выражает площадь треугольника (с коэффициентом 1/2) с заданием порядка сторон, и площадь меняет знак при изменении порядка сторон, т. е. является антисимметрической функцией. В случае объемов выбор порядка вершин, к которому мы таким образом приходим, связан с понятием ориентации пространства. То же понятие воз-
64 Гл. 2. Матрицы и определители никает и в случае п > 3, но сейчас мы не будем углубляться в эти вопросы (мы вернемся к ним в §§ 4.4 и 7.3). Скажем только, что это понятие необходимо для построения теории объемов и теории интегрирования. Собственно, понятие ориентации возникает уже и при п = 1, когда мы считаем длиной отрезка О А (где О — начало отсчета на прямой, а точка А имеет координату х) определитель первого порядка х, который будет положительным, только если А лежит справа от О. Аналогично, если точка В имеет координату у, длина отрезка АВ равна у — х и положительна, только если В правее А. Таким образом, длина отрезка зависит от порядка 9 ? 4 £ ^ его концов и меняет знак, если их поме- О 0 0 О > ^ ' нять местами (является антисимметрической Рис. 2.3. Путь функцией). Только при таком соглашении, например, длина пути ОАВС равна длине отрезка ОС (рис. 2.3). А если бы мы пользовались только положительными длинами, то получили бы для длины пути ОАВС выражение \0А\ + \АВ\ + + \ВА\ + \АС\ = \0С\ + 2\АВ\. § 2.7. Полное развертывание определителя Формула (2.12), при помощи которой мы определили в § 2.2 определитель n-го порядка, выражает его через определители меньших порядков. Предполагается, что потом это определение можно применить к ним, и так, переходя к определителям все меньших и меньших порядков, прийти к определителю первого порядка, который для матрицы (ац) равен ац. Так мы получаем выражение для определителя матрицы А /ац а\2 -" а\п\ «21 а22 * ' ' «2? через ее элементы. Это выражение довольно сложное, для вывода свойств определителей проще пользоваться данным в § 2.2 индуктивным определением. Но теперь мы достаточно подготовлены для того, чтобы найти и это довольно сложное определение. Прежде всего докажем одно вспомогательное утверждение, которое «на глаз» представляется очевидным, но все же требует доказательства (хоть и очень простого). Лемма. Если линейная функция f(x) строки х длины п записывается двумя способами f(x) = ^2 (цхи f(x) = ^2 kxi, i=\ i=l mo a\ =bua2 = b2,..-,an = bn. Доказательство. Оба равенства для f(x) должны быть верны при любых х. Положим, в частности, х — е^ = (0,..., 1,... ,0), где 1 стоит на г-ом месте (со строками е^ мы уже встречались при доказательстве теоремы 1.1).
2.7. Полное развертывание определителя 65 Тогда из первого представления мы получаем, что /(е^) = а^, а из второго, что f(ei) = bi. Поэтому сц = h для всех г, что и утверждалось. Мы будем рассматривать определитель \А\ как функцию строк а\, а2,...,ап матрицы А. Как было доказано в § 2.2, определитель является линейной функцией любой строки матрицы. Функцию от любого числа т строк одной и той же длины п называют полилинейной, если она является линейной функцией от каждой строки (при фиксированных остальных). Теорема 2.10. Полилинейная функция F{a\, а2,..., ат) выражается в виде F(aba2,...,am) = 2^ а^^-Лт ац1а2г2 • • • am*m, (2.40) если, /сак обычно, a,i = (a;i,ai2,... ,сцп), и сумма распространяется на произвольные наборы чисел (ц, г2,..., гт) из совокупности 1,2,..., п, ачА2,~Лт ~ некоторые коэффициенты, которые определяются только функцией F и не зависят от строк аь а2,..., ат. Доказательство. Используем индукцию по числу т. При т= 1 утверждение теоремы очевидно ввиду определения линейной функции. При т > 1 мы воспользуемся тем, что п F(a\, a2,..., am) = ]Р <ft(a2, • • •, am) aH (2.41) г=1 при любом заданном ai, а коэффициенты ^ зависят от a2,...,am, т.е. являются функциями от них. Проверим, что все функции щ полилинейные. Докажем, например, их линейность относительно а2. Воспользовавшись линейностью функции F(ai,a2,... ,ат) относительно а2, получим, что F(ai,a'2 + a2,...,am) = F(a\,a!2,.-. ,am) + F(ai,a2,... ,am) или n n ^^(a2 + a2,...,am)^ = ^ (</^(a2,... ,am) + (^(a2,... ,am)) ж; г=1 г=1 для Жг = ан, т.е. для любых ж$. Отсюда, согласно лемме, следует равенство (Рг(а'2 + а2,... ,ат) = <£г(а2, ••• ,am) + ^(a2, • •• ,ош). Точно так же проверяется и второе свойство линейной функции в теореме 1.1. Из этой теоремы вытекает линейность функций (pi(a2>-..,am) относительно а2 и, аналогично, их полилинейность. Теперь, по предположению индукции, мы имеем для каждой из них выражение Щ{а2, ...,От)= Y1 $2,~.Лт а2г2 * * * атггп (2.42) (*2»-»*т) (индекс г в (3l2^im указывает, что эти постоянные связаны с функцией </?;)• Для завершения доказательства нам остается, изменив обозначения, поло- 3 А. О. Ремизов, И. Р. Шафаревич
66 Гл. 2. Матрицы и определители жить г — гь подставить выражения (2.42) в формулу (2.41) и положить fiil —гу- Замечание. Постоянные о^ьг2,...,гт в соотношении (2.40) могут быть найдены по формулам &цА2,~Лт = ^ \егр ег2> ••• > еЪтJ» (^-4о) где е^ опять обозначает строку (0,..., 1,...,0), в которой на j-м месте стоит 1, а на остальных местах — нули. Действительно, если подставить а\ = е^, а2 = е*2,..., ат = e^m в соотношение (2.40), то член ацха<ц2 '-a>mim обратится в 1, а остальные произведения a\j{a2j2 • • -CLmjm будут равны 0. Это и доказывает (2.43). Применим теперь теорему 2.10 и формулу (2.43) к определителю \А\ как функции строк ai,a2,... ,an матрицы А Так как нам известно, что определитель — полилинейная функция, то для него верно соотношение (2.40) (с т = п), а коэффициенты a;bi2,...,;n вычисляются по формуле (2.43). Следовательно, OLiu%2*~*in Равно определителю матрицы |£^Ь12|^П|, у которой первая строка равна е^, вторая — ei2, ..., п-ая — е*п. Если среди чисел гьг2,... ,гп имеются равные, то l^b^,...,^! = 0, ввиду свойства 6 из § 2.2. Таким образом, нам остается рассмотреть определитель |i5ibi2,...,ij в случае, когда (ii,i2,... jin) — перестановка чисел (1,2,... ,п). Но этот определитель получается из определителя \Е\ единичной матрицы, если над ее строками произвести перестановку (гьг2,... ,гп). Кроме того, мы знаем, что определитель является антисимметрической функцией своих строк (см. свойство 5 из § 2.2). Поэтому мы можем применить к нему свойство (2.37) антисимметрических функций и получим, что |#гьг2,...,гп| = е(1) • \Е\, где I = (ц,г2,..., in). Так как \Е\ = 1, то имеют место равенства щъъ2%„,%п = е(1)> если перестановка I = (чА2,->-Лп)- В результате мы получаем выражение для определителя матрицы А: \А\ = ^2е(1) • aHla2i2 • • • anin, (2.44) где сумма распространена на все перестановки I = (гьгг,... ,гп) чисел (1,2, ...,п). Выражение (2.44) называется формулой полного развертывания определителя. Она достойна того, чтобы переформулировать ее словами: Определитель матрицы А равен сумме членов, каждый из которых является произведением п элементов а^ матрицы А, взятых по одному из каждой строки и каждого столбца. Если расположить множители такого произведения в порядке возрастания номеров строк, то член входит со знаком + или — в зависимости от того, образуют ли номера столбцов четную или нечетную перестановку.
2.8. Ранг матрицы 67 § 2.8. Ранг матрицы В этом параграфе мы введем несколько основополагающих понятий нашего курса и с их помощью докажем несколько новых результатов о системах линейных уравнений. Определение. Матрица, г-й столбец которой совпадает с г-й строкой матрицы А для всех г, называется транспонированной к матрице А и обозначается как А*. Очевидно, что если через а^ обозначен элемент, стоящий на пересечении г-строки и j-ro столбца матрицы А, а через Ь^ — стоящий на том же месте элемент матрицы А*, то Ъ^ = dji. Если матрица А — типа (п,га), то матрица А* — типа (га, п). Теорема 2.11. Определитель транспонированной квадратной матрицы совпадает с определителем исходной матрицы, т. е. \А*\ = \А\. Доказательство. Рассмотрим следующую функцию матрицы А: F(A) = |А*|. Эта функция обладает свойствами 1) и 2), сформулированными в § 2.3 (стр. 52). Действительно, строки матрицы А* — это столбцы матрицы А, и потому утверждение о том, что функция F(A) (т.е. определитель \А*\ как функция матрицы А) обладает свойствами 1) и 2) для строк матрицы А, совпадает с утверждением, что определитель \А*\ обладает этими же свойствами для его столбцов. Это следует из теоремы 2.5. Таким образом, к функции F(A) применима теорема 2.3. Поэтому F(A) = k\A\, где к = F(E) — \Е*\Л а Е — единичная матрица n-го порядка. Очевидно, что Е* = Е, и поэтому к = \Е*\ = \Е\ = 1. Таким образом, F(A) = \A\, что и доказывает теорему. Определение. Квадратная матрица А называется симметрической, если А = А*, и антисимметрической, если А = —А*. Ясно, что если через ау обозначен элемент, стоящий на пересечении г-ой строки и j-го столбца матрицы А, то условие А = А* записывается в виде dij = dji, а условие А = —А* — в виде а^- = —dji. Из последнего соотношения следует, что все элементы ац, стоящие на главной диагонали антисимметрической матрицы, равны нулю. Кроме того, из свойств определителя вытекает, что любая антисимметрическая матрица нечетного порядка вырождена. Действительно, если А — квадратная матрица порядка п, то в силу определения умножения на число и линейности определителя по каждой строке имеем соотношение | — А*\ = (— 1)п\А\, откуда в силу А — —А* получаем \А\ = (—1)П|А|, что в случае нечетного п возможно лишь, если \А\ = 0. 3*
68 Гл. 2. Матрицы и определители Симметрические и антисимметрические матрицы играют важную роль в математике и физике, они скоро встретятся нам в следующих главах, например, при изучении билинейных форм. Определение. Минором порядка г матрицы (а\\ а\2 ••• а\п\ 021 «22 ••• «2п А = (2.45) \0>гп\ &т2 ' ' ' Q"mn/ называется любой определитель квадратной матрицы порядка г, которая получится, если оставить в матрице (2.45) некоторые г строк и г столбцов, а все остальные вычеркнуть. При этом, очевидно, предполагается, что г < т Например, минорами порядка 1 являются сами элементы матрицы, а единственным минором порядка п квадратной матрицы порядка п является ее определитель. Определение. Рангом матрицы (2.45) называется наибольший порядок ее минора, отличного от нуля. Другими словами, ранг — это наименьшее число г, при котором все миноры порядка s > г равны нулю или не существуют (если г = min{m,n}). Отметим одно очевидное следствие теоремы 2.11. Т е о р е м а 2.12. Ранг матрицы не меняется при транспонировании. Доказательство. Миноры матрицы А* получаются транспонированием миноров матрицы А (при транспонировании номера строк и столбцов меняются местами). Поэтому и ранги матриц А* и А совпадают. Напомним, что, излагая метод Гаусса (в § 1.2), мы производили элементарные преобразования типа I и II над уравнениями системы. При этом изменялись как коэффициенты при неизвестных, так и свободные члены системы. Если обращать внимание только на коэффициенты при неизвестных, то можно сказать, что мы совершаем элементарные преобразования над строками матрицы системы. Это обстоятельство дает возможность использовать метод Гаусса для определения ранга матрицы. Основное свойство ранга матрицы выражается утверждением: Теорема 2.13. Ранг матрицы не меняется при элементарных преобразованиях ее строк и столбцов. Доказательство проведем для элементарного преобразования строк типа II (для типа I оно аналогично, но еще проще). Пусть матрица А после прибавления к г-ой строке j'-ой строки, умноженной на число р, превращается в матрицу В. Обозначим ранг матрицы символом rg и положим vgA = г. Если среди ненулевых миноров порядка г матрицы А есть хотя бы один, не содержащий г-ю строку, то при данном преобразований он не изменится, и следовательно, будет ненулевым минором и матрицы В. Отсюда вытекает, что rgB ^ г.
2.8. Ранг матрицы 69 Теперь предположим, что все ненулевые миноры порядка г матрицы А содержат ее г-ю строку. Пусть М — такой минор, стоящий в строках с номерами гь... ,гг, где г& = г для некоторого fc, 1 ^ к < г. Обозначим через 7V минор матрицы В, стоящий в строках и столбцах с теми же номерами, что и М. Если j совпадает с одним из чисел гь... ,гг, то данное преобразование матрицы А является также элементарным преобразованием минора М, при котором он превращается в N. Так как при элементарных преобразованиях типа II определитель не изменяется, то N — М, откуда следует, что vgB > г. Пусть теперь j не совпадает ни с одним из чисел гь...,гг. Обозначим через М' минор матрицы А, стоящий в тех же столбцах, что и М, и в строках с номерами ii,...,ifc_i,j,ifc+i,...,ir. Другими словами, М' получается из М заменой г^-ой строки j-ой строкой матрицы А. Определитель является линейной функцией своих строк, поэтому имеет место равенство N = M+pM'. Но согласно сделанному предположению, М' = 0, так как минор Мг не содержит i-ую строку матрицы А. Таким образом, мы получаем равенство N = М, откуда снова следует, что rgB ^ г. Итак, во всех случаях мы доказали, что vgB > rgA Но так как матрица А, в свою очередь, может быть получена из Б с помощью элементарного преобразования типа II, то имеет место и обратное неравенство rgA ^ vgB. Отсюда, очевидно, следует, что rgA = vgB. Те же рассуждения, но проведенные для преобразований столбцов, показывают, что ранг матрицы сохраняется и при элементарных преобразованиях столбцов. Кроме того, утверждение для столбцов сразу же вытекает из аналогичного утверждения для строк, если воспользоваться теоремой 2.12. Теперь мы можем сформулировать ответы на вопросы, ранее решавшиеся теоремами 1.7 и 1.8, не приводя систему к ступенчатому виду, а используя явные выражения, зависящие от ее коэффициентов. Приведение к ступенчатому виду будет присутствовать в наших доказательствах, но не в окончательных формулировках. Предположим, что путем элементарных преобразований мы привели систему к ступенчатому виду (1.18). Согласно теореме 2.13 как ранг матрицы системы, так и ранг расширенной матрицы при этом не изменится. Очевидно, что ранг матрицы системы (1.18) равен г: минор, находящийся на пересечении первых г строк и г столбцов с номерами l,fc, ...,s, равен ЩхЩк" '~urs и, значит, отличен от нуля, а любой минор большего порядка должен содержать строку нулей и поэтому равен нулю. Таким образом, ранг матрицы исходной системы (1.3) равен г. Ранг расширенной матрицы системы (1.18) тоже равен г, если все свободные члены 6r+i = ... = Ъп = 0 или если уравнений с такими номерами нет (га = г). Если же хотя бы одно из чисел Ьг+ь... ,Ъп отлично от нуля, то ранг расширенной матрицы больше, чем г. Например, если Ъг+\ ф 0, то минор порядка г+ 1, находящийся в первых г+ 1 строках расширенно^ матрицы и в столбцах с номерами 1,к,... ,s,n + 1, равен ацЩ^ • • -arsbr+i и отличен от нуля. Таким образом, критерий совместности, сформулированный в теореме 1.7, может быть также выражен в терминах ранга: ранг матрицы системы (1.3) должен быть равен рангу расширенной матрицы этой системы.
70 Гл. 2. Матрицы и определители Поскольку (согласно теореме 2.13) ранг матрицы и расширенной матрицы исходной системы (1.3) будут равны рангам соответствующих матриц системы (1.18), мы получаем условие совместности, называемое теоремой Кронекера- Капелли: Теорема 2.14. Система линейных уравнений (1.3) совместна тогда и только тогда, когда ранг матрицы системы равен рангу расширенной матрицы. Те же самые соображения дают возможность переформулировать теорему 1.8 следующим образом: Теорема 2.15. Если система линейных уравнений (1.3) совместна, то она будет определенной тогда и только тогда, когда ранг матрицы системы равен числу неизвестных. Можно еще больше прояснить значение понятия ранга матрицы в теории линейных уравнений, если ввести еще одно понятие, которое важно также и само по себе. Определение. Пусть даны т строк одной и той же длины п: а\, a<i, ... ,аш. Строка а той же длины называется их линейной комбинацией, если существуют такие числа р\,Р2,... ,Рт, что а = р\а\ +Р2«2 Н УРтО-т- Отметим два свойства этого понятия. 1) Если а является линейной комбинацией строк ai,...,am, каждая из которых, в свою очередь, является линейной комбинацией одних и тех же строк bi,...,bfc, то и а является линейной комбинацией строк foi,...,^. Действительно, согласно определению линейной комбинации, существуют такие числа д^-, что а>% = qnb\ +<й2&2 Н \-Qikbk, i — 1,... ,m, и такие числа р^ что а = р\а\ + P2<i2 H УРтО*™,- Подставляя в последнее равенство выражения строк щ через Ъ\,...фк, мы получим: а = Pi(qnb\ + <7i2&2 Н Ь Ц\Фк) + Р2{я.2\Ъ\ + ^22&2 Н V Ч2Фк) Н \- + Рт(Ят\Ь\ + qm2b2 H h ЦтФк)- Раскрывая скобки и собирая подобные члены, имеем: a= (pi9ll +P2921 Н \-РтЧт\)Ъ\ + [p\q\2 + P2Q22 Н h Pmqm2)b2 + ' * ' + + (p\q\k + P2q2k н \-Pmqmk)bk, т.е. выражение а как линейной комбинации строк &!,...,&&. 2) Когда мы производим над строками матрицы элементарные преобразования, получаются строки, являющиеся линейными комбинациями строк исходной матрицы. Это очевидно в отдельности как для элементарных преобразований типа I, так и типа П.
2.8. Ранг матрицы 71 Применим к некоторой матрице А ранга г метод Гаусса. Изменяя нумерацию строк и столбцов, мы можем считать, что отличный от нуля минор порядка г расположен в первых г строках и первых г столбцах матрицы. Тогда элементарными преобразованиями первых г строк матрица приводится к виду / «и О А = «12 «22 О О «г+И \« ml «lr «2r «lr+1 «2r+l (Jbrpf (ЛурЛ-1 «In \ «2n «r+1 n 7 где ац ф 0,..., arr Ф 0. Теперь мы можем вычесть из (г + 1)-ой строки первую строку, умноженную на такое число, чтобы первый элемент полученной строки стал равным нулю; потом вторую строку, умноженную на такое число, чтобы второй элемент полученной строки стал равным нулю; и так далее до тех пор, пока не получим матрицу А = /«И «12 0 а22 0 0 0 0 \0 0 «1г «1г+1 «2г «2г+1 (JLy>r CLffA-1 0 ar+ir+i 0 «гаг+1 «In «2п \ «г-Ип ) Так как матрица А получилась из А с помощью последовательности элементарных преобразований, то ее ранг также равен г. _ Покажем, что вся (г + 1)-ая строка матрицы А состоит из нулей. Действительно, если в ней есть элемент ar+ik Ф 0 с некоторым к = 1,...,п, то минор матрицы А, стоящий на пересечении первых г + 1 строк и столбцов с номерами 1,2,..., г, fc, равен «11 «12 0 CL22 о 0 0 0 «1г «2г «1/е «2/с 0 ~ar+\k = «11 «22 ■«r+1 к Ф 0, а это противоречит доказанному факту, что ранг матрицы А равен г.
72 Гл. 2. Матрицы и определители Этот результат можно сформулировать так: если ai,...,ar+i — первые г + 1 строк матрицы А, то найдутся такие числа р\,...9рг, что ar+i — pi^i — • • • — pr~aT = 0. Отсюда следует, что ar+i = piai + • • • + ргаг,_т. е. строка а_г-\-\ является линейной комбинацией первых г строк матрицы А. Но матрица А получилась в результате элементарных преобразований над первыми г_строками матрицы А, так что все строки с номерами, большими г, у матриц Аи А совпадают. Таким образом, мы видим, что (г + 1)-ая строка матрицы А является линейной комбинацией строк ai,...,ar+i, каждая из которых, в свою очередь, является линейной комбинацией первых г строк матрицы А. Следовательно, (г + 1)-ая строка матрицы А является линейной комбинацией ее первых г строк. Это рассуждение, проведенное для (г + 1)-ой строки, годится и для любой строки с номером % > г. Таким образом, любая строка матрицы А является линейной комбинацией ее первых г строк (здесь именно первые г строк играли особую роль, так как мы для удобства записи пронумеровали строки и столбцы таким образом, чтобы отличный от нуля минор порядка г находился в первых г строках и первых г столбцах). В общем случае мы получаем следующее утверждение: Т е о р е м а 2.16. Если ранг матрицы равен г, то все ее строки являются линейными комбинациями некоторых г строк. Замечание. Точнее говоря, мы доказали, что если известен какой-либо отличный от нуля минор порядка, равного рангу матрицы, то любая строка является линейной комбинацией строк, в которых находится этот минор. Применение этих понятий к системам линейных уравнений основывается на следующей очевидной лемме. При этом, как и в школьном курсе, мы будем называть уравнение F(x) = Ъ следствием уравнений (1.10), если всякое решение с системы (1.10) удовлетворяет соотношению F(c) = Ъ. Другими словами, это значит, что, приписывая к системе (1.10) еще одно уравнение F(x) = Ь, мы получаем эквивалентную ей систему. Лемма. Если в расширенной матрице системы (1.3) какая-то строка (например, с номером I) является линейной комбинацией некоторых к строк с номерами i\,... ,ik> то 1-е уравнение системы является следствием к уравнений, имеющих те же номера. Доказательство проводится непосредственной проверкой. Для простоты изложения мы предположим, что речь идет о первых к строках расширенной матрицы. Тогда по определению существуют такие к чисел с^ь..., од, что «1 (ai 1, «12, • • •, aim Ъ\) + аг(а21, а22, • • •, a2n, b2) H Ьод(одьод2, ••• ,Q>kn>bk) = (aii>CLi2> ••• >a>in,bi). То есть для каждого г = 1,..., п выполнены равенства а\ац + од«2г Н Ьодод^ = аи при г = 1,2,...,га, а\Ъ\ + #2^2 Н h otkbk — bi.
2.9. Операции над матрицами 73 Тогда, умножая уравнения с номерами 1,2, ...,fc в нашей системе на числа ai,...,afc соответственно и затем складывая их, мы получим 1-е уравнение системы. То есть, в записи (1.10) мы имеем a\Fi(x) + \-akFk(x) = Ft(x), ot\b\ H h akbk = bt. Подставляя сюда х = с, получаем, что если F\(c) = b\, ..., Fk(c) = &&, то и F^(c) = bi, т.е. Z-e уравнение является следствием первых к уравнений. Соединяя доказанную лемму с теоремой 2.16, мы получаем следующий результат: Теорема 2.17. Если ранг матрицы системы (1.3) совпадает с рангом ее расширенной матрицы и равен г, то все уравнения системы являются следствиями некоторых г ее уравнений. Таким образом, если ранг матрицы совместной системы (1.3) равен г, то она эквивалентна системе, состоящей из некоторых г уравнений (1.3). В качестве этих г уравнений можно выбрать любые такие, что в строках с соответствующими номерами расположен отличный от нуля минор порядка г матрицы системы (1.3). § 2.9. Операции над матрицами В этом параграфе мы определим простые, но очень важные для дальнейшего изложения операции над матрицами. Сначала мы определим эти операции чисто формально, их более глубокий смысл будет ясен из рассмотренных ниже примеров, а главное, из следующей главы, где матрицы будут связаны с геометрическим понятием — линейными преобразованиями векторных пространств. Прежде всего договоримся, что под равенством А — В двух матриц понимается то, что А и В — матрицы одного и того же типа, элементы которых (обозначим их через ац и Ьц соответственно), стоящие на одинаковых местах, совпадают. Таким образом, если Аи В имеют га строк и га столбцов, то запись А = В означает тп равенств а^ = bij для всех индексов i = 1,...,т и j = = 1,...,п. Определение. Пусть А — произвольная матрица типа (га,п) с элементами a,ij и р — число. Произведением матрицы А на число р называется матрица В того же типа (га, га), элементы которой определены равенством b^ = paij. Она обозначается как В = рА. Подобно тому, как это записывается для чисел, матрица, полученная умножением А на число —1, обозначается —А и называется противоположной. В случае умножения любой матрицы типа (га, га) на число 0 мы, очевидно, получаем матрицу того же типа, все элементы которой равны нулю. Она называется нулевой матрицей типа (га, га) и обозначается О. Определение. Пусть А и В — две матрицы одного и того же типа (га, га), элементы которых обозначим а^ и Ь^ соответственно. Суммой А и В
74 Гл. 2. Матрицы и определители называется матрица С того же типа {т,п), элементы Qj которой определены формулой cij = aij + bij. Это записывается в виде равенства С = А + В. Подчеркнем, что сумма (как и равенство) определена только для матриц одного и того же типа. Исходя из данных определений, легко проверить, что, как и в случае чисел, выполнены правила раскрытия скобок: (р + q)A = рА + qA для любых чисел р, q и матрицы А, а также р(А + В) = рА + рВ для любого числа р и матриц А, В одного типа. Так же легко проверить, что сложение матриц не зависит от их порядка, т. е. А + В — В + А и что сумма трех (и большего) числа матриц не зависит от расстановки скобок, т. е. (А + В) + С = А + (В + С). С помощью сложения и умножения на —1 можно также определить разность матриц: А — В = А+ (—В). Теперь определим другую, самую важную, операцию над матрицами, которая называется произведением или умножением. Подобно сложению, эта операция определена для матриц не произвольных типов, а лишь таких, которые связаны определенным соотношением. Определение. Пусть А — матрица типа (га,п), элементы которой будем обозначать а^-, и В — матрица типа (п,к), элементы которой будем обозначать Ьц (отметим, что здесь индексы г и j элементов а^ и Ъ^ пробегают, вообще говоря, разные множества значений). Произведением матриц А и В называется матрица С типа (т,к), элементы су которой определены формулой Cij — <4\b\j + CLi2b2j H h dinbnj. (2.46) Это записывается в виде равенства С = А • В или, короче, С = АВ. Таким образом, произведение двух прямоугольных матриц А и В определено в том и только том случае, когда число столбцов матрицы А равно числу строк матрицы Б, в противном же случае их произведение не имеет смысла (причины этого будут более ясны из следующей главы). Важный частный случай п = т = к показывает, что произведение двух (и следовательно, любого числа) квадратных матриц одного и того же порядка определено. Поясним данное определение некоторыми примерами. Пример 2.3. В дальнейшем нам будут часто встречаться матрицы типов (1,п) и (п, 1), т. е. строки и столбцы длины п, которые часто называют вектор- строками и вектор-столбцами соответственно. Для них нам удобно ввести специальные обозначения: а = (аь...ап)> [/3] = I : , (2.47) т.е. а является матрицей типа (1,п), а [/3] — матрицей типа (п, 1). Такие матрицы, очевидно, связаны транспонированием: [а] = а* и [/3] — /3*. Произведение матриц (2.47) есть, согласно данному определению, матрица С типа (1,1), т.е. число с, которое равно c = a\pi H boW?n- (2.48)
2.9. Операции над матрицами 75 В случае п = 2 и п = 3 выражение (2.48) совпадает с хорошо знакомым из курса аналитической (или даже элементарной) геометрии понятием скалярного произведения векторов, если считать а и [/3] векторами, координаты первого из которых записаны в виде строки, а второго — в виде столбца. Пользуясь формулой (2.48), можно выразить правило умножения матриц, задаваемое формулой (2.46), сказав, что умножается строка матрицы А на столбец матрицы В. Точнее говоря, элемент cij есть определенное формулой (2.48) произведение г-й строки ос{ матрицы А на j-й столбец [j3]j матрицы В. Пример 2.4. Пусть А — матрица типа (га,п) из формулы (1.4) (стр. 19), а [х] — матрица типа (1,п), т.е. вектор-столбец, состоящий из элементов xi,...,xn, записанных аналогично правой части формулы (2.47). Тогда их произведение А[х] — это матрица типа (га, 1), т. е. вектор-столбец, состоящий согласно формуле (2.46), из элементов ацх\ +ai2X2 H \-ainxn, г = 1,... ,га. Это показывает, что рассмотренная нами в § 1.1 система линейных уравнений (1.3) может быть записана в более коротком матричном виде: А[х] = [Ь], где [Ь] — матрица типа (га, 1), состоящая из свободных членов системы: b\,-..,bm, записанных в виде столбца. Пример 2.5. Линейной заменой называется такая замена переменных, когда старые переменные (х\,...,хт) являются линейными функциями от новых (уь--«>2/п)» т-е- выражаются формулами { х{= а\\у\ + а\2У2 Н V а>1пУп, I х2 = а2\У\ + а22У2 ~\ \-о>2пУп, /о ап\ < (2.49) { хт = аш\у\ + ат2у2 Ч Ь сьтпУп с некоторыми коэффициентами о^. Матрица А = (а^) называется матрицей замены (2.49). Рассмотрим результат двух линейных замен — пусть переменные (у1,...,уп)> в свою очередь, выражаются через (z\,...,Zk) по формуле {У\ = bnzi + bi2z2 H + b\kZk, У2 = b2\zx + b22Z2 + -" + b2kzk, (2 50) Уп = bnizi + bn2z2 + •••+ bnkzk с коэффициентами bij. Подставляя формулы (2.50) в (2.49), мы получим выражения для переменных (xi,...,xm) через (z\,...,zk): Щ = (Hiibnzi + h bikzk) + h ain(bnizi + • • • + bnkzk) = = (^iibn H h ainbni)zi H f- (ацЬ\к Н h ainbnk)zk. (2.51) Подобно тому, как было сделано в предыдущем примере, мы можем записать линейные замены (2.49) и (2.50) в матричном виде [х] = А[у] и [у] = B[z], где [ж], [у], [г] — вектор-столбцы, элементами которых являются соответствую-
76 Гл. 2. Матрицы и определители щие переменные, Aw В — матрицы типа (га, п) и (п, к) с элементами ау и Ъ^ соответственно. Тогда, согласно определению (2.46), формула (2.51) имеет вид [ж] = C[z], где матрица С = АВ. Иными словами, последовательное выполнение двух линейных замен дает линейную замену, матрица которой равна произведению матриц этих замен. Замечание. Сказанное позволяет нам сформулировать определение произведения матриц в терминах линейных замен: произведением матриц А и В называется матрица С, которая является матрицей замены, получающейся при последовательном выполнении двух линейных замен с матрицами А и В. Это очевидное замечание позволяет дать простое и наглядное доказательство одного важного свойства произведения матриц, которое называется ассоциативностью: Т е о р е м а 2.18. Пусть матрица А имеет тип (га, п), матрица В — тип (n,k) и матрица D — тип (k,l). Тогда (AB)D = A(BD). (2.52) Доказательство. Рассмотрим сначала частный случай, когда I = 1, т.е. матрица D в равенстве (2.52) является вектор-столбцом с к элементами. Согласно сделанному замечанию, равенство (2.52) в этом случае является простым следствием интерпретации произведения матриц А и В как результата выполнения двух линейных замен переменных — в обозначениях примера 2.5 нужно просто положить [z] = D и затем использовать равенства [y]=B[z],[x] = A[y]n[x] = C[z]. Для доказательства равенства (2.52) в общем случае достаточно заметить, что умножение матрицы А на В сводится к поочередному умножению строк А на столбцы В. То есть, если мы запишем матрицу В в виде столбцов: В = (В\,...,Bk), то АВ аналогичным образом запишется в виде АВ = (AB\,...,ABk), где все ABi — это матрицы типа (га, 1), т.е. тоже вектор-столбцы. После этого доказательство равенства (2.52) в общем случае практически очевидно. Пусть D состоит из I столбцов: D — {D\,..., D{). Тогда в левой части (2.52) стоит матрица (AB)D = ({AB)Du...,{AB)Di), а в правой части — матрица A(BD) = A(BDi9..., BDi) = (A(BDx),...,A(BDi)), и нам остается лишь применить доказанное равенство (2.52) с I = 1 для каждого из вектор-столбцов D\,..., D\. Заметим, что свойство ассоциативности уже рассматривалось нами ранее в более абстрактной форме (стр. 11). Согласно доказанному там, из него следует, что произведение любого числа сомножителей не зависит от способа расстановки скобок между ними. Таким образом, ассоциативность позволяет вычислять произведение любого числа матриц (нужно лишь только, чтобы каждые две соседние матрицы соответствовали друг другу при умножении
2.9. Операции над матрицами 77 так, чтобы было определено их произведение), не указывая способ расстановки скобок между ними. В частности, однозначно определен результат умножения произвольной квадратной матрицы самой на себя любое число раз, это называется возведением в степень. Как и для чисел, операции сложения и умножения матриц связаны между собой соотношениями А(В + С) = АВ + АС, {А + В)С = АС + ВС, (2.53) которые совершенно очевидно следуют из определений. Свойство (2.53), связывающее сложение и умножение, называется дистрибутивностью. Отметим одно важное свойство умножения, связанное с единичной матрицей: для любой матрицы А типа (га, п) и любой матрицы В типа (п, га) выполнены равенства АЕп = А, ЕпВ = В. Доказательство обоих равенств производится по определению умножения матриц, например, с помощью правила «строка на столбец». Таким образом, мы видим, что при умножении матриц Е играет ту же роль, что и 1 при умножении чисел. Однако другое привычное свойство произведения чисел (называемое коммутативностью) — произведение не меняется при изменении порядка сомножителей — не верно для произведения матриц. Это следует хотя бы из того, что произведение АВ матрицы А типа (п, га) и матрицы В типа (I, к) определено только при га = I. Может оказаться, что к ф п, и тогда произведение матриц В А вообще не определено. Но даже, например, в случае п = т = к = 1 = 2, когда определено и произведение АВ, и произведение В А, и мы имеем АВ = (ар + Ъг aq + bs>\ В А = (ар + cq hpJr dq] \ср + dr cq + dsj ' \ar + cs br + ds) ' а это, вообще говоря, разные матрицы. Матрицы А и В, для которых АВ = В А, называются коммутирующими. В связи с умножением матриц используются обозначения, которые мы введем только в том частном случае, который действительно будет нам дальше встречаться. Пусть задана квадратная матрица А порядка п и некоторое натуральное число р < п. Элементы матрицы А, стоящие в ее первых р строках и первых р столбцах, образуют квадратную матрицу А\\ порядка р. Элементы, которые стоят в первых р строках и последних п — р столбцах, образуют прямоугольную матрицу А\2 типа (р,п — р). Элементы, которые стоят в первых р столбцах и последних п — р строках, образуют прямоугольную матрицу А2\ типа (п — р,р). Наконец, элементы, стоящие в последних п — р строках и последних п — р столбцах, образуют квадратную матрицу А22
78 Гл. 2. Матрицы и определители порядка та — р. Это записывается так: А = Mi М\ А\2 А22 (2.54) Формула (2.54) называется записью матрицы А в блочном виде, а матрицы Ац, М2, -^21. ^.22 — блоками матрицы А. Например, в этих обозначениях формула (2.15) принимает вид А = \Ац Ai2 О А22 \Ац\-\А22\ Очевидно, возможно представление матрицы А в виде большего числа матриц-блоков различного типа. Кроме указанного выше случая (2.54), нам будет еще встречаться ситуация, когда блоки стоят на диагонали: А = (Ах О О А2 \0 О О AkJ Здесь Аг — квадратные матрицы порядка щ, г = 1,..., к. Тогда А — квадратная матрица порядка п — п\ Н Ь пь она называется блочно-диагональной. Умножение матриц иногда бывает удобно записывать в блочном виде. Мы рассмотрим только случай двух квадратных матриц одинакового порядка п, разбитых на блоки вида (2.54) одинакового размера: 'An А2\ Mi А22 В = 'Вп В 21 В\2 В22 (2.55) Здесь Ац и 5ц - квадратные матрицы порядка р, А\2 и В\2 — матрицы типа (р,п — р), А2\ и 1$2\ — матрицы типа (п — р,р), А22 и В22 — квадратные матрицы порядка п — р. Тогда произведение С = АВ определено и является квадратной матрицей порядка п, которая может быть разбита на такие же блоки: f , 1^21 С22у с = Утверждается, что в этом случае С\\ = А\\В\\ +А12В21, С21 = А2\Вц + А22В21, С\2 = A\\Bi2 + А12В22, С22 = А21В12 + ^22^22- (2.56) Иными словами, матрицы (2.55) умножаются как матрицы второго порядка, но их элементами являются не числа, а блоки, т. е. опять же матрицы. Доказательство формулы (2.56) сразу же следует из формул (2.46). Например, пусть С = (cij), где 1 ^ i,j ^ р. В формуле (2.46) сумма первых р слагаемых дает элемент с£. в матрице АцВц, а сумма оставшихся п — р слагаемых — элементы с'(- в матрице А12В21. Конечно, аналогичные формулы (с тем же доказательством) верны и для умножения прямоугольных матриц с различными разбиениями на блоки — необходимо только, чтобы эти разбиения были согласованы между собой таким образом, чтобы были определены произведения
2.9. Операции над матрицами 79 всех входящих в формулы матриц. Но в дальнейшем нам понадобится только описанный выше случай (2.55). Операция транспонирования связана с умножением важным соотношением. Пусть матрица А имеет тип (п, га), а матрица В — тип (га, fc). Тогда (АВ)* = В* А*. (2.57) Действительно, согласно определению произведения матриц (формула (2.46)), элемент матрицы АВ, стоящий на пересечении j-ой строки и г-го столбца, равен a>jib\i + aj2b2i H Va>jmbmi, где г=1,...,п, j=l,...,k. (2.58) По определению транспонирования, выражение (2.58) дает нам значение элемента матрицы (АВ)*, стоящего на пересечении г-ой строки и j-ro столбца. С другой стороны, рассмотрим произведение матриц В* и А*, пользуясь сформулированным выше правилом «строка на столбец». Тогда, с учетом определения транспонирования, получаем, что стоящий на пересечении г-ой строки и j-ro столбца элемент матрицы В*А* равен произведению г-ro столбца матрицы В и j-ой строки матрицы А, т. е. равен buClji + h2idj2 H Ь bmidjm. Это выражение совпадает с формулой (2.58) для стоящего в соответствующем месте элемента матрицы (АВ)*, что и доказывает равенство (2.57). При помощи операции умножения можно выразить элементарные преобразования матриц, которыми мы пользовались в § 1.2 при исследовании систем линейных уравнений. Не оговаривая этого особо, здесь мы всегда будем иметь в виду, что всегда перемножаются такие матрицы, произведение которых определено. Пусть задана прямоугольная матрица (а\\ а\2 •" а\п\ 0,21 CL22 ••* G2n \Q"ml &т2 ' ' ' &тп/ Рассмотрим квадратную матрицу порядка га, которая получается из единичной матрицы порядка га перестановкой г-ой и j-ой строк:
80 Гл. 2. Матрицы и определители Т- — j-ij — /1 V 0 0 • 0 1 0 1 0 • т 0 1 • 0 1 0 1 0 • 0 0 1/ и 0 Очевидная проверка показывает, что матрица TijA получается из А тоже перестановкой г-ой и j-ой строк. Таким образом мы можем выразить элементарное преобразование типа I матрицы А через умножение ее слева на подходящую матрицу Ту. Рассмотрим (при г ф j) квадратную матрицу Щ(с) порядка га: /1 Щ{с) = о 1 0 • 0 1 0 0 0 • т ш 0 1 • 0 с 0 1 0 • 0 1 \ (2.59) 0 1/ зависящую от числа с. Она получается из единичной матрицы порядка га прибавлением к г-ой строке j-ой строки, умноженной на с. Столь же очевидная проверка показывает, что матрица Uij(c)A получается из А прибавлением к г-ой строке j-ой строки, умноженной на число с. Таким образом, мы можем записать и элементарное преобразование типа II через умножение
2.9. Операции над матрицами 81 матриц. Следовательно, теорема 1.6 в матричной форме может быть выражена следующим образом: Т е о р е м а 2.19. Произвольную матрицу А типа (га, п) можно привести к ступенчатому виду путем умножения слева на произведение нескольких подходящих матриц Тц и Щ(с) (в надлежащем порядке). Рассмотрим важный случай, когда А и В — квадратные матрицы порядка п. Тогда и их произведение С = АВ — тоже квадратная порядка п. Теорема 2.20. Определитель произведения двух квадратных матриц одинакового порядка равен произведению их определителей, т. е. \АВ\ — = \А\ ■ \В\. Доказательство. Рассмотрим определитель \АВ\ при фиксированной матрице В как функцию от строк матрицы А и обозначим ее через F(A). Докажем сначала, что функция F(A) полилинейна. Нам известно (свойство 1 из § 2.2), что определитель \С\ = F(A), рассматриваемый как функция строк матрицы С = АВ, полилинеен. В частности, он является линейной функцией г-ой строки матрицы С, т. е. F(A) = а\сц + a2ci2 H h ancin (2.60) при некоторых числах а\,...,ап. Обратим внимание на то, что, согласно формуле (2.46), г-ая строка матрицы С = АВ зависит только от г-ой строки матрицы А, а остальные строки матрицы С, наоборот, от этой строки не зависят. Подставив в формулу (2.60) выражения (2.46) для элементов г-ой строки и собирая вместе подобные члены, мы получим выражение для F(A) как линейной функции от г-ой строки матрицы А. Таким образом, функция F(A) полилинейна относительно строк А. Переставим теперь две строки матрицы А, например, с номерами i\ и %2. Формула (2.46) показывает, что 1-я строка матрицы С при I ф i\,i2 не изменится, а ее г\-я и г2-я строки поменяются местами. Поэтому \С\ изменит знак. Это означает, что функция F(A) является антисимметрической относительно строк матрицы А. Мы можем применить к этой функции теорему 2.3 и тогда получим, что F(A) = k\A\, где к = F(E) = \ЕВ\ = \В\, так как для любой матрицы В выполнено соотношение ЕВ = В. Таким образом, мы получаем равенство F(A) = \А\ • |5|, где, согласно нашему определению, F{A) = \АВ\. Теорема 2.20 имеет красивое обобщение на прямоугольные матрицы, которое называется формулой Бине-Коши. Мы не будем сейчас ее доказывать, а приведем только формулировку (естественное доказательство будет дано в § 10.5, с. 372). Произведение двух прямоугольных матриц В и А дает квадратную матрицу порядка т, если В имеет тип (ra,n), a A — тип (п, т). Миноры матриц В и А одинакового порядка, равного наименьшему из чисел пит, называются соответствующими друг другу, если они стоят в столбцах (матрицы В) и строках (матрицы А) с одинаковыми номерами. Формула Бине-Коши утверждает, что определитель \ВА\ = 0, если п < га, и \ВА\ равен сумме попарных произведений соответствующих друг другу миноров порядка га, если п ^ га.
82 Гл. 2. Матрицы и определители При этом сумма берется по всем наборам строк (матрицы А) и столбцов (матрицы В) с возрастающими номерами i\ < %2 < • • • < гт. Красивым частным случаем формулы Бине-Коши является случай, когда В = а\ а2 • Ь\ Ъ<1 • • ап\ • Ъп)' А = (ах ЪЛ &2 ^2 Тогда ВА = а\ + а\ + + < а\Ъ\ +CL2b2 Ч h и соответствующие миноры имеют вид а\Ь\ + аф^ Ч \-JOLnbr^ ъ\ + ъ\+ ... +ь1 CLi при всех г < j, принимающих значения от 1 до п. Формула Бине-Коши дает нам равенство {а\ + 4 + • • • + 4)(Ь? + Ъ\ + • • • + Ъ2п) - (aibi + а2Ъ2 + В частности, из нее вытекает известное неравенство Ч- апЬп) = i<j (а\ + 4 + • • • + 4)(bf + &i + • • • + b2n) ^ (aibi + a2b2 + • ■ • + anbn)2. Операции сложения и умножения матриц позволяют определить многочлены от матриц. При этом, естественно, мы будем предполагать, что всюду речь идет о квадратных матрицах некоторого фиксрованного порядка п. Сначала определим операцию возведения в степень п. По определению, Ап при п > 0 есть результат умножения матрицы А самой на себя п раз, а при п = О есть единичная матрица Е. Определение. Пусть f(x) = ao + ol\x Ч Ь ос^хк — многочлен с числовыми коэффициентами. Тогда многочленом f от матрицы А называется матрица f(A) = а0Е + а{ А + • • • + акАк. Установим некоторые простые свойства многочленов от матриц. Лемма. Если f(x) + g{x) = и(х) и f(x)g(x) = v(x), то для любой квадратной матрицы А имеем f(A) + g(A) = u(A), (2.61) f(A)g(A)=v(A). (2.62)
2.10. Обратная матрица 83 п т Доказательство. Пусть f(x) = Y^aix% и д(х) — J2 Pjx^ тогда и(х) = — Z^7r^r и v{x) = YlusxS, где коэффициенты jr и 8S можно записать в виде Г S формулы s i=0 где ar = 0, если г > п, и /Зг = 0, если г > т. Равенство (2.61) теперь совершено очевидно. Для доказательства же равенства (2.62) заметим, что п п f(A)g(A) = ]Г ацА* ■ £ ft Я = ^ о*^-А^. г=1 j = l г J Собирая вместе все члены, для которых г + j = 5, мы получим формулу (2.62). Следствие. Многочлены f(A) и д(А) от одной и той же матрицы А коммутируют: f(A)g(A) = g(A)f(A). Доказательство вытекает из формулы (2.62) и равенства f(x)g(x) = = 0(s)/(aO- Заметим, что утверждение, аналогичное доказанной лемме, не верно для многочленов от нескольких переменных. Например, тождество (х + у)(х — у) = — х2 — у2 может не сохраниться, если заменить х и у произвольными матрицами. Причина заключается в том, что при выводе этого тождества мы пользуемся соотношением ху — ух, которое для произвольных матриц не верно. § 2.10. Обратная матрица В этом параграфе мы будем рассматривать только квадратные матрицы заданного порядка п. Определение. Матрица В называется обратной матрице А, если АВ = Е. (2.63) Здесь Е обозначает единичную матрицу фиксированного порядка п. Не всякая матрица обладает обратной. Действительно, применяя к равенству (2.63) теорему 2.20 об определителе произведения матриц, мы получим, что \Е\ = \АВ\ = \А\ • |Б|,
84 Гл. 2. Матрицы и определители а так как \Е\ = 1, то |А| • |В| = 1. Очевидно, что такое соотношение невозможно при |А| = 0. Таким образом, никакая вырожденная матрица не имеет обратной. Следующая теорема показывает, что верно и обратное утверждение: Т е о р е м а 2.21. Для любой невырожденной матрицы А существует матрица В, удовлетворяющая соотношению (2.63). Доказательство. Обозначим неизвестный нам j-й столбец искомой обратной матрицы В через [b]j, а через [e]j — j-й столбец единичной матрицы Е. Столбцы [b]j и [e]j являются матрицами типа (п, 1) и, согласно правилу умножения матриц, равенство (2.63) равносильно п соотношениям A[b]j = [e]j9 j=l,...,n. (2.64) Следовательно, нам достаточно доказать разрешимость каждой (при каждом фиксированном j) системы линейных уравнений (2.64) относительно п неизвестных — элементов матрицы Б, входящих в столбец [b]j. Но при любом значении j матрица этой системы есть А и, по условию, |А| Ф 0. Согласно теореме 2.2, такая система имеет решение (причем одно единственное). Принимая найденное для каждого значения j решение этой системы за j-й столбец матрицы В, мы и получаем матрицу, удовлетворяющую условию (2.63), т. е. обратную матрице А. Вспомним, что умножение матриц не подчиняется закону коммутативности, т.е., вообще говоря, АВ ф В А. Поэтому естественно было бы рассматривать и другой вариант обратной матрицы для А — такую матрицу С, что С А = Е. (2.65) То же самое рассуждение, что и приведенное в начале параграфа, показывает, что такой матрицы С не существует, если А вырожденная. Теорема 2.22. Для любой невырожденной матрицы А существует матрица С, удовлетворяющая соотношению (2.65). Доказательство. Эту теорему можно доказать двумя разными способами. Во-первых, можно было бы полностью повторить доказательство теоремы 2.21, рассматривая теперь вместо столбцов матриц С и Е их строки. Но, быть может, несколько изящнее другое доказательство, выводящее теорему 2.22 непосредственно из теоремы 2.21. Для этого применим теорему 2.21 к транспонированной матрице А*. Согласно теореме 2.11, |А*| = \А\, следовательно, \А*\ Ф 0 и, значит, существует такая матрица В, что А* Б = Е. (2.66) Применим операцию транспонирования к обеим частям соотношения (2.66). Очевидно, что Е* = Е. С другой стороны, согласно соотношению (2.57), (Л*Б)* = Б* (А*)* и, как нетрудно проверить, (А*)* = А. Поэтому мы получаем, что В*А = Е, и можем в соотношении (2.65) взять за С матрицу В*, где В определена из (2.66).
2.10. Обратная матрица 85 Матрицы В из соотношения (2.63) и С из (2.65) в равной мере могут претендовать на название обратной матрицы для А. К счастью, мы не получаем здесь двух разных понятий, так как эти матрицы совпадают. А именно, имеет место: Теорема 2.23. Для любой невырожденной матрицы А существует единственная матрица В, удовлетворяющая соотношению (2.63), единственная матрица С, удовлетворяющая соотношению (2.65), и они совпадают. Доказательство. Пусть А — невырожденная матрица. Покажем, что матрица Б, удовлетворяющая соотношению (2.63), единственная. Предположим, что существует другая матрица В', такая, что АВ' = Е. Тогда АВ — АВ\ и умножая слева обе части этого равенства на матрицу С, такую, что С А = Е, существование которой установлено теоремой 2.22, в силу ассоциативности умножения получаем, что (СА)В = (СА)В/1 откуда следует равенство ЕВ = ЕВ\ т. е. В — В'. Точно так же доказывается единственность С, удовлетворяющей соотношению (2.65). Теперь покажем, что В = С. Для этого рассмотрим произведение С(АВ) и воспользуемся ассоциативностью умножения: С(АВ) = (СА)В. (2.67) Тогда, с одной стороны, АВ = Е и С(АВ) = СЕ = С, а с другой стороны, С А = Е и (СА)В = ЕВ = В,и соотношение (2.67) дает, что В = С. Эта единая (согласно теореме 2.23) матрица В — С обозначается А~1 и называется обратной к матрице А. Таким образом, для каждой невырожденной матрицы А существует обратная матрица А~1, удовлетворяющая соотношениям АА~Х =А~1А = Е, (2.68) и такая А~х единственная. Если следовать доказательству теоремы 2.21, то можно вывести и явную формулу для обратной матрицы. Мы опять предполагаем, что матрица А невырождена и, следуя обозначениям, принятым в доказательстве теоремы 2.21, приходим к системе уравнений (2.64). Поскольку \А\ Ф О, мы можем найти решение этой системы по правилу Крамера (2.35). Для любого значения j — 1,...,п в системе (2.64) г-е неизвестное совпадает с элементом Ьц матрицы В. Применяя правило Крамера, получим для него значение bij = р* (2.69) где Dij — определитель матрицы, которая получается из А заменой г-го столбца на столбец [e]j. Определитель Вц можно разложить по г-му столбцу, и из формулы (2.30) мы получим, что он равен алгебраическому дополнению единственного отличного от нуля (и равного 1) элемента г-го столбца. Так как г-й столбец равен [е]^, то единица стоит на пересечении г-ro столбца
86 Гл. 2. Матрицы и определители (который мы заменили на [e]j) и j-й строки. Поэтому Бц — Aji, и формула (2.69) дает Это и есть явная формула для элементов обратной матрицы. Словами ее можно сформулировать следующим образом: для того, чтобы получить из невырожденной матрицы А обратную, нужно заменить каждый элемент его алгебраическим дополнением, затем транспонировать полученную матрицу и умножить ее на число \А\~1. Например, для матрицы 2-го порядка 4*5) при 6 = \А\ = ad — be ф 0 мы получаем обратную матрицу / d _ь\ А =\ V ~5 Ч Понятие обратной матрицы дает простую и изящную запись решения системы п линейных уравнений с п неизвестными. Если, как мы делали это в предыдущем параграфе, записать систему линейных уравнений (1.3) с п = т и невырожденной матрицей А в виде А[х] = [Ь], где [х] — столбец неизвестных х\,...,хп и [Ь] — столбец, состоящий из свободных членов, то, умножая это соотношение слева на матрицу А"1, мы получим решение в виде [ж] = ^.-1И- Таким образом, в матричной записи формулы -для решения системы п линейных уравнений с п неизвестными выглядят точно так же, как и для одного уравнения с одним неизвестным. Но если воспользоваться формулами для обратной матрицы, то мы увидим, что соотношение [ж] = А_1[Ь] в точности совпадает с правилом Крамера, так что эта более изящная запись по существу ничего ново£о не дает. Рассмотрим матрицу А = (о#), в которой элемент а^- = А^ — алгебраическое дополнение элемента а^ матрицы А. Матрица А называется присоединенной матрицей для А. Ее элементы являются многочленами степени п — 1 от элементов матрицы А порядка п. Формула (2.69) для обратной матрицы показывает, что __ _ АА = АА = \А\Е. (2.70) Преимущество присоединенной матрицы А_ по сравнению с обратной матрицей А~1 состоит в том, что определение А не предполагает деления на \А\, и формула (2.70), в отличие от аналогичной формулы (2.68), верна также и при \А\ = 0, т. е. и для вырожденных квадратных матриц, как показывает доказательство правила Крамера. Это будет использовано нами в дальнейшем. В заключение вернемся еще раз к вопросу о представлении элементарных преобразований с помощью умножения на матрицы, который мы начали
2.10. Обратная матрица 87 рассматривать в предыдущем параграфе. Легко видеть, что введенные там матрицы Tij и Uij(c) невырождены, причем 71-1 — Т г-1 игЛс) = иъ(-с). Поэтому теорему 2.19 можно сформулировать следующим образом: любая матрица А может быть получена из некоторой ступенчатой матрицы Аг путем умножения ее слева на матрицы вида Тц и Щ(с) в разном порядке. Применим этот результат к невырожденным квадратным матрицам порядка га. Так как |Т^| ф О, \Щ(с)\ ф О и \А\ ф О (по предположению), то и матрица А' тоже должна быть невырожденной. Но ступенчатая квадратная невырожденная матрица имеет верхнетреугольный вид, т. е. все ее элементы, стоящие под главной диагональю, равны нулю: А' = Mi о о "12 а22 О а13 а23 / а зз V о о о а2п I а; 2п °"пп/ причем \А'\ = a[la,22 ••• а!пп. Таким образом, все стоящие на главной диагонали элементы а'п,...,а'пп отличны от нуля. Но такую матрицу А! можно привести к еще более простому виду с помощью элементарных преобразований только типа II. Именно, так как afnn ф О, то можно вычесть из (п — 1)-ой, (п — 2)-ой, ..., 1-ой строки матрицы А! последнюю строку, умноженную на такие коэффициенты, чтобы все элементы n-го столбца (кроме а'пп) стали равными нулю. Так как а'п_Хп_х ф 0, то таким же образом можно обратить в нуль и все элементы (га — 1)-го столбца (кроме элемента а,п_1п_1). Поступая так га раз, мы сделаем равными нулю все элементы матрицы, кроме тех, которые стоят на главной диагонали, т. е. придем к матрице (о!п О О ••• 0\ D = О О "22 О о азз V о о о о о (2.71) J Матрица, все элементы которой, кроме стоящих на главной диагонали, равны нулю, называется диагональной. Таким образом, мы доказали, что матрица А' может быть получена из диагональной матрицы D путем умножения последней слева на матрицы вида Тц и Щ(с) в разном порядке. Заметим, что умножение на матрицу Тц (т. е. элементарное преобразование типа I) может быть заменено умножениями слева на матрицы типа С/у (с) с разными с и на некоторую более простую матрицу. Именно, перестановку г-ой и j-ой строк можно получить с помощью четырех следующих операций:
Гл. 2. Матрицы и определители 1. прибавление к j-ой строке г-ой строки, 2. вычитание из г-ой строки j-ой строки, 3. прибавление к j-ой строке г-ой. Схематично это можно изобразить следующим образом, обозначая г-ую и j-ую строки через q и cj соответственно: Ci Ci + Cj Ci + C, 4. Теперь нам нужно совершить операцию нового типа: она заключается в умножении г-ой строки на —1 и осуществляется путем умножения (при к = г) нашей матрицы слева на квадратную матрицу /1 Sk = \ s -1 V (2.72) V где —1 стоит на пересечении к-ои строки и к-го столбца. Тогда мы можем переформулировать теорему 2.19 следующим образом: Теорема 2.24. Любая невырожденная матрица может быть получена из диагональной путем умножения ее слева на некоторые матрицы Uij(c) вида (2.59) и матрицы Sk вида (2.72). Этот результат будет использован нами в § 4.4 при введении ориентации вещественного векторного пространства. Кроме того, теорема 2.24 дает простой и удобный способ вычисления обратной матрицы, основанный на использовании метода Гаусса. Для этого введем еще один (третий) тип элементарных преобразований матрицы, который заключается в умножении ее fc-ой строки на произвольное число а, не равное нулю. Очевидно, что это преобразование можно получить, умножая нашу матрицу слева на квадратную матрицу Vk(a) = И 1 1 а <- [Т] 1 V (2.73) V где число а стоит на пересечении fc-ой строки и fe-ro столбца. Умножая матрицу (2.71) слева на матрицы V\{p!\x ),... ,Vn(a!~n), мы превратим ее в единичную.
2.10. Обратная матрица 89 Из теоремы 2.24 следует, что любая невырожденная матрица может быть получена из единичной путем умножения ее слева на матрицы Uij(c) вида (2.59), матрицы Sk вида (2.72) и матрицы 14(a) вида (2.73). Но так как умножение на каждую из этих матриц равносильно элементарному преобразованию одного из трех типов, то это значит, что любая невырожденная матрица может быть получена из единичной с помощью последовательности таких преобразований, и наоборот, с помощью некоторого числа элементарных преобразований всех трех типов можно получить из любой невырожденной матрицы единичную. Это дает нам удобный способ вычисления обратной матрицы. Действительно, пусть с помощью некоторой последовательности элементарных преобразований всех трех типов мы привели матрицу А к Е. Обозначим через В произведение всех тех матриц £/у(с), Sk и Vfc(a), умножение на которые соответствует данным преобразованиям (в очевидном порядке: матрица каждого следующего преобразования стоит слева от матрицы предыдущего). Тогда В А = Е, откуда следует, что В = А~1. Применив ту же последовательность элементарных преобразований к матрице Е, мы получим из нее матрицу BE = Б, т.е. А~1. Таким образом, для вычисления А~1 нужно привести матрицу А к Е с помощью элементарных преобразований всех трех типов (так, как это было показано выше), одновременно применяя те же самые преобразования к матрице Е. Та матрица, которая получится из Е в результате тех же самых элементарных преобразований, и будет А-1. Пусть С — произвольная матрица типа {т,п). Покажем, что для любой невырожденной квадратной матрицы А порядка т ранг произведения АС равен рангу С. Действительно, как мы уже видели, матрица А проводится к Е с помощью некоторой последовательности элементарных преобразований трех типов над ее строками, которой соответствует умножение слева на матрицу А~1. Применяя ту же последовательность преобразований к АС, мы очевидно, получим матрицу А~1АС = С. Согласно теореме 2.13, ранг матрицы не меняется при элементарных преобразованиях типов I и П. Он также не меняется и при элементарных преобразованиях типа III. Это очевидно вытекает из того, что каждый минор является линейной функцией своих строк, следовательно, каждый ненулевой минор матрицы остается таковым и после умножения любой входящей в него строки на любое число, не равное нулю. Таким образом, ранг матрицы АС равен рангу С. Проводя аналогичные рассуждения не для строк, а для столбцов матриц, или просто используя теорему 2.12, мы получаем следующий полезный результат: Теорема 2.25. Для любой матрицы С типа (т,п) и любых невырожденных квадратных матриц А и В порядков тип, соответственно, ранг произведения АС В равен рангу С.
Глава 3 ВЕКТОРНЫЕ ПРОСТРАНСТВА § 3.1. Определение векторного пространства Векторы на прямой, на плоскости и в пространстве играют большую роль в математике и, особенно, в физике. Векторы изображают перемещения тел, или их скорости, ускорения, приложенные к ним силы и т. д. В курсе элементарной математики или физики вектором называется направленный отрезок. Слово направленный означает, что отрезку приписано направление, например, указанное стрелкой на нем. Или же из двух концов отрезка [А, В] один — А — назван началом, в другой — В — концом, и тогда направление задается движением от начала к концу. При этом два вектора х = АВ и у = CD называются равными, если при помощи параллельного переноса можно так совместить отрезки х и у, что начало А отрезка х совместится с началом С отрезка у (тогда автоматически совместятся и их концы), см. рис. 3.1. То, что мы считаем равными различные на рисунке векторы, не является чем-то исключительным в математике и вообще в человеческом мышлении. Это обычный прием абстракции, при помощи которого мы фиксируем внимание на некотором важном для нас свойстве рассматриваемых объектов. Так, в геометрии мы 0 , _ считаем равными некоторые треугольники, хотя Рис. 3.1. Равные векторы r ^ r r J они, может быть, нарисованы на разных листках бумаги. Или в арифметике мы считаем равным число людей в лодке и число яблок на дереве. Очевидно, что выбрав (на прямой, плоскости или в пространстве) некоторую точку О, мы можем найти (и один-единственный) вектор, равный заданному вектору х, начало которого совпадает с точкой О. Законы сложения скоростей, ускорений, сил приводят к следующему определению сложения векторов. Суммой векторов х — АВ и у = CD называется вектор z = AD', где D' — конец вектора BD', равного у, начало которого совпадает с концом В вектора х (рис. 3.2). Если заменить все векторы равными им, но имеющими началом фиксированную точку О, то сложение векторов будет происходить по известному «правилу параллелограмма» (рис. 3.3). Определена и операция умножения вектора х на число а. Под числом сейчас будет подразумеваться только вещественное число (о более общей
3.1. Определение векторного пространства 91 П D J- f А С О Рис. 3.2. Сумма векторов Рис- 3-3- Правило параллелограмма ситуации мы скажем позже). Если а > 0 и х — вектор АВ, то произведением ах называется вектор АС, расположенный на той же прямой, что и отрезок [А, Б], такой, что точка С лежит с той же стороны от А, что и точка Б, а отрезок [А,С] в а раз длиннее отрезка [ДБ]. (На самом деле, если а < 1, то отрезок [А, С] короче отрезка [А, Б].) Обозначая через \АВ\ длину отрезка [А, Б], мы выразим это формулой \АС\ = а\АВ\. Если же а < О и а = —/?, где /3 > 0, то произведением ах называется такой вектор С А, что (Зх = АС. Мы не будем выводить простые свойства сложения векторов и умножения их на числа. Отметим только, что они удивительно схожи для векторов на прямой, на плоскости и в пространстве. Это сходство указывает на то, что мы имеем здесь лишь частные случаи некоторого общего понятия. В этой и нескольких следующих главах мы изложим теорию векторов и состоящих из них пространств произвольного числа измерений п (включая даже некоторые факты, относящиеся к пространствам бесконечного числа измерений). Как сформулировать такое определение? В случае векторов на прямой, на плоскости и в пространстве мы пользуемся интуитивно ясным понятием направленного отрезка. Но если бы мы не были уверены в том, что слушатель обладает той же интуицией? Например, если бы мы хотели сообщить наши сведения инопланетянину, с которым общаемся по радио? В науке очень давно выработан способ, позволяющий преодолевать подобные трудности. Для этого определяют (или, следуя нашей терминологии, сообщают инопланетянину) не что такое есть некие объекты (векторы и т.д.), а каковы отношения между ними, или их свойства. Например, в геометрии оставляют как неопределяемые понятия — точки, прямые и свойство прямой проходить через точку, но формулируют некоторые их свойства — например, что через две разные точки проходит одна и только одна прямая. Такой способ определения новых понятий называется аксиоматическим. В нашем курсе линейной алгебры векторное пространство — это первый объект, который определяется аксиоматически. До сих пор новые понятия определялись при помощи конструкций или формул — как, например, понятие определителя матрицы (который либо определяется индуктивно, с помощью правила разложения по столбцу, либо вводится при помощи довольно сложной формулы полного развертывания (2.44), выведенной в § 2.7). Впрочем, возможно, раньше читателю встречалось понятие группы или поля, которые тоже определялись аксиоматически, но, как правило, детально не исследовались, в отличие
92 Гл. 3. Векторные пространства от понятия векторного пространства, изучению которого будет посвящена вся эта глава. Итак, мы переходим к определению векторного пространства. Определение. Векторным (или линейным) пространством называется некоторое множество L (элементы его мы будем называть векторами и обозначать ж,у, z и т.п.), если 1) определено правило, сопоставляющее любым двум векторам ж и у третий вектор, называемый их суммой и обозначаемый х + у, 2) определено правило, сопоставляющее каждому вектору х и каждому числу а новый вектор, называемый произведением а и ж и обозначаемый ах. Эти операции должны удовлетворять следующим условиям: а) х + у = у + х; б) (ж + у) + z = х + (у + z)\ в) существует такой вектор О Е L, что для любого вектора х е L сумма х + О = х (вектор 0 называется нулевым)', г) для любого вектора х е L существует вектор —х е L, такой, что х + (—х) = О (векторы х и —х называются противоположными друг другу)1); д) для любого числа а и векторов х и у а(х + у) = ах + ау\ е) для любых чисел а и /3 и вектора ж (а + /?)ж = аж + /Зж; ж) так же а((3х) = (а/3) ж; 3) для любого вектора ж 1ж = ж и 0ж = 0. В последнем равенстве 0 справа означает нулевой вектор пространства L, а 0 слева — число нуль (они всегда будут изображаться разными шрифтами). Легко доказать, что нулевой вектор в L единственный. Действительно, если бы существовал еще один нулевой вектор 0', то, по определению, мы имели бы равенства О' = О7 + 0 = 0, откуда следует, что 0Г = 0. Исходя из свойств а)-г) и единственности нулевого вектора легко доказать, что для любого вектора ж противоположный вектор —ж единственный. Из свойств ж) и з) следует, что вектор —ж получается умножением вектора ж на число —1. Действительно, так как ж + (-1)ж= 1ж + (-1)ж = (1 + (-1))ж = 0ж = О, 1) Читатель, знакомый с понятием группы, может коротко переформулировать условия а)-г), сказав, что относительно операции сложения векторы образуют коммутативную группу.
3.1. Определение векторного пространства 93 то в силу единственности противоположного вектора получаем (— 1)ж = —ж. Аналогично, из свойств е) и з) вытекает, что для каждого вектора х и натурального числа к вектор кх = х + - • • + х. к раз Замечание о числах и полях. В данном определении следует уточнить, что мы подразумеваем под числами а,/3 и т.д. Большинство читателей, вероятно, будут понимать их как вещественные числа. В этом случае L называется вещественным векторным пространством. Но те, кто владеют понятием комплексного числа, вполне могут понимать числа а,(3и т.д. как комплексные. Тогда L будет называться комплексным векторным пространством. Развиваемая ниже теория будет применима и в этом случае. Наконец, читатель, знакомый с понятием поля, может объединить эти два случая, понимая под числами элементы произвольного поля К. Тогда L называется векторным пространством над полем К. Собственно, такой же вопрос можно было задать и в предыдущих главах, где мы говорили о числах, не уточняя этого понятия. Ответ будет тот же: под числами можно подразумевать вещественные числа, или комплексные числа, или элементы произвольного поля: все рассуждения годятся одинаково в этих трех случаях. Исключением является лишь доказательство свойства 6, приведенное в § 2.2, в котором мы использовали то, что из равенства 2D = О следует D = 0. Поля, для которых это утверждение верно для любого элемента D, называются полями характеристики1), отличной от 2. Однако можно доказать, что и в общем случае свойство 6 выполняется. Пример 3.1. Приведем некоторые примеры векторных пространств. а) Векторы на прямой, на плоскости и в пространстве, которые мы уже обсуждали. б) В § 2.9 были введены понятия сложения матриц и умножения их на числа. Легко проверить, что множество матриц заданного типа (га, п) с определенными таким образом операциями является векторным пространством — для них выполняются условия а)-з), сводящиеся к соответствующим свойствам чисел. В частности, векторным пространством является множество строк (или столбцов) заданной длины п. Это пространство мы будем обозначать через К71, если элементы строк (или столбцов) принадлежат полю К. При этом понимается, что если мы оперируем только с вещественными числами, то К = R и пространство обозначается как Шп. Если мы оперируем с комплексными числами, то К = С и пространство обозначается символом Сп. Читатель может выбрать любое понимание этого обозначения. 1) Для читателя, знакомого с определением поля, можно дать и общее определение: характеристикой поля К называется наименьшее натуральное число к, такое, что kD = = D Н Ь D = 0 для любого ненулевого элемента D еК (как легко видеть, определенное к раз таким образом число к одно и то же для всех D ф 0). Если же такого натурального к не существует (как, например, в случае наиболее часто рассматриваемых полей К = R или К = С), то характеристику полагают равной нулю.
94 Гл. 3. Векторные пространства в) Пусть L есть совокупность всех непрерывных функций на заданном отрезке [а,Ь], принимающих вещественные или комплексные значения. Определим сложение этих функций и умножение их на число обычным способом. Очевидно, что тогда L — векторное пространство. г) Пусть L — совокупность всех многочленов (любых степеней) с вещественными или комплексными коэффициентами, или коэффициентами из поля К. Сложение и умножение на числа определим обычным образом. Очевидно, что L — векторное пространство. д) Пусть L — совокупность всех многочленов, степень которых не превосходит фиксированного числа п. Остальные элементы определения те же, что и в примере 4. Мы опять имеем пример векторного пространства (своего для каждого значения п). Определение. Подмножество L' векторного пространства L называется его подпространством, если для любых векторов х,у е L' их сумма х + у G L' и для любого числа а и вектора х е L' вектор ах eL'. Очевидно, что L/ само является векторным пространством. Пример 3.2. Пространство L является своим подпространством. Пример 3.3. Вектор 0 составляет подпространство, оно называется нулевым и обозначается через (0). Пример 3.4. Рассмотрим пространство, которое исследовалось в аналитической геометрии, состоящее из всех векторов, начало которых совпадает с некоторой фиксированной точкой О. Тогда любая прямая и любая плоскость, проходящие через точку О, будут подпространствами объемлющего векторного пространства. Пример 3.5. Пусть задана система линейных однородных уравнений от п неизвестных с коэффициентами из поля К. Тогда множество строк, являющихся его решениями, образует подпространство 1_; в пространстве Кп строк длины п. Это следует из записи (1.10) такой системы (с Ъ^ = 0) и свойств (1.8) и (1.9) линейных функций. Подпространство L' называется подпространством решений соответствующей системы линейных однородных уравнений. Уравнения системы определяют подпространство L/ так же, как уравнения прямой или плоскости в аналитической геометрии. Пример 3.6. В пространстве всех многочленов совокупность многочленов степени не выше п (при любом фиксированном п) образует подпространство. Определение. Пространство L называется суммой содержащихся в нем подпространств Ц, L2,...,Lfc, если каждый вектор х е L может быть представлен в виде x = xi+x2-\ \-xkl где Xi e Ц. (3.1) В этом случае пишут: L = Ц + 1_2 + • • • + Ц. Определение. Пространство L называется прямой суммой содержащихся в нем подпространств Ц, 1_2,..., Ц, если оно является их суммой и при
ЗА. Определение векторного пространства 95 этом для каждого вектора ж е L представление (3.1) единственно. В этом случае пишут: L = Li©L2e---eLfc. (3.2) Пример 3.7. Пространство, рассматривавшееся в примере 3.4, является суммой двух плоскостей, если они не совпадают; суммой прямой и плоскости, если прямая не содержится в данной плоскости; суммой трех прямых, если они попарно различны. При этом во втором и третьем случае сумма будет прямой. В случае же двух плоскостей, как легко видеть, представление (3.1) не единственно: например, мы можем представить нулевой вектор в виде суммы двух противоположных векторов, лежащих на прямой, получающейся при пересечении данных плоскостей. Пример 3.8. Обозначим через Ц векторное пространство, состоящее из всех одночленов степени г. Тогда пространство L многочленов степени не выше п представимо в виде прямой суммы L = 1_о © Ц © • • • 0 L^. Это следует из того, что любой многочлен однозначно определяется своими коэффициентами. Лемма. Пусть векторное пространство L является суммой некоторых своих подпространств Ц, 1_2,..., Ц. Тогда для того, чтобы L было их прямой суммой, необходимо и достаточно, чтобы соотношение Ж1+ж2Н \-xk = 0, Xi e Ц, (3.3) выполнялось только при всех Х{ — 0. Доказательство. Необходимость условия (3.3) очевидна, так как для вектора 0 е L равенство 0 = О Л V 0, в котором на г-ом месте стоит нулевой вектор подпространства Ц, является представлением типа (3.1), и наличие другого равенства вида (3.3) противоречило бы определению прямой суммы. Для доказательства достаточности условия (3.3) нужно при наличии двух представлений типа (3.1) х = х\ + ж2 Н Ь жь х = у{+у2-\ Ь ук из одного вычесть другое и снова воспользоваться определением прямой суммы. Заметим, что если Ц, L2,...,Lfc — подпространства векторного пространства L, то их пересечение Ц П L2 П • • • П Ц также является подпространством L, так как удовлетворяет всем требованиям определения подпространства. В случае к = 2 доказанная лемма позволяет получить другой, более наглядный критерий того, что сумма подпространств является прямой: Следствие. Пусть векторное пространство L является суммой двух своих подпространств Ц и 1_2. Тогда для того, чтобы L было их прямой суммой, необходимо и достаточно выполнения условия Ц П L2 = (0). Доказательство. Согласно лемме, L является прямой суммой подпространств Ц и L2, если и только если равенство х\ + ж2 = 0, где х\ Е Ц и ж2 G L-2, выполняется только при х\ = 0 и ж2 = 0. Но из х\ +ж2 = О следует, что вектор х\ = —ж2 содержится в обоих подпространствах Ц
96 Гл. 3. Векторные пространства и L_2, а следовательно, он содержится в пересечении Ц П 1_2. Таким образом, условие L = Li 0 L2 равносильно выполнению двух условий: L = Ц + 1_2 и Li П 1_2 = (0), как и утверждает следствие. Заметим, что последнее утверждение не может быть обобщено на случай произвольного числа подпространств 1_1,...,Ц. Например, пусть L — плоскость, состоящая из всех векторов с началом в некоторой фиксированной точке О, и 1_1,1_2,1-з — три лежащие на ней и попарно не совпадающие прямые, проходящие через О. Очевидно, что пересечение любых двух из них содержит только нулевой вектор, и уж тем более, Ц П L-2 П 1_з = (0). Плоскость L является суммой своих подпространств Ц, 1_2,1_з, но не является их прямой суммой, так как очевидным образом можно предъявить равенство х\ + Х2 + хз = 0 для ненулевых векторов Х{ Е Ц. Легко видеть, что если выполнено равенство (3.2), то существует взаимно однозначное соответствие между множеством векторов х е L и множеством Ц х ••• х Ц, являющимся произведением множеств Ц,...,Ц (см. определение на с. 13). Это соображение дает способ строить прямую сумму векторных пространств, которые, вообще говоря, изначально не являются подпространствами никакого общего объемлющего пространства и даже, быть может, имеют совершенно различную природу. Пусть l_i,...,Lfc — векторные пространства. Как и для произвольных множеств, мы можем определить их произведение L = Ц х • • • х Ц, которое в этом случае еще не является векторным пространством. Однако его легко сделать таковым, определив сумму и произведение на число по следующим формулам: (xu...,xk) + (yl,...,yk) = (xi +2/i,...,»fe + yfe), a(x\,...,xk) = (ах1,...9ахк), для любых векторов xi е Ц, yi е Ц, г — 1,..., /с, и любого числа а. Простая проверка показывает, что определенные таким образом операции удовлетворяют всем условиям, перечисленным в определении векторного пространства, и множество L = Ц х • • • х Ц становится векторным пространством, содержащим Li,...,L/. в качестве своих подпространств. Если быть формально точным, то подпространствами L являются не сами Ц, а множества L- = (О) х • • • х Ц х • • • х (0), где на г-ом месте стоит Ц, а на всех остальных — нулевые векторы, принадлежащие всем остальным пространствам, кроме Ц. Однако мы будем закрывать глаза на это обстоятельство, отождествляя Ц с самим Ц. При этом, очевидно, будет выполнено условие (3.2). Таким образом, для любых заданных независимо друг от друга векторных пространств Ц,..., Ц всегда можно построить такое пространство L, которое содержит все Ц и является их прямой суммой, т. е. L = Ц © • • • 0 Ц. Пример 3.9. Пусть Ц — пространство, рассмотренное в примере 3.4, т.е., фактически, окружающее нас физическое пространство, и I_2 = R — вещественная прямая, являющаяся осью времени. Действуя так, как было сказано выше, мы можем определить прямую сумму L = Ц ф 1_2. Векторы построенного пространства L называются пространственно-временными событиями и имеют вид (x,i), где х £ Ц — пространственная,
3.2. Размерность и базис 97 a t е L2 — временная компоненты. При сложении таких векторов их пространственные компоненты складываются между собой (как векторы физического пространства, например, по «правилу параллелограмма»), а временные компоненты — друг с другом (как вещественные числа). Аналогичным образом происходит и умножение на числа. Это пространство играет большую роль в физике, в частности, в теории относительности, где оно называется пространством Минковского, правда, для этого в нем еще нужно ввести дополнительную структуру — специальную квадратичную форму. Мы вернемся к этому вопросу в § 7.7 (с. 271). § 3.2. Размерность и базис Мы будем пользоваться здесь понятием линейной комбинации, которое в случае пространства строк длины п было уже введено раньше (см. определение на с. 70). Сейчас мы повторим это определение фактически дословно. Для этого заметим, что, применяя повторно операцию сложения векторов и умножения их на число, мы можем образовывать и более сложные выражения, такие, как а\х\ + ода^ Н Ь атжт, причем согласно свойствам а) и б) из определения векторного пространства, они не зависят ни от порядка слагаемых, ни от расстановки скобок (которая нужна, чтобы вместо двух сложить т векторов). Определение, Пусть в пространстве L заданы т векторов: х\, Х2,..., хт. Вектор у является их линейной комбинацией, если у = а\х\ + OL2X2 Л V осшхш, (3.4) где oq,a2,...,am — некоторые числа. Совокупность всех векторов, являющихся линейными комбинациями заданных векторов х\,Х2,... ,хт, т.е. имеющих вид (3.4) при всевозможных ai,c*2,...,am, очевидно, удовлетворяет определению подпространства. Это подпространство называется натянутым на векторы х\,Х2,... ,хт и обозначается (ж 1,Ж2,... ,жт). Очевидно, что (жьж2,...,жш) = (х\) + (ж2)Н Ь (хт). (3.5) Определение. Векторы х\, Х2,..., хт называются линейно зависимыми, если существует их линейная комбинация (3.4), равная О, у которой не все коэффициенты а\,а2,... ,осш нулевые. В противном случае векторы х\, X2,..., Хт называются линейно независимыми. Таким образом, векторы х\,Х2,-..,хт линейно зависимы, если для некоторых чисел ai,c*2,... ,am имеет место соотношение а\х\ + ОДЖ2 Н Ь атжт = 0, (3.6) причем хотя бы одно щ ф 0. Например, векторы х\ и Х2 = —х\ линейно зависимы. Наоборот, векторы жьЖ2,...,жт линейно независимы, если соот- 4 А. О. Ремизов, И. Р. Шафаревич
98 Гл. 3. Векторные пространства ношение (3.6) имеет место только при а\ = а2 = • - • = ат = 0. В этом случае сумма (3.5) является прямой, т. е. (ж1,ж2,...,жш) = (ж1> е (х2) е---е (хт). Полезная переформулировка: векторы xi,X2,-~,xm линейно зависимы тогда и только тогда, когда какой-то из них является линейной комбинацией остальных. Действительно, если Xi — а\х\ Н Ь oti-iXi-i + ai+\Xi+i H \- атхт1 (3.7) то мы имеем соотношение (3.6) с с^ = — 1. Наоборот, если в (3.6) коэффициент щ Ф 0, то, перенося член щхг в правую часть и умножив обе части равенства на число — а^1, мы получим выражение Х{ в виде линейной комбинации жь ... ,а^-ьжг+ь ••• »жт- Наконец, мы можем сформулировать главное определение этого параграфа (а пожалуй, и всей этой главы). Определение. Размерностью векторного пространства L называется максимальное число его линейно независимых векторов, оно обозначается символом dimL. Если такое натуральное число существует, то говорят, что пространство L конечномерно, в противном случае оно называется бесконечномерным. Размерность пространства (0) по определению будет полагаться равной нулю. Таким образом, размерность пространства равна натуральному числу п, если в нем существуют п линейно независимых векторов, но всякие т векторов при т > п линейно зависимы. Пространство бесконечномерно, если в нем существует любое наперед заданное число линейно независимых векторов. Применяя привычную терминологию, мы будем называть прямой пространство размерности 1 и плоскостью — пространство размерности 2. Пример 3.10. Из школьной геометрии (или из курса аналитической геометрии) известно, что векторы на прямой, на плоскости и в окружающем нас физическом пространстве образуют векторное пространство размерности 1, 2 и 3 соответственно. Это и есть главное интуитивное основание общего определения размерности. Пример 3.11. Пространство всех многочленов, очевидно, бесконечномерно, так как для любого натурального числа п многочлены 1,£,£2,... , in_1 линейно независимы. Тем более, бесконечномерно пространство всех функций, непрерывных на интервале [а, Ь]. Размерность векторного пространства L существенно зависит не только от самого множества, элементы которого являются векторами L, но и от того, над каким полем оно рассматривается. Это видно из следующих примеров. Пример 3.12. Пусть Ц — пространство, векторами которого являются комплексные числа, рассматриваемое над полем С. Операции сложения векторов и умножения на числа в нем определим как обычные операции сложения и умножения комплексных чисел. Тогда, как легко видеть из определения, diml_i = 1. Если теперь мы рассмотрим векторное пространство 1_2, также со-
3.2. Размерность и базис 99 стоящее из комплексных чисел, но рассматриваемое над полем R, то получим dim l_2 = 2. Это, как мы увидим, следует из того, что каждое комплексное число однозначно задается парой вещественных чисел (его вещественной и мнимой частью). Часто встречающееся выражение «комплексная плоскость» подразумевает двумерное пространство 1_2 над полем R, а выражение «комплексная прямая» означает одномерное пространство Ц над полем С. Пример 3.13. Пусть L — векторное пространство, состоящее из вещественных чисел, но рассматриваемое над полем Q (как легко видеть, все условия в определении векторного пространства при этом выполнены). При этом в линейной комбинации (3.4) векторы xi и у — это вещественные числа, (xi — рациональные. Из доказанных в курсе анализа свойств числовых множеств следует, что пространство L бесконечномерно. Действительно, если бы размерность L была бы равна некоторому конечному числу п, то, как будет доказано ниже, это означало бы, что существуют числа х\,...,хп Е R, такие, что любое у е R является их линейной комбинацией (3.4) с подходящими коэффициентами ai,...,an из поля Q. Но это означало бы, что множество вещественных чисел счетно, что, как известно из анализа, не верно. Очевидно, что размерность подпространства L/ векторного пространства L не превосходит размерности самого L. Теорема 3.1. Если размерность подпространства L/ равна размерности конечномерного пространства Ц то подпространство L' совпадает с L. Доказательство. Пусть dimL' = dimL = п. Тогда в L' имеется п линейно независимых векторов х\,...,хп. Если L' ф L, то в L существует вектор х ^ L'. Поскольку dimL = n, то любые п + 1 векторы этого пространства линейно зависимы. В частности линейно зависимы векторы жь... ,хп,х, т. е. существует соотношение а\Х\ Н Ь OLnxn + ах = О, в котором не все коэффициенты равны 0. Равенство а — 0 дает линейную зависимость векторов жь...,жп, которые линейно независимы по предположению. Значит, а/0иж = (3\Х\ Н + (Зпхп, где /% = — а~1щ, откуда вытекает, что х — линейная комбинация векторов х\,...,жп. Из определения подпространства очевидно вытекает, что линейная комбинация векторов из L' также является вектором из 1Л Таким образом, х е L7, и L' = L. Если размерность пространства L конечна: dim L = п, а подпространство L' с L имеет размерность п — 1, то !_' называется гиперплоскостью в L. Приведенное выше определение размерности имеет недостаток — оно неэффективно. Теоретически, для того, чтобы определить размерность пространства, нужно было бы перебрать все системы векторов х\,...,хт при различных т в нем и выяснить, будут ли они линейно независимыми. Таким способом не так просто найти размерность пространства строк длины п 4*
100 Гл. 3. Векторные пространства или пространства многочленов степени ^ п. Поэтому мы исследуем понятие размерности еще подробнее. Определение. Векторы е\,...,еп векторного пространства L называются его базисом, если они линейно независимы и любой вектор пространства L является их линейной комбинацией. Таким образом, если е\,...,еп — базис пространства L, то для любого вектора х е L существует представление в виде х = а\е\ + а2е2 Н Ь апеп. (3.8) Теорема 3.2. Для любого вектора х представление (3.8) единственно. Доказательство. Это прямое следствие того, что векторы е\,...,еп образуют базис. Предположим, что существуют два представления х = а\е\ + а2е2 Н Ь апеп, х = (3\е\ + f32e2 Н Ь Рп^п- Вычитая одно равенство из другого, мы получим, что (ai - Р\)е\ + (а2 - (32)е2 + • • • + К - Рп)еп = О. Но так как векторы е\,...,еп образуют базис, то, согласно определению, они линейно независимы. Отсюда следует, что а\ = (3i,a2 — /?2» ••• >an = Pn, что и утверждалось теоремой. Следствие. Если е\,..., еп — базис пространства L, то оно предста- вимо в виде L = (ei)e(e2)e---0(en}. Определение. Числа ai,... ,ап в представлении (3.8) называются координатами вектора х относительно базиса е\,...,еп (или координатами в этом базисе). Пример 3.14. Любой вектор е ф О на прямой образует базис. Для любого вектора х той же прямой мы имеем представление (3.8), которое в данном случае принимает вид х = ае с некоторым числом а. Это а и является координатой (в данном случае — единственной) вектора х в этом базисе е. Если е' Ф 0 — другой вектор той же прямой, то он дает другой базис. Мы видели, что ef — се при некотором числе с ф 0 (так как ег ф 0). Поэтому из соотношения х = ае получаем, что х = ас~1 е!. Таким образом, в базисе е' координата вектора х равна ас'1. Итак, мы видели, что координаты вектора х зависят не только от этого вектора, но и от базиса, которым мы пользуемся (в общем случае, еь... ,еп). Следовательно, координаты вектора — это совсем не его «внутреннее», «геометрическое» свойство. Положение здесь похоже на измерение физических величин: длин отрезков или масс тел. Ни те, ни другие только числами не характеризуются, нужно еще иметь единицу измерения: в первом случае — метр, сантиметр и т.д., во втором — килограмм, грамм и т.д. С таким явлением мы будем сталкиваться постоянно: некоторый объект (как, например,
3.2. Размерность и базис 101 вектор) не может быть «сам по себе» определен какими-либо числами, для этого нужен еще выбор чего-то подобного единице измерения (в данном случае — базиса). Тут всегда возможны две точки зрения: либо выбрать некоторый способ сопоставления объекту чисел, либо ограничиться изучением его «чисто внутренних» свойств, не зависящих от способа сопоставления. Например, в физике нас интересуют сами физические величины, но законы природы обычно выражаются в виде математических соотношений между характеризующими их числами. Мы постараемся согласовать обе точки зрения, определив, как меняются числа, характеризующие объект, при изменении способа сопоставления их объекту. В частности, в § 3.4 будет рассмотрен вопрос, как изменяются координаты вектора при выборе другого базиса. В терминах координат векторов (относительно произвольного базиса е\,..., еп) легко выражаются операции, входящие в определение векторного пространства: сложение векторов и умножение вектора на число. А именно, если х и у — два вектора и х = а\е\ Н Ь апеп, у = Р\е\-\ Ь /ЗпеП9 то х + у = (a\ei Н Ь апеп) + (ftei Н Ь (Зпеп) = = (ai+(3l)ei + -.- + (an + pn)en (3.9) и для любого числа а ах = а(а\е\ Н Ь апеп) = (aai)ei H Ь (аап)еп, (3.10) так что координаты векторов при сложении складываются, а при умножении на число — на это же число умножаются. Из определения базиса вытекает, что если dimL = п и ei,...,en — любые п линейно независимых векторов из L, то они образуют базис в L. Действительно, достаточно проверить, что любой вектор х е L является линейной комбинацией этих векторов. Но по определению размерности, п + 1 векторов ж,еь...,еп линейно зависимы, т.е. /Зх + а\е\ + о>2е2 Н Ь апеп = 0 при некоторых числах /?,а\,а2,... ,ата. При этом /? / 0, иначе это противоречило бы линейной независимости векторов базиса. Но тогда х = -(3~ха\е\ - /3~1а2е2 (3~1апеПУ что и надо было проверить. Теорема 3.3. Если Ц и \-2 — два конечномерных пространства, то dim (Ц © 1_2) = dim Ц + dim l_2- Доказательство. Пусть dimЦ = г, dimL2 = s и е\,..., еТ — базис пространства l_i, a /i,...,/s — базис пространства 1_2. Проверим, что совокупность г + s векторов ei,...,er, f\,---,f8 образует базис в пространстве Lj © L2. По определению прямой суммы, любой вектор х е Ц ф L2 представля-
102 Гл. 3. Векторные пространства ется в виде х = х\ + Х2, где ж* € Ц. Но вектор х\ есть линейная комбинация векторов ei,...,er, а вектор X2 — линейная комбинация векторов /i,...,/e. В результате мы получаем представление вектора х линейной комбинацией r + s векторов ei,... ,er, /j,... ,/s. Так же просто проверяется линейная независимость этих векторов. Пусть существует соотношение aiei + • • • + arer + /?i/i + • • • + AJS = 0. Положим х\ = a\e\ H h arer и Ж2 - A/H + Psf8- Тогда выполнено равенство x\+X2~0, причем X{ G Ц. Отсюда, по определению прямой суммы, следует, что х\ = 0 и Х2 — 0. Из линейной независимости векторов е\,..., ег вытекает, что а\ = 0,..., аг = О, и аналогично /?i = 0,..., /3S — 0. Следствие. Для конечномерных пространств Ц, 1_2,..., Ц пр^ любом k ^ 2 имеем dim (Li 0 L2 ф • • • 0 Ц) = dim Li + dim L2 H h dim Ц. Это утверждение легко вытекает из теоремы 3.3 индукцией по числу к. Из определения следует, что если размерность пространства L равна п, то в нем существуют п линейно независимых векторов, которые, по доказанному, и образуют базис. Сейчас мы установим более общий факт. Теорема 3.4. Если е\,..., ет — линейно независимые векторы в пространстве L конечной размерности п, то их можно включить в базис е\,..., em, em+i»• • •»еп этого пространства. Доказательство. Если векторы ei,...,em уже образуют базис, то теорема доказана. Если они базис не образуют, то в L существует вектор em+i, не являющийся их линейной комбинацией. Тогда векторы ei,...,em+i линейно независимы. Действительно, их линейная зависимость давала бы соотношение а\е\-\ bamem + am+iem+i = 0, (3.11) в котором не все числа ai,...,am+i равны нулю. Тогда am+i ф 0, так как иначе мы получим, что векторы е\,... ,ет линейно зависимы. Но тогда из соотношения (3.11) вытекает, что em+i = f3\e\ H h /3mem, где /3^ = -а^+^г, т.е. вектор em+i является линейной комбинацией векторов ei,... ,em, вопреки предположению. То же рассуждение можно применить к системе векторов ei,...,em+i. Продолжая таким образом, мы будем получать системы, содержащие все большее и большее число линейно независимых векторов и рано или поздно остановимся, так как размерность пространства L конечна. Но тогда любой вектор пространства L будет являться линейной комбинацией линейно независимых векторов построенной системы, т. е. она образует базис. В ситуации, о которой идет речь в теореме 3.4, мы будем говорить, что система векторов ei,...,em дополнена до базиса ei,...,en. Как показывает очевидная проверка, это равносильно соотношению (eb...,en) = (eb...,em) © (em+i,... ,en). (3.12)
3.2. Размерность и базис 103 Следствие. Для любого подпространства L' с L конечномерного пространства L существует такое подпространство L" с Ц что L = L' © L". Доказательство. Достаточно выбрать любой базис ei,...,em в L', дополнить его до базиса е\,...,еп пространства L и положить в равенстве (3.12) L = (eb...,en), L' = (еь...,ет) и L" = (ет+ь... ,еп). Сейчас мы докажем утверждение, которое является центральным пунктом всей теории. Поэтому мы приведем два его доказательства (правда, основывающиеся на одном и том же принципе). Лемма. Более чем п линейных комбинаций п векторов любого векторного пространства обязательно линейно зависимы. Первое доказательство. Выпишем в явном виде все, что нам нужно доказать. Пусть даны п векторов х\9...,хп и т их линейных комбинаций 2/1,... ,уш, причем т> п. Значит, имеют место соотношения ( У\ = ацЖ1 + ai2#2 H Ь ain^n, I 2/2 = а21#1 + а22#2 Н 1" а2пЖп, /Q - оч У Ут = ат\Я\ + аш2Ж2 Н Ь атпЖп при некоторых числах ац. Нам надо найти такие числа ai,...,am, не все из которых равны нулю, что «11/1 + ^22/2 + Ь «тУт = 0. Подставляя сюда соотношения (3.13) и приводя подобные члены, мы получим (а\ац + Q^2a2i Н Ь атат\) х\ + (а\а\2 + ос^а^ Л V осшат2) #2 Н V + (<xia\n + а2а2п Н Ь <У.татп) хп = 0. Это равенство будет заведомо выполнено, если в нем равны нулю все коэффициенты при векторах жь ...,жте, т.е. удовлетворяются уравнения f а\\а\ + a2ic*2 Н Ь amiam — О, I а12«1 + а22«2 Н V ^т2^т = О, I а\па\ + а2па2 Н Ь атпат = 0. Так как по условию т > п, то мы имеем п однородных уравнений для более чем п неизвестных ai,...,am. Согласно следствию теоремы 1.4, эта система имеет ненулевое решение аь... ,am, что и дает утверждение леммы. Второе доказательство проведем индукцией по числу п, также основываясь на формуле (3.13). Основание индукции п = 1 очевидно: любые т векторов, пропорциональных данному вектору х\, линейно зависимы, если т > 1. Теперь рассмотрим случай произвольного п > 1. Пусть в формуле (3.13) коэффициент а\\ ^ 0. Это предположение не несет в себе никаких огра-
104 Гл. 3. Векторные пространства ничений. Действительно, если в формуле (3.13) все коэффициенты а^ = 0, то все векторы У\,.,ут равны 0, и теорема верна (тривиально). Если же хотя бы один коэффициент ац Ф 0, то, изменяя нумерацию векторов х\,...,хп и 2/1,...,уш, мы можем переместить этот коэффициент в левый верхний угол, и считать, что а\\ Ф 0. Теперь вычтем из векторов У2тчУт вектор ух с таким коэффициентом, чтобы в соотношениях (3.13) вектор х\ сократился. После этого мы получим векторы 2/2 -72l/i,...,l/m-7m!/i, где 72 = аГ/а2Ь---'7m = a>Yiam\- Эти га- 1 векторов являются уже линейными комбинациями п—\ векторов Ж2,...,жп. Применяя индукцию по п, мы можем считать в этом случае лемму верной. Значит, существуют такие числа а2,...,ат, не все равные нулю, что &2(У2 ~ 721/0 + * ' • + ат{Ут ~ 1тУ\) = О, Т. е. - (72ОД Н Ь 7ш«ш) У\ + ОС2У2 Л V (У-гпУт = ° Значит, векторы уь... ,уш линейно зависимы. Легко заметить, что, по существу, во втором доказательстве мы использовали метод Гаусса, при помощи которого была доказана теорема 1.4, служащая основой первого доказательства. Так что оба они основываются на одной идее. Связь понятий базиса и размерности видна из следующего результата. Теорема 3.5. Если в векторном пространстве L существует базис из п векторов, то оно имеет размерность п. Доказательство теоремы очевидным образом вытекает из леммы. Пусть ei,...,en — базис пространства L, покажем, что diml_ = n. В этом пространстве есть п линейно независимых векторов — например, сами векторы ei,...,en. И так как любой вектор из L - линейная комбинация векторов базиса, то, согласно лемме, в нем не может быть большего числа линейно независимых векторов. Следствие. Теорема 3.5 показывает, что все базисы пространства состоят из одинакового числа векторов, равного размерности пространства. Поэтому для того, чтобы найти размерность, достаточно отыскать в пространстве какой-либо один его базис. Как правило, это гораздо легче. Например, очевидно, что в пространстве многочленов (от переменной t) степени < п базисом являются многочлены 1,£,£2,... ,tn. Значит, размерность этого пространства равна п+ 1. Пример 3.15. Рассмотрим пространство Кп строк длины п, состоящих из элементов произвольного поля К. В этом пространстве базис составляют строки ( ег = (1, 0, 0, ..., 0), е2 = <0''-0 °>' (3.14) I е„ = (0, 0, 0, .... 1).
3.2. Размерность и базис 105 В § 1.1 при доказательстве теоремы 1.1 мы проверили, что каждая строка длины п является линейной комбинацией этих п строк. То же рассуждение показывает, что эти строки линейно независимы. Действительно, предположим, что ot\e\ + Ь оспеп = 0. Как мы видели в указанном рассуждении, строка а\е\-\ Ь апеп равна (аь... ,ап). Значит, а\ = • • • = ап = 0. Таким образом, размерность пространства Кп равна п. Пример 3.16. Пусть М — произвольное множество. Обозначим через F{M) совокупность всех функций на М, принимающих числовые значения (вещественные, комплексные или из произвольного поля К). Множество F(M) будет векторным пространством, если для fx е F(M) и /2 Е F(M) определить сумму и умножение на число а по формуле (/i + /2)(s) = /i(*) + /2(*). (<*/)(*) = <*f(x) для любого ж G М. Предположим, что множество М конечно. Обозначим через 6х(у) функцию, которая равна 1 при у — х и 0 при всех у ф х. Функции 5х(у) называются 5-функциями. Покажем, что они образуют базис пространства F{M). Действительно, для любой функции / g F{M) мы имеем очевидное равенство /(У) = Е №)Ш, (3-15) хем откуда следует, что любая функция из пространства F{M) представима в виде линейной комбинации 5Х9 х е М. Очевидно, что набор всех <5-функций является линейно независимым, т.е. является базисом пространства F(M). Так как число функций в этом наборе равно числу элементов множества М, то пространство F(M) конечномерно и dimF(M) совпадает с числом элементов М. В частности, если М = Nn (см. обозначение на стр. 7), то любая функция / е F(Nn) однозначно задается совокупностью своих значений /(1),... ,/(п), являющихся ее координатами в разложении (3.15) по базису 6Х9 х е М. Если положить сц = /(г), то числа (аь... ,ап) образуют строку, а это показывает, что пространство F(Nn) совпадает с пространством Кп. В частности, базис пространства F(Nn), состоящий из 5-функций, совпадает с базисом (3.14) пространства Кп. Теорема 3.5 во многих случаях дает простой способ нахождения размерности векторного пространства. Теорема 3.6. Размерность пространства (х\,..., хт) равна максимальному числу линейно независимых векторов среди жь ... ,хт. Таким образом, если определение размерности требует рассмотрения всех векторов пространства (яз1,...,жш), то доказываемая теорема 3.6 позволяет ограничиться рассмотрением только векторов жь... ,хт. Доказательство. Положим L/ = (х\,... ,хт) и обозначим через I максимальное число линейно независимых векторов среди жь...,жт. Изменяя, если нужно, нумерацию, мы можем предполагать, что линейно независимыми являются первые I векторов жь...,ж/. Пусть L" = (х\,... ,ж/}. Очевидно,
106 Гл. 3. Векторные пространства что x\,...,xi образуют базис в пространстве L", и согласно теореме 3.5, dimL" = I. Докажем, что L" = L', что и даст утверждение теоремы 3.6. Если I = га, то это очевидно. Пусть I < га. Тогда, по условию, для любого к = I + 1, ..., га векторы х\,... ,xi,Xk линейно зависимы, т.е. существует линейная комбинация а\Х\ -\ + а\х\ + ос^Хк = 0, в которой не все а% равны нулю. Но более того, обязательно а& Ф 0, так как иначе мы получили бы линейную зависимость векторов x\,...,xi, что противоречит предположению. Тогда Хк = —ol^ ol\x\ — а^ о>2Х2 а£ ol\Xi, т.е. вектор ж& Е L". Мы доказали это для всех к > I, но, по построению, это верно и для к ^ I. Значит, все векторы ж& принадлежат пространству L", а следовательно, и все их линейные комбинации — тоже. Таким образом, не только L" с L/ (что очевидно по построению), но и L' с L", а это показывает, что L" = L/, что и требовалось. Следствие. £а/ш Li,..., Lr и L — такие пространства, что L = Ц + Н \-Lr, и при этом dim L = dim Ц Н + dim Lr, /тго L = Ц 0 • • • © Lr. Доказательство. Выберем в каждом из Ц базис и объеденим их в единую систему векторов ei,...,en. По условию, число п векторов в этой системе будет равно dimL и L = (ej,... ,еп). Согласно теореме 3.6, векторы ei,...,en линейно независимы, а это и значит, что L = Ц 0 • • • © 1_г. Изложенные соображения позволяют дать более наглядную, геометрическую характеристику понятия линейной зависимости. А именно, докажем, что векторы х\,...,хт линейно зависимы тогда и только тогда, когда они содержатся в подпространстве L' размерности меньше га. Действительно, обозначим через I наибольшее число линейно независимых векторов среди х\,...,хт. Предположим, что эти независимые векторы — это x\,...,xi и положим 1У = (жь...,ж/). Тогда при I = т векторы х\,...9хт линейно независимы, и наше утверждение следует из определения размерности. Если же I < га, то все векторы х\,...,хт содержатся в подпространстве L7, размерность которого равна I, согласно теореме 3.5, и утверждение тоже верно. Пользуясь введенными понятиями, можно доказать полезное обобщение теоремы 3.3. Теорема 3.7. Для любых двух конечномерных пространств Ц и 1-2 имеет место равенство dim(Li +L2) = dim Ц +diml_2 - dim(l_i П L2). (3.16) Теорема 3.3 получается как простое следствие теоремы 3.7. Действительно, если Ц + 1_2 = Ц 0 1_2, то, согласно следствию из леммы § 3.1 (с. 95), пересечение Ц П 1_2 = (0), и остается лишь воспользоваться тем, что dim(0) = 0. Доказательство. Обозначим 1_о = Ц П L-2. Из следствия теоремы 3.4 вытекает существование таких подпространств Ц с Ц и Ц С 1-2, что Ц-Ц©^, L2 = L0©14 (3.17)
3.2. Размерность и базис 107 Формула (3.16) легко следует из равенства Ц + 1_2 = L-o 0 L\ © Ц. Действительно, так как Lo = Ц П L2, то ввиду соотношений (3.17) и теоремы 3.3 мы получим Ц + L.2 = Li © Ц и, следовательно, dim(l_i + L2) = dim Ц + dim Ц = dim Li + dim L2 — dim Lo, что и дает соотношение (3.16). Докажем, что Ц + I_2 = Lo © L\ © L2. Ясно, что все подпространства Lo, L\ и L2 содержатся в Li + L2, так что их сумма Lq + L\ + \J2 тоже содержится в Li + L2. Но любой вектор z G Li + L2 представляется в виде z = х + г/, где х G Li, у G L2, а ввиду соотношений (3.17) мы имеем представления х = и + v и у = и' + w, где и, и' G Lo, v e L\, we \J2, откуда получаем z = ж + у = = (ге + u7) + v + гу, и значит, вектор z содержится в Lq + L[ + \J2. Отсюда следует, что L1+L2 = Lo + L,1 + L^L1 + L/2. Но Li П И2 = (О), так как вектор х G Li П L2 содержится и в Li П L2 = Lo, и в Ц, а ввиду (3.17) пересечение Lo П L2 = (О). В результате мы получаем нужное нам равенство Ц + L2 - (L0 Ф L[) + L72 - (L0 © L{) ©L^L09 Ц © L72, что, как мы видели, и доказывает теорему 3.16. Следствие. Пусть L\ и L2 — подпространства конечномерного пространства L. Тогда из неравенства dimLi +dimL2 > dimL следует, что Ц П L2 ф (0), т. е. подпространства Li и L2 имеют общий ненулевой вектор. Действительно, в этом случае Li + L2 С L, и значит, dim (Li + L2) ^ dim L. С учетом этого из соотношения (3.16) получаем dim (Li П L2) = dim Li + dim L2 — dim (Li + L2) ^ dim Li + dim L2 — dim L > 0, откуда следует, что Li П L2 ф (0). Например, две плоскости, проходящие через начало координат в трехмерном пространстве, имеют общую прямую. Теперь мы получим выражение для размерности подпространства (а\,..., ат), использующее аппарат теории определителей. Пусть ai,...,am — векторы пространства L и ei,...,en — любой его базис. Запишем координаты вектора a,i в этом базисе в виде г-ой строки матрицы А: (а\\ а\2 ••• а\п\ й2\ а22 '" CL2n \Q>rn\ а>т2 ' ' ' атп/ Теорема 3.8. Размерность пространства (сц,..., ат) равна рангу мат- рицы А. Доказательство. Линейная зависимость векторов аь...,а& при к^т равносильна линейной зависимости строк матрицы А с теми же номерами.
108 Гл. 3. Векторные пространства В теореме 2.16 мы доказали, что если ранг матрицы равен г, то все ее строки являются линейными комбинациями некоторых г строк. Отсюда уже следует, что dim(ai,... ,ат) ^ г. Но на самом деле из доказательства теоремы 2.16 следует и то, что в качестве таких г строк можно взять любые г строк матрицы, в которых расположен некоторый отличный от нуля минор порядка г (см. замечание после теоремы 2.16). Покажем, что такие г строк линейно независимы, из этого уже будет следовать доказательство теоремы 3.8. Мы можем предполагать, что ненулевой минор Мг стоит в первых г столбцах и первых г строках матрицы А. Тогда нам нужно проверить линейную независимость векторов ai,...,ar. Если мы предположим, что а\а\ Н +агаг = 0, то, обращая внимание лишь на первые г координат векторов, получим г линейных однородных уравнений для неизвестных коэффициентов ai,...,ar. Как легко видеть, определитель матрицы этой системы равен МТ ф 0, и следовательно, она имеет только одно, нулевое решение: а\ = 0,..., аг = 0, т. е. векторы а\,..., аг действительно линейно независимы. В более ранние времена теорема 3.8 формулировалась в следующей форме, которая тоже иногда полезна. Рассмотрим пространство Кп строк длины п (где К — поле вещественных или комплексных чисел, или любое произвольное поле). Тогда векторы щ будут строками длины п (в нашем случае — строками матрицы А). Из доказанной теоремы 3.8 следует Следствие 1. Ранг матрицы совпадает с максимальным числом ее линейно независимых строк. Отсюда вытекает неожиданное Следствие 2. Ранг матрицы также равен максимальному числу ее линейно независимых столбцов. Это утверждение сразу следует из определения ранга матрицы и теоремы 2.11. В заключение параграфа рассмотрим более подробно случай вещественных пространств и введем для них некоторые важные понятия, которые будут использованы в дальнейшем. Пусть L' — гиперплоскость в конечномерном вещественном пространстве L, т.е. dimL/ = dimL— 1. Тогда она делит L на две части, как это изображено, в частности, на рис. 3.4, а и б для прямой и плоскости. Действительно, так как L' ф L, то су- ^^/^/^ L ществует вектор е £ L, е £ \J. Отсю- L' ^vvvvw , да слеДУет> что L = L' © (е). Действительно, согласно выбору е, пересечение [_' п (е) ~ (0), и по теореме 3.3 мы имеем равенство dim(L/ © (е)) = dim L7 + 1 = dim L, Рис. 3.4. Гиперплоскость в пространстве из которого с ПОМощью теоремы 3.1 получаем L' © (е) = L. Таким образом, любой вектор х £ L может быть однозначно представлен в виде
3.2. Размерность и базис 109 х = ае + и, гх £ L', (3.18) где а — некоторое число. Так как числа в нашем случае вещественные, то имеет смысл говорить об их знаке. Совокупность тех векторов ж, в представлении (3.18) которых а > 0, обозначается через L4". Точно так же множество векторов ж, в представлении (3.18) которых а < 0, обозначается через L~~. Множества 1_+ и L- называются полупространствами пространства L. Очевидно, что L \ L' = L+ U 1_~. Конечно, наша конструкция зависит не только от гиперплоскости 1_;, но и от выбора вектора е £ L'. Важно, что хотя при изменении вектора е полупространства L+ и L- могут измениться, но их пара (L+,L~) остается прежней, т. е. они либо не изменяются, либо просто меняются местами. Действительно, пусть е' ф L/ — какой-нибудь другой вектор. Тогда он представляется в виде е1 — Ле + v, где число Л ф 0 и v E L;. Значит, е = A_1(e7 — v). Тогда для любого вектора ж из (3.18) получаем аналогичное (3.18) представление х = аЛ-1 (е; - v) + и = а\~1 е' + и\ v! G L7, где вектор uf — и — a\~lv, и видим, что при переходе от е к е' число а в разложении (3.18) умножается на Л-1. Таким образом, полупространства 1_+ и 1_~ не изменяются, если Л > 0, и меняются местами, если Л < 0. Определенное выше понятие разбиения вещественного пространства L гиперплоскостью !_' имеет естественную интерпретацию в топологических терминах (с. 13-15). Читатель, не интересующийся этим аспектом рассматриваемых понятий, может пропустить пять следующих абзацев. Для того, чтобы использовать топологические термины, необходимо ввести в L понятие сходимости последовательности векторов. Мы сделаем это с помощью понятия метрики (с. 14). Выберем в L произвольный базис е\,..., еп и для векторов х = а\е\ + • • - + апеп и у = /3\е\ + • • • + (Зпеп определим число г(ж, у) формулой г(ж,y) = \ai-/3i\-\ Ь \ап - /Зп\. Из свойств модуля очевидно следует, что все три условия в определении метрического пространства выполняются. Таким образом, векторное пространство L и все его подмножества становятся метрическими пространствами с метрикой г(х,у), и для последовательности векторов автоматически определено понятие сходимости: ж/- —> х при к —> оо, если г(жь ж) —> 0 при к —> оо. Иначе говоря, если ж = а\е\ Н h апеп и х^ = ос\^е\ -\ \- ап^еп, то сходимость Xk —> ж равносильна сходимости п последовательностей координат: &ik —> &>% при всех г = 1,..., п. Заметим, что при определении г (ж, у) мы использовали координаты векторов ж и у в некотором базисе, и следовательно, полученная метрика зависит от выбора базиса. Несмотря на это, понятие сходимости от выбора базиса ei,...,en не зависит. Это легко следует из формул (3.35), связывающих координаты вектора в разных базисах, которые будут выведены позже. Смысл разбиения L \ L7 = l_+ U L- заключается в том, что метрическое пространство L \ L' не является линейно связным, a L+ и L" - его линейно связные компоненты.
по Гл. 3. Векторные пространства Действительно, предположим, что в метрическом пространстве L \ L' существует деформация вектора ж в у, т.е. непрерывное отображение /: [0,1] —> L\ L', такое, что /(0) = х и /(1) = у. Тогда согласно формуле (3.18) мы имеем представления х = ае + и, y = pe + v, f(t) = ^{t)e + w(t), (3.19) где векторы и, v e L' и w(t) e L/ при всех t е [0,1] и ^{t) — функция, принимающая вещественные значения и непрерывная на отрезке [0,1], причем 7(0) = а и 7(1)=/?. Если ж е 1_+ и ж Е 1_~, то с* > 0 и /? < 0, и вследствие известных из математического анализа свойств непрерывных функций, ^(т) — 0 при некотором 0 < т < 1. Но тогда вектор /(т) = ги(т) содержится в гиперплоскости 1_;, и следовательно, векторы ж и у не могут быть деформируемы друг в друга во множестве L \ L'. Таким образом, метрическое пространство L \ L' не является линейно связным. Если же х,у £ 1_+ или ж, у е L~, то в представлениях (3.19) для этих векторов числа а и (3 имеют одинаковый знак. Тогда, как легко видеть, отображение f(t) = (1 — t)x + ty, t e [0,1], задает непрерывную деформацию ж в у во множестве L+ или L- соответственно. Из этих соображений легко получить доказательство предшествующего утверждения, не использующие никаких формул. Если в паре полупространств L+ и L~ выбрано какое-то одно (которое мы будем обозначать через 1_+), то пара (L, L7) называется направленной. Например, в случае прямой (рис. 3.4, а) это соответствует выбору направления прямой L. Используя введенные понятия, можно получить более наглядное представление о понятии базиса (в случае вещественных пространств). Определение. Флагом в конечномерном вещественном пространстве L называется последовательность подпространств (0) С Ц с L2 с • • • С U = U (3.20) такая, что а) dim Ц = г для всех г = 1,..., п, б) каждая пара (U,U_i) является направленной. Очевидно, что ввиду условия а) подпространство Ц_1 является гиперплоскостью в Ц, поэтому приведенное выше определение направленности применимо. Каждый базис ei,...,en пространства L определяет некоторый флаг. А именно, положим Ц = (е\,...,е{) и для заДания направленности пары (U,U_i) выберем дающие один и тот же в качестве полупространства L^" то, которое определяет- флаг ся вектором е; (очевидно, что е^ ^ U_i). Нужно заметить однако, что разные базисы пространства L могут определять один и тот же флаг. Например, на рис. 3.5 базисы (еь в2) и (ei, e'2) на плоскости определяют один и тот же флаг. Но позже, в § 7.2, мы встретимся с ситуацией, когда таким образом определяется взаимно однозначное соответствие между базисами векторного пространства
3.3. Линейные преобразования векторных пространств 111 и его флагами (это достигается за счет выбора некоторых специальных базисов). § 3.3. Линейные преобразования векторных пространств Здесь мы исследуем очень широкое обобщение понятия линейной функции, с которого начинался курс. Обобщение происходит в двух отношениях. Во-первых, в § 1.1 линейная функция определялась как функция строк длины п. Мы же заменим строки заданной длины векторами произвольного векторного пространства L. Во-вторых, значением линейной функции в § 1.1 считалось число, т.е., другими словами, элемент пространства R1 или С1 или К1 для произвольного поля К. Теперь мы заменим числа векторами произвольного пространства М. Таким образом, наше определение будет включать два векторных пространства: L и М. Читатель может считать оба пространства вещественными, комплексными, или пространствами над произвольным полем К, но обязательно одним и тем же для L и М. При этом мы будем говорить о числах, применяя те же соглашения, которые были установлены в §3.1 (с. 93). Напомним, что линейная функция определяется свойствами (1.8) и (1.9), приведенными в теореме 1.1 на с. 21. Аналогично этому следующее определение. Определение. Линейным преобразованием векторного пространства L в М называется отображение srf\ L —> М, сопоставляющее каждому вектору х Е L некоторый вектор &/(х) Е М и обладающее следующими свойствами: ^(x + y) = srf{x)+srf(y), S2/(olx) = ад/(х) для любого числа а и любых векторов х и у пространства L. Линейные преобразования называются также операторами или (только в случае, когда М = L) эндоморфизмами. Отметим одно очевидное, но полезное свойство, которое следует непосредственно из определений. Свойство. При линейном преобразовании образом нулевого вектора является нулевой вектор. Точнее, поскольку здесь речь идет о двух разных пространствах, сформулировать это можно следующим образом: если srf\ L —> М — линейное преобразование, OeLhO'eM — нулевые векторы пространств L и М, то я/{0) = О7. Доказательство. Согласно определению векторного пространства, для любого вектора же L существует противоположный вектор —х Е L, т.е. такой вектор, что х + {—х) — 0, причем (см. стр. 92) вектор —х получается умножением х на число —1. Применяя к обеим частям равенства О = х + (—х) линейное преобразование srf л в силу свойств (3.21) получаем я/(0) = srf{x) — д/(х) = (У, так как для вектора я/(х) пространства М вектор —я/(х) является противоположным, и их сумма дает (У.
112 Гл. 3. Векторные пространства Пример 3.17. Для любого пространства L тождественное, или единичное преобразование определяет линейное преобразование £\ L —> L Таким образом, £{х) = х для каждого х е L. Пример 3.18. Поворот плоскости R2 на некоторый угол вокруг начала координат является линейным преобразованием (здесь L = М = М2). Условия (3.21), очевидно, здесь выполняются. П р и м е р 3.19. Если L — пространство непрерывно дифференцируемых функций на отрезке [а, 6], а М — пространство непрерывных функций на том же отрезке, и для х = /(*) значение st/(x) = /'(*), то отображение srf\ L —> М является линейным преобразованием. Пример 3.20. Если L — пространство дважды непрерывно дифференцируемых функций на отрезке [a, b], M — то же, что и в предыдущем примере, q(t) — некоторая непрерывная на отрезке [а,Ь] функция, и для х = f(t) мы положим srf(x) = f"(i) + q(t)f(t), то отображение sf\ L —> М — линейное преобразование. В анализе оно называется оператором Штурма-Лиувилля. П р и м е р 3.21. Пусть L — пространство всех многочленов, и для х = /(£), как и в примере 3, положим srf{x) = f'(t). Очевидно, что srf\ L —> L — линейное преобразование (т.е. здесь М = L). Если же L — пространство многочленов степени < п, а М — пространство многочленов степени ^ п— 1, то та же самая формула дает линейное преобразование srf\ L —> М. Пример 3.22. Пусть задано представление пространства L в виде прямой суммы двух подпространств: L = L; 0 L". Это значит, что каждый вектор х £ L однозначно представим в виде х = х' + х", где xl е L' и хп е L". Сопоставление каждому вектору х е L слагаемого ж' Е L; в этом представлении задает отображение ^: L —► [_', &{х) = ж'. Простая проверка показывает, что ^ — линейное преобразование, оно называется проектированием на подпространство L' параллельно L". При этом для вектора х е L его образ &(х) Е L' называется проекцией вектора х на L/ параллельно L". Аналогично, для любого подмножества X с L его образ £?{Х) С I/ называется проекцией X на !_' параллельно L". Пример 3.23. Пусть L = М и dimL = dim M = 1. Тогда L = М = (е), где е — некоторый ненулевой вектор, и я/(е) = ае, где а — некоторое число. Из определения линейного преобразования непосредственно следует, что я/(х) = ах для любого вектора х е L. Следовательно, таков общий вид всех линейных преобразований srf\ L —> L в случае dimL = 1. Дальше мы будем рассматривать случай, когда размерности пространств L и М конечны. Это значит, что в L существует некоторый базис ei,...,en, а в М — базис /1?..., fm. Тогда любой вектор х е L записывается в виде х — а\е\ + с*2в2 Н Ь anen. Применяя несколько раз свойства (3.21), мы получим, что для любого линейного преобразования srf\ L —► М образ вектора х равен ). (3.22)
3.3. Линейные преобразования векторных пространств 113 Векторы si(e\),... ,si{en) принадлежат пространству М и, по определению базиса, являются линейными комбинациями векторов /i,...,/m, т.е. ^(ei) = апД + 021/2 Н + Omi/r, •с/(е2) = ai2/i + a22/2 H + ат2Л (3.23) L s/(en) = a\nfi + а2гг/2 Н Ь amnfm- С другой стороны, образ .я^(аз) вектора ж, принадлежащий пространству М, имеет в базисе /i,..., /m некоторые координаты /Зь... ,/?ш, т. е. записывается в виде £/(х) = A/i + fo f 2 + • • • + /Wm« (3-24) причем такое представление единственно. Подставляя в (3.22) выражения (3.23) для si{ei) и группируя нужным образом слагаемые, мы получаем представление si(x) в виде х) = = «l(ail/l + «21/2 Н Ь amlfm) H b^n(oin/l + 02n/2 H Ь amnfm) = = (а\а\\ + a2ai2 H Ь ^nOin)/i H Ь (^l^mi + «20m2 H h OLnamn)fm. В силу единственности разложения (3.24) мы получаем отсюда выражения для координат (3\,..., /Зт вектора si(x) через координаты а\,..., ап вектора х: А = onai + a\20L2 Л V а\пап, 02 = 021^1 + а22^2 Н Ь a2nan, (~ ^ /?m = Oml^l + Om2<^2 H h Omnan. Формула (3.25) дает нам явное выражение для действия линейного преобразования si при выбранных координатах (т.е. базисах) пространств L и М. Это выражение представляет собой линейную замену переменных с матрицей (а\\ а\2 ••• а\п\ 021 022 ' ' ' 02п I : : •. : ' <3'26) \&гп\ 0"гп2 ' ' ' 0"тп/ составленной из коэффициентов, входящих в формулу (3.25). Матрица А имеет тип (т,п) и является транспонированной к матрице, составленной из коэффициентов линейных комбинаций в формуле (3.23). Определение. Матрица А из (3.26), называется матрицей линейного преобразования si: L —> М, заданного формулой (3.23) в базисах ei,...,en И /b ••• »/т- Другими словами, матрица А линейного преобразования si — это такая матрица, г-ый столбец которой составлен из координат вектора sife) в базисе /i,...,/m. Подчеркнем, что запись координат происходит именно по столбцам, а не по строкам (что, конечно, тоже было бы возможно) — это имеет
114 Гл. 3. Векторные пространства ряд преимуществ. Очевидно, что матрица линейного преобразования зависит от выбора обоих базисов ei,...,en и /i,...,/m. Положение здесь такое же, как и с координатами вектора. Линейное преобразование «само по себе» не имеет никакой матрицы: для того, чтобы сопоставить ему матрицу, нужно указать базисы в пространствах L и М. Используя умножение матриц, определенное в § 2.9, можно записать формулу (3.25) в более компактном виде. Для этого введем следующие обозначения: пусть а — вектор-строка (матрица типа (1,п)), составленная из координат а\,...,ап, и /3 — вектор-строка, составленная из координат /?1,... ,/Зп. Аналогично, пусть [а] — вектор-столбец (матрица типа (п, 1)), составленный из тех же самых координат ai,...,an, но только записанных вертикально, и [/3] — вектор-столбец, составленный из (3\,...,рп> т-е- A*i\ /TV W/ \Рп> Очевидно, что а и [а] переводятся друг в друга транспонированием, т. е. сх* = [а], и аналогично, /3* = \J3]. Вспомнив определение умножения матриц, мы видим, что формула (3.25) имеет вид [/3] = А[а] или /3 = схА\ (3.27) Полученные нами формулы показывают, что при выбранных базисах линейное преобразование однозначно определяется своей матрицей. Наоборот, если, выбрав каким-нибудь образом базисы в векторных пространствах L и М, определить отображение si: L —> М с помощью соотношений (3.22) и (3.23) с произвольной матрицей А — (а^)» то легко проверить, что si будет линейным преобразованием. Таким образом, существует взаимно однозначное соответствие между множеством £(L, М) линейных преобразований L в М и множеством матриц типа (п, га). Выбор базисов в пространствах L и М и задает такое соответствие. В следующем параграфе мы выясним, как именно матрица линейного преобразования зависит от выбора обоих базисов. Множество всех линейных преобразований пространства L в М мы будем обозначать через £(L, M). Это множество само можно рассматривать как векторное пространство, если для преобразований si и SB из £(L, M) определить сумму и умножение на число а по формулам: (si + Я){х) = s/(x) + Я(х), (as/)(x) = as/(x). Легко проверяется, что si + SB и asi снова являются линейными преобразованиями L в М, т.е. каждое из них удовлетворяет условиям (3.21), а определенные нами операции удовлетворяют требованиям а)-з) определения векторного пространства. Нулевым вектором пространства £(L, M) является линейное преобразование б\ L —> М, определенное формулой в{х) — 0 для всех х е L (в последнем равенстве 0 означает, конечно, нулевой вектор пространства М). Оно называется нулевым преобразованием.
3.3. Линейные преобразования векторных пространств 115 Пусть в некоторых базисах преобразованию si: L —> М соответствует матрица А вида (3.26), а преобразованию £8\ L —► М — матрица В такого же вида. Выясним, что соответствует при этом преобразованиям si + Я и asi, определенным условиями (3.28). Согласно (3.23) имеем {si + $g)ei = aH/i + a2if2 + • • • + ami/m + Ьн/i + Ь2»/2 Н + bmifm = = («Н + &lt)/l + (а2г + &2г)/2 Н Ь (атг + Ьтг)/т» и следовательно, преобразованию si + £8 соответствует матрица А + В. Еще проще проверяется, что преобразованию as/ соответствует матрица аА. Таким образом, мы еще раз видим, что множество линейных преобразований £(L, М) или множество всех матриц типа (га,п) превращается в векторное пространство. В заключение рассмотрим произведение отображений, являющихся линейными преобразованиями. Пусть L, M,N — векторные пространства, ^: L ^ М и ^: М -> N — линейные преобразования. Заметим, что это — частный случай отображений произвольных множеств, и согласно общему определению (с. 10), произведение отображений 9S и si является отображением 9Ssi\ L —> N, заданным формулой {&si)(x) = &{si{x)) (3.29) для всех х е L Простая проверка показывает, что &&si является линейным преобразованием: для этого нужно только проверить подстановкой в равенство (3.29), что каждое из соотношений (3.21) выполнено для SSsi^ если они выполнены для si и 9S. В частности, в случае L = М = N мы получаем, что произведение линейных преобразований L в L снова является линейным преобразованием L в L. Предположим теперь, что в пространствах L, М и N выбраны базисы е\,.. •, еп, f\,..., fm и д{,..., дь соответственно. Обозначим матрицу линейного преобразования si в базисах ei,...,en и fl,...,fm через А, а матрицу линейного преобразования SS в базисах /i,...,/m и ffi,...,<ft — через Б, и найдем матрицу линейного преобразования £8si в базисах ei,...,en и ffi> •••>#/• Для этого нужно подставить формулы (3.23) для преобразования si в аналогичные формулы для преобразования 8%\ ( @(fl) = bngi+b2ig2 + --- + bngli I ^(/2)=b12ffl+&2202 + -**+ta, (33Q) I @(fm) = Ь\т9\ + Ь2шд2 Л V Ъ\шдх. Формулы (3.23) и (3.30) представляют собой две линейные замены, в которых роль переменных играют векторы, в остальном же они ничем не отличаются от линейных замен переменных, рассматривавшихся нами раньше (с. 75). Следовательно, результат последовательного выполнения этих замен будет таким же, что и в § 2.9 — линейная замена с матрицей В А, т. е. мы получаем
116 Гл. 3. Векторные пространства соотношение (<^0(е;) = ^CijQj, г = 1,...,п, 3 = 1 где матрица С — (с^-) преобразования Sesrf равна В А. Таким образом, мы установили, что произведению линейных преобразований соответствует произведение их матриц, взятое в том же самом порядке. Заметим, что таким образом получается, например, более короткое и естественное доказательство ассоциативности произведения матриц (формула (2.52) в § 2.9). Действительно, ассоциативность произведения произвольных отображений множеств известна (стр. 10), и в силу установленной связи между линейным преобразованием и его матрицей (в выбранных произвольным образом базисах) отсюда вытекает и ассоциативность произведения матриц. Операции сложения и умножения линейных преобразований связаны между собой соотношениями st{& + &) = srf@ + .«^f, (^ + S&ye = я/tf + tftf, называемыми свойством дистрибутивности. Для доказательства можно либо воспользоваться данными выше определениями сложения и умножения линейных преобразований и известным нам свойством дистрибутивности для вещественных или комплексных чисел (или элементов произвольного поля К, так как оно входит в определение поля), либо вывести дистрибутивность линейных преобразований из доказанной в § 2.9 дистрибутивности сложения и умножения матриц (формула (2.53)), снова воспользовавшись установленной выше связью между линейным преобразованием и его матрицей. § 3.4. Замена координат Мы видели, что координаты вектора относительно базиса зависят от того, какой базис в векторном пространстве мы выбрали. Также мы видели, что матрица линейного преобразования векторных пространств зависит от выбора базисов в обоих пространствах. Сейчас мы установим явный вид этой зависимости и для векторов, и для преобразований. Пусть. ei,...,en — некоторый базис пространства L. Согласно следствию теоремы 3.5 любой базис данного пространства состоит из одного и того же числа векторов, равного dimL. Пусть e\,...,efn — другой базис в L. Согласно определению любой вектор х е L является линейной комбинацией векторов ei,...,en, т.е. представим в виде х = а\е\ + а2в2 Н Ъ апеп (3.31) с коэффициентами щ — координатами х в базисе ej,...,en. Аналогично, имеет место представление х = а\е\ + а'2е'2 + • ■ ■ + afnefn (3.32) с координатами Ы{ вектора х в базисе е\,..., е^
3.4. Замена координат 117 Кроме того, каждый из векторов е[,... ,е'п сам является линейной комбинацией векторов е\,..., еп, т. е. ( е\ = с\\е\ + c2ie2 Н Ь cnien, е'2 = ci2ei + с22е2 Н Ь сп2еП1 е'п = с\пе\ + с2пе2 Н Ь Cnnen с некоторыми числами сц. И аналогично, каждый из векторов ei,...,en является линейной комбинацией е\,..., е^, т. е. ( e\ = dne\ + c2le2 H Ь c'nle^, е2 = с[2е[ + с22е2 + Ь c^2e^, (3.34) еп — с\пе\ + с2пе2 "^ Ь cnnen с некоторыми числами с^-. Очевидно, что наборы коэффициентов с^ и с^- в формулах (3.33) и (3.34) несут в себе одну и ту же информацию о «взаимном расположении» базисов еь ..., еп и e'p ..., е^ в пространстве L, поэтому нам достаточно знать только один (любой) из этих наборов. Подробнее о связи коэффициентов с^ и отбудет сказано ниже, прежде этого мы выведем формулу, которая описывает связь координат вектора х в базисах еь..., еп и е\,...,е'п. Для этого подставим выражения (3.33) для векторов е[ в (3.32). Группируя нужным образом слагаемые, мы получим выражение вектора х в виде линейной комбинации ^Ь • • • > €"п- х = а\{с\\е\ + с2\е2 Н h сп\еп) -\ Ь а'п{с\пе\ + c2ne2 H \- СпПеп) = = («icn + a2ci2 H Ь a^cin)ei Н Ь (ajc^i + a2cn2 H h a^cnn)en. Поскольку ei,...,en — базис пространства L и координаты вектора х в нем равны ах (формула (3.31)), то отсюда получаем а\ — с\\а\ + с\2а2 Л V с\по!п, а2 = с2\а\ + с22а2 Н Ь c2nafn, ап = сп\а\ + сп2а2 Н Ь Сппо/п. Соотношения (3.35) называются формулой замены координат вектора, она представляет собой линейную замену переменных с матрицей С, составленной из коэффициентов су, но в другом порядке, чем в формуле (3.33). А именно, С является транспонированной к матрице, составленной из коэффициентов (3.33). Матрица С называется матрицей перехода от базиса е[,...,е'п к базису е\...,еп, так как с помощью нее координаты вектора в базисе е\..., еп выражаются через его координаты в базисе е\,..., е'п. С помощью правила умножения матриц формулу замены координат можно записать в более компактном виде. Для этого используем обозначения
118 Гл. 3. Векторные пространства из предыдущего параграфа: ос — это вектор-строка, составленная из координат ai,...,an, и [а] — вектор-столбец, составленный из тех же самых координат. Вспоминая определение умножения матриц (§ 2.9), мы видим, что формула (3.35) имеет вид [<х) = С[а!) или сх = а!С\ (3.36) Замечание. Нетрудно видеть, что формулы замены координат очень похожи на формулы линейного преобразования. Точнее, соотношения (3.35) и (3.36) являются частным случаем (3.25) и (3.27) при т — п — например, если пространство М совпадает с L. Это позволяет интерпретировать замену координат (т. е. базиса) векторного пространства L как линейное преобразование srf\ L —> L. Подобным же образом, подставляя выражения (3.34) для векторов е* в (3.31), мы получаем соотношения Г а1 = с\\а1 + с12а2 Н Н с'\пап, I а2 = 4lc*l +С22^2Н +с'2пап, ,Q Q7x I °4 = сп1<*1 + сп2а2 Н К 4man> аналогичные (3.35). Формула (3.37) также называется формулой замены координат вектора, она представляет собой линейную замену переменных с матрицей С", транспонированной к матрице, составленной из коэффициентов с'^ из (3.34). Матрица С называется матрицей перехода от базиса ei,...,en к базису вр... ,е'п. В матричной форме записи формула (3.37) имеет вид [а'] = С'[а] или а' = аС*. (3.38) Используя формулы (3.36) и (3.38), легко установить связь между С и С. Лемма. Матрицы перехода С и С1 между любыми двумя базисами векторного пространства являются невырожденными и обратными друг другу, т. е. С = С~1. Доказательство. Подставляя выражение [а!] = С'[а\ в [а] = С[а!], с учетом ассоциативности умножения матриц получаем равенство [ос] = {СС')[а}. Оно верно для всех вектор-столбцов [а] заданной длины п, и следовательно, матрица С С в его правой части — единичная. Действительно, переписав это равенство в эквивалентном виде {СС — E)[ct] = О, легко заметить, что если матрица СС — Е содержит хотя бы один ненулевой элемент, то найдется такой вектор-столбец [а], для которого {СС — Е)[а] Ф 0. Таким образом, СС = Е, откуда по определению обратной матрицы (см. § 2.10), следует, что С' = С~1. Выясним теперь, как матрица линейного преобразования зависит от выбора базисов. Пусть в базисах ei,...,en и /i,.-.,/m пространств L и М преобразование я/: L —► М имеет матрицу А, координаты вектора х обозначены через oti и координаты вектора я/(х) — через /3j. Аналогично, в базисах еj,..., е!п и /1,..., fm этих пространств то же самое преобразование
ЗА. Замена координат 119 srf\ L —► М имеет матрицу А', координаты вектора х обозначены через ol{ и координаты вектора s£{x) — через /3j. Пусть С — матрица перехода от базиса е[,...,е,п к базису ei,...,en, т. е. невырожденная матрица порядка га, a D — матрица перехода от базиса /l' • • •»/m к базису fi,..., /m, т. е. невырожденная матрица порядка га (здесь га и га — размерности пространств L и М соответственно). Тогда, согласно формуле замены координат (3.38), имеем [<*'] = С~1[а], [f3']=D-l\j3], а формула линейного преобразования (3.27) дает нам равенства \P\=A[cl], \p] = A'[a']. Подставим в правую часть равенства [/З7] = D~l[/3] выражение [/3] = А[а], а в его левую часть — выражение [f3'\ = A'[ol'] = AfC~l[oi\, в результате чего получим соотношение A'C-1[ol] = D-1A[ol]. (3.39) Наши рассуждения справедливы для произвольного вектора х е L, поэтому равенство (3.39) выполняется для любого вектор-столбца [а] длины га. Очевидно, что это возможно в том и только том случае, если А'С~{ = D~lA. (3.40) Действительно, обе матрицы А'С~Х и D~lA имеют тип (гга,га), и если бы они не были равны, то нашлась бы по крайней мере одна строка (с номером г от 1 до га) и один столбец (с номером j от 1 до га), такие, что стоящие на их пересечении элементы матриц А!С~1 и D~lA не совпадают. Но тогда легко указать вектор-столбец [а], для которого равенство (3.39) не будет выполнено: например, положить его элемент otj равным 1, а все остальные — нулю. Отметим, что мы могли бы получить формулу (3.40), рассматривая переход от одного базиса к другому как линейное преобразование пространства, задаваемое умножением на матрицу перехода (см. замечание выше). Действительно, в этом случае мы имеем следующую диаграмму, где каждая стрелочка означает умножение вектор-столбца на матрицу, указанную рядом: с -1 м OL\ > \OL \ А! 1Д — W Согласно определению умножения матриц мы можем получить из вектора [а] вектор [/3;], находящийся в противоположном углу диаграммы, двумя способами: умножением на матрицу А'С~~1 и на матрицу D~lA. Оба способа должны давать одинаковый результат (в этом случае говорят, что диаграмма коммутативная), что и означает равенство (3.40).
120 Гл. 3. Векторные пространства Так как матрицы перехода невырождены, то мы можем домножить обе части (3.40) справа на матрицу С, получив в результате формулу A! = D~lAC, (3.41) которая называется формулой замены матрицы линейного преобразования. В случае, когда размерности пит пространств L и М совпадают, обе матрицы А и А' квадратные (порядка п = га), и для них имеет смысл понятие определителя. Тогда по теореме 2.20 из формулы (3.41) следует соотношение l^'l = i^D-1! - И| - |С| = [^Г1 -1^| • |С|. (3.42) Так как С и D — матрицы перехода, то они невырожденные, поэтому определители \А'\ и \А\ отличаются друг от друга умножением на число |£)|-1|С| ф 0. Это означает, что если матрица преобразования пространств одинаковой размерности невырождена при каком-нибудь одном выборе базисов, то она будет невырожденной и в любых других базисах этих пространств. Таким образом, можно дать следующее Определение. Линейное преобразование пространств одинаковой размерности называется невырожденным, если его матрица (записанная при произвольном выборе базисов обоих пространств) невырождена. В частном, но наиболее важном для разнообразных приложений случае, которому будут посвящены главы 4 и 5, когда сами пространства L и М совпадают (т. е. si является линейным преобразованием векторного пространства в себя), базис ei,...,en совпадает с базисом /i,...,/m, n — га, а базис е[,...,е'п совпадает с /j,...,/^. Следовательно, в этом случае D — С, и формула замены (3.41) превращается в А* = С~1АС, (3.43) и равенство (3.42) принимает самый простой вид \А'\ = \А\. Это означает, что хотя матрица линейного преобразования пространства L в себя и зависит от выбора базиса, но ее определитель от базиса не зависит. Это обстоятельство часто выражают, говоря, что определитель является инвариантом линейного преобразования пространства в себя. В этом случае мы можем дать следующее Определение. Определителем линейного преобразования si: L —> L векторного пространства в себя (он обозначается символом \s/\) называется определитель его матрицы А, записанной в произвольном базисе пространства L, т.е. \sf\ = \A\. § 3.5. Изоморфизм векторных пространств В этом параграфе мы выясним, когда линейное преобразование si: L —> М будет взаимно однозначным отображением. Прежде всего заметим, что если si — взаимно однозначное линейное преобразование L в М, то, как и любое взаимно однозначное отображение (не обязательно линейное), оно имеет обратное отображение s/~l: М —> L. Легко видеть, что si~l будет линейным преобразованием М в L. Действительно, если для вектора ух е М существует
3.5. Изоморфизм векторных пространств 121 такой единственный вектор х\ € L, что srf(x\) =ух, г для у2 G М — аналогичный вектор Х2 Е L, то &4{х\ + жг) = У\ + у^ т- е., по определению обратного отображения, получаем первое из условий (3.21) в определении линейного преобразования: ^~1(У1+У2) = Х1+х2 = ^~1(У1) + ^~1Ш- Аналогично, но даже еще проще, проверяется второе из условий (3.21), т.е. то, что srf~l(ay) — asrf~l(y) для любого вектора у Е М и числа а. Определение. Векторные пространства L и М, между которыми существует взаимно однозначное линейное преобразование я/, называются изоморфными, а само преобразование з/ — изоморфизмом. Тот факт, что пространства L и М изоморфны, обозначается как L ~ М. Если же желательно выделить конкретное преобразование si\ L —> М, являющееся изоморфизмом, то пишут я/: L ^ М. Свойство быть изоморфными задает на множестве всех векторных пространств отношение эквивалентности (см. определение на с. 8). Для доказательства этого нам нужно проверить три свойства: рефлексивность, симметричность и транзитивность. Рефлексивность очевидна: для этого нужно просто рассмотреть тождественное отображение S: L ^> L. Симметричность тоже очевидна: если srf\ L ^> М, то обратное преобразование srf~x тоже является изоморфизмом, т. е. srf~l: М ^ L Наконец, если &t\ L ^ М и 38\ М ^ N, то, как легко проверить, преобразование ^ = S&srf тоже является изоморфизмом, т.е. сё,\ L ^ N, что означает транзитивность. Таким образом, множество всех векторных пространств представимо в виде объединения классов пространств, изоморфных между собой. Пример 3.24. При выборе базиса ei,...,en в пространстве L над полем К сопоставление вектору х Е L строки, состоящей из его координат в этом базисе, устанавливает изоморфизм между L и пространством строк Кп. Точно так же запись элементов строки в виде столбца является изоморфизмом пространства строк и пространства столбцов (состоящих из одного и того же числа элементов) — это и есть объяснение единого символа для обозначения этих пространств. Пример 3.25. При выборе в пространствах L и М размерностей пит базисов ei,...,en и /1,...,/т мы сопоставляем каждому линейному преобразованию srf: L —> М его матрицу А. Таким образом устанавливается изоморфизм между пространством £(L, M) и пространством прямоугольных матриц типа (га, п). Теорема 3.9. Векторные пространства L u M конечной размерности изоморфны тогда и только тогда, когда dimL = dimM. Доказательство. То, что любые векторные пространства одинаковой конечной размерности изоморфны, очевидно следует из того, что каждое пространство L конечной размерности п изоморфно пространству Кп строк или столбцов длины п (пример 3.24). Действительно, пусть L и М — два
122 Гл. 3. Векторные пространства пространства размерности п, тогда L ~ Кп и М^Р, откуда вследствие транзитивности и симметричности получаем L ~ М. Докажем, что изоморфные пространства L и М имеют одинаковую размерность. Пусть, согласно условию, srf\ L ^> М — некоторый изоморфизм. Обозначим через 0 е L и 0' е М нулевые векторы пространств L и М соответственно. Напомним, что согласно доказанному на с. 111 свойству линейных преобразований, д/(0) = О'. Пусть dim М = га, выберем в пространстве М некоторый базис /i,...,/m. Согласно определению изоморфизма в пространстве L существуют такие векторы е\,..., ет, что fi — srf{e,i) для г — 1,..., га. Докажем, что векторы ei,...,em составляют базис пространства L, тогда будем иметь dim L = га, что и утверждает теорема. Прежде всего покажем, что эти векторы линейно независимы. Действительно, если бы еь ..., ет были линейно зависимы, то существовали бы такие числа а\,... ,ат, не все равные нулю, что а\е\ + с*2в2 Ч Ь атет = 0. Но применяя к обеим частям этого соотношения линейное преобразование я/, в силу равенства я/(0) = (У мы получили бы тогда ai/i + «2/2 + ' * * + <Wm = О', откуда следует oq = 0, ...,аш = 0, так как, по условию, векторы /i,...,/m линейно независимы. Докажем теперь, что любой вектор ж G L есть линейная комбинация векторов еь... ,ет. Положим stf{x) = уи представим у в виде у = «i/i + «2/2 + • • • + <Wm. Применяя к обеим частям этого равенства линейное преобразование «s/-1, получаем ж = а\е\ + а2в2 Н Ь атет, что и требовалось. Таким образом, мы доказали, что векторы ei,...,em составляют базис пространства L. Пример 3.26. Пусть задана система, состоящая из т линейных однородных уравнений с п неизвестными х\,...,хп и коэффициентами из поля К. Как мы видели в примере 3.5 (стр. 94), ее решения образуют подпространство L' в пространстве Кп строк длины п. Так как мы знаем, что размерность пространства Кп равна п, то отсюда следует, что dim L' ^ п. Найдем эту размерность. Для этого, согласно теореме 1.6, приведем нашу систему к ступенчатому виду (1.18). Так как уравнения исходной системы однородные, то и в_(1.18) все уравнения тоже будут однородными, т.е. все свободные члены bi = 0. Пусть г — число главных неизвестных и, значит, (п — г) — число свободных неизвестных. Как было показано после доказательства теоремы 1.6, мы получим все решения нашей системы, придавая произвольные значения свободным неизвестным и определяя главные неизвестные из первых г уравнений. То есть, если (х\,...,хп) — некоторое решение, то, сопоставляя ему строку значений свободных неизвестных (хц,... ,Xin_r), мы получим взаимно однозначное соответствие между множеством решений
3.5. Изоморфизм векторных пространств 123 системы и строками длины п — г. Очевидная проверка показывает, что это соответствие устанавливает изоморфизм пространств Кп~г и L7. Так как dimKn_r = п — r, то, по теореме 3.9, и размерность пространства решений L7 равна п — г. Наконец, заметим, что число г равно рангу матрицы системы (см. § 2.8). Таким образом, мы получаем следующий результат: пространство решений линейной однородной системы имеет размерность п — r, где п — число неизвестных, г — ранг матрицы системы. Пусть si: L ^ М — некоторый изоморфизм пространств L и М размерности п и ei,...,en — базис в L. Тогда векторы si{e\),... ,st/(en) линейно независимы. Действительно, в противном случае мы имели бы равенство а\£/(е\) Н Ь ansi(en) = si(a\e\ Л Ь апеп) = О7, из которого в силу свойства si(0) = О7 и взаимной однозначности преобразования si следует противоречащее определению базиса соотношение ос\е\Л V апеп = 0. Таким образом, векторы si{e\),... ,s/(en) образуют базис пространства М. Легко видеть, что в этих базисах матрица преобразования si является единичной порядка гг, и координаты любого вектора х е L в базисе ei,...,en совпадают с координатами вектора я/(х) в базисе £i(e\),... ,^(еп). Следовательно, преобразование si невырождено. Аналогичными рассуждениями легко доказать и обратный факт: любое невырожденное линейное преобразование si\ L —► М пространств одинаковой размерности является их изоморфизмом. Замечание. Теорема 3.9 показывает, что все утверждения, формулируемые в терминах понятий, входящих в определение векторного пространства, одинаковы для пространств одной размерности. Другими словами, существует только одна теория n-мерного векторного пространства для заданного п. Примером противоположной ситуации является евклидова геометрия и геометрия Лобачевского. Известно, что если принять все аксиомы геометрии Евклида, кроме «постулата о параллельных» (так называемая «абсолютная геометрия»), то этим аксиомам удовлетворяют две совершенно разные геометрии: Евклида и Лобачевского. Вот такого явления не может быть, если сравнивать абсолютную геометрию с геометрией n-мерного векторного пространства заданной размерности п. Определение взаимной однозначности преобразования si\ L —» М состоит из двух условий. Первое заключается в том, что для любого вектора у е М существует такой вектор х Е L, что si{x) = у, т. е. образ #i(L) совпадает со всем пространством М. Второе условие заключается в том, что равенство s/(x\) — si{x2) возможно только при х\ — а?2. Так как si — линейное преобразование, то для последнего необходимо, чтобы из равенства s/(x) = О7
124 Гл. 3. Векторные пространства следовало х = 0. Это соображение дает мотивировку для следующего определения: Определение. Множество векторов пространства L, для которых si{x) = О7, называется ядром линейного преобразования si. Другими словами, ядро — это прообраз нулевого вектора при отображении si. Очевидно, что ядро линейного преобразования si: L —> М является подпространством в L, а его образ si(L) — подпространством в М. Итак, для выполнения второго требования в определении взаимной однозначности необходимо, чтобы ядро si состояло из одного лишь нулевого вектора. Но это условие является и достаточным. Действительно, если для векторов х\ ф Х2 выполнено si{x\) = siixi), то> вычитая из одной стороны равенства другую и пользуясь линейностью преобразования si, мы получим, что si{x\ — Х2) = О7, т.е. вектор х\ — Х2 содержится в ядре si. Таким образом, линейное преобразование si: L —> М является изоморфизмом тогда и только тогда, когда его образ совпадает со всем пространством М, а его ядро равно (0). Мы сейчас докажем, что если si — линейное преобразование пространств одинаковой конечной размерности, то изоморфность следует из каждого (отдельно взятого) из этих двух условий. Теорема 3.10. Если si: L —> М — линейное преобразование векторных пространств одинаковой конечной размерности и ядро si равно (0), то si является изоморфизмом. Доказательство. Пусть dimL = dimM = п. Рассмотрим некоторый базис е\,...,еп пространства L. Преобразование si переводит каждый вектор е; в некоторый вектор fi = si{ei) пространства М. При этом векторы /1?..., fn являются линейной независимыми, т.е. образуют базис пространства М. Действительно, из линейности преобразования si для любых чисел а\,... ,ап мы имеем равенство £i(a\e\ + ••• + апеп) = axfx H Ь anfn. (3.44) Если бы a\fi Н h anfn = 0' при некотором наборе чисел ai,... ,ап, то из того условия, что ядро at равно (0), мы имели бы а\е\ Н Ь оспеп — О, откуда, по определению базиса, следует, что все числа щ равны нулю. Соотношение (3.44) показывает также, что преобразование hi переводит любой вектор х е L с координатами (а\,...,ап) в базисе ei,...,en в вектор пространства М с такими же координатами в соответствующем ему базисе fi,-",fn (матрица преобразования si в таких базисах является единичной порядка п). Согласно определению изоморфизма, нам достаточно показать, что для любого вектора у е М существует такой вектор х е L, что si(x) = у. Так как векторы /ь... ,fn образуют базис в пространстве М, то у представим в виде их линейной комбинации с некоторыми коэффициентами (а\,... ,ап), откуда в силу линейности si имеем соотношение у = a\fi H h anfn = si{a\ei H h OLnen) = si{x) с вектором х — а.\е,\ Л Ь оспеп, что и доказывает теорему.
3.5. Изоморфизм векторных пространств 125 Теорема 3.11. Если srf\ L —> М — линейное преобразование векторных пространств одинаковой конечной размерности и образ s/(L) = M, то srf является изоморфизмом. Доказательство. Пусть /i,...,/n — некоторый базис пространства М. По условию теоремы, для каждого fi существует вектор ei Е L, такой, что fi = £/(ei). Покажем, что векторы ei,...,en линейно независимы и, следовательно, образуют базис в L. Действительно, если бы существовал такой набор чисел oq,... ,ап, что а\е\ Н V апеп = 0, то в силу ^/(0) = О7 и линейности я/ мы имели бы равенство s/(aiei Н Ь апеп) = а\^{е\) Н Ь ane^(en) = ai/j Н + anfn = О7, откуда по определению базиса следует, что все ai = 0, т. е. векторы е\,..., еп действительно образуют базис пространства L. Из определения базиса следует, что любой вектор х Е L представим в виде х = а\в\ Н ь оспеп. Отсюда получаем: sf(x) = s/{ot\e\ H h anen) = = ai^(ei) H h an^(en) = ai/i + • • • + anfn. Если л^(ж) = 0;, то и ai/i H h cen/n = 0', а это возможно только в случае, когда все числа а* = 0, так как векторы /ь..., /п образуют базис пространства М. Но тогда, очевидно, и вектор ж = а\е\ + ••• + апеп = 0. Таким образом, ядро преобразования я/ состоит из одного лишь нулевого вектора и по теореме 3.10 я/ — изоморфизм. Нетрудно видеть, что доказанные выше теоремы дают следующий результат: Теорема 3.12. Линейное преобразование srf\ L —> М пространств одинаковой конечной размерности является изоморфизмом тогда и только тогда, когда оно невырождено. Другими словами, теорема 3.12 утверждает, что для пространств одинаковой конечной размерности понятие невырожденного преобразования совпадает с понятием изоморфизма. При доказательстве теоремы 3.10 мы установили также один важный факт: линейное преобразование srf\ L —> М пространств одинаковой конечной размерности переводит базис ei,...,en пространства L в базис /i,...,/n пространства М, а любой вектор х е L с координатами (ai,...,an) в первом базисе — в вектор я/(х) Е М с такими же координатами относительно второго базиса. Это очевидно следует из формулы (3.44). Таким образом, невырожденное преобразование st\ L —► М можно задать, указав, что оно переводит некоторый базис ei,...,en пространства L в базис /i,...,/n пространства М, а любой вектор х Е L с координатами (ai,...,an) относительно базиса е\,..., еп — в вектор пространства М с теми же самыми координатами относительно базиса /i,...,/n. Позже мы будем пользоваться этим способом в случае L = М, когда будем изучать некоторые специальные подмножества X с L, главным образом, квадрики. Основная идея состоит
126 Гл. 3. Векторные пространства в том, что подмножества X и Y переводятся друг в друга при помощи некоторого невырожденного преобразования si: L —> L (т. е. Y = si(X)) тогда и только тогда, когда можно найти два такие базиса ei,...,en и /i,...,/n пространства L, что условие принадлежности вектора ж подмножеству X в координатах относительно базиса ei,...,en совпадает с условием принадлежности этого же вектора подмножеству Y в координатах относительно базиса /!,...,/п. В заключение вернемся еще раз к доказанной в § 1.2 теореме 1.5 и следствию из нее — «альтернативе Фредгольма» (с. 29). Теперь и теорема 1.5, и ее следствие совершенно очевидны и получаются как тривиальные следствия более общих результатов. Действительно, как мы видели в § 2.9, система п линейных уравнений с п неизвестными может быть записана в матричном виде А[х] = [Ь], где А — квадратная матрица порядка п, [ж] — вектор-столбец, состоящий из неизвестных х\,...,хп, и [Ь] — вектор-столбец, состоящий из свободных членов Ьь-..,ЬП. Пусть si : L —> М — линейное преобразование пространств одинаковой размерности га, имеющее в некоторых базисах е\,...,еп и /i,...,/n матрицу А. Пусть 6 Е М — вектор, координаты которого в базисе /i,...,/n равны bi,..., Ьп. Тогда линейную систему А [ж] = [Ь] можно интерпретировать как уравнение si{x) = Ь (3.45) с неизвестным вектором х Е L, координаты которого в базисе е\,..., еп и дают решение (^i,...,xn) этой системы. Имеет место очевидная альтернатива: либо линейное преобразование si: L —► М является изоморфизмом, либо не является. По теореме 3.12, первый случай равносилен тому, что преобразование si невырождено. Тогда ядро si равно (0) и образ s/(L) = М. Следовательно, для любого вектора Ъ Е М существует (и притом единственный) вектор ж Е L, для которого srf(x) = Ь, т.е. уравнение (3.45) разрешимо. В частности, отсюда получаем теорему 1.5 и следствие из нее. Во втором случае ядро si содержит ненулевой вектор (соответственно, ассоциированная однородная система имеет ненулевое решение) и образ s/(L) не совпадает с пространством М, т.е. существует такой вектор Ь Е М, для которого уравнение (3.45) не разрешимо (соответственно, система А[х] = [Ь] несовместна). Это утверждение — либо уравнение (3.45) разрешимо при любой правой части, либо ассоциированное однородное уравнение имеет ненулевое решение — справедливо и для случая, когда si — линейное преобразование (оператор) в пространствах бесконечной размерности, удовлетворяющее некоторому специальному условию. Такие преобразования встречаются, в частности, в теории интегральных уравнений, там это утверждение и получило название альтернатива Фредгольма. § 3.6. Ранг линейного преобразования В этом параграфе мы будем рассматривать линейное преобразование si: L —> М, не делая никаких предположений о размерностях пит про-
3.6. Ранг линейного преобразования 127 странств L и М, кроме того, что они конечны. Заметим, что если еь... ,еп — произвольный базис пространства L, то образ si равен (si(e\)i... ,si(en)}. Если выбрать какой-нибудь базис /i,...,/m пространства М и записать матрицу преобразования si в выбранных базисах, то ее столбцы будут состоять из координат векторов si(e\),... ,si(en) в базисе /i,...,/ш и, таким образом, размерность образа si равна максимальному числу линейно независимых векторов из числа этих столбцов, т. е. рангу матрицы линейного преобразования si. Таким образом, ранг матрицы линейного преобразования будет одним и тем же, независимо от того, в каких базисах мы бы ее ни записали, и следовательно, мы можем говорить просто о ранге линейного преобразования. Это позволяет дать эквивалентное определение ранга линейного преобразования, не зависящее от выбора координат: Определение. Рангом линейного преобразования si: L —» М называется размерность пространства ^(L). Следующая теорема устанавливает связь ранга линейного преобразования с размерностью его ядра и показывает, к какому наиболее простому виду можно привести матрицу линейного преобразования si: L —► М за счет подходящего выбора базисов в обоих пространствах. Т е о р е м а 3.13. Для любого линейного преобразования si: L —> М конечномерных пространств размерность ядра si равна dim L — г, где г — ранг si. В этих пространствах можно выбрать базисы, в которых преобразование si имеет матрицу блочно-диагонального вида (1Г 2) • <3-46> где Ег — единичная матрица порядка г. Доказательство. Обозначим ядро преобразования si через L', а его образ c^(L) — через М;. Прежде всего докажем соотношение dim L' + dim M' = dim L. (3.47) По определению ранга преобразования, здесь г = dim М', и таким образом, равенство (3.47) означает в точности первое утверждение доказываемой теоремы. Рассмотрим отображение si1: L —> М', которое ставит в соответствие каждому вектору х Е L вектор у = si(x), принадлежащий М', согласно определению образа отображения si: L —> М. Очевидно, что такое отображение si1: L —> М' тоже является линейным преобразованием. Ввиду следствия теоремы 3.4 имеет место разложение L - L' 0 L", (3.48) где L" — некоторое подпространство в L. Рассмотрим ограничение преобразования si' на подпространство L" и обозначим его через si": L" —> М'. Легко видеть, что образ si" совпадает с образом si', т. е. равен М7. Действительно, так как М' — это образ исходного отображения si: L —► М, то любой вектор у G М' может быть представлен в виде у — si(x) с некоторым х е L. Но ввиду
128 Гл. 3. Векторные пространства разложения (3.48) мы имеем равенство х = и + v, где и е L7 и v e L77, причем L7 является ядром si, т. е. si (и) — О'. Следовательно, si(x) = si (и) + si(v) = = si(v), и значит, вектор у — si {у) является образом вектора v е L77. Ядро преобразования si": L77 —> М7 равно (0). Действительно, по определению, это ядро равно L7 П L77, а такое пересечение состоит лишь из нулевого вектора, так как в правой части разложения (3.48) стоит прямая сумма (см. следствие из леммы на с. 95). В результате мы получаем, что образ преобразования si": L77 —► М7 равен М7, а его ядро равно (0), т.е. это преобразование является изоморфизмом. Согласно теореме 3.9, тогда dim L77 = dim М7. С другой стороны, из разложения (3.48) и теоремы 3.16 следует, что dim L7 + dim L77 = dim L. Заменяя здесь число dim L77 равным ему dimM7, мы и получаем требуемое равенство (3.47). Теперь докажем утверждение теоремы о приведении матрицы линейного преобразования si к виду (3.46). Для этого, подобно разложению (3.48) пространства L, построим разложение пространства М — М7 0 М77, где М77 — некоторое подпространство в М. Согласно доказанному выше dimL7 = n —r и, в силу (3.48), dimL77 = г. Выберем в подпространстве L77 некоторый базис и\,...,иг и положим vi = £/"(щ), т.е., согласно определению, vi = я/(щ). Как мы видели, преобразование si": L77 —» М7 является изоморфизмом, следовательно, векторы v\,...,vr образуют базис в пространстве М7, причем в базисах щ,...,иг и v\,...,vr преобразование si" имеет единичную матрицу Ег. Выберем теперь в пространстве L7 некоторый базис иг+\,...9ип и объединим его с базисом щ,...,иг в единый базис щ,...,ип пространства L. Аналогично, дополним базис v\,...,vr до любого базиса v\,V2,... ,vm пространства М. Какова будет матрица линейного преобразования si в построенных базисах щ,...,ип и v\i...1vm? Очевидно, что si(ui) — V{ для г=1,...,г (по построению, для этих векторов преобразование si" совпадает с si). С другой стороны, si{ui) — О7 для г = г + 1,... ,га, так как векторы иг+\,... ,ип содержатся в ядре si. Записывая координаты векторов si(u\),... ,si(un) в базисе vi,...,vm в виде столбцов матрицы, получаем, что матрица преобразования si имеет блочно-диагональный вид (3.46). Теорема 3.13 позволяет получить более простое и естественное доказательство теоремы 2.25 из предыдущей главы. Для этого заметим, что любая матрица является матрицей некоторого линейного преобразования векторных пространств соответствующих размерностей, при этом невырожденная квадратная матрица является матрицей изоморфизма пространств одинаковой размерности. Для матриц А, В и С из теоремы 2.25 рассмотрим линейные преобразования si : М ^> М7, 3§ : L7 ^ L и ^ : L —> М, где dimL = dimL'-пи dimM = dimM7 = га, имеющие в некоторых базисах матрицы А,ВиС соответственно. Найдем ранг преобразования si^Sfi : L7 -» М7. Из равенств si(M) = М7 и &(\J) = L вытекает, что si^&iL') = sH^[Vf), откуда с учетом изоморфизма si получаем, что dim si^^{\J) = dim^(L). По определению, размерность образа линейного преобразования равна его рангу и совпадает с рангом его матрицы, записанной в любых базисах, следовательно, ig АС В = rgC, где
3.7. Сопряженное пространство 129 символ rg обозначает ранг. Отсюда мы окончательно получаем и требуемое равенство rg АС В = rg С. Подчеркнем, что к простому виду (3.46) матрица преобразования приводится в том случае, когда пространства L и М различны, и следовательно, нет возможности согласовать их базисы, и они выбираются независимо друг от друга. Мы увидим дальше, что в других случаях (например, если L = М) более естественна другая постановка задачи, когда базисы в пространствах L и М выбираются не независимо (например, в случае L = М это просто один и тот же базис). Тогда вопрос о простейшем виде матрицы преобразования оказывается гораздо более сложным. Утверждение теоремы 3.13 о приведении матрицы линейного преобразования к виду (3.46) можно сформулировать и в другой форме. Как мы установили в § 3.4 (формула замены (3.41)), при изменении базисов в пространствах L и М матрица А линейного преобразования я/: L —> М заменяется на матрицу А! = D~lAC, где С и D — матрицы перехода к новым базисам в пространствах L и М соответственно. Известно, что матрицы С и D невырожденные, и наоборот, любая невырожденная квадратная матрица соответствующего порядка может быть взята за матрицу перехода к новому базису. Таким образом, теорема 3.13 дает следующее Следствие. Для любой матрицы А типа (т,п) существуют такие невырожденные квадратные матрицы С и D порядков пит, что матрица D~lAC имеет вид (3.46). § 3.7. Сопряженное пространство Здесь мы рассмотрим понятие линейного преобразования srf\ L —> М в простейшем случае, когда dimM = 1. В результате мы придем к понятию, очень близкому к тому, с которого начинался курс (§ 1.1), но сформулированному более абстрактно — в терминах векторных пространств. Если dimM = 1, то, выбрав в М базис (т.е. любой отличный от нулевого вектор е), мы можем записать произвольный вектор этого пространства в виде ае, где а — число (вещественное, комплексное или элемент произвольного поля К — в зависимости от того, какой смысл читатель желает придать этому термину). Отождествляя ае с а, мы можем вместо М рассматривать совокупность чисел (R, С или К соответственно). В связи с этим мы будем в этом случае обозначать пространство £(L, М), введенное в § 3.3, через £(1_,К). Оно называется пространством линейных функций на L Таким образом, линейная функция на пространстве L — это отображение /: L —► К, которое сопоставляет каждому вектору х Е L число f(x) и удовлетворяет условиям f(x + y) = f(x) + f(y), f(ax) = a f{x) для любых векторов х,у е L и числа a G К. 5 А. О. Ремизов, И. Р. Шафаревич
130 Гл. 3. Векторные пространства Пример 3.27. Если L = Кп — пространство строк длины п с элементами из поля К, то введенное выше понятие линейной функции в точности совпадает с тем, которое было введено в § 1.1. Пример 3.28. Пусть L — пространство функций, принимающих вещественные или комплексные значения и непрерывных на отрезке [а, Ь]. Для каждой функции x(t) из L положим /*(*) = <p(t)x(t) dt, (3.49) где <p(t) — некоторая фиксированная функция из L. Очевидно, что /у(ж) — линейная функция на L. Заметим, что, перебирая всевозможные функции (р{€), мы по формуле (3.49) получим бесконечное число линейных функций на L, т.е. элементов пространства £(1_,К), где K = R или С. Однако с помощью формулы (3.49) нельзя получить все линейные функции на L. Например, пусть s e [a, b] — некоторая фиксированная точка отрезка. Рассмотрим отображение L —► К, ставящее в соответствие каждой функции x(i) е L ее значение в точке s. Очевидно, что такое отображение является линейной функцией на L, но оно не представимо в виде (3.49) ни с какой (p(t). Определение. В случае, когда L конечномерно, пространство £(L, К) называется сопряженным к L и обозначается символом L*. Замечание о бесконечномерном случае. Для бесконечномерного пространства L (например, такого, как рассмотренное в примере 2 пространство непрерывных на отрезке функций) сопряженным пространством L* называется пространство не всех линейных функций, а только удовлетворяющих некоторому дополнительному условию непрерывности (в случае же конечномерного пространства требование непрерывности оказывается выполненным автоматически). Изучение линейных функций на бесконечномерных пространствах оказалось полезным во многих вопросах анализа и математической физики. На этом пути возникла замечательная идея — трактовать любые линейные функции таким образом, как будто бы они заданы в виде (3.49), где cp(t) — некоторая «обобщенная функция», вообще говоря, не принадлежащая исходному пространству L. Это приводит к новым, интересным результатам. Например, если взять в качестве L пространство функций, дифференцируемых на отрезке [а9Ь] и обращающихся в нуль на его концах, то для дифференцируемой функции <p(t) правило интегрирования по частям можно записать в виде f^{x) = —/^(ж'). А если производная <p'(t) не существует, то можно определить новую «обобщенную функцию» i[>(t) соотношением fip(x) — ~fip{x')- При этом очевидно, что jj>(t) = <p'(t), если производная <p'(t) существует и непрерывна. Таким образом можно определить производные у любых функций (в том числе, не непрерывных и даже обобщенных). Например, предположим, что наш отрезок [а,Ь] содержит внутри себя точку 0 и вычислим производную функции h(t), которая равна нулю при
3.7. Сопряженное пространство 131 t <0 и единице при t ^ 0, и следовательно, имеет разрыв в точке t = 0. По определению, для любой функции x(t) из L имеем равенство ь ь с с fhi{x) = -fh{x') = - h(t)x'(t) dt = -\ x'(t) dt = x(0) - x(b) = ж(0), a 0 так как x(b) = 0. Следовательно, производной h!(t) является обобщенная функция1), ставящая в соответствие каждой функции x(t) из L ее значение в точке t — 0. Далее мы будем рассматривать исключительно конечномерный случай. Теорема 3.14. Если пространство L имеет конечную размерность, то сопряженное пространство L* имеет ту же размерность. Доказательство. Пусть е\,...,еп — произвольный базис пространства L. Рассмотрим векторы fi e L*, г = 1,... ,п, определив fi как линейную функцию, ставящую в соответствие вектору х = а\е\ + а2е2 Н Ь апеп (3.50) его г-ю координату в базисе е\,..., еп, т. е. f{{x) = аь ..., fn(x) = an. (3.51) Мы получим таким образом п векторов сопряженного пространства. Проверим, что они составляют его базис. Пусть f = (3\f\ -\ + Pnfn- Тогда, применяя функцию / к вектору ж, определенному формулой (3.50), мы получим f(x) = оц А + а2/32 + • • • + <*„/?„. (3.52) В частности, полагая х = е^, мы получаем, что /(е») = Pi. Таким образом, равенство / = 0 (где 0 — это нулевой вектор пространства L*, т.е. линейная функция на L, тождественно равная нулю) означает, что f(x) =0 для любого вектора х £ L. Очевидно, что это выполняется тогда и только тогда, когда Р\ = 0,..., рп = 0. Этим доказана линейная независимость функций /i,...,/n. Согласно равенству (3.52) любая линейная функция на L представляется в виде P\f\ + ••• + Pnfn с коэффициентами Pi = /(е^). Значит, функции fx,..., fn составляют базис в L* и, следовательно, dim L = dim L* = п. Построенный по формуле (3.51) базис /i,...,/n сопряженного пространства L* называется взаимным к базису ei,...,en исходного пространства L. Очевидно, что он определяется формулой fiiei) = 1, fi(ej) = 0 при j ф г. Заметим, что L и L*, как и любые векторные пространства одинаковой конечной размерности, изоморфны. (Для бесконечномерных пространств это, 1) Такая обобщенная функция называется 5-функцией Дирака в честь английского физика П. Дирака, впервые использовавшего обобщенные функции (в конце 1920-х годов) для исследований в квантовой механике. 5*
132 Гл. 3. Векторные пространства вообще говоря, не верно — так, в случае рассмотренного в примере 3.28 пространства L непрерывных на отрезке функций L и L* не изоморфны.) Однако построение их изоморфизма требует выбора некоторого базиса е\,...,еп в L и базиса /i,/2»---,/n B L*. Таким образом, между L и L* не существует «естественного» изоморфизма, не зависящего от выбора базиса. Если повторить процесс перехода к сопряженному пространству дважды, то мы получим пространство (L*)*, для которого легко построить изоморфизм исходному пространству L, не прибегая к выбору какого-либо специального базиса. Пространство (L*)* называется вторым сопряженным пространством к L и обозначается как L**. Нашей ближайшей целью является определение некоторого линейного преобразования si : L —> L**, которое является изоморфизмом. Для этого нужно задать si{x) для каждого вектора ж е L Вектор si{x) должен принадлежать пространству L**, т.е. быть линейной функцией на пространстве L*. Так как si{x) — элемент второго сопряженного пространства L**, то, согласно определению, si{x) — это линейное преобразование, ставящее в соответствие каждому элементу / е L* (который сам является линейной функцией на L) некоторое число, обозначаемое si{x){f). Мы определим это число естественным условием si(x)(f) = / (ж) для всех х е L, / е L*. (3.53) Преобразование si E £(L, L**) (его линейность очевидна). Для проверки взаимной однозначности si мы можем воспользоваться каким-либо базисом ei,...,en в L и взаимным ему базисом f\,.,fn в L*. Тогда, как легко проверить, si является произведением двух изоморфизмов: построенного при доказательстве теоремы 3.14 изоморфизма L ^ L* и аналогичного изоморфизма L* ^ L**, и, следовательно, si само является изоморфизмом. Определенный условием (3.53) изоморфизм L ^ L** показывает, что пространства L и L* играют совершенно симметричную роль: каждое из них является сопряженным к другому. Для того, чтобы ярче выделить эту симметрию, значение /(ж), в котором х е L и / е L*, удобно записывать в виде (ж,/). Выражение (ж,/) обладает очевидно проверяемыми свойствами: 1) (ач+*2./) = (жь/) + (я2,/); 2) (x,fl+f2) = (x,fl) + (x,f2); 3) (ax,f) = a(x,f); 4) (x,af) = a(xj); 5) если (ж, /) = 0 для всех ж е L, то / = 0; 6) если (ж, /) = 0 для всех / е L*, то ж = 0. Наоборот, если для двух векторных пространств L и М определена функция (ж, у), где ж G L и у Е М, принимающая числовые значения и удовлетворяющая условиям 1)-6), то, как легко видеть, L ~ М* и М ~ L*. Этот факт
3.7. Сопряженное пространство 133 будет существенно использован нами в гл. 6 при исследовании билинейных форм. Определение. Пусть L/ — некоторое подпространство пространства L. Множество тех / Е L*, для которых f(x) = 0 при всех х Е L', называется аннулятором подпространства L' и обозначается (L')a. Из этого определения очевидно следует, что (L/)a является подпространством в L*. Определим его размерность. Пусть dimL — пи dimL' = г. Выберем некоторый базис е\,... ,ег в подпространстве L/, дополним его до базиса ei,...,en всего пространства L и рассмотрим взаимный базис /i,...,/n в L*. Из определения взаимного базиса легко вытекает, что линейная функция / Е L* принадлежит (L')a тогда и только тогда, когда f e (/r+i, ••• »/п)« Иначе говоря, (L')a = (fr+1,..., fn) и значит, dim(L/)a = dim L - dim L/. (3.54) Если теперь мы рассмотрим построенный выше естественный изоморфизм L** ^ L и с его помощью отождествим эти пространства, то можно применить изложенную конструкцию к аннулятору (L')a и рассмотреть получающееся подпространство ((L')a)a в L. Из определения следует, что L/ с ((L/)a)a. Из выведенного соотношения (3.54) для размерностей мы получаем, что dim((L/)a)a = п — (п — г) = г, и, согласно теореме 3.1, отсюда следует, что ((L')a)a = L'. Одновременно мы получим, что подпространство L' состоит из тех векторов х Е L, для которых /r+i(x) = 0, ..., /n(*) = 0. (3.55) Тем самым, произвольное подпространство L7 задается некоторой системой линейных уравнений (3.55). Этот факт хорошо известен для прямой и плоскости (dimL =1,2) в трехмерном пространстве из курса аналитической геометрии. В общем случае это утверждение — обратное к доказанному в примере 3.5 (стр. 94). Теорема 3.14 показывает, что если L — любое векторное пространство размерности п, то в качестве L* мы получаем любые пространства той же размерности (над тем же полем К, разумеется). Также мы определили соответствие L7 н-> (L;)a между подпространствами L; с L и (L;)a с L*, которое ввиду равенства ((L;)a)a = L7 является взаимно однозначным. Мы будем обозначать это соответствие через е и называть двойственностью. Укажем на некоторые простые свойства этого соответствия. Если 1? и L" — два подпространства L, то e(L' + L") = s{L')ne(L"). (3.56) Иными словами, это значит, что (L7 + L")a = (L;)a П (L")a. (3.57) Действительно, пусть / Е (L')a П (L/7)a. По определению суммы, для любого вектора х Е L; + L" мы имеем представление х = х' + хп, где х' Е L' и х" Е L", откуда следует, что f{x) = f(xf) + f(x") = 0, так как / Е (L;)a
134 Гл. 3. Векторные пространства и / Е (L77)a. Следовательно, / Е (L7 + 1_77)а, и тем самым мы доказали включение (1_7)а П (1_77)а с (L7 + L77)a. Докажем теперь обратное включение. Пусть / Е (L7 + L77)a, т.е. /(ж) = 0 для всех векторов ж — ж7 + ее", где ж7 Е L/ и хп Е L77, и в частности, для всех векторов самих подпространств L7 и L77, т.е., по определению аннулятора, мы имеем включения / Е (L7)a и / € (L/7)a. Таким образом, / Е (L7)a n (L77)a, т. е. (L7 + L77)a с (L7)a П (L77)a. Отсюда в силу предыдущего включения мы получаем соотношение (3.57), а следовательно, и соотношение (3.56). В результате мы можем сформулировать следующий, сначала почти очевидный, принцип двойственности, другие, более глубокие варианты которого мы докажем позже: Принцип двойственности. Если для всех векторных пространств одной и той же конечной размерности п над одним и тем же полем К доказана теорема, в формулировке которой участвуют лишь понятия подпространства, размерности, суммы и пересечения, то для всех таких пространств справедлива двойственная теорема, получающаяся из исходной следующей заменой: размерность г размерность п — г пересечение L7 П L77 сумма L7 + L77 сумма L7 + L77 пересечение L7 П L77. Наконец, рассмотрим линейное преобразование «g^: L —> М. При этом, как и любые функции, линейные функции отображаются в противоположную сторону по сравнению с элементами множеств, на которых они заданы, см. параграф, содержащий предварительные сведения, с. 11. В обозначениях этого параграфа мы положим множество Т = К и ограничим построенное там отображение #(М,К) —► ^(ЦК) на подмножество М* с #(М,К) — пространство линейных функций на М. Заметим, при этом что образ М* содержится в пространстве L* с #(!_, К), т.е. состоит из линейных функций на L. Это отображение мы обозначим через я/*. Согласно данному на с. 11 определению мы задаем линейное преобразование srf*\ M* —> L*, определив для каждого вектора g E М* его значение равенством №*(д)) (х) = д (<&(х)) для всех ж Е L. (3.58) Тривиальная проверка показывает, что s/*(g) — линейная функция на L и srf* — линейное преобразование М* в L*. Построенное преобразование ^* называется сопряженным преобразованию si. Пользуясь введенным выше обозначением /(ж) как (ж,/), можно записать определение (3.58) в эквивалентном виде: (л^*(у),ж) = (у,я/(х)) для всех ж Е L и у Е М*.
3.7. Сопряженное пространство 135 Выберем в пространстве L произвольный базис ei,...,en, в М — базис /ь ••• »/m» a также взаимные базисы е*,... , е* в L* и /*,... ,/^ в М*. Теорема 3.15. Матрица преобразования я/: L —> М, записанная в произвольных базисах пространств L и М, и матрица сопряженного преобразования я/*: М* —> L*, записанная во взаимных им базисах пространств М* и L*, соответственно, транспонированы друг другу. Доказательство. Пусть А = (о^) — матрица преобразования я/ в базисах ei,...,en и /i,...,/m. Согласно формуле (3.23) это значит, что m ^(ei) = 1%2ajifj> г=1,...,п. (3.59) i=i По определению сопряженного преобразования (формула (3.58)), для любой линейной функции / е L* выполнены равенства (^*(/))(ei) = /(^(ei)) г=1,...,п. Если е*,... ,е* — базис в L*, взаимный к базису еь ... ,еп в L, а /*,... ,/^ — базис в М*, взаимный к базису f\,.--,fm в М, то £f*(f%) есть линейная функция на L, определенная условием (3.58). В частности, применяя £/*(/£) к векторам е* G L, с учетом (3.58) и (3.59) получаем (7тг \ т а это число равно аы по определению взаимного базиса. Такой линейной п функцией на L, очевидно, является функция J2 аы^*- Таким образом, мы г=1 получаем, что преобразование я/* ставит в соответствие вектору /£ £ М* вектор п ^^*) = $>*»<. к=1,...,т, (3.60) пространства L*. Сравнивая формулы (3.59) и (3.60), мы заключаем, что в указанных базисах матрица преобразования si* равна А* = (а^), т.е. транспонирована матрице преобразования si. Если даны два линейных преобразования векторных пространств si: L —> М и <^: М —> N, то определено и их произведение ^^: L —> N, а значит, и сопряженное ему преобразование (38я/)*\ N* —> L*. Из условия (3.58) непосредственной проверкой легко вывести соотношение {&si)* = si*38*. (3.61) Вместе с теоремой 3.15 таким образом получается новое доказательство равенства (2.57), причем теперь не используются никакие формулы — соотношение (2.57) получается благодаря использованию общих понятий.
136 Гл. 3. Векторные пространства § 3.8. Формы и многочлены от векторов Естественным обобщением линейной функции на векторном пространстве является понятие формы. Оно играет большую роль во многих разделах математики, а также в механике и физике. Мы будем предполагать далее, что векторное пространство L, на котором мы хотим задать форму, определено над произвольным полем К. Выберем в пространстве L некоторый базис е\,...,еп. Тогда каждый вектор х е L однозначно определяется набором своих координат (жь... ,хп) в данном базисе. Определение. Функция F: L —> К называется многочленом на пространстве L, если F(x) записывается как многочлен от координат х\,...,хп вектора ж, т. е. F(x) является конечной суммой выражений вида czf1...^, (3.62) где k\,...kn — неотрицательные целые числа и коэффициент с G К. Выражение (3.62) называется одночленом на пространстве L, а число /С — Гь\ ~Г * * * Г" fori называется его степенью. Степенью многочлена F{x) называется наибольшая из степеней одночленов, входящих в него с коэффициентами с ф 0. Заметим, что при п > 1 многочлен F(x) степени к может иметь несколько различных одночленов (3.62) такой же степени, входящих в него с коэффициентами с ф 0. Определение. Многочлен F(x) на пространстве L называется однородным степени к или формой степени к (часто говорят и пишут: к-формой), если все одночлены, входящие в него с коэффициентами с Ф 0, имеют одну и ту же степень к. Данные нами определения нуждаются в некотором комментарии — ведь мы ввели их, основываясь на использовании некоторого базиса пространства L, и нужно показать, что при изменении базиса они сохраняют смысл, т. е. что если функция Fix) является многочленом (или формой) от координат вектора х в одном базисе, то она будет многочленом (или формой) той же самой степени от координат вектора жив любом другом базисе. Действительно, используя формулу для замены координат вектора, т. е. подставляя соотношения (3.35) в (3.62), легко видеть, что при замене базиса каждый одночлен (3.62) степени к превращается в сумму одночленов такой же степени. Это и доказывает все нужные нам утверждения. Формы степени к = 0 — это просто постоянные функции, ставящие в соответствие каждому вектору х е L одно и то же число. Формы степени к = 1 называются линейными, это в точности линейные функции на пространстве L, которые мы подробно рассматривали в предыдущем параграфе. Формы степени к = 2 называются квадратичными, они играют особенно важную роль как в курсе линейной алгебры, так и во многих других разделах математики и физики. В нашем курсе квадратичным формам будет целиком посвящена гл. 6.
3.8. Формы и многочлены от векторов 137 Отметим, что мы уже сталкивались даже и с формами произвольной степени: Пример 3.29. Пусть F(x\9...9xm) — полилинейная функция от т строк длины п (см. определение на с. 65). Так как пространство Кп строк длины п изоморфно любому n-мерному векторному пространству, то мы можем рассматривать F(x\,...,xm) как полилинейную функцию от т векторов пространства L. Полагая в ней все векторы х\,...,хт равными ж, согласно теореме 2.10, мы получим на пространстве L форму F{x) = F(x,... , ж) степени га. Обозначим через Fk(x) сумму всех одночленов степени k ^ 0, входящих в многочлен F(x) при выборе некоторого базиса ei,...,en. Таким образом, Fk(x) — форма степени к, и мы получим выражение F(x) = F0 + F{ (ж) + • • • + Fm(x), (3.63) в котором Fk(x) = 0, если членов степени к нет. Для каждой формы Fk(x) степени к выполняется равенство Fk{\x) = \kFk(x), (3.64) справедливое для любого числа Л е К и любого вектора х е L (очевидно, достаточно проверить равенство (3.64) для одночлена). Подставляя в соотношение (3.63) вектор Аж вместо ж, мы получим F(Xx) = F0 + AFi (x) + • • • + XmFm(x). (3.65) Отсюда легко вывести, что формы Fi в представлении (3.63) однозначно определяются многочленом F. Нетрудно видеть, что совокупность всех многочленов на пространстве L образует векторное пространство, которое мы обозначим через А. Это обозначение связано с тем, что совокупность всех многочленов образует не только векторное пространство, но и более богатую и сложную алгебраическую структуру, которая называется алгеброй. Это значит, что кроме операций векторного пространства, в А определена еще и операция произведения любых двух элементов, удовлетворяющая определенным условиям, см. определение на с. 366. Однако пока мы не будем пользоваться этим фактом, а рассмотрим А только как векторное пространство. Заметим, что пространство А бесконечномерно. Действительно, достаточно рассмотреть бесконечную последовательность форм Fk(x) = x\, где к пробегает все натуральные значения, а форма Fk{x) ставит в соответствие вектору х с координатами (xi,... ,xn) к-ю степень его г-ой координаты (число г может быть фиксировано). Совокупность форм фиксированной степени к на пространстве L образует подпространство А^ С А. При этом Aq = К, a Ai совпадает с пространством L* линейных функций на L. Разложение (3.63) можно было бы интерпретировать как разложение пространства А в прямую сумму бесконечного числа подпространств А*; (к = 0,1,...), если бы мы определили такое понятие. В алгебре для него принято название градуировка.
138 Гл. 3. Векторные пространства В оставшейся части параграфа мы рассмотрим два примера, использующих введенные понятия. При этом мы будем пользоваться правилами дифференцирования функций многих переменных (в применении к многочленам), которые для некоторых читателей, возможно, будут новыми. Но и ссылаться на полученные таким образом формулы мы будем лишь в отдельных местах курса, которые при желании могут быть опущены. Мы приводим эти рассуждения только для того, чтобы подчеркнуть связь линейной алгебры с другими разделами математики. Начнем с рассуждения, использующего некоторую систему координат, т. е. выбор некоторого базиса в пространстве L. Для многочлена F(x\,... ,хп) определены частные производные dF/dxi, которые также являются многочленами. Легко видеть, что отображение, сопоставляющее каждому многочлену F Е А многочлен dF/dxi, определяет линейное преобразование А —► А, которое обозначается символом d/dxi. Из этих преобразований составляются новые преобразования А —> А вида »-£*£■ <з-бб) где Pi — произвольные многочлены. Линейные преобразования вида (3.66) называются дифференциальными операторами первого порядка. В анализе и геометрии рассматриваются их аналоги, когда Pi являются функциями гораздо более общего класса, и соответствующим образом расширяется пространство А. Из простейших свойств дифференцирования следует, что определенные формулой (3.66) линейные преобразования 9 обладают свойством 9(FG) = F 9(G) + G 9(F) (3.67) для любых F £ А и G Е А. Покажем, что верно и обратное утверждение: любое линейное преобразование 9: А —» А, удовлетворяющее условию (3.67)(3.66), является дифференциальным оператором первого порядка. Для этого заметим прежде всего, что из соотношения (3.67) следует, что 9(1) = 0. Действительно, положив в (3.67) многочлен F — 1, получаем равенство 9(\G) = \ 9(G) + G9(1). Сокращая слагаемое 9(G) в левой и правой части, мы видим, что G 9(1) = 0, а выбрав в качестве G любой отличный от нуля многочлен (хотя бы G = 1), получаем 9(1) = 0. Определим теперь линейное преобразование 9': А —> А по формуле п я & = @-4yPi7r-, где Pi = 9(xi). ^ dxi г=\ Легко видеть, что 9'(\) = 0 и 9'(xi) — 0 для всех индексов г = 1,...,п. Заметим также, что преобразование 9\ как и 9, удовлетворяет соотношению (3.67), из которого следует, что если 9(F) = 0 и 9(G) — 0, то и 9(FG) = 0. Таким образом, 9'(F) = 0, если многочлен F является произведением любых двух одночленов из числа 1,хь... ,хп. В число таких многочленов, очевидно, входят все одночлены второй степени, и следовательно, для них 9'(F) = 0.
3.8. Формы и многочлены от векторов 139 Рассуждая далее по индукции, мы можем показать, что @'{F) = 0 для всех одночленов из А/- при всех &, а следовательно, это верно и вообще для всех форм Fk £ A&. Наконец, вспомним, что любой многочлен F Е А является суммой конечного числа однородных многочленов F/, G А^. Поэтому &{F) = 0 для всех F Е А, и значит, преобразование Sf имеет вид (3.66). Соотношение (3.67) дает определение дифференциального оператора первого порядка, не зависящее от системы координат, т.е. выбора базиса ei,...,en в пространстве L. Пример 3.30. Рассмотрим дифференциальный оператор г=\ Очевидно, что @(xi) = xi для всех г = 1,... ,п, откуда следует, что^ при ограничении на подпространство Ai С А линейное преобразование 2f\ А\ —> Ai становится единичным, т.е. равным £.^Докажем, что при ограничении на подпространство А^сА преобразование Sf\ А/~ —> А/~ совпадает с к£. Используем индукцию по к. Случай к = 1 мы уже разобрали, а случай к = 0 очевиден. Рассмотрим многочлены XiG, ^де G Е А&_1 и г = 1,...,п. Тогда^из (3.67) имеем равенство &{xiG) = Xi@(G)+ G@(xi). Мы видели, что ^(ж;) = #ь а по индукции можно предполагать, что Sf{G) = (к — \)G. В результате получаем равенство ®(xi G) =Xi(k- 1)G + Gxi = kxiG. Но любой многочлен F E A^ может быть записан в виде суммы многочленов вида ж^Сг с подходящими Gi Е А/е_1.^Гаким образом, для любого многочлена F Е А/с мы получаем соотношение ^(i*1) = fcF. Записанное в координатах, оно принимает вид )xi^ = kF, FeAk (3.68) Е< OXi и называется тождеством Эйлера. Пример 3.31. Пусть F(x) — произвольный многочлен на векторном пространстве L. Для переменного t Е R и фиксированного вектора х Е L функция F(tx), ввиду соотношений (3.63) и (3.64), является многочленом от переменной t. Выражение (d0F)(x) = jtF(tx) (3.69) называется дифференциалом функции F{x) в точке 0. Поясним, что в правой части равенства (3.69) стоит обычная производная функции F(tx) как функции переменного tGl в точке t = 0. В левой части равенства (3.69) и в выражении «дифференциал функции в точке 0» символ 0 означает, как обычно, нулевой вектор пространства L.
140 Гл. 3. Векторные пространства Проверим, что (doF)(x) является линейной функцией от х. Для этого воспользуемся равенством (3.65) для многочлена F{tx). Из соотношения F{tx) = F0 + tFi (x) + • • • + *mFm(zO мы сразу же получаем, что ^F(tx)\ =Fx{x), at 1^=0 где F\(x) — линейная функция на L. Таким образом, в разложении (3.63) для многочлена F(x) второе слагаемое F\(x) = (doF)(x), поэтому d^F часто называют линейной частью многочлена F. Приведем выражение в координатах для этой важной функции. Применяя правила дифференцирования функций многих переменных, получаем: d „, ч v^ dF . Л d(txi) ^ dF, ч i=l г=1 Полагая t = 0, из этой формулы мы получаем 71 8F (d0F)(x) = J2o^WXi. (3.70) г=\ Координатное выражение (3.70) для дифференциала вполне удобно, но оно требует выбора базиса е\,..., еп в пространстве L и записи х = х\в\ Н \- хпеп. Только выражение (3.69) показывает, что (doF)(x) не зависит от выбора базиса. В анализе оба выражения (3.69) и (3.70) определяются для функций гораздо более общего класса, чем многочлены. Заметим, что для многочленов F{x\,... ,хп) — xi с помощью формулы (3.70) мы получаем выражения (doF)(x) = x%. Это означает, что функции {d{sx\),..., (doxn) образуют базис в L*, взаимный к базису е\,...,еп в L.
Глава 4 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПРОСТРАНСТВА В СЕБЯ § 4.1. Собственные векторы и инвариантные подпространства В предыдущей главе мы ввели понятие линейного преобразования пространства L в пространство М. В этой и следующей главах мы будем рассматривать важный частный случай, когда пространство М совпадает с L, при этом в нашей книге оно всегда предполагается конечномерным. Тогда линейное преобразование stf\ L —> L называется линейным преобразованием пространства L в себя, или просто линейным преобразованием пространства L. Этот случай имеет большое значение и чаще всего встречается в разных разделах математики, механики и физики. Напомним некоторые установленные нами ранее факты, относящиеся к рассматриваемому случаю. При этом по-прежнему будем понимать термин «число» в самом широком смысле, т.е. как вещественное или комплексное число или элемент произвольного поля К (по выбору читателя). Как мы установили в предшествующей главе, для того, чтобы задать преобразование я/ матрицей, нужно выбрать в пространстве L некоторый базис е\,..., еп и записать координаты векторов я/(е\),..., s/(en) в этом базисе в виде столбцов матрицы. Это будет квадратная матрица А порядка п. Если преобразование srf пространства L невырождено, то векторы £/(е\),... ,s/(en) также образуют базис пространства L, и мы можем интерпретировать А как матрицу перехода от базиса е\,... ,еп к базису £/(е\),... ,я?(еп). Невырожденное преобразование я/, очевидно, имеет обратное преобразование я/~1 с матрицей А~х. Пример 4.1. Выпишем матрицу линейного преобразования «я^, которое заключается в повороте плоскости вокруг начала координат на некоторый угол а против часовой стрелки. Для этого выберем в плоскости базис, состоящий из двух перпендикулярных друг другу векторов е\ и е^ единичной длины, где вектор e<i получается из е\ поворотом на прямой угол против часовой стрелки (рис. 4.1). Тогда, как легко видеть, будем иметь соотношения: £?(е\) = cosaei + sinae2, £${е>2) = — sinaei +cosae2, откуда, согласно определению, следует, что матрица преобразования &/ в данном базисе равна (cos a — sin a \ (4.1) sin a cos а /
142 Гл. 4. Линейные преобразования пространства в себя Пример 4.2. Рассмотрим линейное преобразование sni плоскости комплексного переменного, которое заключается в умножении каждого числа z e С на некоторое фиксированное комплексное число p + iq (здесь i — мнимая единица). Если мы будем рассматривать плоскость комплексного переменного как векторное пространство L над полем С, то очевидно, что в любом базисе пространства L такое преобразова- Рис. 4.1. Поворот на угол а ние ^ имеет матрицу порядка 1, состоящую из единственного элемента, равного данному числу p + iq. Действительно, в этом случае dimL = 1, и нам нужно выбрать в L базис, состоящий из любого ненулевого вектора L, т. е. любое комплексное число z ^ 0. Тогда будем иметь соотношение si{z) = (р + iq)z. Теперь рассмотрим плоскость комплексного переменного как векторное пространство L над полем R. В этом случае dimL = 2, так как каждое комплексное число z = х + iy задается парой вещественных чисел х и у. Выберем в L такой же базис, что и в примере 1, при этом вектор е\ выберем лежащим на вещественной оси, а вектор е2 — на мнимой. Из равенства (х + iy)(p + iq) = (px - qy) + i(py + qx) следуют соотношения (ei) =pe\ + qe2j srf(e,2) = -qe\ + ре2, откуда, согласно определению, следует, что матрица преобразования si в данном базисе равна В случае, если \р + iq\ = 1, мы можем положить р = cos а и q = sin а для некоторого числа 0 ^ а < 2п (такое а называется аргументом комплексного числа p + iq). Тогда матрица (4.2) совпадает с (4Л), т.е. умножение на комплексное число с модулем 1 и аргументом а означает поворот плоскости комплексного переменного против часовой стрелки на угол а. Заметим, что любое комплексное число p + iq можно представить в виде произведения вещественного числа г и комплексного числа, по модулю равного 1, т.е. p + iq = r(pf + iqf), где \р' + iqr\ = 1 и г = \р + iq\. Отсюда видно, что умножение на р + iq есть произведение двух линейных преобразований плоскости комплексного переменного: поворот на угол а и растяжение в г раз. В § 3.4 мы установили, что при переходе от базиса ei,...,en к какому- нибудь другому базису е\,...,е'п пространства L матрица преобразования изменяется по формуле А' = С~1АС, (4.3) где С — матрица перехода от второго базиса к первому.
4.1. Собственные векторы и инвариантные подпространства 143 Определение. Две квадратные матрицы А и А\ связанные между собой соотношением (4.3) с некоторой невырожденной матрицей С, называются подобными. Нетрудно видеть, что на множестве квадратных матриц заданного порядка определенное таким образом отношение является отношением эквивалентности (см. определение на с. 8). Из формулы (4.3) следует, что при замене базиса определитель матрицы преобразования не меняется, поэтому можно говорить не об определителе матрицы преобразования, а об определителе самого линейного преобразования srf, который обозначается как \&{\. Линейное преобразование srf\ L —» L невырождено тогда и только тогда, когда \&4\ ф 0. В случае, если пространство L вещественно, число \&4\ ф 0 также вещественно и имеет определенный знак. Определение. Невырожденное линейное преобразование srf\ L —> L вещественного пространства L называется собственным, если \&4\ > 0, и несобственным, если \si\ < 0. Одна из основных задач теории линейных преобразований, которой мы будем дальше заниматься, заключается в том, чтобы для заданного линейного преобразования векторного пространства в себя найти базис, в котором его матрица имеет наиболее простой вид. Это равносильно тому, чтобы для заданной квадратной матрицы найти наиболее простую подобную ей матрицу. Наличие такого базиса (или подобной матрицы) дает возможность легко обозреть многие важные свойства исходного линейного преобразования (соответственно матрицы). В самом общем виде эта задача будет решена в гл. 5, а сейчас мы рассмотрим ее для одного типа линейных преобразований, которые встречаются чаще всего. Определение. Подпространство L7 векторного пространства L называется инвариантным относительно линейного преобразования я/: L —► L, если для любого вектора х Е L7 вектор &/{х) Е L'. Очевидно, что согласно этому определению, нулевое подпространство (0) и само пространство L являются инвариантными относительно любого линейного преобразования si\ L -» L. Поэтому далее при перечислении инвариантных подпространств пространства L мы всегда будем иметь в виду подпространства L7 с L, не совпадающие ни с (0), ни со всем L. Пример 4.3. Пусть L — трехмерное пространство, изучавшееся в курсе аналитической геометрии и состоящее из векторов с началом в некоторой фиксированной точке О, а преобразование si — зеркальное отражение относительно некоторой плоскости L/, проходящей через О. Тогда, как легко видеть, я/ имеет два инвариантных подпространства: саму плоскость L7 и прямую L", проходящую через О перпендикулярно L7. Пример 4.4. Пусть пространство L — то же, что и в предыдущем примере, а преобразование я/ — поворот относительно некоторой оси L;, проходящей
144 Гл. 4. Линейные преобразования пространства в себя через О, на некоторый угол а, 0 < а < п. Тогда si имеет два инвариантных подпространства: саму прямую L' и плоскость L", проходящую через О перпендикулярно L'. Пример 4.5. Пусть L — то же, что и в предыдущих примерах, и преобразование si — гомотетия, т. е. оно заключается в умножении каждого вектора на фиксированное число а ф 0. Тогда, как легко видеть, любая проходящая через О прямая или плоскость будут инвариантными подпространствами преобразования si. Более того, нетрудно заметить, что если si — гомотетия произвольного векторного пространства L, то любое его подпространство, отличное от (0) и самого L, является инвариантным. Пример 4.6. Пусть пространство L — плоскость, состоящая из векторов с началом в некоторой точке О, а преобразование si — поворот вокруг О на некоторый угол а, 0 < а < 7г. Тогда si не имеет инвариантных подпространств. Очевидно, что ограничение линейного преобразования si на инвариантное подпространство L/ с L — линейное преобразование L' в себя. Мы будем обозначать его через si', т. е. sif\ L/ —> L/ и si'(x) = si{x) при всех х е L'. Пусть ei,...,em — некоторый базис подпространства I/. Так как он состоит из линейно независимых векторов, то может быть дополнен до базиса ei,...,en всего пространства L. Выясним, как выглядит матрица линейного преобразования si в этом базисе. Векторы si(e\),... ,si(em) линейно выражаются через ei,...,em, это и равносильно тому, что е\,...,ет — базис инвариантного относительно si подпространства. Поэтому мы имеем равенства .. , si[e\) = а\\е\ + а2\е2 Н Ь ат\еГ1 si(e2) = а\2е\ + а22е2 Н Ь am2e^ ■^mi (em) = а\те\ + а2те2 -\ \- атгпеш. Очевидно, что матрица А! fa\\ a\2 ••• а\ш\ а2\ а22 ••• а2т \&гп\ 0"гп2 ' * * 0"тт/ (4.4) — это и есть матрица линейного преобразования si': \J —> L' в базисе ei,...,em. Относительно векторов si{ei) при г > т мы, вообще-то, ничего сказать не можем, кроме того, что они являются линейными комбинациями векторов базиса ei,...,en всего пространства L. Однако мы запишем это, отделив слагаемые, кратные векторам е\,..., еш (соответствующие коэффициенты обозначим через Ь^) и кратные векторам еш+ь ••• > еп (соответствующие коэффициенты обозначим через с^-)- В результате мы получим матрицу А = № $) , (4.5)
4.1. Собственные векторы и инвариантные подпространства 145 где В' — матрица типа (га, п — т), С — квадратная матрица порядка п — т и 0 — матрица типа (п — га, га), все элементы которой равны нулю. Если же к подпространству L' можно подобрать другое инвариантное подпространство L", такое, что L = L/ ф L", то, объединяя базисы подпространств L' и L", мы получим базис пространства L, в котором матрица нашего линейного преобразования si запишется в виде А-(Л' ° где А' — матрица (4.4), а С" — матрица линейного преобразования, определяемого ограничением преобразования si на подпространство L". Аналогично, если L = l_i ф L2 Ф • • • Ф Ц, где все Ц — инвариантные подпространства относительно преобразования si, то матрица преобразования si может быть записана в виде (А\ 0 ... 0\ О А' ••• О А= . . . . , (4.6) \0 0 ..'• а\) где А^ — матрица линейного преобразования, определяемого ограничением srf на инвариантное подпространство Ц. Матрицы вида (4.6) называют блочно- диагональными. Простейший случай — это инвариантное подпространство размерности 1. Тогда оно имеет базис, состоящий из одного вектора е ф 0, а его инвариантность выражается соотношением я/(е) = Хе (4.7) с некоторым числом Л. Определение. Если для вектора е ф 0 выполнено соотношение (4.7), то е называется собственным вектором, а число Л — собственным значением преобразования si. Если задано собственное значение Л, то простая проверка показывает, что все векторы е G L, удовлетворяющие соотношению (4.7), включая сюда и нулевой вектор, образуют инвариантное подпространство в L. Оно называется собственным подпространством, соответствующим собственному значению Л, и обозначается через Ц. Пример 4.7. В примере 4.3 собственным вектором преобразования si является, во-первых, любой вектор плоскости L' (при этом собственное значение Л = 1), и во-вторых, любой вектор прямой L" (собственное значение Л = — 1). В примере 4.4 собственные векторы — это все векторы, лежащие на прямой V, им соответствует А = 1. В примере 4.5 любой вектор пространства является собственным со значением X — а. Разумеется, здесь везде речь идет о ненулевых векторах.
146 Гл. 4. Линейные преобразования пространства в себя Пример 4.8. Пусть пространство L состоит из всех бесконечное число раз дифференцируемых функций, а преобразование si — дифференцирование, т.е. оно ставит в соответствие каждой функции x(t) из L ее производную xf(t). Тогда собственными векторами si являются не равные тождественно нулю функции x(t), являющиеся решением дифференциального уравнения xf(t) — Xx(t). Легко проверить, что такие решения — это функции x(t) = ceAt, где с — произвольное число. Следовательно, любому числу Л соответствует одномерное инвариантное подпространство преобразования si, состоящее из векторов x(t) = cext, и при всех с ф 0 это — собственные векторы. Существует удобный способ находить собственные значения преобразования si и соответствующие им подпространства. Для этого надо выбрать в пространстве L произвольный базис е\,...,еп и искать векторы е, удовлетворяющие соотношению (4.7), в виде линейной комбинации е = х\е\ + Ж2в2 Н Ь хпеп. (4.8) Пусть матрица преобразования si в базисе ei,...,en есть А — (%•)• Тогда координаты вектора si{e) в том же базисе выражаются по формулам ( у\ = а\\х\ + а\2Х2 Л V а\пхп, I У2 = 021Я1 + а22#2 Н h ^п^п, < I Уп = о,п\х\ + ап2^2 Н Ь аппхп. Теперь мы можем записать соотношение (4.7) в виде ( ацх\ +а\2Х2~\ \- а\пхп = \х\, J CL2\Xi + tt22^2 H \~ 0,2nXn = А#2> < I ап\х\ + ап2Х2 Н Ь аппжп = Лхп или, иначе, в виде ( («и - А)ж1 + ai2^2 H Ь ain^n = 0, I «21^1 + (a22 - \)Х2 Л Ь (12пХп = О, < (4.9) I a^i^i + an2X2 H Ь (ann - А)хп = 0. Мы получаем для координат х\,Х29 ••• ,жте вектора (4.8) систему п однородных линейных уравнений. Согласно следствию теоремы 2.2 эта система будет иметь отличное от нулевого решение тогда и только тогда, когда определитель ее матрицы равен нулю. Мы можем записать это условие в виде \А - \Е\ = 0. Применяя формулу полного развертывания определителя, мы видим, что определитель \А — tE\ является многочленом степени п от t. Он называется характеристическим многочленом преобразования si. Собственные значения преобразования si совпадают с корнями этого многочлена.
4.1. Собственные векторы и инвариантные подпространства 147 Докажем, что характеристический многочлен не зависит от базиса, в котором мы записываем матрицу преобразования. Собственно, только после этого мы имеем право говорить о характеристическом многочлене самого преобразования, а не его матрицы в каком-то базисе. Действительно, как мы видели (формула (4.3)), в другом базисе мы получим матрицу А' — С~1АС, где \С\ ф 0. Для нее характеристический многочлен равен \А' - tE\ = 1С"1 А С - tE\ = \C~l (A - tE) C\. Применяя формулу умножения определителей и формулу для определителя обратной матрицы, получим равенство 1С"1 (А - tE) С\ = \С~11 • \А - tE\ • \С\ = \А- tE\. Если пространство имеет базис ei,...,en, состоящий из собственных векторов, то в этом базисе s#(e.i) = А^. Отсюда следует, что матрица преобразования я/ в этом базисе имеет диагональный вид /Хх 0 -.. 0\ о л2 ... о I \6 о ... хп) Это частный случай записи (4.6), когда инвариантные подпространства Ц одномерны, т.е. Ц = (е;). Такие линейные преобразования называются диа- гонализируемыми. Как показывает следующий пример, не все преобразования диагонализи- руемы. Пример 4.9. Пусть я/ — линейное преобразование плоскости (вещественной или комплексной), которое в некотором базисе е\,е2 имеет матрицу Характеристический многочлен этого преобразования \А — tE\ — (t — а)2 имеет единственный корень t = а кратности 2, которому соответствует одномерное собственное подпространство (ei). Отсюда следует, что преобразование я/ не диагонализируемо. Это можно доказать и по-другому, воспользовавшись понятием подобной матрицы. Если бы преобразование я/ было диагонализируемо, то нашлась бы невырожденная матрица С второго порядка, для которой выполнено равенство С~1АС — аЕ или, что то же самое, равенство АС = аС. Относительно неизвестных элементов матрицы С = (су) последнее равенство дает нам два уравнения: Ъс2\ = 0 и Ъ&я = 0, откуда в силу Ь^О следует, что c<i\ = C22 = 0, и матрица С оказывается вырожденной.
148 Гл. 4. Линейные преобразования пространства в себя Мы видели, что число собственных значений линейного преобразования конечно и не превосходит п (размерности пространства L), так как они являются корнями характеристического многочлена степени п. Теорема 4.1. Размерность собственного подпространства 1_д С Ц соответствующего собственному значению X, не превосходит кратности числа Л как корня характеристического многочлена. Доказательство. Пусть размерность собственного подпространства L\ равна га. Выберем в нем базис ei,...,em и дополним его до базиса ei,...,en всего пространства L, в котором матрица преобразования si приобретает вид (4.5). Так как, в силу определения собственного подпространства, si{ei) — Хвг для всех г = 1,... ,га, то в формуле (4.5) матрица А' = ХЕт, где Ет — единичная матрица порядка га. Тогда /A'-tEm Bf \ f{\-t)Em Bf A-tE=[ V 0 C'-tEn-J V 0 C'-tEn-. где Еп-т — единичная матрица порядка п — га. Поэтому \A-tE\ = (\-t)m\C'-tEn-m\. С другой стороны, если L = Ц © L", то La П L" = (0), и значит, ограничение преобразования si на L" не имеет собственных векторов с собственным значением Л. Последнее означает, что \С — ХЕп-т\ ф 0, т. е. число Л не является корнем многочлена \Cl — tEn-m\, что нам и требовалось доказать. В предшествующей главе были введены операции сложения и умножения линейных преобразований, которые, очевидно, определены и для частного случая преобразований пространства L в себя. Таким образом, для любого целого числа п > 0 определена операция возведения линейного преобразования в степень п. По определению, sin при п > 0 есть результат умножения si самого на себя п раз, а при п = 0 si0 есть тождественное преобразование £. Это позволяет ввести понятие многочлена от линейного преобразования, которое будет играть в дальнейшем важную роль. Пусть si — линейное преобразование векторного пространства L (вещественного, комплексного или над произвольным полем К) и f{x) = ао + а\х Н Ь ockXk — многочлен с числовыми коэффициентами (соответственно вещественными, комплексными или из этого же поля К). Определение. Многочленом f от линейного преобразования si называется линейное преобразование f(^) = olq£ + axsi + -• + aksik, (4.10) где £ — тождественное линейное преобразование. Заметим, что данное определение не использует координат, т.е. выбор определенного базиса в пространстве L. Если же такой базис ei,...,en выбран, то линейному преобразованию si однозначно соответствует некоторая
4.2. Комплексные и вещественные пространства 149 квадратная матрица А. В § 2.9 было введено понятие многочлена от квадратной матрицы, что позволяет дать другое определение: /(я/) — это линейное преобразование с матрицей f(A) = аоЕ + а{А + --- + akAk (4.11) в базисе еь..., еп. В равносильности этих определений нетрудно убедиться, если вспомнить, как действия над линейными преобразованиями выражаются через действия над их матрицами (см. § 3.3). Для этого нужно показать, что при замене базиса ei,...,en матрица f(A) тоже меняется по формуле (4.3) с той же самой матрицей С, что и матрица А. Действительно, рассмотрим замену координат (т. е. переход к другому базису пространства L) с матрицей С. Тогда в новом базисе матрица преобразования si равна А' = С~1АС. В силу ассоциативности умножения, имеем также соотношения А/п = С~хАпС для всех целых п ^ 0. Подставляя А' вместо А в формулу (4.11), с учетом сказанного мы получаем f(A') = а0Е + оцА' + • • • + akAf k = = С~1{а0Е + ai A + • • • + akAk) С = C~lf{A) С, что и доказывает наше утверждение. Очевидно, что на многочлены от линейных преобразований переносятся утверждения, доказанные нами в § 2.9 для многочленов от матриц (стр. 82). Лемма. Если f(x) + д(х) = и(х) и f(x)g(x) = v(x), то для любого линейного преобразования srf имеем f(£/)+g(j*)=u(sf), (4.12) f(j*)g(£/)=v(fi/). (4.13) Следствие. Многочлены f{s#) и д(&/) от одного и того же линейного преобразования srf коммутируют: f(s^)g(s/) = g(^)f(s^). § 4.2. Комплексные и вещественные пространства Теперь мы более детально исследуем понятия, введенные в предыдущем параграфе, для преобразований комплексных и вещественных векторных пространств (т.е. предполагая, что поле К есть С или R соответственно). Основной результат, специфический именно для комплексных пространств, таков: Теорема 4.2. Любое линейное преобразование комплексного векторного пространства имеет собственный вектор. Это немедленно следует из того, что характеристический многочлен линейного преобразования, как и вообще любой многочлен ненулевой степени, имеет комплексный корень. Тем не менее, как показывает пример 4.9
150 Гл. 4. Линейные преобразования пространства в себя из предыдущего параграфа, и в комплексном пространстве не всякое линейное преобразование диагонализируемо. Рассмотрим вопрос диагонализируемости подробнее, все время предполагая, что имеем дело с комплексными пространствами. Мы докажем диаго- нализируемость часто встречающегося типа преобразований. Для этого нам понадобится следующая лемма. Лемма 1. Собственные векторы, соответствующие различным собственным значениям, линейно независимы. Доказательство. Пусть собственные векторы ei,...,em соответствуют различным собственным значениям Х\,..., Ат, т. е. s/{ei) = А;вг, г = 1,...,га. Докажем лемму индукцией по числу векторов т. При т = 1 она следует из определения собственного вектора (ei Ф О). Предположим, что существует линейная зависимость а\е\ +а2в2 Н У осшеш = 0. (4.14) Применяя к обеим частям этого равенства преобразование s/, мы получим, что Aiaiei + \2OL2e2 Н f- Amamem = 0. (4.15) Вычитая из равенства (4.15) равенство (4.14), умноженное на Аш, мы получим а\ (Ai - Am)ei + а,2{\2 ~ Аш)в2 Н Ь am_i (Am_i - Am)em_i = 0. По индукции мы можем считать лемму доказанной для т — 1 векторов eb...,em_i. Так мы получаем, что ai(Ai - Am) = 0,...,am_i(Am_i - Am) = 0, а так как, по условию леммы, Ai ф Аш,..., Am_i Ф Ат, то а\ = • • • = am_i = 0. Подставляя это в равенство (4.14), мы придем к соотношению атет = 0, т. е. (по определению собственного вектора) и ат = 0. Таким образом, в (4.14) все щ = 0, а это и означает линейную независимость векторов ei,..., ет. Из доказанной леммы вытекает следующий результат: Теорема 4.3. Линейное преобразование комплексного пространства диагонализируемо, если его характеристический многочлен не имеет кратных корней. Как известно, в этом случае характеристический многочлен имеет п различных корней (напомним еще раз, что речь идет о поле комплексных чисел). Доказательство. Пусть Ai,...,An — различные корни характеристического многочлена преобразования s/ и ei,...,en — соответствующие им собственные векторы. Нам достаточно доказать, что эти векторы образуют базис всего пространства. Так как их число равно размерности пространства, то это равносильно их линейной независимости, которая следует из леммы 1. Если А — матрица преобразования &/ в каком-либо базисе, то условие теоремы 4.3 выполняется, если и только если так называемый дискрими-
4.2. Комплексные и вещественные пространства 151 нант1) характеристического многочлена отличен от нуля. Например, если порядок матрицы А равен 2 и А = а Ъ с d то \А - tE\ = a — t b с d — t = (а - t)(d -t) -bc = t2 - (a + d)t + ad- be. Условие, что этот квадратный трехчлен имеет два различных корня, заключается в том, что (a + d)2 — 4(ad — be) ф 0. Это можно переписать в виде {a-df+Abe^Q. (4.16) Аналогично, для комплексных пространств любой размерности линейные преобразования, не удовлетворяющие условиям теоремы 4.3, в любом базисе задаются матрицей, элементы которой связаны некоторым специальным алгебраическим соотношением. В этом смысле условиями теоремы 4.3 не охватываются лишь преобразования, являющиеся исключительными. Аналогичные рассуждения дают необходимое и достаточное условие для того, чтобы линейное преобразование было диагонализируемо. Теорема 4.4. Линейное преобразование комплексного пространства диагонализируемо тогда и только тогда, когда для каждого его собственного значения X размерность соответствующего ему собственного подпространства L\ равна кратности X как корня характеристического многочлена. Иными словами, граница для размерности подпространства 1_д, найденная в теореме 4.1, достигается. Доказательство. Пусть преобразование srf диагонализируемо, т. е. в некотором базисе еь ..., еп оно имеет матрицу А = /Ai 0 0 А2 0 \о о ... хп/ Можно считать, что среди собственных значений Ai,...,An равные числа стоят рядом, так что их совокупность имеет вид Аь ..., Аь А2,..., Х%\, , Afe,..., А^, т\ раз ?7i2 раз т^ раз где все числа Ль..., Л^ различны между собой. Иначе говоря, мы можем записать матрицу А в блочно-диагональном виде: 1) С общим понятием дискриминанта многочлена произвольной степени можно познакомиться, например, в книге В. В. Прасолова «Многочлены». (Издательство МЦНМО, 2003.)
152 Гл. 4. Линейные преобразования пространства в себя f\\Emi О О Х2Ет2 0 \ о V о о XkE, "»fc (4.17) где Emi — единичная матрица порядка т^ Тогда |А - tE\ = (Ai - £)mi (Л2 - t)m2 • • • (Afc - t)m*, т. е. число Xi является корнем кратности mi характеристического многочлена. С другой стороны, равенство д/(х) = Х{Х для вектора х = а\е\ Н Ь ^е^ дает соотношения Asay = A^ay для всех j = 1,...,п и 5 = l,...,fc, т.е. либо dj — 0, либо As = А». Иначе говоря, вектор х является линейной комбинацией только тех собственных векторов е^, которые соответствуют собственному значению А^. Это значит, что подпространство L^ состоит из всех линейных комбинаций таких векторов и, следовательно, diml^ = гщ. Пусть, наоборот, для любого из различных собственных значений Ai,...,Afc размерность собственного подпространства L\{ равна кратности mi числа Xi как корня характеристического многочлена. Тогда из известных свойств многочлена следует, что т\-\ Ь m^ = n и, значит, dim L\{ -\ Ь dim L\k = dim L. (4.18) Докажем, что сумма L\{ -\ h L\k является прямой суммой входящих в нее собственных подпространств L^. Для этого нам достаточно проверить, что для любых векторов х\ G \-\{,... , ж/~ Е \-\к равенство х\ + • • • + х^ = О возможно лишь в том случае, если х\ = • • • = х^ — 0. Но так как х\,...х\~ являются собственными векторами преобразования srf, соответствующими различным собственным значениям Ai,..., А&, то в силу леммы 1 мы получаем требуемое утверждение. Таким образом, благодаря равенству (4.18) мы имеем разложение L = LAl ©•••©LAfe. Выбрав в каждом из собственных подпространств LAi, i— l,...,fc, базис (состоящий из rrii векторов), и объединив их вместе таким образом, чтобы входящие в одно подпространство LAi векторы стояли рядом, мы получим базис пространства L, в котором матрица А преобразования si имеет вид (4.17). Это и означает диагонализируемость преобразования stf. Случай вещественных пространств чаще встречается в приложениях. Он исследуется почти так же, как и случай комплексных пространств, хотя
4.2. Комплексные и вещественные пространства 153 результаты выглядят несколько сложнее. Мы приведем здесь доказательство вещественного аналога теоремы 4.2. Теорема 4.5. Каждое линейное преобразование вещественного векторного пространства размерности п > 2 имеет одномерное или двумерное инвариантное подпространство. Доказательство. Пусть srf — линейное преобразование вещественного пространства L размерности п> 2 и х е L — произвольный ненулевой вектор. Так как в совокупности ж,^(ж),^2(ж),... ,^п(ж) число векторов равно п + 1 > dim L, то по определению размерности пространства эти векторы должны быть линейно зависимы. Это значит, что существуют такие вещественные числа ао,аь... ,ап, не все равные нулю, что а0х + a\srf(x) + а2^2(х) Н Ь ansrfn{x) = 0. (4.19) Рассмотрим многочлен P{t) — ао + Oi\t Л V antn и подставим вместо переменной t преобразование srf, как это было сделано в § 4.1 (формула (4.10)). Тогда равенство (4.19) может быть записано в виде P(tf)(x) = 0. (4.20) Отличный от тождественного нуля многочлен P(t), удовлетворяющий равенству (4.20), называется аннулирующим многочленом вектора х (подразумевается — относительно данного преобразования srf). Предположим, что аннулирующий многочлен P(t) некоторого вектора ж^О является произведением двух многочленов меньшей степени: P(t) = = Q\{t)Q2{t)- Тогда, согласно определению (4.20) и формуле (4.13) из предыдущего параграфа, Q\{s^)Q2^){x) = 0. При этом либо Q2{^){k) = 0 и, значит, вектор х обладает аннулирующим многочленом фгС*) меньшей степени, либо Q2(«eO(aO Ф О- Положив у = Q2(«^)(®)» мы получим равенство Qi№)(y) — 0, означающее, что ненулевой вектор у обладает аннулирующим многочленом Q\(t) меньшей степени. Как известно, любой многочлен с вещественными коэффициентами является произведением многочленов первой и второй степени. Применяя к P(t) нужное число раз описанный выше процесс, мы в конце концов придем к многочлену Q(t) первой или второй степени и такому ненулевому вектору z, что Q(srf)(z) = 0. Это — вещественный аналог теоремы 4.2. Вынося за скобки коэффициент при старшем члене многочлена Q(i), мы можем считать, что этот коэффициент равен 1. Если степень Q(t) равна 1, то Q(t) = t — А с некоторым Л, и равенство Q(srf)(z) = 0 дает (я/ — \&)(z) = 0. Это значит, что Л является собственным значением, a z — собственным вектором преобразования «я^, и следовательно, (z) — одномерное инвариантное подпространство преобразования srf. Если степень Q(t) равна 2, то Q(t) =t2 + pt + qn (srf2 + psrf + qS){z) = 0. В этом случае подпространство Y! = (z,stf(z)) двумерно и инвариантно относительно преобразования srf. Действительно, векторы z и srf{z) линейно независимы, иначе мы имели бы уже рассмотренный выше случай собственного вектора z. Значит, dimL' = 2. Покажем, что L' — инвариантное подпространство преобразования srf. Пусть х = otz + (3&f(z). Для того, чтобы
154 Гл. 4. Линейные преобразования пространства в себя показать, что я/(х) Е L', достаточно проверить, что векторы &/(z) и з/ (д/(г)) содержатся в L'. Первое верно по определению L'. Второе следует из того, что £/(&/(z)) = srf2{z) и, по условию, srf2{z) + psrf{z) + qz — О, т.е. s/2{z) = -qz-p^(z). Обсудим встретившееся нам при доказательстве теоремы 4.5 понятие аннулирующего многочлена. Аннулирующий многочлен вектора ж^О, имеющий минимальную степень, называется минимальным многочленом вектора х. Теорема 4.6. Любой аннулирующий многочлен делится на минимальный. Доказательство. Пусть P(t) — аннулирующий многочлен вектора х ф О и Q(t) — его минимальный многочлен. Предположим, что Р не делится на Q. Разделим Р на Q с остатком. Это дает равенство Р — UQ + R, где U и R — некоторые многочлены от t, причем R не равен тождественно нулю и степень R меньше степени Q. Подставляя в этой равенство преобразование srf вместо переменной *, на основании формул (4.12) и (4.13) мы получим, что Р«Кж) = U(s/)Q(j*)(x) + R(s*)(x), (4.21) а так как Р и Q — аннулирующие многочлены вектора ж, то R(srf)(x) — 0. Ввиду того, что степень R меньше степени Q, это противоречит условию минимальности многочлена Q. Следствие. Минимальный многочлен вектора х ф 0 определяется однозначно, с точностью до постоянного множителя. Заметим, что для аннулирующих многочленов верно и обратное теореме 4.6 утверждение: всякое кратное любого аннулирующего многочлена тоже является аннулирующим многочленом (разумеется, того же вектора х). Оно вытекает из того, что в этом случае в равенстве (4.21) мы имеем R — 0. Из этого утверждения следует, что существует единый многочлен, являющийся аннулирующим для всех векторов пространства L. Действительно, пусть ei,...,en — какой-либо базис пространства L и Pi,...,Pn — аннулирующие многочлены его векторов. Обозначим через Q наименьшее общее кратное этих многочленов. Тогда из сказанного выше следует, что Q является аннулирующим многочленом любого из векторов ei,...,en, т.е. Q(srf)(ei) =0 для всех г = 1,...,п. Докажем, что Q — аннулирующий многочлен любого вектора х Е L. По условию, х есть линейная комбинация векторов базиса, т. е. х = а\е\ + ос^е^ Л У апеп. Тогда QW)(x) = Q{stf) (aiei + • • • + апеп) = axQ{srf){ex) + • • • + anQ(^/)(en) = 0. Определение. Многочлен, аннулирующий все векторы пространства L, называется аннулирующим многочленом этого пространства (имеется в виду — для данного линейного преобразования srf\ L —> L). В заключение сопоставим рассуждения, использованные нами при доказательстве теорем 4.2 и 4.5. В первом случае мы опирались на существование корня (т.е. множителя степени 1) у характеристического многочлена, а во втором — на существование простейшего множителя (степени 1 или 2)
4.2. Комплексные и вещественные пространства 155 у аннулирующего многочлена. Связь между этими многочленами устанавливается на основании результата, который важен и сам по себе. Он называется теоремой Гамильтона-К эли: Теорема 4.7. Характеристический многочлен является аннулирующим многочленом пространства. Доказательство этой теоремы основывается на рассуждениях, аналогичных использованным при доказательстве леммы 1 из § 4.1, но относящихся к значительно более общей ситуации. Мы будем теперь рассматривать многочлены от переменной t, коэффициенты которых — не числа, а линейные преобразования пространства L в себя или (что то же самое, если в L зафиксирован некоторый базис) квадратные матрицы Р^: P(t)=P0 + Pit + -.. + Pktk. С ними можно совершать действия как с обычными многочленами, предполагая, что переменная t перестановочна с коэффициентами. Можно и подставлять в них вместо t матрицу линейного преобразования А. Результат мы будем обозначать через Р(А), т.е. P(A) = P0 + PiA + --. + PkAh. Здесь важно, что t и А записаны справа от коэффициентов Pi. Дальше мы будем рассматривать ситуацию, когда Р{ и А — квадратные матрицы одного порядка. Ввиду сказанного выше, все утверждения будут верны и для случая, когда в последней формуле вместо матриц Pi и А стоят линейные преобразования ^и^ некоторого пространства L в себя: &{st) = &>о + &\& + "• + ^k^k- Однако при этом не верен аналог формулы (4.13) из § 4.1, т.е. если многочлен R(t) = P(t)Q(t) и А — матрица произвольного линейного преобразования пространства L, то, вообще говоря, R(A) Ф P(A)Q(A). Например, если многочлены Р = P\t и Q = Qo, то P\tQo = P\Qot, но не верно, что P\AQq = P\QqA для любой матрицы А, так как матрицы А и Qq не обязательно коммутируют. Однако есть один важный частный случай, когда формула (4.13) сохраняет силу: Л е м м а 2. Пусть P(t) = P0 + Plt + --. + Pktk, Q(t) = Qo + Qit + -" + Qit\ и многочлен R(t) = P(t)Q(t). Тогда R(A) = P{A)Q{A), если матрица А коммутирует с каждым коэффициентом многочлена Q(t), т. е. AQi = QiA для всех г— 1,..., Z. Доказательство. Нетрудно видеть, что многочлен R(t) = P(t)Q(t) представим в виде R(t) = Rq + R\t + • • • + Rk+itk+l с коэффициентами Rs — s — Yj PiQs-u гДе Pi — 0, если г > k, и Qi = 0, если г > l. Аналогично, г=0
156 Гл. 4. Линейные преобразования пространства в себя многочлен R(A) = P(A)Q(A) представим в виде k+l / S при тех же условиях: Pi = 0, если г > к, и Qi = 0, если г > I. По условию леммы AQj = QjA, откуда с помощью индукции легко получается, что AlQj = = QjA1 для любых г и j. Таким образом, наше выражение приобретает вид к+l s s \ S=Q 4=0 ' Разумеется, аналогичное утверждение верно и для многочленов, у которых переменная t стоит слева от коэффициентов (тогда матрица А должна коммутировать с каждым коэффициентом многочлена Р, а не Q). Используя лемму 2, мы можем доказать теорему Гамильтона-Кэли. Доказательство теоремы 4.7. Рассмотрим матрицу tE — А и обозначим ее определитель через (p(t) = \tE — А\. Коэффициенты многочлена (p(t) — числа, и как легко видеть, он равен характеристическому многочлену матрицы А, умноженному на (— 1)п (чтобы сделать коэффициент при tn равным 1). Обозначим через B(t) присоединенную матрицу для tE — А (см. определение на с. 86). Очевидно, что B{t) будет содержать в качестве своих элементов некоторые многочлены от t степени < п— 1, и следовательно, мы можем записать ее в виде B(t) = Во + B\t + • • • + Bn-\tn~l, где В{ — некоторые матрицы. Формула (2.70) для присоединенной матрицы дает B(t)(tE-A) = ip(t)E. (4.22) Подставим в формулу (4.22) вместо переменной t матрицу А линейного преобразования stf в некотором базисе пространства L. Так как матрица А коммутирует с единичной матрицей Е и сама с собой, то по лемме 2 имеет место равенство матриц В(А)(АЕ — А) = ф(А)Е, левая часть которого равна нулевой матрице О. Очевидно, что в любом базисе нулевой матрице соответствует нулевое преобразование б\ L —> L, следовательно, (р(д?) = б\ Это и есть утверждение теоремы 4.7. В частности, отсюда видно, что при доказательстве теоремы 4.5 в качестве аннулирующего многочлена P(t) мы можем взять характеристический многочлен преобразования я/. § 4.3. Комплексификация Ввиду того что вещественные векторные пространства особенно часто встречаются в приложениях, мы изложим здесь другой способ вывода свойств линейных преобразований таких пространств, исходя из уже доказанных свойств линейных преобразований комплексных пространств. Пусть L — конечномерное вещественное пространство. Для того, чтобы применить к нему предшествующие рассуждения, нужно вложить его в неко-
4.3. Комплексификация 157 торое комплексное пространство L . Для этого воспользуемся тем, что, как мы видели в § 3.5, L изоморфно пространству строк длины п (где п = dimL), которое мы обозначили символом Rn. Ввиду обычного вложения множеств R с С, мы можем рассматривать Rn как подмножество в Сп. При этом оно, конечно, не является подпространством Сп как векторного пространства над полем С. Например, умножение на комплексное число г не переводит Rn в себя. Наоборот, как легко видеть, имеет место разложение Сп = Rn 0 iRn (вспомним, что в С77, определено умножение на г всех векторов, и, в частности, векторов из подмножества Rn). Дальше мы будем обозначать Rn через L, а Сп — через L€. Предыдущее соотношение запишется тогда так: Lc - L 0 iL (4.23) Любое линейное преобразование si пространства L (как пространства над полем R) может быть тогда распространено на все 1_с (как пространство над полем С). А именно, как следует из разложения (4.23), любой вектор х £ Lc может быть однозначно записан в виде х = и + iv, где и, v £ L, и мы положим я/с(х) = я/(и) + Ш{у). (4.24) Очевидную проверку того, что определенное соотношением (4.24) отображение д/с является линейным преобразованием пространства 1_с (над полем С), мы опускаем. Более того, нетрудно доказать, что з/с является единственным линейным преобразованием пространства Lc, ограничение которого на L совпадает с я/, т.е. для которого выполнено равенство £/с(х) = з/(х) при всех х G L. Изложенная конструкция может показаться не вполне изящной, так как она использует изоморфизм пространства L и Rn, а для его построения необходимо выбрать некоторый базис в L. Хотя в большинстве приложений такой выбранный базис имеется, мы приведем конструкцию, не зависящую от выбора какого-либо базиса. Для этого вспомним, что пространство L может быть восстановлено из своего сопряженного пространства L* с помощью изоморфизма L ~ L**, построенного в § 3.7. Иначе говоря, L ~ £(L*,R), где, как и раньше, £(L, M) обозначает пространство линейных отображений L —¥ М (здесь либо все пространства считаются комплексными, либо все — вещественными). Теперь рассмотрим С как двумерное векторное пространство над полем R и положим 1_с = £(!_*, С), (4.25) где в £(1_*,С) оба пространства L* и С рассматриваются как вещественные. Таким образом, соотношение (4.25) превращает 1_с в векторное пространство над полем R. Но мы можем превратить его в пространство над полем С, определив умножение векторов из Lc на комплексные числа. Именно, если <р е £(L*, С), а число z e С, то положим zip = ip, где ip e £(L*, С) определено условием ?/?(/) = z • <p(f) для всех / G L*.
158 Гл. 4. Линейные преобразования пространства в себя Легко проверить, что определенное таким образом Lc — векторное пространство над полем С, и переход от L к 1_с будет тот же самый, который мы описали выше, при любом выборе базиса в L (т.е. выборе изоморфизма L~Rn). Если s/ — линейное преобразование пространства L, то мы определим соответствующее ему линейное преобразование s/c пространства L , задав для каждого вектора ip eLc значение s/c(i{>) е Lc с помощью соотношения (^С(ШЛ = Ф(^ЧЛ) Для всех / е L*, где е^*: L* —> L* — преобразование, сопряженное s/ (см. с. 134). Очевидно, что s/c — действительно линейное преобразование пространства !_с, и его ограничение на L совпадает с преобразованием s/, т. е. для каждого ф е L выполнено равенство s/c(ip)(f) = s/(ijj)(f) при всех / е L*. Определение. Комплексное пространство Lc называется комплекси- фикацией вещественного пространства L, а преобразование s/c: Lc —> L€ — комплексификацией преобразования s/\ L —> L Замечание. Изложенная выше конструкция применима и к гораздо более общему случаю: таким образом можно сопоставить любому векторному пространству L над произвольным полем К пространство LK над большим полем К'эКи линейному преобразованию s/ пространства L — линейное преобразование s/K' пространства LK\ В построенном нами пространстве 1_с полезно ввести операцию комплексного сопряжения, которая сопоставляет вектору ж е 1е вектор ж е 1_с, либо интерпретируя 1_с как Сп (с чего мы и начали этот параграф) и беря комплексно сопряженное для каждого числа в строке ж, либо (что равносильно) используя представление (4.23) и полагая ж = и — iv для ж = и + iv. Очевидно, что верны равенства ж + у = х + у, (ах) = а ж для любых векторов х,у е 1е и любого комплексного числа а. Преобразование s/c, полученное по правилу (4.24) из некоторого преобразования s/ вещественного пространства L, мы будем называть вещественным. Для вещественного преобразования s/c выполнено соотношение ^с(ж)=^с(ж), (4.26) которое вытекает из определения (4.24) преобразования s/c. Действительно, если вектор ж = и + iv, то s/c(x) = s/(u) + is/(v), s/c(x) = s/(u) - is/(v). С другой стороны, х = и — iv, откуда следует s/c(x) = si/(и) — is/(у) и, соответственно, равенство (4.26). Рассмотрим линейное преобразование s/ вещественного векторного пространства L. Ему соответствует, как было сказано выше, линейное преобразование s/c комплексного пространства Lc. Согласно теореме 4.2 преобразова-
4.3. Комплексификация 159 ние sfc обладает собственным вектором х е Lc, для которого, следовательно, выполнено равенство sic{x) = Лж, (4.27) где Л — корень характеристического многочлена преобразования si и, вообще говоря, является некоторым комплексным числом. Мы должны разобрать два случая: когда Л — вещественное и комплексное. Случай 1. Л — вещественное число. Значит, характеристический многочлен преобразования si имеет вещественный корень и поэтому si имеет собственный вектор уже в пространстве L, т. е. L обладает одномерным инвариантным подпространством. Случай 2. Л — комплексное число. Пусть Л = а + ih, где а и Ъ — вещественные числа, Ъ ф 0. Собственный вектор х мы тоже можем записать в виде х — и + iv, где векторы u,v eL. По условию, sic(x) = si (и) + isi(v), и тогда соотношение (4.27), ввиду разложения (4.23), дает si {у) = av + bu, si {и) = -bv + аи. (4.28) Это значит, что подпространство L' = (v,u) пространства L инвариантно относительно преобразования s/. Размерность подпространства L/ равна 2, и векторы v,u составляют его базис. Действительно, достаточно проверить их линейную независимость. Линейная зависимость v и и означала бы, что v = £и (или наоборот, и = £v) при некотором вещественном £. Но при v = £и второе из равенств (4.28) давало бы соотношение si {и) — (а — Ь£)и, а это означало бы, что и — вещественный собственный вектор преобразования si, соответствующий вещественному собственному значению а — Ь£, т. е. мы имеем дело с первым случаем. Аналогично рассматривается зависимость и = £v. Объединяя случаи 1 и 2, мы получаем другое доказательство теоремы 4.5. Заметим, что на самом деле сейчас доказано даже немного больше, чем сказано в теореме 4.5. А именно, мы показали, что в двумерном инвариантном подпространстве L/ существует базис v,u, в котором преобразование s/ задается формулами (4.28), т.е. имеет матрицу вида а. Ъ^О. Определение. Линейное преобразование я/ вещественного пространства L называется блочно-диагонализируемым, если в некотором базисе его матрица имеет вид (а\ 0 А = \о 0 0 о\ о (4.29) 0 B,J
160 Гл. 4. Линейные преобразования пространства в себя где ai,...,ar — вещественные матрицы первого порядка (т.е. вещественные числа), а В\,... ,BS — вещественные матрицы второго порядка вида В, Ь^О. (4.30) Блочно-диагонализируемые линейные преобразования являются вещественным аналогом диагонализируемых преобразований комплексных пространств. Связь между этими понятиями устанавливается следующей теоремой. Теорема 4.8. Линейное преобразование si вещественного пространства L блочно-диагонализируемо тогда и только тогда, когда его ком- плексификация sic является диагонализируемым преобразованием пространства Lc. Доказательство. Пусть линейное преобразование si: L —► L является блочно-диагонализируемым. Это значит, что в некотором базисе пространства L его матрица имеет вид (4.29), что равносильно разложению L = U U ©Mi е--- е мь (4.31) где Ц и Mj — подпространства, инвариантные относительно преобразования si. В нашем случае сНтЦ = 1, так что Ц = (е*) и si\ei) = с^е*, и dim Mj = 2, при этом в некотором базисе подпространства М^ ограничение преобразования si на Mj имеет матрицу вида (4.30). Используя формулу (4.30), легко убедиться, что ограничение sic на двумерное подпространство Mj имеет два различных комплексно сопряженных собственных значения: Xj и Xj. Если / • и fj — соответствующие им собственные векторы, то в 1_с имеется базис еь...,ег,/1,//1,...,/в,/д, в котором матрица преобразования sic принимает вид (4.32) Это означает, что преобразование sic диагонализируемо. Пусть теперь, наоборот, нам известно, что si^ диагонализируемо, т. е. в некотором базисе пространства 1_с преобразование sic имеет диагональную матрицу
4.4. Ориентация вещественного пространства 161 /А, 0 ••• 0\ О А2 •■■ О : : ' (4-33> \0 О •■■ Ап/ Среди чисел Ль..., Л^ могут встречаться и вещественные, и комплексные. Все числа Л^ являются корнями характеристического многочлена преобразования sic. Но очевидно (по определению Lc), что любой базис вещественного пространства L является базисом комплексного пространства 1_с, а в таком базисе матрицы преобразований si и sic совпадают. То есть матрица преобразования s/c в некотором базисе вещественна. Значит, и ее характеристический многочлен имеет вещественные коэффициенты. Тогда из известных свойств вещественных многочленов следует, что если среди чисел Ai,...,An есть комплексные, то они входят парами Xj и А^, причем А^ и А^ встречаются одинаковое число раз. Мы можем считать, что в матрице (4.33) первые г чисел вещественные: А^ = с^ Е Ш (г ^ г), а остальные — комплексные, причем Xj и Xj (j > г) стоят рядом. В этом случае матрица преобразования приобретает вид (4.32). Вместе с каждым собственным вектором е преобразования sic в пространстве 1_с содержится и вектор ё. Причем если е соответствует собственному значению А, то ё соответствует собственному значению А. Это легко вытекает из того, что si — вещественное преобразование и из соотношения (LC)A = (Lc)p которое проверяется автоматически. Поэтому мы можем записать базис, в котором преобразование s/c имеет вид (4.32), в виде e\,...,er,fi,fi,...,f8,f8, где все е* G L. Положим fj = Uj + ivj, где Uj,Vj G L, и рассмотрим подпространство Nj = {uj,Vj). Очевидно, что Nj инвариантно относительно si и, согласно формуле (4.28), ограничение si на подпространство Nj дает преобразование, имеющее в базисе Uj,Vj матрицу вида (4.30). Таким образом, мы видим, что LC = (ei) 0 ■ • • © (ег) © г{е\) © • • • 0 i(er) © Ni © zNi © • • • ф Ns © iNs, откуда следует разложение L = (ei) ф • • • ф (ег) ф Ni Ф • • • Ф Ns, аналогичное (4.31). Это показывает, что преобразование si: L —> L блочно- диагонализируемо. Аналогично, используя понятие комплексификации, можно доказать вещественные аналоги теорем 4.1, 4.2 и 4.4. § 4.4. Ориентация вещественного пространства На вещественной прямой имеются два направления — направо и налево (от произвольной точки, принятой за начало координат). Аналогично, на вещественной плоскости есть два направления обхода вокруг точки — по и против часовой стрелки. Мы рассмотрим аналогичные понятия в произвольном вещественном векторном пространстве (конечной размерности). 6 А. О. Ремизов, И. Р. Шафаревич
162 Гл. 4. Линейные преобразования пространства в себя Пусть ei,...,en и е\,...,е'п — два базиса нашего пространства L. Тогда существует такое линейное преобразование si: L —> L, что ^(еО = е£, г=1,...,п. (4.34) Очевидно, что для заданной пары базисов такое преобразование si существует только одно, и притом оно невырождено (\si\ ^ 0). Определение. Базисы ei,...,en и е'р...,е^ называются одинаково ориентированными, если удовлетворяющее условию (4.34) преобразование si — собственное (\si\ > 0), и противоположно ориентированными, если ей/ — несобственное (|«g^| < 0). Теорема 4.9. Свойство быть одинаково ориентированными задает отношение эквивалентности на множестве всех базисов пространства L Доказательство. Определение отношения эквивалентности (на произвольном множестве) было дано на с. 8, и для доказательства теоремы нам нужно проверить только симметричность и транзитивность, так как рефлексивность совершенно очевидна (в качестве преобразования si нужно взять £). Так как преобразование si невырождено, то соотношение (4.34) может быть переписано в виде si~l(e'i) = е*, г = 1,... , п, откуда следует симметричность свойства базисов быть одинаково ориентированными: преобразование si заменяется на si~l, при этом \si~l\ = \#i\~ » и знак определителя сохраняется. Пусть базисы е\,...,еп и е\,...,е'п одинаково ориентированы и базисы вр ..., е!п и е",..., е^ тоже одинаково ориентированы. Согласно определению, это означает, что преобразования si из (4.34) и 98л определенное условием #(ej) = e?f г=1,...,п, (4.35) являются собственными. Подставляя в (4.35) выражения для векторов е[ из (4.34), мы получаем 38si{ei) = ei, г = 1,...,тг, а так как \3Ssi\ = |^| • |л^|, то преобразование ^/ тоже является собственным, т.е. базисы е\,...,еп и е", ...,e(J одинаково ориентированы, и транзитивность выполнена. Обозначим множество всех базисов пространства L через 6. Теорема 4.9 означает, что по свойству быть одинаково ориентированными множество (£ разбивается на два класса эквивалентности, т.е. оно представимо в виде <£ = <Е\ U <£г, где <£\ П (£2 = 0. Практически для того, чтобы получить это разбиение, можно поступить следующим образом: выбрать в L произвольный базис е\,...,еп и обозначить через (В\ совокупность всех базисов, одинаково ориентированных с ним, а через (£2 — совокупность ориентированных противоположно. Теорема 4.9 показывает, что такое разбиение множества (£ не зависит от того, какой именно базис ei,...,en мы выберем. Мы можем сказать, что любые два базиса, входящие в одно и то же из подмножеств
4.4. Ориентация вещественного пространства 163 (El и ^2, ориентированы одинаково, а входящие в разные подмножества — ориентированы противоположно. Определение. Выбор одного из подмножеств <£\ или <&2 называется ориентацией пространства L. При этом базисы, принадлежащие выбранному подмножеству, называются положительно ориентированными, а принадлежащие другому — отрицательно ориентированными. Как видно из этого определения, выбор ориентации пространства зависит от нашего произвола: с тем же успехом положительно ориентированные базисы можно было бы назвать отрицательно ориентированными, и наоборот. Не случайно на практике реальный выбор ориентации основывают, апеллируя либо к строению человеческого тела (лево-право), либо к направлению движения солнца по небу (по или против часовой стрелки). Содержательная часть излагаемой в этом параграфе теории заключается в том, чтобы связать понятие ориентации с некоторыми топологическими понятиями (изложенными в параграфе с предварительными сведениями, см. с. 14). Для этого нам нужно будет прежде всего определить сходимость для последовательностей элементов множества <£. Мы сделаем это, введя на множестве (£ метрику, т. е. превратив его в метрическое пространство. Это значит, что нужно задать функцию г(х,у), определенную для всех х,у е <£, принимающую вещественные значения и удовлетворяющую условиям 1)-3), приведенным на с. 14. Мы начнем с того, что определим сначала метрику г(А9В) на множестве 21 квадратных матриц заданного порядка п с вещественными коэффициентами. Для матрицы А = (а^-) из 21 положим число ц(А) равным максимуму модулей всех ее элементов: ц(А) = max \dij\. (4.36) i,j=l,...,n Лемма 1. Определенная соотношением (4.36) функция ц(А) обладает следующими свойствами: а) /л(А) > О при А^О и /л(А) = О для А —О. б) /л(А + В) ^ /х(А) + fi(B) для всех А, В е 21. в) fi(AB) ^ пр,(А)р,(В) для всех А, В е 21. Доказательство. Свойство а) очевидно вытекает из определения (4.36), свойство б) следует из аналогичного неравенства для чисел: |%+6;j| ^ ^ \aij\ + \hj\- Остается проверить свойство в). Пусть А = (а^-), В = (Ь^) п и С = АВ = (dj). Тогда су = J2 aikbkj, поэтому п п \Cij\ ^ 5Z 1^1 1Ь^'1 ^ ]С^М5) = П^(А)/^(В)> fc=l k=\ откуда следует, что /х(С) ^ nji(A)n(B). 6*
164 Гл. 4. Линейные преобразования пространства в себя Теперь мы можем превратить множество 21 в метрическое пространство, положив для двух матриц А и В из 21 r(A,B)=fi(A-B). (4.37) Условия 1)-3), входящие в определение метрики, вытекают из определений (4.36) и (4.37) и свойств а) и б) доказанной выше леммы. Метрика на 21 позволяет ввести метрику на множестве (£ базисов пространства L. Зафиксируем какой-нибудь один базис е\,...,еп и определим число г(х,у) для двух произвольных базисов х и у из множества (£ следующим образом. Пусть базисы х и у состоят из векторов х\,... ,хп и ух,... ,уп, соответственно, тогда существуют такие линейные преобразования si и S8 пространства L, что si(ei)=xil 38{ei) = yi9 i= l,...,n. (4.38) Преобразования si и SS невырождены и условием (4.38) определяются однозначно. Обозначим через А и В матрицы преобразований si и SB в базисе еь ... ,еп и положим г(х,у)=г(А,В), (4.39) где г (А, В) определено выше соотношением (4.37). Условия 1)-3), входящие в определение метрики, вытекают для г(х,у) из аналогичных свойств метрики г(ДВ). Однако здесь возникает трудность: определение метрики г(х,у) соотношением (4.39) зависит от выбора некоторого базиса е\,...,еп пространства L. Выберем другой базис е'19...,е'п и посмотрим, чем же порожденная им метрика rf{x,y) отличается от г(х,у). Для этого воспользуемся известным нам фактом, что для двух базисов е\,..., еп и е[,...,е'п существует единственное линейное (и притом невырожденное) преобразование с€\ L —► L, переводящее первый базис во второй: е^^(е^), г= 1,...,п. (4.40) Формулы (4.38)_ и (4.40) показывают, что для линейных преобразований si = si^~x и S3 = ^f_1 выполнены равенства ^(e'i)=xil W(e'i)=yi, г= 1,...,п. (4.41) Обозначим через А' и В' матрицы преобразований si и SS в базисе е\,..., е'п, а через А и В — матрицы преобразований si и SS в этом же базисе. Пусть С — матрица преобразования <ё7, т.е., согласно (4.40), ^атрица_перехода от базиса е[,...,е'п к базису еь..., еп. Тогда матрицы А\ А и В\ В связаны между собой соотношениями А = А'С~1 и В = В'С~1. Кроме того, заметим, что А и А' — это матрицы одного и того же преобразования si в разных базисах (ei,..., еп и е[,..., е'п) и аналогично, В и В' — матрицы одного и того же преобразования S8. Поэтому, согласно формуле замены координат, мы имеем А' = С~ХАС и В' = С~1ВС, и, таким образом, в результате получаем соотношения А = А'С~1 = С-1 А В = S'C"1 = С_1В. (4.42)
4.4. Ориентация вещественного пространства 165 Возвращаясь к определению (4.39) метрики на 21, мы видим, что г'(х,у) = = г (А, В). Подставляя в последнее соотношение выражения (4.42) для матриц А и В, с учетом определения (4.37) и свойства в) из доказанной выше леммы, имеем: г'(х, у) = г(А,В) = г(С-1А,С~1В) = = fi(C~l(A - В)) < nfi(C-lMA -B) = аг(х, у), где число а = пр,(С~1) не зависит от базисов х и у, а только от ej,...,en и е\,...,е'п. Так как последние два базиса играют в нашей конструкции симметричную роль, то аналогичным образом можно получить и второе неравенство r(x,y) < (3rf{x,y) с некоторой положительной постоянной /?. Соотношения г'(ж, у) <; от(ж, у), г(х, у) ^ /?г'(ж, у), а, (3 > О, (4.43) показывают, что хотя метрики г{х,у) и г'(ж, у), определенные с помощью разных базисов ei,...,en и е^,...^, различны, но задаваемые ими на множестве 21 понятия сходимости совпадают. Если говорить более формально, то, выбрав в (£ два разных базиса и определив с их помощью метрики г(х,у) и г'(х,у) на (£, мы тем самым определили два разных метрических пространства (£7 и (£" с одним и тем же множеством <£ и различными метриками г и г' на нем. При этом тождественное отображение множества <£ в себя не является изометрией (£' и (£", но в силу соотношений (4.43), является их гомеоморфизмом. Таким образом, мы можем говорить о непрерывных отображениях, путях в (£ и о его связных компонентах, не уточняя, какой именно метрикой мы пользуемся. Перейдем теперь к вопросу о том, являются ли два базиса из множества £ непрерывно деформируемыми друг в друга (см. общее определение на с. 16). Он сводится к тому, являются ли непрерывно деформируемыми друг в друга невырожденные матрицы А и В, соответствующие этим базисам при выборе некоторого вспомогательного базиса ei,...,en (точно так же, как и другие топологические понятия, непрерывная деформируемость от выбора этого вспомогательного базиса не зависит). Подчеркнем, что условие невырожденности матриц А и В играет здесь существенную роль. Сформулируем понятие непрерывной деформируемости для матриц из некоторого множества 21 (которое в нашем случае суть множество невырожденных матриц). Определение. Матрица А называется непрерывно деформируемой в Б, если существует семейство матриц A{t) из 21, элементы которых непрерывно зависят от параметра t G [0,1], такое, что А(0) =ЛиЛ(1) = В. Очевидно, что определенное таким образом свойство матриц быть непрерывно деформируемыми друг в друга задает отношение эквивалентности на множестве 21. Согласно определению, для этого нужно проверить, что выполнены свойства рефлексивности, симметричности и транзитивности. Проверка всех этих свойств очень проста и приведена на с. 16.
166 Гл. 4. Линейные преобразования пространства в себя Отметим еще одно свойство непрерывной деформируемости, в случае, когда множество 21 обладает дополнительным свойством: для двух любых матриц, содержащихся в 21, их произведение также принадлежит 21. Очевидно, что это условие выполнено, если 21 — множество невырожденных матриц (в следующих главах мы встретимся и с другими примерами таких множеств). Л е м м а 2. Если матрица А непрерывно деформируема в В и С Е 21 — произвольная матрица, то АС непрерывно деформируема в ВС, а С А непрерывно деформируема в СВ. Доказательство. Согласно условию мы имеем семейство A(t) матриц из 21, где t е [0,1], осуществляющее непрерывную деформацию А в В. Для доказательства первого утверждения нужно взять семейство A(i)C, а для второго — семейство CA(t). Эти семейства осуществляют нужные нам деформации. Т е о р е м а 4.10. Две невырожденные квадратные матрицы одного порядка с вещественными элементами непрерывно деформируемы друг в друга тогда и только тогда, когда знаки их определителей совпадают. Доказательство. Пусть Аи В — матрицы, о которых идет речь в теореме. Необходимость условия, что определители \А\ и \В\ одного знака, очевидна. Действительно, ввиду формулы для полного развертывания определителя (§ 2.7) или в силу его индуктивного определения (§ 2.2) видно, что определитель является многочленом от элементов матрицы, и следовательно, \A(t)\ является непрерывной функцией от t. Но непрерывная функция, принимающая значения разных знаков в концах отрезка, обращается в нуль в некоторой его точке, в то время, как по условию, должно быть выполнено \A(t)\ Ф 0 для всех t е [0,1]. Докажем достаточность этого условия, для определенности полагая сначала, что \А\ > 0. Покажем, что А непрерывно деформируема в единичную матрицу Е. Согласно теореме 2.24 матрица А может быть представлена как произведение матриц С/у (с), Sk и диагональной матрицы. Матрица Uij(c) непрерывно деформируема в единичную: в качестве семейства A(t) можно взять матрицы Uij(ct). Так как сами Sk — диагональные матрицы, то мы видим, что (ввиду леммы 2) матрица А непрерывно деформируема в диагональную матрицу D, а из предположения (\А\ > 0) и доказанной части теоремы следует, что \D\ > 0. Пусть D = fdx 0 0 0 d2 0 0 0 d3 0 0 dn/ \о о о Каждый элемент di можно представить в виде sipi, где si = 1 или — 1, a pi > 0. Матрицу первого порядка (р$) при Pi > 0 можно непрерывно деформировать в (1). Для этого достаточно положить A(t) = (a(t)), где a(t) = t + (l —t)pi при t € [0,1]. Поэтому матрица D непрерывно деформируема в матрицу D',
4.4. Ориентация вещественного пространства 167 в которой все di — SiPi заменены на Е{. Как мы видели, отсюда следует, что \Df\ > О, т.е. число —1, стоящих на главной диагонали, четно. Объединим их в пары. Если —1 стоит на г-ом и j-ом месте, то мы вспомним, что матрица задает на плоскости преобразование центральной симметрии относительно начала координат, т. е. поворот на угол 7г. Если мы положим (cos7г£ — sinnt \ (4.45) sin 7г£ cos 7г£ / то получим матрицу поворота на угол 7г£, которая при изменении t от О до 1 осуществляет непрерывную деформацию матрицы (4.44) в единичную. Очевидно, что так мы получим непрерывную деформацию матрицы Dr в Е. Обозначая непрерывную деформируемость символом ~, мы можем написать три соотношения: А ~ D, D ~ D', D' ~ Е, откуда вследствие транзитивности следует, что А ~ Е. Отсюда также вытекает и утверждение теоремы 4.10 для двух матриц А и В с \А\ > 0 и \В\ > 0. Для того, чтобы охватить и матрицы А с \А\ < 0, введем функцию е(А) = +1, если \А\ > 0, и е(А) = -1, если \А\ < 0. Очевидно, что е(АВ) = е(А)е(В). Если е(А) = е(В) = — 1, то положим А~{В = С. Тогда е(С) = 1 и, по доказанному ранее, С ~ Е. Согласно лемме 2, отсюда следует, что В ~ А, а вследствие симметричности, и А~ В. С учетом сказанного в § 3.4 и леммы 2, из теоремы 4.10 мы получаем следующие результаты: Теорема 4.11. Два невырожденных линейных преобразования веще- ственного векторного пространства непрерывно деформируемы друг в друга тогда и только тогда, когда знаки их определителей совпадают. Теорема 4.12. Две базиса вещественного векторного пространства непрерывно деформируемы друг в друга тогда и только тогда, когда они одинаково ориентированы. Вспоминая введенные ранее топологические понятия линейной связности и линейно связных компонент (стр. 17), мы видим, что полученные результаты могут быть сформулированы следующим образом. Множество 21 невырожденных матриц заданного порядка (или линейных преобразований пространства L в себя) представимо в виде объединения двух линейно связных компонент, отвечающих положительным и отрицательным определителям. Аналогично, множество (£ всех базисов пространства L представимо в виде объединения двух линейно связных компонент, состоящих из положительно и отрицательно ориентированных базисов.
Глава 5 ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА § 5.1. Корневые векторы и циклические подпространства В предшествующей главе мы исследовали линейные преобразования вещественного и комплексного пространства в себя и, в частности, нашли условие, при котором линейное преобразование комплексного пространства является диагонализируемым, т. е. имеет в некотором специально выбранном базисе (состоящем из собственных векторов преобразования) диагональную матрицу. Там же было показано, что не все преобразования комплексного пространства являются диагонализируемыми. Цель этой главы — более полное изучение линейных преобразований вещественного или комплексного пространства в себя, включающее исследование недиагонализируемых преобразований. В этой главе векторное пространство мы будем по-прежнему обозначать L и предполагать его конечномерным, причем в §§ 5.1-5.3 мы будем рассматривать линейные преобразования только комплексных векторных пространств. Как уже было отмечено, простейшим классом линейных преобразований являются диагонализируемые. Поскольку этот класс не охватывает всех линейных преобразований, мы должный найти конструкцию, обобщающую конструкцию диагонализируемого линейного преобразования и при этом настолько общую, чтобы она позволяла охватить все линейные преобразования. Преобразование приводится к диагональному виду, если имеется базис, состоящий из его собственных векторов. Поэтому мы начнем с обобщения понятия собственного вектора. Напомним, что собственный вектор е ф 0 линейного преобразования srf\ L —» L, соответствующий собственному значению Л, удовлетворяет условию st{e) = Xe или, что то же самое, равенству (^-А<Г)(е) = 0. Естественным обобщением этого является следующее понятие: Определение. Ненулевой вектор е называется корневым вектором линейного преобразования srf\ L —> L, соответствующим собственному значению Л, если при некотором натуральном т выполнено условие {srf-\<g)m(e)=0. (5.1)
5.1. Корневые векторы и циклические подпространства 169 Наименьшее натуральное число га, при котором выполнено соотношение (5.1), называется высотой корневого вектора е. Пример 5.1. Собственный вектор — это корневой вектор высоты 1. Пример 5.2. Пусть пространство L состоит из многочленов x(t) степени не более п-1,а^- линейное преобразование дифференцирования, сопоставляющее каждой функции x(t) ее производную x'(t). Тогда si(x(t)) = a/(t), sik(x(t)) = x(k\t). Так как (tk) — k\ ф О и (tky — 0, то очевидно, что многочлен x(t) = tk является корневым вектором преобразования si высоты к + 1, соответствующим собственному значению Л = 0. Определение. Пусть е — корневой вектор высоты га, соответствующий собственному значению Л. Подпространство М, натянутое на векторы е, (^-А<Г)(е), ..., (^-A^T-^e), (5.2) называется циклическим подпространством, порожденным вектором е. Пример 5.3. Если га = 1, то циклическое подпространство — это одномерное подпространство (е), порожденное собственным вектором е. Пример 5.4. В примере 5.2 циклическое подпространство, порожденное корневым вектором x(t) = tk, состоит из всех многочленов степени не более к. Теорема5.1. Циклическое подпространство М с L, порожденное корневым вектором е высоты т, инвариантно относительно преобразования srf и имеет размерность т. Доказательство. Поскольку циклическое подпространство М натянуто на т векторов (5.2), его размерность, очевидно, не превосходит т. Докажем, что векторы (5.2) линейно независимы, это и будет означать, что dim M = т. Пусть а{е + а2(^ - \g){e) + • • • + ат(я/ - А*?)™"1 (е) = 0. (5.3) Применим к обеим частям этого равенства линейное преобразование {si — A<?)m_1. Так как, согласно определению (5.1) корневого вектора, (si — XS>)m(e) = 0, то и подавно будет (si — \£)k(e) = О при любом к> т. Поэтому мы получим, что ai(si-X^)rn-l(e) = 01 а так как (si — XS>)m~l(e) ф 0 ввиду того, что вектор е имеет высоту га, то отсюда вытекает равенство а\ = 0. Соотношение (5.3) приобретает теперь вид: a2(si - \S)(e) + • • • + am(si - \<?)m-l(e) = 0. (5.4) Применяя к обеим частям равенства (5.4) преобразование (si — A<?)m-2, мы точно так же докажем, что а2 = 0. Продолжая этот процесс далее, мы получим, что в соотношении (5.3) все коэффициенты ai,...,am равны нулю. Следовательно, векторы (5.2) линейно независимы, и dimM = га.
170 Гл. 5. Жорданова нормальная форма Докажем теперь инвариантность циклического подпространства М относительно преобразования я/. Положим ei=e, e2 = (s*-M)(e), .... ет = (я/ - \S)m-\e). (5.5) Так как все векторы подпространства М выражаются в виде линейных комбинаций векторов ei,...,em, то для этого достаточно показать, что векторы stf(e\),... ,&/(ет) выражаются в виде линейных комбинаций векторов ei,...,em. Но из соотношений (5.1) и (5.5) очевидно, что (■^-A<f)(ei) = e2, -А<Г)(е2) = ез, т.е. (ei) = Aei + е2, ^(е2) = Ае2 + ез, что и доказывает наше утверждение. , (^-А<Г)(ет) = 0, *f{em) = Aem, (5.6) Следствие. Векторы е\,..., ет, определенные формулой (5.5), образуют базис циклического подпространства М, порожденного корневым вектором е. Матрица ограничения линейного преобразования srf на подпространство М в этом базисе имеет вид /А 0 0 0\ 1 А 0 0 А = 0 1 А \0 0 А 0 1 А/ (5.7) Это очевидно вытекает из формул (5.6). Теорема 5.2. Пусть М — циклическое подпространство, порожденное корневым вектором е высоты т с собственным значением А. Тогда любой вектор у е М представим в виде у = /(*0(в), где / — многочлен степени не более т — 1. £с/ш многочлен / (£) не делится на t — X, то вектор у также является корневым вектором высоты т и порождает то же самое циклическое подпространство М. Доказательство. Первое утверждение теоремы сразу следует из того, что, согласно определению циклического подпространства, каждый вектор у е М имеет вид у = ахе + а2(^ - A<f )(е) + • • • + ат{^ - А^)™"1 (е), (5.8) т. е. у = f(stf)(e), где многочлен /(*) = ах + a2(t - А) + • • • + am(t - A)™"1.
5.1. Корневые векторы и циклические подпространства 171 Докажем второе утверждение. Пусть у = f(si)(e), тогда (si — \£)т(у) = 0. Действительно, из соотношений у = f(si)(e) и (5.1) с учетом установленного ранее свойства, что любые два многочлена от одного и того же линейного преобразования коммутируют (следствие леммы из § 4.1, с. 149), мы получаем равенство (si - \ё)т(у) = (si- \£)т ДО(е) = f(si) (si - \£)т(е) = 0. Предположим, что многочлен f(t) не делится на £ — А. Это означает, что коэффициент а\ ф 0. Покажем, что тогда (si — \&)т~х(у) ф 0. Применяя к векторам в обеих частях равенства (5.8) линейное преобразование (si -\ё)ш-\ получаем (si-\g)™-\y) = = a{(si- \£)ш-1{е) + a2(si - А<Г)ш(е) + • • • + am(si - А<Г)2т"2(е) = = а{(£/-\£)т-1(е), так как слагаемые (si — \<§)k(e) — О при всех к > га. Из последнего соотношения с учетом условий а\ ф О и (si — XS>)rn~l(e) ф 0 следует, что (si — Х£)т~1(у) Ф 0. Таким образом, вектор у также является корневым вектором линейного преобразования si высоты га. Наконец, докажем, что циклические подпространства М и М', порожденные корневыми векторами е и у, совпадают. Очевидно, что М'сМ, так как у G М, а ввиду инвариантности циклического подпространства М, и вектор (si — \<§)к(у) при любом к тоже содержится в М. Но из теоремы 5.1 следует, что dimM = dimM' = га, поэтому, согласно теореме 3.1, включение М'сМ означает просто равенство М' = М. Следствие. В обозначениях теоремы 5.2 для любого вектора у е М и числа \х Ф А имеет место представление у — (si — ii£){z) для некоторого вектора z e M. Кроме того, имеет место следующее утверждение: либо у — корневой вектор высоты т, порождающий циклическое подпространство М, либо у = (si — \S){z) для некоторого вектора z e M. Доказательство. Матрица ограничения линейного преобразования si на подпространство М в базисе е\,...,ет из (5.5) имеет вид (5.7). Отсюда легко видеть, что для любого \х ф А определитель ограничения линейного преобразования si — р£ на М отличен от нуля. Из теорем 3.11 и 3.12 следует, что ограничение si — р,£ на М является изоморфизмом М ^ М, и его образ (si — //<f)(M) = М, т.е. для Любого вектора j/GM найдется такой вектор z е М, что у = (si - [iS)(z). По теореме 5.2, вектор у представляется в виде у — f(si)(e), причем если многочлен /(£) не делится на £ — А, то у — корневой вектор высоты га, порождающий циклическое подпространство М. Если же /(£) делится на £ — А, т.е. f(t) = (t — \)g(t) с некоторым многочленом #(£), то, положив вектор z = g(si)(e), мы получим требуемое представление у — (si — XS)(z).
172 Гл. 5. Жорданова нормальная форма § 5.2. Жорданова нормальная форма (разложение) Для доказательства основного результата этого параграфа и даже всей этой главы — теоремы о разложении комплексного векторного пространства в прямую сумму циклических подпространств — нам понадобится следующая лемма: Лемма. Для любого линейного преобразования si\ L —> L комплексного векторного пространства существует число X и (п — 1)-мерное подпространство \J с Ц инвариантное относительно преобразования srf, такие, что для каждого вектора ж Е L имеет место соотношение srf{x) = Хх + у, где у Е L'. (5.9) Доказательство. Согласно теореме 4.2, любое линейное преобразование комплексного векторного пространства имеет собственный вектор и собственное значение. Пусть Л — собственное значение преобразования srf. Тогда преобразование 38 — srf — Х<§ вырождено (оно аннулирует собственный вектор), и, согласно теореме 3.13, его образ 3§{1) является подпространством М с L размерности т < п. Пусть ei,...,em — некоторый базис в М. Дополним его произвольным образом до базиса в L векторами ет+ь ..., еп. Очевидно, что подпространство I- ~ \^1 » • • • » €"ГП-> ^771+1 » * * * » €"П— 1/ имеет размерность п — 1 и содержит в себе М, так как е\,... ,ет Е М. Докажем теперь равенство (5.9). Рассмотрим произвольный вектор х Е L. Тогда <^(ж) Е «S^(L) = М, а значит, 3§{х) E L', так как М с L'. Вспомнив, что srf — 33 + Л<?, мы получим, что &/(х) = <^(ж) + Лж, причем, согласно нашему построению, вектор у = 38 (х) Е !_'. Из этого инвариантность подпространства L' следует уже совсем просто. Действительно, если ж Е L', то в равенстве (5.9) не только у Е L', но и Лж Е L', а значит, и ^(ж) Е 1Л Основной результат этого параграфа (теорема о разложении) заключается в следующем. Теорема 5.3. Конечномерное комплексное векторное пространство L может быть разложено в прямую сумму циклических подпространств относительно любого линейного преобразования srf\ L —> L Доказательство будет вестись индукцией по размерности п — dimL. Оно основывается на доказанной выше лемме, и мы будем использовать те же обозначения. Пусть L'cL - это то самое (п — 1)-мерное подпространство, инвариантное относительно преобразования ^, о котором идет речь в лемме. Выберем произвольным образом вектор е' £ L'. Если /1?..., /n_i — любой базис подпространства L', то векторы /ь... ,/п_1,е/ образуют базис в L. Действительно, их число равно п — dim L, поэтому достаточно доказать их линейную независимость. Предположим, что ai/1 + --- + an_1/n_1+/3e/ = 0. (5.10)
5.2. Жорданова нормальная форма (разложение) 173 Если J3 ф О, то из этого равенства следовало бы, что е7 Е L7. Поэтому /3 = 0, а тогда из равенства (5.10) ввиду линейной независимости векторов /i>--->/n-i следует, что ai = • • • = an_i =0. Далее мы будем пользоваться произволом в выборе вектора е7 Е L. До сих пор он удовлетворял единственному условию е7 0 L7, но нетрудно видеть, что любой вектор е" = е! + ж, где ж Е L7, удовлетворяет тому же условию и, значит, может быть принят за е!. Действительно, если е77 Е L7, то ввиду того, что х Е L7, мы имели бы, что е7 Е L7, вопреки предположению. Очевидно, что теорема 5.3 верна для п = 1. Поэтому, используя индукцию, мы можем считать, что она выполняется для подпространства L7. Пусть L^Lie — фЦ. (5.11) — разложение L7 в сумму циклических подпространств, причем каждое циклическое подпространство Ц порождено своим корневым вектором е^ высоты гщ, соответствующим собственному значению А;, и обладает базисом еь (^-^)(е0, ..-, К-А^Г*-1^). (5.12) По теореме 5.1, отсюда следует, что dim Ц = rrii и п — 1 = тп\ Н \- mr. Для вектора е7, выбранного в начале доказательства, согласно лемме, имеет место равенство £/(е') = \е/ + у, где г/Е L7. Ввиду разложения (5.11) этот вектор у представляется в виде У = У\+ '-+УГ> (5-13) где у{ Е Ц. Благодаря следствию теоремы 5.2 можно утверждать, что вектор у{ либо представляется в виде {si — \£){zi) с некоторым ^ G Ц, либо является корневым вектором высоты т$, отвечающим собственному числу А. Меняя в случае необходимости нумерацию векторов yif мы можем записать К - А<?)(е7) = (я/ - \£)(z) + ys + • • • + yr, (5.14) где z = zi H h «s-ь 2; E Ц при всех г— 1,..., s — 1, а каждый из векторов yj с номерами j = s,... , г, порождает циклическое пространство Lf. Здесь могут представиться два случая. С л у ч а й 1. В формуле (5.14) число s — 1 — г, т. е. (^ - А<Г)(е7) = (^ - A<f )(s), * E L/. Воспользовавшись произволом в выборе вектора е7, о котором говорилось выше, положим е77 = е! — z. Тогда из последнего соотношения получаем (Х-А<Г)(е77) = 0. По определению, это означает, что е77 — собственный вектор, соответствующий собственному значению А. Рассмотрим одномерное подпространство Lr+i = (е77). Очевидно, что оно является циклическим, причем l = l7 e Lr+i = и е • • • © i_r © Lr+i. Теорема 5.3 в этом случае доказана.
174 Гл. 5. Жорданова нормальная форма Случай 2. В формуле (5.14) число s — 1 < г. Опять положим е" — е! — z. Тогда из (5.14) мы получим, что (si-\£)(e")=ys + .:- + yr> (5.15) где по построению каждый у^, j = s,... ,г, является корневым вектором высоты rrij, соответствующим собственному значению А, и порождает циклическое подпространство L/. Очевидно, что мы всегда можем упорядочить векторы ys,...,yr таким образом, что ms < • • • ^ тг. Предположим, что это условие выполнено. Докажем, что вектор е" является корневым вектором высоты тг + 1, соответствующим собственному значению А, и покажем, что имеет место разложение пространства: L = Li0-..eLr_ieL'r, (5.16) где Ц, — циклическое подпространство, порожденное вектором е". Очевидно, что из этого будет следовать утверждение теоремы 5.3. Из равенства (5.15) следует соотношение: (si - \S)mr+\e") = (** ~ ^Гг(Уз) + --- + (si- \ё)тг(уг). (5.17) Так как корневые векторы у±, % — s,... , г, имеют высоты rrii и, согласно нашему предположению, все mi ^ тг, то {si — \£)Шг (j/J = О для всех г = 5,..., г. Отсюда с учетом равенства (5.17) вытекает, что (si — A<f)7nr+1(e") = О. Точно так же мы получаем, что (si - \£)mr(e") = (si- X^)mr~l(ys) + -" + (si- \<?)mr-l(yr). (5.18) Слагаемые в правой части этой суммы принадлежат подпространствам Ls,..., Lr. Если бы имело место равенство (si-\£)mr(e")=0, то из него следовало бы, что все слагаемые в правой части (5.18) равны нулю, так как подпространства Ls,...,Lr образуют прямую сумму. В частности, мы получили бы, что (si — \£)Шг~1(уг) = О, а это противоречит тому, что корневой вектор уТ имеет высоту mr. Таким образом, мы заключаем, что (si — XS)™7* (e") 7^ 0, и следовательно, корневой вектор е" имеет высоту тпг + 1. Остается доказать соотношение (5.16). Заметим, что размерности пространств l_i,...,Lr_i равны mi,... ,mr_i, а размерность Ц, равна mr + 1. Поэтому из равенства (5.12) следует, что сумма размерностей слагаемых в правой части (5.16) равна размерности левой части. Следовательно, для того, чтобы доказать соотношение (5.16), на основании следствия теоремы 3.6 (с. 106), нам достаточно показать, что любой вектор из пространства L представим в виде суммы векторов из подпространств 1_ь ..., Lr_i, Ц.. Последнее утверждение достаточно доказать для всех векторов некоторого базиса пространства L. Такой базис получится, в частности, если мы объединим вместе вектор е" и векторы некоторых базисов подпространств 1_ь..., Lr. Для вектора е" это утверждение очевидно, так как е" е \Jr. Точно так же утверждение очевидно для любого вектора, входящего в базис одного
5.2. Жорданова нормальная форма (разложение) 175 из подпространств Ц,..., Lr_i. Остается доказать это для векторов некоторого базиса подпространства 1_г. Такой базис составляют, например, векторы уг, (^-А<Г)(уг), ..., (^-А<Грг_1Ы- Из (5.15) следует, что Уг = -(Уз + '" + Ут-х) + (**- А<?)(е"), и значит, О* - \£)к{уг) = -(^ - XS)k{ys) (^ - XS)k{yr_x) + + (srf-\£)k+x{e") для всех к = 1,..., mr — 1. Это и доказывает нужное нам утверждение: так как ys е Ц, ..., yr_! € Lr_i, е" € L(,, а подпространства Ls,..., Lr_i и L^. инвариантны, то (^ - XS)k{ys) € 1_„ ..., (s/ - XS)k{yr_x) e Lr_b W - X£)k+\e") € L^. Таким образом, теорема 5.3 полностью доказана. Заметим, что при переходе от подпространства L' к L для заданного Л разложение на циклические подпространства меняется следующим образом: либо в разложении появляется еще одно одномерное подпространство (случай 1), либо увеличивается на единицу размерность одного из циклических подпространств (случай 2). Пусть разложение в прямую сумму подпространств, существование которого установлено теоремой 5.3, имеет вид L = Li ф • • • ф 1_г. Выберем в каждом из подпространств Ц базис вида (5.5) и объединим их в один базис е\,...,еп пространства L. В этом базисе матрица А преобразования 80 имеет блочно-диагональный вид: А = (Ах О О А2 0\ О (5.19) \о о ••• д./ а матрицы А{ имеют (ввиду следствия теоремы 5.1) вид (\i 0 0 0\ А, 1 О О 1 о Xi \ О О о Xi О 1 Х{) (5.20)
176 Гл. 5. Жорданова нормальная форма Матрица А, задаваемая формулами (5.19) и (5.20), называется жордановой нормальной формой, а матрицы Ai — жордановыми клетками. Таким образом, имеет место следующий результат, являющийся просто переформулировкой теоремы 5.3: Теорема 5.4. Для любого линейного преобразования конечномерного комплексного пространства существует базис этого пространства, в котором матрица преобразования имеет жорданову нормальную форму. Следствие. Каждая комплексная матрица подобна матрице, имеющей жорданову нормальную форму. Доказательство. Как мы видели в гл. 3, любая квадратная матрица А порядка п является матрицей некоторого линейного преобразования st\ L —> L в некотором базисе ei,...,en. Согласно теореме 5.4 в некотором другом базисе e[9...Je,n матрица А' преобразования si имеет жорданову нормальную форму. Как было установлено в § 3.4, матрицы А и А1 связаны между собой соотношением (3.43) с некоторой невырожденной матрицей С (матрицей перехода от первого базиса ко второму). Это и означает, что матрицы А и А1 подобны. § 5.3. Жорданова нормальная форма (единственность) Теперь мы выясним, в какой мере разложение пространства L в прямую сумму циклических подпространств относительно заданного линейного преобразования si\ L —> L является однозначным. Прежде всего заметим, что в таком разложении L = Li0..-©Lr (5.21) сами подпространства Ц ни в коем случае не определяются однозначно. Самым простым примером является тождественное преобразование si = £. Для него любой ненулевой вектор является собственным, и, значит, любое одномерное подпространство — циклическим подпространством, порожденным корневым вектором высоты 1. Поэтому любое разложение подпространства L в прямую сумму одномерных подпространств является разложением в прямую сумму циклических подпространств, а таких разложений существует столько же, сколько базисов в пространстве L, т. е. бесконечно много. Мы докажем, однако, что собственные числа А; и размерности циклических подпространств, соответствующих этим числам, для всех различных разложений (5.21) совпадают. Как мы видели, жорданова нормальная форма определяется только собственными числами А; и размерностями соответствующих им подпространств (см. формулы (5.19) и (5.20)). Таким образом будет доказана и единственность жордановой нормальной формы. Теорема 5.5. Жорданова нормальная форма линейного преобразования определяется этим преобразованием однозначно с точностью до перестановки жордановых клеток. Иначе говоря, при разложении (5.21) векторного пространства L в прямую сумму подпространств, циклических для некоторого линейного преобразования si : L —► L, собственные числа А*
5.3. Жорданова нормальная форма (единственность) 177 и размерности mi соответствующих им циклических подпространств Ц зависят только от преобразования si и одинаковы для всех разложений (5.21). Доказательство. Пусть А — произвольное собственное число линейного преобразования si и (5.21) — одно из возможных разложений. Обозначим через 1т (га = 1,2,...) целое число, показывающее, сколько га-мерных циклических подпространств, соответствующих А, встречается в (5.21). Мы дадим способ вычислить lmi исходя только из А и si. Этим и будет показано, что это число на самом деле не зависит от разложения (5.21). Применим к обеим частям равенства (5.21) преобразование {si — \<о)г с некоторым г ^ 1. Очевидно, что {si - \<?У(1) = {sf- Л<ОЧЦ) е • • • 0 {si - \#У(1г). (5.22) Найдем размерности подпространств {si — A<f)z(L/~). При доказательстве следствия теоремы 5.2 мы установили, что для любого р ф X ограничение линейного преобразования si — р<§ на М является изоморфизмом, и его образ {si — р£){М) — М. Поэтому если L& соответствует числу А& ф А, то (^-А<*)*(Ц) = Ц, Afc^A. (5.23) Если же А/е = А, то, выбрав в Ц базис е, {si — \£){е),..., {si — A^)mfc_1(e), где число rrik = dimL^, т.е. равно высоте корневого вектора е, мы получим, что если г ^ га^, то подпространство {si — A<f )г(Ц) состоит только из нулевого вектора, а если г < rrik, то (^ _ \£)%к) = {{si - А<Г)*(е),..., {si - \£)т*-1{е)), причем векторы {si — \£)г{е),..., {si — \£)тк~1{е) линейно независимы. Таким образом, в случае А/- = А мы получаем формулу dim(^-A<mU) = (°' . если^™ь (5.24) Ц тгг^ — г, если г < га^. Обозначим через п! сумму размерностей тех подпространств Ц, которые соответствуют числам А& ф А. Тогда из формул (5.22)-(5.24) следует, что dim(^ - A<f )'(L) = 1Ш + 2li+2 + -- + {p-i)lP + nf, (5.25) где р — максимум размерности циклического подпространства, соответствующего данному значению А в разложении (5.21). Действительно, из равенства (5.22) получаем, что dim(^ - \£)\1) = dim{si - А<?)*(Ц) + • • • + dim{si - A<T)*(Lr). (5.26) Из формулы (5.23) следует, что слагаемые dim{si — А<?)г(Ц) с А& ф А в сумме дают п/. Ввиду формулы (5.24) слагаемые dim(^ — А<?)г(Ц) с А& = А и rrik ^ г равны нулю. Кроме того, из той же формулы (5.24) следует, что если rrik = г + 1, то dim{s/ — А^)г(Ц) = 1, а количество подпространств Ц размерности тк = г+\ будет равно Z^+i по определению числа 1т. Поэтому в формуле (5.26) число слагаемых, равных 1, будет ^+ь Аналогично, число подпространств Ц размерности rrik = г + 2 равно ^+2» но при этом мы
178 Гл. 5. Жорданова нормальная форма уже имеем dim(^ — \S)l{Lk) = 2, откуда в правой части (5.25) появляется член 2^+2, и т.д. Отсюда и следует равенство (5.25). Напомним, что в § 3.6 для любого линейного преобразования &: L —> L нами было определено понятие ранга, далее будем обозначать его через rg^. При этом rg^ совпадает с размерностью образа ^(L) и равен рангу матрицы В этого преобразования независимо от того, в каком базисе е\,...,еп записана матрица преобразования. Положим теперь г* = rg {si — \£)г при г = 1 ния (5.25) для г = 1,... ,р с учетом того, что . ,р. Напишем соотноше- ls — О при 5 > р dim(^ - А<Г)г(Ц - rg {si - \£)г = Гг и припишем к ним равенство п — 1\ + 2/2 Н h pip + n', вытекающее из формулы (5.21) или из (5.25) при г = 0. В результате мы получим соотношения ( h+2l2 + 3l3 + + p/p + n' = n, h + 2Z3 + • • • + (p - 1)^ + n' = rb 6p -t- ^ — ^p— l > n —t, p> из которых можно выразить /i,..., lp через r\,..., rp. Действительно, вычитая из каждого равенства следующее, получим, что *! + ■ к + + 1р = п-Гь + /р = П - г2, (5.27) 6р — Тр—\ Тр Повторяя еще раз ту же операцию, получим 1\ — П — 2г\ + Г2 (5.28) L-] =rp_2 -2rp_i +гр *p-i бр — Тр—\ Тр. Из этих соотношений следует, что числа k определяются числами г*, а значит, зависят только от преобразования si. Следствие 1. В разложении (5.21) подпространство, соответствующее числу X, встречается тогда и только тогда, когда А — собственное значение преобразования si. Доказательство. Действительно, если Л — не собственное значение, то преобразование si — \<S невырождено, а значит, невырождены и преобра-
5.4. Вещественные векторные пространства 179 зования {si — \£)г. Иначе говоря, Гг = п для всех г = 1,2,... Из формул (5.27) тогда следует, что все k = 0, т.е. в разложении (5.21) нет подпространств, соответствующих А. Наоборот, если все k = О, то из (5.28) мы получаем, что rn = rn_i — • • • = -л = п. Но равенство r\ = n и означает, что преобразование srf — \<§ невырождено. Следствие 2. Квадратные матрицы А и В порядка п подобны тогда и только тогда, когда их собственные значения совпадают и для любого собственного значения А и любого г ^ п rg (А - ХЕУ = rg (В - ХЕ)\ (5.29) Доказательство. Необходимость условий (5.29) очевидна, так как если А и В подобны, то подобны и матрицы (А — \Е)Ъ и (В — \Е)г, а значит, их ранги совпадают. Докажем достаточность. Пусть условия (5.29) выполнены. Построим преобразования я/: L —► L и £3\ L —> L, имеющие в некотором базисе е\,... ,еп пространства L матрицы А и Б, соответственно. Пусть преобразование srf приводится к нормальной жордановой форме в некотором базисе /i,..-,/n, а преобразование ^ — в некотором базисе 0i,...,gn. Ввиду равенства (5.29) и на основании формул (5.25) мы заключаем, что эти жордановы формы совпадают. Значит, матрицы А и В подобны одной и той же матрице, а следовательно, по транзитивности, они подобны друг другу. В качестве еще одного приложения формул (5.27) выясним, когда матрица приводится к диагональному виду. Диагональная форма — это частный случай жордановой формы, в которой все диагональные клетки имеют порядок 1. Иначе говоря, все циклические пространства одномерны. Это значит, что 12 = • - = 1п = 0. Из второго равенства в формулах (5.27) следует, что для этого необходимо и достаточно, чтобы было выполнено условие r\ — r<i (для достаточности надо использовать то, что k ^ 0). Таким образом, мы доказали следующий критерий: Теорема 5.6. Линейное преобразование srf приводится к диагональному виду тогда и только тогда, когда для любого его собственного значения А rg (^ - \£) = rg {st - \g)2. Разумеется, аналогичный критерий верен и для матриц. § 5.4. Вещественные векторные пространства До сих пор мы рассматривали линейные преобразования в комплексных векторных пространствах (это связано с тем, что мы постоянно использовали существование собственного вектора у любого линейного преобразования, что может не быть верным в вещественном случае). Однако построенная нами теория дает много сведений и в случае преобразований вещественных пространств, что особенно важно для приложений. Предположим, что вещественное векторное пространство 1_о вложено в комплексное векторное пространство L — например, его комплексификацию
180 Гл. 5. Жорданова нормальная форма (как это было сделано в § 4.3), а линейное преобразование s/q пространства 1_о определяет вещественное линейное преобразование я? пространства L. В этом (и следующем) параграфе черта сверху будет означать комплексное сопряжение. Теорема 5.7. В разложении пространства L на циклические подпространства относительно вещественного линейного преобразования srf число циклических т-мерных подпространств, соответствующих собственному значению X, равно числу циклических т-мерных подпространству соответствующих комплексно-сопряженному собственному значению А. Доказательство. Поскольку характеристический многочлен вещественного преобразования srf имеет вещественные коэффициенты, то для каждого его корня Л число Л также является корнем характеристического многочлена. Обозначим, как мы это делали при доказательстве теоремы 5.5, число циклических m-мерных подпространств для собственного значения Л через 1т, а_ число циклических m-мерных подпространств для собственного значения Л — через 1'ш. Кроме того, обозначим Г{ — rg(s/ — XS)1 иг| = rg(^ — \£)г. Формулы (5.28) выражают числа 1т через гт. Так как эти формулы верны для любого собственного значения, то так же выражаются и числа Уш через г'ш. Нам, следовательно, достаточно доказать, что г[ = г^, откуда будет вытекать, что 1[ = 1и что и утверждает теорема. Для этого рассмотрим некоторый базис пространства 1_о (как вещественного пространства). Он же будет базисом пространства L (как комплексного пространства). Пусть А — матрица линейного преобразования я/ в этом базисе. По определению, она совпадает с матрицей линейного преобразования з/q в том же базисе и, следовательно, состоит из вещественных чисел. Поэтому матрица А — ХЕ получается из А — ХЕ заменой всех элементов на комплексно-сопряженные. Мы будем записывать это как a-Je = а-хе. Как легко видеть, отсюда вытекает, что для любого г > 0 выполнено равенство (А - ХЕ)1 = {А-ХЕу. Таким образом, наше утверждение сводится к_следующему: если В — матрица с комплексными элементами и матрица В получается из нее заменой каждого элемента на комплексно сопряженный, то rgB = rgB. Доказательство этого сразу же вытекает из определения ранга матрицы как наибольшего порядка отличного от нуля минора: ведь очевидно, что миноры матрицы В получаются комплексным сопряжением из миноров матрицы В с теми же номерами строк и столбцов. Теорема доказана. Таким образом, согласно теореме 5.7, жорданова нормальная форма (5.19) вещественного линейного преобразования состоит из жордановых клеток (5.20), соответствующих вещественным собственным значениям А*, и из пар жордановых клеток одинакового порядка, соответствующих комплексно-сопряженным собственным значениям А; и А;.
5.4. Вещественные векторные пространства 181 Посмотрим, что это дает нам для классификации линейных преобразований вещественного пространства 1_о. Мы рассмотрим в качестве простейшего примера случай dimLo = 2. Согласно теореме 5.7 жорданова форма линейного преобразования srf в комплексном пространстве L может иметь один из трех следующих видов: а 0\ ,^ч (а 0\ , * /А О (*) [О }) • ^ [l а) " <в> V0 А где а и /3 — вещественные, а Л — комплексное, но не вещественное число, т. е. Л = а + ib, где 12 = -1 и Ь ф 0. В случаях (а) и (б), как можно видеть из определения линейного преобразования <я/, матрица преобразования «**& уже имеет указанный вид в некотором базисе вещественного пространства 1_о. Как мы показали в § 4.3, в случае (в) преобразование gf$ в некотором базисе имеет матрицу Ъ Таким образом, мы видим, что любое линейное преобразование двумерного вещественного пространства в некотором базисе имеет одну из трех форм: «(о?)- <6>("£Ь «(Л)- <*•»> где а,Р,а,Ь — вещественные числа и Ь Ф 0. В силу формулы (3.43) это означает, что любая вещественная квадратная матрица второго порядка подобна матрице, имеющей одну из трех форм (5.30). Совершенно аналогично можно исследовать и общий случай линейных преобразований в вещественном векторном пространстве произвольной размерности1). Точно те же рассуждения показывают, что любая вещественная квадратная матрица подобна блочно-диагональной матрице А = Mi 0 ... 0\ 0 А2 ••• 0 \0 0 ..• Аг) где Ai — либо жордановы клетки (5.20) с вещественным собственным значением Аь либо матрицы четного порядка, имеющие блочный вид 1) Подробное изложение доказательства можно найти, например, в книге Д. К. Фаддеева «Лекции по алгебре» (М.: 1984, гл. XII, § 7).
182 Гл. 5. Жорданова нормальная форма в котором блоки Aj и Е л,- /Л; О Е hi О О О Е К 0\ О hi О \0 0 Е hi) матрицы второго порядка: Е 1 О О 1 § 5.5*. Приложения Для матрицы А, имеющей нормальную жорданову форму, просто вычисляются значения f(A), где f{x) — произвольный многочлен степени п. Прежде всего заметим, что если матрица А имеет блочно-диагональный вид А = (Ах О О А2 \0 0 •• с произвольными блоками А\,... ,АГ, то (КМ) о О f(A2) О aJ f(A) V О О 0 \ о f(Ar)J Это сразу же следует из разложения пространства L = Ц Lr в прямую сумму инвариантных подпространств и того, что линейное преобразование с матрицей А определяет в Ц линейное преобразование с матрицей Ai. Таким образом, нам остается только рассмотреть случай, когда А — жорданова клетка, т. е. /А 1 А О А О О О 1 А А 1 0\ О О (5.31) \о о Нам удобно будет представить ее в виде А = ХЕ + В, где
5.5. Приложения 183 Б = /0 0 0 1 0 О О 1 О 0\ О о о 1 О/ (5.32) \о о Напишем формулу Тейлора для многочлена степени п: f(X + y) = f(X) + f(X)y+i^ly2 + + /(п)(э ТЫ (5.33) Заметим, что при выводе формулы (5.33) нам приходится раскрывать скобки в биномах Ньютона (х + у)к, к = 2, ...,п, и при этом, очевидно, пользоваться коммутативностью умножения чисел. Если бы свойства коммутативности не было, то мы бы не смогли получить, например, выражение (х + у)2 = у2 + + 2ху + х2, но лишь (ж + у)2 = у2 + ух + ху + х2. Поэтому мы можем перейти в формуле (5.33) от чисел х и у не к произвольным матрицам, а только к коммутирующим. Положим в формуле (5.33) аргументы х = ХЕ и у = В, так как матрицы \Е и В, очевидно, коммутируют. Как легко проверить, для любого многочлена f(XE) = f{X)E, и мы получаем выражение f(A) = f(X)E + f\X)B + ^Р^2 + • • • + fn[X^Bn. 2! га! (5.34) Теперь заметим, что в базисе ei,...,em циклического подпространства, порожденного корневым вектором е высоты га, преобразование ^ с матрицей Б вида (5.32) имеет следующий вид: &{&) = e^+i при г ^ га — 1, О при г > га — 1. Применяя эту же формулу к раз, получим, что **(«) = {ei+0 ei+k ПРИ г ^ га — fc, при г > гп — к. Отсюда видно, что матрица Вк имеет очень простой вид:
184 Гл. 5. Жорданова нормальная форма Вк = /О О 1 О О 1 о о о\ о о о о о о 1 о о 1 Для того, чтобы описать его словами, назовем в матрице А = (а^) совокупность элементов ац с i = j — главной диагональю, а совокупность элементов ац с i — j = к (где к — заданное число), образующих ряд, параллельный главной диагонали, — диагональю, сдвинутой на к шагов от главной. Таким образом, в матрице Вк единицы стоят на диагонали, сдвинутой на к шагов от главной, а в остальных местах стоят нули. Формула (5.34) дает теперь для жордановой клетки А порядка т выражение f(A) = ( V0 ч>\ V2 Vm-2 I Vm-1 0 V0 Vi <Рт-3 <Рт-2 0 •• 0 •• V0 Vm-3 ' ' • 0 • 0 • Vo • Vi о\ 0 0 0 VO i , где (рк = /W(A) fc! (5.35) т.е. числа % — это коэффициенты в разложении Тейлора (5.34). Рассмотрим простейший пример. Пусть нам нужно возвести квадратную матрицу второго порядка А в очень большую степень р (например, р = 2000). Сделать эти вычисления вручную кажется безнадежным. Но построенная теория оказывается здесь очень полезной. Найдем собственные значения линейного преобразования si с матрицей А, т. е. корни квадратного трехчлена \А — \Е\. При этом возможны два случая. Случай 1. Трехчлен \А — ХЕ\ имеет различные корни Ai и Л2. Мы можем легко найти соответствующие собственные векторы е\ и ег, для которых (^ - AiO(ei) =0, (я/ - А2^)(е2) = 0. Как мы знаем, векторы е\ и е2 линейно независимы, и в базисе ei,e2 преобразование я/ имеет диагональную матрицу ( q1 \ 1 • Если С — матрица
5.5. Приложения 185 перехода от исходного базиса, в котором преобразование si имело матрицу А, к базису ei,e2, то А = С-1(Х' ?)с, (5.36) О Л2 откуда легко получается для любого (сколь угодно большого р) формула: ^ = с_1(о? xi)a <5-37> Рассмотрим второй случай. Случай 2. Трехчлен \А — ХЕ\ имеет кратный корень Л (который, следовательно, является вещественным). Тогда нормальная жорданова форма матри- цы А имеет вид одной клетки I « J или I q > I . В последнем варианте нормальная жорданова форма матрицы равна ХЕ и, следовательно, такова же и сама матрица А (это следует, например, из того очевидного факта, что если в некотором базисе линейное преобразование имеет матрицу ХЕ, то оно будет иметь такую же матрицу и в любом другом базисе). Таким образом, в последнем варианте мы имеем дело с предшествующим случаем, в котором Ai = Л2 = А, и вычисление Ар получается по формуле (5.37), где нужно только заменить Ai и А2 на А. Остается рассмотреть первый вариант. Для жордановой клетки ( « \ ) по формуле (5.35) получаем Л 0ЧР 1 \ Если еьег — такие векторы, что (^ - A<?)(ei) ^ О, е2 = (л/ - \£)(ех), то в базисе е\,в2 матрица преобразования я/ приобретает вид нормальной жордановой формы. Обозначив через С матрицу перехода к этому базису и воспользовавшись формулой замены л = с-.(}°)с, получаем, что 1 / ХР °\ Ар = С"1 л С. (5.38) \р\р-1 ХР I Формулы (5.37), (5.38) и решают нашу задачу. Теперь мы можем применить те же соображения не только к многочленам, но и к другим функциям, например, задаваемым сходящимися степенными рядами — такие функции называются аналитическими. Для этого мы должны будем использовать понятие сходимости последовательности матриц. Напомним, что понятие сходимости для последовательности квадратных матриц
186 Гл. 5. Жорданова нормальная форма заданного порядка с вещественными коэффициентами уже было определено нами в § 4.4. Более того, в том же параграфе мы ввели на множестве таких матриц метрику г (А, В), превратив его тем самым в метрическое пространство, для которого понятие сходимости определено автоматически (см. с. 14). Очевидно, что определенная формулами (4.36) и (4.37) метрика г (А, В) является также метрикой и на множестве квадратных матриц заданного порядка с комплексными коэффициентами, и следовательно, превращает его в в метрическое пространство. При таком определении сходимость последовательности матриц А^ = (aL ), (к) к = 1,2,..., к матрице В = (pij) означает, что а\-} —► Ь^ при к —> оо для всех i,j. В этом случае пишут: А^ —► В при к —► оо или Km А^ = В. к—>оо Матрица В называется пределом последовательности А^к\ к = 1,2,... Аналогичным образом можно определить предел семейства матриц A(h), зависящих от параметра /ь, принимающего не натуральные (как это было в случае последовательности), а вещественные значения, и стремящегося к произвольному значению ho. По определению, lim A{h) = Б, если lim r(A(h),B) = 0. h—>Hq h—>Jiq Другими словами, это значит, что lim aij(h) = hj для всех i,j. h—>Hq Как и в случае чисел, имея понятие сходимости последовательностей матриц, можно говорить и о сходимости рядов матриц. На ряды матриц безо всяких изменений переносятся известные из анализа теоремы о рядах. Пусть функция f(x) определена степенным рядом f(x) = а0 + а{х + • • • + акхк + • • • . (5.39) Тогда, по определению, f(A) = a0E + aiA + ..- + akAk + • • • . (5.40) Пусть степенной ряд (5.39) сходится при \х\ < г и матрица А имеет вид жордановой клетки (5.31) с собственным значением Л, по модулю меньшим г. Тогда, рассматривая сумму первых к слагаемых ряда (5.40) и переходя затем к пределу к —> оо, мы получаем, что ряд (5.40) сходится, и для f(A) имеет место формула (5.35). Если теперь мы возьмем матрицу А!, которая подобна некоторой жордановой клетке А, т.е. связана с ней соотношением Af — С~1АС с некоторой невырожденной матрицей С, то в силу очевидного соотношения (С~1АС)к = С~1АкС, из (5.40) мы получаем ДА') = С~1(а0Е + ai А + • • • + акАк + • • • )С = C~lf(A)C. (5.41) Формулы (5.35) и (5.41) позволяют определить f(A) для любой аналитической функции f{x). Пользуясь результатами из анализа, мы можем распространить понятие функции от матрицы и на более широкий класс функций (например, на непрерывные — с помощью теоремы о равномерном приближении непрерывной функции многочленами). Однако этих вопросов мы здесь касаться не будем.
5.5. Приложения 187 В приложениях особенно важна так называемая экспонента от матриц. Напомним, что экспонента от числа х может быть определена как сумма ряда e*=l+a. + I^ + ... + Ix* + ... , (5.42) который, как доказывается в курсе анализа, сходится при любом вещественном или комплексном числе х. В соответствии с этим экспонента от матрицы А определяется рядом еА = Е + А+±-А2 + .-- + ±-Ак + ..- , (5.43) 2! к\ сходящимся при любой матрице А с вещественными или комплексными элементами. Проверим, что если матрицы А и В коммутируют, то на матричную экспоненту переносится привычное свойство числовой экспоненты еАев = еА+в. (5.44) Действительно, подставляя в левую часть (5.44) выражения (5.43) для еА и ев, раскрывая скобки и группируя слагаемые, получаем: еАев=(Е + А+±А2 + ±А* + ---)(Е + В + ±В2 + ±В3 + ---) = = Е + {А + В) + [^А2 + АВ + ^£2) + HwA3+kA2B+*AB2+hB3)+— = E+(A + B) + ±(A + B)2 + ^(A + Bf + .--, что совпадает с выражением (5.43) для еА+в. В обоснование сделанных выше переходов нужно заметить, что, во-первых, как известно из анализа, соответствующий экспоненте (5.43) числовой ряд (5.42) абсолютно сходится на всей числовой оси (это позволяет производить суммирование его членов в произвольном порядке) и, во-вторых, матрицы А и В коммутируют (без этого невозможен был бы последний переход — по причине, уже обсуждавшейся нами на с. 183). В частности, из (5.44) следует важное соотношение eA(t+s) = eAt eAs (5<45) для любых чисел t и s и любой квадратной матрицы А Из него легко вывести, что ^ем = Аем (5.46) at (понимая дифференцирование матричной функции поэлементно). Действительно, по определению дифференцирования, d At ,. eA^h)-eAt —ет = hm , at /i->o h
188 Гл. 5. Жорданова нормальная форма а из (5.45) следует, что eA(t+h) _ eAt ^ eAh eAt _ eAt _eAh_E м h h h Наконец, из (5.43) легко вытекает равенство pAh _ тр /1 1 \ lim ^—г-=- = lim Л"1 (Ah) + i- (Ah)2 + • • • + тт (Ah)k + .••)= A. h-^o h h->o \ 2! A;! ) Все эти соображения имеют многочисленные применения в теории дифференциальных уравнений. Рассмотрим систему п линейных однородных дифференциальных уравнений: —j = ^OijXj, i=l,...,n, (5.47) где aij — некоторые постоянные коэффициенты, a xi = Xi(t) — неизвестные дифференцируемые функции от переменной t. Подобно тому, как это было сделано ранее для систем линейных алгебраических уравнений (пример 2.4, с. 75), систему линейных дифференциальных уравнений (5.47) тоже можно кратко записать в матричной форме, если ввести вектор-столбцы dt \ ахп I \ dt / и квадратную матрицу порядка п, состоящую из коэффициентов системы: А — (а^). Тогда система (5.47) запишется в виде $ = Ах, (5.48) at число п называется порядком этой системы. Для любого постоянного вектора xq рассмотрим вектор x(t) = eAtxo, зависящий от переменной t. Этот вектор удовлетворяет системе (5.48). Действительно, для любых матриц A(t) и В (хотя бы и прямоугольных, лишь бы число столбцов A(t) совпадало с числом строк В), если только матрица В постоянна, выполняется равенство после чего остается воспользоваться соотношением (5.46). Аналогично, для любых матриц A(t) и В, где В — постоянная и число столбцов В совпадает с числом строк A(t), имеет место формула ±(BA{t)) = B*Ajp.. (5.49) Так как при t = 0 матрица eAt = Е, то решение x(t) = eAtxo удовлетворяет начальному условию ж(0) = xq. Но теорема единственности, доказываемая
5.5. Приложения 189 в теории дифференциальных уравнений, утверждает, что при заданном xq такое решение единственно. Таким образом, в виде eAtxo мы получаем все решения системы (5.48), если считать вектор жо не фиксированным, а принимающим все возможные значения из пространства размерности п. Наконец, можно выписать и явную формулу для решений. Для этого сделаем в системе уравнений (5.48) линейную замену переменных по формуле у — С~1х, где С — невырожденная постоянная квадратная матрица порядка п. При этом с учетом соотношений (5.49), (5.48) и х = Су получим at at (5.50) Формула (5.50) показывает, что матрица А системы линейных дифференциальных уравнений при линейных заменах переменных изменяется по тому же самому закону, что и матрица линейного преобразования при соответствующей замене базиса. В соответствии со сказанным в предыдущих параграфах, мы можем выбрать в качестве С такую матрицу, с помощью которой матрица А приводится к нормальной жордановой форме. В результате система (5.48) перепишется в виде ft=A>y' (5-51) где матрица А' = С~ХАС имеет нормальную жорданову форму. Пусть (Ах 0 ••• 0\ 0 А2 ••• 0 А' = (5.52) \0 0 ••• Ат) где Ai — жордановы клетки. Тогда система (5.51) распадается на г систем -^ = Aiyi, i=l,...,r, и для каждой из них мы можем выписать решение в виде еА**ж^ , а матрицу eAit найти из соотношения (5.35). Здесь /(ж) = ext, и следовательно, /<"<.) = £«- = *", п = р Значит, для клетки Ai вида (5.31) размера m формула (5.35) дает: /1 0 0 ••• 0 0\ t 1 0 eAt = ext Ш. 2 t 1 (m-2)! (m-3)! +m— 1 +m—2 f.m—3 \(m-l)! (m-2)! (m-3)! 0 0 (5.53)
190 Гл. 5. Жорданова нормальная форма Отсюда вытекает, что решения системы (5.48) распадаются на серии, длины которых равны порядкам жордановых клеток в представлении (5.52), и для клетки порядка т все решения данной серии выражаются как линейные комбинации (с постоянными коэффициентами) функций ех\ tex\ ...,tm-lext. (5.54) Легко проверить, что совокупность решений системы (5.48) является векторным пространством, где сложение двух векторов и умножение вектора на число определено как сложение и умножение на число соответствующих функций. Набор функций (5.54) образует базис в пространстве решений системы (5.48). В теории дифференциальных уравнений такой набор принято называть фундаментальной системой решений. В заключение скажем несколько слов о линейных дифференциальных уравнениях с вещественными коэффициентами (т.е., предполагая, что в системе (5.48) матрица А и вектор х вещественны) на плоскости (п = 2). При этом следует различать четыре возможности для матрицы А и корней многочлена \А — ХЕ\: (а) корни вещественны и различны (а и /3), (б) имеется кратный корень а (обязательно вещественный) и А — аЕ, (в) имеется кратный корень а, но А ф аЕ, (г) корни комплексно-сопряженные: а + гЪ и а — гЪ (здесь г2 = — 1 и Ъ ф 0). В каждом из этих случаев матрица А может быть приведена (путем умножения слева на С-1 и справа на С, где С — некоторая невырожденная вещественная матрица) к следующим нормальным формам: «(г?)- <«(г2)- <■>(?£)■ и (г-j Решение x(t) соответствующего линейного дифференциального уравнения находится в виде x(t) = eAtxo, где xq = I l J — вектор начальных данных. Далее мы можем применить формулу (5.53), считая, что матрица А системы имеет нормальную форму (а), (б), (в) или (г). При этом в случаях (а)-(в) получим: (a) x(t) = (е°У ) , (б) x{t) = [e^ J , (5.55) (в) x{t)= \^at ^tJ • ^J = yciteat + c2eC, I • (5-56) В случае (г) мы получаем x(t) — eAt ( 1 1, где А = ( , ) . В примере 4.2 (с. 142) мы установили, что А есть матрица линейного преобразования плоскости С комплексного переменного z, которое заключается в умножении z на комплексное число а + ib. Значит, по определению экспоненты,
5.5. Приложения 19J_ eAt есть матрица умножения z на комплексное число е(а+гЬ^. Согласно формуле Эйлера, e(a+ib)t = eat(CQS ы + i gin Ы)=р + iq, где р — eatcosbt и q = eatsiribt. Таким образом, мы получаем линейное преобразование вещественной плоскости С комплексного переменного z, которое заключается в умножении всех комплексных чисел z E С на заданное комплексное число р + iq. Как мы видели в примере 4.2, матрица такого линейного преобразования имеет вид (4.2). Умножая ее на вектор-столбец а?о начальных данных и подставляя выражения р = eat cos bt и q = eat sin bt, получаем окончательную формулу: /r> -о\ /гЛ * /cicosbt-C2sinbA (г) x(t)= (Р q • Г1 ] =еаЧ . (5.57) w V? РУ W yCl sin bt + ca cos WJ Плоскость переменных (х\,Х2) называется фазовой плоскостью системы (5.48) при п — 2. Формулы (5.55)-(5.57) задают (в параметрической форме) некоторые кривые на фазовой плоскости, при этом каждой паре значений ci,C2 соответствует, вообще говоря, своя кривая, проходящая через точку (сьсг) фазовой плоскости при t = 0. Эти ориентированные кривые (ориентация задается направлением движения, соответствующим возрастанию параметра t) называются фазовыми кривыми системы (5.48), а совокупность всех фазовых кривых, отвечающих всевозможным значениям ci,C2, называется фазовым портретом системы. Зададимся вопросом: как выглядят фазовые портреты системы (5.48) в случаях (а)-(г)? Прежде всего заметим, что среди всех решений x(t) обязательно есть постоянное: x(t) = 0. Оно получается, если в формулы (5.55)-(5.57) подставить нулевые начальные значения: с\ = c<i = 0. Фазовая кривая, соответствующая этому решению, — это просто точка х\ = Х2 = 0. Постоянные решения (и соответствующие им фазовые кривые — точки фазовой плоскости) называются особыми точками, или точками покоя, или положениями равновесия дифференциального уравнения1). Подобно тому, как исследование функции обычно начинается с поиска точек экстремума, исследование дифференциального уравнения обычно начинается с поиска особых точек. Существуют ли другие особые точки системы (5.48), кроме х\ = x<i — 0? Особые точки — это постоянные решения системы, а так как производная от постоянного решения тождественно равна нулю (т.е. левая часть системы (5.48) тождественно равна нулю), то значит, правая часть системы (5.48) тоже должна быть тождественно равна нулю. Таким образом, особые точки — это в точности решения системы линейных однородных уравнений Ах — 0. Если матрица А невырождена, то система Ах = 0 не имеет других решений, кроме нулевого, и следовательно, система (5.48) не имеет других особых точек, кроме х\ = х^ — 0. Если матрица А вырождена и ее ранг равен 1, 1) Смысл этого названия состоит в том, что если в какой-то момент времени материальная точка, движение которой описывается системой (5.48), оказывается в особой точке, то она будет оставаться там всегда.
192 Гл. 5. Жорданова нормальная форма то система (5.48) имеет бесконечное число особых точек, лежащих на одной прямой в фазовой плоскости. В случае же, когда ранг матрицы А равен 0, все точки фазовой плоскости являются особыми. Далее мы будем считать, что матрица А невырождена, и рассмотрим, какие фазовые портреты соответствуют приведенным выше случаям (а)-(г). На всех рисунках ось абсцисс соответствует переменной х\, а ось ординат — переменной x<i. (а) Корни а и (3 вещественны и различны. В этом случае возможны три варианта: а и /3 имеют разные знаки, оба отрицательны, оба положительны. (а.1) Если а и /3 имеют разные знаки, то особая точка называется седлом. Предположим для определенности, что а < 0 и /3 > 0. Начальному значению с\ ф 0, С2 = 0 соответствует решение x\(t) = c\eat, жгСО = 0, проходящее через точку (с\,0) при t = 0. Соответствующая фазовая кривая представляет собой горизонтальный луч х\ > 0, Х2 = 0 (если с\ > 0) или х\ < 0, Х2 — 0 (если с\ < 0), движение по которому при возрастании t происходит по направлению к особой точке х\ — х% = 0. Аналогично, начальному значению с\ = 0, с^ ф 0 соответствует решение x\(t) = 0, X2(t) = С2в^, проходящее через точку (0, сг) при t = 0. Соответствующая фазовая кривая представляет собой вертикальный луч х\ = 0, Х2 > 0 (если С2 > 0) или х\ — 0, #2 < 0 (если С2 < 0), движение по которому при возрастании t происходит по направлению от особой точки х\ = Х2 = 0. Таким образом, существуют две фазовые кривые, асимптотически приближающиеся к особой точке при t —> +оо (они называются устойчивыми усами), и две кривые, приближающиеся к ней при t —> —оо (они называются неустойчивыми усами). Отметим один важный момент: из того, что eat —» 0 при t —> +схэ ие^->0 при t —> —оо следует, что устойчивые и неустойчивые усы неограниченно приближаются к седлу при t —> +оо и t —> —оо соответственно, но не могут достичь его за конечное время. Устойчивые и неустойчивые усы седла разбивают фазовую плоскость на четыре сектора (поэтому усы часто называют также сепаратрисами). В нашем случае (когда матрица системы (5.48) имеет жорданову форму) усы лежат на координатных осях, и поэтому эти секторы совпадают с координатными квадрантами. Посмотрим, как ведут себя все остальные фазовые кривые, соответствующие начальным значениям с\ ф 0, С2 ф 0. Прежде всего заметим, что если начальная точка (с\, сг) лежит в каком-то одном из четырех секторов, то проходящая через нее при * = 0 фазовая кривая при всех значениях t остается в этом же секторе. Это очевидно следует из того, что функции x\(t) = c\eat и X2(t) = C2^1 знакопостоянные. Для определенности рассмотрим первый квадрант с\ > 0, С2 > 0 (все остальные получаются из него после преобразования симметрии или относительно оси абсцисс, или оси ординат, или начала координат). Возведем функцию x\(t) = c\eat в степень /?, а функцию X2(t) = счеР1 — в степень а. Разделив затем их друг на друга, после сокращения множителя eal3t получим соотношение Ч = 4 = с, (5.58) х2 с2
5.5. Приложения 193 где константа с определяется начальными значениями с\,С2. Так как числа а и /3 имеют разные знаки, то фазовая кривая на плоскости (х\,Х2), соответствующая этому уравнению, имеет вид, схожий с гиперболой. Эта фазовая кривая проходит на некотором положительном расстоянии от особой точки х\ — Х2 = 0, асимптотически стремится к одному из неустойчивых усов при t —» +оо и к одному из устойчивых усов при t —> — оо. Такие фазовые кривые называются гиперболическими или седловыми. Таким образом, в случае седла мы имеем два устойчивых уса, стремящихся к особой точке при t —» +оо и два неустойчивых уса, стремящихся к ней при t —> —оо, а также бесконечное число седловых фазовых кривых, заполняющих четыре сектора, на которые усы делят фазовую плоскость. Соответствующий фазовый портрет изображен на рис. 5.1. седло устойчивый узел неустойчивый узел Рис. 5.1. Седло и узлы (а.2) Если а и (3 имеют одинаковые знаки, то особая точка называется узлом. Причем если а и (3 отрицательные, узел называют устойчивым, а если а и /3 положительные, — неустойчивым. Смысл этих названий станет понятен чуть позже. Для определенности мы ограничимся рассмотрением устойчивого узла (неустойчивый узел исследуется аналогично), т.е. будем считать, что числа а и (3 отрицательные. Как и в случае седла, фазовая кривая, соответствующая начальному значению с\ Ф О, c<i = О, представляет собой горизонтальный луч х\ > О, Х2 = 0 (если с\ > 0) или х\ < 0, Х2 — 0 (если с\ < 0), движение по которому при возрастании t происходит по направлению к особой точке. Фазовая кривая, соответствующая начальному значению с\ = 0, с^ ф- 0, представляет собой вертикальный луч х\ = 0, х^ > 0 (если c<i > 0) или х\ — 0, Х2 < 0 (если С2 < 0), движение по которому при возрастании t происходит тоже по направлению к особой точке. Как и в ситуации с седлом, видно, что если начальная точка (с\,С2) лежит в одном из четырех квадрантов, то проходящая через нее при t = 0 фазовая кривая при всех значениях t остается в этом же квадранте. Рассмотрим первый квадрант с\ > 0, С2 > 0. Производя те же действия, что и при исследовании седла, мы снова получим уравнение (5.58). Но теперь числа а и /3 имеют один и тот же знак, и фазовая кривая, соответствующая этому уравнению, имеет совсем иной вид, чем в случае седла. После преобразования из (5.58) 7 А. О. Ремизов, И. Р. Шафаревич
194 Гл. 5. Жорданова нормальная форма мы получим степенную функцию х\ = с1^х^' . Если а > /3, то показатель а/Р > 1, и график этой функции похож на ветвь параболы х\ = х\. Если же а < /3, то показатель а/(3 < 1, и график функции похож на ветвь параболы #2 — х\. Таким образом, в случае устойчивого узла все фазовые кривые при t —» +оо стремятся к особой точке, а при t —> —оо удаляются от нее (для неустойчивого узла здесь нужно поменять +оо и —оо местами). Такие фазовые кривые называют параболическими. Фазовые портреты устойчивого и неустойчивого узла изображены на рис. 5.1. Теперь можно объяснить смысл терминов устойчивый и неустойчивый. Если материальная точка находилась в положении равновесия, которое является устойчивым узлом, и была выведена из него каким-то внешним воздействием, то, двигаясь по кривым, изображенным на фазовом портрете, она будет стремиться вернуться в это положение. Если же это был неустойчивый узел, то материальная точка, будучи выведена из положения равновесия, не только не будет стремиться вернуться в это положение, но, напротив, будет все больше удаляться от него с экспоненциально возрастающей скоростью. (б) Если матрица А подобна матрице аЕ, то особая точка называется дикритическим узлом. Производя те же действия, что и ранее, получим соотношение (5.58) с /3 = а, из которого следует уравнение х\/х2 = с\/с2. Все фазовые кривые представляют собой лучи с центром в х\ = х^ — 0. Причем если а < 0, то движение по ним при t —» +оо происходит по направлению к точке покоя х\ = Х2 = 0, а если а > 0, то - от нее. Таким образом, в случае а < 0 (а > 0) имеем устойчивый (неустойчивый) дикритический узел. Фазовый портрет устойчивого дикритического узла изображен на рис. 5.2, в случае неустойчивого дикритического узла нужно только изменить направление стрелок на противоположное. устойчивый устойчивый неустойчивый дикритический узел вырожденный узел вырожденный узел Рис. 5.2. Дикритический и вырожденные узлы (в) Если решение уравнения задается формулой (5.56), то особая точка называется вырожденным узлом. Если а < 0, то вырожденный узел устойчивый, а если а > 0 — неустойчивый. При с\ ф 0, с^ = 0 получаем две фазовые кривые — горизонтальные лучи х\ > 0, Х2 = 0 и х\ < 0, х^ = 0, движение по которым происходит по направлению к особой точке при а < 0 и от особой точки при а > 0. Для исследования фазовых кривых при С2 ф 0 нужно исследовать свойства функций x\(t) = c\eat и X2(t) — (c\t + C2)eat при с\ > 0
5.5. Приложения 195 и при с\ < 0. В результате для устойчивого (неустойчивого) вырожденного узла получится фазовый портрет, изображенный на рис. 5.2. Все фазовые кривые (кроме двух вертикальных лучей) похожи на куски параболы, каждый из которых целиком лежит либо в правой, либо в левой полуплоскости и пересекает ось абсцисс ровно в одной точке. (г) Корни комплексно-сопряженные: а + гЪ и а — ib, где Ъ ф 0. Здесь нужно отдельно рассмотреть два случая: а ф 0 и а — 0. устойчивый фокус неустойчивый фокус центр Рис. 5.3. Фокусы и центр (г.1) Если а Ф 0, то особая точка называется фокусом. Для того, чтобы представить себе поведение фазовых кривых, задаваемых формулой (5.57), заметим, что вектор x(i) получается из вектора хо с координатами (ci,C2) поворотом на угол Ы и умножением на число eat. Следовательно, фазовые кривые представляют собой спирали, которые «наматываются» на особую точку х\ — Х2 = 0 при t —► +оо (если а < 0) или при t —> —оо (если а > 0). При а < 0 и а > 0 фокус называется устойчивым или неустойчивым соответственно. Направление движения по спиралям (по часовой стрелке или против нее) определяется знаком числа Ъ. На рис. 5.3 изображены фазовые портреты устойчивого фокуса (а < 0) и неустойчивого фокуса (а > 0) в случае Ь > 0, т. е. когда движение по спиралям происходит против часовой стрелки. (г.2) Если а = 0, то особая точка х\ = Х2 = 0 называется центром. Соотношение (5.57) в этом случае задает поворот вектора хо на угол Ы. Фазовые кривые представляют собой окружности с общим центром х\ = x<i — 0, движение по которым происходит по или против часовой стрелки, в зависимости от знака числа Ъ. Фазовый портрет центра (для случая Ъ > 0) изображен на рис. 5.3. 7*
Глава 6 КВАДРАТИЧНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ § 6.1. Основные определения Определение. Квадратичной формой от п неизвестных х\,...,хп называется однородный многочлен второй степени от этих неизвестных. Таким образом, в этот многочлен входят только члены второй степени, т. е. одночлены вида cpij xiXj при всевозможных i,j = 1,... ,п, и он имеет вид п Ф(Х1,...,ХП)= Y^PijXiXj' (6-1) Заметим, что в выражении (6.1) содержатся подобные члены, так как XiXj = XjXi. Как с ними поступать, мы решим позже. Конечно, каждую квадратичную форму (6.1) можно рассматривать как функцию от вектора х = х\е\ + • • • + хпеп, где ei,...,en — какой-либо фиксированный базис векторного пространства L размерности п. Мы будем записывать это как п ^(Ж) = Yl WjXiXj. (6.2) Данное определение квадратичной формы, очевидно, согласуется с более общим определением формы произвольной степени, которое было дано в § 3.8 (с. 136). Напомним, что в этом параграфе форма произвольной степени к была определена как функция F(x) от вектора х е L, если F(x) записывается как однородный многочлен степени к от координат х\,...,хп в некотором (и тогда — любом) базисе этого пространства. Таким образом, при к = 2 мы получаем данное выше определение квадратичной формы. При замене координат, т.е. при выборе другого базиса пространства L квадратичная форма ф(х) будет по-прежнему записываться в виде (6.2) с некоторыми другими коэффициентами Щу Квадратичные формы еще очень близки к линейным функциям, и мы дальше сведем их изучение к теории линейных функций и преобразований. Основой для этого служит следующее понятие: Определение. Функция <р(х, у) от двух векторов ж, у е L, сопоставляющая им число, называется билинейной формой на L, если она линейна по каждому аргументу, т.е. для каждого фиксированного у е L функция (р(х,у) от х — линейная на L и для каждого фиксированного х G L функция (р(х, у) от у — линейная на L.
6.1. Основные определения 197 Иными словами, это значит, что должны быть выполнены соотношения (р(х{ + х2,у) = <p{xi,y) + (р(х2,у), (р(ах9у) = а(р(х,у), <р(х, ух + у2) = <р(х, ух) + (р(х, у2), (р(х,ау) = а(р(х,у) для любых векторов пространства L и числа а. В случае, когда пространство L состоит из строк, мы имеем дело с частным случаем понятия полилинейной функции, введенного в § 2.7 (при т = 2). Если е\,...,еп — некоторый базис в L, то мы можем записать х = ххех Н 1- хпеп, у = уге\ Н Ь упеп, и, используя равенства (6.3), получим формулу, выражающую (в выбранном базисе) билинейную форму ср(х,у) через координаты векторов х и у: п <р(х, у) = ^2 ¥>ij XiVj, где <pij = <p(ei9 ej). (6.4) При этом квадратная матрица Ф = (y>ij) называется матрицей билинейной формы (р в базисе ei,...,en. В случае, когда х и у — строки, эта запись является частным случаем записи произвольной полилинейной функции, выведенной в § 2.7 (теорема 2.10). Соотношение (6.4) показывает, что значение (р(х,у) выражается через элементы матрицы Ф и координаты векторов х и у в базисе е\,...,еп, а значит, билинейная форма, как функция аргументов ж и у, полностью определяется свой матрицей Ф. Эта же формула показывает, что если в билинейной форме ip(x,y) положить аргумент у — ж, где х = (х\,... ,хп), то мы получим квадратичную форму ф{х) = (р(х,х), причем таким образом может быть получена любая квадратичная форма (6.1) — для этого нужно лишь выбрать билинейную форму ip(x,y) с матрицей Ф = (¥fy")» удовлетворяющей условию (p(ei,ej) = (pij, где щ$ — коэффициенты из (6.1). Как легко видеть, множество билинейных форм на пространстве L само становится векторным пространством, если естественным образом определить в нем операции сложения билинейных форм и умножения их на числа. Нулевым вектором такого пространства является, очевидно, билинейная форма, тождественно равная нулю. Связь понятия билинейных форм и линейных преобразований основана на следующем результате, использующем понятие сопряженного пространства: Теорема 6.1. Существует изоморфизм между пространством билинейных форм (р на L и пространством £(L, L*) линейных преобразований srf\ L —► L*. Доказательство. Пусть ср(х,у) — билинейная форма на L. Сопоставим ей линейное преобразование st\ L —► L* следующим образом. По определению, si должно ставить в соответствие вектору у Е L линейную функцию ф(х) на L. Мы зададим эту линейную функцию, положив ф(х) = ip(x,y). Проверка того, что определенное таким образом преобразование si линейно, совершенно очевидна.
198 Гл. 6. Квадратичные и билинейные формы Так же очевидна и проверка взаимной однозначности построенного соответствия (р I—> si. Мы просто явно укажем обратное преобразование множества £(L, L*) в множество билинейных форм. Пусть si — линейное преобразование L —> L*, каждому вектору х G L оно сопоставляет линейную функцию si{x) G L*. Эта функция принимает значение si{x){y) на векторе у, которое мы и обозначим через ip(x,y). Используя обозначения, введенные в § 3.7 (с. 134), и учитывая, что в этой ситуации М = L*, мы можем написать: (р(х,у) = (x,si(y)) для любых векторов х,у G L. Наконец, совершенно очевидно, что построенное отображение (р *-> si является изоморфизмом векторных пространств, т.е. выполняются условия Ч>\ + ¥>2 *-+ &4\ + £?2 и Хер i-> \af, где ^ и ^ и А - произвольное число. Из этой теоремы следует, что изучение билинейных форм аналогично изучению линейных преобразований L —> L (хотя и несколько проще). В математике и физике особую роль играют два специальных типа билинейных форм. Определение. Билинейная форма <р(ж, у) называется симметрической, если <р(х,у) = ср(у,х), (6.5) и антисимметрической, если ц>(х,у) = -<р(у,х) (6.6) для любых векторов х,у G L. С частными случаями обоих этих понятий мы встречались в гл. 2, когда векторы х и у предполагались строками, состоящими из чисел. Если, следуя теореме 6.1, билинейную форму (р(х,у) представить в виде <р(х,у) = {x,si{y)) (6.7) с некоторым линейным преобразованием si: L —> L*, то условие симметричности (6.5) означает, что (x,si(y)) = (y,si(x)). Так как (y,si(x)) = = (x,si*(y)), где si*: L** —> L* — линейное преобразование, сопряженное к si, см. с. 134, то это же условие записывается в виде (x,si(y)) = {x,si*{y)). Поскольку это соотношение должно быть выполнено для любых векторов x,y€L, то его можно переписать в виде si = si*. Обратите внимание, что ввиду равенства L** = L, как si, так и si* являются преобразованиями L —> L*. Аналогично, условие антисимметричности (6.6) билинейной формы (р(х,у) записывается в виде si = — si*. Заметим, что условия симметричности (6.5) и антисимметричности (6.6) достаточно проверить для случая, когда векторы жиг/ принадлежат какому- либо базису е\,...,еп пространства L. Действительно, если это условие выполнено для векторов базиса е\,...,еп, т.е., например, в случае симметричности, выполнены равенства tp(ei,ej) = (p(ej,ei) для всех i,j = 1,...,п, то из формулы (6.4) следует, что условие (6.5) верно для всех векторов х, у G L. Вспоминая определение матрицы билинейной формы, мы видим, что форма (р симметрична тогда и только тогда, когда ее матрица Ф в каком-либо базисе пространства L симметрична (Ф = Ф*). Аналогично, антисимметрич-
6.1. Основные определения 199 ность билинейной формы ц> равносильна антисимметричности ее матрицы Ф в каком-либо базисе (Ф = —Ф*). Матрица Ф билинейной формы зависит от выбора базиса ei,...,en. Мы исследуем сейчас эту зависимость. При этом мы будем пользоваться полученной в § 3.4 формулой замены координат (3.38), да и сами наши рассуждения будут похожи на те, которые мы применяли при выводе этой формулы. Прежде всего, запишем соотношение (6.4) в более компактной матричной форме. Для этого заметим, что для /уГ строки ж = (х\,... ,хп) и столбца [у] = I : \Уп/ можно переписать сумму в формуле (6.4) следующим образом: п п I п \ п п J2 <PijXiVj = X] жм Е wjVj)= X)XiZi> где Zi = 12 ФчУз- Согласно правилу умножения матриц мы имеем выражение (Zl\ ^2 VijXiVj = x[z], где [z] = I : J = Ф[у]. г, 3=1 \zj Значит, имеет место запись п Отметим, что аналогичными рассуждениями или просто транспонированием обеих частей предыдущего равенства (в левой части которого стоит число, т.е. матрица типа (1,1), не меняющаяся при транспонировании) мы можем получить похожее соотношение: п Y2 VijXiVj = уФ*[х]. hj=l Таким образом, если в некотором базисе ei,...,en матрица билинейной формы ip равна Ф, а векторы жиг/ имеют координаты Х{ и гц, то справедлива формула: <р(х,у) = хФ[у]. (6.8) Аналогично, для другого базиса е[,...,е'п имеем равенство <р(х,у) = х,Ф'[у1 (6.9) где Ф; — матрица билинейной формы </?, а х\ и у[ — координаты векторов ж и у в базисе е\,... ,е'п.
200 Гл. 6. Квадратичные и билинейные формы Пусть С — матрица перехода от базиса е\,,..., е!п к базису е\,..., еп. Тогда, согласно формуле замены (3.36), имеем соотношения х = ж'С* и [у] = С [у']. Подставляя эти выражения в (6.8), с учетом формулы (6.9) мы получаем тождество ж'С*Ф С [у7] =ж/Ф/[у/], выполненное для всех х' и [у']. Отсюда следует, что матрицы Ф и Ф' билинейной формы ip в этих базисах связаны равенством Ф' = С*ФС. (6.10) Это и есть формула замены матрицы билинейной формы при изменении базиса. Поскольку ранг матрицы не изменится, если ее умножить слева или справа на невырожденную квадратную матрицу соответствующего порядка (теорема 2.25), то ранг матрицы Ф совпадает с рангом матрицы Ф; при любой матрице перехода С. Таким образом ранг г матрицы билинейной формы не зависит от выбора базиса, в котором матрица записывается, и следовательно, можно назвать его просто рангом билинейной формы (р. В частности, если г — п, т. е. ранг совпадает с размерностью пространства L, то билинейная форма ср называется невырожденной. Ранг билинейной формы можно определить и другим способом. По теореме 6.1, каждой билинейной форме <р однозначно соответствует некоторое линейное преобразование я/: L —> L*, и связь между ними устанавливается соотношением (6.7). Легко проверить, что если выбрать в пространствах L и L* два взаимных базиса, то матрицы билинейной формы <р и линейного преобразования я/ будут совпадать. Это показывает, что ранг билинейной формы совпадает с рангом линейного преобразования «я^. Из сказанного вытекает, в частности, что форма <р невырождена тогда и только тогда, когда линейное преобразование s/: L —> L* является изоморфизмом. Одна и та же квадратичная форма ф может быть получена из разных билинейных форм (р — это связано с наличием подобных членов в записи (6.1) квадратичной формы, о чем мы говорили выше. Для того, чтобы добиться однозначности и согласованности со свойствами линейности, мы поступим не так, как в школе, где, например, записывают сумму членов а\2Х\Х2 + а2\Х2Х\ = (а\2 + а2\)х\Х2, а иначе, используя запись, содержащую подобные члены. Замечание о числах и полях. Дальнейшие уточнения в этом параграфе имеют в виду читателя, который интересуется случаем векторных пространств над произвольным полем К. Здесь мы введем некоторое ограничение, которое сделает изложение единообразным для случаев К = R, К = С и всех рассматриваемых нами типов полей. А именно, далее мы всегда будем предполагать, что К является полем отличной от 2 характеристики1) (о таком ограничении общего понятия поля мы уже упоминали на с. 93). Используя простейшие свойства, вытекающие из определения поля, легко 1) Чаще всего встречаются поля характеристики, отличной от 2. Однако и исключенные нами из рассмотрения поля характеристики 2 имеют важные приложения, например, в дискретной математике и криптографии.
6.1. Основные определения 201 доказать, что в поле отличной от 2 характеристики для любого элемента а существует единственный элемент 6, такой, что 26 = а (где 26 означает 6 + 6). Тогда полагают 6 = а/2, и из равенства а = 0 следует 6 = 0. Теорема 6.2. Любая квадратичная форма ф{х) на пространстве L над полем К отличной от 2 характеристики может быть представлена в виде ф{х) = (р(х,х), (6.11) где (р — симметрическая билинейная форма, причем для заданной квадратичной формы ф такая билинейная форма (р существует только одна. Доказательство. Согласно сказанному выше любая квадратичная форма ф{х) может быть представлена в виде ф(х) = (рх(х,х), (6.12) где <р\(х,у) — некоторая билинейная форма, не обязательно симметрическая. Положим , \ , / \ 4>{п,у) = g ' Очевидно, что (р(х9у) — билинейная форма, причем уже симметрическая. Из формулы (6.12) следует соотношение (6.11), как и утверждалось. Докажем теперь, что если для некоторой симметрической билинейной формы (р(х,у) верно соотношение (6.11), то (р(х,у) однозначно определяется квадратичной формой ф(х). Для этого вычислим ф(х + у). По условию и согласно свойствам билинейной формы (р, мы имеем: ф(х + у) = (р(х + у,х + у) = (р(х,х) + <р(у,у) + <р(х,у) + (р(у,х). (6.13) Ввиду симметричности формы (р мы имеем ф{х + у)= ф(х) + ф(у) + 2(р(х, у), и, значит, <^(ж> У) = g (^(ж + У)~ ^(ж) - Ф(У)) • (6-14) Последнее соотношение и определяет (однозначно) билинейную форму (р(х,у) по заданной квадратичной форме ф{х). При тех же предположениях для антисимметрических форм имеет место следующий результат: Теорема 6.3. Для любой антисимметрической билинейной формы (р(х,у) на пространстве L над полем К отличной от 2 характеристики выполнено равенство <р(х,х) = 0. (6.15) Наоборот, если равенство (6.15) выполнено для любого вектора х е Ц то билинейная форма ср(х,у) — антисимметрическая. Доказательство. Если форма <р(х,у) антисимметрическая, то, переставив аргументы в выражении (р(х,х), мы придем к соотношению (р(х,х) = = —(р(х,х), а тогда 2(р(х,х) = 0, откуда следует равенство (6.15), так как,
202 Гл. 6. Квадратичные и билинейные формы по условию теоремы, поле К имеет отличную от 2 характеристику. Наоборот, если <р(х,х) = 0 для любого вектора х Е L, то это верно, в частности, и для вектора х + у, т. е. мы получаем (р(х + у,х + у) = ф(х, х) + (р(х, у) + ср(у, х) + (р(у, у) = 0. Так как по предположению теоремы, ср(х,х) — (р{у,у) = 0, то отсюда следует равенство (р(х,у) + (р(у,х) = 0, означающее, что билинейная форма <р(х,у) — антисимметрическая. Заметим, что установленная теоремой 6.2 запись квадратичной формы ф(х) в виде (6.11), где (р(х,у) — симметрическая билинейная форма, показывает нам, как нужно записывать подобные члены в представлении (6.1). Действительно, если векторы х = ххе\ Л Ь хпеп, у = у{е\ Н Ь упеп и <р(х,у) — билинейная форма, то п г, j=l где <pij = (p(ei, ej). Симметричность формы (р(х, у) означает, что щ^ = tpji для всех i,j = l,...,n. Тогда запись п ф(х{, ... , Хп) = ^ (fij XiXj ij=l содержит одинаковые подобные члены ipijXiXj и (pjiXjXi при г ф j. To есть, если г ф j, то член с XiXj встречается в сумме дважды: как (pijXiXj и как (PjiXjXi. Так как щ = (fji, то после приведения подобных членов он записывается в виде 2(fiijXiXj. Например, коэффициенты квадратичной формы х\ + x\x<i + x\ равны ^11 = 1» ^22 = 1 и ф\ч — (р2\ = 1/2. Такая, на первый взгляд, странная, запись имеет, как мы скоро увидим, много преимуществ. § 6,2. Приведение к каноническому виду Основная цель этого параграфа — приведение квадратичной формы к наиболее простому виду, называемому каноническим. Как и в случае с матрицей линейного преобразования, это достигается за счет выбора специального базиса в векторном пространстве. А именно, требуемый базис должен обладать тем свойством, что матрица симметрической билинейной формы, соответствующей данной квадратичной форме, имеет в нем диагональный вид. Это свойство непосредственно связано с важным понятием ортогональности, которое будет неоднократно использоваться в этой и следующих главах. Заметим, что понятие ортогональности может быть сформулировано и имеет смысл для любой билинейной формы, не обязательно симметрической, но особенно просто оно определяется для симметрических и антисимметриче-
6.2. Приведение к каноническому виду 203 ских билинейных форм. В этом параграфе мы будем рассматривать только симметрические билинейные формы. Итак, пусть на конечномерном векторном пространстве L задана симметрическая билинейная форма (р(х,у), Определение. Векторы х и у называются ортогональными, если (р(х,у) =0. Заметим, что в силу условия симметричности ip{y,x) — <р(х,у), и поэтому равенство ср(х, у) = 0 эквивалентно <^(у, х) = 0. Последнее справедливо также и для антисимметрических билинейных форм. Если же на форму не накладывать условия симметричности или антисимметричности, то вектор х может оказаться ортогонален вектору у, в то время как вектор у не будет ортогонален вектору х. Это приводит к понятиям левой и правой ортогональности и очень красивой геометрии, но выходит за рамки нашей книги. Вектор х е L называется ортогональным подпространству L;c L относительно <р, если он ортогонален каждому вектору у е L/, т. е. выполнено равенство (р(х, у) = 0 для всех у е L'. Из определения билинейности сразу следует, что совокупность всех векторов ж, ортогональных подпространству L' относительно данной билинейной формы (р, является подпространством в L. Оно называется ортогональным дополнением подпространства L/ относительно формы ср и обозначается (L')£. В частности, при L' = L пространство (L)£ представляет собой совокупность векторов х е L, для которых выполнено равенство (р(х,у) = 0 при всех у е L. Это подпространство называется радикалом билинейной формы (р(х,у). Из определения билинейной формы сразу вытекает, что радикал состоит из таких векторов х Е L, что (p(x,ei) = 0 для всех г=1,...,п, (6.16) где ei,...,en — произвольный базис пространства L. Равенства (6.16) представляют собой линейные однородные уравнения, задающие радикал как подпространство в L. Записав разложение вектора х по выбранному базису, т. е. в виде х = х\е\ -\ (- хпеп, мы в силу формулы (6.4) получим из равенств (6.16) систему линейных однородных уравнений относительно неизвестных #1,... ,хп. Матрица этой системы совпадает с матрицей Ф билинейной формы у? в базисе ei,...,en. Таким образом, пространство (L)£ удовлетворяет условиям примера 3.26, рассмотренного в § 3.5 (с. 122). Следовательно, dim(L)^ = = п — г, где г — ранг матрицы линейной системы, т. е. ранг билинейной формы (р. Таким образом, мы получаем равенство r = dimL-dim(L)^. (6.17) Теорема 6.4. Пусть V с L — такое подпространство, что ограничение билинейной формы <р(ж, у) на L7 является невырожденной билинейной формой. Тогда имеет место разложение L = L'® (L/); (6.18)
204 Гл. 6. Квадратичные и билинейные формы Доказательство. Прежде всего отметим, что, согласно условиям теоремы, пересечение L7 П (L7)^ — (0). Действительно, оно состоит из таких векторов х G L7, что (р(х,у) = 0 для всех у El!, г значит, только из нулевого вектора, так как, по условию, ограничение (р на подпространство L7 является невырожденной билинейной формой. Таким образом, нам достаточно доказать, что L7 + (L7)^ = L. Мы приведем два доказательства этого факта, чтобы продемонстрировать разные типы рассуждений, используемые в теории векторных пространств. Первое доказательство. Воспользуемся построенным в теореме 6.1 линейным преобразованием я/: I —> L*, соответствующим билинейной форме ср. Сопоставляя каждой линейной функции на L ее ограничение на подпространство L7 с L, мы получим линейное преобразование &: L* —► (L/)*. Выполняя последовательно преобразования я/ и SS, мы получим в результате линейное преобразование <€ = 3esrf\ I —> (L7)*. Ядро Li преобразования ^ состоит из таких векторов у Е L, что <р(х, у) = 0 для всех х Е L7, так как, по определению, (р(х,у) = (х,я/(у)). Значит, Ц = = (L7)^. Покажем, что образ L2 преобразования ^ совпадает со всем пространством (L7)*. Докажем даже более сильное утверждение: любой вектор и Е (L7)* может быть представлен в виде и = ^{v), где v E L7. Для этого мы должны рассмотреть ограничение преобразования ^ на подпространство 1Г. По определению, оно совпадает с преобразованием srf'\ I' —> (L7)*, построенным в теореме 6.1, которое соответствует ограничению билинейной формы (р на L/. По условию, ограничение формы <р на L7 невырождено, а значит, преобразование s/f является изоморфизмом. Отсюда, в частности, следует, что его образ совпадает со всем пространством (L7)*. Теперь воспользуемся теоремой 3.13 и применим соотношение (3.47) к преобразованию &. Мы получим, что diml_i + dimL-2 = dimL Так как 1_2 = (L7)*, то, по теореме 3.14, diml_2 — dimL7. Вспоминая также, что Ц = (L7)^, окончательно мы имеем равенство dim(L7)^ + dim L7 = dim L. (6.19) Поскольку L7n(L7)^ = (0), то согласно следствию из леммы § 3.1 (с. 95), мы заключаем, что L7 + (L7)^ = L7 © (L7)^. Из теорем 3.1, 3.3 и соотношения (6.19) тогда следует, что L7 © (L7)^ = L. Второе доказательство. Нам нужно представить произвольный вектор х Е I в виде х = и + v, где и Е I' и v E (L7)^. Это, очевидно, равносильно условию х — и Е (L7)^, и значит, условию (р(х — и, у) = О для всех у Е L7. Вспоминая свойства билинейной формы, мы видим, что достаточно, чтобы последнее равенство было выполнено для векторов у = е$, г = 1,...,г, где ei,...,er — некоторый базис пространства L7. Ввиду билинейности формы (р наши соотношения можно переписать в виде (р(и,si) = <p(x,вг) для всех г=1,...,г. (6.20)
6.2. Приведение к каноническому виду 205 Представим вектор и как и — х\е\ + • • • + хгег. Соотношения (6.20) дают систему из г линейных уравнений <p(e\,ei)x\ Н t-(p(er,ei)xr = <р(ж,е*), г = 1,...,г, (6.21) с неизвестными х\,...,хг. Матрица системы (6.21) имеет вид / \ <p(ei,e\) ■■■ (p(ei,er) Ф= : .. : l<^(er,ei) ••• <p(er,er) \ ) Но легко видеть, что Ф — это матрица ограничения билинейной формы <р на подпространство L', записанная в базисе е\,...,ег. Поскольку по условию такая форма невырождена, то невырождена и ее матрица, и значит, система уравнений (6.20) разрешима. Иными словами, найдется вектор и Е L7, удовлетворяющий всем соотношениям (6.20), что доказывает наше утверждение. Эти соображения, относящиеся к билинейным формам, мы применим теперь в теории квадратичных форм. Нашей целью будет найти базис, в котором матрица заданной квадратичной формы ф(х) имеет наиболее простой вид. Теорема 6.5. Для любой квадратичной формы ф(х) существует базис, в котором она записывается в виде ф(х) = \хх\ + • • • + Хпх2п, (6.22) где х\,... ,хп — координаты вектора х в этом базисе. Доказательство. Пусть ср(х,у) — симметрическая билинейная форма, связанная с квадратичной формой ф(х) формулой (6.11). Если ф(х) тождественно равна нулю, то теорема очевидно верна (при Ai = • • • = Лп = 0). Если квадратичная форма ф(х) не равна тождественно нулю, то существует вектор ei, для которого ф{е\) ф 0, т. е. (р(е\, е\) ф 0. Это значит, что ограничение билинейной формы tp на подпространство L7 — (ei) невырождено, поэтому согласно теореме 6.4, для подпространства L7 = (ei) имеет место разложение (6.18), т.е. L = (ei) © (ei)^. Так как dim(ei) = 1, то, согласно теореме 3.3, отсюда получаем dim(ei)^ = п — 1. Рассуждая по индукции, мы можем считать теорему доказанной для пространства (ei)£. Значит, в этом пространстве существует такой базис е2,... ,еп, что (p(ei,ej) = 0 при всех г ф j, i,j ^ 2. Тогда в базисе пространства L квадратичная форма ф(х) записывается в виде (6.22) с некоторыми Аь..., Ап. Отметим, что одна и та же квадратичная форма ф может иметь вид (6.22) в различных базисах, и при этом числа Ai,...,An в разных базисах могут отличаться. Например, если в одномерном пространстве, базис которого состоит из одного ненулевого вектора е, определить квадратичную форму ф условием ф(хе) — х2, то в базисе, состоящем из вектора ег = Ае, А ф 0, она будет записываться в виде ф{хе') = (Хх)2.
206 Гл. 6. Квадратичные и билинейные формы Если в некотором базисе квадратичная форма записывается в виде (6.22), то говорят, что она имеет в нем канонический вид. Теорема 6.5 называется теоремой о приведении квадратичной формы к каноническому виду. Из сказанного выше следует, что приведение квадратичной формы к каноническому виду неоднозначно. Если в базисе ei,...,en пространства L квадратичная форма ф(х) имеет вид, установленный теоремой 6.5, то ее матрица в этом базисе равна Ф (М о ... о\ 0 А2 ••• 0 \0 0 .. \J (6.23) Очевидно, что ранг матрицы Ф равен числу отличных от нуля значений среди Ль..., Л^. Как мы видели в предыдущем параграфе, ранг матрицы Ф (т. е. ранг квадратичной формы ф{х)) не зависит от выбора базиса, в котором записывается матрицы Ф, поэтому это число будет одним и тем же для всех базисов, для которых имеет место теорема 6.5. Полученные результаты полезно записать в матричной форме. Применяя выведенную в предыдущем параграфе формулу (6.10) замены матрицы билинейной формы при изменении базиса, мы можем сформулировать теорему 6.5 иначе: Теорема 6.6. Для любой симметрической матрицы Ф существует такая невырожденная матрица С, что матрица С*ФС — диагональная. При этом, выбирая разные матрицы С, мы можем получать и различные диагональные матрицы С*ФС, но число отличных от нуля элементов, стоящих на главной диагонали, всегда будет одно и то же. Совершенно аналогичные рассуждения применимы к случаю антисимметрических билинейных форм. Аналогом теоремы 6.5 для них является следующая Теорема 6.7. Для каждой антисимметрической билинейной формы (р(х,у) существует базис е\,...,еп, первые 2г векторов которого можно объединить в такие пары {e,2i-\,e>2i)> г = 1,...,г, что ^(е2г-1,е2г) = 1, (р(е2ие2г-\) = -1 для всех г=1,...,г, (р(е{, ej) = 0, если \г — j\ > 1 или г > 2г, или j > 2г. Таким образом, в данном базисе матрица билинейной формы <р приобретает вид:
6.2. Приведение к каноническому виду 207 Ф / о 1 -1 О \о 0 1 1 О О 1 ■1 О о \ (6.24) о/ Доказательство этой теоремы в точности параллельно доказательству теоремы 6.5. Если (р(х,у) = О для всех ж и у, то утверждение теоремы очевидно (при г = 0). Если же это не так, то существуют два вектора е\ и ег, для которых ^(вр ег) = ос ф 0. Полагая ei = a~le\, мы получим, что <p(e\,e2) = 1. Матрица формы </?, ограниченной на подпространство L'= (еьег), в базисе еьв2 имеет вид (-? J) • <6-25> и следовательно, она невырождена. Тогда на основании теоремы 6.4 мы получаем разложение L = L' © (L')£, при этом dim(L/)^ = п — 2, где п = dim L. Рассуждая по индукции, мы можем считать теорему доказанной для формы (р, определенной на пространстве (L;)£. Если /i,...,/n_2 "" так°й базис пространства (L7)^, существование которого утверждает теорема 6.7, то очевидно, что ei,e2,/i,..., fn-2 ~ это и есть нужный нам базис исходного пространства L. Число п — 2г равно размерности радикала билинейной формы (р и следовательно, одно и то же для всех базисов, в которых матрица билинейной формы (р приводится к виду (6.24). Ранг матрицы (6.25) равен 2, а матрица (6.24) содержит г таких блоков на главной диагонали, поэтому ранг матрицы (6.24) равен 2г. Таким образом, из теоремы 6.7 мы получаем следующее Следствие. Ранг антисимметрической билинейной формы — четное число. Теперь сформулируем все, что мы доказали для антисимметрических билинейных форм, на языке матриц. Здесь утверждения будут такими же, как и для симметрических матриц, и доказываются они точно так же. Мы получаем, что для любой антисимметрической матрицы Ф существует такая невырожденная матрица С, что матрица ф' = С*ФС (6.26) имеет вид (6.24). Матрицы Ф и Ф', связанные между собой соотношением (6.26) с некоторой невырожденной матрицей С, называются эквивалентными. Этот же термин
208 Гл. 6. Квадратичные и билинейные формы применяется к соответствующим этим матрицам (при выборе определенного базиса) квадратичным формам. Легко проверить, что введенное таким образом понятие действительно является отношением эквивалентности на множестве квадратных матриц заданного порядка или же на множестве квадратичных форм. Свойство рефлексивности очевидно — нужно лишь положить в формуле (6.26) матрицу С = Е. Умножая обе части равенства (6.26) справа на матрицу В = С~1 и слева — на матрицу £?*, с учетом соотношения (С-1)* = (С*)-1 мы получим равенство Ф = В*Ф'В, устанавливающее свойство симметричности. Наконец, проверим свойство транзитивности. Пусть нам даны соотношения (6.26) и Ф" = D*<&'D с некоторыми невырожденными матрицами С и D. Тогда, подставляя первое из них во второе, мы получаем равенство ф// _ £)*(7*ФСТ>. Положив В = CD, с учетом соотношения В* = £)*С* мы получаем равенство Ф" = В*Ф В, которое и означает эквивалентность матриц Ф и Ф". Теперь можно переформулировать теоремы 6.5 и 6.7 следующим образом: Теорема 6.8. Всякая симметрическая матрица эквивалентна диагональной. Теорема 6.9. Всякая антисимметрическая матрица Ф эквивалентна матрице вида (6.24), где число г равно половине ранга матрицы Ф. Из теорем 6.8 и 6.9 следует, что как все симметрические, так и все антисимметрические матрицы, эквивалентные друг другу, имеют одинаковый ранг, а для антисимметрических матриц эквивалентность равносильна равенству их рангов. В заключение отметим, что все исследованные в этом параграфе понятия можно выразить иначе, используя запись билинейных форм, которую дает теорема 6.1. Согласно этой теореме каждая билинейная форма <р(х,у) на пространстве L может быть единственным образом записана в виде (р(х,у) = = (х,д/(у)), где si: L —► L* — некоторое линейное преобразование. Как было показано в § 6.1, симметричность формы <р равносильна тому, что #i* = si, а антисимметричность — тому, что si* = — si. В первом случае преобразование si называется симметрическим, во втором — антисимметрическим. Таким образом, теоремы 6.5 и 6.7 равносильны следующим утверждениям. Для любого симметрического преобразования si существует такой базис пространства L, в котором матрица этого преобразования имеет диагональный вид (6.23). Аналогично, для любого антисимметрического преобразования si существует такой базис пространства L, в котором матрица этого преобразования имеет вид (6.24). Точнее говоря, в обоих утверждениях речь идет о выборе базиса в L и взаимного ему базиса в L*, поскольку преобразование si действует из L в L*. § 6.3. Комплексные, вещественные и эрмитовы формы Сначала рассмотрим квадратичную форму ф в комплексном пространстве L. Согласно теореме 6.5 в некотором базисе ei,...,en она записывается
6.3. Комплексные, вещественные и эрмитовы формы 209 ф{х) = \ix\ + -- + \nxl,, где х\,...,хп — координаты вектора х в этом базисе. Это значит, что для соответствующей ей симметрической билинейной формы (р{х,у) значение (p(ei, Bj) = 0 при г ф j и (p(ei, е$) = А*. При этом число значений А;, отличных от нуля, равно рангу г билинейной формы <р. Изменяя нумерацию векторов базиса, мы можем считать, что А; Ф 0 при г < г и А^ = 0 при г > г. Тогда можно ввести новый базис е\,... ,е'п, положив ei = V^i ег прИ i ^ r> ei = ег ПРИ i > Г, так как л/\1 — опять комплексное число. В новом базисе <^(е^,е') = 0 при всех г ф j и (р(е[,е[) = 1 при г ^ г, ¥>(ej,ej) = 0 при г > г. Это значит, что квадратичная форма ф(х) записывается в таком базисе в виде ф(х)=х2{ + --- + х2г, (6.27) где х\,... ,хТ — первые г координат вектора х. Таким образом, мы видим, что в комплексном пространстве L любая квадратичная форма приводится к каноническому виду (6.27), и все квадратичные формы (а также симметричные матрицы) одного ранга эквивалентны. Рассмотрим теперь случай вещественного векторного пространства L. Согласно теореме 6.5 любая квадратичная форма ф опять записывается в виде ф(х) = \\x\-\ Ь Хгх% где все А; ф 0, а число г — ранг формы ф. Но теперь мы не можем поступить так просто, как в комплексном случае, положив е[ — л/Xi е*, так как при Аг < 0 из числа А^ не извлекается вещественный квадратный корень. Поэтому мы должны разделить числа Ai,...,Ar на положительные и отрицательные. Опять изменив нумерацию векторов базиса, мы можем предполагать, что Ai,...,As — положительные, a As+i,...,Ar — отрицательные. Теперь мы можем ввести новый базис, положив ei = V^4 при г ^ s, е[ = у/—Хг при г = s + 1,..., г, е'г = е* при г > г. В таком базисе для билинейной формы <р мы будем иметь: (р{е[,е^) =0 при г ф j и <p(ej,e£) = 1 при г= l,...,s, (р{е[,е[) = -1 при г = s + 1,... ,г, и квадратичная форма ф тем самым будет приведена к виду ф(х) = х\ + • • • + х\ - х2+1 х\. (6.28) Отметим один важный частный случай. Определение. Вещественная квадратичная форма ф(х) называется положительно определенной, если ф{х) > 0 для любого х ф 0, и отрицательно определенной, если ф(х) < 0 для любого х ф 0. Очевидно, что эти понятия связаны между собой простым отношением: отрицательная определенность формы ф(х) равносильна положительной определенности формы —ф(х), и наоборот. Поэтому в дальнейшем нам достаточно будет установить основные свойства только положительно опреде-
210 Гл. 6. Квадратичные и билинейные формы ленных форм, а соответствующие свойства отрицательно определенных форм при этом будут получены автоматически. Записанная в виде (6.28) квадратичная форма на n-мерном векторном пространстве будет положительно определенной, если s = n, и отрицательно определенной, если s = 0 и г = п. Основное свойство вещественных квадратичных форм — это следующая Теорема 6.10. Для любого базиса, в котором вещественная квадратичная форма ф приводится к виду (6.28), число s имеет одно и то же значение. Доказательство. Дадим характеристику числа s, не зависящую от приведения квадратичной формы ф к виду (6.28). А именно, докажем, что s равно максимальной размерности такого подпространства L' с L, что ограничение ф на L' является положительно определенной квадратичной формой. Для этого прежде всего заметим, что для любого базиса, в котором форма приобретает вид (6.28), можно найти подпространство L' размерности s, ограничение формы ф на которое дает положительно определенную форму. А именно, если форма ф{х) записывается в виде (6.28) в базисе ei,...,en, то положим L7 = (ei,...,es). Очевидно, что ограничение формы ф на L' дает положительно определенную квадратичную форму. Аналогично можно рассмотреть множество векторов 1_/;, для которых в разложении (6.28) первые s координат равны нулю: х\ = 0,... ,xs = 0. Очевидно, что это множество — векторное подпространство L" = (es+i,es+2,... ,еп), и для любого вектора х е L" выполнено неравенство ф{х) < 0. Предположим, что существует подпространство М с L размерности т > 5, ограничение ф на которое дает положительно определенную квадратичную форму. Тогда, очевидно, dimM + dimL" = m + n — s>n. По следствию теоремы 3.16, подпространства М и L" должны иметь общий вектор ж^О. Но так как х е L", то ф(х) ^ 0, а так как х е М, то ф{х) > 0. Полученное противоречие завершает доказательство теоремы. Определение. Число s, которое, согласно теореме 6.10, одинаково при всех способах приведения квадратичной формы к виду (6.28), называется индексом инерции квадратичной формы ф. В связи с этим теорему 6.10 часто называют законом инерции. Важным типом квадратичных форм являются положительно определенные формы. Если следовать изложенной теории, то для того, чтобы установить, будет ли квадратичная форма положительно определенной, нам нужно привести ее к каноническому виду и проверить, выполнено ли соотношение s — п. Однако существует признак, позволяющий узнать это по матрице соответствующей билинейной формы, записанной в произвольном базисе. Пусть эта матрица в базисе е\,... ,ете имеет вид ф = {щ), где <pij = <p(ei9 ej). Минор Д$ матрицы Ф, находящийся на пересечении первых г строк и первых г столбцов, называется угловым.
6.3. Комплексные, вещественные и эрмитовы формы 211 Теорема 6.11 (критерий Сильвестра). Квадратичная форма ф является положительно определенной тогда и только тогда, когда все угловые миноры матрицы соответствующей билинейной формы положительные. Доказательство. Покажем, что если квадратичная форма является положительно определенной, то все А; > 0. Прежде всего заметим, что Ап — |Ф| — это определитель матрицы формы <р. В некотором базисе форма ф приводится к каноническому виду, т. е. ее матрица в этом базисе имеет вид /Ai 0 ... 0\ , О Л2 • • • 0 ф — . . • \6 о ... \J Так как квадратичная форма ф — положительно определенная, то все А; > 0, и очевидно, |Ф'| > 0. Ввиду формулы (6.26) замены матрицы билинейной формы при замене базиса и равенства \С*\ = \С\ мы получаем соотношение |Ф'| = |Ф| • |С|2, из которого следует, что Ап = |Ф| > 0. Рассмотрим теперь подпространства Ц = (еь ..., е$) С L размерности г ^ 1. Ограничение квадратичной формы ф(х) на Ц, очевидно, тоже положительно определенная форма. Но определитель ее матрицы в базисе ei,...,e^ равен Д$. Поэтому А^ > 0, как мы доказали. Докажем теперь, что, наоборот, из условия Д$ > 0 для всех г = 1,...,п следует, что квадратичная форма ф положительно определенная. Это будет доказано индукцией по размерности п пространства L. Очевидно, что Ц С L при г — 1,... ,п — 1, и угловые миноры Д* в базисе ei,...,en для матрицы ограничения формы ф на подпространство Ц те же, что и для формы <р в L. Поэтому ограничение квадратичной формы ф на Ln_i по индукции может считаться положительно определенной. Следовательно, ограничение ср(х,у) на подпространство Ln_i является невырожденной билинейной формой, поэтому, согласно теореме 6.4, имеет место разложение L = Ln_i 0 (Ln_i)£, где dimLn_i = п - 1 и dim(Ln_i)^ = 1. Таким образом, мы можем представить вектор еп в виде еп = fn + У> гДе У € U-ь fn ^ (Ln-i)J- (6.29) Любой вектор х G L представим в виде линейной комбинации векторов базиса ei,...,en, т.е. в виде х = х\е\ Л \-хп-\еп-\ + хпеп = и + хпеп, где и е \-n~\- Подставляя сюда выражение (6.29) и полагая и + хпу = v, мы получим x = v + xnfn, где veU-L /nG(Ln_i)J. (6.30) Последнее означает, что векторы v и fn ортогональны относительно билинейной формы ср, т.е. ip(v,fn) = 0, и следовательно, из разложения (6.30) вытекает равенство il>(x) = tl>(v)+a*rl>(fn)- (6-31)
212 Гл. 6. Квадратичные и билинейные формы Таким образом, мы видим, что в базисе ei,...,en_i,/n матрица билинейной формы ю имеет вид ( — ° ^ II I ' о V о ••• о ^(/j/ и для ее определителя Dn мы получаем выражение Dn — |Ф'| • i/>(fn). Поскольку Dn > 0 и |Ф7| > 0, то отсюда следует, что ip(fn) > 0. Согласно предположению индукции, в формуле (6.31) слагаемое ip(v) > 0, и следовательно, ф(х) > 0 при каждом х ф О. Пример 6.1. Критерий Сильвестра имеет красивое применение к свойствам алгебраических уравнений. Рассмотрим многочлен /(£) степени п с вещественными коэффициентами, про который мы будем предполагать, что его корни (вещественные или комплексные) z\,...,Zn различны. Для каждого корня Zk рассмотрим линейную форму 1к{х) = х\ + x2zk Н Ь xnz%~1, (6.32) а также квадратичную форму п ф(х) = ^2ll{xi,...9xn), (6.33) *=1 где х = (ж1,...,жп). Хотя среди корней Zk могут быть и комплексные, квадратичная форма (6.33) всегда вещественная. Это очевидно для слагаемых l\, соответствующих вещественным корням z^. Что же касается комплексных корней, то они, как известно, входят парами — комплексный корень и ему сопряженный. Пусть Zk и zj — комплексно-сопряженные. Отделяя в коэффициентах линейной формы Ik вещественную и мнимую часть, мы можем записать ее в виде h = ик + ivk, где щ н Vk — линейные формы с вещественными коэффициентами. Тогда lj = Uk — ivk, и для этой пары комплексно-сопряженных корней сумма l\ +12- = 2и\ — 2v\ — вещественная квадратичная форма. Таким образом, квадратичная форма (6.33) вещественная, и имеет место следующий важный критерий: Т е о р е м а 6.12. Все корни многочлена f(t) тогда и только тогда вещественны, когда квадратичная форма (6.33) положительно определенная. Доказательство. Если все корни Zk вещественные, то вещественны все линейные формы Ik из (6.32), и сумма в правой части формулы (6.33) содержит только неотрицательные слагаемые. Очевидно, что она равна нулю, только если h = 0 для всех к = 1,... ,п. Это условие дает нам систему, состоящую из п линейных однородных уравнений с п неизвестными х\,...,хп. Из формулы (6.32) легко видеть, что определитель матрицы этой системы является уже известным нам определителем Вандермонда, см. формулы (2.32) и
6.3. Комплексные, вещественные и эрмитовы формы 213 (2.33). Он отличен от нуля, так как все корни Zk различные, и таким образом, эта система имеет только нулевое решение. Значит, ф(х) )0 и ф(х) = О, если и только если ж = 0, т. е. квадратичная форма (6.33) положительно определенная. Докажем теперь обратное утверждение. Пусть квадратичная форма (6.33) положительно определенная, и многочлен /(£) имеет г вещественных корней и р пар комплексных корней, так что г + 2р = п. Тогда, как мы видели, V^) = ^ + 2j>5-^2), (6.34) fc=i j=\ где первая сумма распространена на все вещественные корни, а вторая — на все пары комплексно сопряженных корней. Покажем, что если р > О, то найдется такой вектор х ф О, для которого 1\ (ж) = 0, ..., 1г{х) = О, щ (ж) = 0, ..., ир(х) = 0. Эти равенства представляют собой систему г + р линейных однородных уравнений от п неизвестных х\,... ,хп. Так как число уравнений г+р<г + 2р = п, то эта система имеет ненулевое решение х = (х\,... ,хп), для которого квадратичная форма (6.34) принимает вид р #г) = -2]Г^0, .7=1 причем равенство ф(х) = 0 возможно только тогда, когда Vj(x) = 0 для всех j = 1,...,р. Но тогда мы получаем равенства ^(ж) = 0 вообще для всех линейных форм из (6.32), что в силу положительной определенности возможно лишь при ж = 0. Таким образом, мы получили противоречие с тем, что р > 0, т.е. что многочлен /(*) имеет хотя бы один комплексный корень. Форму (6.33) можно вычислить в явном виде, а потом применить к ней критерий Сильвестра. Для этого заметим, что коэффициент при мономе х\ в правой части (6.33) равен $2(/с-1) = z\ H + zn ~ , а коэффициент при мономе XiXj (где г ф j) равен 2^+j_2 = 2(zj+J'~ H + £n+J~ )• Суммы п ^fc — J2 zi называются суммами Ньютона. Из теории симметрических функ- ций известно, что они выражаются как многочлены от коэффициентов /(£). Таким образом, матрица симметрической билинейной формы, соответствующей квадратичной форме (6.33), имеет вид / SQ S\ -•- Sn-l\ I 5i S2 '•• Sn \ \Sn-l 5n *•• S2n-2/ Применяя к форме (6.33) критерий Сильвестра, мы получаем следующий результат: все (различные) корни многочлена f(i) вещественные тогда
214 Гл. 6. Квадратичные и билинейные формы и только тогда, когда выполняются неравенства 50 51 51 52 5г-1 5г > 0 |5г-1 Si ••• S2i-2\ для всех г = 1,... ,п — 1. Для иллюстрации этого утверждения рассмотрим простейший случай п = 2. Пусть /(£) = t2 + pt + q. Тогда тот факт, что корни многочлена /(*) вещественны и различны, равносилен двум неравенствам: 50 >0, 50 51 51 52 >0. (6.35) Первое из них выполнено для любого многочлена, так как sq — это просто его степень. Если корни многочлена /(*) равны а и /3, то s0 = 2, s{ = а + /3 = -р, 52 = а2 + /З2 = (а + /З)2 - 2а/3 = р2 ■2q, и неравенство (6.35) дает 2(р2 — 2q) —p2=p2 (6.36) Aq > 0. Это известный еще из школы признак: корни квадратного трехчлена вещественны и различны тогда и только тогда, когда его дискриминант положителен. Теперь мы вернемся к комплексным векторным пространствам и рассмотрим в них некоторые функции, являющиеся более естественным аналогом билинейных и квадратичных форм, чем рассмотренные в начале параграфа. Определение. Функция f(x), определенная на комплексном векторном пространстве L и принимающая комплексные значения, называется полулинейной, если она обладает следующими свойствами: f(x + y) = f(x) + f(y), f(ax) = af(x), для любых векторов х и у пространства L и любого комплексного числа а (здесь и далее а обозначает число, комплексно сопряженное а). Очевидно, что при любом выборе базиса ei,...,en пространства L полулинейная функция записывается в виде f(x) =х\у\ Н \-хпуп, где вектор х = х\е\ -\ \- хпеп и числа у; = /(е*). Определение. Функция (р(х,у) от двух векторов комплексного векторного пространства L называется полуторалинейной, если она линейная как функция х при фиксированном у и полулинейная как функция у при фиксированном ж. Название «полуторалинейная» происходит от соединения «полной» линейности по первому аргументу и полулинейности по второму. Полулинейные и полуторалинейные функции также часто называют формами. Далее мы будем тоже использовать это название.
6.3. Комплексные, вещественные и эрмитовы формы 215 Очевидно, что при любом выборе базиса ei,...,en пространства L полуторалинейная форма записывается в виде п (р(х,у) = ^Г УгзхгУу гДе 4>%j = ^(ei,e7-), (6.37) векторы х = х\е\ + - - - + хпеп и у = у\е\ + • • • + упеп. Как и в случае билинейной формы, матрица Ф = (^) с определенными выше элементами <Pij = (p(ei,ej) называется матрицей полуторалинейной формы (р(х,у) в выбранном базисе. Определение. Полуторалинейная форма (р(х,у) называется эрмитовой, если (р(у,х) = <р(х,у) (6.38) для любых векторов х и у. Очевидно, что в записи (6.37) эрмитовость формы (р(х,у) выражается свойством (fij = Tpjl коэффициентов <pij ее матрицы Ф, т. е. соотношением Ф = Ф . Матрица, обладающая этим свойством, также называется эрмитовой. Отделив вещественную от мнимой части в <р(х,у), мы получим (р(х, у) = и{х, у) + iv(x, у), (6.39) где и(х,у) и v(x,y) — функции двух векторов х и у комплексного пространства L, принимающие вещественные значения. В пространстве L, в частности, определено и умножение на вещественные числа, так что оно может рассматриваться и как вещественное векторное пространство. Это вещественное пространство мы будем обозначать через Lr. Очевидно, что на пространстве Lr функции и(х,у) и v(x,y) билинейны. Свойство же эрмитовости комплексной формы <р(х,у) обозначает, что на Lr билинейная форма и(х,у) — симметрическая, a v(x,y) — антисимметрическая. Определение. Функция ф(х) на комплексном пространстве L называется квадратично-эрмитовой, если она может быть представлена в виде <ф(х) = tp(x,x) (6.40) при некоторой эрмитовой полуторалинейной форме ср(х,у). Из определения эрмитовой формы сразу следует, что значения квадратично-эрмитовой функции вещественны. Т е о р е м а 6.13. Квадратично-эрмитова функция ф(х) однозначно определяет эрмитову полуторалинейную форму <р(х,у) в представлении (6.40). Доказательство. По определению полуторалинейности имеем ф{х + у) = ф(х) + ф(у) + (р(х, у) + (р(х, у). (6.41)
216 Гл. 6. Квадратичные и билинейные формы Подставляя сюда выражение (6.39), мы получаем, что и(х9 у) = - (ф(х + у)- ф(х) - ф(у)). (6.42) Аналогично, из соотношения ф{х + iy) = ф(х) + ф(гу) + <р(х, iy) + <р(гу, х) (6.43) по свойствам эрмитовости и полуторалинейности получаем (р(х, гу) = -i(p(x, у), <p(iy, x) = tp(x, iy), что дает . v(x, у) = - {ф{х + iy) - ф(х) - ф(гу)). (6.44) Полученные выражения (6.42) и (6.44) и доказывают теорему. Теорема 6.14. Полуторалинейная форма <р(х,у) является эрмитовой тогда и только тогда, когда связанная с ней соотношением (6.40) функция ф(х) принимает только вещественные значения. Доказательство. Если полуторалинейная форма у(ж,у) эрмитова, то в силу определения (6.38) мы имеем равенство ip(x,x) = <p(x,x) для всех х е L, откуда следует, что для любого вектора х е L значение ф(х) — вещественное число. Если же значения функции ф(х) вещественны, то, рассуждая в точности так же, как и при доказательстве теоремы 6.13, из формулы (6.41) с учетом (6.38) мы получим, что значение ф{х + у) - ф{х) - ф(у) = <р(х, у) + <р(у, х) вещественно. Подставляя сюда выражение (6.39), мы видим, что сумма v(x,y) +v(y,x) = 0, т.е. функция v(x,y) — антисимметрическая. Рассуждая аналогичным образом, из формулы (6.43) заключаем, что значение ф(х + iy) - ф{х) - ф(гу) = <р(х, iy) + <р(гу, х) тоже вещественно. Из определения полу- и полуторалинейности вытекают соотношения (p(iy,x) =i<p(y,x) и (p(x,iy) = —i(p(x,y). Таким образом, мы получаем, что число i((p(y,x)-<p(x,y)) вещественно, что с учетом выражения (6.39) дает равенство и(у, х) — и(х, у) = 0, т.е. функция и(х,у) — симметрическая. Следовательно, форма <р(х,у) — эрмитова. Эрмитовы формы — это самый естественный комплексный аналог симметрических форм. Для них верны (и совершенно так же доказываются) аналоги выведенных нами свойств симметрических форм в вещественных пространствах: приведение к каноническому виду, закон инерции, понятие положительной определенности и критерий Сильвестра.
Глава 7 ЕВКЛИДОВЫ ПРОСТРАНСТВА Понятия, входящие в определение векторного пространства, не дают возможности сформулировать многомерные аналоги длины вектора, угла между векторами и объема. Между тем, подобные понятия возникают во многих разделах математики и физики. В этой главе мы их исследуем. Все векторные пространства, которые мы будем здесь рассматривать, будут вещественными (за исключением специально оговоренных случаев, когда комплексные пространства рассматриваются как средство исследования вещественных). § 7.1. Определение евклидова пространства Определение. Евклидовым пространством называется вещественное векторное пространство с фиксированной симметрической билинейной формой на нем, такой, что соответствующая ей квадратичная форма положительно определена. Само векторное пространство будет, как правило, обозначаться через L, а фиксированная симметрическая билинейная форма на нем — через (х,у). Это выражение называется также скалярным произведением векторов ж и у. Повторим, используя эти обозначения, определение евклидова пространства. Евклидово пространство — это вещественное векторное пространство L, любым двум векторам х и у которого сопоставляется вещественное число (х,у). При этом предполагаются выполненными условия: 1) (х\ +Х2,у) = (Х\,у) + (Х2,у) ДЛЯ ЛЮбыХ веКТОрОВ Х\,Х2,У Е L 2) (ах,у) = а(х,у) для любых векторов ж, у е L и вещественного числа а. 3) (ж, у) = (у, ж) для любых векторов х,у е L. 4) (ж, х) > 0 при всех х ф 0. Свойства 1)-3) показывают, что функция (ж, у) является симметрической билинейной формой на L, в частности, что (0, у) = 0 для любого вектора у Е L, только свойство 4) выражает специфику евклидовых пространств. Выражение (ж, ж) также часто записывается как (ж2), оно называется скалярным квадратом вектора ж. Таким образом, свойство 4) означает, что квадратичная форма (ж2), соответствующая билинейной форме (ж, у), является положительно определенной. Укажем некоторые очевидные следствия приведенных определений. При фиксированном векторе у Е L, где L — евклидово пространство, условия 1) и 2) в определении можно сформулировать так, что функция fy(x) = (х,у) с аргументом ж является линейной. Таким образом, мы имеем отображение
218 Гл. 7. Евклидовы пространства у ь-> fy пространства L в L*. Условие 4) в определении евклидова пространства показывает, что ядро этого отображения равно (0). Действительно, fy^0 для любого у т^ 0, так как fy(y) = (у2) > 0. Если размерность пространства L конечна, то, согласно теоремам 3.10 и 3.14, это отображение является изоморфизмом. Причем следует заметить, что в отличие от конструкции, использованной при доказательстве теоремы 3.14, сейчас мы построили изоморфизм L ^ L*, не используя специальный выбор какого-либо базиса в L. Таким образом, мы имеем некоторый естественный изоморфизм L ^ L*, определенный только заданием скалярного произведения в L. Ввиду этого в случае конечномерного евклидова пространства L мы будем дальше иногда отождествлять L и L*. Иными словами, как и для всякой билинейной формы, для скалярного произведения (ж, у) существует единственное линейное преобразование srf\ L —► L*, такое, что (ж, у) = &/{у)(х). Предшествующее рассуждение показывает, что в случае евклидова пространства преобразование srf является изоморфизмом, в частности, билинейная форма (ж, у) невырождена. Приведем примеры евклидовых пространств. Пример 7.1. Плоскость, в которой за (ж,у) взято известное из аналитической геометрии скалярное произведение векторов ж и у, т. е. произведение их длин на косинус угла между ними. Пример 7.2. Пространство Rn, состоящее из строк (или столбцов) длины п, в котором скалярное произведение строк ж = (а\,... ,ап) и у = (/?i,...,/?n) определено соотношением (ж, у) = aiPi + а2@2 + '" + о>пРп' (7.1) Пример 7.3. Векторное пространство L, состоящее из многочленов степени п с вещественными коэффициентами, рассматриваемых на некотором отрезке [а,Ь]. Для двух многочленов f(t) и g(t) определим их скалярное произведение соотношением ь (/.5) = f(t)g(t)dt. (7.2) Пример 7.4. Векторное пространство L, состоящее из всех функций, принимающих вещественные значения и непрерывных на отрезке [а, Ь]. Для двух таких функций f(t) и g(t) определим их скалярное произведение равенством (7.2). Пример 7.4 показывает, что евклидово пространство, как и векторное, не обязано быть конечномерным. Бесконечномерные евклидовы пространства называются также предгильбертовыми1). Мы же будем дальше рассматривать только конечномерные евклидовы пространства. ]) Особенно важную роль в различных разделах математики и физики играют так называемые гильбертовы пространства, которые выделяются из предгильбертовых условием полноты, специфичным именно для случая бесконечной размерности. (Иногда в определении предгильбертова пространства заменяют условие (ж, ж) > 0 более слабым условием (х,х) ^ 0.)
7.1. Определение евклидова пространства 219 Пример 7.5. Любое подпространство L' евклидова пространства L, если мы определим форму (ж, у) для него так же, как и в пространстве L. По аналогии с примером 7.1 полагают: Определение. Длиной вектора х евклидова пространства называется неотрицательное значение корня \/{х2). Длина вектора х обозначается через \х\. Отметим, что здесь существенно используется свойство 4), согласно которому длина любого ненулевого вектора является положительным числом. Следуя той же аналогии, естественно определить угол <р между векторами х и у условием cosip = ,^^,, 0 ^ <р < тг. (7.3) Однако такое число (р существует, только если выражение в правой части равенства (7.3) по модулю не превосходит 1. Это действительно так, и доказательство этого факта будет нашей ближайшей целью. Лемма. Если вектор е ф О, то любой вектор х Е L может быть представлен в виде х = ае + у, (е, у) = 0, (7.4) с некоторым числом а и вектором у е L Доказательство. Положив у = х — ае, найдем а из условия (е,у) = 0. Оно равносильно тому, что (ж,е) = а(е,е). Значит, а = (ж,е)/|е|2. Заметим, что |е| ф 0, так как по условию е ф 0. Определение. Вектор ае из соотношения (7.4) называется ортогональной проекцией вектора х на прямую (е). Теорема 7.1. Длина ортогональной проекции вектора х не превосходит его длины \х\. Доказательство. Действительно, так как, по определению, х = ае + у и (е,у) = 0, то |ж| = (х ) — (ае + у,ае + у) = |ае| + \у\ ^ |сее| и значит, \х\ ^ |ае|. (7.5) Отсюда сразу же вытекает нужная нам Теорема 7.2. В евклидовом пространстве для любых векторов х и у выполнено неравенство \(х,у)\^\х\-\у\. (7.6) Доказательство. Когда один из векторов ж, у равен нулю, неравенство (7.5) очевидно и превращается в равенство 0 = 0. Пусть теперь оба вектора
220 Гл. 7. Евклидовы пространства ненулевые. В этом случае обозначим через ау ортогональную проекцию вектора х на прямую (у). Тогда, согласно (7.4), имеем соотношение х = ay + z, где (у, z) = 0. Отсюда получаем равенство (ж,у) = (ay + z,y) = (ay,у) = а \у\2. Значит, |(ж,у)| = \а\ • \у\2 = \ау\ • \у\. Но по теореме 7.1 выполнено неравенство \ау\ ^ |ж|, и следовательно, |(ж,у)| ^ |ж| • \у\. Неравенство (7.6) имеет много названий: Коши-Буняковского-Шварца и др. Из него вытекает хорошо знакомое из элементарной геометрии неравенство треугольника. Действительно, для изображенного на рис. 7.1 треугольника имеет место соотношение ае = ж — у, из которого с помощью (7.6) получаем неравенство Рис. 7.1. Ортогональная проекция |ае|2 = (х-у,х-у) = |ж|2 - 2(ж, у) + \у\2 ^ |ж|2 + 2|(ж,у)\ + \у\2 ^ ^|ж|2 + 2|ж|.|2/| + |2/|2 = (|ж| + |1/|)2, откуда, очевидно, следует неравенство треугольника: \ае\ ^ |ж| + \у\. Таким образом, из теоремы 7.2 следует, что число ц>, удовлетворяющее равенству (7.3), существует. Оно и называется углом между векторами ж и у. Условие (7.3) определяет угол однозначно, если считать, что 0 < (р ^ 7г. Определение. Векторы жиг/ называются ортогональными, если их скалярное произведение (ж, у) = 0. Заметим, что это — повторение определения, данного в § 6.2 для билинейной формы <р(х,у) = (х,у). Согласно данному выше определению (7.3), угол между ортогональными векторами равен 7г/2. В евклидовом пространстве существует полезный критерий линейной независимости векторов. Пусть а\,..., ат — т векторов евклидова пространства L. Определение. Определителем Грама системы векторов а\,...,ат называется определитель (a\,ai) (а\,а2) ••• (а\,аш) G(a\,...,am) = (а2,а\) (а2,а2) ••• (а2,ат) (am,ai) (ат,а2) ••• (ат,ат) (7.7) Теорема 7.3. Если векторы а\,...,ат линейно зависимы, то определитель Грама G(a\,... ,am) = 0, если же они линейно независимы, то G(ai,...,am) > 0.
7.1. Определение евклидова пространства 221 Доказательство. Если векторы ai,...,am линейно зависимы, то, как было показано в § 3.2, один из них является линейной комбинацией остальных. Пусть это будет вектор ат, т.е. аш — а\а\ + ••• + аш-\аш_\. Тогда из свойств скалярного произведения следует, что для любого г— 1,...,т выполнено равенство (аШ1аг) = aq(ai,ai) + о>2(а2,щ) -\ Ь am_i(am_i,a;). Отсюда видно, что, вычитая в определителе (7.7) из последней строки все предшествующие, умноженные на коэффициенты ai,...,am_i, мы получим определитель со строкой нулей. Следовательно, G(a\,..., ат) = 0. Пусть теперь векторы ai,...,am линейно независимы. Рассмотрим в подпространстве L' = (ai,... ,am) квадратичную форму (ж2). Положив вектор ж = а\а\ Н + атат, мы можем записать ее в виде га naioi Н Ь amam)2j = ]Р ai(Xj(ai, a,j). Как легко видеть, эта квадратичная форма положительно определена, а ее определитель совпадает с определителем Грама G(a\,... ,ат). Согласно теореме 6.11 отсюда вытекает, что G(ai,...,am) > 0. Теорема 7.3 является широким обобщением неравенства Коши-Буняковс- кого-Шварца. Действительно, при т = 2 неравенство (7.6) очевидно (превращается в равенство), если векторы жиг/ линейно зависимы. Если же х и у линейно независимы, то их определитель Грама равен G(x,y) = (ж, ж) (ж, у) (ж, у) (у, у) Устанавливаемое теоремой 7.3 неравенство G(x,y) > 0 и дает нам (7.6). В частности, мы видим отсюда, что неравенство (7.6) превращается в равенство, только если векторы ж и у пропорциональны. Впрочем, это легко вывести, просматривая доказательство теоремы 7.2. Определение. Векторы е\,...,ет евклидова пространства образуют ортонормированную систему, если (eif ej) = 0 при г ф j, (е*, е*) = 1, (7.8) т.е. эти векторы попарно ортогональны и длина каждого из них равна 1. Если т = п и векторы е\,..., еп образуют базис пространства, то такой базис называется ортонормированным. Очевидно, что определитель Грама ортонормированного базиса равен 1. Воспользуемся теперь тем, что квадратичная форма (ж2) положительно определена, и применим к ней формулу (6.28), в которой, по определению положительной определенности, s = п. Этот результат теперь может быть переформулирован как утверждение о существовании такого базиса е\,..., еп пространства L, в котором скалярный квадрат вектора ж = а\е\ Н + апеп
222 Гл. 7. Евклидовы пространства равен сумме квадратов координат, т. е. (ж ) = а\ Н Ь огп. Иначе говоря, мы получаем следующее утверждение. Теорема 7.4. В каждом евклидовом пространстве существует орто- нормированный базис. Замечание. В ортонормированном базисе скалярное произведение векторов х = (c*i,...,an) и у = (/?ь ••• >А0 имеет наиболее простой вид, задаваемый формулой (7.1). Соответственно, в ортонормированном базисе скалярный квадрат любого вектора равен сумме квадратов его координат, а длина — корню из суммы квадратов. Лемма, устанавливающая разложение (7.4), имеет важное и далеко идущее обобщение. Для его формулировки вспомним, что в § 3.7 для каждого подпространства L/ с L мы определили его аннулятор (1?)а С L*, а ранее в этом параграфе показали, что любое евклидово пространство L конечной размерности можно отождествить с его сопряженным пространством L*. В результате мы можем рассматривать (1_')а как подпространство самого исходного пространства L. В таком качестве мы будем называть его ортогональным дополнением подпространства L' и обозначать (L')-1. Если вспомнить необходимые определения, то мы получим, что ортогональное дополнение (L7)-1 подпространства L'cL состоит из тех векторов у е L, для которых выполнено условие (ж, у) = 0 при всех х е L7. (7.9) С другой стороны, (L7)-1 — это подпространство (L7)^, определенное для случая, когда билинейная форма <р(х,у) = (х,у), см. с. 203. Основное свойство ортогонального дополнения для конечномерных евклидовых пространств заключается в следующем: Теорема 7.5. Для любого подпространства Ц конечномерного евклидова пространства L имеет место представление L = LieLf. (7.10) В случае, когда Ц = (е), теорема 7.5 сводится к уже доказанной нами лемме. Доказательство. В предыдущей главе мы видели, что любая квадратичная форма ф(х) в некотором базисе пространства L приводится к каноническому виду (6.22), или, в случае вещественного пространства, к виду (6.28) с некоторыми числами 0 ^ s ^ г, где s — индекс инерции и г — ранг квадратичной формы ф(х), или, что то же самое, ранг симметрической билинейной формы <р(х,у), связанной с ф{х) соотношением (6.11). Напомним, что билинейная форма (р(х,у) невырожденная, если г = п, где п = dimL. Условие положительной определенности формы ф(х) равносильно тому, что все числа Ai,...,An в (6.22) положительные, или, что то же самое, в формуле (6.28) имеют место равенства s = г = п. Отсюда вытекает, что симметрическая билинейная форма (р(х,у), соответствующая положительно определенной квадратичной форме ф(х), невырождена как на пространстве L,
7.1. Определение евклидова пространства 223 так и на любом подпространстве L' с L. Для завершения доказательства остается вспомнить, что, по определению, квадратичная форма (ж2), соответствующая скалярному произведению (ж, у), положительно определена, и воспользоваться теоремой 6.4 для билинейной формы <р(х,у) = {х,у). Из соотношения (3.54) для аннулятора (см. § 3.7) или из теоремы 7.5 следует, что dirndl)-1 = dimL — diml_i. Отображение проектирования пространства L на подпространство Ц параллельно Lj- (см. определение на с. 112) называется ортогональным проектированием L на Ц. При этом проекция вектора ж е L на подпространство Ц называется его ортогональной проекцией на Ц. Это естественное обобщение введенного выше понятия ортогональной проекции вектора на прямую. Аналогично, для любого подмножества X с L определена его ортогональная проекция на Ц. Определитель Грама связан с понятием объема в евклидовом пространстве, обобщающим понятие длины вектора. Определение. Параллелепипедом, натянутым на векторы а\,..., ат, называется совокупность векторов а\а\-\ Ь amam при всех 0 ^ a; ^ 1. Он обозначается через Щаь ..., аш). Основанием параллелепипеда Щаь ..., аш) называется параллелепипед, натянутый на любые т — 1 векторов из числа ab...,am, например, П(аь ... ,am_i). В случае плоскости (см. пример 7.1) мы имеем параллелепипеды Щеп) и Щаьаг). Согласно данному определению II(ai) — это отрезок, начало и конец которого совпадают с началом и концом вектора а\, а Щаьаг) — параллелограмм, построенный на векторах а\ и а^. Вернемся к рассмотрению произвольного параллелепипеда II(ai,..., ат) и определим подпространство Ц = (аь ••• ,am_i). К этому случаю мы можем применить введенное выше понятие ортогонального проектирования пространства L. Согласно разложению (7.10) вектор ат однозначно представляется в ви- де ат = ж + у, где ж G Ц к у е if. Вектор у называется высотой параллелепипеда П(аь... ,am), опущенной на основание Щаь •••, am_i). В случае ПЛОСКОСТИ ОПИСЫВа- Рис. 7.2. Высота параллелепипеда емая конструкция изображена на рис. 7.2. Теперь мы можем ввести понятие объема параллелепипеда П(аь-..,аш), точнее, его неориентированного объема. Это, по определению, неотрицательное число, которое обозначается V(ai,...,am) и определяется индукцией по т. В случае т = 1 оно равно V{a\) — \a\\, а в общем случае V(a\,..., аш) есть произведение V(a\,...,am_i) на длину высоты параллелепипеда П(аь ... ,am), опущенной на основание П(аь ... ,am_i).
224 Гл. 7. Евклидовы пространства Численное выражение неориентированного объема таково: У2(аь...,ат) = G(ai,...,am). (7.11) Это соотношение показывает геометрический смысл определителя Грама. Формула (7.11) очевидна при т = 1 и в общем случае доказывается индукцией по га. Согласно (7.10) представим вектор ат в виде ат — х + у, где х е Ц = (ab...,am_i) иу elj~. Тогда ат — а\а\ Л bam_i<zm_i +y. Заметим, что у — это высота нашего параллелепипеда, опущенная на основание П(аь... ,am_i). Вспомним формулу (7.7) для определителя Грама и вычтем из его последнего столбца все предыдущие, умноженные на ai,...,am_i. В результаты мы имеем (abai) (aba2) ••■ 0 (a2,ai) (а2,аг) ••• 0 G{au...9am) = \ : : : |, (7.12) |(am_i,ai) (am_i,a2) ••• 0 (am,ai) (am,«2) ••• (y,am) причем (j/,am) = (j/,j/) = |y|2, так как у G Lf. Разлагая определитель (7.12) по последнему столбцу, получаем равенство G(ab...,am) = G(ab...,am_i)|y|2. Напомним, что по построению, у — это высота параллелепипеда И(а\,..., am), опущенная на основание П(аь... ,am_i). По предположению индукции, мы имеем G(oi,... ,am_i) = T^2(ai,... ,am_i), и значит, G(ai,...,am) = У2(аь...,ат_1)|у|2 = У2(аь ..., ат). Таким образом, введенное нами понятие неориентированного объема отличается от того объема и той площади, о которых шла речь в § 2.1 и § 2.6, так как неориентированный объем не может принимать отрицательные значения. На это и указывает слово «неориентированный». Теперь мы сформулируем второе понятие объема параллелепипеда, обобщающее те объемы и площади, о которых говорили раньше, и отличающееся от неориентированного объема множителем ±1. Согласно теореме 7.3 интерес представляет только случай, когда векторы ai,...,am линейно независимы. Тогда мы можем рассмотреть пространство L = (а\,..., ат) с базисом а\9...,ат. Итак, нам даны п векторов аь... ,an, где п = dimL Рассмотрим матрицу А, j-ът столбец которой состоит из координат вектора a,j относительно некоторого ортонормированного базиса ei,...,en: (а\\ а\2 ••• а\п\ CL21 а22 ' ' * 0>2п А = \а>п 1 «п2 J
7.1. Определение евклидова пространства 225 Простая проверка показывает, что в матрице А* А на пересечении г-ой строки и j-ro столбца стоит элемент (a^aj). Значит, определитель матрицы А*А равен G(a\,..., an), a в силу равенств \А*А\ = |А*| • |А| = \А\2 отсюда получаем \Af = G(ai,... ,an). С другой стороны, из формулы (7.11) следует, что G(ai,... ,an) = V2(ai,... ,an), и значит, |А| =±V(ab...,an). Определитель матрицы А называется ориентированным объемом п-мерного параллелепипеда IL(a\,... ,an). Он обозначается через v(ai,... ,an). Таким образом, неориентированный и ориентированный объемы связаны между собой соотношением V(au...9an) = \v(ai,...,an)\. Поскольку определитель матрицы не меняется при транспонировании, то v(ai,...,an) = \A*\. Иными словами, для вычисления ориентированного объема координаты образующих параллелепипеда щ можно записывать не по столбцам матрицы, а по строкам, что иногда бывает более удобно. Очевидно, что знак ориентированного объема зависит от выбора ортонор- мированного базиса е\,...,еп. Эта зависимость и характеризуется термином «ориентированный». Подробнее об этом будет сказано в § 7.3. Объем обладает важными свойствами: Теорема 7.6. Пусть ff: L —► L — произвольное линейное преобразование евклидова пространства L размерности п. Тогда для любых п векторов а\,... ,ап этого пространства имеет место соотношение v (# (ai),... ,V(an)) = Щ v(au ..., ап). (7.13) Доказательство. Выберем ортонормированный базис пространства L. Преобразование ^ имеет в нем некоторую матрицу С, и координаты ai,...,ап любого вектора а связаны с координатами /3\,...,/Зп его образа ^(а) соотношением (3.25), или, в матричной форме, (3.27). Пусть А — матрица, столбцы которой состоят из координат векторов ai,...,an, и А' — матрица, столбцы которой состоят из координат векторов ^(ai),... ,^(an). Тогда, очевидно, мы имеем соотношение А1 = С А, откуда следует, что \А'\ = \С\ - \А\. Для завершения доказательства остается заметить, что |^| = \С\ и, по определению ориентированного объема, имеют место равенства v(a\,... ,an) = \A\ nv(<t?(al),...,tf(an)) = \A'\. Из этой теоремы следует, конечно, что V(V{ai)9...tV(an)) = \\A\\V(ai9...9an)9 (7.14) здесь ||А|| означает модуль (абсолютное значение) определителя матрицы А. Исходя из введенных понятий, можно определить аналог объема V(M) для очень широкого класса множеств М, содержащего все множества, реально встречающиеся в математике и физике. Это является предметом так называемой теории меры, весьма далекой от линейной алгебры, так что мы 8 А. О. Ремизов, И. Р. Шафаревич
226 Гл. 7. Евклидовы пространства ее касаться не будем. Заметим только, что важное соотношение (7.14) при этом сохраняется: V (tf(M)) = \\A\\V(M). (7.15) Интересным примером множества в n-мерном евклидовом пространстве является шар В (г) радиуса г — множество, состоящее из всех векторов ж е L, для которых |ж| ^ г. Множество векторов х е L, для которых \х\ = г, называется сферой S(r) радиуса г. Из соотношения (7.15) вытекает, что V (B(r)) = Vnrn, где Vn = V (B(l)). Вычисление интересной геометрической константы Vn — это вопрос анализа, связанный с теорией так называемых Г-функций. Мы приведем здесь только результат: п 7Г2 v„ = 'п r(f+ !)• Из теории Г-функций следует, что если п четно (п = 2га), то Vn = 7гт/т\, а если п нечетно (п = 2га + 1), то Vn = 2т+1тгт/(1 • 3 • • • (2т + 1)). § 7.2. Ортогональные преобразования Пусть Ц и 1_2 — евклидовы пространства одинаковой размерности со скалярными произведениями (х,у)\ и (ж,г/)2 в них. Длину вектора х в пространствах Ц и 1_2 мы будем обозначать через \х\\ и \х\2 соответственно. Определение. Изоморфизмом евклидовых пространств Ц и 1_2 называется изоморфизм $i\ Li —> 1_2 векторных пространств, сохраняющий скалярное произведение, т. е. такой, что для любых векторов ж, г/ е Ц выполнено равенство (x,y)i = (£/(x),s/(y))2. (7.16) Полагая в равенстве (7.16) вектор у = ж, мы получаем, что \х\\ = \si(x)^ и, значит,|ж|1 = |^(ж)|2, т.е. изоморфизм srf сохраняет длины векторов. Наоборот, если srf\ Ц —> L2 — изоморфизм векторных пространств, сохраняющий длины векторов, то |^(ж + 2/)|| = |а5 + 1/|?» и следовательно, \*/{х)\\ + 2(£/(х),£/(у))2 + К(у)|| = \х\\ + 2(х,у)1 + \у\1 Но, по условию, мы также имеем равенства \s/(x)\2 = |#|i и \<ei(y)\2 = |у|ь значит, (х,у)\ = (£/(х),£?(у))2. Это, собственно говоря, является следствием того факта (теорема 6.2), что симметрическая билинейная форма (ж, у) определяется квадратичной формой (ж, ж), и сейчас мы просто повторили доказательство, приведенное в § 4.1. Если размерности пространств Ц и 1_2 совпадают, то из того, что линейное преобразование si\ Ц —> 1_2 сохраняет длины векторов, уже следует, что оно является изоморфизмом. Действительно, как мы видели в § 3.5, для этого достаточно проверить, что ядро преобразования si равно (0). Но если si{x) = О, то \s/(x)\2 = 0, а значит, и |sc|i = 0, т. е. ж = 0. Теорема 7.7. Любые два евклидовых пространства одинаковой конечной размерности изоморфны.
7.2. Ортогональные преобразования 227 Доказательство. Из существования ортонормированного базиса сразу вытекает, что любое n-мерное евклидово пространство изоморфно евклидову пространству из примера 7.2. Действительно, пусть еь ..., еп — ортонормиро- ванный базис произвольного евклидова пространства L. Сопоставив каждому вектору ж g L строку его координат в базисе ei,...,en, мы получим изоморфизм пространства L и пространства Rn строк длины п со скалярным произведением (7.1) (см. замечание на с. 222). Как легко видеть, изоморфизм является отношением эквивалентности (с. 8) на множестве всех евклидовых пространств, и в силу транзитивности отсюда следует, что любые два евклидовых пространства размерности п изоморфны. Теорема 7.7 аналогична теореме 3.9 для векторных пространств, и смысл ее тот же (он подробно разъяснен в § 3.5). Например, пользуясь теоремой 7.7, мы могли бы иначе доказать неравенство (7.6) из предыдущего параграфа. Действительно, оно совершенно очевидно (неравенство превращается в равенство), если векторы ж и у линейно зависимы. Если же они линейно независимы, то мы можем рассмотреть подпространство L' = (ж,у). Согласно теореме 7.7, оно изоморфно плоскости (пример 7.1 в предыдущем параграфе), где это неравенство известно. Следовательно, оно справедливо и для любых векторов х и у. Определение. Линейное преобразование % евклидова пространства L в себя, сохраняющее скалярное произведение, т. е. такое, что для любых векторов жиг/ (x,y) = (V(x),W(y)), (7.17) называется ортогональным. Очевидно, что это — частный случай изоморфизма евклидовых пространств Ц и 1_2, когда они совпадают. Легко видеть также, что ортогональное преобразование % переводит любой ортонормированный базис в ортонормированный базис, так как из условий (7.8) и (7.17) вытекает, что ^(ei),... ,^(еп) является ортонормирован- ным базисом, если таковым является ei,...,en. Наоборот, если линейное преобразование % переводит некоторый ортонормированный базис еь ... ,еп в ортонормированный же базис, то для векторов ж = а\е\ + ••• + апеп и У — /?iei H V Рп^п мы имеем <%{х) = ai^T(ei) + • • • + anW(en), W{y) = A^(ei) + • • • + Рп^{еп). Так как и ei,...,en, и <$Р(е\),... ,^(еп) — ортонормированные базисы, то в силу (7.1) и левая, и правая части соотношения (7.17) равны выражению ос\(3\ + • • • + ап/Зп, т.е. соотношение (7.17) выполняется, и значит, Щ — ортогональное преобразование. Отметим важную переформулировку этого факта: для любых двух орто- нормированных базисов существует единственное ортогональное преобразование, переводящее первый из них во второй. Пусть U = (uij) — матрица линейного преобразования % в некотором ортонормированном базисе ei,...,en. Из сказанного выше следует, что преобразование ^ ортогонально тогда и только тогда, когда векторы 8*
228 Гл. 7. Евклидовы пространства fy(e\),... ,^(еп) образуют ортонормированный базис. Но по определению п матрицы U, вектор ^(е;) = ^ иые^, а так как е\,... , еп — ортонормирование ный базис, то (^(в;), ^(ej)) = UHlti^- + TX2i^2j H Ь uniUnj- Выражение в правой части равно элементу с^, где матрица (су) = С/*С/. Значит, условие ортогональности преобразования <%£ можно записать в виде U*U = E, (7.18) или, что то же самое, U* = U~l. Это равенство равносильно тому, что UU* = Е, (7.19) и выражается в виде соотношений между элементами матрицы U: Щ\Щх-\ Ь TXmUjn = ° ПРИ ЬФЬ <4И 1" uin = ! • (7«2°) Матрица С/, удовлетворяющая соотношению (7.18) или равносильному соотношению (7.19), называется ортогональной. Понятие ортонормированного базиса евклидова пространства можно более наглядно интерпретировать с помощью понятия флага (см. определение на с. ПО). А именно, ортонормированному базису ei,...,en мы сопоставим флаг (0)сЦс1-2с...с1-п = 1_, (7.21) в котором подпространство Ц = (ei,...,e^), а пара (Ц_ьЦ) является направленной в том смысле, что L+ — это то полупространство в Ц, которое содержит вектор е$. В случае евклидова пространства существенно то, что теперь мы получаем взаимно однозначное соответствие между ортонормиро- ванными базисами и флагами. Для доказательства этого нам нужно только проверить, что ортонормированный базис ei,...,en однозначно определяется соответствующим ему флагом. Пусть этот базис соответствует флагу (7.21). Если мы уже построили такую ортонормированную систему векторов ei,...,e;_i, что Ц_1 = (еь... ,e;_i), то следует рассмотреть ортогональное дополнение Lj-_{ к подпространству Ц_1 в Ц. Тогда dimL^ij = 1 и L^ = (e»), где вектор е* определяется однозначно с точностью до множителя ±1. Этот множитель мы можем выбрать однозначно, исходя из условия е* Е L+. Сделанное несколько раньше замечание теперь можно интерпретировать так: Для любых двух флагов Ф\ и Ф2 евклидова пространства L существует единственное его ортогональное преобразование, переводящее Ф\ в Ф2. Нашей ближайшей целью будет построение ортонормированного базиса, в котором заданное ортогональное преобразование ^ имеет, по возможности, наиболее простую матрицу. Согласно теореме 4.5 преобразование % имеет одномерное или двумерное инвариантное подпространство L'. Очевидно, что ограничение ^ на подпространство L' снова будет ортогональным преобразованием. Выясним сначала, какие это могут быть преобразования, т. е. каковы ортогональные преобразования одномерных и двумерных пространств.
7.2. Ортогональные преобразования 229 Если dimL/ = 1, то 1_; = (е) для некоторого ненулевого вектора е. Тогда ^(е) = ае, где а — некоторое число. Из ортогональности преобразования Щ мы получаем, что (е, е) = (ае, ае) = а (е, е), откуда вытекает, что а2 = 1, и значит, а = ±1. Следовательно, в одномерном пространстве L/ существует два ортогональных преобразования: единичное <§, для которого £(х) — х для всех векторов ж, и такое ^, для которого ^(ж) = —ж. Очевидно, что ^ = —£. Пусть теперь dim L' = 2, в этом случае L/ изоморфно плоскости со скалярным произведением (7.1). Из аналитической геометрии известно, что ортогональное преобразование плоскости является либо поворотом на некоторый угол ср вокруг начала координат, либо зеркальным отражением относительно некоторой прямой I. В первом случае ортогональное преобразование ty£ в любом ортонормированном базисе плоскости имеет матрицу cos ш — sin ю \ (7.22) sm(f cos (pi Во втором случае плоскость представима в виде прямой суммы L' = I © Z-1, где I и lL — прямые, и для вектора ж имеет место разложение ж = у + z, где у е I и z Gi1, а вектор <%{х) = у — z. Если выбрать ортонормированный базис е\,в2 так, чтобы вектор е\ был расположен на прямой I, то преобразование 9£ будет иметь матрицу ^=(i_(l)- (7-23) Но мы не будем пользоваться этим фактом аналитической геометрии, а покажем, что он вытекает из простых соображений линейной алгебры. Пусть °i/ имеет в некотором ортонормированном базисе еьег матрицу т.е. переводит вектор хе\ + ув2 в (ах + Ьу)е\ + (сх + dy)e2. To, что ^ сохраняет длину вектора, дает соотношение (ах + by)2 + [сх + dy)2 = x2 + y2 для всех х и у. Подставляя в него последовательно пары (ж, у), равные (1,0), (0,1) и (1,1), получаем а2 + с2 = 1, Ь2 + d2 = 1, ab + cd = 0. (7.25) Из соотношения (7.19) следует, что \UU*\ = 1, а так как |!7*| = Ц7|, то \U\2 = 1, и значит, \U\ = ±1. Нужно отдельно рассмотреть случаи разных знаков. Если \U\ = —1, то характеристический многочлен |J7 —ii?| матрицы (7.24) равен t2 — (a + d)t — 1 и имеет положительный дискриминант. Следовательно, матрица (7.24) имеет два вещественных собственных значения Ai и А2 противоположных знаков (так как по теореме Виета А1А2 = — 1) и два соот-
230 Гл. 7. Евклидовы пространства ветствующих им собственных вектора е\ и в2. Рассматривая ограничение Щ на одномерные инвариантные подпространства (е\) и (ег), мы приходим к разобранному выше одномерному случаю, откуда, в частности, следует, что значения Ai и Л2 равны ±1. Покажем, что векторы е\ и в2 ортогональны. По определению собственных векторов, имеем равенства ^(е») = А^, откуда («Г(е0, «Г(е2)) = (А1еь А2е2) = AiA2(ei,e2). (7.26) Но так как преобразование % ортогонально, то (^(ei),^(e2)) = (еьег), и из (7.26) мы получаем равенство (еьег) = AiA2(ei,e2). Так как Ai и А2 имеют противоположные знаки, то отсюда следует, что (еьег) = 0. Выбрав собственные векторы е\ и e<i единичной длины, причем так, что Ai = 1 и А2 = —1, мы получим ортонормированный базис ei,e2, в котором преобразование <% имеет матрицу (7.23). При этом имеем разложение L = I © Z-1, где I = (е\) и I1- = (ег), и преобразование U является зеркальным отражением относительно прямой I. Если же \U\ = 1, то из соотношений (7.25) для a,b,c,d с учетом равенства ad — bc= 1 легко вывести, что существует такой угол (р, что а — d = cos <p и с = — Ъ = sin9?, то есть матрица (7.24) имеет вид (7.22). Основой для рассмотрения общего случая является следующее утверждение. Теорема 7.8. Если подпространство L7 инвариантно относительно ортогонального преобразования <%, то его ортогональное дополнение (L')-1 тоже инвариантно относительно W. Доказательство. Нам нужно показать, что для каждого вектора у G (L')1- выполнено включение *%f(y) G (L')"1. Если у G (L')-1, то (х,у) = 0 для всех ж G L/. Из ортогональности преобразования <%£ мы получаем, что (^{х),^/(у)) = (ж, у) = 0. Так как % является взаимно однозначным отображением L в L, то его ограничение на инвариантное подпространство L/ является взаимно однозначным отображением L' в L'. Иными словами, любой вектор ж' G I/ можно представить в виде х' = <%f(x), где х — другой вектор из L'. Следовательно, (x',fy(y)) =0 для любого вектора ж' G L', а это и означает, что *2f(y) G (L')-1. Замечание. При доказательстве теоремы 7.8 мы нигде не пользовались положительной определенностью квадратичной формы (ж, ж), соответствующей скалярному произведению (ж, у). Действительно, эта теорема верна и для любой невырожденной билинейной формы (ж, у). Условие невырожденности требуется для того, чтобы ограничение преобразования <%£ на инвариантное подпространство было взаимно однозначным, без этого теорема становится неверной. Определение. Подпространства Ц и 1_2 евклидова пространства называются ортогональными друг другу, если (ж, у) = 0 для всех векторов ж G Ц и у G 1-2, это записывается в виде Ц _1_ 1_2. Разложение евклидова пространства в прямую сумму ортогональных подпространств называется ортогональным. Если dim L > 2, то, согласно теореме 4.5, преобразование <%£ имеет одномерное или двумерное инвариантное подпространство. Таким образом, при-
7.2. Ортогональные преобразования 231 меняя нужное число раз (в зависимости от dimL) теорему 7.8, мы получаем ортогональное разложение L = Ц 0 L2 ф • • • © Ц, где Ц _L Ц при всех г ф j, (7.27) все подпространства Ц инвариантны относительно преобразования ^ и имеют размерность 1 или 2. Объединяя ортонормированные базисы подпространств Ц,...,Ц; и выбирая их удобный порядок, мы получим следующий результат. Теорема 7.9. Для всякого ортогонального преобразования существует такой ортонормированный базис, в котором его матрица имеет блочно- диагональный вид: /1 \ -1 -1 А ■¥>1 (7.28) Aj где (7.29) щ ф тгк, к £ Z. Заметим, что определители всех матриц (7.29) равны 1, поэтому для собственного ортогонального преобразования (см. определение на с. 143) число —1, стоящих на главной диагонали в (7.28), четное, а для несобственного — нечетное. Посмотрим теперь, что дают доказанные нами теоремы в известных из аналитической геометрии случаях: при п — 1, 2 и 3. При п = 1 существуют, как мы уже видели, всего два ортогональных преобразования: S и — £, первое из которых — собственное, а второе — несобственное. При п = 2 собственное ортогональное преобразование является поворотом плоскости на некоторый угол (р. В любом ортонормированном базисе его матрица имеет вид А^ из (7.29), без каких-либо ограничений на угол (р. Для несобственного преобразования в записи (7.28) число —1 должно встречаться нечетное число раз, т. е. один раз. Это значит, что в некотором ортонормированном базисе ei,e2 его матрица имеет вид -1 О О 1
232 Гл. 7. Евклидовы пространства Рис. 7.3. Зеркальное отраже ние плоскости Такое преобразование является зеркальным отражением плоскости относительно прямой (ег) (рис. 7.3). Рассмотрим теперь случай п = 3. Так как характеристический многочлен преобразования % имеет нечетную степень 3, то у него есть вещественный корень. Это значит, что в записи (7.28) на главной диагонали матрицы присутствует число + 1 или —1. Рассмотрим сначала собственные преобразования. В этом случае для матрицы (7.28) есть лишь одна возможность: /10 0 \ I 0 cos (f — sin (p J . \0 sin ip cos </?/ Если матрица записана в базисе в1,е2,ез, то преобразование ^ не меняет точек прямой I = (ei) и осуществляет поворот на угол (р в плоскости (в2,ез). В этом случае говорят, что преобразование ^ — поворот пространства на угол Lp вокруг оси I. То, что всякое собственное ортогональное преобразование трехмерного евклидова пространства обладает «осью вращения», впервые доказал Эйлер. Мы обсудим механический смысл этого утверждения позже, в связи с движениями аффинных пространств. Наконец, если ортогональное преобразование несобственное, то в записи (7.28) остается лишь возможность /-1 0 I 0 cos (р \ 0 sin<£ В этом случае ортогональное преобразование fy сводится к повороту вокруг оси I и одновременному зеркальному отражению относительно плоскости lL. § 7.3*. Ориентация евклидова пространства В евклидовом пространстве, как и в любом вещественном векторном пространстве, определено понятие одинаковой или противоположной ори- ентированности двух базисов и ориентации пространства (см. § 4.4). Но в евклидовых пространствах эти понятия имеют некоторые специфические особенности. Пусть еь ..., еп и е\,..., е'п — два ортонормированных базиса евклидова пространства L. Согласно общему определению, они одинаково ориентированы, если преобразование перехода от одного к другому — собственное. Это значит, что для преобразования ^, для которого ^(ei) = e/1, ..., <2Г(еп) = е;, определитель его матрицы положителен. Но в том случае, когда оба рассматриваемых базиса ортонормированы, преобразование ^, как мы знаем,
7.3. Ориентация евклидова пространства 233 ортогональное, и для его матрицы U выполнено соотношение \U\ = ±1. Значит, ^ — собственное преобразование тогда и только тогда, когда \U\ = 1, и несобственное — когда \U\ = — 1. Имеет место следующий аналог теорем 4.10 -4.12 из §4.4: Теорема 7.10. Два ортогональных преобразования вещественного евклидова пространства непрерывно деформируемы друг в друга тогда и только тогда, когда знаки их определителей совпадают. Определение непрерывной деформируемости здесь повторяет определение, данное в § 4.4, для множества 21, но состоящего уже только из ортогональных матриц (или преобразований). Так как произведение любых двух ортогональных преобразований также является ортогональным, то лемма 2 из § 4.4 (с. 166) справедлива и в этом случае, и мы будем ею пользоваться. Доказательство теоремы. Покажем, что любое собственное ортогональное преобразование ^ может быть непрерывно деформировано в единичное. Так как условие непрерывной деформируемости задает отношение эквивалентности на множестве ортогональных преобразований, то, по свойству транзитивности, из этого будет следовать утверждение теоремы для всех собственных преобразований. Итак, нам нужно доказать, что существует семейство непрерывно зависящих от параметра t е [0,1] ортогональных преобразований %, для которых % = S и ^i = У/. Непрерывная зависимость % означает, что при записи в любом базисе все элементы матриц преобразований % являются непрерывными функциями от t. Заметим, что это вовсе не очевидное следствие теоремы 4.10, ведь она не гарантировала нам, что все Неортогональные преобразования Ортогональные преобразования Рис. 7.4. Деформация, выводящая из области ортогональных преобразований промежуточные преобразования % при 0 < t < 1 ортогональны. Возможная «плохая» деформация ^, выводящая из области ортогональных преобразований, изображена пунктирной линией на рис. 7.4. Воспользуемся теоремой 7.9 и рассмотрим ортонормированный базис, в котором матрица преобразования & имеет вид (7.28). Преобразование fy собственное тогда и только тогда, когда число элементов —1 на главной диа- <-\ 0^ гонали (7.28) четно. Заметим, что матрица второго порядка 0 -1 тоже может быть записана в виде (7.29) при щ = 7г. Таким образом, собственное ортогональное преобразование записывается в подходящем ортонормирован- ном базисе в блочно-диагональном виде: (Е \ Х<Р1 (7.30) Atpk/
234 Гл. 7. Евклидовы пространства где аргументы щ уже могут принимать любые значения. Формула (7.30), по существу, и дает непрерывную деформацию преобразования ^ в &. Чтобы быть в согласии с нашими обозначениями, рассмотрим преобразование %, имеющее в этом же базисе матрицу /Е \ ■A-tipi (7.31) V A* J Тогда очевидно, во-первых, что преобразование Щ ортогонально при любом t, а во-вторых, что % = £ и <%\ = W. Это и дает нам доказательство теоремы в случае собственного преобразования. Рассмотрим теперь несобственные ортогональные преобразования и покажем, что любое такое преобразование "V может быть непрерывно деформировано в зеркальное отражение относительно гиперплоскости, т. е. в преобразование &, имеющее в некотором ортонормированном базисе матрицу F = /-1 0\ 1 (7.32) \0 1/ Выберем произвольный ортонормированный базис пространства. Пусть в нем несобственное ортогональное преобразование У имеет матрицу V. Тогда, очевидно, преобразование <%f, имеющее в том же базисе матрицу U — VF, является собственным ортогональным. В силу очевидного соотношения F~l = F мы имеем V = UF, т.е. У = <%'#'. Воспользуемся семейством %, осуществляющим непрерывную деформацию собственного преобразования 9/ в £. Из последнего равенства с помощью леммы 2 из § 4.4 мы получаем непрерывное семейство Уг = Щ&, где % = £^ = & и Ух = <%'& = У. Таким образом, семейство Уг = %3£ осуществляет деформацию несобственного преобразования У в &. Аналогично тому, как это было в § 4.4 теорема 7.10 дает нам следующий топологический результат: множество ортогональных преобразований состоит из двух линейно связных компонент — собственных и несобственных ортогональных преобразований. Дословно так же, как и в § 4.4, из доказанного вытекает, и то, что два одинаково ориентированных ортонормированных базиса могут быть непрерывно деформированы друг в друга. То есть если е\,...,еп и е\,...,е'п — одинаково ориентированные ортонормированные базисы, то существует такое семейство ортонормированных базисов ei (£),..., en(i), непрерывно зависящее от параметра t Е [0,1], что еДО) = ei и е$(1) = е[. Иными словами, понятия ориентации пространства совпадают, как бы мы их ни определяли: при помощи произвольного базиса или ортонормированного. Далее мы будем рассматривать ориентированные евклидовы пространства, выбирая ориентацию произвольно. Этот выбор позволяет говорить о положительно и отрицательно ориентированных ортонормированных базисах.
7.3. Ориентация евклидова пространства 235 Теперь мы можем сравнить понятия ориентированного и неориентированного объема. Эти два числа отличаются друг от друга множителем ±1 (неориентированный объем неотрицателен по определению). Когда в пространстве L размерности п был введен ориентированный объем параллелепипеда П(аь... ,ап), то мы заметили, что его определение зависит от выбора некоторого ортонормированного базиса ei,...,en. Поскольку мы предполагаем пространство L ориентированным, то можем включить в определение ориентированного объема параллелепипеда П(аь... , ап) условие, что базис ei,...,en, использовавшийся при определении v(a\,... ,ап), является положительно ориентированным. Тогда число v(a\,... ,ап) не зависит от выбора базиса (т.е. не изменится, если вместо ei,...,en взять любой другой орто- нормированный положительно ориентированный базис е\,...,е'п). Это сразу следует из формулы (7.13) для преобразования ^ = f и того, что преобразование Ф, переводящее один базис в другой, является ортогональным и собственным, т.е. \fy\ = 1. Теперь мы можем сказать, что ориентированный объем v(a\,...,an) положителен (еле- __^ ff gu ^ довательно, равен неориентированному), если базисы еь-..,еп и ai,...,an одинаково ори- Рис. 7.5. Ориентированная длина ентированы, и отрицателен (т.е. отличается от неориентированного знаком), если эти базисы имеют противоположную ориентацию. Например, на прямой (рис. 7.5) длина отрезка ОА равна 2, а длина отрезка ОВ равна —2. Таким образом, можно сказать, что ориентированный объем параллелепипеда П(аь... ,ап) — это его «объем с ориентацией». Если выбрать начало координат на вещественной прямой, то базис на ней состоит из одного вектора, и векторы е\ и ае\ одинаково ориентированы, если лежат по одну сторону от начала, т. е. а > 0. Выбор ориентации на прямой, можно сказать, соответствует выбору понятия «правое» и «левое». На вещественной плоскости ориентация, задаваемая базисом ei,e2, опре- ег деляется «направлением вращения» от е\ к б2: по или против часовой стрелки. Одинаково ориентированные базисы еьег и e\,ef2 (рис. 7.6, а, б) могут а) б) в) быть переведены друг в друга непрерывным изменением, а противополож- Рис' 7'6' Ориентированные базисы плоскости но ориентированные — не могут, даже если они образуют равные фигуры (рис. 7.6, а, в), так как для этого требуется зеркальное отражение, т. е. несобственное преобразование. В вещественном трехмерном пространстве ориентация определяется базисом из трех ортонормированных векторов. Мы опять встречаемся с двумя противоположными ориентациями — это наша правая и левая рука (рис. 7.7, а). Другой способ задания ориентации в вещественном трехмерном пространстве определяется винтовой линией (рис. 7.7, б). В этом случае е'{* ех *\s x^2
236 Гл. 7. Евклидовы пространства ориентация определяется тем, в каком направлении линия закручивается, поднимаясь — по или против часовой стрелки1). Рис. 7.7. Разные ориентации трехмерного пространства § 7.4*. Примеры Пример 7.6. Под «фигурой» в евклидовом пространстве L мы будем понимать любое подмножество S С L Две фигуры S и S", содержащиеся в евклидовом пространстве М размерности п, называются геометрически одинаковыми, если существует ортогональное преобразование ^ пространства М, переводящее S в S''. Нас будет интересовать вопрос: когда фигуры S и S' геометрически одинаковы, т.е. когда fy(S) = S"? Сначала разберем случай, когда фигуры S и S' состоят из наборов т векторов: S = (а\,..., ат) и Sf = (а[,..., а'т) с числом т ^ п. То, что S и Sf геометрически одинаковы, означает существование такого ортогонального преобразования ^, что ^(о») = о!{ при всех г = 1,...,т. Для этого, конечно, необходимо, чтобы выполнялись равенства (ai,aj) = (abaj), г, j = 1,... ,m. (7.33) Предположим, что векторы ai,...,am линейно независимы и докажем, что тогда условие (7.33) является достаточным. Согласно теореме 7.3, в этом случае G(a\,..., am) > 0 и, по условию, G(a\1... ,a^) = G(ai,... ,am). Из этой же теоремы следует, что векторы а\,..., а!ш тоже будут линейно независимы. Положим L = (oi am), L7 = (a^,..., <4). (7.34) Разберем сначала случай, когда т = п. Пусть М = (оь... ,am). Рассмотрим линейное преобразование ^: М —> М, заданное условиями ^(сц) = о!{ для всех г = 1,...,т. Очевидно, что такое преобразование определено одно- 0 В виде такой винтовой линии расположены молекулы аминокислот, входящих в состав белков. По неизвестной нам причине все они ориентированы одинаково: в соответствии с поворотом против часовой стрелки.
7.4. Примеры 237 значно и, в силу соотношения (771 771 ч • 771 7714771 и равенств (7.33), является ортогональным. Пусть га < п. Тогда имеют место разложения М = L © L1- = Lf © (L;) , где подпространства L и L7 пространства М определены формулой (7.34). Согласно предыдущему, существует изоморфизм У: L —» L', такой, что У{а^) — а[ для всех г — 1,... ,т. Ортогональные дополнения L-1 и (L7) этих подпространств имеют размерность п — га, и следовательно, тоже изоморфны (теорема 7.7). Выберем произвольный изоморфизм W: L1- -» (1_;) . Вследствие разложения М = L © L-1, любой вектор х е М может быть однозначно представлен в виде х = у + z, где у е L и zgL1. Определим линейное преобразование <$/: М —> М формулой ^(ж) = У (у) + W[z). Согласно построению ^(щ) = a'i для всех г = 1,...,га, а тривиальная проверка показывает, что преобразование ^ является ортогональным. Рассмотрим теперь случай, когда S = I и S' = V — прямые, и следовательно, состоят из бесконечного числа векторов. Достаточно положить / = (е) и V = (е'), где |е| = \е'\ = 1, и воспользоваться тем, что существует ортогональное преобразование % пространства М, переводящее еве'. Таким образом, любые две прямые геометрически одинаковы. Следующий по сложности случай — когда фигуры 5 и S' состоят из двух прямых: S — l\ U 12 и Sf = l[ U 1'2. Положим k = (е*) и 1[ — (е£), где |е$| = = \е'{\ = 1 для г = 1 и 2. Теперь, однако, векторы ej и в2 определены не однозначно, а могут быть заменены на —е\ или —в2. При этом их длины не меняются, а скалярное произведение (еьег) может изменить знак, т.е. неизменной остается только его абсолютная величина |(ei,e2)|. На основании предыдущего мы можем сказать, что фигуры S и S' геометрически одинаковы тогда и только тогда, когда |(ei,e2)| — Ke^e^)!- Если <р — угол между векторами е\ и в2, то мы видим, что прямые 1\ и ^ определяют |cos<^|, или же угол <р9 для которого 0 ^ (р ^ 7г/2. В учебниках по геометрии часто говорят о двух углах между прямыми — «остром» и «тупом», но мы выберем один, являющийся острым или прямым. Этот угол ср называется углом между прямыми 1\ и 12. Предшествующее рассуждение показывает, что две пары прямых I\,l2 и 1[,1'2 геометрически одинаковы тогда и только тогда, когда определенные таким образом углы между ними совпадают. Случай, когда фигура S состоит из прямой I и плоскости L (dim/ = 1, dim L = 2) относится, собственно говоря, еще к элементарной геометрии, так как dim(Z + L) ^ 3, и фигура S = I U L помещается в трехмерном пространстве. Но мы рассмотрим его с более абстрактной точки зрения, пользуясь языком евклидовых пространств. Пусть I = (е) и / — ортогональная проекция е на L. Угол <р между прямыми I и V = (/) называется углом между I и L (как уже было сказано выше, он острый или прямой). Косинус этого угла
238 Гл. 7. Евклидовы пространства можно вычислить по формуле: cosy= ;' (7.35) 1Ф1/1 Покажем, что если угол между прямой I и плоскостью L равен углу между прямой V и плоскостью !_', то фигуры S = Z U L и S' = /' U L' геометрически одинаковы. Прежде всего, очевидно, существует ортогональное преобразование, переводящее L в L', так что мы может считать, что L = L'. Пусть I = = (е), |е| = 1, а V — (е'}9 \е'\ = 1, и обозначим через / и /' ортогональные проекции е и е! на L. По условию, 1(е,/)| 1(е',/')1 1/1 И • |/| (7.36) Так как еие' можно представить в виде: е = / + ж и е' — f + у, где ж, у е L-1, то |(е,/)| = |/|2, |(e/,//)l = l/l2- Кроме того, |е| = \е!\ = 1, и соотношение (7.36) показывает, что |/| = |/'|. Поскольку е = ж + /, то |е|2 = |ж|2 + 2(ж,/) + |/|2, откуда с учетом равенств |е|2 =1 и (ж,/) = 0 получаем, что |ж|2 = 1 — |/|2 и, аналогично, |у|2 = 1 — |/'|2. Отсюда вытекает равенство |ж| = \у\. Определим ортогональное преобразование % пространства М = L© L-4 ограничение которого на плоскость L переводит вектор f в ff (это возможно, так как |/| = |/;|), а ограничение на ее ортогональное дополнение L-1 переводит вектор х в у (что возможно ввиду равенства |ж| = |у|). Очевидно, что <% переводит е в е' и, значит, I в I', а по построению, плоскость L в обеих фигурах одна и та же, и преобразование Щ переводит ее в себя. С новым и более интересным обстоятельством мы сталкиваемся, рассматривая случай, когда фигура S состоит из пары плоскостей Ц и 1_2 (сИтЦ = = dim!_2 — 2). Если Ц П L2 Ф (0), то dim(l_i + L2) ^ 3, и мы имеем дело с вопросом элементарной геометрии (который, впрочем, просто рассматривается и на языке евклидовых пространств). Поэтому мы будем предполагать, что Li П 1_2 = (О) и, аналогично, Ц П Ц = (0). Когда фигуры S = Li U L2 и S' = Ц U Ц геометрически одинаковы? Оказывается, для этого необходимо совпадение не одного (как в рассмотренных выше примерах), а двух параметров, которые можно интерпретировать как два угла между плоскостями Ц и L-2. Рассмотрим всевозможные прямые, содержащиеся в плоскости Ц и углы, образованные ими с плоскостью 1_2. Для этого напомним геометрическую интерпретацию угла между прямой I и плоскостью L. Если I = (е), где |е| = 1, то угол (р между I и L определяется формулой (7.35) с условием 0 ^ <р ^ 7г/2, где / — ортогональная проекция вектора е на L. Отсюда е = / + ж, где ж е L1- и, значит, (е,/) = (/,/) + (ж,/) = |/|2, так что соотношение (7.35) дает |cosy>| = |/|. Иными словами, чтобы рассмотреть все углы между прямыми, содержащимися в плоскости Ц, и плоскостью 1_2, нам нужно рассмотреть в l_i окружность, состоящую из векторов длины 1 и длины ортогональных проекций всех этих векторов на плоскость 1_2. Для того, чтобы записать их в виде формулы, рассмотрим ортогональное проектирование пространства М на плоскость 1_2: М —> 1_2. Обозначим через @* ограничение этого
7А. Примеры 239 (7.37) линейного преобразования на плоскость Ц. Тогда интересующие нас углы представляются формулой |cos</?| = |^(е)|, где е — всевозможные векторы в плоскости !_i единичной длины. Ограничимся случаем, когда линейное преобразование 2? является изоморфизмом. Случай, когда это не так, т. е. когда ядро преобразования & не равно (0) и образ не равен 1_2, исследуется аналогично. Так как & — изоморфизм, то существует обратное преобразование 2?~х\ 1-2 —> Ц. Выберем в плоскостях Ц и 1_2 ортонормированные базисы ei,e2 и д\,д2. Пусть вектор е е Ц имеет единичную длину. Обозначим через / = ^(е) и предположив, что / = х\дх + х2д2, наВДем уравнения на координаты х\ и а?2. Положим <^_1Ы = «ei +/3е2, ^_1(^2) = iex+5e2. Так как / = «^(е), то е = &~\f) = xl&>-l(gl)+x2&>-l(g2) = (ах{ + jx2)e{ + (рхх +6х2)е2, и условие \£?~l(f)\ = 1, которое мы запишем в виде |^_1(/)|2 = 1, превращается в равенство (ах\ + "ух2)2 + (@х\ + &Е2)2 = 1, т. е. (а2 + (32)х\ + 2(а7 + 06)xix2 + {l2 + S2)x22 = 1. Уравнение (7.37) с переменными х\,х2 описывает в прямоугольной системе координат, заданной векторами д^ и д2, кривую второго порядка. Эта кривая ограничена, так как |/| ^ |е| (/ — ортогональная проекция вектора е) и, значит, (/2) < 1, т. е. х\ + х\ ^ 1. Как известно из курса аналитической геометрии, такая кривая является эллипсом. В нашем случае он имеет центром симметрии начало координат О, т.е. сохраняется при замене х\ —> —х\, х2 —► — х2 (см. рис. 7.8). Из аналитической геометрии известно, что на эллипсе есть две точки А и А\ симметричные относительно начала координат, такие, что отрезок \ОА\ = \ОА'\ длиннее отрезка \ОС\ для любой точки С эллипса. Отрезок \ОА\ = \ОА1\ называется большой полуосью эллипса. Аналогично, существуют такие симметричные относительно начала координат точки В и В\ что отрезок \ОВ\ = \ОВ!\ короче любого отрезка \ОС\. Отрезок \ОВ\ = \OBf\ называется малой полуосью эллипса. Вспомним, что длина любого отрезка \ОС\, где С — произвольная точка эллипса, дает нам значение costp, где <р — угол между некоторой прямой, содержащейся в Ц, и плоскостью 1_2. Отсюда следует, что cos<^ принимает при одной величине <р наибольшее, а при некоторой другой величине у? — наименьшее значение. Соответствующие углы обозначим через (р\ и (р2. По определению, 0 < ср\ ^ (р2 < 7г/2. Эти два угла и называются углами между плоскостями Ц и L2. Рис. 7.8. Эллипс, описываемый уравнением (7.37)
240 Гл. 7. Евклидовы пространства Опущенный нами случай, когда преобразование & имеет ненулевое ядро, сводится к тому, что изображенный на рис. 7.8 эллипс стягивается в отрезок. Теперь нам остается проверить, что если оба угла между плоскостями (Ц, 1_2) равны соответствующим углам между (Ц, Ц), то фигуры S = Ц U 1_2 и S1 = Ц U Ц геометрически одинаковы, т. е. существует ортогональное преобразование ^, переводящее плоскость Ц в Ц, г = 1,2. Пусть ^ и й - это углы между Ц и !_2, равные, по предположению, углам между Ц и Ц. Рассуждая так же, как и раньше (в случае угла между прямой и плоскостью), мы можем найти ортогональное преобразование, переводящее \-2 в Ц. Значит, мы можем предполагать, что 1_2 — Ц. Обозначим эту плоскость через L. При этом, конечно, углы ср\ и <^2 не изменятся. Пусть cos^i ^ cos (^2 Для пары плоскостей Ц и L. Это значит, что coscpi и cos ^2 — наименьшая и наибольшая полуось эллипса, который мы рассматривали выше. То же верно и для пары плоскостей L\ и L. По построению, это значит, что cos(f\ = \f\\ = |/i| и cos</?2 = I/2I — I/2I' где вектоРы fi G L являются ортогональными проекциями векторов е^ е Li длины 1. Рассуждая аналогичным образом, мы получаем векторы f\ Е L и е!{ Е Ц, г = 1,2. Так как |/il = |/i|, I/2I = I/2I и> по известному свойству эллипса, его большая и малая полуоси ортогональны, то мы можем найти ортогональное преобразование пространства М, переводящее f\ в f[ и /2 в /2 и' произведя его, считать, что fx = f\ и /2 = /2- А поскольку эллипс определяется своими полуосями, то эллипсы С\ и С[, получающиеся в плоскости L из плоскостей Ц и Ц, просто совпадают. Рассмотрим ортогональное проектирование пространства М на плоскость L. Обозначим через & его ограничение на плоскость I_i, а через £?' его ограничение на плоскость Ц. Преобразования g?\ Ц —> L и <^7: Ц —> L будем предполагать, как и раньше, изоморфизмами соответствующих линейных пространств, но совершенно не обязательно — изоморфизмами евклидовых пространств. Изобразим их стрелками: L (7.38) и докажем, что преобразования & и &' отличаются друг от друга на изоморфизм евклидовых пространств Ц и L\. Иначе говоря, мы утверждаем, что преобразование У = (£Р')~ 2? является изоморфизмом евклидовых пространств Ц и Ц. Как произведение изоморфизмов линейных пространств, преобразование У тоже является изоморфизмом, т. е. взаимно однозначным линейным преобразованием. Нам остается проверить, что У сохраняет скалярное произведение. Как было отмечено выше, для этого достаточно проверить, что У сохраняет длины векторов. Пусть х — вектор из L. Если х — О, то вектор
7.4. Примеры 241 У(х) = О в силу линейности У, и утверждение очевидно. Если х ф О, то положим е = а~1х, где а = |ж|, тогда |е| = 1. Вектор 2?(е) содержится в эллипсе С плоскости L. Так как С — С, то ^(е) = &'{е'), где е; — некоторый вектор плоскости Ц и |е'| = 1. Отсюда получаем равенство (с^7)" «^(е) = е', т.е. У(е) = е! и |е'| = 1, а значит, |^(ж)| = а = |ж|, что и требовалось доказать. Теперь рассмотрим базис плоскости L, состоящий из векторов fl и /2, лежащих на большой и малой полуосях эллипса С = С", и дополним его векторами еьег, где £?(ei) — fi. Мы получим таким образом четыре вектора ei,e2,/i,/2 в пространстве Ц + L (как легко проверить, линейно независимые). Аналогично, в пространстве L[ + L построим четыре вектора e!ve!2,j\,J2- Докажем, что существует ортогональное преобразование пространства М, переводящее первую четверку векторов во вторую. Для этого достаточно проверить, что скалярные произведения соответствующих (по порядку записи) векторов совпадают. Здесь наименее тривиальным является соотношение {е!х,е!^) = (еьег), но оно следует из того, что е[ = У(е$), где У — изоморфизм евклидовых пространств Ц и L[. Соотношение {e\,fi) = — (eb/i) вытекает из того, что f{ — ортогональная проекция, (e\,fi) = \f\\2 и аналогично (e\,fi) = \f\\2. Остальные соотношения еще более очевидны. Таким образом, фигуры S = Ц U L2 и S' = \-[ U Ц геометрически одинаковы тогда и только тогда, когда оба угла между плоскостями Li,l_2 и LpL^ совпадают. При помощи теорем, которые будут доказаны в § 7.5, читатель легко сможет рассмотреть ситуацию с парой подпространств Ц,1_2 С М произвольной размерности. В этом случае ответ на вопрос о том, когда две пары подпространств S = Ц U 1-2 и S' = L[ U Ц геометрически одинаковы, определяется совпадением двух конечных наборов чисел, которые можно интерпретировать как «углы» между подпространствами Ц,1_2 и Ц,Ц. Подробное изложение этого вопроса можно найти в книге П. А. Широкова «Тензорное исчисление», указанной в списке литературы (см. § 31.5). Пример 7.7. Когда старший из авторов читал этот курс (кажется, в 1952 или 1953 г.) на механико-математическом факультете МГУ, он рассказал студентам об одном вопросе, возникшем в работе А. Н. Колмогорова, А. А. Петрова и Н. В. Смирнова, ответ на который в одном частном случае был получен А. И. Мальцевым. Этот вопрос был приведен как пример не решенной до сих пор задачи, которой занимались знаменитые математики и которая полностью формулируется в терминах линейной алгебры. На следующей лекции, т. е. через неделю, к нему подошел студент и рассказал о найденном им решении этой задачи. Позже оно было опубликовано1). Вопрос, поставленный в работе А. Н. Колмогорова с соавторами, заключался в следующем. В евклидовом пространстве L размерности п заданы п ненулевых попарно ортогональных векторов жь...,жп, т.е. {xi,Xj) =0 при всех г ф j, i,j — 1,... ,п. При каких значениях т < п существует такое т-мерное подпространство М с L, что ортогональные проекции векторов О Л. Б. Нисневич, В. И. Брызгалов. Об одной задаче n-мерной геометрии// УМН, 1953, 8:4(56), 169-172.
242 Гл. 7. Евклидовы пространства жь ...,хп на него имеют одинаковую длину? А. И. Мальцев доказал, что если все векторы х\,...,хп имеют одинаковую длину, то такое подпространство М любой размерности т <п существует. Общий случай рассматривается следующим образом. Положим \х{\ = щ и допустим, что существует m-мерное подпространство М, ортогональные проекции всех векторов xi на которое имеют одинаковую длину а. Обозначим через & ортогональное проектирование на подпространство М, так что \£?{xi)\ = а. Положим fi = a^lXi, тогда векторы f\,.,fn образуют ортонормированный базис пространства L. Выберем, с другой стороны, в L такой ортонормированный базис е\,..., еп, что векторы е\,..., ет составляют базис в М, т.е. при разложении L = M0M1 (7.39) объединим ортонормированные базисы ei,...,em и em+i,...,en в подпространствах М и М1 соответственно. п Пусть fi=J2 иые>к- Тогда матрицу U — (uki) можно интерпретировать k=\ как матрицу линейного преобразования ^, переводящего векторы ei,...,en в векторы f\,.--,fn, записанную в базисе ei,...,en. Поскольку оба набора векторов ei,...,en и f\,.,fn — ортонормированные базисы, то ^ — ортогональное преобразование, в частности, согласно формуле (7.18), выполнено равенство UU* = Е. (7.40) Из разложения (7.39) вытекает, что каждый вектор fi единственным образом представляется в виде суммы fi = Ui + Vi, где щ е М и vi G М-1. По определению, ортогональная проекция вектора fi на подпространство М равна ^(fi) — иг- По построению базиса е\,..., еп отсюда следует, что т к=\ Согласно условию, мы имеем равенства |^(/J|2 = \&(а^1Х{)\2 = а2а~2:, которые в координатах принимают вид т Е2 2-2-1 fc=l Сложив эти соотношения при всех %— 1,...,п и изменяя в двойной сумме порядок суммирования, с учетом соотношения (7.40) для ортогональной матрицы U мы получаем равенство п п т т п «2 Е ч2 = Е Е«* = Е Е««=™. (7-41) г=1 г=1 /с=1 к=\ г=\
7.4. Примеры 243 / п 2 I V^ -2 из которого следует, что а выражается через а\,... ,ап и га по формуле: Е-Г2) • (7-42) \г=1 / Отсюда в силу равенств \^(fi)\2 = \£?(a^lXi)\2 = а2а~2 получаем выражения _j |^(/,)|2 = т(а?£«гЛ , i=i,...,n. Согласно теореме 7.1, |^(/J| ^ |/$|, а так как, по построению, |/J = 1, то в результате мы имеем неравенства га(а?]Ра~2) < 1, г=1,...,п, откуда следует, что а?]Гагг2 ^т, г= 1,...,п. (7.43) г=1 Таким образом, неравенства (7.43) необходимы для того, чтобы задача была разрешима. Покажем, что они являются также и достаточным условием разрешимости. Сначала разберем случай т = 1. Заметим, что в этой ситуации неравенства (7.43) автоматически выполнены для любого набора положительных чисел а\,...,ап. Поэтому для произвольной системы попарно ортогональных векторов х\,...,хп из L мы должны указать прямую М с L, ортогональные проекции всех этих векторов на которую имеют одинаковую длину. В качестве таковой возьмем прямую М = (у) с вектором ~2 ж- г=\ г где, как и ранее, а? = (ж*,ж*). Поскольку ^^У е М и (ж* - ^^-у,у) = О, то ортогональная проекция вектора ж; на прямую М равна \У\ Очевидно, длина каждой такой проекции 1 {г)1~ \у\ ~ \у\ не зависит от номера вектора ж^. Итак, мы доказали, что для любой системы п ненулевых попарно ортогональных векторов в n-мерном евклидовом пространстве найдется прямая, ортогональные проекции всех векторов на которую имеют одинаковую длину.
244 Гл. 7. Евклидовы пространства Для удобства восприятия в дальнейшем мы обозначим символом Р(га, п) утверждение о том, что если длины а\,...,ап попарно ортогональной системы векторов жь ... ,хп в n-мерном евклидовом пространстве L удовлетворяют условию (7.43), то найдется такое т-мерное подпространство М с Ц что ортогональные проекции £?(х\),..., &(хп) векторов х\,...,хп на него имеют одинаковую длину а, выраженную формулой (7.42). Используя такую договоренность, можно сказать, что мы доказали утверждение Р(1,га) для любого п > 1. Прежде чем перейти к случаю произвольного га, переформулируем задачу в более удобном виде. Пусть /3\,... ,(Зп — произвольные числа, удовлетворяющие условиям: Pi+~- + Pn = m, 0< #< 1, г= 1,...,п. (7.44) Обозначим символом Р'(т,п) следующее утверждение: в евклидовом пространстве L найдется ортонормированный базис g\,...,gn и т-мерное подпространство L' с Ц такие, что ортогональные проекции &'(gi) векторов базиса на L' имеют длины у/Щ, т. е. \&'Ш\2=Ри 1=1,...,П. Лемма. Утверждения Р(т,п) и Р'(т,п) при подходящем выборе чисел cq,..., ап и /3i,..., /?п равносильны. Доказательство. Покажем сначала, что из утверждения Р(т,п) следует Р'(га, п). Здесь нам дан набор чисел /5i,...,/3n» удовлетворяющий условиям (7.44), и известно, что утверждение Р(т,п) справедливо для любых положительных чисел ai,...,an, удовлетворяющих условиям (7.43). По числам /?1,...,/Зп и произвольному ортонормированному базису gl,...,gn определим векторы Xi — /?г~ д„ г = 1,...,п. Ясно, что эти векторы попарно ортогональны, причем \xi\ = /?Г ' . Проверим что числа щ = /?г~ ' удовлетворяют неравенствам (7.43). Действительно, в силу условий (7.44) имеем: а? J2a-2=(3~l'£(3i = prim>m. г=1 г=1 Утверждение Р{т,п) состоит в том, что в пространстве L существует такое га-мерное подпространство М, длины ортогональных проекций векторов xi на которое равны |£*(ач)|=а = \ га \г=1 Е«г Но тогда длины ортогональных проекций векторов д{ на то же подпространство М раВНЫ |^(flfj| = \&(у/Щхг)\ = у/Щ. Теперь докажем, что утверждение Р'(т,п) влечет Р(т,п). Здесь нам дан набор ненулевых попарно ортогональных векторов х\,... ,хп с длинами \х{\ = щ,
7.4. Примеры 245 причем числа с^ удовлетворяют неравенствам (7.43). Положим ,г=1 и проверим, что fy удовлетворяют условиям (7.44). Равенство (3\ Н Ь (Зп — га очевидно следует из определения чисел $. Из неравенств (7.43) вытекает, что -1 -1 и значит, А = оГ2ш I 5>"2) <1. Утверждение Р'(га, га) состоит в том, что существует ортонормированный базис <7i,...,grn и га-мерное подпространство L' с L, длины ортогональных проекций векторов gi на которое равны \^'{9i)\ = VJ3i. Но тогда ортого- нальные проекции попарно ортогональных векторов pi ' gi на то же самое подпространство L' будут иметь одинаковую длину, равную 1. Чтобы доказать утверждение Р(га, га) для заданных векторов х\,...,хп, нам теперь достаточно рассмотреть линейное преобразование Щ пространства L, переводящее векторы gi в ^(ffj — /г» ГДе fi = a7lxi- ^ак как базисы д1,...,дп и /i,...,/n ортонормированы, то ^ — ортогональное преобразование и, следовательно, ортогональные проекции векторов ж* на т-мерное подпространство М = <2f(L/) имеют одинаковую длину. Причем согласно доказанному выше, эта длина равна числу а, определенному формулой (7.42). Лемма доказана. Благодаря лемме вместо утверждения Р(га, га) мы можем доказывать утверждение Р'(га, га). Сделаем это индукцией по га и га. Базу индукции (га = 1, га > 1) мы уже доказали выше. Индуктивный переход осуществим в три шага: 1) из утверждения Р'(га, га) при 2га ^ га + 1 выведем Р'(га, га + 1); 2) покажем, что утверждение Р'(га, га) влечет Р'(п,т — га); 3) докажем, что утверждение Р'(га + 1,га) при всех га > га+ 1 вытекает из утверждения Р1{т!,п) для всех га' ^ га и га > га/. Ш а г 1: из утверждения Р'(га, га) при 2га ^ га + 1 выведем Р'(га, п + 1). Рассмотрим набор положительных чисел /3\,... ,/Зп,/Зп+\, удовлетворяющий условиям (7.44), в которых га заменено на га + 1, с числом 2га < (га + 1). Без ограничения общности можно считать, что (3\ ^ /% ^ • • • ^ Аи-ь Так как /?! + •••+ /?n+i = га и га + 1 ^ 2га, то /?n + /3n+i ^ 1. Действительно, например, для нечетного га обратное предположение дало бы неравенство 4 v ' (п + 1)/2 сумм
246 Гл. 7. Евклидовы пространства из которого очевидно следует /3\ Н Ь /Зп+1 > (п + 1)/2 ^ га, что противоречит сделанному предположению. Рассмотрим (п + 1)-мерное евклидово пространство L и разложим его в прямую сумму L = (е) © (е)-1, где е е L — произвольный вектор длины 1. По предположению индукции, утверждение Р'(т,п) справедливо для чисел /3i,... ,/?п-1 и /? = Рп + Pn+i и n-мерного евклидова пространства (е)-1. Значит, в пространстве (е)± существует ортонормированный базис g\,-,gn и ш-мерное подпространство L', такие, что квадраты длин ортогональных проекций векторов gi на L' равны |^'Ы|2 = А, t=l,...,n-l, |^'(<7n)|2 = /?n + /3n+l. Обозначим через &>\ L —> L' ортогональное проектирование пространства L на L' (при этом, естественно, &>{е) = 0) и построим в L ортонормированный базис <?!,... ,3n+i> для которого \&(gi)\2 = А при всех г = 1,... , п + 1. Положим д{ = д{ для г = 1,...,п - 2 и дп = agn + be, gn+1 = cgn + de, где числа a, 6, с, d подобраны так, чтобы были выполнены условия \9п\ = \9п+\\ = 1» (9п>9п+\) = 0> (?45) \Щдп)\2 = Рп, \Щдп+1)\2 = /Ui. Тогда система векторов #i,... ,</n+i доказывает утверждение Р/(т,п + 1). Соотношения (7.45) переписываются в виде а2 + Ъ2 = с2 + d2 = 1, ас + bd = О, a2(/?n + /W0 = 0п, c2(pn + {3n+i) = /Зп+1. Легко проверить, что эти соотношения будут выполнены, если мы положим Ъ — ±с, d = T&, а=\ -?> т;—» с=\гт;—^ • \Рп + Рп+\ уРп+Рп+1 Прежде чем перейти ко второму шагу, сделаем следующее Замечание. При доказательстве утверждения Р'{т,п) можно предполагать, что Pi < 1 для всех г = 1,..., п. Доказательство. Пусть 1 = (3\ = •-- = fik > /3fc+1 ^ • • • ^ /Зп > 0. Выберем в n-мерном пространстве L произвольное подпространство Ц размерности к и рассмотрим ортогональное разложение L = L& © Ljt\ Отметим, что 1 > /?fc+i ^ • • • ^ /Зп > 0 и /?*+1 + • • • + (Зп = т - к. Поэтому если утверждение Pf(m — к,п — к) справедливо для чисел /Зк+\, • • •, Pn, то в L£ найдется подпространство L^. размерности т — к и ортонормированный базис flffc+i,... ,дп, такие, что \&(д{)\2 = fa при г = /с + 1,... ,п, где ^: 1_£ —» L^ — ортогональное проектирование. Теперь положим L' = Ц © L'fc и выберем в Ц произвольный ортонормированный базис д1,...,дк. Тогда если ^': L —> L' — ортогональное проектирование, то \^'(gi)\2 = 1 при г = 1,..., к и \&'(дг)\2 = fa при г = к + 1,... ,п. Ш а г 2: утверждение Р'(т,п) влечет Р'(п,т — п).
7.5. Симметрические преобразования 247 Рассмотрим п чисел /3\ > • • • ^ /?п, удовлетворяющих условиям (7.44), в которых число га заменено на п — т. Нам нужно построить ортогональное проектирование &'\ L —> L' n-мерного евклидова пространства L на (га — п)-мерное подпространство L/ и ортонормированный базис д{1... ,дпв L, для которых выполнены условия |<^'(#г)|2 = А, г= 1,...,п. По предыдущему замечанию можно считать, что все /% < 1. Тогда числа /3? = 1 — /% удовлетворяют условиям (7.44) несогласно утверждению Р'(га, п), существует ортогональное проектирование 2?\ L —> L пространства L на га-мерное подпространство^ и ортонормированный базис д\,--,дп, для которых выполнены условия |^(flO|2 = Pi- В качестве искомого (га — п)-мерного подпространства возьмем L' = L и обозначим через 2?' ортогональное проектирование на L'. Тогда для каждого г = 1,... ,п выполнены равенства Яг = П9г) + *"(*). 1 = Ш2 = \П9г)\2 + 1^'Ы|2 = Р'г + 1^'Ы|2> из которых следует, что \£?'{д^\2 = 1 — Р[ — Pi- Ш а г 3: утверждение Р'(т + 1, п) при всех п > га + 1 вытекает из утверждения Р'(га/, п) для всех га/ ^ га и п > га7. Согласно сделанному предположению, утверждение Р'{т,п) справедливо, в частности, при п = 2т+1. Благодаря шагу 2 можно утверждать, что имеет место Р (т + 1,2га + 1), а так как 2(га + 1) < (2га + 1) + 1, то ввиду шага 1 заключаем, что Р'{т + 1, п) выполнено для всех п ^ 2га + 1. Осталось доказать утверждения Р'(т + 1, и) при га + 2 ^ п < 2га. Но эти утверждения вытекают из Р'{п— (га + 1),п) согласно шагу 2. Единственное, что нужно при этом проверить, это выполнение неравенств 1 ^ п — (га+ 1) ^ га, которые непосредственно следуют из предположения о том, что га + 2 ^ п ^ 2га. § 7.5. Симметрические преобразования Как мы заметили в начале § 7.1, для евклидова пространства L существует естественный изоморфизм L ^ L*, который дает нам право отождествлять в этом случае пространство L* с L. В частности, используя определение, данное в § 3.7, мы можем для любого базиса е\,...,еп пространства L определить взаимный базис /i,...,/n пространства L условием (/$, е$) = 1» (Д, ej) = 0 при г ф j. Таким образом, ортонормированный базис — это базис, который является сам себе взаимным. Таким же образом мы можем считать, что для любого линейного преобразования я/: L —► L сопряженное преобразование j^*: L* —> L*, определенное в § 3.7, является линейным преобразованием евклидова пространства L в себя и определяется условием (л/*(*)>У) = {*>**№) (7.46) для любых векторов ж, г/ G L. Согласно теореме 3.15 матрица линейного преобразования si в любом базисе пространства L и матрица сопряженного преобразования ^* во взаимном базисе являются транспонированными друг другу. В частности, матрицы преобразований sf и я/* в любом ортонорми-
248 Гл. 7. Евклидовы пространства рованном базисе транспонированы друг другу. Это согласуется с принятым обозначением транспонированной матрицы: А*. Легко проверить, что и наоборот, если матрицы преобразований si и Зё в некотором ортонормированном базисе транспонированы друг другу, то преобразования si и 3& сопряжены. Рассмотрим, например, ортогональное преобразование ^, для которого, по определению, выполнено условие (*2f(x),$/(y)) = (х,у). Согласно формуле (7.46) мы имеем равенство (fy{x),fy(y)) = (x,ty**2f(y)), откуда следует (х ,*%/*& (у)) = (ж,у). Значит, (x,&*fy(y) — у) = 0 для всех векторов ж, откуда вытекает равенство ^*^(y) = у для всех векторов у е L. Иначе говоря, тот факт, что W*ty = & - тождественное преобразование, равносилен условию ортогональности преобразования У/. В матричной форме — это соотношение (7.18). Определение. Линейное преобразование si евклидова пространства называется симметрическим, или самосопряженным, если si* — si. Иначе говоря, для симметрического преобразования si и любых векторов х и у должно быть выполнено условие (si{x),y) = {x,si(y)\ (7.47) т.е. билинейная форма (р(х,у) = (si(x),y) — симметрическая. Как мы видели, отсюда следует, что в любом ортонормированном базисе матрица преобразования si — симметрическая. Симметрические линейные преобразования играют очень большую роль в математике и ее приложениях. Наиболее существенные их приложения относятся к квантовой механике, где симметрические преобразования бесконечномерного гильбертова пространства (см. примечание на с. 218) соответствуют так называемым наблюдаемым физическим величинам. Мы, однако, ограничимся случаем конечномерных пространств. Как мы увидим дальше, и при этом ограничении теория симметрических линейных преобразований имеет очень много приложений. Основным свойством симметрических линейных преобразований конечномерных евклидовых пространств является следующее. Теорема 7.11. Всякое симметрическое линейное преобразование вещественного пространства имеет собственный вектор. Ввиду очень большого числа приложений этой теоремы мы изложим три ее доказательства, основанные на различных принципах. Первое доказательство. Пусть si — симметрическое линейное преобразование евклидова пространства L. Если dimL > 2, то, согласно теореме 4.5, оно имеет одномерное или двумерное инвариантное подпространство L'. Очевидно, что ограничение преобразования si на инвариантное подпространство L' тоже будет симметрическим преобразованием. Если dimL7 = 1, то это означает, что I/ = (е), где е ф 0, и значит, е — собственный вектор. Следовательно, для доказательства теоремы нам достаточно показать, что симметрическое линейное преобразование в двумерном подпространстве Y! имеет собственный вектор. Выбрав в L' ортонормированный базис, мы полу-
7.5. Симметрические преобразования 249 чим для si симметрическую матрицу в этом базисе: Для того, чтобы найти собственный вектор преобразования &/, мы должны найти вещественный корень многочлена \А — tE\. Этот многочлен имеет вид (а - t)(c -t)-b2 = t2 - (а + c)t + ac-b2 и имеет вещественный корень тогда и только тогда, когда его дискриминант неотрицателен. Но дискриминант этого квадратного трехчлена равен (а + с)2 - 4(ас - Ъ2) = (а - с)2 + 4Ь2 ^ 0. Второе доказательство основано на использовании комплексифика- ции Lc вещественного пространства L. Следуя конструкции, изложенной в § 4.3, мы можем распространить преобразование &/ и на векторы пространства 1_с. Согласно теореме 4.2, полученное преобразование g/c: Lc —► Lc уже будет иметь собственный вектор е е Lc и собственное значение Л е С, так что £/с(е) — Ле. Мы продолжим скалярное произведение (ж, у) с пространства L на 1_€ так, чтобы там оно определяло эрмитову форму (см. определение на с. 215). Ясно, что это можно сделать только одним способом — определив для векторов а\ = х\ +гу\ и а,2 = Х2 + гу2 пространства Lc скалярное произведение по формуле (аиа2) = (xi,x2) + (yi,y2) + г((УьХ2) - (хиу2)). (7.48) Проверка того, что так определенное скалярное произведение {а\,а2) действительно определяет в 1_с эрмитову форму, сводится к проверке полуто- ралинейности (в этом случае достаточно отдельно рассмотреть умножение вектора а\ и вектора а2 на вещественное число и на г) и эрмитовости. Тут все вычисления совершенно тривиальны, и мы их опускаем. Важным новым свойством полученного скалярного произведения (01,02) является его положительная определенность, т. е. то, что, как и скалярное произведение, (а, а) вещественно (это следует из эрмитовости) и (а, а) > 0 при а^О (это прямо вытекает из формулы (7.48) при х\ = х2, ух = у2). Очевидно, что и для нового скалярного произведения мы имеем аналог соотношения (7.47), т.е. (^с(а0,а2) =(ab^C(a2))f (7.49) иначе говоря, форма ср(а\,а2) = ^s/c(ai),a2) — эрмитова. Применим (7.49) к векторам а\ = а2 = е, тогда мы получим (Ле, е) = (еДе). В силу эрмитовости мы имеем равенства (Ле, е) = Л(е,е) и (е, Ле) = Л(е, е), откуда следуе_т, что А(е, е) = Л(е, е). Так как (е,е) > 0, то отсюда вытекает, что Л = Л, т. е. число Л вещественное. Таким образом, характеристический многочлен \я/с — tS\ преобразования s/c имеет вещественный корень Л. Но базис пространства L как пространства над R является базисом пространства 1_с над С,
250 Гл. 7. Евклидовы пространства и матрица преобразования я/с в этом базисе совпадает с матрицей преобразования si/. Иначе говоря, \s/c — tS\ ~\s^/ — tS\ и значит, характеристический многочлен \s/ — tS\ преобразования s/ имеет вещественный корень Л, а это и означает, что преобразование si/: L —> L имеет в пространстве L собственный вектор. Третье доказательство опирается на некоторые аналитические факты, которые мы сейчас приведем. Прежде всего, заметим, что евклидово пространство можно естественным образом превратить в метрическое, определив расстояние г (ж, у) между векторами ж и у соотношением г (ж, у) — \х — у\. Тем самым, в евклидовом пространстве L определены понятия сходимости, предела, непрерывной функции, замкнутого и ограниченного множеств, см. с. 14. Теорема Болъцано-Вейерштрасса утверждает, что для любого замкнутого и ограниченного множества X в конечномерном евклидовом пространстве L и любой непрерывной функции <р(х) на X существует вектор жо € X, на котором ip(x) принимает свое наибольшее значение, т. е. (р(хо) ^ ср(х) для любого х G X. Эта теорема хорошо известна из анализа для случая, когда множество X — отрезок на прямой. Ее доказательство в общем случае, в точности такое же, обычно излагается несколько позже. Здесь мы используем эту теорему без доказательства. Применим теорему Больцано-Вейерштрасса к множеству X, состоящему из всех векторов х пространства L с \х\ = 1, т.е. к сфере радиуса 1, и функции (р(х) = (х9я/(х)). Эта функция непрерывна не только на X, но и на всем пространстве L. Действительно, достаточно выбрать в пространстве L какой-нибудь базис и записать в нем скалярное произведение (x,si/(x)) как квадратичную форму от координат вектора х. Нам важно всего лишь то, что в результате получается многочлен от координат. После этого достаточно воспользоваться известными теоремами о том, что сумма и произведение непрерывных функций непрерывны. После этого вопрос сведется к проверке того, что любая координата вектора х является непрерывной функцией от ж, но это совершенно очевидно. Таким образом, функция (х,д/(х)) принимает наибольшее значение на множестве X при некотором жо = е. Обозначим это значение через Л. Следовательно, (ж,^(ж)) < Л для любого ж, для которого |ж| = 1. Для любого ненулевого вектора у положим ж = у/|у|. Тогда |ж| = 1 и, применяя к этому вектору полученное неравенство, мы видим, что (у, я/(у)) ^ А(у,у) для любого у (это, очевидно, справедливо и для у = О). Докажем, что число Л является собственным значением преобразования «й^. Для этого запишем условие, определяющее Л, в виде: (у,^(»))<А(у,у), А = (е,^(е)), |е| = 1, (7.50) для любого вектора у G L. Применим (7.50) к вектору у = е + ez, где и число е, и вектор z e L пока произвольны. Раскрывая выражения (у, si/(у)) = (e + ez,£/(e) +8£/{z)) и (у'»У) — (е + £z>е + £*)» мы получим неравенство
7.5. Симметрические преобразования 251 (е, si{e)) + ф, si{z)) + e(z, si(e)) + e2{si(z)i si(z)) ^ < A ((e, e) + e(e, z) + e{z, e) + e2(z, *)) . Ввиду симметричности преобразования л^, на основании свойств, входящих в определение евклидова пространства, и вспоминая, что (е, е) = 1, (e,si(e)) = Л, после сокращения общего слагаемого (е, ^(е)) = Л(е, е) в обеих частях предыдущего неравенства мы получим: 2s(e, s/(z) - Xz) + s2 ((*t(z), s/(z)) - \(z, z)) ^ 0. (7.51) Заметим теперь, что любое выражение as + be2 в случае а ф 0 принимает положительное значение при некотором е. Для этого нужно выбрать значение \е\ достаточно малым, чтобы а + be имело тот же знак, что и а, а потом выбрать надлежащим образом знак у е. Таким образом, неравенство (7.51) всегда приводит к противоречию, кроме случая (е, s/(z) — Xz) = 0. Если для некоторого вектора z ф О выполнено si{z) = Xz, то z — собственный вектор преобразования si с собственным значением Л, что мы и хотели доказать. Если же si{z) — Xz фО для всех z ф 0, то ядро преобразования si — XS равно (0). Из теоремы 3.10 следует, что тогда преобразование si — XS является изоморфизмом, и его образ равен всему пространству L. Это значит, что для любого и Е L можно подобрать такой вектор zgL, что и = si{z) — Xz. Тогда в силу соотношения (e,si(z) — Xz) = 0 мы получим, что для любого вектора и Е L выполнено равенство (е, и) — 0, но это невозможно по крайней мере для и = е, так как |е| = 1. Дальнейшая теория симметрических преобразований строится на основании очень простых рассуждений. Теорема 7.12. Если подпространство L' евклидова пространства L инвариантно относительно симметрического преобразования s#', то и его ортогональное дополнение (L7) тоже инвариантно. Доказательство вытекает непосредственно из определений. Пусть вектор у Е (L7) , тогда (ж, у) = 0 для всех х Е L'. Ввиду симметричности преобразования si мы имеем соотношение а ввиду инвариантности L' получаем, что si(x) E L/. Значит, (x,si(y)) = 0 для всех векторов х Е L/, т.е. si {у) E (L7)^, что и доказывает теорему. Комбинация теорем 7.11 и 7.12 дает основной результат теории симметрических преобразований. Теорема 7.13. Для всякого симметрического преобразования si конечномерного евклидова пространства L существует ортонормированный базис этого пространства, состоящий из собственных векторов преобразования s#'. Доказательство проводится с помощью индукции по размерности пространства L. Действительно, согласно теореме 7.11, преобразование si имеет
252 Гл. 7. Евклидовы пространства по крайней мере один собственный вектор е. Можно считать, что |е| = 1. Положим L = (е) 0 (е)^, где (е)± имеет размерность п — 1 и, по теореме 7.12, инвариантно относительно srf'. По предположению индукции, в пространстве (е)± нужный базис имеется. Присоединяя к нему вектор е, получаем искомый базис в L. Обсудим полученный результат. Для симметрического преобразования я/ мы имеем ортонормированный базис е\,...,еп, состоящий из собственных векторов. Но в какой мере однозначно определяется этот базис? Пусть вектору вг соответствует собственное значение Л^. Тогда в нашем базисе преобразование s/ имеет матрицу А = /Л! О ... 0\ О А2 ••• О Vo о ... xj (7.52) Но, как мы видели в § 4.1, собственные значения линейного преобразования я/ совпадают с корнями характеристического многочлена п \е/ - Щ = \А- tE\ = Y[(\i - t). Таким образом, собственные числа Ai,...,An преобразования si/ определяются однозначно. Пусть среди них разные — это Ль..., А&. Если собрать вместе все векторы построенного ортонормированного базиса, соответствующие одному и тому же собственному значению А; (из числа различных Ль..., Л^), и рассмотреть натянутое на них подпространство, то мы, очевидно, получим собственное подпространство LAi (см. определение на с. 145). При этом имеет место ортогональное разложение L = LAl 0 • • • 0 LAfc, где LA. _L lXj при всех г ф j. (7.53) Ограничение s/ на собственное подпространство LAi дает преобразование \{£, и в этом подпространстве любой ортонормированный базис состоит из собственных векторов (с собственным значением А;). Итак, мы видим, что симметрическое преобразование s/ однозначно определяет только собственные подпространства LAi, а в каждом из нихортонор- мированный базис можно выбрать произвольным образом. Объединив вместе эти базисы, мы получим произвольный базис пространства L, удовлетворяющий условиям теоремы 7.13. Заметим, что каждый собственный вектор преобразования s/ принадлежит одному из подпространств LA.. Если два собственных вектора х и у соответствуют различным собственным значениям А^ ф Aj, то они содержатся в разных подпространствах LAi и 1_А и, ввиду ортогональности разложения
7.5. Симметрические преобразования 253 (7.53), должны быть ортогональны. Таким образом, мы получаем следующее утверждение: Т е о р е м а 7.14. Собственные векторы симметрического преобразования, отвечающие различным собственным значениям, ортогональны. Впрочем, эту теорему можно легко доказать и непосредственным вычислением. Доказательство. Пусть х и у — собственные векторы симметрического преобразования s/, соответствующие различным собственным значениям А; и А^. Подставим в равенство (s/(x),y) = (x,s/(y)) выражения s/(x) = \{Х и я/(у) = Xjy. Отсюда получим (А* — \j)(x,y) = 0, и так как А* Ф \j, то (ж, у) = 0. Теорему 7.13 часто удобно формулировать как теорему о квадратичных формах, используя теорему 6.1 из § 6.1 и возможность отождествить пространство L* с L, если пространство L евклидово. Действительно, теорема 6.1 показывает, что любая билинейная форма <р на евклидовом пространстве L может быть представлена в виде <p(x,y) = (x,s/(y)), (7.54) где s/ — однозначно определяемое билинейной формой <р линейное преобразование пространства L в L*, т.е., с учетом отождествления L* с L, преобразование пространства L в себя. Очевидно, что симметричность преобразования s/ совпадает с симметричностью билинейной формы <р. Поэтому установленное выше взаимно однозначное соответствие между симметрическими билинейными формами и линейными преобразованиями устанавливает такое же соответствие между квадратичными формами и симметрическими линейными преобразованиями евклидова пространства L, причем ввиду соотношения (7.54) симметрическому преобразованию s/ соответствует квадратичная форма ф(х) = (ж,^(ж)), и любая квадратичная форма ф{х) однозначно представима в таком виде. Если в некотором базисе е\,..., еп преобразование s/ имеет диагональную матрицу (7.52), то для вектора х = х\е\ + ••• + хпеп квадратичная форма ф(х) имеет в этом базисе канонический вид <ф(х) = Xix2x + • • • + \пх2п. (7.55) Таким образом, теорема 7.13 эквивалентна следующему утверждению: Теорема 7.15. Для любой квадратичной формы в конечномерном евклидовом пространстве существует ортонормированный базис, в котором она имеет канонический вид (7.55). Теорему 7.15 иногда полезно формулировать как теорему о произвольных векторных пространствах. Теорема 7.16. Для двух квадратичных форм в конечномерном векторном пространстве, одна из которых положительно определена, существу-
254 Гл. 7. Евклидовы пространства ет такой базис (уже не обязательно ортонормированный) у в котором они обе имеют канонический вид (7.55). В этом случае говорят, что в соответствующем базисе эти квадратичные формы приводятся к сумме квадратов (даже если среди коэффициентов А; в формуле (7.55) есть отрицательные). Доказательство. Пусть ф\(х) и ф^(х) — Две такие квадратичные формы, для определенности будем считать, что ф\(х) положительно определена. Согласно теореме 6.5 в рассматриваемом векторном пространстве L существует базис, в котором форма ф\{х) имеет канонический вид (7.55). Так как, по условию, квадратичная форма ф\(х) положительно определенная, то для нее в формуле (7.55) все числа А; положительные, и следовательно, существует такой базис ei,...,en пространства L, в котором ф\(х) приводится к виду ф(х) = х\ Н Ь х\ (7.56) Рассмотрим в качестве скалярного произведения (ж, у) в пространстве L симметрическую билинейную форму (р(х,у), соответствующую, согласно теореме 6.2, квадратичной форме ф\{х). Тем самым мы превратим L в евклидово пространство. Как видно из формул (6.14) и (7.56), для этого скалярного произведения базис ei,...,en является ортонормированным. Тогда, по теореме 7.15, существует ортонормированный базис е\,..., е!п пространства L, в котором форма ф2(х) имеет канонический вид (7.55). Но так как базис е\,...,е'п ортонормированный относительно определенного нами с помощью квадратичной формы ф\{х) скалярного произведения, то в нем ф\{х) по-прежнему имеет вид (7.56), что и утверждает теорема. Замечание 1. Очевидно, что теорема 7.16 останется верной, если в ее формулировке заменить условие положительной определенности одной из форм условием отрицательной определенности. Действительно, если ф(х) — отрицательно определенная квадратичная форма, то форма —ф(х) — положительно определенная, и обе они имеют канонический вид в одном и том же базисе. Без предположения о положительной (или отрицательной) определенности одной из квадратичных форм теорема 7.16 не верна. Чтобы показать это, выведем одно необходимое (но не достаточное) условие того, что две квадратичные формы ф\(х) и fa(х) одновременно приводятся к сумме квадратов. Пусть А\ и A<i — их матрицы в некотором базисе. Если квадратичные формы ф\(х) и ф2(х) одновременно приводятся к сумме квадратов, то в некотором другом базисе их матрицы А\ и А!2 диагональны, т. е. А\ О а<1 \0 О О Д = а. */ /А о о & \о о о /V
7.5. Симметрические преобразования 255 п Тогда многочлен lAjt + A^I равен П(аг* + А)> т-е- он разлагается на ли- г=1 нейные множители oat + /%. Но согласно формуле (6.10) замены матрицы билинейной формы при изменении базиса, матрицы А\,А\ и А2,А!2 связаны соотношениями А\ =C*AiC, А'2 = С*А2С, где С — некоторая невырожденная матрица, т.е. \С\ ф 0. Поэтому 1^^ + 41 = \C*(Ait + А2)С\ = \C*\\Ait + A2\\C\, откуда с учетом равенства \С*\ = \С\ получаем соотношение \Ait + A2\ = \C\-2\A'lt + A!2\, из которого следует, что многочлен l^it + ^l тоже разлагается на линейные множители. Таким образом, для того, чтобы две квадратичные формы ф\(х) и ф2(х) с матрицами А\ и А2 одновременно приводились к сумме квадратов, необходимо, чтобы многочлен |Ai* + A2\ разлагался на линейные вещественные множители. Теперь при п = 2 положим ф\(х) = х\ — х\ и ф2(х) = х\х2. Эти квадратичные формы не являются ни положительно, ни отрицательно определенными. Их матрицы имеют вид: и многочлен |.Ait + A2| = —{t2 + 1), очевидно, на вещественные линейные множители не разлагается. Значит, квадратичные формы ф\(х) и гр2(х) не приводятся одновременно к сумме квадратов. Вопрос о приведении пары квадратичных форм с комплексными коэффициентами к сумме квадратов (с помощью комплексного линейного преобразования) подробно рассмотрен, например, в книге Ф. Р. Гантмахера «Теория матриц», указанной в списке литературы в конце книги (см. теорему 7 в § 6 гл. XII). Замечание 2. Последнее приведенное нами доказательство теоремы 7.11 позволяет интерпретировать наибольшее собственное значение Л симметрического преобразования si как максимум квадратичной формы (x,si(x)) на сфере \х\ = 1. Пусть А; — другие собственные значения, так что (х,д/(х)) = Х\х2 Н Ь Апх^. Тогда А — это наибольшее из всех А;. Действительно, предположим, что собственные значения занумерованы в порядке убывания: Ai ^ A2 ^ • • • ^ Ап. Тогда Aire? Н + \пх\ ^ Ai (х\ + • • • + xlj , и максимальное значение формы (х,я/(х)) на сфере \х\ — 1 равно Ai (оно достигается на векторе с координатами х\ = 1, х2 — - • • = хп = 0). Значит, Ai =Л. Существует аналогичная характеристика и других собственных значений Xi — теорема Куранта-Фишера, которую мы приведем без доказательства.
256 Гл. 7. Евклидовы пространства Рассмотрим всевозможные векторные подпространства L' С L размерности к. Ограничим квадратичную форму (x,srf{x)) на подпространство L' и рассмотрим ее значения на пересечении L' с единичной сферой, состоящей из всех векторов х g L' с условием |ж| = 1. Согласно теореме Больцано-Вейерштрасса ограничение формы (х,я/(х)) на L' в некоторой точке сферы принимает свое максимальное значение А', которое, конечно, зависит от подпространства L'. Теорема Куранта-Фишера утверждает, что наименьшее получающееся таким образом число (при вариации подпространства L' размерности к) равно собственному значению An_&+i. Замечание 3. Собственные векторы связаны с задачей о нахождении максимума и минимума. Пусть f(x\,... ,хп) — вещественнозначная дифференцируемая функция от п вещественных переменных. Некоторая точка называется критической точкой функции /, если в ней производные функции / по всем переменным (xi,...,xn), т.е. производные по всем направлениям вообще, выходящим из этой точки, равны нулю. В анализе доказывается, что при некоторых естественных ограничениях это условие является необходимым (но не достаточным) для того, чтобы функция / принимала в данной точке максимальное или минимальное значение. Рассмотрим квадратичную форму f(x) = (х,я/(х)) на единичной сфере \х\ = 1. Нетрудно показать, что для любой точки этой сферы все достаточно близкие к ней точки описываются некоторой системой координат, так что наша функция / может рассматриваться как функция от этих координат. При этом критическими точками функции (х,я/(х)) оказываются в точности те точки сферы, которые являются собственными векторами симметрического преобразования srf. Пример 7.8. Пусть в трехмерном пространстве с координатами ж, у, z эллипсоид задан уравнением az bz cz Выражение в левой части (7.57) можно записать в виде ф{х) = (x,srf(x)), где / \ А, \ ( Х У Z \ x = (x,y,z), *t(x)=[tf, ^ ^)- Предположим, что 0 < а < Ъ < с. Тогда наибольшее значение, которое квадратичная форма ф{х) принимает на сфере \х\ = 1, есть А = 1/а2, оно достигается на векторах (±1,0,0). Если |^(ж)| ^ ^ ПРИ 1Ж1 — 1> то Для любого вектора у ф 0, полагая х = у/\у\, получаем \ф(у)\ < Х\у\ . Для вектора у = О это неравенство очевидно, поэтому оно справедливо вообще при всех у. При \ф(у)\ = 1 из него следует, что \у\2 ^ j. Это значит, что самый короткий вектор г/, удовлетворяющий уравнению (7.57), есть вектор (±а, 0,0). Отрезки, имеющие начало в точке (0,0,0), а конец — в точках (±а, 0,0), называются малыми полуосями эллипсоида (иногда этим термином обозначается их длина). Аналогично, наименьшее значение, которое квадратичная форма ф(х) принимает на сфере \х\ = 1, равно 1/с2, оно достигается на векторах (0,0, ±1) единичной сферы. Отрезки, соответствующие векторам (0,0, ±с), называются большими полуосями эллипсоида. Вектор (0, ±6,0) соответствует критиче-
7.6. Приложения к механике и геометрии 257 ской точке квадратичной формы ф(х), которая не является ни максимумом, ни минимумом. Это — так называемая точка минимакса, т. е. при движении из этой точки по одному направлению функция ф{х) будет увеличиваться, а по другому — уменьшаться (см. рис. 7.9). Отрезки, соответствующие векторам (О, ±Ь, 0), называются средними полуосями эллипсоида. Все, что было до сих пор изложено в этой главе (за исключением § 7.3 об ориентации вещественного евклидова пространства), дословно переносится на комплексные евклидовы пространства, если в них скалярное произведение определено при помощи положительно определенной эрмитовой формы (р(х,у). Условие положительной определенности означает, что для соответствующей квадратично- эрмитовой формы ф(х) — (р(х,х) выполнено неравенство ф(х) > 0 при всех ж^О. Обозначая, как и раньше, скалярное произведение через (ж, у), последнее условие записывается в виде (ж, х) > 0 при всех х ф О. Сопряженное преобразование «яЛ, как и прежде, определяется условием (7.46). Но теперь матрица преобразования ^* в ортонормированном базисе получается из матрицы преобразования srf не просто транспонированием, а транспонированием и комплексным сопряжением. Аналог симметрического преобразования определяется как такое преобразование «я^, что.соответствующая ему билинейная форма (х,£/(у)) является эрмитовой. Принципиальным фактом является то, что в квантовой механике имеют дело с комплексным пространством. Теперь мы можем сформулировать сказанное ранее следующим образом: наблюдаемые физические величины соответствуют эрмитовым преобразованиям в бесконечномерном комплексном гильбертовом пространстве. Теория эрмитовых преобразований в конечномерном случае строится даже проще, чем теория симметрических преобразований в вещественных пространствах, так как нет нужды доказывать аналоги теоремы 7.11: нам уже известно, что любое линейное преобразование в комплексном пространстве имеет собственный вектор. Из определения эрмитовости следует, что собственные значения эрмитова преобразования вещественны. Для эрмитовых преобразований верны теоремы, доказанные в этом параграфе (с теми же доказательствами). Преобразование ^, сохраняющее скалярное произведение, называется в комплексном случае унитарным. Рассуждения, проведенные в § 7.2, показывают, что для унитарного преобразования fy существует ортонормирован- ный базис, состоящий из собственных векторов, а все собственные значения преобразования <%£ являются комплексными числами, по модулю равными 1. § 7.6*. Приложения к механике и геометрии Мы приведем два примера из разных областей — механики и геометрии — когда теоремы предшествующего параграфа играют ключевую роль. Так как 9 А. О. Ремизов, И. Р. Шафаревич
258 Гл. 7. Евклидовы пространства эти вопросы будут впоследствии рассмотрены в соответствующих курсах, то мы позволим себе здесь быть более краткими как в определениях, так и в доказательствах. Пример 7.9. Рассмотрим движение механической системы в малой окрестности ее положения равновесия. Говорят, что система имеет п степеней свободы, если в некоторой окрестности ее состояние определяется п так называемыми обобщенными координатами q\,...,qn, которые мы будем считать координатами вектора q в некоторой системе координат, причем начало координат 0 находится в положении равновесия нашей системы. Движение системы определяет зависимость вектора q от времени t. Мы будем считать, что исследуемое положение равновесия определяется локальным строгим минимумом ее потенциальной энергии П. Если это значение равно с, а потенциальная энергия есть функция U(q\,... ,qn) обобщенных координат (предполагается, что она не зависит от времени), то это значит, что П(0,..., 0) = с и II(gi,..., qn) > с для всех остальных значений q\,..., qn, близких к нулевым. Из того, что минимальному значению соответствует критическая точка функции П, следует, что в точке О все производные Ш обращаются в нуль. Поэтому при разложении функции H(q\,... ,qn) в ряд по степеням переменных q\,..., qn в точке О линейные члены будут равны п нулю, и мы получим выражение H(q\,..., qn) = с + ]П Ъ^ qiqj -\ , где Ъц — некоторые постоянные, а многоточие означает члены степени, выше второй. Поскольку мы рассматриваем движения, недалеко уходящие от точки О, то можем пренебречь этими членами. В таком приближении мы и будем рассматривать задачу, т. е. положим п П(дь...,дп) = с+^2 bijQiqj- Так как TL(qi,...,qn) > с для всех значений q\,...,qn, кроме нулевых, то п квадратичная форма J2 bij qiqj является положительно определенной. Кинетическая энергия Т является квадратичной формой от так называемых обобщенных скоростей ^,--,^jf, которые обозначаются также через 9i,...,9n, т.е. п где a,ij = aji — функции от q (предполагается, что от времени t они не зависят). Рассматривая, как и для потенциальной энергии, только значения <^, близкие к нулю, мы можем заменить в (7.58) все функции ац постоянными aij(0), что и будет далее предполагаться. Кинетическая энергия всегда положительна, кроме случая, когда все qi = 0, поэтому квадратичная форма (7.58) положительно определена. Движение широкого класса механических (так называемых натуральных) систем описывается довольно сложной системой дифференциальных
7.6. Приложения к механике и геометрии 259 уравнений — уравнениями Лагранжа второго рода: d_ /дТ\ _ дТ _ _дП eft \dqij dqi %' Применение теоремы 7.16 дает возможность свести их в рассматриваемой ситуации к гораздо более простым. Для этого найдем систему координат, п п в которой квадратичная форма ]Р aijXiXj приводится к виду J2 х\, а квад- i,j=\ г=\ п п ратичная форма Yl hjXiXj — к виду ^2 \х\. При этом в рассматриваемом п случае форма ]Г) by XiXj положительно определена, а значит, все А; > 0. г,3 = \ В такой системе координат (мы будем снова обозначать их через q\,..., qn) система уравнений (7.59) распадается на независимые уравнения —ф = -\^и г=1,...,гс, (7.60) которые имеют решения qi = Ci cos y/Xit + di sin y/Xit, где q и di — произвольные постоянные. Это показывает, что «малые колебания» являются периодическими по каждой координате qi. Так как они ограничены, то наше положение равновесия О является устойчивым. Если бы мы рассматривали состояние равновесия, являющееся критической точкой потенциальной энергии П, но не являющееся строгим минимумом, то в уравнениях (7.60) мы не могли бы гарантировать того, что все А; > 0. Тогда для тех г, для которых Xi < 0, мы получили бы решения qi = q ch\/—Xit + di sh\/—A^t, которые могут неограниченно возрастать с ростом t. Точно так же для А; = 0 мы получили бы неограниченное решение <& = q + dit. Собственно говоря, мы сделали всего лишь следующее: заменили исходные данные нашей задачи на близкие к ним, в результате чего задача стала гораздо более простой. Такая процедура обычна в теории дифференциальных уравнений, и там доказывается, что решения упрощенной системы уравнений в определенном смысле мало отличаются от решений исходной системы, причем величину этого отклонения можно оценить в зависимости от величины членов, которыми мы пренебрегли. Такая оценка имеет место на конечном интервале времени, длина которого тоже зависит от величины пренебрегае- мых членов. В этом и состоит оправдание сделанных нами упрощений. Красивый пример, исторически игравший большую роль, дают поперечные колебания нити с насаженными на нее бусинками1). Пусть имеется невесомая и идеально гибкая нить, которая закреплена в концах. На ней неподвижно закреплены п бусинок с массами т\,... ,шп, и пусть они делят всю нить на участки длины 1о,1\,...,1п- Мы будем предполагать, что в первоначальном состоянии нить расположена по оси х и обо- 1) Этот пример заимствован из книги Ф. Р. Гантмахера и М. Г. Крейна «Осцилляционные матрицы и ядра и малые колебания механических систем», М. 1950. 9*
260 Гл. 7. Евклидовы пространства значим через у\,...,уп перемещения бусинок по оси у. Тогда кинетическая энергия этой системы имеет вид 1 п ™*у% г=1 Считая натяжение нити (ввиду малости перемещений) постоянным и равным сг, мы получим для потенциальной энергии выражение П = аА1, где п Al = Yl Ak — удлинение всей нити и Д/г- г=0 соответствующего k. При этом мы знаем выражение А^ через If. удлинение участка нити, А/г = ф1 + (Уг+1 " Vif k, г = 0,. .,71, где уо = уп+{ = 0. Разлагая это выражение в ряд по yi+\ — yi, мы получим п J квадратичные члены Y2 — (уг+i — 2/г)2> и можем положить г=0 2«г п = 2 Е ^ ^+1 ~ У^2' Уо = Уп+Х = °* г=0 Таким образом, в этом случае задача сводится к одновременному приведению к сумме квадратов двух квадратичных форм от переменных у\,... ,уп: 4 П П 1 т=о^2ту^ п = ^ Е г(уш~у^2, уо = Уп+1 = °- г=0 2 ^1 г=0 Если же массы всех бусинок равны, и они делят нить на равные части, т. е. rrii: = m и U■.= 1/{п+ 1), г = 1,... ,п, то все формулы могут быть написаны в более явном виде. В этом случае речь идет об одновременном приведении к сумме квадратов двух форм: п m х-^ о Е^2 (г(п+1) П = г=1 " г=1 г=0 I п п (Е У* ~ Е ^^+l) ' УО = 1/п+1 = О- Таким образом, мы должны привести ортогональным преобразованием (со- п п храняющим форму J2 у\) K сумме квадратов форму ]П у%у%+\ с матрицей г=1 Л=2 /0 1 1 0 о 1 о о \о о о 1 о 1 о г=0 о о\ о о •• 0 0 1 1 0/
7.6. Приложения к механике и геометрии 261 Можно было бы идти стандартным путем: найти собственные значения Ai,...,An как корни определителя \A — tE\ и собственные векторы у из системы уравнений Ay = Ay, (7.61) где А = Xi и у — столбец из неизвестных yi,...,yn. Но проще прямо воспользоваться уравнениями (7.61). Они дадут систему п уравнений для неизвестных у\,..., уп: у2 = 2Xyi, у\+уг = 2Ау2, • • •, Уп-2 + уп = 2Ayn_i, yn_i = 2Ауп, которую можно записать в виде Ук-\ + Ук+\ = 2Ауь fc=l,...,n, (7.62) полагая уо = уп+\ = 0. Система уравнений (7.62) является рекуррентным соотношением, при котором каждое значение y^+i выражается через два предшествующие: yk и yk-i- Таким образом, зная два соседние значения, мы можем, пользуясь соотношением (7.62), построить все yk. Условие уо = у>п+\ = 0 называется граничным или краевым. Заметим, что при А = =Ы уравнение (7.62) с граничным условием уо = = уп+\ = 0 имеет только нулевое решение: у0 = • • • = Уп+\ = 0. Действительно, при А = 1 получаем У2 = 2уь уз = 3уь •••> Уп = пу\, yn+i = (n+l)y{, откуда в силу уп+\ = 0 следует у\ = 0, и все у/. = 0. Аналогично, при А = — 1 получаем У2 = -2уь уз = 3г/ь У4 = -4уь ..., yn = (-lr^nyi, yn+i = (-1)п(п + 1)Уь откуда в силу уп+\ = 0 также следует у\ = 0, и снова все у/~ = 0. Таким образом, при А = ±1 система уравнений (7.61) имеет в качестве единственного решения вектор у = 0, который, по определению, не может быть собственным вектором. Другими словами, это означает, что числа ±1 не являются собственными значениями матрицы А. Для решения уравнения (7.62) с граничным условием уо = yn+i = 0 существует красивая формула. Обозначим через а и /3 корни квадратного уравнения z2 — 2Xz + 1 = 0. В силу приведенных соображений, Л ^ ±1 и, следовательно, числа а и (3 различны и не могут быть равны ±1. Непосредственная подстановка показывает, что тогда при любых А и В последовательность yk = Аак + В(Зк удовлетворяет соотношению (7.62). Коэффициенты А и В подбираются из условий уо = 0, у\ — заданное. Следующие уь как мы видели, уже определяются из соотношения (7.62) и, значит, снова задаются нашей формулой. Условия уо = 0, yi — заданное, дают В = —А и А(а — (3) = у\, откуда А = у\/(а — (3). Таким образом, получаем выражение ук = ^1(*к-Рк). (7.63)
262 Гл. 7. Евклидовы пространства Воспользуемся теперь условием уп+\ = О, оно дает an+1 = /?n+1. Кроме того, так как а и /? — корни многочлена z2 — 2Xz + 1, то а/3 = 1, откуда /3 = а~~1, и значит, a2(n+1) = 1. Отсюда (с учетом того, что а ф ±1) мы получаем а = cos ( ) + г sinf ), \n+lJ Vn+1/ где г — мнимая единица, а число j пробегает значения 1,...,п. Используя опять уравнение z2 — 2Xz +1=0, корнями которого являются а и /?, мы получаем, что для Л имеется п разных значений: Xj = cos(——-), j = l,...,n, Vn+1/ так как j = n + 2,... ,2n + 1 дают те же самые значения Xj. Это и есть собственные значения матрицы А. Для собственного вектора у?, соответствующего собственному значению Aj, мы по формуле (7.63) получаем его координаты уц,..., ynj в виде ykj = sin(—— J, k= l,...,n. Эти формулы были выведены Даламбером и Даниилом Бернулли. Переходя к пределу при п —> оо, Лагранж вывел из них закон колебаний однородной струны. Пример 7.10. Рассмотрим в n-мерном вещественном евклидовом пространстве L подмножество X, заданное уравнением F(xu...,xn) = 0 (7.64) в некоторой системе координат. Такое подмножество X называется гиперповерхностью и состоит из всех векторов х = (х\,... ,хп) евклидова пространства L, координаты которых удовлетворяют уравнению1) (7.64). Используя формулу замены координат (3.36), мы видим, что свойство подмножества Id быть гиперповерхностью не зависит от выбора координат, т.е. базиса в L. Тогда, предполагая, что начала всех векторов находятся в одной фиксированной точке, каждый вектор х = (х\,...,хп) можно отождествить с его концом — точкой данного пространства. Для того, чтобы соответствовать более привычной терминологии, далее в этом примере мы будем называть точками гиперповерхности X составляющие ее векторы х. Мы будем считать, что F(0) = 0 и функция F(x\,...,xn) дифференцируема по всем аргументам нужное нам число раз. Легко проверить, что и это свойство не зависит от выбора базиса. Предположим дополнительно, что 0 не является критической точкой гиперповерхности X, т. е. не все частные производные dF(0)/dxi равны нулю. Иначе говоря, если ввести век- 1) Более привычная точка зрения, когда гиперповерхность (например, кривая или поверхность) состоит из точек, требует рассмотрения n-мерного точечного (или, по-другому, аффинного) пространства, которое будет введено в следующей главе.
7.6. Приложения к механике и геометрии 263 тор gradF = (§]lr,--->•§£-), называемый градиентом функции F, то это означает, что gradF(O) Ф 0. Нас будут интересовать локальные свойства гиперповерхности X, т. е. свойства, связанные с точками, близкими к 0. При сделанных предположениях известная из анализа теорема о неявной функции показывает, что вблизи 0 координаты х\,...,хп каждой точки гиперповерхности X могут быть представлены как функции от п — 1 аргументов щ,... ,ип-\, причем для каждой точки значения щ,...,ип-\ определяются однозначно. В качестве щ,..., ип-\ можно взять некоторые п — 1 из координат х\,...,хп, определив оставшуюся координату х& из уравнения (7.64), для этого должно лишь быть выполненным условие Ц^-(О) Ф О для данного к, что выполнено в силу предположения gradF(O) ф 0. Функции, определяющие зависимость координат х\,...,хп точки гиперповерхности X от аргументов щ,... ,ип-\, будут дифференцируемыми по всем аргументам столько же раз, сколько и исходная функция F(xi,...,xn). Гиперплоскость, определяемая уравнением называется касательным пространством или касательной гиперплоскостью к гиперповерхности X в точке 0 и обозначается через TqX. В случае, если базис в евклидовом пространстве L — ортонормированный, это уравнение можно также записать в виде (gradF(0),a?) = 0. Как подпространство евклидова пространства L, касательное пространство TqX тоже является евклидовым. Множество векторов, зависящих от параметра t, принимающего значения из некоторого интервала вещественной прямой, т.е. x(t) = (x\(t),... ,xn(t)), называется гладкой кривой, если все функции Xi(t) нужное число раз дифференцируемы, и при каждом значении параметра t не все производные ^ равны нулю. Аналогично тому, что было сказано выше о гиперповерхности, можно представлять себе, что кривая состоит из точек A(t), где каждая A(t) является концом некоторого вектора x(t), а началом всех векторов x(i) является некоторая фиксированная точка О. Далее мы будем называть точками кривой составляющие ее векторы х. Говорят, что кривая 7 проходит через точку xq, если ж (to) = Щ при некотором значении параметра to. Очевидно, что здесь всегда можно считать to = 0. Действительно, рассмотрим другую кривую x(t) = (x\(i),... ,xn(t)), где функции Xi(t) = a^(t + to). Это же можно записать в виде ж (г) = ж^), введя новый параметр г, который связан со старым соотношением г = t — to. Вообще говоря, для кривой можно производить любые замены параметра по формуле t = ф(т), где функция ф задает непрерывно дифференцируемое и взаимно однозначное отображение одного интервала на другой. При таких заменах кривая, рассматриваемая как множество точек (или векторов),
264 Гл. 7. Евклидовы пространства не изменится. Отсюда следует, что одну и ту же кривую можно записать по- разному, используя разные параметры1). Введем вектор ^ = (^'•••>^§1)- Пусть кривая 7 проходит через точку 0 при t = О, тогда вектор р = ^f(O) называется касательным вектором к кривой 7 в точке 0. Он, конечно, зависит от выбора параметра £, задающего кривую. При замене параметра t = ф(г) имеем dx dx dt dx ., . /^огч * = *-г = -зг*(т)- (7-65) и касательный вектор р умножается на константу, равную значению производной ф'(0). Пользуясь этим, можно добиться того, что |^(t)| = 1 при всех *, близких к 0. Такой параметр называется натуральным. Условие того, что кривая x{t) принадлежит гиперповерхности (7.64), дает равенство F(x(t)) = 0, выполненное при всех t. Дифференцируя это соотношение по £, получаем, что вектор р содержится в пространстве TqX. И наоборот, любой вектор, содержащийся в Г0Х, может быть представлен в виде ^jr(O) для некоторой кривой x(t). Эта кривая, конечно, определяется неоднозначно. Кривые, для которых касательные векторы р пропорциональны, называются касающимися в точке 0. Обозначим через то вектор, ортогональный касательному пространству TqX и имеющий длину 1. Таких векторов два: то и —то, и мы выберем один их них. Например, можно положить п = ^4(0). (7.66) Определим вектор ^f как ^ (^) и положим Q=($(0),n)- (Z67) Предложение. Величина Q зависит только от вектора р, а именно, является квадратичной формой от его координат. Доказательство. Это утверждение достаточно проверить, подставляя в (7.67) вместо вектора то любой пропорциональный ему вектор, например, gradF(O). Так как по условию кривая x(t) содержится в гиперповерхности (7.64), то F(x\(i),... ,xn(t)) = 0. Дифференцируя это равенство два раза по £, мы получаем ^ OF dxi _ ^ d2F dxi dxj ^ dF d2Xi _ ^ dxi dt ' ^ dxidxj dt dt ^-f dxi dt2 г=1 i,j=L i=l l) Например, окружность радиуса 1 с центром в начале координат на плоскости переменных х, у задается не только формулой х = cost, у — smt, но и формулой х = cost, у — — sinr (замена t = —г), или формулой х = sin г, у — cost (замена t = 7г/2 — г).
7.6. Приложения к механике и геометрии 265 Полагая здесь t = О, мы видим, что ($(0>,^<O>)=-£Jg-(O)M,, где р = (pi,... ,_рп). Это и доказывает наше утверждение. Форма Q(p) называется второй квадратичной формой гиперповерхности. Первой квадратичной формой называется форма (р2), когда TqX понимается как подпространство евклидова пространства L. Заметим, что вторая квадратичная форма требует выбора одного из двух (п или — п) векторов длины 1, ортогональных TqX. Это часто интерпретируют как выбор одной стороны гиперповерхности в окрестности точки 0. Первая и вторая квадратичные формы дают возможность получить выражение для кривизны некоторых кривых ж(£), принадлежащих гиперповерхности X. Предположим, что кривая является (хотя бы в любой, сколь угодно малой, окрестности точки 0) пересечением плоскости L', содержащей точку О, и гиперповерхности X. Такая кривая называется плоским сечением гиперповерхности. Если задать кривую x(t) так, что t является натуральным параметром, то ее кривизной в точке 0 называется число к = > Мы предположим, что /г^Ои положим 1 d2x т=к- Ж(0)- Вектор га по определению имеет длину 1. Он называется нормалью к кривой x(t) в точке 0. Если кривая x(t) является плоским сечением гиперповерхности, то x{t) содержится в плоскости L' (при всех достаточно малых £), и следовательно, вектор dx Л. x(t + К) — x(t) —- = lim — т — at /i->0 h тоже содержится в плоскости 1Л Тем самым это верно и для вектора d2x/dt2, а значит, и для нормали т. Если кривая 7 задана при помощи натурального параметра t, то dx\2 dt dx dx\ "ей"' ~dt) ~ Дифференцируя это равенство по t, получим, что векторы d2x/dt2 и dx/dt ортогональны. Тем самым, нормаль т к кривой 7 ортогональна любому касательному вектору (при любом задании кривой 7 в виде x(t) с натуральным параметром £), и вектор т определен однозначно, с точностью до знака. Очевидно, что \J = (т,р), где р — любой касательный вектор. По определению (7.67) второй квадратичной формы Q и с учетом равенства \т\ = \п\ — 1, мы получаем выражение Q(p) — (km, n) = fc(m, n) — kcostp, (7.68)
266 Гл. 7. Евклидовы пространства где (р — угол между векторами га и га. Выражение kcosip обозначается к и называется нормальной кривизной гиперповерхности X по направлению р. Напомним, что здесь га обозначает выбранный вектор единичной длины, ортогональный касательному пространству TqX, am — нормаль к кривой, для которой вектор р касательный. Аналогичная формула для любого параметрического задания кривой x(t) (когда t — не обязательно натуральный параметр), использует и первую квадратичную форму. Именно, если г — другой параметр, at — натуральный, то, согласно формуле (7.65), теперь вместо вектора р мы получаем р' =рф'(0). Так как Q — квадратичная форма, то Q(pil>f(0)) = ф'(0) Q(p)> и вместо формулы (7.68) мы теперь получаем т^£г = k cos tp. (7.69) (Р2) Здесь участвуют уже и первая квадратичная форма (р2), и вторая Q(p), но зато формула (7.69), в отличие от (7.68), верна при любом выборе параметра t на кривой 7- Смысл введенного выше термина нормальная кривизна состоит в следующем. Сечение гиперповерхности X плоскостью L' называется нормальным, если га G L'. Вектор га определен формулой (7.66), он ортогонален касательному пространству TqX. Но в плоскости L7 лежит и вектор р, касательный к кривой 7, и ортогональный ему вектор нормали га. Таким образом, в случае нормального сечения га = ±га, и значит, в формуле (7.68) угол (р равен О или 7г. Наоборот, из равенства | cos^| = 1, следует, что п е L7. Таким образом, в случае нормального сечения нормальная кривизна к отличается от к только множителем ±1 и определяется соотношением г Q(p) \р\ Так как L7 = (га,р), то все нормальные сечения соответствуют прямым в плоскости L7. Для каждой прямой существует единственное нормальное сечение, содержащее эту прямую. Иначе говоря, мы «вращаем» плоскость !_' вокруг вектора га, рассматривая все получающиеся плоскости (га,р), где р — вектор в касательной гиперплоскости TqX. Так получаются все нормальные сечения гиперповерхности X. Воспользуемся теперь теоремой 7.15. В нашем случае она дает ортонор- мированный базис ei,...,en_i в касательной гиперплоскости TqX (которая рассматривается как подпространство евклидова пространства L), в котором квадратичная форма Q(p) приводится к каноническому виду. Иными словами, для вектора р = ще\-\ Ь un_ien_i вторая квадратичная форма принимает вид Q(p) = X\uf + • • • + \n-\Un_i. Так как базис еь ..., en_i ортонормиро- ванный, то при этом Щ (Р, ei) -— = ——— = cos <ри (7.70) \Pi\ ml
7.6. Приложения к механике и геометрии 267 где щ — ^гол между векторами р и е^. Отсюда получаем для нормальной кривизны к нормального сечения 7 формулу |р| U \\p\J U где р — любой касательный вектор к кривой 7 B точке 0. Соотношения (7.70) и (7.71) называются формулой Эйлера. Числа А* называются главными кривизнами гиперповерхности X в точке О. В случае п = 3 гиперповерхность (7.64) является обычной поверхностью и имеет две главные кривизны Ai и А2. С учетом соотношения cos2 cp\ + + cos2 <£2 = 1 формула Эйлера принимает вид к = Х\ cos2 cpi + А2 cos ц>2 = (Ai — A2) cos2 ip\ + A2. (7.72) Пусть Ai > A2, тогда из (7.72) видно, что нормальная кривизна к достигает максимума (равного Ai) при cos2 ц>\ — 1 и минимума (равного А2) при cos2 (pi = 0. Это утверждение называется экстремальным свойством главных кривизн поверхности. Если Ai и А2 одного знака (А1А2 > 0), то, как видно из (7.72), любое нормальное сечение поверхности в данной точке 0 имеет кривизну того же знака, и следовательно, все нормальные сечения выпуклы в одну и ту же сторону, и вблизи точки 0 поверхность расположена по одну сторону от своей касательной плоскости (рис. 7.10, а). Такие точки называются эллиптическими. Если Ai и А2 имеют разные знаки (А1А2 < 0), то, как видно из формулы (7.72), имеются нормальные сечения с противоположными направлениями выпуклости, и вблизи точки 0 поверхность расположена по разные стороны от своей касательной плоскости (рис. 7.10, б). Такие точки называются гиперболическими. 1) а) б) Рис. 7.10. Эллиптические (а) и гиперболические (б) точки !) Примерами поверхностей, целиком состоящих из эллиптических точек, являются эллипсоиды, двуполостные гиперболоиды и эллиптические параболоиды, а поверхностей, целиком состоящих из гиперболических точек, — однополостные гиперболоиды и гиперболические параболоиды.
268 Гл. 7. Евклидовы пространства Из приведенных рассуждений видно, что произведение главных кривизн к= \\\<i определяет некоторые важные свойства поверхности (как говорят, свойства «внутренней геометрии» поверхности), оно называется ее гауссовой или полной кривизной. § 7,7. Псевдоевклидовы пространства Многие теоремы, доказанные в предшествующих параграфах этой главы, остаются справедливыми, если в определении евклидова пространства мы откажемся от требования положительной определенности квадратичной формы (ж2) или заменим его более слабым. Без этого условия скалярное произведение (ж, у) ничем не отличается от произвольной симметрической билинейной формы. Как показывает теорема 6.2, она однозначно определяется квадратичной формой (ж2). Таким образом, мы получаем теорию, полностью совпадающую с теорией квадратичных форм, изложенной нами в гл. 6. Основная теорема (о приведении квадратичной формы к каноническому виду) заключается в существовании ортогонального базиса ei,...,en, т.е. базиса, для которого (е^е^) = 0 при всех г ф j. Тогда для вектора х\е\ + • • • + хпеп квадратичная форма (ж2) = Aix2 + ••• + Anx2, причем это верно для векторных пространств и билинейных форм над произвольным полем К характеристики, отличной от 2. Понятие изоморфизма пространств имеет смысл и в этом случае: как и прежде, нужно требовать сохранения скалярного произведения (ж, у). Теория таких пространств (определенных с точностью до изоморфизма) с билинейной или квадратичной формой — это интересный вопрос (например, в случае К = Q — поля рациональных чисел). Но нас здесь интересуют вещественные пространства. В этом случае формула (6.28) и теорема 6.10 (закон инерции) показывают, что с точностью до изоморфизма пространство однозначно определяется рангом и индексом инерции соответствующей квадратичной формы. Далее мы ограничимся рассмотрением вещественных векторных пространств с невырожденной симметрической билинейной формой (х,у). Напомним, что невырожденность билинейной формы означает, что ее ранг (т.е. ранг ее матрицы в любом базисе пространства) равен dimL Другими словами, это значит, что ее радикал равен (О), т.е. если вектор ж таков, что (ж,у) = 0 для всех векторов у е L, то ж = 0 (см. § 6.2). Для евклидова пространства это свойство автоматически следует из условия 4) в определении (достаточно положить в нем у = ж). Формула (6.28) показывает, что при этих условиях существует базис ei,...,en пространства L, для которого (е»,е,-) = 0 при i^j, (е2) = ±1. Такой базис по-прежнему называется ортонормированным. В нем форма (ж2) записывается в виде (ж ) — хх Н Ь xs — xs+l — • — — хп
7.7. Псевдоевклидовы пространства 269 а число s называется индексом инерции как квадратичной формы (ж2), так и самого псевдоевклидова пространства L. По сравнению с евклидовыми пространствами, новая трудность возникает, если квадратичная форма (ж2) не является ни положительно, ни отрицательно определенной, т.е. ее индекс инерции s положителен, но меньше, чем п. В этом случае ограничение билинейной формы (ж, у) на подпространство L' с L может оказаться вырожденным, даже если исходная билинейная форма (ж, у) в L невырождена. Например, ясно, что в L существует такой вектор ж^О, для которого (ж2) = 0, и тогда ограничение (ж, у) на одномерное подпространство (ж) вырождено (тождественно равно нулю). Итак, рассмотрим векторное пространство L с заданной на нем невырожденной симметрической билинейной формой (ж, у). В этом случае по- прежнему используются многие понятия и обозначения, относящиеся к евклидовым пространствам. Так, векторы ж и у называются ортогональными, если (ж, у) = 0. Подпространства Ц и 1_2 называются ортогональными, если (ж, у) = 0 для всех векторов ж е Ц и у е !_2, это записывается в виде Ц _L 1_2. Ортогональное дополнение подпространства L' с L относительно билинейной формы (ж, у) обозначается через (L7)-1. Однако имеется важное отличие от евклидовых пространств, в связи с чем нам будет удобно дать следующее Определение. Подпространство L'c L называется невырожденным, если билинейная форма, полученная ограничением на него формы (ж, у), невырождена. В противном случае L' называется вырожденным. Согласно теореме 6.4, в случае невырожденного подпространства L7 мы имеем ортогональное разложение L = L/0(L/)±. (7.73) В случае евклидова пространства, как мы уже видели, любое подпространство L' невырождено, и разложение (7.73) имеет место без каких бы то ни было дополнительных условий. Как показывает следующий пример, в псевдоевклидовом пространстве условие невырожденности подпространства L7 для разложения (7.73) действительно существенно. Пример 7.11. Рассмотрим трехмерное пространство L с симметрической билинейной формой, которая задается в некотором выбранном базисе формулой (ж, у) = Х\у\ + Х2У2 - ЯЗУЗ, где Xi — координаты вектора х и yi — координаты вектора у. Пусть L' = (е), где вектор е имеет координаты (0,1,1). Тогда, как легко видеть, (е, е) = 0 и следовательно, ограничение формы (ж, у) на L/ тождественно равно нулю. Это означает, что подпространство I? вырождено. Его ортогональное дополнение (L')-1 двумерно и состоит из всех векторов z E L с координатами (21,22,23), для которых z^ = 23. Следовательно, L7 с (\-f)±1 и пересечение L/ П (L/)-1- = L7 содержит ненулевые векторы. Это означает, что сумма Lf + (L')"1 не является прямой. Кроме того, очевидно, что L; + (L7)-1 ф L. Из условия невырожденности билинейной формы (ж, у) следует, что определитель ее матрицы (в любом базисе) отличен от нуля. Если эта матрица
270 Гл. 7. Евклидовы пространства записывается в базисе ei,...,en, то ее определитель равен |(ei,ei) (еье2) ••• (еьеп) (e2,ei) (e2,e2) ••• (е2,е„) (7.74) |(en,ei) (еп,е2) ••• (еп,еп)1 и, как и в случае евклидовых пространств, мы будем называть его определителем Грама базиса ei, ..., еп. Конечно, этот определитель зависит от выбора базиса, но его знак от выбора базиса не зависит. Действительно, если А и А' — матрицы нашей билинейной формы в двух различных базисах, то они связаны соотношением Аг — С*АС, где С — невырожденная матрица перехода, откуда следует, что \Af\ = \A\ • \С\2. Таким образом, знак определителя Грама для всех базисов одинаков. Как было отмечено выше, для невырожденного подпространства L; с L имеет место разложение (7.73), которое влечет равенство dim L = dim L/ + dim(L/)±. (7.75) Но равенство (7.75) верно и для любого подпространства L' с L, хотя, как мы видели в примере 1, разложение (7.73) в общем случае уже может не иметь места. Действительно, согласно теореме 6.1, мы можем записать любую заданную в пространстве L билинейную форму (ж, у) в виде (ж, у) = (x,si(y)), где &f: L —► L* — некоторое линейное преобразование. Из невырожденности билинейной формы (ж, у) следует невырожденность преобразования si. Иными словами, преобразование si является изоморфизмом, т. е. его ядро равно (0) и, в частности, для любого подпространства L' с L мы имеем равенство dim^(L7) = dimL/. С другой стороны, мы можем записать ортогональное дополнение (\-/)± в виде {si{\J))a, пользуясь понятием аннулятора, введенным в § 3.7. На основании сказанного выше и формулы (3.54) для аннулятора, мы имеем соотношение dim(^(L'))a = dim L - dim^(L') = dim L - dim L/, т.е. dim(L/)-L = dimL —dimL7. Отметим, что это рассуждение справедливо для векторного пространства L, определенного не только над вещественным, но и над произвольным полем. Рассматриваемые нами пространства определяются (с точностью до изоморфизма) своим индексом инерции s, который может принимать значения от 0 до п. Согласно сказанному выше, знак определителя Грама любого базиса равен (— \)n~s. Очевидно, что, заменяя в том же пространстве L скалярное произведение (ж, у) на — (ж, у), мы сохраним все его существенные свойства, а индекс инерции s при этом заменится на п — s, ввиду чего мы можем считать далее, что п/2 ^ s < п. Случай s = n соответствует евклидовым пространствам. Существует, однако, явление, причина которого в настоящее время не вполне ясна — наиболее интересные вопросы математики и фи-
7.7. Псевдоевклидовы пространства 271 зики до сих пор всегда были связаны лишь с двумя типами пространств: когда индекс инерции s равен п или п — 1. Теории евклидовых пространств (s = n) была посвящена предшествующая часть главы. В оставшейся части мы рассмотрим другой случай: s — п — 1. Эти пространства мы и будем далее называть псевдоевклидовыми (хотя иногда этот термин применяют, когда (ж, у) — любая невырожденная симметрическая билинейная форма, не являющаяся ни положительно, ни отрицательно определенной, т. е. с индексом инерции s^0,n). Таким образом, псевдоевклидово пространство размерности п — это векторное пространство L с определенной на нем симметрической билинейной формой (х,у), такой, что в некотором базисе е\,...,еп квадратичная форма (ж2) приобретает вид *? + •■■+ 4-i-4- (776) Как и в случае евклидова пространства, такие базисы мы по-прежнему будем называть ортонормированными. Наиболее известное применение псевдоевклидовых пространств связано со специальной теорией относительности. Согласно идее Минковского, там рассматривается четырехмерное пространство, векторы которого называются пространственно-временными событиями (мы уже упоминали об этом на с. 97). Они имеют координаты (x,y,z,t), и пространство снабжается квадратичной формой х2 + у2 + z2 — t2 (здесь скорость света предполагается равной 1). Полученное таким образом псевдоевклидово пространство и называется пространством Минковского. По аналогии с физическим смыслом этих понятий в пространстве Минковского, в произвольном псевдоевклидовом пространстве вектор х называется пространственноподобным, если (ж2) > 0; времениподобным, если (ж2) < 0; и светоподобным, или изотропным, если (ж2) = О1). Пример 7.12. Рассмотрим простейший случай псевдоевклидова пространства L, когда dimL = 2, а индекс инерции 5=1. Согласно общей теории, в нем существует ортонормированный базис, в данном случае, базис еьвг, для которого (e?) = l, (el) = -l, (e,,e2) = 0, (7.77) и скалярный квадрат вектора х = х\е\ + £2^2 равен (ж2) = х\ — х\. Однако проще записывать формулы, связанные с пространством L, в базисе, состоящем из светоподобных векторов f\,f^ положив /i = ^, /2 = ^- (7-78) 1) Отметим, что эта терминология отлична от общепринятой: наши «пространственнопо- добные» векторы обычно называются «времениподобными», и наоборот. Различие объясняется принятым нами условием s = п — 1. В общепринятом определении пространства Минковского обычно рассматривается квадратичная форма — х2 — у — z2 + t2, индекс инерции которой s = 1, и нам нужно умножить ее на —1, чтобы было выполнено условие $ ^ п/2.
272 Гл. 7. Евклидовы пространства л /, Рис. 7.11. Псевдоевклидова плоскость Тогда (/?) = (/|) = 0, (/lf/2) = 1/2, и ска- лярный квадрат вектора х = x\fx + Ж2/2 равен (зг) = х\Х2. Светоподобные векторы расположены на осях координат (рис. 7.11), времениподобные векторы составляют второй и четвертый квадрант, а пространственноподобные — первый и третий. Определение. Множество V с L, состоящее из всех светоподобных векторов псевдоевклидова пространства, называется световым (или изотропным) конусом. То, что мы называем множество V конусом, означает, что вместе с любым вектором е в нем содержится вся прямая (е), как сразу следует из определения. Множество времениподобных векторов называется внутренностью конуса V', а множество пространственноподобных векторов — его внешностью. В пространстве из примера 7.12 световой конус V является объединением двух прямых (fi) и (/2). Более наглядное представление о световом конусе дает следующий пример. П р и м е р 7.13. Рассмотрим псевдоевклидово пространство L, когда dim L = 3, а индекс инерции s = 2. При выборе ортонормированного базиса е\,в2,ез, для которого (ef) = (е|) = 1, (е§) = — 1, (е^е^=0 при всех г 7^ j, световой конус V задается уравнением х\ + х\ — х\ — 0. Это обычный круговой конус в трехмерном пространстве, знакомый из курса аналитической геометрии (рис. 7.12). Теперь вернемся к общему случаю псевдоевклидова пространства L размерности п и рассмотрим в нем световой конус V более детально. Прежде всего, проверим, что он «совсем круглый». Под этим мы подразумеваем следующее: Лемма 1. Хотя конус V содержит вместе с каждым вектором х всю прямую (х), он не содержит ни одного двумерного подпространства. Доказательство. Предположим, что V содержит двумерное подпространство (х,у). Выберем вектор е G L, для которого (е2) = — 1. Тогда прямая (е) является невырожденным подпространством в L, и мы можем применить разложение (7.73): L = (е) 0 (е)-Ч (7.79) Из закона инерции следует, что (е)-1 — евклидово пространство. Применим разложение (7.79) к нашим векторам х,у eV. Мы получим, что у = ре + v, (7.80) Рис. 7.12. Световой конус X ае + и, где и и v — векторы евклидова пространства (е) , а и (3 — некоторые числа.
7.7. Псевдоевклидовы пространства 273 Условия (ж2) =0 и (у2) = 0 записываются как а2 = (и2) и /З2 = (v2). Используя те же самые рассуждения для вектора ж + у = (а + /3)е + и + v, который, согласно предположению (ж, у) с V, тоже содержится в V, мы получаем равенство (a + (3)2 = (u + v,u + v) = (и2) + 2(м, v) + (v2) = а2 + 2(п,«) + /З2. Сокращая в левой и правой частях равенства подобные члены а2 и /З2, мы получаем, что а/3 = (te,v), т.е. (u,vf = а2/32 = (tx2) • (v2). Таким образом, для векторов и и v в евклидовом пространстве (е)± неравенство Коши-Буняков- ского-Шварца превращается в равенство, а из этого следует, что они пропорциональны (стр. 221). Пусть v = \и, тогда вектор у — Лж = (/3 — Аа)е тоже является светоподобным. Так как (е2) = — 1, то отсюда следует, что /3 = Асе. Но тогда из соотношений (7.80) вытекает, что у = Аж, а это противоречит условию dim(a, у) = 2. Выберем произвольный времениподобный вектор е € L Тогда в ортогональном дополнении (е}± прямой (е) билинейная форма (ж, у) задает положительно определенную квадратичную форму. Значит, {е}± HV = (0), и гиперплоскость (е}± делит множество V \ 0 на две части V+ и VL, состоящие из таких векторов х е V, что для каждой части выполнено условие (е,ж) > 0 или (е,ж) < 0 соответственно. Эти множества V+ и V- мы будем называть полами светового конуса V. На рис. 7.12 плоскость (еьег) делит У на «верхнюю» и «нижнюю» полы У+ и V- для вектора е = ез. Построенное нами разбиение V \ О = V+ U V- опиралось на выбор некоторого времениподобного вектора е и, по видимости, должно от него зависеть (например, замена вектора е на —е меняет полы У+ иУ_ местами). Сейчас мы докажем, что разбиение V \0 = V+UV-, без учета того, как именно мы каждую полу обозначим, от выбора вектора е не зависит, т.е. является свойством самого псевдоевклидова пространства. Для этого нам понадобится следующее, почти очевидное, утверждение: Л е м м а 2. Пусть L7 — подпространство псевдоевклидова пространства L размерности dim L' ^ 2. Тогда следующие утверждения равносильны: 1) V — псевдоевклидово; 2) L' содержит времениподобный вектор; 3) L' содержит два линейно независимых светоподобных вектора. Доказательство. Если L' — псевдоевклидово, то утверждения 2) и 3) очевидно следуют из определения псевдоевклидова пространства. Покажем, что из утверждения 2) следует 1). Пусть L7 содержит времениподобный вектор е, то есть (е2) < 0. Тогда подпространство (е) невырождено, следовательно, для него имеет место разложение (7.79), причем, как вытекает из закона инерции, подпространство (е)± евклидово. Если бы подпространство L' было вырожденным, то нашелся бы такой ненулевой вектор и G L/, что (и, ж) = 0 для всех ж е I/, и в частности, для векторов е и и. Условие (и,е)=0 означает, что вектор и содержится в {е)±, а условие (и,и)=0 означает, что вектор и светоподобный. Но это невозможно, так как подпро-
274 Гл. 7. Евклидовы пространства странство (е) евклидово и не может содержать светоподобных векторов. Полученное противоречие показывает, что подпространство !_' невырожденное, и следовательно, для него имеет место разложение (7.73). С учетом закона инерции отсюда следует, что подпространство L' псевдоевклидово. Покажем, что из утверждения 3) следует 1). Пусть подпространство L' содержит линейно независимые светоподобные векторы /j и /2. Покажем, что плоскость П = (fi,f2) содержит времениподобный вектор е. Тогда, очевидно, е содержится и в L', и согласно доказанному выше, подпространство L7 — псевдоевклидово. Любой вектор е £ П представим в виде е = af^ + /3/2. Отсюда получаем (е2) = 2а/?(/1,/2)- Заметим, что (/i,/2) Ф 0> так как в противном случае для каждого вектора е £ П было бы выполнено равенство (е2) = 0, означающее, что плоскость П целиком содержится в световом конусе V, что противоречит лемме 1. Таким образом, (/i,/2) ^ 0, и выбирая координаты а и (3 так, чтобы знак их произведения был противоположен знаку (/i,/2), мы получим вектор е, для которого (е2) < 0. Пример 7.14. Рассмотрим трехмерное псевдоевклидово пространство L из примера 3 и плоскость П в нем. Свойство П быть евклидовой, псевдоевклидовой или вырожденной наглядно иллюстрируется рис. 7.13. а) б) в) Рис. 7.13. Плоскость П в трехмерном псевдоевклидовом пространстве На рис. 7.13, а плоскость П пересекает световой конус V по двум прямым, соответствующим двум линейно независимым светоподобным векторам. Очевидно, что это равносильно тому, что П пересекается и с внутренностью светового конуса, состоящей из времениподобных векторов, а следовательно, является псевдоевклидовой плоскостью. На рис. 7.13, в плоскость П пересекает V только в вершине, т. е. П П V = (0). Значит, плоскость П — евклидова, так как каждый ненулевой вектор е £ П лежит вне конуса V, т. е. (е2) > 0. Наконец, на рис. 7.13, б изображен промежуточный вариант: плоскость П пересекает конус V по одной прямой, т. е. касается его. Так как плоскость П содержит светоподобные векторы (лежащие на этой прямой), то она не может быть евклидовой, а так как она не содержит времениподобных векторов, то, по лемме 2, она не может быть и псевдоевклидовой. Значит, плоскость П вырождена. Это нетрудно проверить и иначе, выписав матрицу ограничения скалярного произведения на плоскость П. Пусть в ортонормированном базисе еье2,ез из примера 7.12 эта плоскость задана уравнением х% = ах\ + (3x2. Тогда
7.7. Псевдоевклидовы пространства 275 векторы дх = е\ + аез и д2 = е2 + /Зез образуют базис П, в котором огра- (\-а2 -af3\ ничение скалярного произведения имеет матрицу I я2 ) с 0ПРеДе" лителем А = (1 — а2)(1 — /З2) — (а/?)2. С другой стороны, условие касания плоскости П и конуса V состоит в том, что дискриминант квадратичной формы х\ + х\ — (ах\ + /Зх2)2 от переменных х\ и х% равен нулю. Легко проверить, что этот дискриминант равен —Д, и значит, он обращается в нуль одновременно с определителем этой матрицы. Теорема 7.17. Разбиение светового конуса V на две полы V+ и V- не зависит от выбора времениподобного вектора е. В частности, линейно независимые светоподобные векторы х и у принадлежат одной поле, если и только если (х,у) < 0. Доказательство. Предположим, что при некотором выборе временипо- добного вектора е светоподобные векторы х и у принадлежат одной поле светового конуса V, и покажем, что тогда при любом выборе е они всегда будут принадлежать той же самой поле. Случай, когда векторы х и у пропорциональны, т.е. у = Аж, очевиден. Действительно, так как (е) П V — (0), то (е, х) т^ 0, и значит, векторы х и у принадлежат одной поле тогда и только тогда, когда А > 0, независимо от выбора вектора е. Теперь рассмотрим случай, когда ж и у линейно независимы. Тогда (ж, у) ^ О, так как в противном случае вся плоскость (ж, у) содержалась бы в световом конусе V, что, согласно лемме 1, невозможно. Докажем, что независимо от того, какой именно времениподобный вектор е мы выбрали для разбиения V \ 0 = V+ U VI, векторы ж, у е V \ 0 содержатся в одной поле тогда и только тогда, когда (ж, у) < 0. Заметим, что этот вопрос, собственно говоря, относится не ко всему пространству L, а только к подпространству (е,ж,у), размерность которого при сделанных предположениях равна 2 или 3, в зависимости от того, принадлежит ли вектор е плоскости (ж, у), или не принадлежит. Рассмотрим сначала случай, когда dim(e,x,y) =2, т.е. eG (ж,у). Тогда положим е = ах + (Зу. Следовательно, (е, ж) = /?(ж, у) и (е, у) = а(х, у), так как ж, у G V. По определению векторы х и у принадлежат одной поле тогда и только тогда, когда (е,ж)(е,г/) > 0. Но так как (е,ж)(е,т/) = а/3(ж,у)2, то это условие равносильно неравенству а/3 > 0. Вектор е времениподобен, поэтому (е2) < 0, и в силу равенства (е2) = 2а(3(х,у) мы получаем, что условие а/3 > 0 равносильно тому, что (ж, у) < 0. Рассмотрим теперь случай, когда dim(e,x,y) = 3. Пространство (е,ж,у) содержит времениподобный вектор е, следовательно, по лемме 2, оно является псевдоевклидовым, а его подпространство (ж, у) — невырожденным, так как (ж,у) т^Ои (ж2) = (у2) = 0. Таким образом, в этом случае разложение (7.73) принимает вид {e,x,y) = {x,y)®(h), (7.81) где пространство (h) = (ж,!/)-1 одномерно. В левой части разложения (7.81) стоит трехмерное псевдоевклидово пространство, а пространство (ж, у) является двумерным псевдоевклидовым, поэтому, согласно закону инерции,
276 Гл. 7. Евклидовы пространства пространство (h) евклидово. Таким образом, для вектора е мы имеем представление е = ах + /Зу + 7^, (h, ж) = О, (Л, у) = 0. Отсюда вытекают равенства (е, х) = /?(ж, у), (е, у) = а(ж, у), (е2) = 2а/?(ж, у) + j2(h2). С учетом того, что (е2) < 0 и (/г2) > 0, из последнего соотношения мы получаем, что а/3(х,у) < 0. Условие принадлежности векторов х и у одной поле выражается в виде неравенства (е,ж)(е,у) > 0, т.е. а(3 > 0. Так как а/3(ж,у) < 0, то, как и в предыдущем случае, это равносильно условию (ж, у) <0. Замечание. Как мы это делали в § 3.2 в связи с разбиением векторного пространства L гиперплоскостью L', можно убедиться, что разбиение множества V\0 совпадает с его разбиением на две линейно связные компоненты V+ и VI. Из этого соображения можно получить другое доказательство теоремы 7.17, не использующее никакие формулы. Псевдоевклидовость пространства проявляется в следующем замечательном соотношении: Теорема 7.18. Для любых времениподобных векторов х и у выполнено неравенство, обратное неравенству Коши-Буняковского-Шварца: (х,у)2>(х2)-(у2), (7.82) которое превращается в равенство, если и только если х и у пропорциональны. Доказательство. Рассмотрим подпространство (ж,у), в котором содержатся все интересующие нас векторы. Если векторы ж и у пропорциональны, т. е. у — Аж, где А — некоторое число, то неравенство (7.82) очевидно превращается в тавтологическое равенство. Таким образом, мы можем считать, что dim (ж, у) = 2, т.е. предполагать ситуацию, рассмотренную в примере 7.12. Как мы видели, в пространстве (ж, у) существует базис f\,f2l для которого выполнены соотношения (/2) = (f2) = 0, (f\,f2) — 1/2- Записав векторы х и у в этом базисе, мы получим выражения X = Xif{+ X2f2, J/ = S/l/l + 2/2/2 > из которых следует, что (Ж2) = Х\Х2, (У2) = У№, (Ж, у) = -(Xiy2 + Х2У\). Подставляя полученные выражения в (7.82), мы видим, что нам нужно проверить неравенство {х\у2+х2у\)2 ^ 4х\х2у\у2. Произведя в последнем очевидные преобразования, можно видеть, что оно равносильно неравенству (*1У2-*2Ш)2^0, (7.83) которое справедливо при всех вещественных значениях переменных. Кроме того, очевидно, что неравенство (7.83) превращается в равенство, если и толь-
7.7. Псевдоевклидовы пространства 277 ко если х\у2 — Х2У\ = О, т.е. определитель ж = (х\,Х2) иу= (уьУг) пропорциональны. Х\ Х2 У\ У2 = О, и, значит, векторы Из теоремы 7.18 вытекает полезное Следствие. Времениподобные векторы х и у не могут быть ортогональны. Действительно, если (ж, у) = О, то из неравенства (7.82) следует, что (ж2) • (у2) ^ 0, а это противоречит условию (х2) < 0 и (у2) < 0. Подобно разделению самого светового конуса V на две полы, мы можем разделить на две части и его внутренность. А именно, будем говорить, что времениподобные векторы е и е' лежат внутри одной полы светового конуса V, если скалярные произведения (е, х) и (е',ж) имеют один и тот же знак для всех векторов х е V, и лежат внутри разных пол, если эти скалярные произведения имеют разные знаки. Множество М с L называется выпуклым, если вместе с любыми двумя векторами е,е! е М оно содержит и векторы gt = te + (1 — t)ef при всех t Е [0,1]. Покажем, что внутренность каждой полы светового конуса V выпукла, т. е. вектор gt лежит внутри той же самой полы, что и векторы е и е', при всех t G [0,1]. Для этого заметим, что в выражении (gt,x) = = t(e, ж) + (1 — t)(e7, ж) коэффициенты £ и 1 — t неотрицательны, а скалярные произведения (е,ж) и (е7,ж) имеют один и тот же знак. Следовательно, для любого вектора ж е У скалярное произведение (gt,x) имеет тот же знак, что (е,ж) и (е;,ж). Л е м м а 3. Времениподобные векторы е и е! лежат внутри одной полы светового конуса V, если и только если (е, е') < 0. Доказательство. Если времениподобные векторы е и е' лежат внутри одной полы, то, по определению, мы имеем неравенство (е, ж) • (е;, ж) > 0 для всех ж G У. Предположим, что (е, е;) ^ 0. Как мы установили выше, вектор gt = te + (1 — t)e; является времениподобным и лежит внутри той же самой полы, что е и е7, при всех £ е [0,1]. Рассмотрим скалярное произведение (gt,e) = t(e,e) + (1 — i)(e,e') как функцию от переменного t G [0,1]. Очевидно, что эта функция непрерывна, принимает при t = 0 значение (е, е!) ^ 0 и при £ = 1 значение (е, е) < 0. Следовательно, как доказывается в курсе математического анализа, существует такое значение г е [0,1], что (<7г,е) = 0. Но это противоречит следствию из теоремы 7.18. Итак, мы доказали, что если векторы е и е' лежат внутри одной полы конуса V, то (е, е') < 0. Обратное утверждение очевидно. Пусть еие' лежат внутри разных пол, например, е — внутри У+, а е' - внутри V-. Тогда, как вытекает из определения, вектор — ef лежит внутри полы V+, и следовательно, (е,-е') <0, т.е. (е,е') > 0.
278 Гл. 7. Евклидовы пространства § 7.8. Лоренцевы преобразования В этом параграфе мы рассмотрим аналог ортогональных преобразований для псевдоевклидовых пространств — так называемые лоренцевы преобразования. Такие преобразования имеют многочисленные приложения в физике1). Они также определяются условием сохранения скалярного произведения: Определение. Линейное преобразование % псевдоевклидова пространства L называется лоренцевым, если выполнено соотношение (&(x),W(y)) = (x,y) (7.84) для любых векторов ж, у е L. Как и в случае ортогональных преобразований, достаточно, чтобы условие (7.84) было выполнено для всевозможных векторов ж — у псевдоевклидова пространства L. Доказательство этого полностью совпадает с доказательством аналогичного утверждения из § 7.2. Здесь мы, как и в случае евклидовых пространств, воспользуемся скалярным произведением (ж, у) для того, чтобы отождествить L* с L (напомним, что для этого нужна только невырожденность билинейной формы (ж, у), а не положительная определенность соответствующей ей квадратичной формы (ж2)). В результате, для любого линейного преобразования srf\ L —► L мы можем рассматривать srf* тоже как преобразование пространства L в себя. Повторяя те же рассуждения, которые использовались нами в случае евклидовых пространств, мы получаем, что |j2^*| = \srf\. В частности, из определения (7.84) следует, что для лоренцева преобразования Щ выполнено соотношение U*A 17 = А, (7.85) где U — матрица преобразования % в произвольном базисе ei,...,en пространства L и A— (a,ij) — матрица Грама билинейной формы (ж,у), т.е. матрица с элементами а^ — (е^еД Билинейная форма (ж,у) невырождена, т.е. \А\ ф О, и из соотношения (7.85) следует равенство |^|2 = 1, откуда получаем, что \%\ = ±1. Как и в случае евклидовых пространств, преобразования с определителем 1 называются собственными, а с определителем —1 — несобственными. Из определения вытекает, что любое лоренцево преобразование переводит световой конус V в себя. Из теоремы 7.17 следует, что лоренцево преобразование либо переводит каждую полу в себя (т.е. <2/(у+) = V+ и ^(VL) = V-), либо меняет их местами (т.е. ^(V+) = V- и ^(У_) = У+). Сопоставим каждому лоренцеву преобразованию <%£ число v{fy) = +1 в первом случае, и v{ftt) = — 1 — во втором. Как и определитель \&\, это число v(W) является *) Например, лоренцевы преобразования пространства Минковского — четырехмерного псевдоевклидова пространства — играют в специальной теории относительности (откуда и распространился этот термин) ту же роль, что и преобразования Галилея, описывающие переход от одной инерциальной системы отсчета к другой, в классической, ньютоновской механике.
7.8. Лоренцевы преобразования 279 естественной характеристикой лоренцева преобразования. Обозначим пару чисел (\fy\,v(fy)) через е(9/). Очевидно, что е{%-1) = e(W), е{^хЩ = е(Ще(Щ, где справа подразумевается, что перемножаются отдельно первые и вторые компоненты пар. Скоро мы увидим, что в любом псевдоевклидовом пространстве существуют лоренцевы преобразования Щ всех четырех типов, т. е. с е(^/), принимающим все значения (+1,+1), (+1,-1), (-1.+1), (-1,-1). Это свойство иногда интерпретируется так, что псевдоевклидово пространство имеет не две (как евклидово), а четыре ориентации. Подобно ортогональным преобразованиям евклидова пространства, лоренцевы преобразования характеризуются тем, что переводят ортонормирован- ный базис псевдоевклидова пространства в ортонормированный. Действительно, пусть для векторов ортонормированного базиса е\,...,еп выполнены равенства (ei>ej-) = 0 при i + j, (ef) = • • • = (4_i) = 1, (е2п) = -1. (7.86) Тогда из условия (7.84) следует, что их образы °i/(e\),... ,*2f(en) удовлетворяют аналогичным равенствам, т. е. образуют ортонормированный базис в L. Обратно, если для векторов е* выполнены равенства (7.86) и аналогичные равенства верны для векторов ^(е*), то, как легко проверить, для любых векторов ж и у псевдоевклидова пространства L будет выполнено соотношение (7.84). Два ортонормированных базиса называются одинаково ориентированными, если для лоренцева преобразования Щ, переводящего один из них во второй, e(W) = (+1,+1). Выбор некоторого класса одинаково ориентированных базисов называется ориентацией псевдоевклидова пространства L. Принимая пока на веру тот факт (который будет доказан чуть ниже), что существуют лоренцевы преобразования & со всеми теоретически возможными e(fy), мы видим, что в псевдоевклидовом пространстве можно ввести ровно четыре ориентации. Пример 7.15. Рассмотрим встречавшиеся нам понятия в случае псевдоевклидова пространства из примера 7.12, т.е. для dimL = 2 и s = 1. Как мы видели, в этом пространстве существует базис /i,/2, Для которого выполнены соотношения (f\) — (f\) = 0, (/1? /2) = 1/2, и скалярный квадрат вектора ж = xfi + yf2 равен (ж2) = ху. Если ^: L —> L — лоренцево преобразование, заданное формулой х' = ах + by, у' = сх + dy, то равенство (fy(x),ty(x)) = (ж,ж) для вектора ж = xfx + yf2 принимает вид х'у1 = ху, т. е. (ах + Ъу)(сх + dy) = ху, при всех х и у. Отсюда получаем ас = О, bd = 0, ad + be = 1. Ввиду равенства ad + bc= 1 значения а = Ъ = О невозможны.
280 Гл. 7. Евклидовы пространства Если а ф 0, то с = 0, и значит, ad = 1, т. е. d = а ф 0 и Ъ — 0. Таким образом, преобразование ^ имеет вид х1 = ах, у' = а~1у. (7.87) Это — собственное преобразование. Если же Ъ ф 0, то d = 0, и значит, с = Ь-1, а = 0. Преобразование ^ в этом случае имеет вид х' = by, у' = Ъ~1х. (7.88) Это — несобственное преобразование. Если записать преобразование % в виде (7.87) или (7.88), в зависимости от того, является ли оно собственным или несобственным, то знак числа а или, соответственно, числа Ъ показывает, переставляет ли % полы светового конуса, или сохраняет каждую из них. А именно, покажем, что преобразование (7.87) переставляет местами полы, если а < 0, и сохраняет их, если а > 0. И аналогично, преобразование (7.88) переставляет полы, если Ъ < 0, и сохраняет их, если Ъ > 0. По теореме 7.17, разбиение светового конуса V на две полы V+ и VL не зависит от выбора времениподобного вектора, поэтому, согласно лемме 3 из § 7.7, нам нужно определить знак скалярного произведения (е, ^(е)) для произвольного времениподобного вектора е. Пусть е = xfx + yf2, тогда (е2) = ху < 0. В случае, если % — собственное преобразование, мы имеем формулу (7.87), из которой следует, что <2Г(е) = axfl + a~lyf2y (е, ^Г(е)) - (а + а~1)ху. Так как ху < 0, то скалярное произведение (е,^(е)) отрицательно, если а + а"1 > 0, и положительно, если а + а-1 < 0. Но очевидно, что а + а~х > 0 при а > 0 и а + а"1 <0 при а < 0. Таким образом, при а > 0 мы имеем (е,^(е)) < 0, и, по лемме 3 из § 7.7, векторы е и &(е) лежат внутри одной полы. Следовательно, преобразование <%£ сохраняет полы светового конуса. Аналогично, при а < 0 мы получаем (е, ^(е)) > 0, т. е. е и ^(е) лежат внутри разных пол, следовательно, преобразование ^ переставляет полы местами. Случай несобственного преобразования рассматривается с помощью формулы (7.88). Рассуждая аналогично предыдущему, мы получаем из нее соотношения О10 ^(е) = b-lyf{ + bxf2, (e, <2f (е)) = to2 + 6"У, откуда видно, что теперь знак (е,^(е)) совпадает со знаком числа Ъ. Пример 7.16. Иногда полезно использовать то, что лоренцевы преобразования псевдоевклидовой плоскости записываются и в другом виде, с помощью гиперболических синуса и косинуса. Выше мы видели (формулы (7.87) и (7.88)), что в базисе f\,f2, определенном соотношением (7.78), собственные и несобственные лоренцевы преобразования задаются, соответственно, равенствами «r(/i) = a/i, &(f2)=a-[f2l W(fi) = bf2, &(f2) = b-lfl.
7.8. Лоренцевы преобразования 281 Отсюда несложно вывести, что в ортонормированном базисе еьег, связанном с /i,/2 формулой (7.78), эти преобразования задаются равенствами _ , ч а + а~1 а — а~1 ^ , ч а — а~х а + а~х mnm «T(ei) = ei + е2, <2Г(е2) = ^ ei + 2 б2' ( } 4^0 = ^*-*^*, *(в2) = ^е1-^в2 (7.90) соответственно. Положив здесь а = где знак ± совпадает со знаком числа а или Ь в формуле (7.89) или (7.90), соответственно, мы получаем, что матрицы собственных преобразований имеют вид сЪ.ф sh^\ f—chif;—ship\ (7<Ш sh^ chip J I—sh^ — сЪ.ф)1 ^* ' а матрицы несобственных преобразований имеют вид * ИЛИ aW, ,J,b (7-92) — shx/> —сЪ.ф1 \ sh^ ch^y где sh^ = (e^ — e~^)/2 и ch-0 = (e^ + e~^)/2 — гиперболические синус и косинус. Т е о р е м а 7.19. В каждом псевдоевклидовом пространстве существуют лоренцевы преобразования Щ со всеми четырьмя возможными значениями s{fy). Доказательство. Для случая dimL = 2 эта теорема уже нами доказана: в примере 7.16 мы видели, что существуют четыре различных типа лорен- цевых преобразований псевдоевклидовой плоскости, имеющие в подходящих ортонормированных базисах матрицы (7.91), (7.92). Очевидно, что преобразования % с такими матрицами дают все возможные значения е(Ш). Теперь перейдем к общему случаю dimL > 2. Выберем в псевдоевклидовом пространстве L произвольный времениподобный вектор е и любой не пропорциональный ему вектор е!. Согласно лемме 2 из § 7.7, двумерное подпространство (е, е') является псевдоевклидовым (следовательно, невырожденным), и имеет место разложение L=(e,e')®(e,e')±. Из закона инерции следует, что пространство (е, е')1- евклидово. В примере 7.16 мы видели, что в псевдоевклидовой плоскости (е, е') существует лоренцево преобразование 9/\ с любым значением е(%\). Определим преобразование ^: L —► L как <%\ в (е, е') и S в (е, ef)~L, т. е. для вектора х = у + z, где у е (е,е') и z е (е,е') , положим °tt{x) — 9/\(у) + z. Очевидно, что преобразование ^ лоренцево и е{<%) = е(%\). Для лоренцевых преобразований имеет место аналог теоремы 7.8: Теорема 7.20. Если подпространство \J инвариантно относительно лоренцева преобразования <2f, то и его ортогональное дополнение (L')1- тоже инвариантно относительно Щ.
282 Гл. 7. Евклидовы пространства Доказательство этой теоремы в точности повторяет доказательство теоремы 7.8, так как там мы использовали не положительную определенность квадратичной формы (ж2), соответствующей билинейной форме (ж, у), а только ее невырожденность, см. замечание на с. 230. Исследование лоренцевых преобразований псевдоевклидова пространства сводится к аналогичному вопросу для ортогональных преобразований евклидова пространства на основании следующего результата: Теорема 7.21. Для всякого лоренцева преобразования W псевдоевклидова пространства L существуют такие невырожденные инвариантные относительно ^ подпространства 1_о и 1_ь что имеет место ортогональное разложение L = Lo©Lb LoJLLi, (7.93) где подпространство 1_о — евклидово и размерность подпространства Ц равна I, 2 или 3. Из закона инерции следует, что если diml_i = 1, то Ц натянуто на вре- мениподобный вектор. Если dim Ц = 2 или 3, то псевдоевклидово пространство [_i может быть, в свою очередь, представимо в виде прямой суммы подпространств меньшей размерности, инвариантных относительно &, однако такое разложение уже не обязательно ортогональное (см. пример 7.11). Доказательство проведем индукцией по п — размерности пространства L. При п = 2 утверждение теоремы очевидно — в разложении (7.93) нужно положить Lo = (0) и Ц = L. Пусть теперь п > 2 и утверждение теоремы доказано для всех псев- ' доевклидовых пространств размерности меньше п. Воспользуемся результатами, полученными в гл. 4 и 5 о линейных преобразованиях векторного пространства в себя. Очевидно, что имеет место один из трех случаев: либо преобразование °i/ имеет комплексное собственное значение, либо <%£ имеет два линейно независимых собственных вектора, либо пространство L является для Щ циклическим, соответствующим единственному вещественному собственному значению. Рассмотрим три эти случая отдельно. Случай 1. Линейное преобразование У£ вещественного векторного пространства L имеет комплексное собственное значение Л. Как было установлено в § 4.3, тогда_^ имеет и комплексно сопряженное собственное значение Л, причем паре А, Л соответствует двумерное вещественное инвариантное подпространство L7 С L, не содержащее вещественных собственных векторов. Очевидно, что L' не может быть псевдоевклидовым: тогда ограничение <%£ на L' имело бы вещественные собственные значения и L/ содержало бы вещественные собственные векторы преобразования ^, см. примеры 7.15 и 7.16. Покажем, что подпространство L' — невырождено. Предположим, что L' вырождено. Тогда оно содержит светоподобный вектор е^О. Поскольку преобразование <9£ лоренцево, то вектор fy(e) тоже светоподобный, а так как подпространство L' инвариантно относительно ^, то ^(е) содержится в L/. Следовательно, подпространство L/ содержит два светоподобных вектора: е и ^(е). Согласно лемме 2 из § 7.7 эти векторы
7.8. Лоренцевы преобразования 283 не могут быть линейно независимы, так как тогда L' было бы псевдоевклидовым, а это противоречит нашему предположению, что L/ вырождено. Отсюда следует, что вектор ty(e) пропорционален е, а это означает, что е является собственным вектором преобразования ^, чего, как мы отметили выше, быть не может. Полученное противоречие означает, что подпространство L' — невырождено, и следовательно, евклидово. Случай 2. Линейное преобразование % имеет два линейно независимых собственных вектора: е\ и е2. Если хотя бы один из них не светоподобный, т. е. (е?) т^ 0, то L' = (е;) является невырожденным инвариантным подпространством размерности 1. Если же оба собственных вектора е\ и е2 — светоподобные, то по лемме 2 из § 7.7 подпространство L/ = (ei,e2) является инвариантной псевдоевклидовой плоскостью. Итак, в обоих случаях преобразование % имеет невырожденное инвариантное подпространство L' размерности 1 или 2. Значит, в обоих случаях мы имеем ортогональное разложение (7.73), т.е. L = L/ © (L7)-1. Если L' — одномерное и натянуто на времениподобный вектор или является псевдоевклидовой плоскостью, то это и есть разложение (7.93) с 1_о — (\-f)± и Ц = L7. В противном случае подпространство L7 — евклидово размерности 1 или 2, а подпространство (L')-1 — псевдоевклидово размерности п — 1 или п — 2 соответственно. По предположению индукции, для (L7)1- имеет место аналогичное (7.93) ортогональное разложение (L,)± = Lq © L\. Отсюда для L получаем разложение (7.93) с Lq = L' ф Lq и Li = L[. Случай 3. Пространство L является для преобразования $/ циклическим, соответствующим единственному вещественному собственному значению Л и корневому вектору е высоты т = п. Очевидно, что при п = 2 такого быть не может: как мы видели в примере 7.15, в подходящем базисе псевдоевклидовой плоскости лоренцево преобразование имеет либо диагональный вид (7.87), либо вид (7.88) с различными собственными значениями ±1. В обоих случаях, очевидно, псевдоевклидова плоскость L не может быть циклическим подпространством преобразования fy'. Рассмотрим случай псевдоевклидова пространства L размерности п ^ 3. Покажем что L может быть циклическим подпространством преобразования % только если п = 3. Как мы установили в § 5.1 в циклическом подпространстве L имеется базис ei,...,en, определенный формулой (5.5), т.е. е1=е, е2 = (^-ЛО(е), ..., еп = (W - Щп'\е), (7.94) в котором выполнены соотношения (5.6): ^(ei) = Aei+e2, <2Г(е2) = Ае2 + е3, ..., <2f(en) = Леп. (7.95) В этом базисе матрица преобразования ^ имеет вид жордановой клетки (см. формулу (7.96)). Легко увидеть, что собственный вектор еп — светоподобный. Действительно, если (еп) Ф О, то мы имели бы ортогональное разложение L = (еп) ф (е™)1, где оба подпространства (еп) и (еп)1- — инвариантны. Но это противоречит предположению, что пространство L — циклическое.
284 Гл. 7. Евклидовы пространства /А О 1 А О 1 и = о о л \о о о А 1 0\ О о о V (7.96) Так как преобразование fy лоренцево, то оно сохраняет скалярное произведение векторов, и из (7.95) мы получаем равенства (e.i,en) = {W{ei),<%(en)) = (Ae^+ ei+bAen) = А2(е*,еп) + А(еш,ета) (7.97) для всех г = 1,..., п — 1. Если А2 ф 1, то из (7.97) следует, что \fiii £п) — Л 1-Л2 (e*+i,en). Подставляя в это равенство значения индекса % — п— 1,..., 1 с учетом (е2) = О, мы последовательно получаем, что (е$, еп) = О для всех г. Это значит, что собственный вектор еп содержится в радикале пространства L, а так как L псевдоевклидово (т.е., в частности, невырождено), то еп = 0. Полученное противоречие показывает, что Л2 = 1. Подставляя Л2 = 1 в равенства (7.97) и сокращая подобные члены, находим, что (ei+i,en) = 0 для всех индексов г = 1,... ,п — 1, т. е. (е^,еп) = 0 для всех индексов j = 2,... ,п. В частности, имеем равенства (en_i,en) = 0 при п > 2 и (еп_2, еп) = 0 при п > 3. Отсюда следует, что п = 3. Действительно, из условия сохранения скалярного произведения имеем соотношение (en_2,en_i) = (^(en_2),^(en_i)) = (Aen_2+ en_b Aen_i + en) = = A2(en_2,en_i) + А(егг_2,егг) +A(e2_2) + (en_ben), из которого с учетом соотношений А2 = 1 и (en_i, en) = 0 вытекает равенство (en_2, en) + (e2_J = 0. Если п > 3, то (еп_2, еп) = 0, и отсюда получаем, что (e2_j) = 0, т. е. вектор en_i — светоподобный. Рассмотрим подпространство L; = (en,en_i). Очевидно, что оно является инвариантным относительно преобразования ^, а так как оно содержит два линейно независимых светоподобных вектора еп и еп_ь то, по лемме 2 из § 7.7, подпространство L' — псевдоевклидово, и мы имеем разложение L = = L' © (L')-1 в прямую сумму двух инвариантных подпространств. Но это противоречит тому, что пространство L — циклическое. Следовательно, преобразование % может иметь циклические подпространства только размерности 3. Объединяя вместе случаи 1-3, с учетом предположения индукции мы получаем утверждение теоремы. Объединяя теоремы 7.9 и 7.21, мы получаем
7.8. Лоренцевы преобразования 285 Следствие. Для всякого лоренцева преобразования псевдоевклидова пространства существует такой ортоноржированный базис, в котором его матрица имеет блочно-диагональный вид с блоками следующих типов: 1) порядка 1 с элементом ±1, 2) порядка 2 вида (7.29), 3) порядка 2 вида (7.91)-(7.92), 4) порядка 3, соответствующей трехмерному циклическому подпространству с собственным значением ±1. Из закона инерции следует, что матрица лоренцева преобразования может содержать не более одного блока, относящегося к типу 3 или 4. Заметим также, что блок типа 4, соответствующий трехмерному циклическому подпространству, не может быть приведен к жордановой нормальной -форме в ортонормированном базисе. Действительно, как мы видели выше, блок типа 4 приводится к жордановой нормальной форме в базисе (7.94), где собственный вектор еп — светоподобный, и следовательно, не может входить ни в какой ортонормированный базис. При доказательстве теоремы 7.21 мы установили необходимые условия для того, чтобы лоренцево преобразование имело циклическое подпространство — в частности, его размерность может быть только 3, соответствующее собственное значение равно ±1, а собственный вектор светоподобен. Очевидно, что эти необходимые условия не являются достаточными, так как при их выводе мы использовали равенства (е^е^) = (W&),<$/(ek)) не для всех векторов базиса (7.94). Покажем, что лоренцевы преобразования с циклическими подпространствами действительно существуют. Пример 7.17. Рассмотрим векторное пространство L размерности п = 3. Выберем в нем базис е\,е2,ез и определим преобразование ^: L —> L соотношениями (7.95) с числом Л = ±1. Тогда матрица преобразования W будет иметь вид жордановой клетки с собственным значением Л. Подберем матрицу Грама для такого базиса е\,е2,ез, чтобы наделить L структурой псевдоевклидова пространства. При доказательстве теоремы 7.21 мы нашли необходимые условия (в2,ез) = 0 и (е§) = 0. Положим (е\) = а, (еьег) = Ь, (еьез) = с и (е|) = d. Тогда матрица Грама запишется как (а Ъ с\ Ъ d 0 . (7.98) с 0 0/ С другой стороны, как мы знаем (см. пример 7.13, с. 272), в L существует ортонормированный базис, в котором матрица Грама диагональная и имеет определитель —1. Так как знак определителя матрицы Грама один и тот же для всех базисов, то отсюда следует, что \А\ = — crd < 0, т. е. сф 0 и d > 0. Условия с ф 0 и d > 0 также и достаточны для того, чтобы векторное пространство, в котором скалярное произведение задано матрицей Грама А вида (7.98), было псевдоевклидовым. Действительно, выбрав базис <7i,<72>03' в котором квадратичная форма, соответствующая матрице А, имеет канонический вид (6.28), мы видим, что условию \А\ < 0 удовлетворяет, кроме
286 Гл. 7. Евклидовы пространства псевдоевклидова пространства, еще только пространство, в котором (д?) = — 1 для всех г = 1,2,3. Но такая квадратичная форма является отрицательно определенной, т. е. (ж2) < 0 для всех векторов х ^ О, а это противоречит тому, что (е|) = d > 0. Теперь рассмотрим равенства (е^е^) = (^(е£),^(е&)) для всех индексов г ^ fe от 1 до 3. С учетом Л2 = 1, (в2,ез) = 0 и (е2) = 0 мы видим, что все они выполняются автоматически, за исключением случаев г = &=1иг=1, к = 2. Эти два случая дают соотношения 2Л6 + d = 0 и с + d = 0. Таким образом, мы можем выбрать число а произвольным, число d — любым положительным и положить с = — d и Ь = —Xd/2. Нетрудно также убедиться, что линейно независимые векторы е\,е2,е^, удовлетворяющие таким условиям, действительно существуют. Как и в евклидовом пространстве, наличие различных ориентации псевдоевклидова пространства, определяемых значением е(%) для лоренцева преобразования ^, связано с понятием непрерывной деформации преобразования (стр. 233), которое задает отношение эквивалентности на множестве преобразований. Пусть % — семейство лоренцевых преобразований, непрерывно зависящих от параметра t. Тогда |%| тоже непрерывно зависит от £, а так как определитель лоренцева преобразования равен =Ы, то значение \%\ при всех t постоянно. Таким образом, лоренцевы преобразования с определителями разных знаков непрерывно деформированы друг в друга быть не могут. Но, в отличие от ортогональных преобразований евклидовых пространств, лоренцевы преобразования % имеют еще и другую характеристику — число и(Щ) (см. определение на с. 278). Покажем, что, как и определитель |%|, число v{^t) тоже постоянно. Для этого выберем произвольный времениподобный вектор е и воспользуемся леммой 3 из § 7.7. Вектор %(е) — тоже времениподобный, причем z/(%) = +1, если е и %(е) лежат внутри одной полы светового конуса, т.е. (е,^t(e)) < 0, и 1у(Щ) = —1, если е и Щ(е) лежат внутри разных пол, т.е. (е,Щ(е)) > 0. Далее остается заметить, что функция (е,%(е)) непрерывно зависит от аргумента t, и следовательно, может изменить знак, если только при некотором значении t обратится в нуль. Но из неравенства (7.82) для времениподобных векторов х = е и у — %(е) следует неравенство (е,Ще))2>(е2)-(Ще)2)>0, показывающее, что (е, %(е)) не может обратиться в нуль ни при каком значении £. Таким образом, с учетом теоремы 7.19 мы видим, что число классов эквивалентности лоренцевых преобразований заведомо не менее четырех. Далее мы покажем, что их ровно четыре. Сначала мы установим это для псевдоевклидовой плоскости, а затем докажем и для псевдоевклидова пространства произвольной размерности. Пример 7.18. Матрицы (7.91), (7.92), задающие все возможные лоренцевы преобразования псевдоевклидовой плоскости, непрерывно деформируемы в матрицы
7.8. Лоренцевы преобразования 287 соответственно. Действительно, нужная нам непрерывная деформация получится, если в матрицах (7.91), (7.92) заменить параметр ф на (1 — £)^> где t е [0,1]. Очевидно также, что ни одна из четырех матриц (7.99) не является . непрерывно деформируемой в другую: любые две из них различаются либо знаками определителей, либо тем, что одна сохраняет полы светового конуса, а другая меняет их местами. В общем случае имеет место аналог теоремы 7.10: Теорема 7.22. Два лоренцевых преобразования %\ и % вещественного псевдоевклидова пространства непрерывно деформируемы друг в друга тогда и только тогда, когда е(*2/\) = £(%). Доказательство. Как и в случае теоремы 7.10, мы начнем с более частного утверждения: покажем, что любое лоренцево преобразование ^, для которого e(W) = (\&\,v(W)) = (+1,+1), (7.100) может быть непрерывно деформировано в £. Согласно теореме 7.21 рассмотрим ортогональное разложение (7.93), обозначив через % ограничение преобразования fy на инвариантное подпространство Ц, где г — 0,1. Исследуем отдельно три случая. Случай 1. В разложении (7.93) размерность подпространства Ц равна 1, т.е. I_i = (е), где (е2) < 0. Тогда подпространству Ц в матрице преобразования % соответствует блок первого порядка с числом а = +1 или — 1, а Щ) — ортогональное преобразование, которое, в зависимости знака сг, может быть собственным или несобственным, так чтобы было выполнено условие |^| = а\Щ)\ = 1. Однако легко видеть, что при а = — 1 имеем v(fy) = —1 (так как (е,^(е)) > 0), поэтому условие (7.100) оставляет лишь случай а = +1, и следовательно, ортогональное преобразование ^Ь — собственное. Тогда ^i — тождественное преобразование (одномерного пространства). Согласно теореме 7.10, ортогональное преобразование % непрерывно деформируемо в тождественное, и следовательно, преобразование °i/ непрерывно деформируемо в <§. Случай 2. В разложении (7.93) размерность подпространства Ц равна 2, т. е. Lj — псевдоевклидова плоскость. Тогда, как мы установили в примерах 7.16 и 7.18, в некотором ортонормированном базисе плоскости Ц матрица преобразования Щ\ имеет вид (7.92) и непрерывно деформируема в одну из четырех матриц (7.99). Очевидно, что условию v(fy) = 1 отвечает лишь матрица Е и одна из матриц F<i, F% — а именно та, в которой собственные значения ±1 соответствуют собственным векторам д± таким образом, что (ff+) < 0 и (д2_) > 0. При этом, очевидно, мы имеем ортогональное разложение Ц = (д+)0(0_).
288 Гл. 7. Евклидовы пространства Если матрица преобразования ^ непрерывно деформируема в Е, то ортогональное преобразование Щ — собственное, и следовательно, тоже непрерывно деформируемо в тождественное, что и доказывает наше утверждение. Если матрица преобразования ^/\ непрерывно деформируема в F<i или F3, то ортогональное преобразование %> — несобственное, и следовательно, его матрица непрерывно деформируема в матрицу (7.32), которая имеет собственное значение —1, соответствующее некоторому собственному вектору h е Lo. Из ортогонального разложения L = 1_о © (д+) 0 {д_) с учетом (д\) < 0 следует, что инвариантная плоскость L/ = (g_,h) является евклидовой. Матрица ограничения % на L' равна —Е и следовательно, непрерывно деформируема в Е. Это и означает, что преобразование ^ непрерывно деформируемо в S. Случай 3. В разложении (7.93) подпространство Ц — трехмерное псевдоевклидово циклическое с собственным значением Л = ±1. Этот случай был подробно рассмотрен в примере 7.17, и мы будем использовать введенные там обозначения. Очевидно, что условию z/(^) = 1 отвечает лишь Л = 1, так как в противном случае преобразование ^\ переводит светоподобный собственный вектор ез в —ез, т. е. переставляет полы светового конуса местами. Таким образом, условию (7.100) отвечает лоренцево преобразование °^\ со значением е{&\) = = (+1,+1) и собственное ортогональное преобразование Щ. Покажем, что такое преобразование Щ непрерывно деформируемо в тождественное. Так как Щ, очевидно, тоже непрерывно деформируемо в тождественное, то это и даст нужное нам утверждение. Итак, пусть А= 1. Зафиксируем в Ц базис е\,в2,ез, удовлетворяющий выведенным в примере 7.17 условиям (е?) = а, (elfe2) = -|, (e1,e3) = -d, (е22) = d, (е2,е3) = (е|) = 0 (7.101) с некоторыми числами а и d > 0. Матрица Грама А в этом базисе имеет вид (7.98) с с = — d и Ъ = — Ь/2, а матрица U\ преобразования ^ имеет вид жордановой клетки. Пусть % — линейное преобразование пространства Ц, матрица которого в базисе еье2,ез имеет вид / 1 0 0\ Ut= I t l 0 , (7.102) W) * 1/ где t — вещественный параметр, принимающий значения от 0 до 1, a ip(t) — непрерывная функция от £, которую мы выберем таким образом, чтобы преобразование % было лоренцевым. Как мы знаем, для этого должно быть выполнено соотношение (7.85) с матрицей U = Ut. Подставляя в равенство ЩА Ut = А матрицу А вида (7.98) с с = — d и Ъ — —Ь/2 и матрицу Ut вида (7.102) и приравнивая соответствующие элементы в левой и правой частях, мы получим, что равенство ЩА Ut = А имеет место, если (p(t) = t(t — l)/2. При таком выборе функции (p(t) мы получаем семейство лоренцевых преобразований Щ, непрерывно зависящих от параметра t e [0,1]. Кроме того, очевидно, что при t = 1 матрица Ut является с жордановой клеткой U\, а при t = 0 матрица Ut = Е. Таким образом, семейство % осуществляет непрерывную деформацию преобразования ^ в £.
7.8. Лоренцевы преобразования 289 Теперь докажем утверждение теоремы 7.22 в общем виде. Пусть W — лоренцево преобразование с произвольным s(W). Покажем, что оно может быть непрерывно деформировано в преобразование <^\ имеющее в некотором ортонормированном базисе блочно-диагональную матрицу F=\0 F'J' где Е — единичная матрица порядка п — 2 и F' — одна из четырех матриц (7.99). Очевидно, что за счет выбора подходящей матрицы F1 мы можем получить лоренцево преобразование & с любым е(^). Подберем матрицу F' так, чтобы было е{&) = e{W). Выберем в нашем пространстве произвольный ортонормированный базис, пусть в нем преобразование W имеет матрицу W. Тогда преобразование $У, имеющее в том же базисе матрицу U = WF, является лоренцевым, причем в силу выбора е(&) = e(W) имеем равенство e{W) = е(Ж)е(^г) = (+1,+1). Далее, из очевидно проверяемого соотношения F~l = F получаем W = UF, т. е. W = <%'&'. Воспользуемся теперь семейством %, осуществляющим непрерывную деформацию преобразования % в <§. Из равенства W = ^'& с помощью свойства 3 на с. 166 мы получаем соотношение Wt — %&, в котором Щ = §& = & и W\ = %& = W. Таким образом, семейство Wt = Щ& и осуществляет деформацию лоренцева преобразования W в &. Если f 1 и f2 - лоренцевы преобразования, такие, что е(%\) = е(%)> то, согласно доказанному ранее, каждое из них непрерывно деформируемо в & с одной и той же матрицей F'. Следовательно, по свойству транзитивности, преобразования ^ и % непрерывно деформируемы друг в друга. Подобно тому, как было сделано в § 4.4 и § 7.3 для невырожденных и ортогональных преобразований, мы можем выразить факт, установленный теоремой 7.22, в топологической форме: множество лоренцевых преобразований псевдоевклидова пространства заданной размерности имеет ровно четыре линейно связные компоненты. Они соответствуют четырем возможным значениям e(W). Заметим, что существование четырех (вместо двух) ориентации не является специфическим свойством псевдоевклидовых пространств с квадратичной формой (7.76), как это было с большинством свойств настоящего параграфа. Оно имеет место для любых векторных пространств с билинейным скалярным произведением (ж, у), если только оно невырождено, а квадратичная форма (ж2) не является ни положительно, ни отрицательно определенной. Можно (не претендуя на доказательство) указать причину этого явления. Если в каноническом виде форма (ж2) имеет вид х\-\ Ьж2-ж2+1 ж2, где s £ {1,...,п- 1}, то сохраняющие ее преобразования, во-первых, содержат ортогональные преобразования, сохраняющие форму х\ + • • • + х\ и не меняющие координаты жв+1,... ,хП9 а во-вторых, — преобразования, сохраняющие квадратичную форму х2+1 + • • • + ж| и не меняющие координаты х\,...,х8. Каждый тип преобразований «ответствен» за свою ориентацию. 10 А. О. Ремизов, И. Р. Шафаревич
Глава 8 АФФИННЫЕ ПРОСТРАНСТВА Обычный объект изучения планиметрии и стереометрии — это плоскость и пространство, состоящие из точек. Однако логически проще векторное пространство, поэтому мы и начали с его изучения. Теперь же мы можем перейти к «точечному» (аффинному) пространству. Теория таких пространств очень близка к теории векторных пространств, так что в этой главе мы будем касаться только вопросов, специфических именно для этого случая. § 8.1. Определение аффинного пространства Вернемся к исходному пункту теории векторных пространств — к § 3.1. Там мы говорили, что две точки плоскости (или пространства) определяют вектор. Это обстоятельство мы и положим в основу аксиоматического определения аффинного пространства. Определение. Аффинным пространством называется пара (V, L), состоящая из некоторого множества V (его элементы называются точками) и векторного пространства L, причем определено правило, по которому двум точкам А, В е V сопоставляется вектор пространства L, который мы будем обозначать АВ (здесь играет роль порядок точек А и В). При этом должны быть выполнены следующие условия: 1) АВ + ВС = АС. 2) Для любых трех точек А,В,С eV существует и единственна такая точка D е V, что АВ = CD. (8.1) Рис. 8.1. Равенство векторов 3) Для любых двух точек А,ВеУи числа а существует и единственна такая точка С е V, что АС = аАВ. (8.2) Замечание. Из условия 2) следует, что и АС = BD. Действительно, ввиду условия 1) мы имеем равенства АВ + BD = AD и АС + CD = AD. Значит, АВ + BD = АС + CD (см. рис. 8.1). Так как, по условию, АВ = CD, а все векторы содержатся в пространстве L, то отсюда следует, что АС = BD.
8.1. Определение аффинного пространства 291 Из этих условий и определения векторного пространства легко вывести, что для любой точки A Е V вектор АА — О, а для любых двух точек A,BeV выполнено равенство > у В А = -АВ. Точно так же легко проверить, что если точка А Е V и вектор х = АВ из пространства L заданы, то точка В Е V этим определяется однозначно. Теорема8.1. Совокупность всех векторов вида АВ, где А и В — любые точки из V, образует подпространство L' пространства L Доказательство. Пусть х = АВ, у = CD. Согласно условию 2) существует такая точка К, что В К = CD. Тогда по условию 1) вектор АК = АВ + Ш = АВ + СГ) = х + у снова содержится в подпространстве L'. Аналогичным образом, для любого вектора х = АВ из L' условие 3) дает вектор АС = аАВ = ах, который, следовательно, тоже содержится в L'. Ввиду теоремы 8.1 при исследовании аффинного пространства (V, L) нам понадобятся не все вектора пространства L, а только те, которые принадлежат его подпространству !_'. Поэтому дальше мы будем обозначать пространство L' через L. Иными словами, мы будем предполагать выполненным следующее Условие. Для любого вектора х Е L существуют такие точки А и В из V, что х = АВ. Это условие не накладывает дополнительных ограничений, оно просто равносильно переобозначению: L вместо L7. Пример 8.1. Любое векторное пространство L определяет аффинное пространство (L, L), если для двух векторов а, Ь Е L, рассматриваемых как точки множества V = L, положить аЪ — Ъ — а. В частности, совокупность Кп всех строк длины п определяет аффинное пространство. Пример 8.2. Изучаемые в курсе элементарной или аналитической геометрии плоскость и пространство являются примерами аффинных пространств. Условие 2) в определении аффинного пространства показывает, что как бы ни выбирать точку О в множестве У, любой вектор х Е L может быть представлен как х = О А. Более того, из требования единственности точки D в условии 2) следует, что при задании точки О и вектора х точка А однозначно определяется условием О А — х. Таким образом, выбрав (произвольным образом) точку О Е V и сопоставляя каждой точке А Е V вектор О А, мы получим взаимно однозначное соответствие между точками А множества V и векторами х пространства L. Иными словами, аффинное пространство — это векторное пространство, в котором не фиксировано начало координат О. С физической точки зрения, это понятие более естественное — в нем все точки равноправны или, иначе говоря, оно однородно. Математически оно выглядит сложнее — нам нужно задать не одно, а два множества: V и L. ю*
292 Гл. 8. Аффинные пространства Мы так и будем записывать аффинное пространство как пару (У, L), но часто аффинным пространством мы будем называть только V, подразумевая и L и предполагая при этом выполненными сформулированное выше условие. В этом случае будем называть L пространством векторов аффинного пространства V. Определение. Размерностью аффинного пространства (V, L) называется размерность соответствующего ему пространства векторов L. Когда желают сконцентрировать внимание на пространстве V, его размерность обозначают dim У. Дальше мы будем рассматривать только пространства конечной размерности. Аффинное пространство размерности 1 будем называть прямой, а аффинное пространство размерности 2 — плоскостью. Выбрав произвольным образом точку О Е V, мы получаем взаимно однозначное соответствие V —> L. Если dim L = п и в пространстве L выбран некоторый базис ei,...,en, то имеется изоморфизм L ^ Кп. Таким образом, при любом выборе точки О е V и базиса в L мы получаем взаимно однозначное соответствие V —> Кп и задаем каждую точку аффинного пространства V набором координат (aq,..., ап) вектора х = О А в базисе е\,...,еп. Определение. Точку О и базис е\,..., еп вместе называют репером в пространстве V и обозначают (0;еь... ,еп). Строка (ai,...,an), соответствующая точке A G V, называется координатами точки А относительного этого репера. Если относительно репера (0\е\,...9еп) точка А обладает координатами (аь... ,ап), а точка Б — координатами (/?i,... ,/Зп), то вектор АБ имеет относительно базиса ei,...,en координаты (/?i — аь ... ,/?n — ап). Точно так же, как при выборе базиса в векторном пространстве любой вектор этого пространства задается своими координатами, любая точка аффинного пространства задается своими координатами относительного репера. То есть репер играет в теории аффинных пространств такую же роль, как базис — в векторных. Мы определили репер как набор, состоящий из точки О и п векторов ei,...,en, образующих базис в L. Любой из векторов е* можно записать в виде е* = OAi, и тогда можно задать репер как набор п + 1 точек О, А\,..., Ап. При этом точки О, А\,... ,Ап не произвольные, они должны обладать тем свойством, что векторы ОА\,..., ОАп составляют базис в L, т. е. линейно независимы. Мы видели, что выбор некоторой точки О в V определяет взаимно однозначное соответствие V и L, которое заключается в сопоставлении каждой точке А е V вектора О А е L Выясним, как это соответствие меняется при изменении точки О. Если бы мы исходили из точки О', то должны были бы поставить в соответствие точке А вектор О1 А, который, по определению аффинного пространства, равен О'О + О А. Таким образом, если в первом случае мы сопоставляем точке А вектор ж, то во втором — вектор х + а, где а = О'О. Соответствующее отображение множества V получается, если
8.1. Определение аффинного пространства 293 точке А сопоставить такую точку В, что АВ = а. Такая точка В однозначно определяется выбором А и а. Определение. Сдвигом аффинного пространства (V, L) на вектор а е L называется отображение множества V в себя, сопоставляющее точке А такую точку Б, что АВ = а. (Существование и единственность такой точки В eV для любых A G У и a G L следует из определения аффинного пространства.) Мы будем обозначать сдвиг на вектор а через 3?а. Таким образом, определение сдвига может быть записано в виде формулы: &а(А) = Б, где АВ = а. Согласно данному определению, сдвиг является взаимно однозначным отображением множества V в себя. Его можно изобразить при помощи диаграммы, V ега V где взаимно однозначное соответствие ф между V и L определено при помощи точки О, соответствие ф' — при помощи точки О', а ^а есть сдвиг на вектор а = О*О. В результате отображение ф является произведением (последовательным выполнением) отображений 3?акф'. Это соотношение можно короче записать как ф' = ф + а. Сдвиги обладают следующими свойствами: 1) ^а ^Ъ — ??а+Ъ<> 2) 5Ь = <?, 3) ЗГ_а=*Г-К Доказательство. В свойстве 1) слева стоит произведение отображений, т. е. оно означает, что для любой точки С EV выполнено равенство ^аШС)) = ЗГа+ь(С). (8.4) Представим вектор Ь в виде Ъ — СР (это возможно, причем, согласно определению аффинного пространства, точка Р € V определяется однозначно). Тогда мы имеем равенство «^ь(С) = Р. Представим также вектор а в виде а — PQ. Тогда, аналогично, &а(Р) = Q- Из этих соотношений следует, что a + b = CP + PQ = CQ1 откуда мы, очевидно, получаем ^+ь(С) = Q. С другой стороны, мы имеем равенство «^(«^ь(С)) = &а(Р) = Q> что и доказывает соотношение (8.4). Свойства 2) и 3) проверяются еще проще. Заметим, что для любых двух точек A,BeV существует единственный вектор а е L, для которого &а{А) = В. А именно, это вектор а = АВ. (8.3)
294 Гл. 8. Аффинные пространства Пусть задан некоторый репер (0',е\,..., еп). Относительно него любая точка AeV имеет координаты (х\,... ,хп). Функция F(A), заданная на аффинном пространстве V и принимающая числовые значения, называется многочленом, если она выражается как многочлен от координат х\,...,хп. Это определение можно сформулировать иначе. Обозначим через ф : V —> L взаимно однозначное соответствие V и L, определенное выбором любой точки О. Тогда функция F на V является многочленом, если она представляется в виде F(A) = G(i/;(A)), где G(x) — многочлен на пространстве L (см. определение на с. 136). Конечно, надо еще проверить, что это определение не зависит от выбора репера (0;е\,..., еп), но это делается очень просто. Если ф'\ V —> L — взаимно однозначное соответствие V и L, определенное выбором точки О' (ср. диаграмму (8.3)), то ф' — ф + а. Как мы видели в § 3.8, свойство функции G(x) быть многочленом не зависит от выбора базиса в L, и остается проверить, что для многочлена G(x) и вектора а е L функция G(x + а) тоже является многочленом. Очевидно, достаточно проверить это для одночлена сх{1 • • • х^1. Если вектор х имеет координаты х\,... ,хп, а вектор а — координаты ai,...,an, то, подставляя их в одночлен сх{1 • • • х^п, мы получаем выражение с{х\ + a\)kl • • • (хп + ап)кп, которое, очевидно, тоже является многочленом от переменных хь ... ,хп. Пользуясь теми же самыми соображениями, которые мы использовали в примере 3.31, с. 139, можно для любого многочлена F на аффинном пространстве V определить его дифференциал doF в любой точке О е V. При этом дифференциал doF будет линейной функцией на пространстве векторов L пространства V, т.е. вектором сопряженного пространства L*. Действительно, рассмотрим построенное выше взаимно однозначное отображение ф: V —> L, для которого ф(0) = 0, представим F в виде F(A) = С*(ф(А)), где G(x) — некоторый многочлен на векторном пространстве L, и определим doF = doG как линейную функцию на L. Пусть в пространстве V задан репер (0;еь... ,еп), тогда F(A) будет многочленом от координат точки А относительно этого репера. Запишем выражение doF в этих координатах. По определению, дифференциал 71 ВС г=\ — линейная функция от координат х\,...,хп относительно базиса ei,...,en. При этом dG/dxi является многочленом и соответствует некоторому многочлену Ф{ на У, т.е. имеет вид Фг(А) = ^(ф(А)). Мы положим по определению Ф^ = dF/dxi. Легко проверить, что если выразить F и Ф^ как многочлены от х\,...,хп, то Ф^ действительно будет частной производной от F по переменной Х{. Так как ф{0) = 0, то Лт(0) = §£:(0). Следовательно, мы получаем для дифференциала doF выражение п яр г=1 сходное с формулой (3.70), полученной в § 3.8.
8.2. Аффинные подпространства 295 § 8.2. Аффинные подпространства Определение. Подмножество V с V аффинного пространства (V, L) называется аффинным подпространством, если множество векторов АВ для всех A,BeVf образует векторное подпространство L' векторного пространства L. Очевидно, что тогда само V1 является аффинным пространством, a L; - его пространством векторов. Если dim У7 = dim У — 1, то V называется гиперплоскостью в V. Пример 8.3. Типичным примером аффинного подпространства является множество V решений системы линейных уравнений (1.3). Если коэффициенты dij и свободные члены bi системы уравнений (1.3) принадлежат полю К, то множество решений V содержится в множестве строк Кп длины п, которое мы рассматриваем как аффинное пространство (К71, К71), т. е. V = Кп и L - Кп. Для доказательства того, что множество решений V7 — аффинное подпространство, проверим, что его пространство векторов L' является пространством решений однородной системы линейных уравнений, ассоциированной с (1.3). То, что множество решений линейной однородной системы является векторным подпространством в Кп, было установлено в § 3.1 (пример 3.5). Пусть строки х и у — решения системы (1.3), рассматриваемые нами сейчас как точки аффинного пространства V = Кп. Нам нужно проверить, что вектор ху, определенный в соответствии с рассмотренным выше примером, содержится в L'. Но в соответствии с этим примером, мы должны положить ху = у — ж, и нам остается проверить, что строка у — х содержится в подпространстве L', т.е. является решением однородной системы, ассоциированной с системой (1.3). Это свойство достаточно проверить отдельно для каждого уравнения. Пусть г-ое уравнение линейной однородной системы, ассоциированной с (1.3), записано в виде (1.10), т.е. Fi(x) = 0, где Fi — некоторая линейная функция. По условию, х и у — решения системы (1.3), в частности, Fi(x) = Ы и Fi(y) = bi. Отсюда следует, что Fi(y - х) = Fi(y) - F^x) = 6» - Ь» = 0, как и утверждалось. Пример 8.4. Докажем теперь, что, наоборот, любое аффинное подпространство в аффинном пространстве (Kn,Kn) определяется линейными уравнениями, т. е. если V' — аффинное подпространство, то V совпадает с множеством решений некоторой системы линейных уравнений. Так как V — подпространство аффинного пространства (КП,КП), то по определению, соответствующее множество векторов L/ — подпространство векторного пространства Кп. Мы видели в § 3.1 (пример 3.5), что тогда оно определяется в Кп однородной системой линейных уравнений Fx(x) = 0, F2(x)=0, ..., Fm(x)=0. (8.5) Рассмотрим произвольную точку А е Vf и положим Fi{A) = bi для всех г = 1,... ,77i. Докажем, что тогда подпространство Vf совпадает с множеством
296 Гл. 8. Аффинные пространства решений системы Fi(aO = 6b F2{x) = h2, ..., Fm(x) = bm. (8.6) Действительно, возьмем любую точку В Е V'. Пусть в некотором репере точки А и В имеют координаты А = (ai,...,an) и В = (fa,... ,/Зп). Тогда координаты вектора АВ равны (fa — а\,... ,(Зп — ап), и мы знаем, что точка В принадлежит V тогда и только тогда, когда вектор х = АВ принадлежит подпространству L', т.е. удовлетворяет уравнениям (8.5). Воспользовавшись теперь тем, что функции Fi линейны, мы получим, что для любой из них Fi(fa-au...^n-an) = Fi(fa,...,f37l)~Fi(au...,an)=Fi(B)-bi. Значит, точка В принадлежит аффинному подпространству V' тогда и только тогда, когда Fi(B) = h, т.е. ее координаты удовлетворяет уравнениям (8.6). Определение. Аффинные подпространства V и Vм называются параллельными, если они имеют одно и то же пространство векторов, т. е. L' = L". Легко видеть, что два параллельных подпространства или не имеют общих точек, или полностью совпадают. Действительно, предположим, что V и Vм параллельны и точка А е V П V". Так как пространства векторов для V и Vм совпадают, то для любой точки В Е V1 существует такая точка С Е Vn\ что АВ = АС. Отсюда, с учетом единственности точки D в соотношении (8.1) из определения аффинного пространства следует, что В = С и, значит, V С V". Поскольку определение параллельности не зависит от порядка подпространств V' и V", то имеет место и обратное включение V" С V, а значит, Vf = V".. Пусть V' и Vй — два параллельные подпространства, выберем в каждом из них по точке: А Е V и В Е V". Положив вектор АВ — а, мы получим, по определению сдвига 5^, что ^а(А) = В. Рассмотрим произвольную точку С Е V. Из определения параллельности следует, что существует такая точка D Е V'1', что АС = BD. Отсюда, как легко видеть, следует, что CD = АВ = а (см. рис. 8.1 и замечание на с. 290). Но это значит, что &а(С) = D. Иными словами, &а(У) С V". Аналогично получаем, что ЗГ-а(у") с V\ а отсюда, из свойств 1-3 сдвига вытекает, что V" С ^a(Vf). Значит, £Га(Уг) = V", т.е. любые два параллельные подпространства переводятся друг в друга некоторым сдвигом. Наоборот, легко проверить, что аффинные подпространства V и £?а(У') параллельны для любых V и а. Рассмотрим две различные точки А и В аффинного пространства (V, L). Тогда совокупность всех точек С, существование которых устанавливается условием 3) определения аффинного пространства (при произвольных числах се), образует, как легко проверить, аффинное подпространство V1'. Соответствующее векторное подпространство L; совпадает с (АВ). Поэтому L', а значит, и аффинное пространство (V, L') одномерно. Оно называется прямой, проходящей через точки А и В.
8.2. Аффинные подпространства 297 Понятие прямой связано с общим понятием аффинного подпространства при помощи следующего утверждения. Теорема 8.2. Для того, чтобы подмножество М аффинного пространства V, определенного над полем характеристики, отличной от 2, являлось его аффинным подпространством, необходимо и достаточно, чтобы прямая, проходящая через всякие две точки М, целиком содержалась в М. Доказательство. Необходимость этого условия очевидна. Докажем его достаточность. Выберем произвольную точку О е М. Нам надо доказать, что множество векторов О А, где А — всевозможные точки множества М, образует подпространство L/ в пространстве векторов L аффинного пространства (У, L). Тогда для любой другой точки В е М вектор АВ = О В — О А будет принадлежать подпространству L', и значит, (М, L') будет аффинным подпространством пространства (V, L). То, что произведение любого вектора О А на любое число а содержится в L', вытекает из условия, что прямая (ОА) содержится в L/. Проверим, что сумма двух векторов а = О А и Ъ — ОВ, содержащихся в I/, тоже содержится в L'. Для этого условие, наложенное нами на множество точек прямой, понадобится нам только при а = 1 /2 (чтобы воспользоваться им, мы и предположили, что поле К, над которым рассматривается аффинное пространство V, является полем отличной от 2 характеристики). Пусть С — такая точка на прямой, проходящей через А и В, что АС = 1/2АВ. По условию, вместе с каждой парой точек А и В множества М этому множеству принадлежит прямая, проходящая через них. Отсюда, в частности, следует, что С G М и ОС е \J. Обозначим вектор ОС через с (см. рис. 8.2). Тогда имеем равенства: Ь = ОВ = ОА + АВ = а + АВ1 с = ОС = ОА + АС = а + АС. Таким образом, в нашем случае вектор АВ = Ь — а и АС = с — а, и значит, с — а — 1/2(6 — а), т. е. с — 1/2(а + Ъ). Следовательно, вектор а + Ъ = 2с, а так как с е L', то и вектор а + b £ 1Л Пусть теперь Ао, А\,..., Ат — совокупность т+ 1 точек аффинного пространства V. Рассмотрим подпространство L7 = (AoAi,AoA2,...,AoArn) пространства L. Оно не зависит от выбора точки А$ среди заданных точек Ао, А\,..., Ат, и его можно записать, например, в виде (...,AiAj,...) для всех г и j, 0 ^ г, j ^ т. Совокупность V всех точек В е V, для которых вектор АоВ G L/, образует аффинное подпространство, пространством векторов которого является L7. Согласно определению dim V' ^ га, причем dim V = га
298 Гл. 8. Аффинные пространства 7 7 7 тогда и только тогда, когда dimL = га, т.е. векторы АоА\,АоА2,...,АоАт линейно независимы. Это дает основание для следующего определения. Определение. Точки Ао,А\,... ,АГ1 финного пространства V, для которых -о— аф- dim(Ao^i, А0А2,..., АоАт) = га, Рис. 8.3. Независимые точки называются независимыми. Например, точки Ао,А\,...,Ап (где п — — dim У) определяют репер тогда и только тогда, когда они независимы. Независимы две различные точки и три точки, не лежащие на одной прямой и т.д. (рис. 8.3). Важным свойством аффинных пространств, сближающим их с привычным пространством из элементарной геометрии, является следующее: Теорема 8.3. Через каждые две различные точки А и В аффинного пространства V проходит единственная прямая. Доказательство. Очевидно, что различные точки А и В независимы, и содержащая их прямая V' с V должна совпадать с совокупностью точек С £ V, для которых АС Е (АВ) (можно было бы вместо АС рассматривать вектор ВС — он определяет то же самое подпространство V' С V). Если АС = аАВ и АС = /ЗАВ, то С С = (/3 - а)АВ, откуда и следует, что V — прямая. Выбрав на любой прямой Р аффинного пространства V точку О (начало отсчета) и любую отличную от нее точку Е е Р (масштаб измерения), мы получим для произвольной точки АеР соотношение ОА = аОЕ, (8.7) где а — некоторое число, т.е. элемент поля К, над которым рассматривается аффинное пространство V. Сопоставление Аиа, как легко проверить, устанавливает взаимно однозначное соответствие между точками АеР и числами а. Это соответствие, конечно, зависит от выбора точек О и Е на прямой. Собственно, мы имеем здесь частный случай понятия координат — относительно репера (О; е) на аффинной прямой Р, где е = ОЕ. Благодаря этому, с любыми тремя точками А,ВиС аффинного пространства, принадлежащими одной прямой, за исключением лишь случая, когда А — В — С, можно связать число а, которое называется отношением точек А, В и С (иногда говорят — простым отношением) и обозначается (А, В, С). Это делается следующим образом. Если А ф Б, то а однозначно определяется из соотношения АС = аАВ. В частности, а = 1, если В = С, и а = 0, если А — С. Если А — В ф С, то полагают а = оо. Если же все три точки А, В и С совпадают, то отношение (А, В, С) не определено. Используя понятие ориентированной длины отрезка, можно записать отношение трех точек в виде формулы
8.2. Аффинные подпространства 299 (АВ,С) = —, (8.8) где АВ означает длину отрезка АВ со знаком, т.е. АВ = \АВ\, если точка А лежит левее В, и АВ = — |АВ|, если точка А лежит правее В. При этом, естественно, в формуле (8.8) считается, что а/0 = оо для любого числа а Ф 0. Далее в этом параграфе мы будем предполагать, что V — вещественное аффинное пространство. В этом случае, очевидно, числа а из соотношения (8.7), соответствующие точкам прямой Р, вещественны, и отношение а < 7 < Р между числами на вещественной прямой переносится на соответствующие им точки прямой Р с V. Если эти числа а, /3 и 7 соответствуют точками А,ВиС, то говорят, что точка С лежит между точками А и В. Несмотря на то, что само соответствие ina, определяемое формулой (8.7), зависит от выбора различных точек О и Е на прямой, свойство точки С лежать между А и В от этого выбора не зависит (хотя при ином выборе О и Е порядок точек А и В, конечно, может измениться). Действительно, как легко проверить, при замене точки О на О' ко всем числам а,/3 и 7 прибавляется одно и то же слагаемое Л, соответствующее вектору 00', а при замене точки Е на Е' числа а,/3 и 7 умножаются на одно и то же число д^О, такое, что ОЕ = \хОЕ'. При обеих операциях соотношение а < 7 < Р для точки С и пары точек А и В не изменяется, только лишь числа а и Р в этом неравенстве могут поменяться местами (в случае, если они умножаются на \± < 0). Свойство точки С лежать между А и В связано с введенным выше отношением трех точек, принадлежащих одной прямой. А именно, очевидно, что в случае вещественного пространства неравенство (С, А, В) < 0 выполняется тогда и только тогда, когда точка С лежит между А и В. Определение. Совокупность точек прямой, проходящей через точки А и Р, лежащих между А и В, вместе с самими А и В называется отрезком, соединяющим точки А и В, и обозначается [А,В]. При этом точки А и В называются концами отрезка и, по построению, содержатся в нем. Таким образом, отрезок определяется двумя точками А и В, но не их порядком, т.е., по определению, [В,А] = [А,В]. Определение. Множество М cV называется выпуклым, если вместе с любыми двумя точками А,ВеМ оно содержит и все точки отрезка [А, В]. Понятие выпуклости связано с разбиением аффинного пространства V гиперплоскостью V на два полупространства, аналогично разбиению векторного пространства на два полупространства, построенному в § 3.2. Для того, чтобы определить это разбиение, обозначим через L7 с L гиперплоскость, соответствующую V1, рассмотрим введенное выше разбиение L \ L7 = L+ U L-, выберем любую точку О1 е V1 и положим для точки А е V \ V, что А Е V+ или A g V~ в зависимости от того, какому полупространству (1_+ или 1_~) принадлежит вектор О'А.
300 Гл. 8. Аффинные пространства Простая проверка показывает, что полученные подмножества V+ и V зависят только от полупространств 1_+ и L- и не зависят от выбора точки О* Е V. Очевидно, что V \ V = V+ U V~ и У+ П V~ = 0. Теорема 8.4. Множества V+ и V~ выпуклы, а все множество V \ V1 — нет. Доказательство. Проверим сначала утверждение о множестве V+. Пусть А, В Е V+. Это значит, что векторы ж = О'А и у = О1 В содержатся в полупространстве L+, т.е. представляются в виде *х = ае + и, у = /Зе + v, а,/3>0, u,veLf (8.9) > при некотором фиксированном векторе е 0 !_'. Рассмотрим вектор z = OfC и запишем его в виде z = je + w, wel'. (8.10) Предполагая, что точка С лежит между А и В, докажем, что z e L+, т. е. что 7>0. Заданное свойство — точка С лежит между А и В — записывается с помощью сопоставления точкам прямой, проходящей через А и В, чисел — координат в репере (О; 0£") по формуле (8.7). Хотя это сопоставление зависит от выбора точек О и Е, но само свойство «лежать между», как мы видели, от этого выбора не зависит. Поэтому мы можем выбрать О — А и Е = В, тогда в нашем репере точка А имеет координату 0, а точка В — координату 1. Пусть С имеет координату Л. Так как Се[А,В], то 0 ^ Л ^ 1. По определению, АС = ХАВ. Но в силу того, что АС = АО' + OrC = z-x, АВ = АО' + (УВ = у-х, мы получаем равенство z — х = Х(у — х) или, эквивалентно, равенство z = (1 — Х)х + Ху. Пользуясь формулами (8.9) и (8.10), из последнего равенства мы получаем соотношение 7 = (1 — Х)а + А/?, из которого с учетом неравенств а > 0, /3 > 0 и 0 ^ Л ^ 1 следует, что 7 > 0. Выпуклость множества V~ доказывается дословно так же. Докажем, наконец, что множество V \ Vf не выпукло. Ввиду выпуклости У+ и V~ нам интересен только случай, когда точки А и В принадлежат разным полупространствам — например, А Е V+ и В Е V~ (или, наоборот, А Е V~ и В Е V+, но этот случай совершенно аналогичен). Условие А е V+ и В е V~ означает, что в формулах (8.9) числа а > 0 и (3 < 0. Аналогично предыдущему, для любой точки С Е [А, В] строим вектор z, как это было сделано в (8.10), и так же получаем равенство 7 = (1 — Х)а + Л/?. В случае, когда числа а и /3 разного знака, простейшая выкладка показывает, что всегда существует такое число Л Е [0,1], что (1 — Х)а + Х/3 = 0, а это и значит, что С Е [ДВ]. Тем самым, теорема доказана полностью. Таким образом, множество V+ характеризуется тем свойством, что любые две его точки соединяются принадлежащим ему отрезком. Это верно
8.3. Аффинные преобразования 301 и для множества V~. В то же время никакие две точки А е У+ и Б е V~ не могут быть соединены отрезком, не пересекающим гиперплоскость V'. Это соображение дает другое определение разбиения V \ V' = V+ U V~, не апеллирующее к векторным пространствам. Рассмотрим последовательность подпространств V0cVlcV2C---cVn = V, <Шп^ = г. (8.11) Из последнего условия следует, что V{-\ является гиперплоскостью в Vu и значит, определено разбиение Vi \ Vi-\ = V+i U V~i, введенное выше. Пара (Vi-\,Vi) называется направленной, если указано, какое из двух выпуклых подмножеств множества V^\T^_i мы обозначаем через Т^+, а какое — через Vf. Последовательность подпространств (8.11) называется флагом, если каждая пара (V^_i,V^) является направленной. Заметим, что во флаге, определенном последовательностью (8.11), подпространство Vb имеет размерность 0, т. е. состоит из одной точки. Эта точка называется центром флага. § 8.3. Аффинные преобразования Определение. Аффинным преобразованием аффинного пространства (У, L) в другое аффинное пространство (V, U) называется пара отображений /: V -> V\ &: L -> L', удовлетворяющая двум условиям: 1) отображение &\ L —» Y! является линейным преобразованием векторных пространств L —» L7; 2) для любой пары точек A,BeV выполнено равенство f(A)f(B) = &(AB). Условие 2) означает, что линейное преобразование & определяется отображением /. Оно называется линейной частью отображения / и обозначается Л(/). Дальше мы будем, как правило, указывать только отображение /: V —> V', поскольку линейная часть ^ им определяется однозначно, и рассматривать аффинное преобразование как отображение V —> V. Теорема 8.5. Аффинные преобразования обладают следующими свойствами: а) Последовательное выполнение двух аффинных преобразований fug снова дает аффинное преобразование, обозначаемое gf. При этом A(gf) = A(g)A(f). б) Аффинное преобразование f взаимно однозначно тогда и только тогда, когда линейное преобразование Л(/) взаимно однозначно. В этом случае обратное отображение f~l также является аффинным преобразованием и Л(/-1) = A(f)~l. в) Если f = е — тождественное преобразование, то Л(/) = £. Доказательство. Все эти утверждения получаются прямой проверкой.
302 Гл. 8. Аффинные пространства а) Пусть (V, L), {VfXf) и (V77, L77) — некоторые аффинные пространства. Рассмотрим аффинное преобразование /: V —> У7 с линейной частью & = Л(/) и другое аффинное преобразование д: V —» У77 с линейной частью <£ — А(д). Результат последовательного выполнения / и д обозначим через h, а результат последовательного выполнения & и <S — через ^f7. Тогда, по определению произведения произвольных отображений множеств, h: V —> V" и Ж: L —> L77, причем, как мы знаем, ^? является линейным преобразованием. Таким образом, нам нужно показать, что для любой пары точек А, В е У выполнено равенство h(A)h(B) = Ж [AS). Но так как, по определению, мы имеем равенства f(A)f(B) = &(АВ), д(А'МВ') =У(А!&) для любых точек А, В е У и А', В' е У7, то Л(А)Л(В) = g(f(A))g(f(B)) = &(f(A)f(B)) = Щ&(АВ)) = Ж(АВ). Утверждения б) и в) проверяются столь же непосредственно. Приведем некоторые примеры аффинных преобразований. Пример 8.5. Для аффинных пространств (L, L) и (L7, L7) линейное преобразование / = &\ L —> L7 является аффинным, причем, очевидно, Л(/) = &. Далее нам часто будут встречаться аффинные преобразования, в которых аффинные пространства У и У7 (а значит, и пространства векторов L и L7) будут совпадать. Мы будем называть их аффинными преобразованиями пространства V в себя. Пример 8.6. Сдвиг &а на любой вектор а е L является аффинным преобразованием пространства У в себя. Из определения сдвига следует, что М^а) = &- Наоборот, всякое аффинное преобразование, линейная часть которого равна §, является сдвигом. Действительно, по определению аффинного преобразования, условие Л(/) = S означает, что f(A)f(B) = АВ. Вспомнив замечание на с. 290 и рис 8.1, мы видим, что из этого утверждения вытекает равенство Af(A) = Bf(B), а это значит, что / = &а, где вектор а = Af(A) для какой-нибудь (любой) точки А пространства У. Это же рассуждение позволяет получить и более общий результат. Теорема 8.6. Если аффинные преобразования /: У —> У7 и д: V —> У7 имеют одинаковые линейные части, то они отличаются друг от друга на сдвиг, т. е. существует такой вектор а е L7, что g = ЗГа f. Доказательство. Согласно определению, равенство Л(/) = А(д) означает, что f(A)f(B) = д{А)д{В) для любых двух точек А, В е У. Из этого, очевидно, следует равенство у > f(A)g(A)=f(B)g(B). (8.12) Как и в предыдущем примере, это рассуждение основано на замечании, сфор: мулированном на с. 290. Соотношение (8.12) означает, что вектор f(A)g(A) не зависит от выбора точки А. Обозначим этот вектор через а. Тогда, по
8.3. Аффинные преобразования 303 определению сдвига, д(А) = &a(f(A)) для любой точки А Е V, что и утверждает теорема. Определение. Пусть V с V — подпространство аффинного пространства V. Аффинное преобразование f:V^>V называется проектированием на подпространство V1', если f(V) — V7, а ограничение / на V' — тождественное преобразование. Теорема 8.7. Если f: V —► V — проектирование на подпространство Vf с V, то прообраз f~l{Af) любой точки А1 е V является аффинным подпространством в V размерности dim V — dim V'. Для разных точек А', А" е V' подпространства f~l(A') и f~x{A") параллельны. Доказательство. Пусть & = Л(/), тогда &\ L —» L7 — линейное преобразование, где L и L7 — пространства векторов аффинных пространств V и V соответственно. Рассмотрим любую точку A' eV' и точки Р, Q е /_1(А7), т. е. /(Р) — /(Q) = А7. Тогда вектор f(P)f(Q) = 0, откуда, согласно определению аффинного преобразования, получаем, что f(P)f(Q) = ^(PQ) = 0, то есть вектор PQ принадлежит ядру линейного преобразования #, которое, как мы знаем, является подпространством в L. Наоборот, если Р е /_1(А7) и вектор х принадлежит ядру преобразования j£", т.е. &{х) = 0, то существует точка Q G У, для которой х — PQ. Тогда /(Р) = /(Q) и Q е f~l(Af). По условию, любой вектор х = А1 В1 е L7 может быть представлен в виде &(PQ), где /(Р) = А' и /(Q) = Р7. Значит, образ преобразования J^ совпадает со всем пространством L7, откуда по теореме 3.13 получаем dim Г1 (А') = dim &~х (0) = dim L - dim L7 = dim V - dim V\ так как J£*_1(0) есть ядро преобразования J£\ а число dimL7 равно его рангу (рис. 8.4). Мы уже доказали, что для любой точки А' е V пространство векторов аффинного пространства f~l(A') совпадает с ^~*(0). Тем самым теорема доказана. Подпространства f~x(Af) для точек А' £ V1 называются слоями проектирования /: V —> V (рис. 8.4). Если Sf С V' — некоторое подмножество (не обязательно подпространство), то его прообраз — множество S = f~l(Sf) — называется цилиндром в V. Определение. Аффинное преобразование /: V —> V7 называется изоморфизмом, если оно взаимно однозначно. Аффинные пространства V и V' в этом случае называются изоморфными. Согласно утверждению б) теоремы 8.5 условие взаимной однозначности преобразования /: V —» V равносильно взаимной однозначности линейного преобразования Л(/): L —> L7 соответствующих пространств векторов L и L7. Рис. 8.4. Слои проектирования
304 Гл. 8. Аффинные пространства Таким образом, аффинные пространства V и V изоморфны тогда и только тогда, когда изоморфны соответствующие им пространства векторов L и L/. Как было показано в § 3.5, векторные пространства L и L' изоморфны тогда и только тогда, когда dimL = dimL', и при этом изоморфизмом является любое невырожденное линейное преобразование L —> L/. Отсюда вытекает следующее утверждение: аффинные пространства V и V' изоморфны тогда и только тогда, когда dim V = dim У7. При этом изоморфизмом V и V' является любое аффинное преобразование /: V —> V7, у которого линейная часть Л(/) невырождена. Аффинное преобразование / с невырожденной линейной частью Л(/) мы также будем называть невырожденным. Из определений непосредственно вытекает следующее утверждение. Теорема 8.8. Отношение (А, Б, С) трех точек, лежащих на одной прямой, не меняется при невырожденном аффинном преобразовании. Доказательство. Согласно определению отношение а — {А,В,С) трех точек А, В, С при условии А ф В определяется из соотношения АС = аАВ. (8.13) Пусть /: V —► V — невырожденное аффинное преобразование, 3F\ L —► L — соответствующее ему линейное преобразование. Тогда в силу невырожденности преобразования /, имеем f(A) ф f(B) и f(A)f(C) = ^(ACl f(A)f(B) = ^(AB), ир= (/(А), /(Б), /(C)) определяется из равенства f(A)f(C) = 0f(A)f(B), т. е. J?(AC)=(3&(AB). (8.14) Применяя к обеим частям равенства (8.13) преобразование J^\ мы получаем JP(AC) = а^(АВ), откуда с учетом равенства (8.14) следует, что /3 = а. В случае А = В ф С мы в силу невырожденности / получаем аналогичное соотношение f(A) = f(B) Ф /(С), откуда имеем (А, В, С) = оо и(/(А),/(В),/(С)) = оо. Пример 8.7. Любое аффинное пространство (V, L) изоморфно пространству (L, L). Действительно, выберем в множестве V произвольную точку О и определим отображение /: V —> L так, что f(A) = О А. Очевидно, что согласно определению аффинного пространства отображение / является изоморфизмом. Заметим, что ситуация здесь похожа на изоморфизм векторного пространства L и сопряженного пространства L*. В одном случае изоморфизм требует выбора базиса в L, в другом — выбора точки О в V. Пусть /: V —► V7 — аффинное преобразование аффинных пространств (У, L) и (V7, L'). Рассмотрим изоморфизмы (р: V —► L и (р': V —> L', определенные, как в примере 8.7, выбором некоторых точек О G V и О' е V. Мы имеем отображения
8.3. Аффинные преобразования 305 V —f-^ V1 (8.15) L > L' где ^ — Л(/). При этом, вообще говоря, мы не можем утверждать, что &tp = ip'f, но тем не менее эти отображения тесно связаны. Для любой точки А Е V по построению имеем (р(А) = О А и &((р(А\) = &{ОА) = f(Q)f(A). Точно так же, у/(/(А)) = O'f(A). Наконец, 0'f{A) = 0'f{0) + f(0)f(A). Объединяя эти соотношения, получаем <p'f = %&<p, где b = 0,f(0). (8.16) Соотношение (8.16) позволяет записать действия аффинных преобразований в координатной форме. Для этого выберем в пространствеах V и V' реперы (0;еь ... ,еп) и {Q',e\,... ,е^), где n — dim У и га = dim У7. Тогда координаты точки А в выбранном репере — это координаты вектора О А = (р(А) в базисе вь... ,вп. Точно так же координаты точки /(А) — это координаты вектора O'f(A) = <p\f(A)) в базисе е'1,...,е'т. Воспользуемся соотношением (8.16). Пусть координаты вектора О А в базисе ei,...,en равны (ai,...,an), координаты вектора 0'f(A) в базисе е^,..., е'ш — (а\,...,o4J, а матрица линейного преобразования & в этих базисах — F = (/#)• Положив координаты вектора Ъ из формулы (8.16) в базисе е\,...,е'т равными (/?ь ••• >/?т)> мы получим (4 = ^2fijaj+Pi, г=1,...,га. (8.17) Используя стандартные обозначения вектор-столбцов ["]=( ! j, M=f :), 1(3]= ( \ J, \«n/ \<W V/W можно переписать формулу (8.17) в виде [a']=F[oc} + [(3]. (8.18) Далее чаще всего нам будет встречаться случай преобразования аффинного пространства V в себя. Предположим, что отображение / : V —> V имеет неподвижную точку О, т. е. для точки О eV выполнено равенство /(О) = О. Тогда преобразование / может быть отождествлено со своей линейной частью, т.е. если за счет выбора в аффинном пространстве V репера (0;еь... ,en) с неподвижной точкой О отождествить V с векторным пространством L, то отображение / отождествится со своей линейной частью & = А(/). При этом /(О) = Ои ОДА) = &(оХ) для любой точки А Е У. у
306 Гл. 8. Аффинные пространства Такие аффинные преобразования пространства V в себя мы будем называть линейными (заметим, что это понятие зависит от выбора точки О Е V, которую / переводит в себя). Если для любого аффинного преобразования / определить /о = ^Г1/» гДе вектор а = Of (О), то /о будет линейным преобразованием, и мы получаем представление / = ^а/о- (8.19) Очевидно, что невырожденное аффинное преобразование пространства (У, L) переводит любой репер (0\е\,..., еп) в некоторый репер. Это значит, что если f(0) = Of и Л(/)(вг) = e'i9 то (O'je'p... ,eJJ тоже является репером. Наоборот, если преобразование / переводит некоторый репер опять в репер, оно невырождено. Из представления (8.19) вытекает следующее утверждение. Если задан репер (О; е\,..., еп), произвольная точка О' и векторы а\,..., ап из L, то существует (и притом единственное) аффинное преобразование /, переводящее О в О7 и такое, что Л(/)(вг) = щ для всех г = 1,...,п. Для доказательства положим в представлении (8.19) вектор а = 00', а в качестве /о возьмем такое линейное преобразование векторного пространства L в себя, что /o(ej) = щ для всех г = 1,...,п. Очевидно, что построенное таким образом аффинное преобразование / удовлетворяет нужным условиям. Его единственность следует из представления (8.19) и того, что векторы е\,...,еп образуют базис в L. Очевидна следующая переформулировка этого утверждения: если заданы п+ 1 независимых точек Aq9A\, ..., Ап n-мерного аффинного пространства V и любые другие его п+1 точек Во,В\,...,Вп, то существует (и притом единственное) аффинное преобразование /: V —► V, такое, что f(Ai) = Bi для всех г — 0,1,...,п. Нам дальше будет полезно знать зависимость вектора а в представлении (8.19) от выбора точки О (от ее выбора зависит также и преобразование /о пространства V, но как преобразование векторного пространства L оно совпадает с Л(/)). Положим 00' = с. Тогда при новом выборе О' в качестве начальной точки мы имеем аналогичное (8.19) представление / = ^«'4 (8-20) > где /q{О') — О1 и вектор а' = Orf(Or). По известным правилам мы имеем а7 = 07(00 = ^0 +О/СО7), О ДО7) = Of (О) + f{0)f(0') = а + ^(с). » >• Так как О10 = —ОО', то мы получаем, что векторы а и а7 в представлениях (8.19) и (8.20) связаны между собой соотношением о! = а + &(с)-с, где с = (Ю'. (8.21) Выберем в аффинном пространстве (V, L) некоторый репер. Напомним, что мы записываем его в виде (0',е\,...,еп) или (0;А\,... ,Ап), где е$ = ОА{. Пусть / — невырожденное преобразование V в себя, и пусть оно переводит
8.3. Аффинные преобразования 307 репер (0;еь... ,еп) в (Of,e\,... ,е'п). Если е\ = 01А[, то это значит, что ДО) = 0'и Д^)=^приг=1,...,п. Пусть точка A е V имеет относительно репера (О; А\,..., Ап) координаты (аь... ,ап). Это значит, что вектор О А равен aqei H + апеп. Тогда точка /(А) определяет вектор ДО)ДА), т.е. «^"(ОА). А этот вектор, очевидно, имеет в базисе е\,...,егп те же самые координаты, что вектор О А в базисе ei,...,en, так как, по определению, е[ = &{ei). Таким образом, аффинное преобразование / задается тем, что точка А переходит в другую точку /(А), имеющую в репере (0\е\,... ,е'п) те же координаты, которые точка А имела в репере (0;еь ... ,еп). Определение. Два подмножества S и Sf аффинного пространства V называются аффинно эквивалентными, если существует такое невырожденное аффинное преобразование /: V —> V, что f(S) = S'. Предыдущее рассуждение показывает, что это определение равносильно тому, что в пространстве V существуют такие два репера (0;еь... ,еп) и (Of;e\,... ,eJJ, что все точки множества S имеют относительно первого репера те же координаты, что и точки множества Sf — относительно второго. В случае вещественных аффинных пространств задание аффинных преобразований формулами (8.17) и (8.18) позволяет перенести на них теорему 4.11 о собственных и несобственных линейных преобразованиях. Определение. Невырожденное аффинное преобразование вещественного аффинного пространства V в себя называется собственным, если его линейная часть является собственным преобразованием векторного пространства. В противном случае оно называется несобственным. Таким образом, согласно этому определению, сдвиги мы зачисляем в собственные преобразования. Несколько позже мы приведем более содержательное обоснование такого определения. Согласно приведенному определению аффинное преобразование / является или не является собственным в зависимости от знака определителя матрицы F = (fij) в формулах (8.17), (8.18). Заметим, что это понятие относится только к невырожденным преобразованиям V, так что в формулах (8.17) и (8.18) должно быть т = п. Для того, чтобы сформулировать аналог теоремы 4.11, нам необходимо уточнить смысл утверждения о том, что семейство g(t) аффинных преобразований непрерывно зависит от параметра t. Под этим мы будем понимать то, что для g{t) в аналогичной (8.17) формуле п a'i = ^9ij{t)aj + 0i(t), i = 1 та, (8.22) i=i записанной в некотором (произвольно выбранном) репере пространства V, все коэффициенты gij(t) и /%(£) непрерывно зависят от t. В частности, если G(i) — (gij{t)) — матрица линейной части аффинного преобразования g(t), то ее определитель \G(t)\ — непрерывная функция. Из свойств непрерывных
308 Гл. 8. Аффинные пространства функций вытекает, что определитель \G{t)\ имеет один и тот же знак во всех точках отрезка [0,1]. Таким образом, мы будем говорить, что аффинное преобразование / непрерывно деформируемо в h, если существует такое семейство g(i) невырожденных аффинных преобразований, непрерывно зависящее от параметра t е [0,1], что g(0) = f и g(l) = h. Очевидно, что определенное таким образом свойство аффинных преобразований быть непрерывно деформируемыми друг в друга задает на их множестве отношение эквивалентности, т. е. для него выполнены свойства рефлексивности, симметричности и транзитивности. Теорема 8.9. Два невырожденных аффинных преобразования вещественного аффинного пространства непрерывно деформируемы друг в друга тогда и только тогда, когда они либо оба собственные, либо оба несобственные. В частности, невырожденное аффинное преобразование f тогда и только тогда собственное, когда оно непрерывно деформируемо в единичное. Доказательство. Начнем с последнего, более частного, утверждения теоремы. Пусть невырожденное аффинное преобразование / непрерывно деформируемо в е. Тогда в силу симметричности существует такое непрерывное семейство невырожденных аффинных преобразований g{t) с линейной частью A(g(t)), что д(0) = е и д(1) = /. Запишем для преобразования g(t) формулу (8.22) в некотором репере (0\е\,... ,еп) пространства V. Очевидно, что для матрицы G(i) = (##(*)) выполнены соотношения G(0) = Е и G(l) = F, где F — матрица линейного преобразования & = Л(/) в базисе ei,...,en пространства L и /?г(0) = 0 для всех г = 1,...,п. По определению непрерывной деформации, определитель \G(t)\ отличен от нуля при всех t е [0,1]. Так как |б?(0)| = \Е\ = 1, то \G(t)\ > 0 для всех t е [0,1], и, в частности, для t = 1. Последнее означает, что |Л(/)| = |G(1)| > 0. Таким образом, линейное преобразование Л(/) — собственное, и, по определению, аффинное преобразование / — тоже собственное. Пусть, наоборот, / — собственное аффинное преобразование. Это значит, что линейное преобразование Л(/) — собственное. Тогда по теореме 4.11 преобразование Л(/) непрерывно деформируемо в тождественное. Пусть &(t) — семейство линейных преобразований, такое, что ^(0) = £ и ^(1) = Л(/), задаваемое в некотором базисе е\,... ,еп пространства L формулой п ai = y^29ij(t)aj^ г=1,...,п, (8.23) 3 = 1 где gij(t) — непрерывные функции, матрица G(t) = (gijit)) невырождена для всех t G [0,1] и выполнены равенства G(0) = E, G(t) = F, где F — матрица преобразования Л(/) в том же базисе е\,... ,еп. Рассмотрим семейство g(t) аффинных преобразований, задаваемых в репере (0;е\,..., еп) формулой п а'г = ^2 9^а3 + №> i = lj * *' ' П' 3 = 1
8А. Евклидовы аффинные пространства и движения 309 в которой коэффициенты g%j{t) взяты из формулы (8.23), а коэффициенты fa — из формулы (8.17) для преобразования / в том же репере (0;ei,..., еп). Так как ^(0) = £ и Sf (1) = Л(/), то очевидно, что #(0) = е и j(l) = /, причем \G(t)\ > 0 для всех t G [0,1], т.е. преобразование g(t) является невырожденным для всех t е [0,1]. В силу транзитивности из доказанного следует, что любые два собственные аффинные преобразования непрерывно деформируемы друг в друга. Случай несобственных аффинных преобразований рассматривается совершенно аналогично, нужно лишь заменить во всех предшествующих рассуждениях тождественное преобразование S некоторым фиксированным линейным преобразованием пространства L. Теорема 8.9 показывает, что, аналогично вещественным векторным пространствам, в любом вещественном аффинном пространстве существуют две ориентации, из которых мы по произволу можем выбрать любую. § 8.4. Евклидовы аффинные пространства и движения Определение. Аффинное пространство (V, L) называется евклидовым аффинным пространством, если векторное пространство L евклидово. Это значит, что для любых двух векторов ж, у G L определено скалярное произведение (ж, у), удовлетворяющее условиям, перечисленным в § 7.1. В частности, (ж, ж) ^ 0 для всех ж е L и определена длина |ж| = у/(х,х) вектора ж. Поскольку любая пара точек А, В Е V задает вектор АВ е L, то любым двум точкам А и В можно сопоставить число г(АВ) = \АВ1 называемое расстоянием между точками А и В в V. Введенное таким способом расстояние удовлетворяет сформулированным на с. 14 условиям метрики: 1) г(А,В) >0при АфВ иг(А,А)=0\ 2) г(А,В) — г(В,А) для любых точек А и В; 3) для любых трех точек А, В и С справедливо неравенство треугольника: г(Д С) < г(Д В) + г(В, С). (8.24) Свойства 1) и 2) очевидно следуют из свойств скалярного произведения. Докажем неравенство (8.24), частный случай которого (для прямоугольного треугольника) был доказан на с. 220. По определению, если АВ = ж и ВС = у, то (8.24) равносильно неравенству \х + у\ ^ |ж| + |у|. (8.25) Поскольку в левой и правой частях (8.25) стоят неотрицательные числа, мы можем возвести обе части в квадрат, и получить эквивалентное неравенство, которое и докажем: \х + у\2^(\х\ + \у\)2. (8.26)
310 Гл. 8. Аффинные пространства Так как |ж + у\ - (х + у,х + у) = \х\ + 2(ж, у) + |у|2, то, раскрывая скобки в правой части (8.26), мы перепишем это неравенство в виде |ж|2 + 2(ж,у) + |у|2 ^ |ж|2 + 2|ж| • |у| + |у|2. Сокращая подобные члены в левой и правой частях, приходим к неравенству (ж,у) < |ж| • \у\, т.е. неравенству Коши-Буняковского-Шварца (7.6). Таким образом, евклидово аффинное пространство является метрическим пространством. В § 8.1 мы определили репер аффинного пространства как точку О в V и базис е\,... ,еп в L. Если наше аффинное пространство (V, L) является евклидовым, а базис е\,..., еп — ортонормированным, то и репер (О; е\,..., еп) называется ортонормированным. Мы видим, что с любой точкой О е V можно связать ортонормированный репер. Определение. Отображение д: V —> V евклидова аффинного пространства V в себя называется движением, если оно является изометрией V как метрического пространства, т.е. сохраняет расстояние между точками. Это означает, что для любых двух точек A,BeV выполнено равенство r(g(A),g(B))=r(A,B). (8.27) Подчеркнем, что в данном определении речь идет именно о произвольном отображении д: V —> V, которое, вообще говоря, не обязано предполагаться аффинным преобразованием. Согласно приведенным на с. 17 рассуждениям отображение д: V —> V является движением, если его образ g(V) = V и выполнено условие сохранения расстояния (8.27). Пример 8.8. Пусть а — произвольный вектор векторного пространства L, соответствующего аффинному пространству V. Тогда сдвиг вГа является движением. Действительно, по определению сдвига, для любой точки A eV имеем равенство ^а(А) = В, где АВ = а. Если для некоторой другой точки С имеем аналогичное равенство «^(С) = D, то CD = а. В силу условия 2) в определении аффинного пространства отсюда вытекает равенство АВ — CD, из которого, согласно замечанию на с. 290, следует, что АС — BD. Значит, \АС\ = \BD\, или, что то же самое, г (А, С) = г{^а{А),^а{С)), как и утверждалось. Пример 8.9. Предположим, что отображение д: V —> V имеет неподвижную точку О, т.е. для О е V выполнено равенство д(0) = О. Как мы видели в § 8.3, выбор точки О определяет взаимно однозначное отображение V —> L, где L — пространство векторов аффинного пространства V. При этом точке А е V сопоставляется вектор О А Е L. Таким образом, отображение д: V —> V определяет некоторое отображение £?: L —> L, такое, что Sf (0) = 0. Подчеркнем, что так как мы не предполагали
8.4. Евклидовы аффинные пространства и .движения 311 отображение g аффинным преобразованием, отображение £f, вообще говоря, не является линейным преобразованием пространства L. Сейчас мы проверим, что если У — линейное ортогональное преобразование евклидова пространства L, то g — движение. По определению, преобразование Sf задается условием &(ОА) — Од{А). Нам нужно доказать, что д — движение, т. е. для любых двух точек А и В выполнено равенство \9(А)д(В)\ = \АВ\. (8.28) Мы имеем равенство АВ = ОВ — О А, и получаем, что д(А)д(В) = д~(А)6 + OgjB) = Од~{В) - Од~(А), а этот вектор, по определению преобразования ^, равен У(ОВ) — &(ОА). Ввиду того, что преобразование У предполагается линейным, этот вектор равен У {О В — О А). Но, как мы видели, О В — О А = АВ и значит, д{А)д{В)=У(АВ). Из ортогональности преобразования Sf следует, что \У(АВ)\ = \АВ\. В сочетании с предыдущими соотношениями это и дает нужное равенство (8.28). Понятие движения является самой естественной математической абстракцией, соответствующей представлению о перемещении твердого тела в пространстве. Мы можем применить к его анализу всю совокупность результатов, полученных в предыдущих главах, на основании следующего фундаментального утверждения: Т е о р е м а 8.10. Любое движение является аффинным преобразованием. Доказательство. Пусть / — движение евклидова аффинного пространства V. В качестве первого шага выберем в V произвольную точку О и рассмотрим вектор а = Of (О) и отображение g = Z?-af пространства V в себя. Здесь произведение &-af, как обычно, означает последовательное выполнение отображений / и 2?-а. Тогда О является неподвижной точкой отображения д, т. е. д(0) = О. Действительно, д(0) = 51а (/(О)), и по определению сдвига, равенство д(0) = О равносильно тому, что f(0)0 = —а, а это, очевидно следует из того, что а = Of (О). Заметим теперь, что произведение (т. е. последовательное выполнение) двух движений д\ и д^ тоже есть движение, проверка этого непосредственно следует из определения. Так как мы знаем, что &а — движение (см. пример 8.8), то и д — движение. Таким образом, мы получаем представление / в виде / = &ад, где д — движение и д(0) = О. Тем самым, как мы видели в примере 8.9, д определяет некоторое отображение У пространства L в себя. Основной частью доказательства является проверка того, что У — линейное преобразование.
312 Гл. 8. Аффинные пространства Мы будем основываться на следующем простом соображении. Лемма. Пусть задано отображение Sf: векторного пространства L в себя и некоторый базис е\,...,еп в нем. Положим Sf (е») = е\, г = 1,..., п, и предположим, что для любого вектора х = а\е\ Н Ь апеп (8.29) его образ У(х) = а1е\ + .-. + апе,п (8.30) с теми же а\,..., ап. Тогда 5f — линейное преобразование. Доказательство. Нам нужно проверить два условия, входящие в определение линейного преобразования: а) &(х + у)=&(х)+&(у), б) У {ах) = о&(х) для любых векторов х и у и числа а. Эта проверка совершенно очевидна. а) Пусть векторы х = а\е\ Н \- апеп и у = /3\е\ Н Ь Агвп. Тогда их сумма x + y = (ai+p\)ei-\ Ь (an + /?п)еп. С другой стороны, по условию леммы имеем &(х + у) = (ai + A )ei + ■ • • + К + /Зп)е; = = {ахе\ + • • • + ane;) + (fte'i + • • • + А»0 = Sf (ж) + #(у). б) Для вектора х = а\е\ Н Ь cenen и произвольного числа а ах — (аа\)е\ H Ь (aan)en. По условию леммы, У (ах) = (aai)ei Ч V (aan)e^ = a(aiei Л V о>пе'п) = о&(х). Продолжение доказательства теоремы 8.10. Проверим, что построенное выше отображение У: L —> L удовлетворяет условию леммы. Для этого сначала убедимся, что оно сохраняет скалярное произведение в L, т. е. что для любых векторов х,у е L выполнено равенство тх),^(у)) = (х,у). (8.31) Вспомним, что свойство преобразования g быть движением формулируется как следующее свойство преобразования У векторного пространства L: \9(х)-9(у)\ = \х-у\ (8.32) для любых двух векторов х и у. Возводя обе части равенства (8.32) в квадрат, получаем \9(х)-9(у)\2 = \х-у\2. (8.33) Так как ж и у — векторы евклидова пространства L, то \х-у\2 = \х\2 -2(х,у) + \у\2,
8.4. Евклидовы аффинные пространства и движения 313 \У{х) - Й%)|2 = №)|2 - 2{У{х)*Пу)) + №Ш2- Подставляя эти выражения в равенство (8.33), мы находим, что \&(х)\2 - 2{У{х),У{у)) + \&(у)\2 = И2 - 2(х,у) + \у\2. (8.34) Полагая в соотношении (8.34) вектор у = 0, с учетом того, что ё?(0) = О, мы получаем равенство \&(х)\ = \х\ для любого х е L. Наконец, с учетом соотношений |#(ж)| = \х\ и |^(у)| = |j/|, из (8.34) и следует нужное нам равенство (8.31). Таким образом, для любого ортонормированного базиса е\,..., еп векторы ep...,e^, определенные соотношениями Sf(e^) = ej, тоже образуют орто- нормированный базис, в котором координаты вектора х — х\е\ + • • • + хпеп задаются формулой Х{ — (ж, е$). Отсюда мы получаем, что (&(х),е'{) — ж», и значит, &(х) = х\е\ Н \-хпе'п, т. е. построенное отображение Sf: L —> L удовлетворяет условию леммы. Отсюда следует, что Sf — линейное преобразование пространства L, а в силу свойства (8.31) оно является ортогональным преобразованием. Заметим, что попутно мы доказали возможность представления любого движения / в виде произведения f=&a9, (8.35) где STa — сдвиг, a g имеет неподвижную точку О и соответствует некоторому ортогональному преобразованию У пространства L (ср. пример. 8.9). Из представления (8.35) и результатов § 8.3 следует, что два ортонормированных репера переводятся друг в друга движением, и притом единственным. Для исследования движений мы можем воспользоваться уже изученной в § 7.2 структурой ортогональных преобразований, т. е. теоремой 7.9. Согласно этой теореме для любого ортогонального преобразования, в частности, для преобразования Sf, соответствующего движению g в формуле (8.35), существует ортонормированный базис, в котором его матрица G имеет блочно- диагональный вид: /1 \ -1 -1 ТЧ>\ (8.36) Gipr/
314 Гл. 8. Аффинные пространства где /cos (pi — sirupi G<fi = . \ sm (fi cos (fi и числа (fi Ф пк, к G Z. Два числа —1, стоящие на главной диагонали матрицы (8.36), могут быть заменены матрицей G^ вида (8.37) с (р = 7г, так что можно считать, что в матрице (8.36) число —1 отсутствует или встречается ровно один раз и при этом О < щ < 2п. При таком соглашении мы получаем, что если преобразование У собственное, то чисел —1 на главной диагонали нет, а если У несобственное, то есть ровно одно такое число. Из сказанного следует, что в случае собственного преобразования У пространства L размерности п имеет место ортогональное разложение L = 1_о© Ц 0 ••• ©Ц, где Ц -L Ц- при всех i^j, (8.38) все подпространства Ьо,...,Ц инвариантны относительно преобразования Sf, и dim Lo = n — 2k, dim Ц — 2 для всех г = 1,..., к. Ограничение ^ на Lq является тождественным преобразованием, а ограничение Sf на подпространство Ц с г = 1,..., к есть поворот на угол ^. Если же преобразование <S несобственное, то на главной диагонали матрицы (8.36) один раз встречается число —1. Тогда в ортогональном разложении (8.38) прибавляется еще одно дополнительное одномерное слагаемое Ц.+1, в котором преобразование <& переводит каждый вектор х в противоположный вектор —ж. Ортогональное разложение пространства L в сумму подпространств, инвариантных относительно преобразования ^, приобретает вид L = L0 © Ц © • • • © Ц 0 Ц+1, где Ц J_ Ц- при всех г ф j, (8.39) причем dim Li = 2 для г = 1,..., к, dim Lo = n — 2к — 1 и dim L^+i = 1. Теперь воспользуемся произволом в выборе точки О в представлении (8.35) движения /. Согласно формуле (8.21) при изменении точки О вектор а в (8.35) заменяется на вектор а + &(с) — с, где за с может быть принят любой вектор пространства L. Мы имеем представление с = со + с\ + • • • + сь Ci e Ц, (8.40) в случае разложения (8.38) или c = cq + ci-\ bcfc + cfc+ь a g Li, (8.41) в случае разложения (8.39). Так как £f (ж) = х для любого вектора х е Lo, то слагаемое со не дает никакого вклада в вектор ^(с) — с, прибавляемый к а. Для г > 0 положение прямо противоположное: преобразование У — £ определяет невырожденное преобразование в L;. Это следует из того, что ядро преобразования <g — S равно (0), что очевидно для поворота на угол ^, 0 < щ < 27Г, в плоскости и для преобразования — £ на прямой. Поэтому образ преобразования У — £ в Li равен всему подпространству L; при г > 0. То есть любой вектор щ е L^ может быть представлен в виде щ = &(ci) — Ci, где q — некоторый другой вектор того же пространства L^, г > 0. (8.37)
8.4. Евклидовы аффинные пространства и движения 315 Таким образом, в соответствии с представлениями (8.40) и (8.41), вектор а можно записать в виде а = ао + а\ -\ + а^ или а = ао + а\ -\ \- а& + + afc+i, в зависимости от того, является ли преобразование ^ собственным или несобственным. Мы можем положить ai = @(ci) — ci, где векторы q определены соотношениями (8.40) или (8.41) соответственно. В результате мы получим равенство а + <£{с) — с = ао, означающее, что за счет выбора точки О мы можем добиться того, что вектор a будет содержаться в подпространстве Ц). Таким образом, нами доказана Теорема 8.11. Любое движение f евклидова аффинного пространства V может быть представлено в виде f = Pag, (8.42) где преобразование g имеет неподвижную точку О и соответствует ортогональному преобразованию У = А(д), а ^а — сдвиг на вектор а, такой, что &(а) = а. Рассмотрим самый наглядный пример «физического» трехмерного пространства, в котором мы живем. Здесь возможны два случая. Случай 1. Движение / — собственное. Тогда ортогональное преобразование Sf : L —> L тоже собственное. Так как dimL = 3, то разложение (8.38) имеет вид L = Lo0Lb Ц-LLf, где dim l_o = 1 и diml_i = 2. Преобразование Sf не меняет векторы из L_o и определяет поворот на угол 0 < (р < 27г в плоскости Ц. Представление (8.42) показывает, что преобразование / может быть получено как поворот на угол <р вокруг прямой Lq И СДВИГ В направлении 1_о (рис. 8.5). Рис. 8.5. Собственное Этот результат можно переформулировать ина- движение че. Пусть твердое тело совершает непрерывно во времени сколь угодно сложное движение. Тогда его начальное положение может быть совмещено с конечным положением поворотом вокруг некоторой оси и сдвигом вдоль этой оси. Действительно, так как перемещается твердое тело, то конечное положение получается из начального некоторым движением /. Так как это перемещение получено как непрерывное движение, то оно — собственное. Таким образом, мы можем применить трехмерный случай теоремы 8.11. Полученный результат называется теоремой Эйлера. Случай 2. Движение / — несобственное. Тогда ортогональное преобразование Sf : L —► L тоже несобственное. Так как dimL = 3, то разложение (8.39) имеет вид L = LoeL!©L2, Ц-LLj,
316 Гл. 8. Аффинные пространства где Lo = (0), diml_i =2и dimL2 = 1. Преобразование <S определяет поворот на угол 0 < <р < 27г в плоскости L\ и переводит каждый вектор прямой 1_2 в противоположный. Отсюда вытекает, что равенство &(а) = а возможно лишь с вектором а = О, следовательно, сдвиг &а в формуле (8.42) равен тождественному преобразованию. Поэтому движение / всегда имеет неподвижную точку О и получается как поворот на угол 0 < (р < 2тт в плоскости 1_ь проходящей через эту точку, и зеркальное отражение относительно плоскости Ц. Теории движений в евклидовом аффинном пространстве можно придать более наглядный вид, воспользовавшись понятием флага, введенным в § 8.2 (с. 301). Прежде всего, ясно, что движение пространства переводит флаг во флаг. Основной результат, фактически уже доказанный, может быть сформулирован так: Т е о р е м а 8.12. Для любых двух флагов существует движение, переводящее первый флаг во второй, и такое движение единственно. Доказательство. Для проверки этого утверждения заметим, что для любого флага V0 С Vi С • • • С Vn = V (8.43) аффинное подпространство Vq, по определению, состоит из одной-единствен- ной точки. Положив Vq = О, мы можем отождествить каждое подпространство Vi с подпространством Ц с L, где Ц — пространство векторов аффинного пространства VJ. При этом последовательность L0 С Ц с • • • С Ln - L (8.44) задает флаг в L. С другой стороны, мы видели в § 7.2, что флаг (8.44) однозначно соответствует ортонормированному базису ei,...,en в L. Таким образом, Ц = (еь... ,е$) и е* Е ц, как это было установлено в § 7.2. Значит, флаг (8.43) однозначно задается некоторым ортонормированным репером (0;ei,... ,en) в V. Как мы отметили выше, для двух ортонормированных реперов существует единственное движение пространства V, переводящее первый репер во второй. Тем самым, это верно и для двух флагов вида (8.43), что и утверждается теоремой. Свойство, доказанное в теореме 8.12, называется «свободной подвижностью» евклидова аффинного пространства. Для случая трехмерного пространства это утверждение является математическим выражением того факта, что твердое тело в нем можно произвольно передвигать и поворачивать. В аффинном евклидовом пространстве расстояние г (А, В) между любыми двумя точками не меняется при движениях пространства. В общем аффинном пространстве невозможно связать с каждой парой точек число, которое не менялось бы при произвольных невырожденных аффинных преобразованиях. Это следует из того, что для любой пары различных точек А,Ви любой другой пары А1, В' существует аффинное преобразование /, переводящее А в А' и В в В'. Для доказательства запишем преобразование / согласно формуле (8.19), в виде / = &afo> выбрав в качестве точки О точку А. При этом А является
8.4. Евклидовы аффинные пространства и движения 317 неподвижной точкой аффинного преобразования /о, т.е. fo(A) = А. Преобразование /о определяется некоторым линейным преобразованием пространства векторов L нашего аффинного пространства V и однозначно задается соотношением у > Af0(C) = &(AC)9 CeV. Тогда условие f(A) = Af будет выполнено, если мы положим а = АА'. Остается выбрать линейное преобразование &\ L —► L таким образом, чтобы было выполнено равенство f(B) = В\ т.е. &afo(B) — В', что равносильно соотношению MB) = ^-а(В'). (8.45) Положим вектор х = АВ (по условию, Аф В, поэтому х ф 0) и рассмотрим точку Р — &La(B') и вектор у = АР. Тогда соотношение (8.45) эквивалентно равенству &{х) = у. Нам остается только найти линейное преобразование 3?\ L —> L, для которого выполнено условие ^"(ж) = у при заданных векторах ж и у, причем х ф 0. Для этого нужно дополнить вектор х до базиса пространства L и определить ^ на векторах этого базиса произвольным образом, лишь бы только было выполнено условие &(х) = у.
Глава 9 ПРОЕКТИВНЫЕ ПРОСТРАНСТВА § 9.1. Определение проективного пространства В планиметрии точки и прямые на плоскости играют очень похожую роль. Для того, чтобы подчеркнуть эту симметрию, основное свойство, связывающее точки и прямые на плоскости, называют инцидентностью, и тот факт, что точка А принадлежат прямой I или прямая / проходит через точку А, выражают в симметричной форме, говоря, что А и I инцидентны. Тогда можно было бы надеяться, что каждому утверждению геометрии об инцидентности некоторых точек и прямых соответствует другое утверждение, которое получается из первого, если в нем всюду поменять местами слова «точка» и «прямая». И это действительно так, за некоторыми исключениями. Например, каждым двум различным точкам инцидентна одна и только одна прямая. Но не верно, что каждым двум различным прямым инцидентна одна и только одна точка: исключение составляет случай, когда прямые параллельны; тогда им не инцидентна ни одна точка. Проективная геометрия дает возможность избавиться от подобных исключений, добавив к плоскости некоторые точки, которые называют бесконечно удаленными. Например, тогда две параллельные прямые инцидентны некоторой бесконечно удаленной точке. Да и при наивном восприятии внешнего мира мы «видим», что параллельные прямые, удаляясь от нас, сближаются и пересекаются в точке, принадлежащей «горизонту». Собственно говоря, «горизонт» — это и есть совокупность всех бесконечно удаленных точек, которыми мы дополняем плоскость. Анализируя приведенный пример, мы можем сказать, что видимая нами точка плоскости является пересечением луча, исходящего из точки, находящегося в центре нашего глаза, с его (глаза) сетчаткой. Математически эта ситуация описывается при помощи понятия центрального проектирования. Предположим, что изучаемая нами плоскость П содержится в трехмерном пространстве. Выберем в том же пространстве некоторую точку О, не содержащуюся в плоскости П. Любая точка А плоскости П может быть соединена с О некоторой прямой О А. Наоборот, прямая, проходящая через точку О, пересекает плоскость П в определенной точке, если только эта прямая не параллельна П. Таким образом, большинство прямых, проходящих через точку О, соответствуют точкам А е П. Но прямые, параллельные П, интуитивно соответствуют как раз бесконечно удаленным точкам плоскости П, или «точкам горизонта» (рис. 9.1).
9J. Определение проективного пространства 319 Это представление мы и положим в основу определения проективного пространства и дальше разовьем его подробнее. Определение. Пусть L — произвольное векторное пространство конечной размерности. Совокупность всех прямых (ж), где х — ненулевой вектор пространства L, называется проективизацией L или, иначе, проективным пространством P(L). При этом сами прямые (ж) называются точками проективного пространства P(L). Размерностью пространства P(L) называется число DimP(L) = = dimL-1. Как мы видели в гл. 3, все векторные пространства одинаковой размерности п изоморфны. Это выражают, говоря, что существует только одна теория n-мерного векторного пространства. В том же смысле существует только одна теория n-мерного проективного пространства. Проективное пространство размерности п мы часто будем обозначать через Р71, если нам не нужно указывать (п+ 1)-мерное векторное пространство, с помощью которого оно построено. Если DimP(L) = 1, то P(L) называется проективной прямой, а если DimP(L) = 2, то — проективной плоскостью. Точками проективной прямой являются прямые на обычной плоскости, а точками проективной плоскости — прямые в трехмерном пространстве. Как и раньше, мы предоставляем читателю на выбор — считать ли L вещественным или комплексным пространством, или же рассматривать его как пространство над произвольным полем К (за исключением некоторых особых вопросов, связанных именно с вещественными пространствами). В соответствии с данным выше определением, мы будем полагать DimP(L) = — 1, если dimL = 0. В этом случае множество Р(1_) пусто. Для того, чтобы ввести координаты в пространстве Р(1_) размерности п, выберем базис ео, еь ..., еп в пространстве L. Точка А е P(L) — это, по определению, прямая (ж), где ж — ненулевой вектор из L. Тем самым мы имеем представление ж = аоеъ + а\е\ Н V апеп. (9.1) Числа (ао,аь... ,аЛ) называются однородными координатами точки А. Но точка А — это целая прямая (ж). Она может быть получена и в виде (у), если у = Лж и Л т^ 0. Тогда у = Ааово + Aceiei Н Ь \апеп. Отсюда следует, что числа (Аао, Ха\, • • • , Хап) — тоже однородные координаты точки А. То есть однородные координаты определены только с точностью до общего ненулевого множителя. Так как по условию А = (ж) и ж ф 0, то все они одновременно не могут быть равными нулю. Чтобы подчеркнуть, что однородные координаты определены лишь с точностью до общего ненулевого Рис. 9.1. Центральное проектирование
320 Гл. 9. Проективные пространства множителя, их записывают в виде (од : ct\ : ol<i : ••• : ап). (9.2) Таким образом, если мы хотим выразить некоторое свойство точки А в терминах ее однородных координат, то это утверждение должно сохранять свой смысл, если все однородные координаты {а^,а\,...,ап) одновременно умножить на одно и то же отличное от нуля число. Предположим, например, что мы рассматриваем точки проективного пространства, однородные координаты которых удовлетворяют соотношению F(a0,ab...,an) = 0, (9.3) где F — многочлен от п + 1 переменной. Для того, чтобы это требование действительно относилось к точкам и не зависело от множителя Л, на который мы можем умножать их однородные координаты, необходимо, чтобы вместе с числами (ao,aq,... ,an) соотношению (9.3) удовлетворяли бы и числа (Лао, Aai,..., Хап) при любом ненулевом множителе А. Выясним, когда это требование будет выполняться. Для этого соберем в многочлене F(xq,х\,...,хп) вместе все слагаемые вида ах0°хх1 • • • ж*п с ко + к\ + • • • + кп = т и обозначим их сумму через Fm. Мы получим представление N F(xo,xi,...,xn) = y^Fm(xo,xi,...1xn). т=0 Из определения Fm сразу следует, что Fm{\x0, Хх\,..., Ххп) = XmFrn(xo, х\,..., хп). Отсюда N F(XxQ,Xx\,...,Xxn) = ^ XmFm(xo,xi,...,xn). N Наше условие означает, что равенство J2 Аш^т = 0 выполняется для коор- т=0 динат рассматриваемых точек и одновременно для всех значений А, отличных от нуля. Обозначим через Cm значение Fm(ao,a\,...,an) для какого-то конкретного выбора однородных координат (ао,а\,... ,ап). Тогда мы приходим N к условию ]Г СтХ™ = 0 для всех значений А, отличных от нуля. Это значит, т=0 N что многочлен ^ СгпХт от переменной А имеет бесконечное число корней 771=0 (для простоты мы сейчас предполагаем поле К, над которым рассматривается векторное пространство L, бесконечным; однако этим ограничением можно было бы и не пользоваться). Тогда, по известной теореме алгебры многочленов, все коэффициенты Cm равны нулю. Иначе говоря, наше равенство (9.3) сводится к выполнению соотношений
9.1. Определение проективного пространства 321 Fm(ao,au ... ,ап) = О, т = О,1,... ,N. (9.4) Многочлен Fm содержит только одночлены одинаковой степени га, т. е. однороден. Мы видим, что свойство точки А, выраженное через алгебраические соотношения между ее однородными координатами, не зависит от допустимого выбора координат, а только от самой точки А, если оно выражается равенством нулю однородных многочленов от координат. Если L' с L - векторное подпространство, то P(L/)cP(L), так как каждая прямая (ж), содержащаяся в L', содержится и в L. Такие подмножества P(L') с Р(1_) называются проективными подпространствами пространства P(L). Каждое P(L'), по определению, само является проективным пространством. Тем самым определена его размерность DimP(L') = dimL/ — 1. По аналогии с векторными пространствами, проективное подпространство P(L') с P(L) называется гиперплоскостью, если DimP(L/) = DimP(L) — 1, т.е. dimL' = dimL — 1, и следовательно, V — гиперплоскость в L. Множество точек пространства P(L), определенных соотношениями ( Fi(ao,ai,...,an) =0, J i<2(ao,ai,...,an) = 0, I Fm(aQ,a\,...,an) = 0, где F\,F2,...,Fm — однородные многочлены различных (вообще говоря) степеней, называется проективным алгебраическим многообразием. Пример 9.1. Простейшим примером проективного алгебраического многообразия является проективное подпространство. Действительно, как мы видели в § 3.7, любое векторное подпространство L' с L можно задать с помощью системы линейных однородных уравнений, и следовательно, проективное подпространство P(L') с Р(1_) можно задать формулой (9.5), в которой га = DimP(L) — DimP(L/) и степень всех однородных многочленов F\,... ,Fm равна 1. При этом в случае т — 1 мы получаем гиперплоскость. Пример 9.2. Другой важный пример проективного алгебраического многообразия — так называемые проективные квадрики, они задаются формулой (9.5), где ш=1 и степень единственного однородного многочлена F\ равна 2. Квадрики будут подробно рассмотрены нами в гл. 11. Простейшие примеры проективных квадрик встречались в курсе аналитической геометрии — это кривые второго порядка на проективной плоскости. Пример 9.3. Рассмотрим множество точек проективного пространства P(L), у которых г-я однородная координата (в некотором базисе ео, еь... ,ета пространства L) равна нулю, и обозначим через Ц множество соответствующих этим точкам векторов пространства L. Подмножество Ц С L определено в L одним линейным уравнением щ = 0 и, следовательно, является гиперплоскостью. Значит, Р(Ц) является гиперплоскостью проективного пространства P(L). Множество точек проективного пространства P(L), у которых г-я 11 А. О. Ремизов, И. Р. Шафаревич
322 Гл. 9. Проективные пространства однородная координата отлична от нуля, обозначим через Т^. Очевидно, что Ц, уже не является проективным подпространством в P(L). Естественным обобщением примера 9.3 является следующая конструкция. Пусть в пространстве L выбран произвольный базис ео, е\,...,еп. Рассмотрим некоторую линейную функцию </? на пространстве L, не равную тождественно нулю. Векторы х е L, для которых <р(х) = О, образуют гиперплоскость L<p С L — это подпространство решений «системы», состоящей из одного линейного однородного уравнения. Ему соответствует проективная гиперплоскость Р(Цр) С P(L). Очевидно, что Ц, совпадает с гиперплоскостью Ц из примера 3, если линейная функция (р сопоставляет каждому вектору х е L его г-ю координату, т.е. ср является г-м вектором базиса пространства L*, взаимного базису ео,еь... ,еп пространства L. Теперь обозначим через W^ множество векторов х е L, для которых (р(х) = 1. Это опять множество решений «системы», состоящей из одного линейного уравнения, но уже неоднородного. Его естественным образом можно рассматривать как аффинное пространство с пространством векторов L^. Обозначим множество P(L) \Р(Ц>) через V^>. Тогда для любой точки A^V^ существует единственный вектор х е И7^, для которого А = (ж). Таким путем мы можем отождествить множество V^ с множеством W^ и с помощью этого отождествления рассматривать V^ как аффинное пространство. По определению, его пространство векторов есть Ц,, и если А и В — две точки из V<p, то имеются два таких вектора ж и у, для которых (р(х) = 1 и <р(у) = 1, что А = (х) и В = (у), и тогда АВ = у — х. Таким образом, n-мерное проективное пространство P(L) представляется как объединение n-мерного аффинного пространства V^ и проективной гиперплоскости Р(Ц>) с P(L), рис. 9.2. Дальше мы будем называть V^ аффинным подмножеством пространства P(L). Выберем в пространстве L базис ео,..., еп так, что (р(ео) = 1 и ^(е») = 0 для всех г = = 1,...,п. Тогда вектору ео соответствует точка О = (ео), принадлежащая аффинному подмножеству V^, а все остальные векторы ei,...,en е Ц>, и им соответствуют точ- V=l ки (ei),..., (еп), содержащиеся в гиперплоскости P(L^). Таким образом, мы построили в аффинном пространстве (V^, Цр) репер (0;еь...,еп). Координаты (fi,...,£n) точки AeVip относительно этого репера называются неоднородными координатами точки А из нашего проективного пространства. Подчеркнем, что они определены только для точек из аффинного подмножества V<p. Если вернуться к определениям, то мы увидим, что неоднородные координаты (£ь ... ,£п) получаются из однородных координат (9.2) по формулам Рис. 9.2. Аффинное подмножество проективного пространства & = ОЦ ао 1,...,п. (9.6)
9.1. Определение проективного пространства 323 При этом, очевидно, выбранная нами функция ср принимает на векторе ж из формулы (9.1) значение (р(х) = од. Для того, чтобы распространить понятие неоднородных координат на все точки проективного пространства P(L) = V^U P(L^), остается рассмотреть еще точки из проективной гиперплоскости P(L^). Для таких точек естественно положить значение ао = 0. Иногда это выражают, говоря, что неоднородные координаты (£i,...,£n) точки А Е Р(Ц^) принимают бесконечные значения, что и оправдывает представление о P(L^) как о множестве «бесконечно удаленных точек» (горизонте) для аффинного подмножества V^. Конечно, можно было бы выбрать и такую линейную функцию ср, что (p(ei) = 1 для некоторого номера г Е {0,... , п}, не обязательно равного 0, как это было выше, и (p(ej) = 0 для всех j ф г. Мы обозначим соответствующие пространства V^ и Ц через V* и Ц. В этом случае проективное пространство P(L) представляется в аналогичном виде Vi U Р(Ц), т. е. как объединение аффинной части Vi и гиперплоскости Р(Ц) для соответствующего значения г Е {0, ...,п}. Иногда этот факт выражают, говоря, что на проективном пространстве Р(1_) можно ввести различные аффинные карты. Нетрудно видеть, что каждая точка А проективного пространства Р(1_) является «конечной» для какого-нибудь значения г Е {0,... , п}, т. е. принадлежит подмножеству Vi для соответствующего значения г. Это следует из того, что по определению, однородные координаты (9.2) точки А не равны нулю одновременно. Если ai ф 0 для какого-нибудь г Е {0,... , п}, то А содержится в соответствующем аффинном подмножестве Vi. Если L' и L" — два подпространства пространства L, то очевидно, что P(L') n P(L") = P(L' n L;/). (9.7) Несколько сложнее интерпретировать множество P(L7 + L"). Очевидно, что оно не совпадает с P(LX) UP(L/7). Например, если L' и L" — две различные прямые на плоскости L, то множество P(L7) U P(L"), представляющее собой две точки, вообще не является проективным подпространством пространства P(L). Чтобы дать геометрическую интерпретацию множеств P(L7 + L;/), мы введем следующее понятие. Пусть Р = (е) иР' = (е') — две различные точки проективного пространства P(L). Положим Ц = (е, е') и рассмотрим одномерное проективное подпространство Р(Ц). Оно, очевидно, содержит обе точки Р и Р' и, кроме того, само содержится в любом проективном подпространстве, содержащем точки Р и Р1. Действительно, если 1_2 С L — такое векторное подпространство, что Р(1-2) содержит точки Р и Р', то это значит, что L_2 содержит векторы е и е', а следовательно, оно содержит и все подпространство Ц = (е, е;). Поэтому, согласно определению проективного подпространства, Р(Ц) с Р(1-2). Определение. Построенное по двум данным точкам Р ф Р' одномерное проективное подпространство Р(Ц) называется прямой, соединяющей точки Р и Р'. Теорема 9.1. Пусть L7 и L" — два подпространства векторного пространства L. Тогда объединение прямых, соединяющих всевозможные и*
324 Гл. 9. Проективные пространства точки из P(L') со всевозможными точками из P(L"), совпадает с проективным подпространством Р(1_' + L"). Доказательство. Обозначим через Е объединение прямых, о которых идет речь в формулировке теоремы. Любая такая прямая имеет вид Р(Ц), где l_i — (е7, е"), векторы е' G L' и е" G L". Так как е! + е" G L' + L/;, то, согласно тому, что было сказано выше, каждая такая прямая Р(Ц) содержится в P(L' + L"). Тем самым мы доказали, что множество Е С P(L' + L"). Наоборот, пусть теперь точка S е Р(1_) содержится в проективном подпространстве P(L7 + L"). Это значит, что S = (е), где вектор е е L' + L". Последнее означает, что вектор е представим в виде е = е' + е", где е! е L' и еп G L". Значит, S — (е) и вектор е содержится в плоскости (е^е"), т.е. S принадлежит прямой, соединяющей точку (е7) из P(L') с точкой (е7/) из Р(1_7/). Иными словами, S е Е, и таким образом, подпространство P(L' + L") с Е. С учетом доказанного выше обратного включения мы получаем требуемое равенство E = P(L' + L"). Определение. Множество P(L; + L") называется проективной оболочкой множества P(L') U Р(1_7/) и обозначается как P(L/ + L") - P(L')UP(L"). (9.8) Вспоминая теорему 3.16, мы получаем следующий результат: Теорема 9.2. Если Р' и Р" — два проективных подпространства проективного пространства P(L), то Dim (Р' П Р") + Dim (F U Р") = Dim Г + DimP". (9.9) Пример 9.4. В случае, если Р' и Р" — две прямые на проективной плоскости P(L), dimL = 3, то DimP' = DimP" = 1 и Dim (Р' UP") ^ 2, и из соотношения (9.9) мы получаем, что Dim (Р7 П Р") ^ 0, т. е. любые две прямые на проективной плоскости пересекаются. Теория проективных пространств обладает красивой симметрией, которая носит название двойственности (с аналогичным явлением мы уже встречались в теории векторных пространств, см. § 3.7). Пусть L* — пространство, сопряженное к L. Проективное пространство Р(1_*) называется двойственным P(L). Любая точка двойственного пространства P(L*) есть, по определению, прямая (/), где / — линейная функция на пространстве L, не равная тождественно нулю. Такая функция определяет гиперплоскость L^ с L, задаваемую линейным однородным уравнением f(x) = 0 в векторном пространстве L, а значит, и гиперплоскость Р^ = P(L^) в проективном пространстве P(L). Докажем, что построенное выше соответствие между точками (/) двойственного пространства Р(1_*) и гиперплоскостями Р^ пространства Р(1_) является взаимно однозначным. Для этого нам нужно показать, что уравнения / = 0 и af = О эквивалентны и определяют одну и ту же гиперплоскость,
9.1. Определение проективного пространства 325 т. е. ¥f = ¥af. Как было показано в § 3.7, каждая гиперплоскость !_' с L определяется одним линейным уравнением, отличным от нулевого. Два разных уравнения / = 0 и f{ = 0 могут определять одну и ту же гиперплоскость, только если fi = а/, где а — некоторое ненулевое число. Действительно, в противном случае система из двух уравнений / = 0 и fx = 0 имеет ранг 2, следовательно, определяет подпространство L" размерности п — 2 в L и подпространство P(L") с Р(1_) размерности п — 3, которое, очевидно, не является гиперплоскостью. Таким образом, двойственное пространство Р(1_*) можно интерпретировать как пространство гиперплоскостей в P(L). Это простейший пример того, что некоторые геометрические объекты не могут быть описаны числами (как, например, векторные пространства — размерностями), но составляют множество, имеющее геометрический характер. С более сложными случаями мы столкнемся в гл. 10. Имеет место и гораздо более общий факт — взаимно однозначное соответствие между проективными подпространствами размерности т пространства P(L) (размерности п) и подпространствами размерности п — т—1 пространства Р(1_*). Это соответствие мы сейчас опишем, и читатель легко убедится, что при т = п — 1 оно совпадает с описанным нами соответствием между гиперплоскостями в P(L) и точками в P(L*). Пусть L' с L — подпространство размерности т+ 1, так что DimP(L/) = га. Рассмотрим в сопряженном пространстве L* аннулятор (L')a подпространства 1Л Напомним, что аннулятором называется подпространство (L7)a с L*, состоящее из всех таких линейных функций / е L*, что /(ж) =0 для всех векторов х g L7. Как мы установили в § 3.7 (формула (3.54)), размерность аннулятора равна dim(L')a = dim L - dim L' = n - m. (9.10) Проективное подпространство P((L/)a) с P(L*) называется двойственным подпространству P(L;) с P(L). В силу (9.10) его размерность равна п — т— 1. Мы, собственно, имеем здесь дело с вариантом хорошо знакомого нам понятия. Если в пространстве L определена невырожденная симметрическая билинейная форма (ж, г/), то мы можем отождествить (L;)a с ортогональным дополнением к L7, которое обозначалось (L')-1, см. с. 203. Если записать билинейную форму (ж, у) в некотором ортонормированном базисе простран- п ства L, то она примет вид X) xiVi> и точка с координатами (уо»Уь ••• »Уп) будет г=0 соответствовать гиперплоскости, задаваемой уравнением п ]Г ХгУг = 0, г=0 в котором уо^.^Уп предполагаются фиксированными, а хо,... ,хп — переменными. Доказанные утверждения вместе с установленным в § 3.7 принципом двойственности автоматически приводят к следующему результату, называемому проективным принципом двойственности.
326 Гл. 9. Проективные пространства Проективный принцип двойственности. Если для всех проективных пространств одной и той же конечной размерности п над одним и тем же полем К доказана теорема, в формулировке которой участвуют лишь понятия проективного подпространства, размерности, проективной оболочки и пересечения, то для всех таких пространств справедлива двойственная теорема, получающаяся из исходной следующей заменой: размерность т размерность п — т—1 пересечение Pi П Р2 проективная оболочка Pi U P2 проективная оболочка Pi U P2 пересечение Pi П Рг. Например, утверждению «через две различные точки проективной плоскости проходит одна прямая» двойственным является утверждение «любые две различные прямые на проективной плоскости пересекаются в одной точке». Можно попытаться распространить этот принцип так, чтобы он охватывал не только проективные пространства, но и проективные алгебраические многообразия, описываемые уравнениями (9.5). Однако при этом возникают некоторые новые трудности, о которых мы здесь только упомянем, не разбирая их в деталях. Пусть, например, проективное алгебраическое многообразие X с P(L) задано одним уравнением F(xo,xi,...,xn) = 0, где F — однородный многочлен. Каждой точке А Е X соответствует гиперплоскость, задаваемая уравнением п 8F £^(л)^ = 0' (9Л1) г=0 которая называется касательной гиперплоскостью к X в точке А (это понятие будет подробнее обсуждаться позже). Согласно предыдущему этой гиперплоскости можно сопоставить точку В двойственного пространства Р(1_*). Естественно предполагать, что когда А пробегает все точки X, то и точка В пробегает некоторое проективное алгебраическое многообразие в пространстве P(L), называемое двойственным к исходному многообразию X. Это действительно так, кроме некоторых неприятных исключений. А именно, для некоторой точки А может оказаться, что все частные производные ^f-(-A) = 0 для г = 0,1,...,п, и уравнение (9.11) не определено. Такие точки называются особыми точками проективного алгебраического многообразия X. В этом случае мы никакой гиперплоскости не получаем и, следовательно, не можем указанным способом сопоставить точке А определенную точку пространства P(L*). Можно доказать, что особые точки в некотором смысле представляют собой исключение. Более того, многие очень интересные многообразия вообще не имеют особых точек, так что двойственное многообразие для них существует. Но тогда у двойственного многообразия, в свою очередь, появляются особые точки, так что красивая симметрия все равно пропадает. Преодоление всех этих трудностей — задача алгебраической геометрии.
9.2. Проективные преобразования 327 Мы не будем в нее углубляться и упомянули о ней лишь в связи с тем, что в гл. 11, посвященной квадрикам, мы рассмотрим именно такой частный случай, когда эти трудности не возникают. § 9.2. Проективные преобразования Пусть si — линейное преобразование векторного пространства L в себя. Естественно приходит в голову мысль распространить его на проективное пространство P(L). Казалось бы, это легко сделать: надо каждой точке Р е P(L), соответствующей прямой (е) в L, сопоставить прямую {si(e)} и, значит, некоторую точку проективного пространства P(L). Однако здесь мы сталкиваемся со следующей трудностью: если si(e) — О, то мы не можем построить прямую (si(e)), так как все векторы, пропорциональные si(e), равны нулю. Таким образом, преобразование, которое мы хотим построить, определено, вообще говоря, не для всех точек проективного пространства P(L). Если же мы хотим, чтобы оно было определено для всех точек, то должны потребовать, чтобы ядро преобразования si было равно (0). Как мы знаем, это условие равносильно тому, что преобразование si: L —> L невырождено. Таким образом, всем невырожденным преобразованиям si пространства L в себя (и только им) соответствуют отображения проективного пространства P(L) в себя. Мы будем обозначать их через ¥(si). Мы видели, что невырожденное преобразование si: L —> L определяет взаимно однозначное отображение пространства L в себя. Докажем, что в этом случае и соответствующее отображение H?(si): P(L) —> P(L) тоже будет взаимно однозначным. Сначала проверим, что его образ совпадает со всем P(L). Пусть Р — точка пространства P(L), она соответствует некоторой прямой (е) в L. Так как преобразование si невырождено, то е = si(e') для некоторого вектора е' е L, причем е! ф 0, так как е ф 0. Если Р' — точка пространства P(L), соответствующая прямой (е'), то Pf = ¥(si)(P). Остается проверить, что F(si) не может отображать две разные точки в одну. Предположим, что Р ф Р' и Р(^) (р) = р(^) (р') = р, (9.12) причем точки Р, Р' и Р соответствуют прямым (е), (е;) и (е) соответственно. Условие Р ф Р1 равносильно тому, что векторы е и е' линейно независимы, а из равенства (9.12) вытекает, что («й^(е)) — (si(e')) = (e), и значит, векторы si(e) и si{e!) линейно зависимы. Но если asi(e) + j3si{e!) = 0, где а Ф 0 или /3 ф 0, то si(ae + /Зе') = О, а так как преобразование si невырождено, то ае + (Зе' ф 0, что противоречит условию Р ф Рг. Таким образом, мы доказали, что отображение F(si): P(L) —> P(L) взаимно однозначно. Следовательно, определено и обратное ему отображение F(si)~l. Определение. Отображение ¥(si) проективного пространства P(L), соответствующее невырожденному преобразованию si векторного пространства L в себя, называется проективным преобразованием пространства P(L). Теорема 9.3. Имеют место следующие утверждения:
328 Гл. 9. Проективные пространства 1) Р(М) = Р(^) тогда и только тогда, когда srf<i = \srf\, где А — некоторое число, не равное нулю. 2) Если я/\ и £?2 — два невырожденных преобразования векторного пространства L, то Р(л^л^) =Р(л^)Р(л^). 3) Если srf — невырожденное преобразование, то Р(^)-1 = Р («я/-1). 4) Проективное преобразование Р(^) переводит всякое проективное подпространство пространства Р(1_) в подпространство такой же размерности. Доказательство. Все утверждения теоремы следуют непосредственно из определений. 1) Если ^2 = \я?\, то очевидно, что &4\ и ^ одинаково преобразуют прямые векторного пространства L, т.е. Р(л^) = Р(^). Пусть теперь, наоборот, дано, что ¥(я/\)(А) = Р(л^)(Л) для любой точки А е P(L). Если точка А соответствует прямой (е), то мы имеем («я^(е)) = («я^(е)), т.е. ^2(е) = АМ(е), (9.13) где Л — некоторое число. Однако теоретически число Л в соотношении (9.13) могло бы быть своим для каждого вектора е. Рассмотрим два линейно независимых вектора ж и у и запишем для векторов х,у и х + у условие (9.13): {£/2(х) = Л^(ж), *&(l/) = /"*i(tf), (9-14) Л^(Ж +J/) = V£/\(x + y). Ввиду линейности ^и^ имеем М(ж + 2/) = M(®) + M(l/), ^(ж + у) =л^(я5) + ^2(1/). (9.15) Подставив выражения (9.15) в третье равенство в (9.14), а затем вычтем из него первое и второе. Тогда мы получим {у - Л)М (ж) + (i/ - p)srfx (у) = st\ ({и - Х)х + (у- fi)y) = 0. Так как преобразование stf\ невырождено (в силу определения проективного преобразования), то {у — \)х + (и — р)у — 0, а ввиду линейной независимости векторов х и у отсюда следует, что Л = и и /л = и, т. е. все числа Л, //, v в (9.14) одинаковы, и следовательно, число Л в соотношении (9.13) одно и то же для всех векторов е е L. 2) Нам нужно доказать, что для любой точки Р, соответствующей прямой (е), выполнено равенство Р(л^л^)(Р) = Р(л^) (Р(л^)(Р)), а это, согласно определению проективного преобразования, следует из того, что ((М«я^)(е)) = M((«^(e)))- Последнее равенство вытекает из определения произведения линейных преобразований. 3) По доказанному мы имеем равенство ¥(^)¥(^/~l) = Y{srfsrf~x) = = P(<f). Очевидно, что P(<f) представляет собой тождественное преобразование пространства Р(1_) в себя. Отсюда следует, что Р(«я^)-1 = Р («s/-1). 4) Наконец, пусть L' — m-мерное подпространство векторного пространства L и P(L') — соответствующее ему (т — 1)-мерное проективное подпространство. Отображение ¥(#/) переводит P(L7) в совокупность точек
9.2. Проективные преобразования 329 вида Р" = {д/(е')), где Р' = ((е')) пробегает все точки из P(L'). Это верно, когда е' пробегает все векторы подпространства L/. Докажем, что при этом все векторы (£/(е')} совпадают с ненулевыми векторами некоторого векторного подпространства L", которое имеет ту же размерность, что и L/. Это и даст нам нужное утверждение. Выберем в подпространстве L' некоторый базис ei,...,em, тогда любой вектор е! е !_' представляется в виде е' = а\е\ Н hamem, а условие, что е' ф 0, равносильно тому, что не все коэффициенты ai равны нулю. Отсюда получаем ). (9.16) Векторы srf(e\),... ,£/(ет) линейно независимы, так как преобразование srf\ L —> L невырождено. Рассмотрим m-мерное подпространство L" = — (^(ei),... ,^(em)). Из соотношения (9.16) следует, что преобразование Р(^) переводит точки подпространства P(L') в точности в точки подпространства P(L"). При этом из равенства dimL' = dimL" = m мы получаем DimP(L/) = DimP(L") = m - 1. По аналогии с линейными и аффинными преобразованиями, возникает надежда однозначно описать проективное преобразование тем, во что оно переводит некоторое число «достаточно независимых» точек. В качестве первой попытки можно рассмотреть точки Д = (е$) для г = О,1,...,п, где ео,еь... ,еп — базис пространства L. Но этот путь не приводит к цели, так как существует слишком много различных преобразований, переводящих каждую точку Д в себя. Действительно, таковы все преобразования Р(^), если &4{e.i) = А^ с любыми А^ ^ 0, т. е., иначе говоря, если srf имеет в базисе e0,ei,...,en матрицу /Ао и • • • \)\ | 0 Ai .-. О Л= ■ \0 0 ... An/ В этом случае (^(е^)) = (е*) для всех г = 0,1,..., п. Однако образ произвольного вектора е = аоео + а\е\ Н Ь апеп равен j^(e) = а0Ао^(ео) + а\\\я!{е.() Л V ап\п^{еп), а этот вектор уже не пропорционален е, если только все А^ не совпадают друг с другом. Таким образом, зная, во что преобразование Р(^) переводит точки Pq,P\, ... ,Рп, мы еще не можем определить его однозначно. Но оказывается, что добавление еще одной точки (при некоторых слабых предположениях) однозначно описывает преобразование. Для этого нам нужно ввести новое понятие. Определение. В n-мерном проективном пространстве P(L) n + 2 точки РЬ, Ри...,Рп, Рп+1 (9.17)
330 Гл. 9. Проективные пространства называются независимыми, если никакие п + 1 точек из них не содержатся в подпространстве размерности меньшей, чем п. Например, четыре точки на проективной плоскости независимы, если никакие три из них не лежат на одной прямой. Выясним, что означает условие независимости, если точке Pi соответствует прямая (е$), г = 0,... ,п+ 1. Так как, по определению, точки Ро,Р\,...9Рп не содержатся в подпространстве размерности, меньшей чем п, то векторы ео,еь... ,еп не содержатся в подпространстве размерности, меньшей чем гс+1, т.е. они линейно независимы и, значит, составляют базис пространства L. Таким образом, вектор en+i является их линейной комбинацией: en+i = аоео + а\е\ Н V апеп. (9.18) Если какое-то число щ = 0, то из (9.18) следует, что вектор еп+\ содержится в подпространстве !_' = (ео,..., ё*,..., еп), где знак " означает пропуск соответствующего вектора. Следовательно, векторы ео,..., ё;,..., en, en+i содержатся в подпространстве L', размерность которого не превосходит п. Но это означает, что точки Po,...,Pi,...,Pn,Pn+i содержатся в проективном подпространстве P(L'), причем DimP(L/) ^ п— 1, т. е. являются зависимыми. Покажем, что для независимости точек (9.17) достаточно, чтобы в разложении (9.18) все коэффициенты щ были отличны от нуля. Пусть вект.оры eo,ei,... ,еп образуют базис в пространстве L, а вектор en+i является их линейной комбинацией (9.18), где все щ ф 0. Докажем, что тогда точки (9.17) независимы. Если это было бы не так, то некоторые п + 1 векторов из числа ео,еь... ,en+i пространства L содержались бы в подпространстве, размерность которого не превосходит п. Это не могут быть векторы ео,еь... ,еп, так как они, по условию, являются базисом в L. Пусть это будут векторы ео,... ,ё{,... ,en,en+i при некотором г < п+ 1, и их линейная зависимость выражается равенством Аоео Н Ь \i-\ei_\ + \i+\ei+\ -\ Ь An+ien+i = О, где Лп+1 ф 0, так как векторы ео, еь... ,еп линейно независимы. Отсюда следует, что вектор en+i является линейной комбинацией векторов ео,... ,ёь... ,еп. Но это противоречит условию, что в выражении (9.18) все щ т^О, так как векторы eo,ei,...,en образуют базис в пространстве L, и разложение (9.18) для любого вектора en+i определяет его координаты щ однозначно. Таким образом, п + 2 независимые точки (9.17) всегда получаются из п+ 1 точек Pi = (ei), для которых соответствующие им векторы е^ образуют базис в пространстве L, добавлением еще одной точки Р = (е), для которой вектор е является линейной комбинацией векторов е^ со всеми коэффициентами, отличными от нуля. Теперь мы можем сформулировать основной результат. Теорема 9.4. Пусть р<ь Pi,...,Pn, Pn+i; Н, Р[,-..,Р^ PU\ (9-19)
9.2. Проективные преобразования 331 — две системы независимых точек проективного пространства P(L) размерности п. Тогда существует, и притом единственное, проективное преобразование, переводящее точку Pi в Р[ для всех г = 0,1,..., п + 1. Доказательство. Мы воспользуемся полученной выше интерпретацией свойства независимости точек. Пусть точки Pi соответствуют прямым (е^), а точки Р[ — прямым {е[). Мы можем считать, что векторы ео,... ,еп и векторы е(),...,е^ образуют базисы (п + 1)-мерного пространства L. Тогда, как мы знаем, для любого набора отличных от нуля чисел Ао,...,Ап существует (и притом единственное) невырожденное линейное преобразование srf\ L —> L, переводящее е^ в \е!{ при всех % = 0,1,...,п. По определению, для такого преобразования srf мы будем иметь равенства ¥(^/)(Pi) = Р[ при всех % = 0,1,...,п. Так как dimL = п+ 1, то имеют место соотношения en+i = а0е0 + а\е\ -\ \- апеп, е'п+1 = а'0е'0 + а\е\ -\ Ь olne!n. (9.20) Из условия независимости обоих наборов точек (9.19) следует, что в представлениях (9.20) все коэффициенты с^ и а[ отличны от нуля. Применяя преобразование srf к обеим частям первого соотношения (9.20), с учетом равенств srf{ei) = \е[ мы получаем: ^(en+i) = а0Л0ео + aiA^ + • • • + ап\пе'п. (9.21) Положив числа Л^ = а[а^1 для всех г = 0,1,... , п и подставляя их в соотношение (9.21), с учетом второго равенства из формулы (9.20) мы получим, что ^(еп+1) = е'п+1, т.е. РИ(Рп+1) = P'n+V Единственность найденного проективного преобразования Р(^) следует из его построения. Например, при п = 1 пространство Р(1_) является проективной прямой. Три точки Ро,Р\,Р2 независимы тогда и только тогда, когда они попарно различны. Мы видим, что любые три попарно различные точки проективной прямой могут быть переведены в другие три попарно различные точки единственным проективным преобразованием. Теперь выясним, как задается проективное преобразование в координатной форме. В однородных координатах (9.2) задание проективного преобразования Р(^) по существу совпадает с заданием невырожденного линейного преобразования srf, ведь однородные координаты точки А е Р(1_) совпадают с координатами вектора х из (9.1), задающего прямую (ж), соответствующую точке А. Воспользовавшись формулой (3.25), мы получаем для однородных координат Pi точки ¥{srf){A) следующие выражения через однородные координаты oci точки А: I А = аюою + а\\ы\ + а>12&2 Н Ь а\п®-п, /п ооч К Рп = ап0&0 + dnia\ + an2«2 H Ь аппап.
332 Гл. 9. Проективные пространства При этом нужно помнить, что однородные координаты заданы с точностью до общего множителя и оба набора (од : а\ : • • • : ап) и (/?о : Р\ : • • • : Рп) не обращаются в нуль. Очевидно, что при умножении всех щ на общий множитель Л все Pi в формуле (9.22) тоже умножаются на этот множитель. Все Pi не могут обратиться в нуль, если в нуль не обращаются все щ (это следует из того, что преобразование srf невырождено). Условие невырожденности преобразования srf выражается как неравенство нулю определителя его матрицы: 1^00 а01 •" а0п\ I &п0 &п 1 ' ' ' &пп | Другой способ записи проективного преобразования — в неоднородных координатах аффинных пространств. Вспомним, что проективное пространство Р(1_) содержит аффинные подмножества Vi, г — 0,1,... , п, и может быть получено из любого Vi добавлением соответствующей проективной гиперплоскости Р(Ц), состоящей из «бесконечно удаленных точек», т.е. в виде р(|_) = Vi U Р(Ц). Для простоты записи мы ограничимся только случаем г = 0, все остальные Vi рассматриваются аналогично. Аффинному подмножеству Vo соответствует (как его подпространство векторов) векторное подпространство Lq С L, определенное условием од = 0. Для задания координат в аффинном пространстве Vo нам нужно зафиксировать в нем некоторый репер, состоящий из точки О £ Vo и базиса в пространстве Lq. Пусть в (п + 1)-мерном пространстве L выбран базис ео, еь... ,еп. В качестве точки О £ Vo выберем точку, соответствующую прямой (ео), а в качестве базиса в L_o возьмем векторы еь ..., еп. Рассмотрим точку А е Vo, имеющую в базисе ео, еь..., еп пространства L однородные координаты (од : а\ : ••• : ап), и, повторяя рассуждения, использованные нами при выводе формулы (9.6), найдем ее координаты относительно построенного указанным выше способом репера {0\е\,... ,еп). Точка А соответствует прямой (е), где е = оде0 + а\е\ Н Ь апеп, (9.23) причем од ф 0, так как А е Vo. Согласно условию мы должны выбрать из обеих прямых (ео) и (е) векторы х иу с координатой од = 1 и рассмотреть координаты вектора у — х относительно базиса ei,...,en. Очевидно, что х = ео, и в силу (9.23) мы имеем у = е0 + aia^ei Н Ь апа^1еп. Таким образом, вектор у — х имеет в базисе еь..., еп координаты Х\ — , — , Хп — ОД ОД Рассмотрим теперь невырожденное линейное преобразование £$\ L —> L и соответствующее ему проективное преобразование Р(^), заданное формулами (9.22). Оно переводит точку А с однородными координатами щ в точку В с однородными координатами Pi. Для того, чтобы в обоих случаях получить
9.3. Двойное отношение 333 неоднородные координаты в подмножестве V&, нужно, согласно формуле (9.6), разделить все координаты на координату с номером 0. Таким образом мы получим, что точка с неоднородными координатами xi = ^- переходит в точку с неоднородными координатами yi = I1, т.е., с учетом (9.22), мы получаем выражения q» + aiis1 + - + flfaxw> -=1 (П (924) aoo + aoixi H Ь aonxn Иначе говоря, в неоднородных координатах проективное преобразование записывается дробно-линейными формулами (9.24) с общим знаменателем для всех yi. Оно не определено в точках, где этот знаменатель обращается в нуль — это и есть «бесконечно удаленные точки», т. е. точки проективной гиперплоскости P(Lq) с уравнением /?о — 0. Рассмотрим проективные преобразования, переводящие «бесконечно удаленные точки» в «бесконечно удаленные», и следовательно, «конечные» — в «конечные». Это значит, что равенство /3q = 0 возможно только при ао = 0, т.е., с учетом формулы (9.22), равенство aoo^o + CLQiOi\ + a02^2 H Ь ^0п^п = 0 возможно только при ао = 0. Очевидно, что последнее равносильно условиям aQi = 0 при всех г = 1,...,п. В этом случае общий знаменатель дробно- линейных формул (9.24) обращается в постоянную аоо- Из невырожденности преобразования я/ следует, что aoo ^ 0, и мы можем разделить на аоо числители в равенствах (9.24). Тогда мы получим в точности формулы для аффинных преобразований (8.17). Таким образом, аффинные преобразования являются частным случаем проективных — когда проективные преобразования переводят множество «бесконечно удаленных точек» в себя. Пример 9.5. В случае DimlP(L) = 1 проективная прямая P(L) имеет одну- единственную неоднородную координату, и формула (9.24) принимает вид у — —, ad — Ьсф О. с + ах Преобразования «конечной части» проективной прямой (х ф оо) являются аффинными и имеют вид у — а + (Зх, где (3 фО. § 9.3. Двойное отношение Напомним, что в § 8.2 мы определили отношение (А, В, С) трех точек аффинного пространства, лежащих на одной прямой, и далее, в § 8.3, было доказано (теорема 8.8), что отношение (А, В, С) трех точек, лежащих на одной прямой, не меняется при невырожденном аффинном преобразовании. В проективных пространствах понятие отношения трех точек, лежащих на одной прямой, не может иметь естественного аналога. Это вытекает из следующего утверждения: Теорема 9.5. Пусть А\,В\,С\ и А^.В^.С^ — две тройки точек проективного пространства, удовлетворяющие условиям: а) все точки в каждой тройке попарно различны,
334 Гл. 9. Проективные пространства б) точки в каждой тройке лежат на одной прямой (своей для каждой тройки). Тогда существует проективное преобразование, переводящее одну тройку в другую. Доказательство. Обозначим прямую, на которой лежат три точки Ai, В{, Ci, через li, где г = 1,2. Точки А\,В\,С\ независимы на 1\, а точки А^В^Съ независимы на Z2. Пусть точка Ai определяется прямой (е;), точка Bi — прямой (/;), точка d — прямой (д{) и прямая k — двумерным пространством Ц, г = 1,2. Все они содержатся в пространстве L, определяющем наше проективное пространство. Дословно повторяя доказательство теоремы 9.4, мы построим изоморфизм srff: Ц —► L2, переводящий прямые (ej), (f\), (g\) в прямые (е2), (/2)' (92) соответственно. Представим пространство L в виде двух разложений: |_ = ЦеЦ, L = L2eL'2. Очевидно, что dim L[ — dim Ц = dim L — 2, поэтому пространства Ц и Ц изоморфны. Выберем некоторый изоморфизм srf"\ L\ —» Ц и определим преобразование я/: L —> L как £&' на Li и как srf" на Ц, а для произвольного вектора ж G L, используя разложение ж = х\ + Жр Ж1 е Ц, х\ е Ц, определим &/{х) — £/г{х\) + £/"(х\). Легко видеть, что srf — невырожденное линейное преобразование и проективное преобразование Р(^) переводит тройку точек AbBi,Ci в А2,Б2,С2. Аналогично тому, что с тройкой точек А, В, С аффинного пространства, лежащих на одной прямой, связано число (А, В, С), не меняющееся при невырожденных аффинных преобразованиях, в проективном пространстве с чет- веркой точек А\, А2, Аз, А±, лежащих на одной прямой, можно связать число, не меняющееся при проективных преобразованиях. Это число обозначается (А\, -А2,Аз, А±) и называется двойным или ангармоническим отношением этих четырех точек. К его определению мы и переходим. Рассмотрим сначала проективную прямую I = P(L), где dimL = 2. Любые четыре точки А\,А2,Аз,А4 на I соответствуют четырем прямым (а\), (а2), (аз), (04), лежащим в плоскости L. Выберем на плоскости L произвольный базис ei,e2 и рассмотрим разложение векторов а^ по этому базису: щ = Хгв\ +Уг^2, г = 1,... ,4. Координаты векторов а\,... ,сц можно записать в виде столбцов матрицы м = (х\ Х2 ХЗ Х4\ \У\ У2 УЗ Уа) ' Рассмотрим вопрос: как миноры второго порядка матрицы М изменяются при переходе к другому базису е\,е'2 плоскости L? Обозначим через [а$] и [а!{] столбцы координат вектора ai в базисах (ei,e2) и (е^е^) соответственно: м=(2)' м=($- Согласно формуле замены координат (3.36) они связаны соотношением [а\ — C[ol% где С — матрица перехода от базиса е[, е'2 к базису е\, е2. Отсюда следует, что
9.3. Двойное отношение 335 Xi Уг Xj Уз = С- для любых индексов г и j получаем и по теореме об умножении определителей, мы = \с\ Уз причем \С\ Ф 0. Значит, для любых трех индексов i,j,k отношение Уг Xi Уг Хк Ук х' Х Уз Уг x'i Ук (9.25) не изменится при изменении базиса (мы предполагаем сейчас, что оба определителя, в числителе и знаменателе, отличны от нуля). Таким образом, отношение (9.25) определяет число (а^а^,^), зависящее от трех векторов ai,aj,ak, но не от выбора базиса в L. Однако это еще не то, что мы обещали: ведь точки Ai определяют прямые (а;), а не векторы щ. Мы знаем, что вектор о!{ определяет ту же прямую, что и вектор щ, если и только если а\ — \{Щ, Л^ ф 0. Поэтому если мы подставим в выражение (9.25) вместо координат векторов ai,aj,a,k координаты пропорциональных им векторов а'^а^,а'к, то его числитель умножится на \i\j, а знаменатель умножится на А^Аь и в результате все выражение (9.25) умножится на число А^-А^1, т.е. изменится. Если же теперь мы рассмотрим выражение DV{Ai,A2,A3,A4) = Х\ ХЪ У\ УЪ Х\ Х4 \У\ У А Х2 хА У 2 У4\ Х2 Х$\ У 2 УЗ (9.26) то, как показывает предыдущее рассуждение, оно не будет зависеть ни от выбора базиса на плоскости L, ни от выбора векторов оц на прямых (<ц), а будет определяться только четырьмя точками А\,А2,Аз,А4 на проективной прямой I. Выражение (9.26) и называется двойным отношением этих четырех точек. Выпишем выражение для DV (A\, A2l A3, А4), предполагая, что на проективной прямой I введены неоднородные координаты. Начнем с формулы, записанной в однородных координатах (х : у). Мы будем сейчас считать точки Ai «конечными» точками /, т. е. предполагать, что yi^O для всех г = 1,... ,4, и положим ti = Xi/i/i — это будут координаты точки Ai в «аффинной части» проективной прямой I. Тогда мы получаем Jbi Jb n Уг Уз УгУз 1 1 ViVjiU -tj)
336 Гл. 9. Проективные пространства Подставляя эти выражения в формулу (9.26), мы видим, что все гц сокращаются, и в результате получается выражение m(AuA2M*M) = ^-*з)(*2-*4) (9 27) Если мы предположим, что все четыре точки А\,А2,Аз,А4 лежат в «конечной части» плоскости, то, в частности, это значит, что они принадлежат аффинной части проективной прямой I и имеют на проективной прямой I конечные координаты ti,*2»*3t*4- С учетом формулы (8.8) для простого отношения трех точек, заметим, что тогда выражение для двойного отношения принимает вид W(AuA2,A3lA4) = )A/'A/jAa1 , (9.28) KS4,A2,Ai) Равенство (9.28) показывает связь двойного и простого отношения, введенного в § 8.2. Мы определили двойное отношение для четырех попарно различных точек. В случае двух совпадающих точек его можно определить естественными соглашениями (как мы сделали это для простого отношения), полагая в некоторых случаях равным оо. Однако оно остается неопределенным, если три из четырех точек совпадают. Приведенные выше рассуждения почти содержат доказательство основного свойства двойного отношения: Теорема 9.6. Двойное отношение четырех точек, лежащих на одной прямой некоторого проективного пространства, не меняется при проективном преобразовании этого пространства. Доказательство. Пусть А\,А2,Аъ,А± — четыре точки, лежащие на прямой V некоторого проективного пространства P(L). Они соответствуют четырем прямым (а\), {а2}, (аз), (04) пространства L, а прямая V — двумерному подпространству L7 С L. Пусть si — невырожденное преобразование пространства L, а ср = ¥(&/) — соответствующее проективное преобразование пространства P(L). Тогда, согласно теореме 9.3, cp(lf) = V — другая прямая проективного пространства P(L), она соответствует подпространству sk{l!) с L и содержит четыре точки <р(А\), р(А2)у <р(Аз), ф{Аа). Пусть векторы е\,е2 составляют базис L/ и векторы щ = Х{е\ + yie2, г = 1,...,4. Тогда двойное отношение UV (A\, А2, As, Аа) определяется формулой (9.26). С другой стороны, £/(a,i) = Xis/(e\) + yi^(e2) и если мы воспользуемся базисом fi — srf\e\) и f2 = £?(е2) подпространства s/(\J), то двойное отношение т№Ах),<р{А2)ММ)ММ)) определяется той же самой формулой (9.26), так как координаты векторов £/(a,i) в базисе f\,f2 совпадают с координатами векторов щ в базисе е\,е2. Но, как мы уже проверили, двойное отношение не зависит ни от выбора базиса, ни от выбора векторов а^, определяющих прямые (а;), поэтому отсюда следует, что DV (А{, А2, Аз, М) = DV (<р(А{), <р(А2), <^(А3), <^4)).
9.4. Топологические свойства проективных пространств 337 Пример 9.6. Рассмотрим на проективной плоскости П две прямые 1\ и l<i и точку О, не лежащую ни на одной из них. Соединим произвольную точку А € 1\ с точкой О прямой 1а (рис. 9.3). Точку пересечения прямых 1а и 1^ обозначим А!'. Отображение прямой 1\ в \<i, ставящее в соответствие каждой точке А е 1\ точку Af e l<i, называется перспективным. Рис. 9.3. Перспективное рис д.4. Пучок параллельных прямых отображение Докажем, что существует проективное преобразование плоскости П, определяющее перспективное соответствие между прямыми 1\ и Х^. Для этого обозначим через /о прямую, соединяющую точку О и точку Р = 1\ П l<i, и рассмотрим множество V = П \ Iq. Иными словами, мы будем считать Iq «бесконечно удаленной» прямой, а точки из V — «конечными точками» проективной плоскости. Тогда на V перспективное соответствие будет задаваться пучком параллельных прямых, так как эти прямые в «конечной части» не пересекаются (рис. 9.4). Точнее говоря, этот пучок определяет отображение «конечных частей» 1[ и V2 прямых 1\ и Z2- Отсюда следует, что в аффинной плоскости V прямые 1[ и 1'2 параллельны, а перспективное соответствие между ними определяется любым сдвигом ^а на вектор а = АА\ где А — произвольная точка прямой 1[, а А! — соответствующая ей при перспективном соответствии точка прямой lf2. Как мы видели выше, любое невырожденное аффинное преобразование аффинной плоскости V является проективным для П и, тем более, это очевидно для сдвига. Значит, перспективное соответствие определяется некоторым проективным преобразованием плоскости П. Поэтому из теоремы 9.6 теперь следует Теорема 9.7. Двойное отношение четырех точек, лежащих на одной прямой, сохраняется при перспективном соответствии. § 9.4*. Топологические свойства проективных пространств Предыдущие рассуждения этой главы относились к проективному пространству P(L), где L — конечномерное векторное пространство над произвольным полем К. Если нас интересует какое-то конкретное поле (например, R или С), то все доказанные нами утверждения остаются в силе, так как мы пользовались только общими алгебраическими понятиями (которые и входят в определение поля) и нигде не использовали, например, свойства неравенств или модуля и т.д. Теперь мы скажем несколько слов о свойствах, связанных с понятием сходимости, или, как их называют, топологических
338 Гл. 9. Проективные пространства свойствах проективных пространств. О них имеет смысл говорить, например, если L — вещественное или комплексное векторное пространство, то есть поле К = R или С. Начнем с того, что сформулируем понятие сходимости последовательности векторов жьЖ2,... ,5Cfc,... пространства L к вектору ж этого же пространства. Выберем в L произвольный базис ео,еь... ,еп и запишем разложение векторов Xk и ж по этому базису: ж/е = (Xkoeo + ak\e\ H Ь аьеп, ж = /Зоео + @\е\ Н Ь /?nen- Мы будем говорить, что последовательность векторов х\,Х2,... ,ж&,... схо- дится к вектору ж, если последовательность чисел ан,а2г,...,а/сг,-.. (9.29) с фиксированным г сходится к числу Д при к —> оо для каждого индекса г = 0,1,...,п (говоря о комплексных векторных пространствах, мы предполагаем, что читатель знаком с понятием сходимости последовательности комплексных чисел). Вектор х называется в этом случае пределом последовательности. Из приведенных в § 3.4 формул замены координат легко вывести, что свойство сходимости не зависит от выбора базиса в L. Мы будем записывать его как ж& —» ж при к —> оо. Перейдем теперь от векторов к точкам проективного пространства. В обоих рассматриваемых нами случаях (К = R или С) существует полезный способ нормировки однородных координат (xq : х\ : ••• : хп), определенных, вообще говоря, с точностью до умножения на общий множитель А Ф 0. Так как, по определению, равенство Х{ = 0 невозможно для всех г = 0,1,... , п, то мы можем выбрать ту координату хг, для которой \хГ\ (модуль в R или С, соответственно) принимает наибольшее значение, и положив Л = \хг\, сделать замену yi = X~lXi для всех г = 0,1,...,п. Тогда, очевидно, (х0 : х{ : • • • : хп) = (у0 : ух : • • • : уп), причем \уг\ = 1 и \yi\ ^ 1 для всех г = 0,1,...,п. Определение. Последовательность точек Р\, Р^,..., Рь ... сходится к точке Р, если на каждой прямой (е^), определяющей точку Р&, и на прямой (е), определяющей точку Р, можно найти такие ненулевые векторы ж& и ж, что Xk —> ж при fc —> оо. Это записывается в виде Р^ ^ Р при & —> оо. Точка Р называется пределом последовательности РьРг,... , Рь ••• Заметим, что, согласно условию, (е&) = (ж&) и (е) = (ж). Теорема 9.8. Из любой бесконечной последовательности точек проективного пространства можно выбрать подпоследовательность, сходящуюся к некоторой точке этого пространства. Доказательство. Как мы видели, любая точка Р проективного пространства может быть представлена в виде Р = (у), где вектор у имеет координаты (уо,Уь...,Уп), причем max|^| = 1. В курсе анализа доказывается, что для любой ограниченной последовательности вещественных чисел выполнено утверждение, сформулированное
9.4. Топологические свойства проективных пространств 339 в теореме 9.8. Оно также очень просто доказывается и для последовательности комплексных чисел. Чтобы получить отсюда утверждение теоремы, рассмотрим бесконечную последовательность точек Pi,P2, ••• >^ь ••• проективного пространства P(L). Обратим внимание сначала на последовательность нулевых (то есть имеющих номер 0) координат векторов #i,#2,... ,#ь •••> соответствующих этим точкам. Пусть это будут числа аю.оэдъ •••><*&()>••• (9.30) Как мы отметили выше, можно считать, что все |а^о| ^ 1. Согласно сформулированному выше утверждению анализа из последовательности (9.30) можно выбрать подпоследовательность ащо, ап2о, •••> anfc0, •••> (9.31) сходящуюся к некоторому числу /?о, которое, следовательно, также по модулю не превосходит 1. Теперь рассмотрим подпоследовательность точек Рщ>Рп2> ••• 'Рпк, ••• и векторов хщ,хП2,...,хПк,... с теми же номерами, что и в подпоследовательности (9.31). Обратим внимание на первую координату этих векторов. Для них, очевидно, тоже верно, что |anfci| ^ 1. Значит, из последовательности можно выбрать подпоследовательность, сходящуюся к некоторому числу /3\, причем, очевидно, \(3\\ ^ 1. Повторяя это рассуждение п + 1 раз, мы получим в результате из исходной последовательности векторов х\,Х2,...,ж&,... подпоследовательность жШ1,жШ2,... ,хтк,..., сходящуюся к некоторому вектору х е L, который, как и любой вектор этого пространства, разложим по базису eo,ei,... ,еп, т.е. х = /?0е0 + АеН Ь Priori- Это даст нам утверждение теоремы 9.8, если мы убедимся, что не все координаты /3o,0i, • •• ,Рп вектора х равны нулю. Но это следует из того, что, по построению, для каждого вектора хтк подпоследовательности жШ1,жШ2,... , жШ/е,... некоторая его координата аШк1, г = 0, ...,п, по модулю равна 1. Так как существует лишь конечное число координат, а число векторов хШк бесконечно, то найдется такой номер г, что среди координат аткг будет бесконечно много, равных по модулю единице. С другой стороны, по построению, последовательность amii,am2i,... ,amki,... сходится к числу /%, которое, таким образом, должно быть по модулю равно 1. Свойство, устанавливаемое теоремой 9.8, называется компактностью. Оно верно и для любого проективного алгебраического многообразия проективного пространства (как вещественного, так и комплексного). Мы можем сформулировать его так: Следствие. В случае вещественного или комплексного пространства точки проективного алгебраического многообразия образуют компактное множество. Доказательство. Пусть проективное алгебраическое многообразие X задается системой уравнений (9.5), и P\,P2,...,Pk,... — последовательность
340 Гл. 9. Проективные пространства его точек. Согласно теореме 9.8 существует ее подпоследовательность, сходящаяся к некоторой точке Р этого пространства. Нам остается доказать, что точка Р принадлежит многообразию X. Для этого достаточно показать, что она представляется в виде Р = (и), где координаты вектора и удовлетворяют уравнениям (9.5). Но это сразу следует из того, что многочлены — непрерывные функции. Пусть F(xo,x\,...,xn) — многочлен (в данном случае — однородный, это один из многочленов i*i, входящих в систему уравнений (9.5)). Мы запишем его в виде F = F(x), где х Е L, тогда из сходимости векторов Xk —» х при к —» оо, таких, что F(xk) = 0 для всех к, следует, что F{x) = 0. Для подмножеств конечномерного векторного или аффинного пространства (как вещественного, так и комплексного) свойство компактности связано с их ограниченностью, точнее, свойство ограниченности вытекает из компактности. Таким образом, если вещественные и комплексные векторные или аффинные пространства следует представлять себе как «неограниченно простирающиеся во все стороны», то для проективных пространств это не так. Но что значит «представлять себе»? Для того, чтобы точно сформулировать это интуитивное представление, мы приведем для вещественной и комплексной проективной прямой простые геометрические образы, которым они гомеоморфны (см. соответствующее определение на с. 14). Это и будет определять точный смысл слов «представлять себе» данное множество. Заметим, что свойство компактности, устанавливаемое теоремой 9.8, не меняется при переходе от множества к другому, гомеоморфному ему множеству. Начнем с самой простой ситуации: одномерного вещественного проективного пространства — вещественной проективной прямой. Она состоит из пар (хо : х\), где xq и х\ рассматриваются с точностью до общего множителя Л ф 0. Те пары, для которых хо Ф 0, образуют аффинное подмножество U, точки которого задаются одной координатой t — x\/xq, так что мы можем отождествить множество U с R. Во множество U не входят пары, для которых хо = 0, но они соответствуют одной точке (0:1) проективной прямой, которую мы обозначим (оо). Таким образом, вещественная проективная прямая представима в виде R U (оо). Сходимость точек Рк —> Q при к —> оо в этом случае определяется следующим образом. Если точки Рк ф (оо) и соответствуют числам tk, а точка Q ф (оо) и соответствует числу t, то Рк = (ак : /Зк) и Q = (а: /3), где Pk/oLk = tk, &к Ф 0 и (3/а = t, а ф 0. Схо- / димость Рк —> Q при к —> оо в этом случае означает сходимость последовательности чи- Рис. 9.5. Вещественная проектов- сел *fc -> * ПРИ к -> оо. В случае, если Рк -> ная прямая —> (оо), сходимость (в прежних обозначениях) означает, что а& —» 0, Рк —> 1 ПРИ к —► оо, откуда следует t^1 —> 0, что равносильно тому, что \tk\ —> оо при к —> оо. Можно наглядно представить себе вещественную проективную прямую, нарисовав окружность, касающуюся горизонтальной прямой I в точке О (рис. 9.5). Соединив наивысшую точку О' этой окружности с любой ее точкой А, мы получим прямую, которая пересекает I в некоторой точке В.
9.4. Топологические свойства проективных пространств 341 Таким образом получается взаимно однозначное соответствие между точками А ф О' окружности и всеми точками В прямой I. Если поместить начало отсчета на прямой I в точку О и сопоставить каждой точке В е I число t e R, выбрав для этого на прямой I некоторый масштаб (т. е. любую точку прямой I, отличную от точки О), то мы получим взаимно однозначное соответствие между числами t e R и точками А ф О' окружности. При этом |*&| —► оо тогда и только тогда, когда для соответствующих точек А^ окружности имеет место сходимость Ak —> О'. Следовательно, мы получаем взаимно однозначное соответствие между точками вещественной проективной прямой R U (оо) и всеми точками окружности, при этом сохраняется понятие сходимости. Таким образом, мы доказали, что вещественная проективная прямая гомео- морфна окружности, которая обычно обозначается S1 (одномерная сфера). Аналогичные рассуждения применимы и к комплексной проективной прямой. Она представляется в виде Си (оо). На ней сходимость последовательности точек Pk —> Q при к —> оо в случае Q ф (оо) соответствует сходимости последовательности комплексных чисел Zk —► z, где z е С, а сходимость последовательности точек Pk —> (оо) — сходимости \zk\ —► оо (здесь \z\ обозначает модуль комплексного числа z). Для наглядного представления комплексной проективной прямой Риман предложил следующий способ (см. рис. 9.6). Комплексные числа изображаются обычным образом точками на плоскости. Рассмотрим сферу, касающуюся этой горизонтальной плоскости в начале координат О, которое соответствует комплексному числу z = 0. Через наивысшую точку О' сферы И любую Другую ее точку Рис. 9.6. Стереографическая проек- А проходит прямая, пересекающая комплекс- дия сферы на плоскость ную плоскость в точке В, которая изображает некоторое число z еС Так получается взаимно однозначное соответствие между числами z E С и всеми точками сферы, отличными от точки О' (рис. 9.6). Это соответствие часто называют стереографической проекцией сферы на плоскость. Сопоставив точке (оо) комплексной проективной прямой точку О' сферы, мы получаем взаимно однозначное соответствие между точками комплексной проективной прямой С U (оо) и всеми точками сферы. Легко видеть, что при этом понятие сходимости сохраняется. Таким образом, комплексная проективная прямая гомеоморфна двумерной сфере в трехмерном пространстве, которая обозначается 5 . Далее мы ограничимся проективными пространствами P(L), где L — вещественное векторное пространство произвольной конечной размерности, и рассмотрим для них свойство ориентируемости. Оно связано с понятием непрерывной деформации линейного преобразования, которое было введено в § 4.4. По определению, любое проективное преобразование проективного пространства P(L) имеет вид Р(^), где si — невырожденное линейное преобразование векторного пространства L. При этом, как мы видели, линейное
342 Гл. 9. Проективные пространства преобразование я/ определяется проективным с точностью до замены на as/, где а — произвольное отличное от нуля число. Определение. Одно проективное преобразование называется непрерывно деформируемым в другое, если первое можно представить в виде Р(М)> а второе — в виде Р(^), и линейное преобразование sz/\ непрерывно деформируемо в л^. Теорема 4.11 утверждает, что линейное преобразование s/\ непрерывно деформируемо в s/^ тогда и только тогда, когда определители \&/\\ и |^| имеют одинаковый знак. Что же происходит при замене s/ на аз/? Пусть проективное пространство Р(1_) имеет размерность п, тогда векторное пространство L имеет размерность п+ 1, и \as/\ = ап+1\я/\. Если число п + 1 четное, то всегда anJr 1 > 0, и такая замена не меняет знака определителя. Иными словами, в проективном пространстве нечетной размерности п знак определителя \&/\ линейного преобразования s/ однозначно определен преобразованием Р(«й^). Очевидно, мы получаем следующий результат: Теорема 9.9. В проективном пространстве нечетной размерности проективное преобразование F(g/\) непрерывно деформируемо в Р(^) тогда и только тогда, когда определители \s/\\ и \^\ имеют одинаковый знак. Те же соображения работают и в случае проективных пространств четной размерности, но приводят к другому результату: Т е о р е м а 9.10. В проективном пространстве четной размерности любое проективное преобразование непрерывно деформируемо в любое другое. Доказательство. Покажем, что любое проективное преобразование непрерывно деформируемо в тождественное. Если \я/\ > 0, то это сразу же следует из теоремы 4.11. Если же \я/\ < 0, то эта же теорема дает нам, что преобразование я/ непрерывно деформируемо в 38, которое имеет матрицу ( 0 /? ) > где Еп — единичная матрица порядка п. Но ¥(38) = ¥(—38), а преобразование —38 имеет матрицу ( л _^. ) • Так как в нашем случае число п четно, то | — Еп\ = (— 1)п > 0, и по теореме4.10 матрица ( л _тт- ) непрерывно деформируема в Еп+\, и следовательно, преобразование — 38 непрерывно деформируемо в тождественное. Таким образом, проективное преобразование ¥(38) непрерывно деформируемо в ¥(£), а значит, по определению, и ¥($/) непрерывно деформируемо в Р(<?). Теперь достаточно применить свойства 1 и 2, доказанные в § 4.4, и мы получим утверждение теоремы 9.10. Выражая эти факты в топологической форме, можно сказать, что множество проективных преобразований пространства Рп заданной размерности имеет одну линейно связную компоненту, если п четно, и две линейно связные компоненты, если п нечетно.
9.4. Топологические свойства проективных пространств 343 Теоремы 9.9 и 9.10 показывают, что свойства проективных пространств четной и нечетной размерности радикально отличаются. Впервые мы сталкиваемся с этим обстоятельством в случае проективной плоскости. Она отличается от векторной (или евклидовой) плоскости тем, что имеет не две, а только одну ориентацию. Так же обстоит дело и с проективными пространствами любой четной размерности. Мы видели в § 4.4, что ориентацию аффинной плоскости можно интерпретировать как выбор определенного направления обхода окружности. Теорема 9.10 показывает, что в проективной плоскости это уже не верно — непрерывно двигая окружность с заданным направлением обхода в проективной плоскости, мы можем перевести ее в окружность с противоположным направлением обхода. Это возможно лишь благодаря тому, что наша деформация в некоторый момент «проходит через бесконечность», чего на аффинной плоскости быть не могло. Это свойство можно наглядно представить, используя следующую конструкцию, годную для вещественных проективных пространств произвольной размерности. Предположим, что векторное пространство L, определяющее наше проективное пространство P(L), является евклидовым, и рассмотрим в нем сферу S, заданную равенством \х\ — 1. Каждая прямая (х) пространства L пересекает сферу S. Действительно, такая прямая состоит из векторов вида ах, где a Е К, и условие ах £ S означает, что \ах\ = 1. Так как \ах\ — \а\ • \х\ и ж^О, то мы можем положить |а| = |ж|-1. Таким выбором число а определено с точностью до знака, или, иначе говоря, существуют два вектора: е и —е, принадлежащие прямой (х) и сфере S. Сопоставив таким образом каждому вектору е е S прямую (х) проективного пространства, мы получим отображение /: S —> P(L). Предшествующее рассуждение показывает, что образом / является все пространство P(L). Однако это отображение / не взаимно однозначно, так как в одну точку Р е P(L), соответствующую прямой (ж), переходят две точки сферы S: векторы е и —е. Это свойство выражают, говоря, что проективное пространство получается из сферы S путем отождествления ее диаметрально противоположных точек. Применим это к случаю проективной плоскости, т. е. положим DimP(L) = 2. Тогда dimL = 3, и сфера S, содержащаяся в трехмерном пространстве, является сферой S2. Разделим ее на две равные части горизонтальной плоскостью (рис. 9.7). Рис. 9.7. Модель проективной плос- Рис. 9.8. Отождествле- кости ние точек Каждая точка верхней полусферы диаметрально противоположна некоторой точке нижней полусферы, и мы можем отобразить верхнюю полусферу
344 Гл. 9. Проективные пространства Рис. 9.9. Движение окружности на проективную плоскость P(L), представив любую точку Р Е P(L) в виде (е), где е — вектор верхней полусферы. Однако и это соответствие не будет взаимно однозначным, так как диаметрально противоположные точки на границе полусферы все равно склеиваются, т.е. соответствуют одной точке (см. рис. 9.8). Это выражают, говоря, что проективная плоскость получается путем отождествления диаметрально противоположных точек границы полусферы. Рассмотрим теперь движение окружности с отмеченным направлением ее обхода (рис. 9.9). На этом рисунке видно, что когда движущаяся окружность пересекает границу полусферы, направление обхода окружности меняется на противоположное. Это свойство выражают, говоря, что проективная плоскость является односторонней поверхностью (в то время как сфера в трехмерном пространстве и другие привычные нам поверхности — двусторонние). На это свойство проективной плоскости обратил внимание Мёбиус. Он же привел простой пример односторонней поверхности, которая называется лентой Мёбиуса. Чтобы получить ее, нужно вырезать из бумаги прямоугольник ABDC (рис. 9.10, слева) и склеить его противоположные стороны АВ и CD, перевернув последнюю на 180°. Получившаяся таким образом одностороння поверхность изображена на рис. 9.10 справа, и там же изображена непрерывная деформация окружности (положения 1 —» 2 —> 3 —» 4), изменяющая направление обхода на обратное. Лента Мёбиуса имеет и непосред- С у^г\, 7-^>ч ственное отношение к проективной плоскости. А именно, представим себе эту плоскость как сферу 52, в которой отождествлены диаметрально противоположные точки. Разделим сферу на три части, пересекая ее двумя параллельными плоскостями, проходящими выше и ниже серединной линии. В результате сфера разбивается на центральную часть U и две «шапочки» — верхнюю и нижнюю (рис. 9.11). А В Ю Рис. 9.10. Лента Мёбиуса Рис. 9.11. Разрезание сферы Рис. 9.12. Центральная часть сферы
9.4. Топологические свойства проективных пространств 345 Займемся сначала центральной частью U. Диаметрально противоположная точка к каждой ее точке содержится в ней же. Разделим ее на две половины — переднюю и заднюю — вертикальной плоскостью, пересекающей U по дугам АВ и CD (рис. 9.12). Переднюю половину(С//) можно совместить с прямоугольником ABDC на рис. 9.10. Любая точка центральной части U либо сама принадлежит ее передней половине, либо имеет диаметрально противоположную точку, принадлежащую передней половине, и притом только одну — за исключением точек отрезков АВ и CD. Для того, чтобы получить из двух диаметрально противоположных точек этих отрезков одну, нужно склеить эти отрезки точно так же, как это сделано на рис. 9.10. Таким образом, лента Мёбиуса гомео- морфна части U1 проективной плоскости. Чтобы получить оставшуюся часть V = P(L) \ U', нам нужно рассмотреть две «шапочки» на сфере (см. рис. 9.11). Для любой точки каждой из них диаметрально противоположная точка принадлежит другой «шапочке». Значит, при отождествлении диаметрально противоположных точек достаточно рассмотреть только одну «шапочку» — например, верхнюю. Эта «шапочка» гомеоморфна кругу: достаточно просто спроектировать ее на горизонтальную плоскость. Очевидно, что граница верхней «шапочки» отождествляется с границей центральной части сферы. Таким образом, проективная плоскость гомеоморфна поверхности, которая получится, если к ленте Мёбиуса приклеить круг таким образом, чтобы его граница отождествлялась с границей ленты Мёбиуса (легко проверить, что граница ленты Мёбиуса — окружность).
Глава 10 ВНЕШНЕЕ ПРОИЗВЕДЕНИЕ И ВНЕШНЯЯ АЛГЕБРА § 10.1. Плюккеровы координаты подпространства Основная идея аналитической геометрии, восходящая к Ферма и Декарту, заключается в том, что любая точка плоскости или пространства задается своими координатами (двумя или тремя соответственно). Конечно, при этом еще должна быть выбрана некоторая система координат. В этом курсе мы видели, что этот же принцип применим и ко многим пространствам более общих типов: векторным пространствам произвольной размерности, а также евклидовым, аффинным и проективным. В этой главе мы покажем, что он может быть применен к исследованию векторных подпространств М фиксированной размерности га в заданном векторном пространстве L размерности n ^ га. Поскольку га-мерные подпространства М С L находятся во взаимно однозначном соответствии с (га — 1)-мерными проективными подпространствами Р(М) с P(L), то тем самым мы получим и описание проективных подпространств фиксированной размерности проективного пространства с помощью «координат» (некоторых наборов чисел). Случай точек проективного пространства (подпространств размерности 0) нами уже был разобран в предыдущей главе: они задаются однородными координатами. То же относится к случаю гиперплоскостей проективного пространства P(L): они соответствуют точкам двойственного пространства P(L*). Простейшая ситуация, когда вопрос не сводится к двум перечисленным случаям, — это множество проективных прямых в трехмерном проективном пространстве. Здесь решение было предложено Плюккером, поэтому и в самом общем случае «координаты», соответствующие подпространству, называются плюккеровыми. Следуя ходу истории, сначала (в §§ 10.1 и 10.2) мы изложим их описание, использующее некоторую систему координат, а позже исследуем введенную конструкцию инвариантным образом, чтобы выяснить, какие ее элементы связаны с выбранной системой координат, а какие от нее не зависят. Таким образом, сейчас мы предполагаем, что в векторном пространстве L выбран некоторый базис. Так как dim L = п, то любой вектор а е L в этом базисе имеет п координат. Рассмотрим некоторое подпространство М с L размерности га ^ п. Выберем произвольный базис oi,...,am в подпространстве М, тогда М = (ai,...,am), причем векторы ai,...,am линейно независимы. Вектор (Li имеет в выбранном базисе пространства L координаты ац,...,а,ъП (i= 1,...,га), которые мы можем расположить в виде матрицы М типа (га,п), записывая их в виде строк:
10.1. Плюккеровы координаты подпространства 347 /о>и а\2 "• а\7 I «21 «22 ••• «2п . М= \ . . . . (10.1) \«ml «т2 ' * ' «тшг/ Условие, что векторы а\,...,ат линейно независимы, означает, что ранг матрицы М равен т, т. е. один из ее миноров порядка т отличен от нуля. Так как число строк матрицы М равно т, то минор порядка т однозначно определяется заданием номеров своих столбцов. Обозначим через М^,...^ минор, состоящий из столбцов с номерами гь...,гт, которые принимают различные значения от 1 до п. Нам известно, что все миноры Miu^im не могут быть равны нулю одновременно. Выясним, как они зависят от выбора базиса а\,...,ат в М. Если Ь\,... ,Ьт — другой базис этого подпространства, то Ъг = Ьца\ Н Ь bimam, %— 1,... ,m. Так как векторы bi,...,bm линейно независимы, то определитель |(Ь^)| Ф 0. Положим с= \(bij)\. Если М[ im — минор матрицы М\ построенной аналогично М при помощи векторов bi,...,bm, то согласно формуле (3.35) и теореме 2.20 об определителе произведения матриц, имеем соотношение М[х im = cMiu...,im. (10.2) Определенные нами числа Milimiim не независимы. Именно, если неупорядоченный набор номеров ii,...,jm совпадает с zi,...,im (т.е. содержит те же самые числа, быть может, переставленные в другом порядке), то, как мы видели в § 2.6, имеет место соотношение Mh jm = ±Miu_tim, (10.3) где знак + или — стоит в зависимости от того, четное или нечетное число транспозиций нужно совершить для перехода от набора (ii,...,zm) к (ji,--,jm)- Иначе говоря, функция Miltmtim от т аргументов ii,...,zm, принимающих значения 1,...,п, является антисимметрической. В частности, мы можем принять за набор (ji,...,jm) такое расположение чисел гь...,гт, что ц < %2 < - • • < гт, и соответствующий минор Mjb...i<7-m будет совпадать либо с M^b...^m, либо с — Мгь...,гт. Ввиду этого в первоначальных обозначениях мы будем предполагать, что г\ < %2 < • • • < гш, и положим Piu-.tim = Щ,-,1т (10-4) для всех наборов i\ < %2 < • • • < гт из чисел 1,...,п. Таким образом, мы сопоставим подпространству М столько чисел Pilt„,im, сколько имеется сочетаний из п по т, т.е. v = С™. Из формулы (10.3) и условия, что ранг матрицы М равен т, следует, что все эти числа Ргь...,гт не могут обращаться в нуль одновременно. С другой стороны, формула (10.2) показывает, что при замене базиса а\,..., ат подпространства М другим базисом Ь\,..., Ьт этого подпространства все эти числа одновременно умножаются на некоторое число с ф 0. Таким образом, числа Pih...,im при г\ < %2 < ••• < гт могут быть приняты
348 Гл. 10. Внешнее произведение и внешняя алгебра за однородные координаты точки проективного пространства W 1 = Р(1М), где dimN = и и DimP(N) = u-l. Определение. Совокупность чисел Ргь...,гт из (10.4) для всех наборов Ч < h < '' - < im, принимающих значения 1,... ,п, называются плюккеровыми координатами га-мерного подпространства М с L. Как мы видели, плюккеровы координаты определены только с точностью до общего ненулевого множителя, и их набор нужно понимать как точку проективного пространства Р"-1. Простейший частный случай, когда т = 1, возвращает нас к определению проективного пространства, точки которого соответствуют одномерным подпространствам (а) некоторого векторного пространства L. Числа Ргь...,гт в этом случае превращаются в однородные координаты точки. Поэтому не удивительно, что и те, и другие зависят от выбора системы координат (т. е. базиса) в пространстве L. Дальше мы, следуя традиции, будем допускать некоторую неточность, называя плюккеровыми координатами подпространства М как точку проективного пространства Р^-1, так и указанный в данном определении набор чисел Ргь...,гт- Теорема 10.1. Плюккеровы координаты подпространства М с L однозначно его определяют. Доказательство. Выберем произвольный базис а\,...,ат подпространства М. Он определяет однозначно (а не с точностью до множителя) миноры Miu...,imi B каком бы порядке мы ни расположили числа гь...,гт. Миноры однозначно определяются плюккеровыми координатами (10.4), согласно формуле (10.3). Произвольный вектор х Е L принадлежит подпространству М = (а\,..., ат) тогда и только тогда, когда ранг матрицы /а\\ а\2 ••• ain^ М= М : '•• : \Х\ Х2 ' ' ' Хп ) составленной из координат векторов а\,..., am, x в некотором (любом) базисе пространства L, равен ш, т. е. когда все миноры порядка т + 1 матрицы М равны нулю. Рассмотрим минор, включающий столбцы с номерами, образующими подмножество X = {к\,..., кт+\} множества Nn = {1,..., п}, причем мы можем считать, что к\ < к2 < • • • < кт+\. Разлагая его по последней строке, получим равенство J>cA* = 0, (10.5) где Аа — алгебраическое дополнение элемента ха в рассматриваемом нами миноре. Но, по определению, минор, соответствующий Аа, получается из матрицы М вычеркиванием последней строки и столбца с номером а. Следовательно, он совпадает с одним из миноров матрицы М, а номера его столбцов получаются выбрасыванием из множества X элемента а. Для
10.1. Плюккеровы координаты подпространства 349 записи получающихся множеств часто используют удобное обозначение \к\,..., /са,..., /ст_}_1}, где знак " означает пропуск соответствующего (стоящего под ним) элемента. Таким образом, соотношение (10.5) записывается в виде тга+1 Е(-1)^чь..^,^т+1-а (1аб) 3 = 1 Так как миноры M;b„.,im матрицы М выражаются через плюккеровы координаты по формуле (10.4), то соотношения (10.6), получающиеся при всевозможных подмножествах X = {к\,... ,кш+\} множества Nn, и дают записанные через плюккеровы координаты условия того, что х е М, что и доказывает теорему. Согласно теореме 10.1 плюккеровы координаты однозначно определяют подпространство М, но, как правило, они не могут принимать произвольные значения. Правда, при т = 1 однородные координаты точки проективного пространства могут быть произвольными наборами чисел (конечно, за исключением одного единственного набора, состоящего только из нулей). Другой, столь же простой случай: т = п— 1, когда подпространства являются гиперплоскостями, соответствующими точкам Р(1_*). Гиперплоскости определяются однородными координатами в этом проективном пространстве, которые тоже могут быть произвольными наборами чисел (опять же, за исключением набора, состоящего из одних нулей). Нетрудно проверить, что эти однородные координаты могут отличаться от плюккеровых координат лишь знаками, т.е. сомножителем ±1. Однако, как мы сейчас увидим, для произвольного числа т < п плюккеровы координаты связаны между собой определенными соотношениями. Пример 10.1. Рассмотрим следующий по сложности случай: п = 4, т = 2. Если перейти к проективным пространствам, соответствующим L и М, то это даст нам описание совокупности проективных прямых в трехмерном проективном пространстве (случай, рассмотренный Плюккером). Так как п = 4, т = 2, то и = С| — 6, и следовательно, каждая плоскость М с L имеет шесть плюккеровых координат: Р12, Р13. Р14, Р23, Р24, Р34- (Ю.7) Легко видеть, что для любого базиса пространства L мы всегда можем выбрать базис а, Ь в подпространстве М таким образом, что матрица М, заданная формулой (10.1), будет иметь вид: Отсюда легко найти значения плюккеровых координат (10.7): Р12=1, Р13 = 7> Ри = 5, Р23 = -а, Р24 = -/5, Р34 = a5-pj,
350 Гл. 10. Внешнее произведение и внешняя алгебра откуда вытекает соотношение рз4 ~Р\ъР2А + Р\аР2Ъ = 0- Для того, чтобы сделать его однородным, воспользуемся тем, что р\2 = 1, и запишем его в виде Р12Р34 -Р13Р24 +Р14Р23 = 0. (10.8) Соотношение (10.8) уже однородно, и поэтому оно сохраняется при умножении всех плюккеровых координат (10.7) на любой ненулевой сомножитель с. Таким образом, соотношение (10.8) остается верным при любом выборе плюккеровых координат, а значит, определяет точку на некотором проективном алгебраическом многообразии1) в 5-мерном проективном пространстве. В следующем параграфе мы исследуем аналогичный вопрос в общем случае, для произвольных размерностей т < п. § 10.2. Соотношения Плюккера и грассманианы Сейчас мы опишем соотношения, которым удовлетворяют плюккеровы координаты m-мерного подпространства М в n-мерном пространстве L для произвольных пит. При этом мы будем пользоваться следующими обозначениями и соглашениями. Хотя при определении плюккеровых координат Ргь...,гт предполагалось, что ц < %2 < • • • < гт, теперь мы будем рассматривать числа Pii,-,im также и с Другими наборами индексов. А именно, если (ji,...,jm) — произвольный набор т индексов, принимающих значения 1,... ,п, то положим Piu-Jm = О- (10-9) если среди чисел j\,... ,jm есть равные; если же все числа j\,... ,jm различные и (гь... ,гш) — их расположение в порядке возрастания, то положим Pjl-jm =±Pilf«fiTO, (10.10) где знак + или — стоит в зависимости от четности или нечетности перестановки (т.е. числа транспозиций), переводящей набор 0'i,...,jm) в (ii,...,im), согласно теореме 2.8. Иными словами, ввиду равенства (10.3) положим Pjb-jm = Mh,:,3m> (10.11) 0ь ••• jjm) — произвольный набор индексов, принимающих значения 1,...,п. Теорема 10.2. Для любого т-мерного подпространства М п-мерного пространства L u для любых двух наборов (j\,... ,jm-\) и (к\,..., fcm+i) индексов, принимающих значения 1,...,п, выполнены соотношения m+l Е(-1)^. im-Ukr ■ Pku..Jr,...,km+1 = О- (Ю.12) r=l которые называются соотношениями Плюккера. Обозначение к\,..., кг,..., кт+\ означает, что из последовательности к\,..., кг,..., fcm+i выброшен кг. 1) Это многообразие называется квадрикой.
10.2. Соотношения Плюккера и грассманианы 351 Заметим, что индексы у входящих в соотношение (10.12) чисел раь...,ат не обязательно идут в порядке возрастания, так что они не являются плюкке- ровыми координатами, но с помощью соотношений (10.9) и (10.10) мы можем легко выразить их через плюккеровы координаты. Поэтому и соотношение (10.12) тоже можно рассматривать как соотношение между плюккеровыми координатами. Доказательство теоремы 10.2. Возвращаясь к определению плюкке- ровых координат через миноры матрицы (10.1) и пользуясь соотношением (10.11), мы видим, что равенство (10.12) может быть переписано в виде m+l Е(-1)ГМ^ь...^-ь^ -Mku_,Jr fcr_,, =0. (10.13) ■m+l Г=\ Покажем, что соотношение (10.13) имеет место для миноров любой матрицы типа (га, п). Для этого разложим определитель Mju^jrn_lkr по последнему столбцу. Обозначим алгебраическое дополнение элемента а^г последнего столбца этого определителя через Ai, I = 1,...,т. Таким образом, алгебраическое дополнение А\ соответствует минору, расположенному в строках и столбцах с номерами (1,... ,1,... , га) и (j\,... ,jm_i) соответственно. Тогда М7- 7 а-1,кг — / j а1кгА[- 1=1 Подставив это выражение в левую часть соотношения (10.13), придем к равенству m+l m+l / т ч E(-1)rMi. i»-.*- ■ мк1,..л,..лт+1 = Е^пЕ^^К, S....W r=l r=l Xl=l J Меняя порядок суммирования, получим m+l Et-1)^...,^-.^-^, r=l Но сумма, стоящая в скобках, равна результату разложения по первой строке определителя квадратной матрицы порядка m+l, состоящей из столбцов матрицы (10.1) с номерами к\,... ,кт+\ и строк с номерами 1,1,...,т. Этот определитель равен т /т+1 \ Л,-Л,..,кт+1 = Е Т;(-1Уа1ЪгМкь..Л,.,кт+1 А1- г=1 \г=1 / O/fc, 0,lk2 0-2ki «2fc2 aifcm+i °2fcm+i = 0. Действительно, при любом I = l,...,ra две строки (с номерами 1 и I + 1) в нем совпадают, и значит, определитель равен нулю.
352 Гл. 10. Внешнее произведение и внешняя алгебра Пример 10.2. Вернемся еще раз к рассмотренному в предыдущем параграфе случаю п — 4, т = 2. Соотношения (10.12) здесь определяются подмножествами (к) и (1,т,п) множества {1,2,3,4}. Если, например, к = 1 и I = 2, т = 3, п = 4, то мы получаем уже выведенное ранее соотношение (10.8). Легко проверить, что если все числа к,1,т,п попарно различны, то мы получаем то же самое соотношение (10.8), а если среди них есть равные, то соотношение (10.12) выполняется тождественно (для доказательства этого нужно использовать антисимметричность р^ относительно г и j). Поэтому и в общем случае (при любых тип) соотношения (10.12) между плюккеровыми координатами называются соотношениями Плюккера. Мы видели, что каждому подпространству М заданной размерности т пространства L размерности п соответствуют его плюккеровы координаты Ргь...,гт> Ч < П < ' * * < im, (10.14) удовлетворяющие соотношениям (10.12). Таким образом, m-мерное подпространство М с L задается своими плюккеровыми координатами (10.14), совершенно аналогично тому, как точки проективного пространства задаются своими однородными координатами (это и есть частный случай плюккеровых координат при т = 1). Однако при т > 1 координаты подпространства М нельзя задавать произвольно: необходимо, чтобы они удовлетворяли соотношениям (10.12). Ниже мы докажем, что эти соотношения и достаточны для того, что набор чисел (10.14) являлся плюккеровыми координатами некоторого m-мерного подпространства М с L. Для этого полезна следующая геометрическая интерпретация плюккеровых координат. Соотношения (10.12) являются однородными (степени 2) относительно чисел Piltm,im. После замены на основании формул (10.9) и (10.10) каждое из этих соотношений остается однородным, и тем самым они определяют некоторое проективное алгебраическое многообразие в проективном пространстве Р^-1, называемое многообразием Грассмана или грассманианом и обозначаемое G(m,n). Теперь мы подробнее исследуем грассманиан G(m,ri). Как мы видели, G(m,n) содержится в проективном пространстве Р^-1, где v — С™ (см. с. 348), и однородные координаты записываются как числа (10.14) со всевозможными возрастающими наборами индексов, принимающих значения 1,...,п. Пространство Р^-1 является объединением аффинных подмножеств E/jb_,tm, каждое из которых определено условием Ргь...,гт Ф 0 при некотором выборе индексов %\,... ,гт. Отсюда получаем G{m,n)= (J (G(m,n)n^b...,;m). Исследуем отдельно какое-нибудь из подмножеств G(m,n) П C/ilr.,im, например, для простоты, подмножество с индексом (гь...,гш) = (1,...,т). Общий случай рассматривается совершенно аналогично и отличается только нумерацией координат в пространстве ¥и~1. Мы можем считать, что для точек нашего аффинного подмножества U\^m число р\,„$т = 1. Соотношения (10.12) дают возможность выразить плюккеровы координаты (10.14) подпространства М (или, что то же самое, миноры Miu^im
10.2. Соотношения Плюккера и грассманианы 353 матрицы (10.1)) в виде многочленов от таких координат ргь...,гт» У которых среди индексов i\ < %2 < • • • < гш не более чем один превосходит га. Любой такой набор индексов, очевидно, имеет вид (1,... ,г,... ,ra,Z), где г ^ га и I > га. Обозначим соответствующую этому набору плюккерову координату через ргЬ т. е. положим рт1 = р\,...,?,...,т,1- Рассмотрим произвольный упорядоченный набор j\ < J2 < —• < jm чисел от 1 до п. Если индексы j^ ^ га при всех к = 1,... ,т, то набор (j\,J2, •••»jm) совпадает с набором (1,2,...,га), а так как плюккерова координата р\^т — 1, то доказывать нечего. Таким образом, нам остается рассмотреть оставшийся случай. Пусть jk > га — одно из чисел j\ < J2 < - • < От- Воспользуемся соотношением (10.12), соответствующим набору (ji,... ,jb ••• > jm) из га — 1 чисел и набору (1,... ,га, j/c) из га + 1 чисел. В этом случае соотношение (10.12) принимает вид: т Е^Ра.-Л i».r -PU r,...,mJk + (-l)m+4b...,,b...,Wfc = °- г=1 так как £>1,.„>т = 1. Ввиду антисимметричности выражения Pju„,jm отсюда следует, что Pjltn.jm — Pj х 7- 7- равно сумме (с чередующимися знаками) произведений р. у - рн. Если среди чисел ji,...,jm было 5 превосходя- щих га, то среди чисел ji,..., J&,..., jm их будет уже 5—1. Повторяя этот процесс нужное число раз, мы в итоге получим выражение выбранной плюккеровой координаты Pju...,jrn через координаты prl, r ^ га, I > га. Тем самым мы получили следующий важный результат: Теорема 10.3. Для любой точки из множества G{m,n) П £Л,...,т все плюккеровы координаты (10.14) являются многочленами от координат Рн = Pu...,r,...,m,i, г ^ га, Z > га. Так как числа 1^г^гаига</^п, то всевозможные наборы координат рг1 образуют аффинное пространство V размерности т(п — га). Согласно теореме 10.3 все остальные плюккеровы координаты Piu„tim являются многочленами от ргЬ поэтому координаты рг1 однозначно определяют точку множества G(ra, n) П t/i,...,m. Тем самым, получается естественное взаимно однозначное (задаваемое этими многочленами) соответствие между точками множества G(m,n)C\Uit_%m и точками аффинного пространства V размерности га(п — га). Конечно, то же самое верно и для точек любого другого множества G(ra, n) П £/гь...,гт. В алгебраической геометрии этот факт выражают, говоря, что грасманиан G(m9n) покрыт аффинными пространствами размерности т(п — га). Теорема 10.4. Всякая точка грассманиана G(m,ri) соответствует некоторому т-мерному подпространству М с L, как это было описано в предшествующем параграфе. 12 А. О. Ремизов, И. Р. Шафаревич
354 Гл. 10. Внешнее произведение и внешняя алгебра Доказательство. Так как грассманиан G(m,ri) является объединением множеств G(m,n) П (7гь...,гт> то нам достаточно доказать теорему для каждого из них. Мы проведем доказательство для множества G(m,n) П {7i,...,m, так как остальные отличаются от него лишь нумерацией координат. Выберем m-мерное подпространство М с L и базис ai,...am в нем так, чтобы в соответствующей матрице М, заданной формулой (10.1), элементы, стоящие в ее первых т столбцах, образовывали единичную матрицу Е порядка т. Тогда матрица М имеет вид М = /1 0 ••• 0 aim+i ••• а\п\ I 0 1 • • • 0 а2т+\ •- а2п \ \0 0 • • • 1 amm+i • • • Q>mn/ (10.15) Согласно теореме 10.3 плюккеровы координаты (10.14) являются многочленами от prl = _pi,...,r,...,m,z- Кроме того, по определению плюккеровых координат (10.4), p\,...,r,...,m,i = Afi,...,r,...,m,z- При этом в г-ой строке минора М\,...^,...,171,1 матрицы (10.15) все элементы равны нулю, кроме элемента, находящегося в последнем (1-ом столбце), который равен аг\. Разлагая минор ^i,...,r,...,m,z по r-ой строке, мы видим, что он равен (—l)r+lari. Иначе говоря, pw = (-l')r+zaH. Согласно нашему построению все элементы аг\ матрицы (10.15) могут принимать произвольные значения за счет выбора подходящего подпространства М с L и базиса ai,...am в нем. Таким образом, плюккеровы координаты ртХ также принимают произвольные значения. Остается заметить, что, согласно теореме 10.3, все остальные плюккеровы координаты являются многочленами orpri, и следовательно, для построенного подпространства М они определяют заданную точку множества G(m,n) П U\^m. § 10.3. Внешнее произведение векторов Теперь мы попытаемся понять смысл сопоставления подпространству М С L его плюккеровых координат, отделив те части конструкции, которые зависят от выбора базисов е\,...,еп в L и ai,...,am в М, от тех, которые от выбора базисов не зависят. Наше определение плюккеровых координат было связано с минорами матрицы М, заданной формулой (10.1), а поскольку миноры (как и вообще любые определители) являются полилинейными и антисимметрическими функциями строк (и столбцов), то сначала напомним соответствующие определения из § 2.6 (тем более, что теперь они нам понадобятся в несколько измененном виде). Именно, если в гл. 2 мы рассматривали только функции строк, то теперь рассмотрим функции векторов, принадлежащих произвольному пространству L. Мы будем предполагать пространство L конечномерным. Тогда, согласно теореме 3.9, оно изоморфно пространству строк длины п = dim L, так что мы могли бы воспользоваться определениями из § 2.6. Но сам такой изоморфизм зависит от выбора базиса в пространстве L, а наша цель состоит
10.3. Внешнее произведение векторов 355 как раз в том, чтобы исследовать зависимость нашей конструкции от выбора базиса. Определение. Функция F(x\,... ,хт) от т векторов пространства L, принимающая числовые значения, называется полилинейной, если для любого индекса г от 1 до т и любых фиксированных векторов а\,..., а*,..., аш F(a\,..., a,i-i, Xi, Ог+i,..., ат) является линейной функцией вектора ж^. При т — 1 мы приходим к понятию линейной функции, введенному в § 3.7, а при т = 2 — к понятию билинейной формы, введенному в § 6.1. Определение антисимметрической функции, которое было дано в § 2.6, годилось для любого множества, и в частности, мы можем применить его к множеству всех векторов пространства L. Согласно этому определению для любых двух различных индексов г и s от 1 до т должно выполняться соотношение Г \Х\, ... , Жг, ... , Ж5, ... , Хш) = Г \Х\, ... , Ж5, ... , Жг, ... , Хт). \ 1 vJ. lOj для любого набора векторов х\,...,хт Е L. Как было доказано в § 2.6, свойство (10.16) достаточно проверить для s = г + 1, т. е. когда производится перестановка двух соседних векторов из набора х\,...,хт. Тогда свойство (10.16) будет выполнено и для любых индексов г и s. Ввиду этого мы часто будем формулировать условие антисимметричности только для «соседних» индексов и пользоваться тем, что тогда оно уже справедливо для любых двух индексов г и s. В случае, если числа — это элементы поля отличной от 2 характеристики, отсюда следует, что F(x\,...,xm) = 0, если какие-либо два вектора х\,..., хт совпадают. Обозначим через Пш(1_) совокупность всех полилинейных функций от т векторов пространства L а через Om(L) — совокупность всех антисимметрических функций из Пт(1_). Множества nm(L) и f2m(L) становятся векторными пространствами, если для любых F, G Е Пт(1_) определить их сумму H = F + Ge IIm(L) по формуле Н(х\,... ,хт) = F(#i,...,xm) + G(x\,... ,xm) и для любой функции F G Пт(1_) определить умножение на число а как функцию Н — aF e Пт(!_) по формуле Я(ж1,...,жт) = aF(x\,...,xm). Из данных определений непосредственно следует, что таким образом Пт(1_) превращается в векторное пространство, и fim(L) с Пт(1_) является его подпространством. Пусть dim L = п и е\,..., еп — некоторый базис в пространстве L. Из определения следует, что полилинейная функция F(x\,...,xm) определена для всех наборов векторов (ж1,...,жт), если она определена для тех наборов, в которых векторы xi принадлежат нашему базису. Действительно, дословно повторяя рассуждения из § 2.7, использованные нами при доказательстве 12*
356 Гл. 10. Внешнее произведение и внешняя алгебра теоремы 2.10, мы получим для F(x\,...,xm) такие же формулы (2.40) и (2.43). Таким образом, при выбранном базисе ei,...,en полилинейная функция F(x\,... ,хт) определяется своими значениями F(ej1,...,efm), где Чу-Лт — всевозможные наборы чисел из множества Nn — {1,... , п}. Предшествующее рассуждение показывает, что пространство Пш(1_) изоморфно пространству функций на множестве N™ = Nn x • • • х Nn. Следова- т раз тельно, размерность пространства IIm(L) конечна и совпадает с числом элементов множества N™. Как легко видеть, это число равно nm, следовательно, dimnm(L) =nm. Как мы заметили в примере 3.16 (с. 105), в пространстве функций / на конечном множестве N™ существует базис, состоящий из 5-функций, принимающих значение 1 на одном элементе из N™ и значение 0 на всех остальных элементах (с. 105). В нашем случае мы введем для такого базиса специальное обозначение. Пусть I = (гь..., гш) — произвольный элемент множества N™. Тогда обозначим через /7 функцию, принимающую значение 1 на элементе I и значение 0 на всех остальных элементах множества N™. Теперь мы перейдем к рассмотрению подпространства антисимметрических полилинейных функций fim(L), по-прежнему предполагая, что в L выбран некоторый базис е\,...,еп. Для проверки того, что полилинейная функция F является антисимметрической, необходимо и достаточно, чтобы свойство (10.16) было выполнено для векторов е$ базиса. Иначе говоря, это сводится к соотношениям г [ец,..., Bir,..., e^s,..., Sim) = —r (e^,..., e^s,..., e^r,..., e^m) для всех наборов векторов е^,...^^, принадлежащих выбранному базису ei,...,en пространства L. Благодаря этому для любой функции F G f2m(L) и любого набора (jj,... ,jm) G N™ мы имеем равенство F{ejl,...,ejm) = ±F(eil,...,eim), (10.17) где числа ц,...,гт — те же самые, что и ji,...,jm, но расположенные в порядке возрастания: г\ < %2 < • • • < гш, а знак + или — в (10.17) стоит в зависимости от того, является ли число транспозиций, необходимых для перехода от набора (гь...,гт) к набору (ji,... ,.7т), четным или нечетным (заметим, что если среди чисел ji,...,jm есть равные, то обе части равенства (10.17) обращаются в нуль). Рассуждая в точности так же, как и в случае пространства Пт(1_), мы заключаем, что пространство fim(L) изоморфно пространству функций на множестве N™ с N™, которое состоит из всех возрастающих наборов I — (гь... , гш), то есть таких, в которых ц < i<i < • • • < гш. Отсюда, в частности, следует, что Qm(L) = (0), если т> п. Как легко видеть, число таких возрастающих наборов I равно С™, и таким образом, dimftm(L) = C™. (10.18) Обозначим через Fj 5-функцию пространства fim(L), принимающую значение 1 на наборе JgNJh значение 0 на всех остальных наборах из N™.
10.3. Внешнее произведение векторов 357 Векторы ai,...,am е L определяют на пространстве Qm(L) линейную функцию ср, заданную соотношением <p(F)=F(al,...,am) (10.19) для любого элемента F Е £2m(L). Таким образом, ср является линейной функцией на fim(L), т.е. элементом сопряженного пространства Om(L)*. Определение. Сопряженное пространство Am(L) = Om(L)* называется пространством т-векторов или т-ой внешней степенью пространства L, а его элементы — т-векторами. Вектор ср е Лт(1_), построенный с помощью соответствия (10.19) по векторам ai,...,am, называется внешним произведением ai,... , am и обозначается как <р = а\ Л а,2 Л • • * Л ат. Теперь выясним связь между внешним произведением и плюккеровыми координатами подпространства М с L. Для этого нужно выбрать некоторый базис еь ..., еп в L и некоторый базис а\,..., ат в М. Плюккеровы координаты подпространства М имеют вид (10.4), где M;b.^m — минор матрицы (10.1), стоящий в столбцах с номерами ц,... ,гш и являющийся антисимметрической функцией своих столбцов. Введем для плюккеровых координат и соответствующих миноров обозначения VI = Рц,...Ат> Mi = Miu-,im> ГДе I = (ii,..., гт) € N™. Базису пространства fim(L), состоящему из 5-функций F/, соответствует взаимный базис сопряженного пространства Лш(1_), векторы которого мы обозначим через cpj. Используя обозначения, введенные нами в § 3.7, мы можем сказать, что взаимный базис определяется условием (Fi, 4>i) = 1 ПРИ всех I ^ ^f™, (Fl9 cpj) = 0 при всех I ф J. (10.20) В частности, вектор (р = а\ Л a<i Л • • • Л ат пространства Am(L) представляется в виде линейной комбинации векторов этого базиса: с некоторыми коэффициентами А/. Используя формулы (10.19) и (10.20), мы получаем следующие равенства: \i = <p(Fi) = Fj(ab...,am). Для определения значений Fj(a\,... ,am) мы можем воспользоваться теоремой 2.10, см. формулы (2.40) и (2.43). Так как i?j(e<7-1,...,ejTO) = 0, когда индексы e^j,..., eJm образуют набор J ф I, то из формулы (2.43) следует, что значение Fj(a\,... ,am) зависит только от элементов, входящих в минор М/. Минор Mi является линейной и антисимметрической функцией своих строк.
358 Гл. 10. Внешнее произведение и внешняя алгебра Ввиду того, что, согласно определению, Fj(e^,..., е*т) = 1, из теоремы 2.9 получаем, что Fi(a\,... ,am) = Mi =pi. Иначе говоря, имеет место равенство <p = ai Ла2Л---Лат = ^ Мцрх = ]Г pjc^j. (10.22) Таким образом, любой набор т векторов а\,...,ат инвариантно определяет вектор а\ Л • • • Л ат в пространстве Лт(1_), при этом плюккеровы координаты подпространства (ai,...,am) являются координатами этого вектора а\Л---Лат относительно базиса срх, le N™, пространства Лш(1_). Как любые координаты, они зависят от этого базиса, а сам он строится как двойственный базис к некоторому базису пространства fim(L). Определение. Вектор х е Лт(1_) называется разложимым, если он может быть представлен в виде внешнего произведения х = а\ Л a<i Л • • • Л ат (10.23) с некоторыми а\,..., аш е L. Пусть га-вектор х имеет координаты #гь...,гт в некотором базисе (рх, I e N™, пространства Лт(1_). Как и в случае любого векторного пространства, координаты #гь...,гт могут принимать произвольные значения из соответствующего поля. Для того, чтобы m-вектор х был разложимым, т. е. чтобы для него было выполнено соотношение (10.23) с некоторыми векторами а\,... ,am G L, необходимо и достаточно, чтобы его координаты £гь...,гт совпадали с плюккеровыми координатами Ргь...,гт подпространства М = (а\,..., ат) в L. Но как мы установили в предшествующем параграфе, набором плюкке- ровых координат подпространства М с L не может быть произвольный набор v чисел, а только такой, для которого выполнены соотношения Плюкке- ра (10.12). Следовательно, соотношения Плюккера дают необходимое и достаточное условие для того, чтобы m-вектор х был разложимым. Таким образом, для задания га-мерных подпространств М с L нужны только разложимые га-векторы (неразложимые m-векторы не соответствуют никакому га-мерному подпространству). Однако, вообще говоря, разложимые векторы не образуют векторного пространства (сумма двух разложимых векторов может дать неразложимый вектор), кроме того, как легко проверить, множество разложимых векторов не содержится ни в каком подпространстве пространства Am(L), отличного от самого Лт(1_). Во многих задачах естественнее иметь дело с векторными пространствами, в этом и состоит смысл введения пространства Лт(1_), включающего в себя все m-векторы, в том числе, и неразложимые. Заметим, что сами базисные векторы срТ разложимы: они определяются условиями (10.20), которые, как легко проверить с учетом равенства (Fj><Pi) = Fj(ei{1... ,eim), означают, что для вектора х = ipT имеет место представление (10.23) при а\ = ег1У...,ат = е$т, т.е. 4>l = eix Aei2 Л---Ле;т, I = (гь...,гт). Если е\,..., еп — базис пространства L, то векторы е», Л • • • Л e^m при всех возможных возрастающих наборах индексов (г\,...,гт) составляют в про-
10.3. Внешнее произведение векторов 359 странстве Лш(1_) базис, взаимный рассмотренному выше базису Fj пространства f2m(L). Таким образом, любой m-вектор является линейной комбинацией разложимых векторов. Внешнее произведение а\ Л • • • Л ат является функцией от т векторов щ Е L со значениями в пространстве Лт(1_). Сейчас мы установим некоторые ее свойства. Первые два из них являются аналогом полилинейности, а третье — аналогом антисимметричности, но с учетом того, что внешнее произведение — не число, а вектор пространства Am(L). Свойство 1. Для любого г Е {1,...,т} и любых векторов а^Ъ.с Е L выполнено соотношение а\ Л • • • Л di-i Л(Ь + с) Л cbi+i Л • • • Л ат — = а\ Л • • • Л a^_i Л Ъ Л ai+\ Л • • • Л ат + + а\ Л • • • Л а^_1 Л с Л ai+\ Л • • • Л ат. (10.24) Действительно, по определению, внешнее произведение а\ Л • • • Л сц_1 Л (Ъ + с) Л af+i Л • •• Л ат есть линейная функция на пространстве f2m(L), сопоставляющая каждой функции F Е fim(L) число F(ai,... ,ai_i,b + с, ai+i,... ,am). Так как функция F полилинейна, то F(a\,..., a^_i, Ь + с, ai+i,..., am) = = F(a\,...,ai-\,b,ai+i,...,am) + F(a\,... ,ai_i,c,ai+i,... ,am), что и доказывает равенство (10.24). Столь же просто проверяются следующие два свойства: Свойство 2. Для любого числа а и любых векторов щ Е L выполнено соотношение ai Л • • • Л a^_i Л (aaf) Л сц+i Л • • • Л am = = a(ai Л • • • Л aj_i Л а; Л сц+i Л • • • Л ат). (10.25) Свойство 3. Для любых двух индексов г,s Е {1,...,т} и любых векторов щ Е L выполнено соотношение а\ Л • • • Л as_i Л as Л as+i Л • • • Л ar_i Л аг Л ar+i Л • • • Л am — = —ai Л • • • Л as_\ Лаг Л as+\ Л • • • Л ar_i Л as Л ar+i Л • • • Л am, (10.26) т. е. при перестановке местами любых двух векторов из а\,...,am их внешнее произведение меняет знак.
360 Гл. 10. Внешнее произведение и внешняя алгебра Если (как мы и предполагаем) под числами подразумевать элементы некоторого поля отличной от 2 характеристики (например, R или С), то из свойства 3 вытекает Следствие. Если среди векторов а\,...,ат есть хотя бы два равных, то а\ Л • • • Л аш = 0. Обобщая данное выше определение, мы можем выразить свойства 1-3, сказав, что внешнее произведение а\ Л • • • Л ат является полилинейной антисимметрической функцией от векторов ai,... ,am G L со значениями в пространстве Лт(1_). Свойство 4. Векторы ai,...,am линейно зависимы тогда и только тогда, когда ai Л---Лат = 0. (10.27) Доказательство. Предположим, что векторы ai,...,am линейно зависимы. Тогда один из них является линейной комбинацией остальных. Пусть это будет вектор ат (другие случаи сводятся к этому изменением нумерации). Тогда ат = а\а\ Н bam_iam_i, и на основании свойств 1 и 2 получаем, что а\ Л • • • Л am_i Л ат = = ot\(a\ Л--- Aam_i Аа\)-\ ham_i(ai Л--- Aam_i Aam_i). Ввиду следствия из свойства 3 каждое слагаемое в правой части этого равенства равно нулю, следовательно, и а\ Л • • • Л ат = 0. Предположим теперь, что векторы ai,...,am линейно независимы. Нам нужно доказать, что а\ Л • • • Л ат ф 0. Равенство (10.27) означало бы, что функция а\ Л • • • Л ат (как элемент пространства Лт(1_)) сопоставляет любой функции F G Пт(1_) значение F(ai,...,am) = 0. Однако в противоречие с этим можно указать функцию F e Om(L), для которой F(ai,...,am) ф 0. Действительно, представим пространство L в виде прямой суммы L= (ab...,am) 0L;, где L'c L - некоторое подпространство размерности п — т, и для каждого вектора z e L рассмотрим соответствующее разложение z = х + у, где х g (ai,... ,am) и у G L;. Наконец, для векторов ^ = a^iai Н Ьагташ + г/^, yi G L', г = 1,...,га, определим функцию F условием F(z\,... ,zm) = |(ay)|. Как мы видели в § 2.6, определитель является полилинейной антисимметрической функцией строк. Кроме того, F(a\,..., ат) = |-Е7| = 1, что и доказывает наше утверждение. Пусть L и М — произвольные векторные пространства и srf\ L —> М — линейное преобразование. Оно определяет преобразование №(*/): №(M)^np(L), (10.28)
10.3. Внешнее произведение векторов 361 сопоставляющее каждой антисимметрической функции F(yl,... ,j/ ) из пространства ЛР(М) антисимметрическую функцию G(x\,...,xp) из пространства ftp(L) по формуле С(жь...,жр) = F(£/(xi),...,£/(xp)), хх,...,хр Е L (10.29) Простая проверка показывает, что это преобразование является линейным. Заметим, что мы уже встречались с таким преобразованием в случае т = 1: это сопряженное отображение я/*: М* —► L* (см. § 3.7). В общем случае, переходя к сопряженным пространствам AP(L) = QP(L)* и ЛР(М) = ПР(М)*, мы определим линейное преобразование Лр(^): Ap(L)->Ap(M), (10.30) сопряженное к преобразованию (10.28). Отметим важнейшие свойства преобразования (10.30). Лемма 1. Пусть srf\ L —> Ы и 8$: М —> N — линейные преобразования произвольных векторных пространств L, М, N. Тогда Kp(@srf)=kp(8§)kp(srf). Доказательство. Ввиду определения (10.30) и установленных в § 3.7 свойств сопряженных преобразований (формула (3.61)) нам достаточно убедиться, что №(&*/) = Пр(^) №(&). (10.31) Но равенство (10.31) непосредственно вытекает из определения. Действительно, преобразование №(&/) переводит функцию F(y{,..., j/ ) из пространства ПР(М) в функцию G(x\,...,xp) из £F(L) по формуле (10.29). Точно так же преобразование QP(3§) переводит функцию H(zi,...,zp) из fip(N) в функцию F(y{,... ,ур) из ПР(М) по аналогичной формуле Р(У1,...,ур)=Н(ЩУ1),...,Щур)), У1,...,уреМ. (10.32) Наконец, преобразование £esrf\ L —> N переводит функцию H(z\,..., zp) из пространства £2р(1М) в функцию G(x\9...,xp) из пространства Г2Р(1_) по формуле С?(ж1,...,жр) = H(38tf{x\),...,3gs/{xp)), Ж1,...,жр Е L. (10.33) Полагая в (10.33) вектор у^ = £^(a^) и сравнивая полученное соотношение с (10.32), мы и получим требуемое равенство (10.31). Л е м м а 2. Для любых векторов х\,..., хр Е L имеет место равенство Ap(3?)(xi А • - • Л жр) = ^(ж0 Л • • • Л л^(жр). (10.34) Доказательство. Обе части равенства (10.34) являются элементами пространства ЛР(М) = Г2Р(М)*, т. е. линейными функциями на £F(M). Достаточно проверить, что их применение к любой функции F{yx,...,у ) из пространства ПР(М) дает один и тот же результат. Но, как следует из определения, в обоих случаях этот результат равен F(^/(x\),... 9я/{хр)).
362 Гл. 10. Внешнее произведение и внешняя алгебра Наконец, докажем свойство, которое иногда называют универсальностью внешнего произведения: Свойство 5. Любое отображение, сопоставляющее т векторам а\,...,ат пространства L вектор [а\,...9ат] некоторого пространства М, обладающее свойствами 1-3 (стр. 359), может быть получено из внешнего произведения а\ А - • • Л ат применением к нему некоторого однозначно определенного линейного преобразования si\ Лт(1_) —► М. Другими словами, существует такое линейное преобразование srf\ Лш(1_) —> М, что для любого набора ai,... ,am векторов пространства L выполнено равенство [ab...,am] =s/{a\ Л---Лат), (10.35) которое можно выразить следующей диаграммой: I га (10.36) Лш(!_) В этой диаграмме [а\,... ,ат] = srf{a\ Л • • • Л am). Заметим, что хотя Lm — L х - ♦ • х L, очевидно, является векторным про- т раз странством, мы отнюдь не утверждаем, что отображение а\,... ,ат |—> [а\,... ,am], о котором идет речь в свойстве 5, является линейным преобразованием Lm —> М. Вообще говоря, оно таковым и не является. Например, само внешнее произведение а\ Л • • • Л ат: Lm —> Am(L) не является линейным преобразованием в случае, если dimL >га+1ига>1. Действительно, образом внешнего произведения является множество разложимых векторов, описываемых соотношениями Плюккера, которое не является векторным подпространством в Am(L). Доказательство. Мы можем построить такое линейное преобразование Ф: М* —> fim(L), которое сопоставляет каждой линейной функции /gM* функцию Ф(/) Е fim(L), определенную соотношением Ф(/) = /([аь...,ато]). (10.37) Согласно свойствам 1-3, которым, по условию, удовлетворяет [ai,...,am], построенное таким образом отображение Ф(/) является полилинейной и антисимметрической функцией от ai,...,am. Следовательно, Ф: М* —> S77Tl(L) является линейным преобразованием. Определим я/ как сопряженное преобразование: я/ = Ф*: Лт(1_) = Пт{1У —► М = М**. По определению сопряженного преобразования (формула (3.58)), для любой линейной функции F на пространстве Qm(L) ее образ s/(F) является
10А. Внешняя алгебра 363 линейной функцией на пространстве М*, такой, что &/(F)(f) = ^(Ф(/)) для любой /gM*. Применяя к правой части последнего равенства формулу (10.37), получаем равенство *f(F)(f) = F(4>(f)) = F{f([al,...,am])). (10.38) Подставив в (10.38) функцию F(\P) = Ф(аь ... ,аш), т.е. F = ai Л • • • Л аш, приходим к соотношению ^(ai Л .-. Л ат)(/) - /([аь ..., аш]), (10.39) левая часть которого является элементом пространства М**, изоморфного М. Напомним, что отождествление (изоморфизм) пространств М** и М можно получить, сопоставляя каждому вектору ip(f) G М** такой вектор х G М, для которого выполнено равенство /(ж) = ^(/) при любой линейной функции / G М*. Тогда формула (10.39) дает соотношение /(W(ai Л-'-Лат)) =/([ab...,am]), справедливое для любой функции / G M*. Следовательно, из него вытекает нужное нам соотношение */(ai А-- Аат) = [ab...,am]. (10.40) Равенство (10.40) определяет линейное преобразование srf для всех разложимых векторов ж G Лш(1_). Но выше мы видели, что любой га-вектор является линейной комбинацией разложимых векторов. Преобразование srf линейно, и следовательно, оно однозначно определено для всех m-векторов. Таким образом, мы получаем нужное нам линейное преобразование s#\ Am(L) -» М. § 10.4*. Внешняя алгебра Во многих разделах математики важную роль играет понимание выражения а\ Л • • • Л аш не как некоторой функции от га векторов ai,...,am пространства L со значениями в Am(L), а как результата повторного (га раз) применения операции, сопоставляющей двум векторам ж G Лр(1_) и у G Лд(1_) вектор ж Л у G Лр+9(1_). Например, выражение а АЬ Ас можно было бы тогда вычислить «по частям», то есть представить в виде аЛбЛс = (оЛб)Лси вычислить сначала а Л Ь, а потом уже (а АЬ) А с. Для этого нам прежде всего нужно определить функцию, сопоставляющую двум векторам ж G AP(L) и у G Л9(1_) вектор ж Л у G Лр+9(1_). В качестве первого шага такая функция ж Л у будет определена для случая, когда вектор у G Лд(1_) — разложимый, т. е. представим в виде у = ai Л а2 Л • • • Aaq, щ G L. (10.41) Рассмотрим отображение, сопоставляющее р векторам Ь\,... ,ЬР пространства L вектор [Ь\,..., bp] = bi Л • • • Л Ър А а\ А • • • Л aq
364 Гл. 10. Внешнее произведение и внешняя алгебра и применим к нему свойство 5 (универсальность) из предыдущего параграфа. Таким образом, мы получим диаграмму: В этой диаграмме A*+*(L), A*(L) ^(bi Л • • • Л Ьр) = [ЬЬ...,ЬР]. (10.42) Определение. Пусть у — разложимый вектор, т.е. он представим в виде (10.41). Тогда для каждого вектора х е AP(L) его образ srf{x) при построенном выше преобразовании srf\ Л?(\-) —> AP+9(L) обозначается х А у = = х А (а\ Л • • • Л aq) и называется внешним произведением векторов х и у. Таким образом, в качестве первого шага мы определили х А у в случае, когда вектор у разложим. Для того, чтобы определить х Ау для произвольного вектора у Е Ag(L), нам достаточно просто повторить то же рассуждение. Действительно, рассмотрим отображение [a\,...,aq]: A9(L) —> Ap+q(L), определенное формулой [а\,... ,aq] = х А (а\ А • • • Л aq). Опять же на основании свойства 5 мы получаем такую же диаграмму: A*+9(L), (10.43) A*(L) где преобразование si\ A9(L) —> Лр+9(1_) определено формулой srf{a\ Л • • • Л aq) = [аь ... ,aq]. Определение. Для любых векторов х е AP(L) и у е Ag(L) внешним произведением х Ау называется вектор srf(y) Е Лр+9(1_) в простроенной выше диаграмме (10.43). Отметим некоторые свойства внешнего произведения, следующие из этого определения. Свойство 6. Для любых векторов х\,Х2 € Лр(1_) и у е Л9(1_) выполнено соотношение (xi + ж2) Л у = х\ А у + ж2 Л у.
10.4. Внешняя алгебра 365 Аналогично, для любого вектора ж £ Лр(1_), любого вектора у £ Л9(1_) и числа а выполнено соотношение (ах) Л у = а(ж Л у). Оба равенства сразу вытекают из определений и линейности преобразования srf в диаграмме (10.43). Свойство 7. Для любых векторов х £ Лр(1_) и yi,y2 € Л9(1_) выполнено соотношение Ж Л (j/! + 7/2) = ж А 2/! + Ж Л J/2- Аналогично, для любого вектора ж £ Лр(1_), любого вектора у £ A9(L) и числа а выполнено соотношение ж Л (ау) = а(ж Л у). Оба равенства сразу вытекают из определений и линейности преобразования si в диаграммах (10.42) и (10.43). Свойство 8. Для разложимых векторов ж = а\ Л • • • Л ар и у = Ь\ Л • • • Л bq выполнено соотношение ж Л у = а\ Л • • • Л ар Л bi Л • • • Л bq. Это сразу следует из определения. Заметим, что мы собственно так и определяли внешнее произведение, чтобы были выполнены свойства 6-8. Действительно, свойство 8 определяет внешнее произведение разложимых векторов. А так как любой вектор является линейной комбинацией разложимых, то свойства 6 и 7 определяют его в общем случае. Свойство же универсальности внешнего произведения нам было нужно для того, чтобы удостовериться, что результат ж Л у не зависит от выбора линейных комбинаций разложимых векторов, с помощью которых мы представляем векторы х и у. Наконец, отметим столь же простое Свойство 9. Для любых векторов ж £ Лр(1_) и у £ Aq(L) выполнено соотношение xAy = (-l)pqyAx. (10.44) Оба вектора в правой и левой частях равенства (10.44) содержатся в пространстве Лр+<?(1_), т.е., по определению, являются линейными функциями на np+q(L). Так как любой вектор является линейной комбинацией разложимых, то нам достаточно проверить равенство (10.44) для разложимых векторов. Пусть ж = а\ Л • • • Л ар, у = Ь\ Л • • • Л bq и F — произвольный вектор пространства £F+^(L), т.е. F — антисимметрическая функция от векторов Ж1,...,жр+д из L. Тогда равенство (10.44) означает, что F(ai,...,op,bi,...,b9) = (-l)^F(b1,...,b9,ai,...,ap). (10.45) Но равенство (10.45) — очевидное следствие антисимметричности функции F. Действительно, для того, чтобы поставить в левой части (10.45) на первое место вектор Ь\, нам нужно по очереди поменять местами Ъ\
366 Гл. 10. Внешнее произведение и внешняя алгебра с каждым вектором а\,...,ар. Одна такая перестановка меняет знак, а все вместе они умножают F на (— 1)р. Аналогично, для того, чтобы поставить в левой части (10.45) на второе место вектор &2> нужно тоже произвести р перестановок, и значение F снова умножится на (— 1)р. А для того, чтобы поставить в начало все векторы b\,...,bq, нужно q раз умножить F на (— 1)р, что и означает равенство (10.45). Наш следующий шаг заключается в том, чтобы соединить все пространства Лр(1_) в единое множество Л(1_) и определить внешнее умножение для его элементов. Здесь мы встречаемся с частными случаем очень важного алгебраического понятия — алгеброй1). Определение. Алгеброй (над некоторым полем К, которое мы будем считать состоящим из чисел) называется векторное пространство А, в котором кроме обычных операций сложения векторов и умножения векторов на числа определена еще и операция А х А —» А, называемая произведением, ставящая в соответствие любым двум элементам а, Ъ Е А элемент ab Е А и удовлетворяющая следующим условиям: 1) свойство дистрибутивности: для любых а, Ь, с Е А выполнены соотношения (а + Ъ)с = ас + be, с(а + Ъ) — са + сЪ\ (10.46) 2) для любых а, Ъ Е А и любого числа a Е К выполнено соотношение {аа)Ъ = а(аЪ) = а(аЬ); (10.47) 3) существует такой элемент е Е А, называемый единичным, что для любого а Е А выполнены соотношения еа = а и ае = а. Заметим, что единичный элемент в алгебре может быть только один. Действительно, если бы существовал другой единичный элемент е', то, по определению, мы имели бы равенства ее' = ef и ее' = е, откуда следует, что е = е'. Как и в любом векторном пространстве, в алгебре для любого а Е А выполнено равенство 0 • а = 0 (здесь слева 0 обозначает число нуль в поле К, а справа О означает нулевой элемент векторного пространства А, каким является алгебра). Если алгебра А конечномерна как векторное пространство, и е\,..., еп — некоторый базис в нем, то говорят, что элементы е\,...,еп образуют базис алгебры А, при этом число п называется ее размерностью и обозначается: dim А = п. Для алгебры А конечной размерности п произведение двух элементов ее базиса должно представляться в виде: п е*ез =^2aijek' г J = l,...,n, (10.48) fc=i где а£. Е К — некоторые числа. l) He очень удачный термин, совпадающий с названием области математики, которой мы занимаемся, но он укоренился.
10А. Внешняя алгебра 367 Совокупность чисел аф для всех i,j,fc = l,...,n называется таблицей умножения алгебры А и однозначно определяет умножение всех ее элементов. Действительно, если х = Х\е\ Н Ь Апеп и у = ц\е\ -\ \- \inen, то, многократно применяя правила (10.46) и (10.47), с учетом (10.48) мы получаем п ху= J2 Хг^а^ек, (10.49) i,j,k=\ т.е. произведение ху однозначно задается координатами векторов ж,р таблицей умножения алгебры А. И наоборот, очевидно, что при любой заданной таблице умножения формула (10.49) определяет в n-мерном векторном пространстве операцию умножения, удовлетворяющую всем требованиям, входящим в определение алгебры, кроме, быть может, свойства 3), о котором надо заботиться дополнительно, т. е. превращает это векторное пространство в алгебру такой же размерности п. Определение. Алгебра А называется ассоциативной, если для любых трех ее элементов а, Ъ и с выполнено соотношение {аЬ)с = а(Ьс). (10.50) Свойство ассоциативности позволяет вычислять произведение любого числа элементов а\,...,ат алгебры А, не указывая способ расстановки скобок между ними, см. рассуждение на стр. 11. Очевидно, что свойство ассоциативности для конечномерной алгебры достаточно проверить для элементов какого-нибудь ее базиса. Мы уже встречались с примерами алгебр: Пример 10.3. Алгебра всех квадратных матриц порядка п. Она имеет конечную размерность п2 и, как мы видели в § 2.9, является ассоциативной. Пример 10.4. Алгебра всех многочленов от п > 0 переменных, коэффициенты которых — числа. Эта алгебра тоже является ассоциативной, но имеет бесконечную размерность. Теперь для любого векторного пространства L конечной размерности п мы определим его внешнюю алгебру A(L). Эта алгебра имеет много различных применений (некоторые из них будут обсуждаться в следующем параграфе), ее введение — еще одна мотивировка того, что в § 10.3 мы не ограничились рассмотрением только разложимых векторов, достаточных для описания векторных подпространств. Определим внешнюю алгебру Л(1_) как прямую сумму пространств Лр(1_), р ^ 0, которые состоят более чем из одного нулевого вектора, где A°(L) по определению равно К. Так как вследствие антисимметричности внешнего умножения Лр(1_) = (О) при всех р > п, то мы получаем следующее определение внешней алгебры: A(L) = A0(L) 0 Al(L) 0 • • • 0 ЛП(1_). (10.51) Таким образом, любой элемент и построенного векторного пространства Л(!_) представляется в виде и = щ + щ Н Ь ип, где щ G Лг(1_).
368 Гл. 10. Внешнее произведение и внешняя алгебра Наша цель теперь — определить в Л(1_) внешнее произведение, которое мы обозначим и Av, для любых векторов u,v e Л(1_). Мы определим внешнее произведение и A v векторов и = щ + щ Н Ь ип, v = vq + vi Н Ь vn, Ui,Vie Лг(1_), как элемент п U AV — 2_, иг Л vj> i,j=0 воспользовавшись тем, что внешнее произведение щ A Vj уже определено как элемент пространства Al+J'(L). Таким образом, uAv = w0 + w\ H \-wn, где wk= ^TuiAVj, wkeAk(L). i+j=k Простая проверка показывает, что для определенного так внешнего произведения выполняются все условия из определения алгебры. Это сразу вытекает из доказанных ранее свойств внешнего произведения х А у векторов х Е Лг(1_) и у е AJ(L). По определению, A0(L) = К, и число 1 (единица в поле К) является единицей внешней алгебры Л(1_). Определение. Конечномерная алгебра А называется градуированной, если задано разложение векторного пространства А в прямую сумму подпространств Ai с А: А = А0 0 А! 0 • • • 0 Ак (10.52) и выполняется следующее условие: для любых векторов х Е А; и у Е А^ произведение ху Е A^+j, если г + j ^ к, и ху = 0, если i + j > к. При этом само разложение (10.52) называется градуировкой. В этом случае dim A = dim Aq H Ь dim Ak, и, объединяя базисы подпространств Ai, мы получаем базис пространства А. Разложение (10.51) и определение внешнего произведения показывают, что внешняя алгебра Л(1_) является градуированной, если пространство L имеет конечную размерность п. Так как Лр(1_) = (0) при всех р > п, то п п dimA(L) - ^dimAP(L) = J2Cn = 2П' р=0 р=0 В любой градуированной алгебре А с градуировкой (10.52) элементы подпространства Ai называются однородными степени г, и для любого и Е А; пишут г — degu. Часто встречаются градуированные алгебры бесконечной размерности, в этом случае градуировка (10.52) содержит, вообще говоря, не конечное, а бесконечное число слагаемых. Например, в алгебре многочленов (пример 10.4) градуировка определяется разложением многочлена на однородные составляющие. Доказанное нами свойство (10.44) внешнего умножения показывает, что во внешней алгебре Л(1_) для любых однородных ее элементов и и v имеет место соотношение и A v — (— \)dv Л ix, где d = degu degv. (10.53)
10.4. Внешняя алгебра 369 Докажем, что для любого конечномерного векторного пространства L внешняя алгебра A(L) ассоциативна. Как мы заметили выше, свойство ассоциативности достаточно проверить для какого-либо базиса алгебры. Такой базис можно составить из ее однородных элементов и даже выбрать их разложимыми. Таким образом, мы можем положить элементы а, 6, с Е A(L) равными а = а\ Л • • • Л ар, Ь = Ь\ Л • • • Л bq, с = с\ Л • • • Л сг, и в этом случае на основании доказанных ранее свойств получаем а Л (6 Л с) = а\ Л • • • Л ар Л Ъ\ Л • • • Л bq Л с\ Л • • • Л сг = (а Л Ь) Л с. Ассоциативная градуированная алгебра, для любых двух однородных элементов которой выполнено соотношение (10.53), называется супералгеброй. Таким образом, внешняя алгебра Л(1_) любого конечномерного векторного пространства L является супералгеброй и представляет собой важнейший пример этого понятия. Вернемся теперь к внешней алгебре Л(1_) конечномерного векторного пространства L, выберем в ней удобный базис и найдем для него таблицу умножения. Зафиксируем в пространстве L произвольный базис е\,..., еп. Так как элементы (pi — вгг Л • • • Л eim для всевозможных наборов I = (ц,...,гт) из N™ образуют базис в пространстве Am(L), m > 0, то в силу разложения (10.51) базис в A(L) получается объединением базисов подпространств Am(L) при всех т = 1,...,п и базиса подпространства Л0(1_) = К, состоящего из одного ненулевого числа, например, 1. Значит, все такие элементы y>j, I e N^\ т— 1,...,п, вместе с 1 составляют базис внешней алгебры A(L). Так как внешнее произведение с 1 тривиально, то для того, чтобы составить таблицу умножения в построенном базисе, нам нужно найти внешние произведения Vi A (fj для всевозможных наборов индексов I e Nn и Je Nn при всех 1 ^p,q^n. Ввиду свойства 8 (с. 365), внешнее произведение (pj Л (pj равно Ч>1 Л 4>J = еч А • • • Л eip Л ej{ Л • • • Л ejq. (10.54) При этом имеются две возможности. Если наборы I и J содержат хотя бы один общий индекс, то, согласно следствию из свойства 3 (с. 360), произведение (10.54) равно нулю. Если же IП J = 0, то обозначим через К набор из fC+?, составленный из индексов, входящих в множество IU J, т. е., другими словами, К получается упорядочиванием по возрастанию набора (ц,... ,ip,ji,... ,jq). Тогда, как легко заметить, внешнее произведение (10.54) отличается от элемента (рк, К е Nn+<?, входящего в построенный выше базис внешней алгебры Л(1_), тем, что индексы набора I U J могут не быть расположены в порядке возрастания. Для того, чтобы получить из (10.54) элемент <рк, К е N^+g, нужно переставить местами индексы (гь ... ,гр, j\,... ,jq) таким образом, чтобы получившийся в результате набор был возрастающим. Тогда, по теоремам 2.7 и 2.8
370 Гл. 10. Внешнее произведение и внешняя алгебра из § 2.6 и свойству 3, согласно которому при перестановке местами любых двух векторов их внешнее произведение меняет знак, мы получим, что где число e(I,J) равно +1 и —1, в зависимости от четности или нечетности числа транспозиций, необходимых для перехода от набора (ij,... ,гр, j\,... ,jq) к набору К е N£4 В результате мы видим, что в построенном базисе внешней алгебры Л(1_) таблица умножения принимает следующий вид: ^/A(^j = 0, если IHJ^0, /1П,П (^/A^j = e(I, J)<pk> если /nJ = 0. § 10.5*. Приложения Определенное в предшествующем параграфе внешнее произведение х А у векторов х Е AP(L) и у Е Ag(L) позволяет во многих случаях дать простые доказательства встречавшихся нам ранее утверждений. Пример 10.5. Рассмотрим случай р — п, используя обозначения и результаты из предыдущего параграфа. Как мы видели, dimAp(L) = С£, следовательно, пространство Лп(1_) одномерно, и любой его ненулевой вектор задает в нем базис. Если е — такой вектор, то любой вектор пространства Лп(1_) может быть записан в виде ае с подходящим числом а. Таким образом, для любых п векторов х\,... ,хп пространства L мы получаем соотношение х\ Л • • • Л хп = а(х\,... ,хп)е, (10.56) где а(х\,... ,хп) — некоторая функция от п векторов, принимающая числовые значения из поля К. Ввиду свойств 1-3 (с. 359) эта функция является полилинейной и антисимметрической. Выберем в пространстве L некоторый базис е\,... ,еп и положим Xj, — %il ^1 i*'*i XinGji, Ъ — 1, ... , 77/. Выбор базиса определяет изоморфизм пространства L и пространства Кп строк длины п, при котором вектору xi соответствует строка (хц,... 9ХгП). Таким образом, а становится полилинейной и антисимметрической функцией от п строк с числовыми значениями. Согласно теореме 2.9 функция а(х\,..., хп) с точностью до некоторого числового сомножителя к(е) совпадает с определителем квадратной матрицы порядка п, составленной из координат дивекторов х\,... ,хп: a(xi,...,xn) = к(е) хп ••• х\7 Xfi (10.57) Произвол в выборе множителя к(е) в формуле (10.57) соответствует произволу в выборе базиса е в одномерном пространстве Лп(1_) (напомним, что базис ei,...,en в пространстве L зафиксирован).
10.5. Приложения 371 В частности, выберем в качестве базиса пространства An(L) вектор е = е\ Л---Леп. (10.58) Векторы ei,...,en линейно независимы, поэтому в силу свойства 4 (с. 360), вектор е отличен от нуля. Тогда мы, очевидно, получаем, что к(е) = 1. Действительно, так как коэффициент к(е) в формуле (10.57) один и тот же для всех наборов векторов х\,...,хп, то мы можем вычислить его, положив Xi = е$, г = 1,...,п. Сравнивая в этом случае формулы (10.56) и (10.58), мы видим, что а(е\,... ,еп) = 1. Подставляя это значение в соотношение (10.57) при Xi — ei, г — 1,... ,п, и замечая, что определитель в правой части (10.57) является определителем единичной матрицы, т.е. равен 1, приходим к выводу, что к(е) = 1. Следуя данным ранее определениям, мы можем сопоставить любому линейному преобразованию srf\ L —> L линейное преобразование Ап(^/): Лп(1_) —> An(L). Преобразование srf можно задать, указав, в какие векторы х\,...,хп оно переводит базис е\,...,еп пространства L, т.е. задать векторы ж* = «e^(ei), г = 1,... ,гг. Согласно лемме 2 (с. 361), имеет место равенство An(^)(ei Л • • • Л en) = ^(ei) Л • • • Л st{en) = = х\ Л • • • Л хп = а(х\,... ,хп) е. (10.59) С другой стороны, как мы знаем, все линейные преобразования одномерного пространства имеют вид х ь-> ах, где а — некоторое число, которое совпадает с определителем данного преобразования и не зависит от выбора базиса е в Лп(1_). Таким образом, мы получаем, что (Ап(^))(х) = ах, где число а равно определителю |(An(^))| и, очевидно, зависит только от самого преобразования я/, т.е. определяется набором векторов Xi = ^(е^), г=1,...,п. Нетрудно видеть, что это число а совпадает с определенной выше функцией а(х\,... ,хп). Действительно, выберем в пространстве Лп(1_) базис е = е\ Л • • • Л еп, тогда нужное нам равенство следует непосредственно из формулы (10.59). Далее, подставляя в (10.59) выражение (10.57) для а(х\,... ,жп), с учетом того, что к(е) = 1 и определитель в правой части (10.57) совпадает с определителем преобразования я/, мы получаем следующий результат: «fi/(ei) Л • • • Л я/(еп) = К| (в! Л • • • Л еп). (10.60) Это соотношение дает наиболее инвариантное определение определителя линейного преобразования из всех, ранее нам встречавшихся. Соотношение (10.60) было получено нами для произвольного базиса ei,...,en пространства L, т.е. для любых его п линейно независимых векторов. Но и для любых его п линейно зависимых векторов а\,...,ап оно также справедливо. Действительно, в этом случае векторы srf(a\),... ,«я^(ап), очевидно, тоже линейно зависимые, и, согласно свойству 4 из § 10.3, оба внешних произведения а\ Л • • • Л ап и stf{a\) Л • • • Л £?(ап) равны нулю. Таким образом, для любых п векторов а\,...,ап пространства L и любого линейного преобразования srf\ L —► L имеет место соотношение srf{a\) Л • • • Л srf(an) = \si\ {а\ Л • • • Л ап). (10.61)
372 Гл. 10. Внешнее произведение и внешняя алгебра В частности, если 9S\ L —> L — некоторое другое линейное преобразование, то формула (10.60) для преобразования S&stf\ L —> L дает аналогичное равенство (0§£/{е\) Л • • • Л 3Ss/{en)) = |<^/| (ei Л • • • Л еп). С другой стороны, из этой же формулы получаем, что {3B{sf{e{)) Л • • • Л т^{еп))) = \Щ (s/{e{) Л • • - Л я/{еп)) = = \3e\\st\{e\ Л---Леп). Отсюда следует, что \3Bst\ = \3&\ • |^|. Это почти «тавтологическое» доказательство теоремы 2.20 об определителе произведения квадратных матриц. Приведенные рассуждения приобретают более конкретный характер, если пространство L евклидово и ориентировано. Тогда в качестве базиса е\,..., еп в L мы можем выбрать ортонормированный и положительно ориентированный базис. В этом случае базис (10.58) в Лп(1_) определяется однозначно, т.е. не зависит от выбора базиса ei,...,en. Действительно, если е\,...,е'п — другой такой же базис в L, то, как мы знаем, существует такое линейное преобразование srf\ L —> L, что е[ = £/(в{), г = 1,...,п, а сверх того, преобразование я/ является ортогональным и собственным. Но тогда \я/\ = 1, и формула (10.60) показывает, что е\ Л • • • Л е1п = е\ Л • • • Л еп. Пример 10.6. Покажем, как из приведенных соображений вытекает доказательство формулы Бине-Коши, которая была сформулирована, но не доказана в § 2.9. Напомним, что там мы рассматривали произведение двух матриц В и Д первая из которых имеет тип (га,п), а вторая — тип (га, га), так что В А является квадратной матрицей порядка га. Нам нужно получить выражение для определителя \ВА\ через соответствующие миноры матриц В и А. Соответствующими называются такие миноры матриц В и А одинакового порядка, равного наименьшему из чисел п и га, которые стоят в столбцах (матрицы В) и строках (матрицы А) с одинаковыми номерами. Формула Бине-Коши утверждает, что определитель \ВА\ — 0, если п < га, и \ВА\ равен сумме попарных произведений соответствующих друг другу миноров порядка га, если п ^ га. Так как любая матрица является матрицей некоторого линейного преобразования векторных пространств соответствующих размерностей, мы можем сформулировать эту задачу как вопрос об определителе произведения линейных преобразований st\ М —>L и J: L —> М, где dimL = п и dimM = га. Здесь предполагается, что мы выбрали базис е\,...,ет в пространстве М и базис /i,...,/n в пространстве L таким образом, что преобразования я/ и 23 имеют в них матрицы А и В соответственно. Тогда SBsrf будет линейным преобразованием пространства М в себя с определителем \SS&t\ = \ВА\. Докажем сначала, что \ВА\ = 0, если п < га. Так как образ преобразования 3§я/{М) с 9В[У) и dim^(L) < dimL, то в рассматриваемом случае имеет место неравенство dim(<^/(M)) ^ dim^(L) ^ dimL = n<m = dimM,
10.5. Приложения 373 откуда следует, что образ преобразования 8%srf\ М —> М не совпадает со всем пространством М, т.е. преобразование Sesrf вырождено. Это и означает, что \Яя*\ -0, т.е. \ВА\ =0. Теперь рассмотрим случай, когда п ^ га. Используя леммы 1 и 2 из § 10.3 при р — га, мы получаем для векторов базиса е\,...,ет пространства М соотношение Am(<^0(ei Л • • • Л еш) - Ат(ЩАгп(^/)(е1 Л • • • Л ет) = = Ат(^)(^(е1)Л-'-Л£/(ет)). (10.62) Векторы srf(e\),... ,srf(em) содержатся в пространстве L размерности п, и их координаты в базисе /i,...,/n, будучи записанными в виде столбцов, образуют матрицу А преобразования srf\ M —> L. Запишем теперь координаты векторов £^(ei),...,«e^(em) в виде строк. При этом мы получим транспонированную матрицу А* типа (га,п). Применяя к векторам st/(ei),...,£/(em) формулу (10.22), мы получаем равенство */(ei)A---A*/(em) = ]T Micpj (10.63) ic"N5* с функциями <рх, определенными формулой (10.20). В выражении (10.63), согласно нашему определению, Mi — это минор матрицы А*, стоящий в ее столбцах с номерами ii,...,im. Очевидно, что такой минор Mi матрицы А* совпадает с минором матрицы А, стоящим в строках с теми же самыми номерами zi,...,zm. Таким образом, можно считать, что в сумме из правой части (10.63) Mi — это миноры порядка га матрицы А, соответствующие всем возможным упорядоченным наборам I — (гь... ,гт) номеров ее строк. Соотношения (10.62) и (10.63) вместе дают равенство Am(^0(ei Л • • • Л еш) = Ат(<%) ( ^ М1¥>Л . (10.64) Обозначим через Mi и Ni соответствующие миноры матриц А и В. Это значит, что минор Mi стоит в строках матрицы А с номерами I = (ц,... ,гш), а минор Ni — в столбцах матрицы В с теми же самыми номерами. Рассмотрим ограничение линейного преобразования 38\ L —> М на подпространство (fix* ••• >/гт)- По определению функций <£j получаем, что Ат(^)(¥>/)=^(Д)Л...Л^(/<т) = ЛГ1(е,Л---Лето). Отсюда с учетом формулы (10.64) следует соотношение Am(#*0(ei Л • • • Л ет) = Лт(^) ( ^ M^i) =
374 Гл. 10. Внешнее произведение и внешняя алгебра С другой стороны, согласно лемме 2 и формуле (10.60), имеем Am(&£f)(ei Л---Леш) = 3Ss/{e{) Л • • • Л 38&/{ет) = \Sesrf\(e\ Л---Лет). Два последних равенства дают нам соотношение \SBst\ = Yl MiN^ которое с учетом равенства \3§£/\ = \ВА\ совпадает с формулой Бине-Коши для случая n ^ га. Пример 10.7. Выведем формулу для определителя квадратной матрицы А, обобщающую известную формулу разложения определителя по j-му столбцу: |А| = a\jA\j + d2jA2j H Ь anjAnj, (10.65) где Aij — это алгебраическое дополнение элемента а^-, т. е. число (—1)г+^М^, и Mij — минор, получающийся вычеркиванием из матрицы А этого элемента вместе со строкой и столбцом, на пересечении которых он расположен. Обобщение состоит в том, что теперь мы запишем аналогичное разложение определителя не по одному столбцу, а по нескольким, расширив соответствующим образом понятие алгебраического дополнения. Рассмотрим некоторый набор I e N™, где га — натуральное число от 1 до п — 1. Обозначим через I набор, полученный из (1,... ,п) выбрасыванием всех индексов, входящих в I. Очевидно, что I e N™~m. Обозначим через \1\ сумму всех индексов, входящих в набор I, т. е. положим \1\ = ц -\ \- гш. Пусть А — произвольная квадратная матрица порядка п, I — (ii,...,im) и J = (j\,... ,jm) — два набора индексов из N™. Для минора Ми, стоящего в строках с номерами zi,...,im и столбцах с номерами j\,.-.,jm, назовем алгебраическим дополнением число Аы = (-l)lJl+|J|M__. (10.66) Легко видеть, что данное определение — это действительно обобщение введенного в гл. 2 понятия алгебраического дополнения одного элемента а^, для которого га = 1 и наборы I = (г), J — (j) состоят из одного единственного индекса. Теорема 10.5 (Лапласа). Определитель матрицы А равен сумме произведений всех миноров, стоящих в любых га заданных столбцах (или строках), на их алгебраические дополнения: \А\ = J2 м™Аи = Е миА™> JeN™ /ем™ при этом число га может быть любым от 1 до п — 1. Замечание. При га=1ига = п—1 теорема Лапласа дает формулу (10.65) разложения определителя по столбцу и аналогичную формулу разложения по строке. Однако лишь в общем случае можно обратить внимание на имеющуюся здесь симметрию между минорами порядка га и п — га.
10.5. Приложения 375 Доказательство. Заметим прежде всего, что так как при транспонировании матрицы ее строки превращаются в столбцы, а определитель не меняется, нам достаточно доказать только одно из приведенных равенств. Для определенности докажем первое — формулу разложения определителя \А\ по га столбцам. Рассмотрим векторное пространство L размерности п и произвольный базис ei,...,en в нем. Пусть srf\ L —> L — линейное преобразование, имеющее в этом базисе матрицу А. Применим к векторам этого базиса такую перестановку, в результате которой на первые га мест становятся векторы е^,..., eim, на оставшиеся п — т мест — векторы e;m+1,..., e^n. В полученном базисе определитель преобразования srf также будет равен \А\, так как определитель матрицы преобразования srf не зависит от выбора базиса. Применяя формулу (10.60), мы получим srf{eix) Л • • • Л srf{eirn) Л ^(eWl) Л • ■ • Л £?(ein) = = \А\ (ei{ Л • • • Л eim Л eWl Л • • • Л ein) = \А\ (срх Л <pj). (10.67) Вычислим левую часть соотношения (10.67), воспользовавшись формулой (10.22) в применении к двум различным группам векторов. Сначала положим а\ = ^(е^),... ,am = ^(e*m). Тогда из (10.22) мы получаем ^(eil)A.--A^(eim)= £ М™Ч>Л (Ю.68) где I = (гь... , гт), a J пробегает все наборы из множества N™. Теперь заменим в (10.22) число шнап-ти применим получившуюся формулу к векторам а\ = ^(e^m+1),... ,an_m = ^/(е^). В результате мы получим равенство ^(eirn+l)A...A^(ein)= £ Mljt<pj,, (10.69) J'^n-rn где J = (гт+ь... , гп), а J7 пробегает все наборы из множества N™-771. Подставляя выражения (10.68) и (10.69) в левую часть (10.67), мы получим равенство J2 Y, MiJM7j'<PJA<Pj' = \A\(<PiA(Pl)' (107°) JeN% JfeN^-rn Вычислим внешнее произведение срТ Л (fj, воспользовавшись найденной в конце предыдущего параграфа таблицей умножения (10.55) для р = га и q = rz_— га. В этом случае, очевидно, набор К, получающийся объединением I и I, равен (1,...,п), и нам нужно лишь вычислить число е(1,1) = ±1 в соответствии с четностью или нечетностью числа транспозиций, необходимых для перехода от (гь ... ,гт,гт+ь ••• Лп) к К = (1,... ,гг). Нетрудно видеть (используя, например, те же самые рассуждения, что и в § 2.6), что е(1,1) равно числу таких пар (г, г), £де г G J и г е J, для которых индексы гиг образуют инверсию, т.е. г > г. По определению, все индексы, меньшие гь
376 Гл. 10. Внешнее произведение и внешняя алгебра содержатся в/, и следовательно, они образуют инверсию с ц. Это дает нам г\ — 1 пар. Далее, с индексом г^ образуют инверсию все числа, меньшие %2 и входящие в I, т. е. все числа, меньшие гг, за исключением гь которое входит в J, а не I. Это дает г^ — 2 пар. Продолжая так до конца, мы получаем, что число образующих инверсию пар (г, г) равно (i\ — 1) + (гг — 2) + • • • + (гш — га), т. е. равно \1\ — /х, где /х = 1 + • • • + т = \т(т +1). Следовательно, окончательно мы получаем формулу (fi A(pj= (-l)'1'-^^:, где К = (!»••• >п)- Внешнее произведение <pj Л у^равно нулю при всех J и J7, за исключением лишь случая, когда J' = J, т. е. наборы 3 и J' не пересекаются, а дополняют друг друга. Согласно сказанному выше, (pj A(pj= (— l)'J'_AVic- Таким образом, из (10.70) мы имеем равенство ]Г М7Ж77(-1)И-^к = 1^(-1)т-^к- (Ю.71) Умножив обе части равенства (10.71) на число (—1)IJI+/X, с учетом очевидного тождества (— 1)2IJI — 1 окончательно получаем: £ M7JMJ7(-1)IJI+H = |A|, что с учетом определения (10.66) и дает нам требуемое равенство. Пример 10.8. Мы начали этот параграф с примера 10.5, в котором подробно исследовали пространство Лр(1_) при р = п. Рассмотрим теперь случай р = п— 1. Вследствие общего соотношения dimAp(L) = Сп мы получаем, что dimA^L) = га. Выбрав произвольный базис е\,...,еп в пространстве L, мы сопоставим каждому вектору z Е An-1(L) линейную функцию f(x) на L, определенную условием z А х = f(x)(e\ Л • • • Л еп), х G L. Для этого нужно вспомнить, что z Ах содержится в одномерном пространстве Лп(1_), а вектор е\Л---Леп определяет в нем базис. Линейность функции f{x) следует из доказанных ранее свойств внешнего произведения. Проверим, что построенное таким образом линейное преобразование является изоморфизмом. Так как dimAn_1(L) = dimL* = га, то для этого нам достаточно проверить, что ядро преобразования & равно (0). Как мы знаем, в качестве базиса пространства An-1(L) можно взять векторы ei{ Aei2 Л-'-Ле^,, гк е {1,...,га}, причем с точностью до перестановки набор (гь ••• Лп-\) — это все числа (1,...,га), за исключением одного. Значит, в качестве базиса An-1(L) могут быть взяты векторы щ = е\ А • • • Л e^_i Л ё* Л ei+i • • • Л еп, г — 1,...,га. (10.72)
10.5. Приложения 377 Очевидно, что щ Л ej = О, если г ф j, и щ Л е% — ±е\ Л • • • Л еп при всех г = 1,...,п. Предположим, что z Е An-1(L) — такой ненулевой вектор, что соответствующая ему линейная функция f(x) равна нулю для любого х Е L Положим z = z\u\ H + znun. Тогда из нашего предположения следует, что z Л х = 0 для всех ж Е L, и в частности, для векторов е\,..., еп. Отсюда, как легко видеть, вытекают равенства z\ — 0,...,zn = 0 и, таким образом, z — 0. Построенный изоморфизм ^": An_1(L) —► L* является уточнением уже встречавшегося нам ранее факта: плюккеровы координаты гиперплоскости могут быть любыми числами, в этой размерности соотношения Плюккера еще не возникают. Предположим теперь, что пространство L является евклидовым и ориентированным. Это, с одной стороны, определяет фиксированный базис (10.58) в An(L), если еь... ,еп — любой положительно ориентированный ортонорми- рованный базис в L, так что построенный выше изоморфизм &\ Лп-1(1_) —► L* определен однозначно. С другой стороны, для евклидова пространства определен стандартный изоморфизм L* ^ L, не использующий выбор какого-либо базиса в L (см. стр. 218). Комбинируя два эти изоморфизма, мы получим изоморфизм #: A^-^L) ^L, который сопоставляет элементу z e An_1(L) такой вектор х е L, что zAy = (x9 j/)(ei Л • • • Л еп) (10.73) для любого вектора у Е L и положительно ориентированного ортонормиро- ванного базиса ei,...,en, где (ж,у) означает скалярное произведение в евклидовом пространстве L. Рассмотрим этот изоморфизм подробнее. Мы видели выше, что векторы щ, определенные формулой (10.72), составляют базис пространства Лп-1(1_). Для описания построенного изоморфизма нам достаточно определить, какой вектор Ъ G L ставится в соответствие вектору а\ Л • • • Л an_i, щ Е L. Будем считать, что векторы ai,...,an_i линейно независимы, так как иначе вектор а\ Л • • • Л an_i = 0, и следовательно, ему соответствует вектор Ь = 0. С учетом формулы (10.73) это соответствие означает равенство (Ь, у)(е\ Л • • • Л еп) = ах Л • • • Л an_i Л у, (10.74) выполняющееся для всех у Е L. Так как вектор, стоящий в правой части (10.74), равен нулю, если у содержится в подпространстве Ц = {а\,... ,an_i), то мы можем считать, что Ь Е Lf. Теперь мы должны вспомнить об ориентации и считать пространства L и Ц ориентированными (легко убедиться, что ориентация пространства L не определяет никакой естественной ориентации его подпространства Ц, так что мы должны выбрать и зафиксировать ориентацию Ц отдельно). Тогда базис ei,...,en можно выбрать так, чтобы он был ортонормированным и положительно ориентированным, причем первые его п — 1 векторов еь ... ,en_i содержались в подпространстве Ц и тоже определяли в нем ортонормирован- ный и положительно ориентированный базис (этого всегда можно достичь, в случае необходимости заменив вектор еп на противоположный).
378 Гл. 10. Внешнее произведение и внешняя алгебра Так как вектор Ъ содержится в одномерном подпространстве Lf = (en), то Ь = /?еп. Используя предыдущие рассуждения, мы получаем, что а\ Л--- Aan_i = v(a\,... ,an_i)en, где v(a\,... ,an_i) — ориентированный объем параллелепипеда, натянутого на векторы а\,..., an_i (см. определение на с. 225). Это замечание определяет число /3. Действительно, положив в соотношении (10.74) вектор у = еп, с учетом того, что базис ei,...,en был выбран ортонормированным и положительно ориентированным (откуда, в частности, следует равенство v(e\ Л • • • Л еп) = 1), мы получаем соотношение fa = v(ai,...,an_i,en) = г>(аь ..., an_i). Таким образом, построенный выше изоморфизм & сопоставляет вектору ai Л---Лап_1 вектор Ъ = v(a\,... ,an_j)en, где еп — единичный вектор на прямой Lj-, выбранный с таким знаком, чтобы базис е\,...,еп пространства L был ортонормированным и положительно ориентированным. Как легко проверить, это равносильно требованию, чтобы базис ai,...,an_i,en был положительно ориентированным. Окончательный результат таков: Теорема 10.6. Для любого ориентированного евклидова пространства L изоморфизм сопоставляет вектору а\ Л • • • Л an_i вектор Ь е L, который ортогонален векторам а\,..., an_i и длина которого равна неориентированному объему V(ai,...,an_i), а точнее, Ь = У(аь...,ап_1)е, (10.75) где е е L — вектор единичной длины, ортогональный векторам а\,..., an_i ^ выбранный таким образом, чтобы базис aj,..., an_i, e был положительно ориентирован. Определенный соотношением (10.75) вектор Ъ называется векторным произведением векторов ai,...,an_i и обозначается [ai,... ,an_i]. В случае, когда п = 3, это определение дает нам векторное произведение двух векторов [аьаг], известное из аналитической геометрии.
Глава 11 КВАДРИКИ Мы встречались с разными типами пространств, состоящих из точек (аффинные, аффинные евклидовы, проективные). Для всех этих пространств важным и интересным вопросом является изучение содержащихся в них квадрик — множеств точек, координаты (xi,...,xn) которых в некоторой выбранной системе координат удовлетворяют одному уравнению F(xlf...,Xn)=0, (11.1) где F — многочлен второй степени от переменных х\,...,хп. Обратим внимание на то, что, согласно определению многочлена, в уравнении (11.1), вообще говоря, могут содержаться одночлены и второй степени, и первой, и постоянный член. Для каждого из пространств указанных выше типов очевидная проверка показывает, что свойство множества его точек быть квадрикой не зависит от выбора системы координат. Или, иначе говоря, невырожденное аффинное преобразование, движение или проективное преобразование (в зависимости от типа рассматриваемого пространства) переводит квадрику в квадрику. § 11.1. Квадрики в проективном пространстве Согласно данному выше определению квадрика Q в проективном пространстве Р(1_) задается уравнением (11.1) в однородных координатах. Однако, как мы видели в гл. 9, такое уравнение удовлетворяется однородными координатами точки проективного пространства P(L), только если его левая часть однородна. Определение. Квадрикой в проективном пространстве P(L) называется множество Q, состоящее из точек, определенных уравнением (11.1), где F — однородный многочлен второй степени, т. е. квадратичная форма от координат В § 6.2 было доказано, что в некоторой системе координат (т. е. базисе пространства L) уравнение (11.1) приводится к каноническому виду Ао^о + ^l^i H Ь ^r^r = 0> где все коэффициенты А; Ф 0. При этом число г ^ п равно рангу квадратичной формы F, и оно одно и то же для всех систем координат, в которых форма F приводится к каноническому виду. Дальше мы будем предполагать, что квадратичная форма F невырождена, то есть г = п. Соответствующую
380 Гл. 11. Квадрики квадрику Q мы также будем называть невырожденной. Канонический вид ее уравнения тогда записывается так: аох1 + а\х2{ Н V апх\ = 0, (Н-2) где все коэффициенты оц Ф 0. Общий случай отличается от (11.2) только отбрасыванием членов, содержащих Х{ с г = г + 1,... , п. Благодаря этому он легко сводится к случаю невырожденной квадрики. Ранее мы уже сталкивались с понятием касательного пространства к произвольной гладкой гиперповерхности (в гл. 7) или к проективному алгебраическому многообразию (в гл. 9). Теперь мы переходим к рассмотрению понятия касательного пространства к квадрике. Определение. Если А — точка квадрики Q, заданной уравнением (11.1), то касательным пространством к Q в точке А е Q называется проективное подпространство TaQ, определенное уравнением г=0 Касательное пространство — важное общематематическое понятие, и сейчас мы обсудим его в возможно большей общности. В рамках курса алгебры естественно ограничиться случаем, когда F — однородный многочлен произвольной степени к > 0. Тогда уравнение (11.1) определяет в пространстве P(L) некоторую гиперповерхность X, и если не все частные производные §~(А) равны нулю, уравнение (11.3) задает касательную гиперплоскость к гиперповерхности X в точке А. Мы видим, что в уравнении (11.3) слева стоит дифференциал <1aF{x) (cm. пример 3.31 на с. 139), а так как это понятие было определено инвариантно относительно выбора системы координат, то и понятие касательного пространства от него не зависит. Касательное пространство к гиперповерхности X в точке А обозначается ТаХ. Далее мы всегда будем предполагать, что квадрики рассматриваются в пространствах над полем К характеристики, отличной от 2 (например, для определенности можно считать, что поле К — это Ж или С). Если F{x) — квадратичная форма, то при сделанных предположениях мы можем записать ее в виде п F(x) = ^ ai3XiXV (ll-4) где коэффициенты о^ = а^. Иными словами, F(x) = (p(x,x), где п <р(х,у) = ^2 aiJXiVj О1'5) i,j=0 — CHMMefpH4eo^i билинейная форма (теорема 6.2). Если точка А соответствует вектору а с координатами (ao,ai,... ,an), то
//./. Квадрики в проективном пространстве 381 BF n 3=0 и следовательно, уравнение (11.3) принимает вид п / G'ijOLjXi — U, г,3=0 или, эквивалентно, (р(а,х) = 0. Так что в этом случае касательная гиперплоскость в точке А совпадает с ортогональным дополнением (а)1- к вектору a е L относительно билинейной формы (р(х,у). Определение касательного пространства (11.3) теряет смысл, если все производные EL(A)=09 г = 0,1,...,п. (11.6) dxi Точка А заданной уравнением (11.1) гиперповерхности X, в которой выполнены равенства (11.6), называется особой или критической. Если ни одна точка гиперповерхности не является особой, то гиперповерхность называется гладкой. Когда гиперповерхность X — квадрика, т. е. многочлен F — квадратичная форма (11.4), уравнения (11.6) приобретают вид Е< dijCtj =0, г = 0,1,..., п. 3=0 Так как точка А Е P(L), то не все ее координаты щ равны нулю. Таким образом, особые точки квадрики Q — это ненулевые решения системы уравнений Е- aijXj=0, г = 0,1,..., п. (Н-7) з=о Как было показано в гл. 2, такие решения существуют, только если определитель матрицы (flij) равен нулю, а это равносильно тому, что квадрика Q — вырожденная. Таким образом, невырожденная квадрика — это то же самое, что и гладкая. Выясним возможное взаимное расположение квадрики Q и прямой I в проективном пространстве P(L). Прежде всего, покажем, что прямая I либо имеет не более двух общих точек с квадрикой Q, либо целиком содержится в Q. Действительно, если прямая I не содержится целиком в Q, то можно выбрать точку А Е I, А £ Q. Пусть прямая I соответствует некоторой плоскости L' с L, т. е. I = P(L'). Если А— (а), то 1_; = (а, Ь), где вектор Ь Е L не коллинеарен вектору а. Иначе говоря, плоскость V состоит из всех векторов вида ха + уЬу где х и у — всевозможные числа. Точки пересечения прямой / и квадрики Q находятся из уравнения F(xa + yb) = 0, т. е. из уравнения F(xa + yb) = ср(ха + уЪ, ха + уЪ) = = F{a)x2 + 2<р(а, Ь)ху + F{b)y2 = 0 (11.8)
382 Гл. 11. Квадрики относительно неизвестных х, у. Векторы ха + уЬ с у = 0 дают нам точку A^Q. Предполагая, следовательно, что у ф О, положим t = х/у. Тогда (11.8) дает нам квадратное уравнение относительно переменной t: F(xa + уЪ) = y2(F(a)t2 + 2р(а, b)t + F(b)) = 0. Условие А £ Q имеет вид F{a) ф 0. Следовательно, старший коэффициент квадратного трехчлена F(a)t2 + 2ip(a, b)t + F(b) отличен от нуля, поэтому сам квадратный трехчлен не равен тождественно нулю и не может иметь более двух корней. Рассмотрим теперь взаимное расположение Q и I, если прямая I проходит через точку А Е Q. Тогда, как и в предыдущем случае, I соответствует решениям квадратного уравнения (11.8), в котором F(a) = 0, так как А е Q. Таким образом, мы получаем уравнение F(xa + yb) = 2^(а, Ъ)ху + F(b)y2 = y(2ip(a, Ъ)х + F{b)y) =0. (11.9) Одно решение уравнения (11.9) очевидно: у = 0, оно как раз и соответствует точке A G Q. Это решение единственно, если и только если <р(а, Ь) = 0, т. е. если Ъ G TaQ. В последнем случае, очевидно, I с 2aQ, и говорят, что прямая / касается квадрики Q в точке А. Таким образом, возможны следующие четыре случая взаимного расположения невырожденной квадрики Q и прямой I: 1) прямая I не имеет ни одной общей точки с квадрикой Q; 2) прямая / имеет ровно две различные общие точки с квадрикой Q; 3) прямая I имеет ровно одну общую точку А с квадрикой Q, это возможно тогда и только тогда, когда I с TaQ\ 4) прямая I целиком содержится в Q. Конечно, существуют и гладкие гиперповерхности, определенные уравнением (11.1) произвольной степени k ^ 1. Например, такова гиперповерхность, заданная уравнением cqXq + с\х\ + - • • + СпХ1^ = 0, где все а Ф 0. Дальше мы будем рассматривать только гладкие гиперповерхности. Для них левая часть уравнения (11.3) является ненулевой линейной формой на векторном пространстве L, и значит, определяет гиперплоскость в L и в P(L). Проверим, что эта гиперплоскость содержит точку А. Это значит, что если точка А соответствует вектору а = (ао,а\,... ,ап), то Если степень однородного многочлена F равна fc, то, согласно тождеству Эйлера (3.68), мы имеем равенство г=0 г 4=0 г 7 Значение F(A) равно нулю, так как точка А принадлежит гиперповерхности X, задаваемой уравнением F{A) = 0.
//./. Квадрики в проективном пространстве 383 Теперь для того, чтобы перейти к более привычной ситуации, рассмотрим аффинное подмножество в P(L), задаваемое условием хо Ф 0, и введем в нем неоднородные координаты yi=Xi/xQ, г=1,,..,ГС. (11.10) Предположим, что точка А содержится в этом подмножестве (т. е. ее координата с*о ф 0) и запишем уравнение (11.3) в координатах yi. Для этого нам нужно перейти от переменных хо,х\,... ,хп к переменным yi,...,yn и переписать соответствующим образом уравнение (11.3). При этом мы можем положить F(x0,xu...,xn) =xQf(yi,...,yn), (11.11) где Дуь... ,уп) — многочлен степени к > 1, уже не обязательно однородный (в отличие от F). В соответствии с формулой (11.10), обозначим через а\,... ,ап неоднородные координаты точки А, т. е. <Ч = OLi/a$, г = 1,... , п. Пользуясь общими правилами вычисления частных производных, из представления (11.11) с учетом (11.10) мы получаем формулы: dF i.jfe-w . „kshdf дУ1 = kxk0-lf + xk0Yl дх0 ° и ^ ^2// дх0 = H-'f+4±g(-^ = *xt'f-4-'±gy, г=1 "* " i=i Теперь найдем значения вычисленных выше производных функции F в точке А с неоднородными координатами ai,...,an. Значение F(A) = 0, так как точка А принадлежит гиперповерхности I и жо / 0. В силу представления (11.11), отсюда имеем /(аь... ,an) =0. Для краткости мы будем использовать обозначения /(А) = Даь... ,an) и Ш:(А) — Щт(а\,... ,an). Таким образом, из двух предыдущих соотношений получаем: (11.12) После подстановки выражений (11.12) в (11.3) с учетом (11.10) получаем уравнение: df <лл„ „ , S^f„k-ldf i=1 дУг ^° дУг п ао"1жо х; ^(л) (w - ai)=°- г=1
384 Гл. 11. Квадрики Сокращая ненулевой сомножитель о% 1хо, окончательно получаем: £|^(А)(К-сц)=0. (11.13) г=1 Это и есть уравнение касательной гиперплоскости ТаХ в неоднородных координатах. В анализе и геометрии оно записывается в виде (11.13) для функций / гораздо более общего класса, чем многочлены. Теперь мы можем вернуться к случаю, когда гиперповерхность X — Q — невырожденная (и, следовательно, гладкая) квадрика. Тогда для любой точки А е Q уравнение (11.3) определяет гиперплоскость в L, т.е. некоторую прямую в сопряженном пространстве L* и значит, точку, принадлежащую пространству Р(1_*), которую мы обозначим Ф(А). Таким образом мы определяем отображение Ф: Q-*P(L*). (11.14) Наша первая задача заключается в том, чтобы выяснить, что представляет собой множество Ф((2) С P(L*). Для этого мы представим квадратичную форму F(x) в виде F(x) = (p(x,x), где симметрическая билинейная форма (р(х,у) имеет вид (11.5). Согласно теореме 6.1, мы можем единственным образом записать <р(х,у) как (р(х,у) = (x,si(y)), где si: L —> L* — некоторое линейное преобразование. Из определений следует, что при этом радикал формы (р совпадает с ядром линейного преобразования si. Так как в случае невырожденной формы F радикал (р равен (0), то и ядро si тоже равно (0). Поскольку dimL = dimL*, то, по теореме 3.10, линейное преобразование si является изоморфизмом, и, таким образом, определено проективное преобразование F(si): P(L) -> P(L*). Выпишем теперь наше отображение (11.14) в координатах. Если квадратичная форма F(x) записана в виде (11.4), то dF n — = 2^aijXj, г = 0,1,...,п. 3=0 С другой стороны, в некотором базисе ео,е\,...,еп пространства L билинейная форма <р(х, у) имеет вид (11.5), где векторы х = жоео Н h xnen и у = уо^о + • • • + Уп^п- Отсюда следует, что матрица преобразования si: L —> L* в базисе ео, е\,... ,еп пространства L и взаимном ему бази- се /о»/ь---»/п пространства L* равна (а^). Следовательно, квадратичной форме F(x) соответствует изоморфизм si\ L —> L*, а построенное нами отображение (11.14) совпадает с ограничением проективного преобразования ¥(si): P(L) ^ P(L*) на Q, т. е. Ф(ф) = F(si)(Q). Из этого вытекает неожиданное следствие: так как преобразование F(si) взаимно однозначно, то преобразование (11.14) тоже взаимно однозначно. Другими словами, касательные гиперплоскости к невырожденной квадрике Q
//./. Квадрики в проективном пространстве 385 в разных точках A,BeQ различны. Таким образом, мы получили следующий результат. Лемма. Одна и та же гиперплоскость не может совпадать с касательными гиперплоскостями к невырожденной квадрике Q в двух различных точках. Это означает, что, записывая гиперплоскость пространства P(L) в виде TaQ, мы можем опускать точку А. И в случае невырожденной квадрики Q имеет смысл выражение гиперплоскость касается квадрики, при этом точка касания А е Q определяется однозначно. Выясним теперь конкретнее, что же представляет собой множество Ф(<2). Мы докажем, что оно тоже является невырожденной квадрикой, т. е. в некотором (а значит, и в любом) базисе пространства L* определяется уравнением q(x) = 0, где q — невырожденная квадратичная форма. Мы видели выше, что существует изоморфизм srf\ L ^ L*, который взаимно однозначно отображает Q на <&(Q). (Как и в случае произвольных отображений (стр. 12), функции на L и L* при отображении srf\ L ^ L* отображаются в противоположную сторону.) Следовательно, существует и обратное преобразование srf~x\ L* ^ L, также являющееся изоморфизмом. Тогда условие у е Ф(<2) равносильно тому, что srf~l(y) Е Q. Выберем произвольный базис U /i, -, /„ (П-15) в пространстве L*. Изоморфизм srf~x\ L* ^> L переводит этот базис в базис ^_1(/о). ^"'(/l). .... лГЧ/п) (11.16) пространства L. При этом, очевидно, координаты вектора я/~1(у) в базисе (11.16) совпадают с координатами вектора у в базисе (11.15). Как мы видели выше, условие srf~l{y) е Q равносильно соотношению F(ao,ab...,an)=0, (11.17) где F — невырожденная квадратичная форма, а (ао,а\9...,ап) — координаты вектора з/~1(у) в некотором базисе пространства L, например, в базисе (11.16). Значит, условие у е Ф(ф) выражается тем же соотношением (11.17). Тем самым, мы доказали следующее утверждение: Теорема 11.1. Если Q — невырожденная квадрика в пространстве P(L), то множество касательных к ней гиперплоскостей образует невырожденную квадрику в пространстве P(L*). Дословно повторяя рассуждения, приведенные в § 9.1, мы можем расширить сформулированный там проективный принцип двойственности. А именно, мы можем добавить к нему еще некоторые двойственные друг другу понятия, при перемене местами которых сохраняется общее утверждение, сформулированное на с. 325: 13 А. О. Ремизов, И. Р. Шафаревич
386 Гл. 11. Квадрики невырожденная квадрика в Р(1_) невырожденная квадрика в Р(!_*) точка содержится в гиперплоскость касается невырожденной квадрике невырожденной квадрики Это (казалось бы, небольшое) расширение принципа двойственности приводит к совершенно неожиданным результатам. В качестве примера мы приведем две известные теоремы, двойственные друг другу, т.е., на основании принципа двойственности, равносильные. Однако вторая из них была открыта на 150 лет позже первой. Эти теоремы относится к квадрикам в двумерном проективном пространстве, т. е. на проективной плоскости. В этом случае квадрика называется коникой1). Далее мы будем пользоваться следующей терминологией. Пусть Q — невырожденная коника и А\,... ,Aq — шесть различных принадлежащих ей точек. Этот упорядоченный (т. е. с учетом их порядка) набор точек называется шестиугольником, вписанным в конику Q. Для двух различных точек А и В проективной плоскости их проективная оболочка (т. е. проходящая через них прямая) обозначается через АВ (ср. с определением на с. 324). Шесть прямых А\А2, А2А3,..., A$Aq, AqA\ называются сторонами шестиугольника2). При этом противоположными называются следующие стороны: А\А2 и А4А5, А2АЪ и А5Ае, А3А4 и А6АХ. Теорема 11.2 (Паскаля). Пары противоположных сторон любого шестиугольника, вписанного в невырожденную конику, пересекаются в трех точках, принадлежащих одной прямой (рис. НА). Прежде чем формулировать теорему, двойственную к теореме Паскаля, сделаем некоторые комментарии. При выборе однородной системы координат (хо : х\ : х2) на проективной плоскости уравнение коники Q записывается в виде F(xo : х\ : х2) = а\ х0 + а2 хоХ\ + а% х^х2 + а\ х\ + а$ х\х2 + а§ х2 = 0. В правой части этого уравнения имеется шесть коэффициентов. Если мы имеем к точек А\,...,Аь, то условие их принадлежности конике Q сводится к соотношениям F(Ai) = 0, i= l,...,fc, (11.18) которые дают систему, состоящую из к линейных однородных уравнений для шести неизвестных a\,...,aQ. Нам нужно найти ненулевое решение этой системы. Если число к = 6, то этот вопрос подпадает, как частный случай, под следствие теоремы 2.2, (это и объясняет интерес к шестиугольникам, вписанным в коники). Согласно этому следствию, мы должны еще проверить, что определитель системы (11.18) при к = 6 равен нулю. Теорема Паскаля и дает геометрическую интерпретацию этого условия. О Разъяснение этого термина, т. е. объяснение того, причем здесь конус, будет дано несколько позже. 2) Здесь мы несколько отступаем от интуиции элементарной геометрии, где стороной называется не вся прямая, проходящая через две точки, а только соединяющий их отрезок. Это необходимо, если мы хотим охватить случай произвольного поля К, например, К = С.
//./. Квадрики в проективном пространстве 387 Нетрудно показать, что она дает необходимое и достаточное условие того, что шесть точек A\,...,Aq принадлежат некоторой конике, если мы ограничимся, во-первых, невырожденными кониками, и во-вторых, такими наборами шести точек, что никакие три точки из них не лежат на одной прямой (это доказывается в любом достаточно подробном курсе аналитической геометрии). Теперь сформулируем теорему, двойственную к теореме Паскаля. При этом шесть различных прямых Li,...,Lg, касательных к конике Q, будем называть шестиугольником, описанным вокруг этой коники. Точки L\ nl^, L<i П 1/з, 1/з П L±, I4 П Z/5, ^5 П 1/6 и Z/6 П I/i называются вершинами этого шестиугольника. При этом противоположными называются следующие вершины: L\ П Z/2 и L4 П 1/5, Z/2 П Ьз и ^5 П Lq, L^ Г) L4 и Lq П L\. Теорема 11.3 (Брианшона). Прямые, соединяющие противоположные вершины любого шестиугольника, описанного вокруг невырожденной коники, пересекаются в одной точке (рис. 11.2). Рис. 11.1. Шестиугольник, вписанный Рис. 11.2. Шестиугольник, описанный в конику вокруг коники Очевидно, что теорема Брианшона получается из теоремы Паскаля, если заменить в ней все понятия двойственными по указанным выше правилам. Таким образом, в силу общего принципа двойственности, теорема Брианшона следует из теоремы Паскаля. Сама же теорема Паскаля доказывается просто, но мы не будем приводить ее доказательство, так как его логика связана с другой областью — алгебраической геометрией1). Здесь интересно отметить только, что принцип двойственности позволяет получать из одних результатов другие, по виду совсем не похожие. Да теорема Паскаля и была им доказана в XVII в. (когда ему было 16 лет), а теорема Брианшона — в XIX в., более чем 150 лет спустя. Причем Брианшон использовал совсем другие соображения (общий принцип двойственности в то время еще не был ясен). О Это доказательство можно найти, например, в книге Р. Уокера «Алгебраические кривые» (М.: 1952, с. 78). 13*
388 Гл. 11. Квадрики § 11.2. Квадрики в комплексном проективном пространстве Теперь мы рассмотрим проективное пространство P(L), где L — комплексное векторное пространство, причем по-прежнему ограничимся случаем невырожденных квадрик. Как мы видели в § 6.3 (формула (6.27)), невырожденная квадратичная форма в комплексном пространстве имеет канонический вид Xq + х\ + • • • + х\. Значит, в некоторой системе координат уравнение невырожденной квадрики можно записать как х20 + х21 + -.-+х2п = 01 (11.19) т. е. всякая невырожденная квадрика может быть преобразована в квадрику (11.19) с помощью некоторого проективного преобразования. Иначе говоря, в комплексном проективном пространстве существует (с точностью до проективного преобразования) только одна невырожденная квадрика (11.19). Ее мы и будем сейчас исследовать. Ввиду сказанного выше нам достаточно исследовать какую-нибудь одну невырожденную квадрику в проективном пространстве P(L) заданной размерности. Например, мы можем выбрать квадрику, задаваемую уравнением F{x) = 0, где матрица квадратичной формы F{x) имеет вид (11.20) /0 0 • 0 0- 0 1 • \1 0 • • 0 1\ • 1 0 • 0 0 • 0 0/ Простое вычисление показывает, что определитель матрицы (11.20) равен +1 или —1, т.е. отличен от нуля. Основной вопрос, которым мы будем заниматься в этом и следующем параграфах — это исследование проективных подпространств, содержащихся в квадрике. Пусть квадрика Q задается уравнением F(x) = 0, где х Е L, а проективное подпространство имеет вид P(L'), где !_' — подпространство векторного пространства L. Тогда проективное подпространство P(L') содержится в Q, если и только если F(x) = 0 для всех векторов х Е L'. Определение. Подпространство L/ с L называется изотропным относительно квадратичной формы F, если F(x) — 0 для всех векторов х Е L'. Пусть (р — симметрическая билинейная форма, соответствующая квадратичной форме F, согласно теореме 6.2. Тогда в силу соотношения (6.13) мы видим, что (р(х,у) = 0 для всех векторов х,у е 1!. Поэтому мы будем также говорить, что подпространство L' с L изотропно относительно билинейной формы ср. С простейшим примером изотропных подпространств мы уже сталкивались в § 7.7 при исследовании псевдоевклидова пространства. Там встречались светоподобные (или, по-другому, изотропные) векторы, на которых задающая псевдоевклидово пространство квадратичная форма (ж2) обращается
11.2. Квадрики в комплексном проективном пространстве 389 в нуль. Каждый ненулевой светоподобный вектор е, очевидно, определяет одномерное изотропное подпространство (е). Основная техника, применяемая в этом и следующем параграфах, заключается в том, чтобы переформулировать наши вопросы о содержащихся в квадрике F{x) = 0 подпространствах в терминах векторного пространства L, заданной на нем симметрической билинейной формы (р(х,у), соответствующей квадратичной форме F(x), и изотропных относительно F и ц> подпространств. Тогда все решается почти тривиально на основании простейших свойств линейных и билинейных форм. Теорема 11.4. Размерность любого изотропного подпространства L;cL относительно любой невырожденной квадратичной формы F не превосходит половины dim L. Доказательство. Рассмотрим (L')-1 — ортогональное дополнение подпространства L' с L относительно билинейной формы (p(u,v), соответствующей F{x). Квадратичная форма F(x) и билинейная форма (p(u,v) невырождены. Следовательно, имеет место соотношение (7.75), откуда вытекает равенство dim(L/)± = dimL-dimL/. Так как пространство L7 изотропно, то U С (L/)x. Отсюда получаем неравенство dim L' < dim(L/)± = dim L - dim L', из которого следует, что dimL' ^ 1/2 dim L, как и утверждалось в теореме. Далее мы ограничимся исследованием изотропных подпространств максимальной возможной размерности 1/2 dim L (когда число dim L четно) и 1/2 (dim L — 1) (когда оно нечетно). Общий случай dimL/ < l/2dimL легко сводится к этому предельному случаю и рассматривается совершенно аналогично. Рассмотрим некоторые простейшие случаи, известные из аналитической геометрии. Пример 11.1. Самый простой случай — dimL = 2 и, соответственно, DimF(L) = 1. В координатах (xq : x\) квадратичная форма с матрицей (11.20) имеет вид xqx\. Очевидно, что квадрика xqx\ = 0 состоит из двух точек (0 : 1) и (1 : 0), соответствующих векторам е\ = (0,1) и е^ = (1,0) на плоскости L. Каждая из двух точек определяет изотропное подпространство Ц = (е*). Пример 11.2. Следующий по сложности случай — diml_ = 3 и, соответственно, DimP(L) = 2. Это квадрики на проективной плоскости, их точки определяют одномерные изотропные подпространства в L, которые, следовательно, образуют непрерывное семейство. (Если уравнение квадрики есть F(xo,x\,X2) = 0, то в пространстве L оно определяет квадратичный конус, образующие которого являются изотропными подпространствами). Пример 11.3. Следующий случай соответствует dimL = 4 и DimP(L) = 3. Это квадрики в трехмерном проективном пространстве. Для изотропных подпространств L'cL теорема 11.4 дает dimL/ ^ 2. Изотропные подпространства максимальной размерности получаются при dimL7 = 2, т.е. DimP(L;) = 1. Это проективные прямые, лежащие на квадрике. В координатах (хо : х\ : г/о : у\) квадратичная форма с матрицей (11.20) дает уравнение
390 Гл. 11. Квадрики ЩУ0 + Х\У\ =0. (П.21) Нам нужно найти все двумерные изотропные подпространства L7 с L. Пусть базис двумерного подпространства L' состоит из векторов е = (ао,аь&о>М и е' = (a^apb^bj). To, что L' изотропно, выражается, ввиду формулы (11.21), соотношением (а0и + af0v)(b0u + b'0v) + {a\u + a\v){b\u + b\v) = 0, (11.22) которое выполняется тождественно по и и v. Левая часть уравнения (11.22) представляет собой квадратичную форму от переменных и и v, которая может быть тождественно равна нулю лишь в том случае, когда все ее коэффициенты равны нулю. Раскрывая в (11.22) скобки, получаем: а0Ь0 + а\Ь\ = 0, а0Ь'0 + а'0Ъ0 + а\Ъ\ + а\Ь\ = 0, a^bf0 + a\b\ = 0. (11.23) Первое уравнение из (11.23) означает, что строки (ao,ai) и (&i,—Ьо) пропорциональны. Так как обе они не могут быть равны нулю одновременно (тогда все координаты базисного вектора е были бы равны нулю, что невозможно), то одна из них является произведением другой на некоторое (однозначно определенное) число /?. Для определенности положим ао = /?Ьь а\ = —(ЗЬо (случай Ь\ — /?ао, Ьо — ~Ра\ рассматривается аналогично). Точно так же из третьего уравнения (11.23) мы получаем, что а'0 = ф\, а\ = —7^0 с некоторым числом 7- Подставляя соотношения ао = /№ь ах = -/?Ь0, а'0 = ф\, а\ = -7&о (11.24) во второе уравнение (11.23), мы получаем равенство (/? — 7Х&0&1 ~~ ^o^i) — 0- Следовательно, либо b'Qb\ — Ъф\ = 0, либо 7 = 0- В первом случае из равенства b^bi — Ъф\ = 0 вытекает, что строки (Ьо, bf0) и (b\, bj) пропорциональны, и мы получаем соотношения Ъ\ = — abo и Ь\ = — ab'0 с некоторым числом а (случай Ьо — —аЪ\ и bf0 — —аЪ\ рассматривается аналогично). Предположим, что Ъ\ и Ь\ не равны нулю одновременно. Тогда а ф 0, и с учетом соотношений (11.24) мы получаем: a,QU + a'o v = aou + a'ov = /3b\u + jb^v = —a(/3bou + jbfQv) = ot(a\u + a[v), bou + b'ov = —a~ (6ii6 + b^). Во втором случае предположим, что ао и а\ не равны нулю одновременно. Тогда /3 ф 0, и с учетом соотношений (11.24) имеем: ао^ + а^ — aou + а^ = /3(bi-u + b\v), bou + b'ov = —fi~ {a\u + a\v). Таким образом, при сделанных предположениях для любого вектора подпространства L' с координатами (#o,yo»#b2/i) выполнены соотношения хо = ах\, y0 = -a~lyi (11.25) или хо = Ру\, уо = -(3~1хь (11.26) где а и /3 — некоторые отличные от нуля числа.
1L3. Изотропные подпространства 391 Для того, чтобы учесть исключенные случаи, когда а = 0 (Ь\ = Ъ\ = 0) или /3 = 0 (ао = а\ = 0), введем в рассмотрение точки (а : Ь) е Р1 и (с : d) e P1, т.е. пары чисел, которые не равны нулю одновременно и рассматриваются с точностью до умножения на одно и то же отличное от нуля число. Тогда, как легко проверить, однородная запись соотношений (11.25) и (11.26), включающая и отброшенные ранее случаи, будет иметь вид: ахъ = Ъх\, byo = -ayi (11.27) и с#о = dy\, dyo — —сх\ (11.28) соответственно. Действительно, равенство (11.25) получается из (11.27) при а = 1 и Ъ = a, a (11.26) получается из (11.28) при с = 1 и d = /3. Соотношения (11.27) задают изотропную плоскость V с L или же прямую P(L') в P(L), принадлежащую квадрике (11.21). Она определяется точкой (а : Ъ) е P1. Таким образом мы получаем одно семейство прямых. Аналогично, соотношения (11.28) определяют второе семейство прямых. Вместе они дают все прямые, содержащиеся в нашей квадрике (называемой од- нополостным гиперболоидом). Эти прямые называются прямолинейными образующими гиперболоида. Исходя из написанных формул, легко проверить известные из аналитической геометрии свойства: две разные прямые из одного семейства прямолинейных образующих не пересекаются, а две прямые из разных семейств пересекаются (в одной точке). Через любую точку гиперболоида проходит одна прямая каждого из двух семейств. Общий случай проективных подпространств максимальной возможной размерности на невырожденной квадрике произвольной размерности в комплексном проективном пространстве мы рассмотрим в следующем параграфе. § 11.3. Изотропные подпространства Пусть Q — невырожденная квадрика в комплексном проективном пространстве P(L), заданная уравнением F(x) = 0, где F(x) — невырожденная квадратичная форма на пространстве L. В соответствии со сказанным в предыдущем параграфе, мы будем исследовать m-мерные подпространства L7 с L, изотропные относительно F, предполагая, что dimL = 2m, если dimL четно, и dim L = 2т + 1, если dim L нечетно. Разобранные нами в предыдущем параграфе частные случаи показывают, что изотропные подпространства при различных значениях dimL выглядят по-разному. Так, при dim L = 3 мы нашли одно семейство изотропных подпространств, непрерывно параметризуемое точками квадрики Q. При dim L = 2 или 4 мы нашли два таких семейства. Это наводит на мысль, что число непрерывно параметризуемых семейств изотропных подпространств на квадрике зависит от четности или нечетности числа dim L. Как мы сейчас увидим, это действительно так. Случаи четной и нечетной размерности будут далее рассматриваться отдельно.
392 Гл. 11. Квадрики Случай 1. Предположим, что dimL = 2га. Следовательно, нас интересуют изотропные подпространства М с L размерности т. (Это самый интересный случай, так как здесь мы увидим, как обобщаются семейства прямых на од- нополостном гиперболоиде.) Теорема 11.5. Для любого т-мерного изотропного подпространства М с L существует другое т-мерное изотропное подпространство N с Ц такое, что L = M0N. (11.29) Доказательство основывается на индукции по числу т. При т — О утверждение теоремы справедливо (и бессодержательно). Предположим, что т > О, и рассмотрим произвольный ненулевой вектор е G М. Пусть <р(х,у) — билинейная форма, соответствующая квадратичной форме F(x). Так как подпространство М изотропно, то <р(е, е) = 0. В силу невырожденности F(x), билинейная форма (р(х,у) также невырождена, и следовательно, ее радикал равен (0). Тогда линейная функция (р(е,х) от вектора х Е L не равна тождественно нулю (иначе вектор е принадлежал бы радикалу ц>(х,у), который равен (0)). Пусть / G L — такой вектор, что ц>(е, /) Ф 0. Очевидно, что векторы е, / линейно независимы. Рассмотрим плоскость W = (е, /) и обозначим через у/ ограничение на нее билинейной формы (р. В базисе е, / матрица билинейной формы cpf имеет вид / 0 ¥>(е,/)\ Ф'= , ¥>(е,/)^0. We,/) ¥>(/,/)/ Очевидно, что |Ф;| = —<p(e,f)2 ф 0, следовательно, билинейная форма <р' невырождена. Определим вектор „ п У(/»/) ^ 2<р(е,/) Тогда, как легко проверить, (p(g,g) = 0, <р(е,д) = (p(e,f) /0 и векторы е,# линейно независимы, т.е. W = (е,д). В базисе е,д матрица билинейной формы у/ имеет вид / 0 <р(е,д)\ \^(е,») 0 / Вследствие невырожденности билинейной формы ip' по теореме 6.4 имеет место разложение L = W0Llf Li=Wj, (11.30) где diml_i — 2т — 2. Положим Mi = Ц П М и покажем, что Mi — подпространство размерности т— 1, изотропное относительно ограничения билинейной формы <р на Ц. По построению, подпространство Mi состоит из таких векторов х е М, что (р(х,е) = 0 и (р(х,д) = 0. Но первое равенство справедливо вообще для
11.3. Изотропные подпространства 393 всех х G М, так как е G М и М изотропно относительно у?. Таким образом, в определении подпространства Mi остается только второе равенство, означающее, что Mi с М определяется обращением в нуль линейной функции f(x) = (p(x,g), не равной тождественно нулю (так как /(e) = ip(e,g) Ф 0). Следовательно, dim Mi = dimM — 1 = га — 1. Таким образом, Mi является подпространством половинной размерности в пространстве Ц, определенном формулой (11.30), и мы можем применить к нему предположение индукции, получив разложение ц = Mi®Nb (11.31) где Ni с Li — некоторое другое (га — 1)-мерное изотропное подпространство. Заметим, что М = (е) © Mi и положим N = (g) © Ni. Так как подпространство Ni изотропно в Ц, то подпространство N изотропно в L, и с учетом того, что ц>(д,д) — 0, для всех векторов х G Nj имеет место равенство <р(д,х) = 0. Формулы (11.30) и (11.31) вместе дают разложение L = (е) ф (д) ф Mi © Ni = M © N, как и утверждалось теоремой. В обозначениях теоремы 11.5 любой вектор z G N определяет линейную функцию f(x) = (p{z,x) на векторном пространстве L, т.е. элемент сопряженного пространства L*. Ограничение этой функции на подпространство М с L является, очевидно, линейной функцией на М, т.е. элементом пространства М*. Тем самым, определено отображение &\ N —> М*. Тривиальная проверка показывает, что & — линейное преобразование. Устанавливаемое теоремой 11.5 разложение (11.29) имеет интересное следствие: Лемма 1. Построенное линейное преобразование 3?\ N —> М* является изоморфизмом. Доказательство. Найдем ядро преобразования &\ N —► М*. Предположим, что &(zo) = О для некоторого zq e N, т.е. (p(zo,y) = 0 для всех векторов у G М. Но согласно теореме 11.5, любой вектор х е L представляется в виде х — у + z, где у е М и z G N. Таким образом, <p(zo, x) = <p(zo, у) + ip(z0, z) = (p(z0, z) = 0, так как оба вектора z и zo принадлежат изотропному подпространству N. Из невырожденности билинейной формы <р тогда следует, что zq = 0, т. е. ядро & состоит из одного лишь нулевого вектора. Так как dimM = dimiV, то, по теореме 3.10, линейное преобразование & является изоморфизмом. Пусть ei,...,em — некоторый базис в М и /i,...,/m — взаимный ему базис в М*. Построенный нами изоморфизм & ставит ему в соответствие некоторый базис д\,... ,дт в пространстве N, по формуле ^{д^ = f{. Из устанавливаемого теоремой 11.5 разложения (11.29), следует, что векторы е\,..., em,ffi,... ,дт образуют базис в L. В этом базисе билинейная форма ц?
394 Гл. 11. Квадрики имеет наиболее простую матрицу Ф. Действительно, вспоминая определения использованных нами понятий, мы получаем, что ф=(£о)> (1L32) где Е и 0 — единичная и нулевая матрицы порядка га. Для соответствующей квадратичной формы F и вектора х = х\е\ -\ Ъ хтет + хш+\дх -\ \- Х2Шдт мы получаем, что F(x) = YlXiXm+i- (11.33) г=1 Наоборот, если в некотором базисе ei,...,e2m векторного пространства L билинейная форма <р имеет матрицу (11.32), то пространство L представимо в виде L = M0N, M = (еь...,ет), N = (ет+ь ... ,е2т), в согласии с теоремой 11.5. Напомним, что в нашем случае (в комплексном проективном пространстве) любые две невырожденные билинейные формы эквивалентны, поэтому любая невырожденная билинейная форма ср в некотором базисе имеет матрицу (11.32). В частности, мы видим, что в 2га-мерном пространстве L существует га-мерное изотропное подпространство М. Для того, чтобы обобщить на случай любого га результаты, известные из аналитической геометрии при т = 2 (см. пример 11.3), дадим несколько определений, естественным образом обобщающих знакомые нам из гл. 7 понятия для евклидовых пространств. Определение. Пусть <р(х,у) — невырожденная симметрическая билинейная форма в пространстве L произвольной размерности. Линейное преобразование °}/\ L —► L называется ортогональным относительно <р, если <p(W(x),W(y)) = <p(x,y) (11.34) для всех векторов х,у е L. Это определение обобщает понятия ортогонального преобразования евклидова пространства и лоренцева преобразования псевдоевклидова пространства. Аналогично, мы будем называть базис е\,...9еп пространства L ортонормированным относительно билинейной формы <р, если ^(e^e^) = 1 и (p(ei,ej) = 0 при всех г ф j. Каждое ортогональное преобразование переводит любой ортонормированный базис тоже в ортонормированный базис, и для любых двух ортонормированных базисов существует единственное ортогональное преобразование, переводящее первый из них во второй. Доказательства этих утверждений дословно совпадают с аналогичными утверждениями из § 7.2, так как там мы нигде не пользовались положительной определенностью билинейной формы (ж, у), а только ее невырожденностью. Условие (11.34) может быть выражено в матричной форме. Пусть в некотором базисе еь ..., еп пространства L билинейная форма ср имеет матрицу Ф.
11.3. Изотропные подпространства 395 Тогда преобразование Щ\ L —► L будет ортогональным относительно ср, если и только если его матрица U в этом базисе удовлетворяет соотношению СГФС/-Ф. (11.35) Это доказывается точно так же, как и аналогичное равенство (7.18) для ортогональных преобразований евклидовых пространств, и (7.18) является частным случаем формулы (11.35) при Ф = Е. Из формулы (11.35) следует, что \U*\ • |Ф| • \U\ = |Ф| и, с учетом невырожденности формы <р (|Ф| ф 0), что |J7*| • \U\ == 1, т.е. \U\2 = 1. Отсюда окончательно получаем равенство \U\ = ±1, в котором \U\ можно заменить на \<%/\, так как определитель линейного преобразования не зависит от выбора базиса в пространстве и, следовательно, совпадает с определитем матрицы этого преобразования. Равенство \^/\ = ±1 обобщает известное свойство ортогональных преобразований евклидова пространства и дает основание для аналогичного определения: Определение. Линейное преобразование $f: L —* L, ортогональное относительно симметрической билинейной формы </?, называется собственным, если |^| = 1, и несобственным, если |^| = — 1. Из теоремы 2.20 об определителе произведения матриц сразу следует, что собственные и несобственные преобразования умножаются так же, как числа +1 и —1. Аналогично, преобразование Щ~х относится к тому же типу (собственных или несобственных ортогональных преобразований), что и %. Введенные понятия применяются к теории изотропных подпространств на основании следующего результата. Теорема 11.6. Для любых двух т-мерных изотропных подпространств М и М' 2т-мерного пространства L существует ортогональное преобразование W: L —» L, переводящее одно из них в другое. Доказательство. Так как к каждому из подпространств М и М' применима теорема 11.5, то существуют такие m-мерные изотропные подпространства N и N', что L = М © N = М' © N'. Как мы заметили выше, из разложения L = М ф N следует, что в пространстве L существует базис е\,...,е2т, составленный из базисов подпространств М и N, в котором матрица билинейной формы (р равна (11.32). Второе разложение L — Мг ф N7 дает нам аналогичный базис е[,..., е'2т. Определим преобразование ^ действием на векторы базиса ei,...,e2m по формуле ^(вг) — е[ для всех г — 1,...,2га. Очевидно, что тогда образ ^/(М) = М'. Кроме того, для любых двух векторов х = х\в\ Н Ь #2me2m и У = У\е\ + • • • + У2гп^2гп их образы &(х) и &(у) имеют в базисе е^,..., е^ разложения с теми же координатами: %(х) = х\е\-\ Ь ^2т^2т И ^(у) — = yie\-\ Ь У2пг^2т- Отсюда следует равенство
396 Гл. 11. Квадрики 2т i=\ показывающее, что <%£ — ортогональное преобразование. Заметим, что теорема 11.6 не утверждает единственности такого преобразования У/. На самом деле, ее и нет. Рассмотрим этот вопрос подробнее. Пусть ^i и ^ - Два ортогональных преобразования, о которых идет речь в теореме 11.6. Применив к обеим частям равенства ^i(M) = %(М) преобразование ^_1, мы получим ^Ь(М) = М, где Щ> = ^-1% _ также ортогональное преобразование. Дальнейшие рассуждения основываются на следующем результате. Л е м м а 2. Пусть М — т-мерное изотропное подпространство 2т-мер- ного пространства L и %: L —► L — ортогональное преобразование, переводящее М в себя. Тогда преобразование % — собственное. Доказательство. По условию, М является инвариантным подпространством преобразования Щ>. Значит, в любом базисе пространства L, содержащем в качестве первых т векторов базис М, матрица преобразования %) имеет блочный вид Uo=[i с)' (1L36) где А, В, С — квадратные матрицы порядка га. Ортогональность преобразования % выражается соотношением (11.35), в котором, как мы видели, при выборе подхоядщего базиса можно считать выполненным соотношение (11.32). Подставляя в (11.35) вместо U матрицу (11.36), мы получаем А* 0 \ /О Е\ [А В\ _ /О Е В* С*) \Е 0J ' \0 С) ~\Е О Перемножение матриц в левой части этого равенства приводит его к виду (c*AADC) = {l о)' ™ D = C*B + B*C. Отсюда, в частности, получаем А*С = Е, и значит, |А*| • \С\ = 1. Но в силу |А*| = \А\ из (11.36) мы имеем \Uo\ = \А\ • \С\ = 1, что и утверждалось. Из леммы 2 вытекает важное следствие. Теорема 11.7. Если М и М' — два т-мерные изотропные подпространства 2т-мерного пространства L, то все ортогональные преобразования ^/\ L —> L, переводящее одно из них в другое, либо все собственные, либо все несобственные. Доказательство. Пусть 9/\ и % ~~ Два такие ортогональных преобразования, что %(М) = М7. Очевидно, что тогда ^_1(М') = М. Полагая % = ^~Х(ШЪ из равенства Щ(М) = %(М) мы получаем, что %(М) = М.
11.3. Изотропные подпространства 397 Согласно лемме 2 |^5| = 1, и из соотношения <й& = ^ %2 вытекает, что Теорема 11.7 очевидным образом определяет разбиение множества всех га-мерных изотропных подпространств М 2га-мерного пространства L на два семейства Ш\ и 2^2• А именно, М и М7 принадлежат одному семейству, если ортогональное преобразование <%£, переводящее одно из них в другое (всегда существующее, согласно теореме 11.6) является собственным (из теоремы 11.7 следует, что это определение не зависит от выбора конкретного преобразования W). Теперь мы легко можем доказать для любого т следующее свойство, установленное в предыдущем параграфе для т — 2: Теорема 11.8. Два т-мерные изотропные подпространства М и М7 2т-мерного пространства L принадлежат одному семейству ffli тогда и только тогда, когда размерность их пересечения МПМ' имеет ту же четность, что и га. Доказательство. Напомним, что натуральные числа кит имеют одну и ту же четность, если к + т — четно, или, иначе, если (— 1)/с+ш = 1. Вспомнив теперь определение разбиения множества m-мерных изотропных подпространств на семейства Ш\ и Ш?2 и обозначив к = dim(M П М7), мы можем сформулировать утверждение теоремы в виде соотношения \&\ = (-1)к+т, (11.37) где <%£ — любое ортогональное преобразование, переводящее М в М7, т. е. такое, что <2г(М) = М7. Доказательство соотношения (11.37) начнем со случая к = О, т.е. когда М П М7 = (0). Тогда в силу равенства dimM + dimM7 = dimL сумма подпространств М + М7 = М © М7 совпадает со всем пространством L. Это означает, что М7 обладает всеми свойствами изотропного подпространства N, построенного при доказательстве теоремы 11.5. В частности, существуют такие базисы еь... ,ет в М и /1?..., fm в М7, что (fie^fi) = 1 для г= 1,...,га, <p(ei9fj) =0 для i ф j. Определим преобразование $У: L —»• L условиями ^(е^) = f% и ^(/J = е^ для всех % = 1,...,т. Очевидно, что ^(М) — М7 и ^(М7) = М. Так же легко видеть, что в базисе еь ... ,ет,/1}..., fm матрицы преобразования 9/ и билинейной формы (р совпадают и имеют вид (11.32). Подставляя матрицу (11.32) вместо U и Ф в формулу (11.35), мы видим, что она превращается в верное равенство, т. е. преобразование ^/ ортогонально. С другой стороны, мы имеем, таким образом, равенство |^| = |Ф| = (— 1)т. То, что |Ф| = (— 1)т, легко понять, переставив строки матрицы (11.32) с номерами г и т + г для всех г = 1,...,га. При этом мы совершим т перестановок и получим единичную матрицу порядка 2т с определителем 1. В результате мы приходим к равенству |^| = (— 1)т, т.е. к соотношению (11.37) при к = 0. Теперь рассмотрим случай к > 0. Положим подпространство Mi = М П М7, тогда к = dim Mi. По теореме 11.5, существует такое ш-мерное изотропное подпространство N с L, что L = М © N. Выберем в подпространстве М базис
398 Гл. 11. Квадрики е\,...,ет так, что его первые к векторов ei,...,efc образуют базис в Mi. Тогда, очевидно, имеем разложение М = Mi 0M2, где Mi = (ei,...,efc), M2 = (efc+i,...,em>. Выше (см. лемму 1) мы построили изоморфизм &\ N ^ М* и с его помощью определили базис 9\,.,дш в пространстве N по формуле ^{gi) = /*, где /i,...,/m — базис в пространстве М*, взаимный базису ei,...,em. Очевидно, мы имеем разложение N - Ni ©N2, где Ni = (дх,...,дк), N2 = (ff*+i.->ffm>> причем, по нашему построению, J?: Ni ^ MJ и &: N2 ^ \А\. Рассмотрим линейное преобразование Щ: L —> L, определенное по формуле %(ei)=9i, %(9i) = ei при i=l,...,fc, ^Го(ег) = ег, ^b(flt)=&i ПРИ i = fc+l,...,ra. Очевидно, что преобразование ^Ь ортогонально, причем ^02 = <? и <%(Mi) = Nb ^b(M2) = M2, ^To(Ni) = Мь ^o(N2) = N2. (11.38) В построенном нами базисе е\,... ,em,^i,... ,дт пространства L матрица преобразования ^о имеет блочный вид Uo где Ek и E'm-fc — единичные матрицы порядка к и т — к. Как видно, Щ превращается в единичную матрицу после перестановки строк с номерами г и га + г, г = 1,... ,fc. Следовательно, |^&| = (— 1)*\ Докажем, что ^Ь(М;) П М — (0). Так как ^02 = <f, то это равносильно тому, что М' П ^Ь(М) = (О). Предположим, что х е М' П ^Ь(М). Из включения ж Е ^Ь(М) и разложения М = Mi © М2 с учетом (11.38) следует, что х е Ni ©M2, т.е. x = z{+y2i где zi e Nb y2 G M2. (11.39) Таким образом, для любого вектора у{ е Mi имеет место равенство <p(x,yi) = <p(zi,yl) + (p(y2,yi). (11.40) Левая часть равенства (11.40) равна нулю, так как х е М', у^ е М\ с М' и подпространство М' изотропно относительно (р. Второе слагаемое <^(y2,2/i) в правой части равно нулю, так как yi е М^ с М, г = 1,2, и подпространство М изотропно относительно </?. Таким образом, из соотношения (11.40) вытекает, что ¥>(*i,j/i) = 0 для любого вектора у\ £ М\. Последнее означает, что при изоморфизме &\ Ni ^ М* вектору z\ Е Ni соответствует линейная функция на Мь тождественно равная нулю. Но такое может быть только в том случае, когда сам вектор z\ = О. Таким образом, /о 0 Ek \° 0 &т—к 0 0 Ek 0 0 0 0 ^ 0 0 Ет-к )
11.3. Изотропные подпространства 399 в разложении (11.39) мы имеем z\ = О, и следовательно, вектор х = у2 содержится в подпространстве М2. С другой стороны, в силу включений М2 С М и х е М' П ^о(М) с учетом определения подпространства Mi = М П М' этот вектор содержится также и в Mi. В итоге мы получаем, что х е Mi П М2, а в силу разложения М = Mi 0 М2 это значит, что х — 0. Таким образом, подпространства %(М') и М относятся к уже разобранному нами случаю к = 0, и соотношение (11.37) для них доказано. По теореме 11.6, существует такое ортогональное преобразование ^: L —» L, для которого ^i(^b(M7)) = М. Тогда, как мы уже доказали, |^| = (— 1)ш. Ортогональное преобразование % = *%\Щ) переводит изотропное подпространство М' в М, и для него мы имеем соотношение \&\ = \%\ • \Щ = (-\)ш(-\)к = (-l)fc+m, что и доказывает теорему. Отметим два следствия теоремы 11.8. Следствие 1. Семейства Ш\ и Ш2 не имеют общего т-мерного изотропного подпространства. Доказательство. Предположим, что найдутся такие два m-мерные изотропные подпространства Mi е 9Л\ и М2 E Ш2, что Mi = M2. Тогда мы, очевидно, имеем равенство dim(Mi П М2) = m и, согласно теореме 11.8, Mi и М2 не могут принадлежать различным семействам Ш\ и Ш2. Следствие 2. Если два т-мерные изотропные подпространства пересекаются по подпространству размерности т — I, то они принадлежат разным семействам 9Л\ и Ш2. Это следует из того, что числа т и т — 1 имеют разную четность. Случай 2. Теперь мы можем перейти к рассмотрению второй ситуации, когда размерность пространства L нечетна. Он гораздо проще и сводится к уже разобранному случаю четной размерности. Для того, чтобы сохранить прежние обозначения, использовавшиеся нами в четномерном случае, обозначим через L исследуемое пространство нечетной размерности 2га + 1 и вложим его как гиперплоскость в пространство L размерности 2га+ 2. Обозначим через ^_невырожденную квадратичную форму на L и через F — ее ограничение на L. Дальнейшие рассуждения основаны на следующем факте. Л е м м а 3. Для любой невььрожденной квадратичной формьь F существует такая гиперплоскость L с Ц что квадратичная форма F невырождена. Доказательство. В комплексном проективном пространстве все невырожденные квадратичные формы эквивалентны, поэтому нужное утверждение достаточно доказать для какой-нибудь одной формы F. Возьмем в качестве F уже встречавшуюся нам ранее невырожденную форму (11.33) с заменой га на т+ 1. Таким образом, для вектора х е L с координатами (х\,... ,х2т+2) имеем
400 Гл. 11. Квадрики m+1 г=1 (11.41) Гиперплоскость L с L определим уравнением х\ = хт+2- Координатами в L являются наборы (#i,... ,xm+i,xm+2>#m+3> ••• >#2m+2)i где_ знак " означает пропуск стоящей под ним координаты, и квадратичная форма F в них имеет вид 771+1 F{x) =X2\ + ^2 Х^т+1+г- г=2 Матрица квадратичной формы (11.42) имеет блочный вид /10 ••• о\ о (11.42) V 0 Ф / где Ф — матрица из формулы (11.32). Так как определитель |Ф| ^ 0, то квадратичная форма (11.42) невырождена. Далее мы будем исследовать га-мерные подпространства М с L, изотропные относительно невырожденной_квадратичной формы F, которая является ограничением на гиперплоскость L невырожденной квадратичной формы F, заданной в объемлющем пространстве L. Так как в комплексном проективном пространстве L все невырожденные квадратичные формы эквивалентны, то все результаты будут справедливы для любой невырожденной квадратичной формы на L. Рассмотрим произвольное (га + 1_)-мерное подпространство М с L, изотропное относительно F, и положим _М = М П L. Очевидно, что подпространство М_с L изотропно относительно F. Так как в пространстве L гиперплоскость L определяется одним линейным уравнением, то или М с L (и тогда М =_М), или dim_M — dimM — 1 = га. Но первый случай невозможен, так как dimM ^ l/2diml_ =^_1/2(2га + 1), a dimM = ra+ 1. Таким образом, остается второй случай: dimM = га. Покажем, что такое сопоставление (га + ^-мерному изотропному подпространству М с L га-мерного изотропного подпространства М С L дает все интересующие нас подпространства М и в определенном смысле однозначно. Теорема 11.9. Для любого т-мерного подпространства М с Ц изотропного относительно F, существует такое (га +_1)-мерное_ подпространство М с Ц изотропное относительно F, что М = М П L. Причем в каждом из семейств Ш\ и !Я?2 изотропных относительно F подпространств такое М существует и единственно. Доказательство. Рассмотрим произвольное га-мерное подпространство М с L, изотропное относительно F и обозначим через М его ортогональное
11.3. Изотропные подпространства 401 дополнение относительно симметрической билинейной формы <р, соответствующей квадратичной форме F в объемлющем пространстве L. Согласно нашим прежним обозначениям оно должно было бы обозначаться М^, но мы будем опускать нижний индекс, так как билинейная форма ср будет всегда одна и та же. Из соотношения (7.75), справедливого для невырожденного (относительно формы р) пространства L и любого его подпространства (с. 270), следует, что dim М = dim L - dimM" = 2га + 2-га = га + 2. Обозначим через !р ограничение билинейной формы <р на М и через F — ограничение квадратичной формы F на М . Формы р и F, вообще говоря, вырождены. По определению (с. 203), радикал билинейной формы р равен М" П (М" )"L = М П М. Но так как М изотропно, то МсМ , и следовательно, радикал билинейной формы р совпадает с М. Согласно соотношению (6.17) из § 6.2 ранг билинейной формы р равен dimM -dim(M )± = dimM - dimM = (га + 2) - га = 2, и в подпространстве М можно выбрать базис ei,...,em+2 так, что его последние га векторов содержатся в М (т.е. в радикале р), а ограничение (р на (ei,e2/ имеет матрицу ( * q I . Таким образом, имеет место разложение М = (еь ег) © М, при этом ограничение квадратичной формы F на (еьег) в нашем базисе имеет вид х\Х2, а ограничение F на JV| тождественно равно нулю. Положим Ыг = М © (е$), г = 1,2. Тогда Mj и Мг - (ш+ 1)-мерные подпространства в L. Из построения следует^что М^ изотропны относительно билинейной формы р. При этом_ М* П L = М, так ка^, с одно^_стороны, из соображений размерности М* (jL L, с другой стороны, М с М; и М с L. Таким образом, мы построили два изотропных подпространства М^ С L, для которых Mi П L = М. То, что они принадлежат разным семействам -DDT;, и ни в одном из этих семейств нет других подпространств с такими свойствами, вытекает из следствия 2 теоремы 11.8. Итак, мы показали, что существует взаимно-однозначное соответствие между множеством m-мерных изотропных подпространств М с L и каждым из семейств ЯЛ* (га + 1)-мерных изотропных подпространств М с L. Этот факт выражают, говоря, что га-мерные подпространства М С L, изотропные относительно невырожденной квадратичной формы F, образуют одно семейство. Разумеется, наше разбиение множества изотропных подпространств на семейства условно, оно скорее является данью традиции, восходящей к частным случаям, рассматриваемым в аналитической геометрии. Однако этому разбиению можно придать более точный смысл, если воспользоваться описанием подпространств с помощью плюккеровых координат. В предыдущей главе мы показали, что А:-мерные подпространства М п-мер- ного пространства L находятся во взаимно-однозначном соответствии с точками некоторого проективного алгебраического многообразия G{k,n), называе-
402 Гл. 11. Квадрики мого грассманианом. Пусть на пространстве L задана невырожденная квадратичная форма F. Обозначим через I(k, п) подмножество точек грассманиана G(k,n), которые соответствуют fc-мерным изотропным подпространствам. Имеют место следующие утверждения, которые мы приведем без доказательства, так как они относятся не к линейной алгебре, а скорее к алгебраической геометрии1). Предложение 1. Множество Г (к, п) является проективным алгебраическим многообразием. Другими словами, утверждается, что свойство подпространства быть изотропным может быть описано некоторыми однородными соотношениями между его плюккеровыми координатами. Проективное алгебраическое многообразие X называется неприводимым, если оно не может быть представлено в виде объединения X — Х\ UX2, где Xi — проективные алгебраические многообразия, отличные от самого X. Пусть пространство L имеет нечетную размерность: п = 2т + 1. Предложение 2. Множество 1(т,2т + 1) является неприводимым проективным алгебраическим многообразием. Пусть пространство L имеет четную размерность: п = 2т. Обозначим через Гг(т,2т) подмножество проективного алгебраического многообразия /(га, 2т), точки которого соответствуют га-мерным изотропным подпространствам семейства DJli. Теорема 11.8 и ее следствия показывают, что /(га, 2га) = /i (га, 2га) U /2(га, 2га), Г\ (га, 2га) Г) h{m, 2га) = 0. Это подсказывает мысль, что проективное алгебраическое многообразие /(га, 2га) приводимо. Предложение 3. Оба множества /г (га, 2га) являются неприводимыми проективными алгебраическими многообразиями. Наконец, имеет место следующее утверждение, относящееся уже к изотропным подпространства не максимальной, а меньшей размерности: Предложение 4. Для любого к < п/2 проективное алгебраическое многообразие I{k, n) является неприводимым. § 11.4. Квадрики в вещественном проективном пространстве Рассмотрим проективное пространство P(L), где L — вещественное векторное пространство. Как и прежде, мы ограничимся случаем невырожденных квадрик. Как мы видели в § 6.3 (формула (6.28)), невырожденная квадратичная форма в вещественном пространстве имеет канонический вид х\ + х\ + • • • + х\ - x2s+l 4 = 0. (11.43) 1) Читатель может найти их, например, в книге В. Ходжа, Д. Пидо «Методы алгебраической геометрии» (М., 1954, том II, часть IV, §§1-5).
11.4. Квадрики в вещественном проективном пространстве 403 При этом индекс инерции г — s + 1 будет одним и тем же во всех системах координат, в которых квадрика задается каноническим уравнением. Умножая уравнение (11.43) на —1, мы, очевидно, не меняем определяемой им квадрики, поэтому можно считать, что 5+1 ^ п — s, т.е. s ^ (п — 1)/2. Сверх того, s ^ п, но в случае s = п из уравнения (11.43) получаем xq = 0, х\ = 0,... ,хп = 0, а такой точки в проективном пространстве нет. Таким образом, в отличие от комплексного проективного пространства, в вещественном проективном пространстве заданной размерности п существует (с точностью до проективного преобразования) не одна, а несколько невырожденных квадрик. Но все же их только конечное число, они соответствуют различным значениям s, причем можно предполагать, что ILzIo<n-l. (11-44) Конечно, нужно еще доказать, что квадрики, соответствующие различным значениям s, проективно не эквивалентны. Но мы рассмотрим этот вопрос (даже в более сложной ситуации) в следующем параграфе. Итак, число проективно неэквивалентных квадрик в вещественном проективном пространстве размерности п равно числу целых s, удовлетворяющих неравенству (11.44). Если п нечетно ип = 2т + 1, то неравенство (11.44) дает т ^ s ^ 2т, и число проективно неэквивалентных квадрик равно т + 1. Если же п четно и п = 2т, то их число равно т. В частности, при п = 2 на проективной плоскости все невырожденные квадрики проективно эквивалентны. Самый типичный пример — это окружность х2 + у2 = 1, целиком содержащаяся в аффинной части х<± ф 0, если в однородных координатах (xq : х\ : жг) уравнение записано как х$ + х\ — х\ = 0 (неоднородные координаты при этом выражаются по формуле х = #о/#2> У = #i/#2)« В трехмерном проективном пространстве существуют два типа проективно неэквивалентных квадрик. В однородных координатах (xq : х\ : Х2 : жз) один из них задается уравнением Xq + х\ + х\ — х\ = 0. Здесь всегда жз Ф 0, квадрика лежит в аффинной части, и задается в неоднородных координатах (ж, у, z) уравнением х2 + у2 + z2 = 1, где ж = жо/^з, ^ === ж1/жз> ^ = #2/#з- Эта квадрика — сфера. Второй тип задается уравнением Xq + х2 — х\ — х\ = 0. Это — однополостный гиперболоид. Их проективная неэквивалентность видна хотя бы из того, что на первой (сфере) не лежит ни одной вещественной прямой, а на второй (однополостном гиперболоиде) имеются два семейства, состоящие из бесконечного числа прямых — так называемых прямолинейных образующих. Конечно, мы можем вложить вещественное пространство L в комплексное пространство 1_с и аналогично, вложить Р(1_) в Р(1_с). Поэтому все, сказанное в § 11.3 об изотропных подпространствах, применимо и в нашем случае. Однако, хотя наша квадрика и вещественная, полученные таким образом изотропные подпространства могут оказаться комплексными. Единственным исключением является случай, когда число п нечетно и s = (п — 1)/2 или п четно и s = п/2.
404 Гл. 11. Квадрики В первом случае мы можем объединить координаты в пары (xi,xs+\+i) и положить щ = Х{ + х5+1+г и Vi = Xi — xs+\+i. Тогда с учетом равенств уравнение (11.43) запишется в виде щуо + щу\ Н h usvs = 0. (11.45) Но это случай квадрики (11.33), который мы рассматривали в предыдущем параграфе. Легко убедиться, что рассуждения из § 11.3 дают нам описание вещественных подпространств квадрики. Случай s = га/2 при четном га тоже не выводит нас из области вещественных подпространств и так же сводится к случаю, рассмотренному в предыдущем параграфе. Более того, если уравнение квадрики имеет вид (11.45) над произвольным полем К отличной от 2 характеристики, то рассуждения из предыдущего параграфа сохраняют свою силу. В общем случае можно все же указать размерности подпространств, содержащихся в квадрике. Для этого мы можем воспользоваться соображениями, уже применявшимися при доказательстве закона инерции (теорема 6.10 из § 6.3). Там мы заметили, что индекс инерции (в данном случае — индекс инерции квадратичной формы из (11.43), равный 5+1) совпадает с максимальной размерностью подпространств L', на которые ограничение формы положительно определено. (Заметим, что это условие дает геометрическую характеристику индекса инерции, то есть зависит только от множества решений уравнения F(x) = 0, а не от определяющей его формы F.) Действительно, пусть квадрика Q задана уравнением F(x) = 0. Если ограничение F' формы F на подпространство L' положительно определено, то очевидно, что Q nP(L') = 0. Таким образом, если мы имеем дело с проективным пространством P(L), где dimL = га + 1, то в L существует подпространство L размерности 5+1, ограничение формы F на которое положительно определено. Это значит, что QnP(L) = 0 (впрочем, такое подпространство L легко указать и непосредственно, исходя из уравнения (11.43)). Если же L' с L — такое подпространство, что P(L') с Q, то L' П L = (0). Отсюда, согласно следствию теоремы 3.16, получаем неравенство dimL + dimL7 ^ dimL = n-\- 1. Следовательно, dim L; + s+l < га + 1, и значит, dim L' ^ га — s. Таким образом, для пространства P(L'), принадлежащего квадрике, задаваемой уравнением (11.43), имеем dimL7 ^ га — s и, следовательно, DimP(L7) ^ га — s — 1. С другой стороны, легко указать подпространство размерности га — s — 1, действительно принадлежащее квадрике (11.43). Для этого объединим в пары неизвестные, входящие в уравнение (11.43) с разными знаками, и приравняем друг другу неизвестные в одной паре, например, xq = xs+i и т.д. Так как мы предположили, что s + 1 ^ га — 5, то мы можем образовать га — s таких пар и, следовательно, получим га — s линейных уравнений. Сколько еще останется неизвестных? Так как в пары мы объединили 2(га — s) неизвестных, а всего их число равно га + 1, то остается га + 1 — 2(га — s) неизвестных (может оказаться, что это число равно нулю). Таким образом мы получим (га — s) + га + 1 — 2 (га — s) = га + 1 — (га — s)
11.4. Квадрики в вещественном проективном пространстве 405 линейных уравнений на координаты в пространстве L. Так как во все уравнения входят разные неизвестные, то эти уравнения линейно независимы и определяют в L подпространство L' размерности п — s. Тогда DimP(L/) = п — s — 1. Конечно, так как L' с Q, то и любое подпространство P(L") с Р(1_/) при L" с 1_; содержится в Q. Таким образом, в квадрике Q содержатся подпространства любой размерности г ^ п — s — 1. Итак, мы доказали следующий результат: Теорема 11.10. Если невырожденная квадрика Q в вещественном проективном пространстве размерности п задается уравнением F(xo,...,xn) = 0 и индекс инерции квадратичной формы F равен 5+1, то в Q содержатся проективные подпространства только размерности г ^ п — s — 1, и для каждого такого числа г найдется содержащееся в Q проективное подпространство размерности г (при условии, что 5+1 ^ п — г, чего всегда можно добиться, не меняя квадрику Q, а лишь заменив задающую ее квадратичную форму F на —F). Мы уже рассматривали в качестве примера квадрики в трехмерном вещественном проективном пространстве (п = 3). Заметим, что в нем имеется всего две не пустые квадрики: при 5=1 и s = 2. При 5 = 2 уравнение (11.43) может быть записано в виде x% + x\ + xl = xl. (11.46) Как мы уже говорили, для точек вещественной квадрики имеем х% Ф 0. Значит, наша квадрика целиком содержится в этом аффинном подмножестве. Полагая х — хо/х%, у — х\/х%, z = x^jx^, мы запишем ее уравнение в виде x2 + y2 + z2 = 1. Это — привычная двумерная сфера S2 в трехмерном евклидовом пространстве. Выясним, какие прямые на ней лежат. Конечно, никакая вещественная прямая не сфере не лежит, так как на прямой имеются точки со сколь угодно большим расстоянием от центра сферы, а для всех точек сферы расстояние от ее центра равно 1. Поэтому речь может идти только о комплексных прямых пространства Р(1_с). Сделав в уравнении (11.46) замену х^ = гу, где г — мнимая единица, мы получим уравнение х$ + х\ — у2 — х\ = 0, которое в новых координатах щ = х0 + у, v0 = x0-y, и\=х\+хз, v\=x\-xs принимает вид г^о^о + ^i^i =0. (11.47) Мы исследовали такое уравнение в § 11.2 (см. пример 11.3). Как пример лежащей на данной квадрике прямой мы можем взять прямую, заданную уравнениями (11.25): щ = \и\, vo = — X~lv\ с любым комплексным числом Л ф 0. Вообще говоря, такая прямая не содержит ни одной вещественной точки нашей квадрики (т.е. точки, соответствующей вещественным значениям координат хо,...,хз). Действительно, если число Л не вещественно, то равенство щ = \щ противоречит тому, что щ и щ вещественны. Случай
406 Гл. 11. Квадрики щ = щ=0 соответствовал бы точке с координатами х\ = хз = 0, для которой Xq + x\ = 0, т. е. все Х{ = 0. Таким образом, на сфере лежит множество комплексных прямых, не содержащих ни одной вещественной ее точки. При желании их все можно было бы описать формулами (11.27) и (11.28) после произведенной нами выше замены координат. Однако интереснее комплексные прямые, лежащие на сфере и содержащие хотя бы одну ее вещественную точку. Для каждой такой прямой I, содержащей вещественную точку сферы Р, комплексно сопряженная прямая I (т. е. состоящая из точек Q, где Q пробегает прямую I) тоже принадлежит сфере и содержит точку Р. Но согласно теореме 11.8 через любую точку Р проходят ровно две прямые (хотя бы и комплексные). Мы видим, что через каждую точку сферы проходят ровно две комплексные прямые, причем они комплексно сопряжены друг другу. Наконец, случай s = 1 приводит к уравнению xl + x\-x\-xl = 0, (11.48) которое после замены координат Uo=Xo+X\, Vo = XQ-X\, U\=X2+X^n V\ = #2 ~ #3 также принимает вид (11.47). Для этого уравнения мы описали все содержащиеся в квадрике прямые формулами (11.27) и (11.28), при этом, очевидно, параметрам a, b,c,d в них следует придавать только вещественные значения. Полученная квадрика есть в данном случае однополостный гиперболоид, а прямые — его прямолинейные образующие (рис. 11.3). Рис. 11.3. Одно- Рис. 11.4. Тор полостный гиперболоид Представим себе, как выглядит такая поверхность, т. е. найдем более знакомое нам гомеоморфное ей множество. Для этого выберем по одной прямой в каждом семействе прямолинейных образующих: в первом — Zq> во втором — 1\. Как мы видели в § 9.4, каждая проективная прямая гомео- морфна окружности S1. С другой стороны, любая прямая второго семейства образующих однозначно определяется своей точкой пересечения с прямой /о» и аналогично, любая прямая первого семейства — своей точкой пересечения
11.5. Квадрики в вещественном аффинном пространстве 407 с прямой 1\. Наконец, через каждую точку поверхности проходят ровно две прямые: одна из первого, а другая — из второго семейства образующих. Таким образом устанавливается взаимно-однозначное соответствие между точками квадрики, заданной уравнением (11.48), и парами точек (ж, у), где ж Е 1о, у G /ь т. е. со множеством Sl x S1. Легко убедиться, что это взаимнооднозначное соответствие является гомеоморфизмом. Множество Sl x S1 называется тором, его проще всего представить себе как поверхность, полученную в результате вращения окружности вокруг оси, лежащей в той же плоскости, что и окружность, но ее не пересекающей (рис. 11.4). Такая поверхность похожа на поверхность баранки. В результате получается, что квадрика, заданная уравнением (11.48) в трехмерном вещественном проективном пространстве, гомеоморфна тору (рис. 11.4). § 11.5. Квадрики в вещественном аффинном пространстве Теперь мы переходим к исследованию квадрик в вещественном аффинном пространстве (V, L). Пусть в нем выбран некоторый репер (0;еь... , еп), тогда каждая точка А е V задается своими координатами (х\,... ,хп). Квадрикой называется совокупность всех точек А е V, для которых F(xb...,xn) = 0, (11.49) где F — некоторый многочлен второй степени. Теперь уже нет никаких оснований считать многочлен F однородным (как это было в случае проективного пространства). Собирая в F(x) члены второй, первой и нулевой степени, мы запишем его в виде F(x) = ф(х) + /(ж) + с, (11.50) где ф(х) — квадратичная форма, /(ж) — линейная форма, с — число. Получающиеся таким образом квадрики F(x) = 0 при п = 2 и 3 представляют собой кривые и поверхности второго порядка, рассматриваемые в курсе аналитической геометрии. Заметим, что при нашем определении квадрики как множества точек, удовлетворяющих соотношению (11.49), мы даже в простейших случаях п = 2 и 3 получаем такие множества, которые обычно не относятся к кривым или поверхностям второй степени. Те же «странные» примеры показывают, что мало похожие многочлены второй степени могут определять одну и ту же квадрику, т.е. множество решений уравнения (11.49). Например, в трехмерном вещественном пространстве с координатами х, у, z уравнение х2 + у2 + z2 + с = 0 вообще не выполняется ни при каких х, у, z, если с > 0, так что это уравнение при любом с > 0 определяет пустое множество. Другой пример — уравнение х2 + у2 = 0, которое удовлетворяется только при х — у — 0, но зато при любом z, т. е. определяет прямую — ось z. Но ту же прямую (ось z) определяет, например, уравнение ах2 + by2 = 0 при любых числах а и Ъ одного знака. Докажем, что если исключить подобные «патологические» случаи, то каждая квадрика определяется единственным уравнением, с точностью до нену-
408 Гл. 11. Квадрики левого постоянного множителя. При этом нам будет удобно считать пустое множество частным случаем аффинного подпространства. Теорема 11.11. Если квадрика Q не совпадает с множеством точек никакого аффинного подпространства и может быть задана двумя разными уравнениями F\{x) = 0 и 2*2(05) = 0, где Fi — многочлены второй степени, то F<i = XF\, где А — некоторое отличное от нуля вещественное число. Доказательство. Так как, согласно принятому условию, квадрика Q не пуста, то в ней содержится какая-нибудь точка А. Вследствие теоремы 8.2 существует еще одна точка В е Q, такая, что прямая I, проходящая через А и Б, не содержится целиком в Q. Выберем в аффинном пространстве V репер (0;еь..., еп), в котором точка О — А и вектор е\ = АВ. Прямая, проходящая через точки А и В, состоит из точек с координатами (х\,0,... ,0) при всевозможных вещественных значениях х\. Запишем определяющее нашу квадрику уравнение Fi(x) = 0, расположив члены по степеням х\. В результате мы получим уравнения Fi(x\,...,xn) = dix\ + fi(x2,..4Xn)xi +il>i(x2,.~,xn) = 0, i = 1,2, где fi(x2,'..,xn) и ipi(x2,.'.,xn) — неоднородные многочлены первой ^второй степени от_переменных Х2,-..,хп. Обозначив /$((),... ,0) = /г (О) и ^г(0,... ,0) = ^г(О), мы можем сказать, что соотношение агх\ + и{0)хх+фг(0) = 0 (11.51) верно при х\ — 0 (точка А) и при х\ = 1 (точка Б), но не выполняется тождественно для всех вещественных значений х\. Отсюда следует фг(0) = 0 и &i + fi{0) = 0. Значит, ai ф 0, иначе мы получили бы, что соотношение (11.51) выполнялось бы для всех х\. Умножив многочлен Fi на а^1, мы можем считать, что а^ = 1. Обозначим через х проекцию вектора х на подпространство (е2,...,еп) параллельно подпространству (ei), т.е. х = (х2,---,хп). Тогда мы можем сказать, что два уравнения x2l+fl(x)xi+il>l(x) = 0 и 3% + f2(x)xl+il>2(x) = 0, (11.52) где /г(ж) — многочлены первой и фг(х) — многочлены второй степени от вектора ж, имеют одинаковые решения. Кроме того, мы знаем, что они оба имеют при х = 0 два решения: х\ = 0 и х\ = 1, т. е. дискриминант каждого квадратного трехчлена Рг(х{) = х\ + fi(x)xi +ipi(x), г = 1,2, с коэффициентами, зависящими от вектора ж, при х = 0 положителен. Коэффициенты трехчлена pi(x\) представляют собой многочлены от переменных Х2,--,хп — координат вектора х. Следовательно, дискриминант трехчлена Рг(х\) — тоже многочлен от переменных Х2,---,хп и поэтому он зависит от них непрерывно. Как следует из определения непрерывности, существует такое число г > 0, что дискриминант каждого трехчлена Ръ(х\) положителен
11.5. Квадрики в вещественном аффинном пространстве 409 при всех ж, для которых \х2\ < £,..., \хп\ < е. Это условие можно кратко записать в виде одного неравенства |ж| < е, предполагая, что пространство векторов ж любым способом превращено в евклидово пространство, в котором определена длина вектора |ж|. Например, ее можно определить соотношением Таким образом, квадратные трехчлены р%{х\) со старшим коэффициентом 1 и коэффициентами fi(x) и ф^х), непрерывно зависящими от ж, имеют по два корня при всех |ж| < е. Но как известно из элементарной алгебры, такие трехчлены совпадают. Следовательно, f\(x) = /2(ж) и яр\(х) = ^2(ж) при всех |ж| < е. Отсюда, на основании следующей леммы, мы получим, что эти равенства выполняются не только при \х\ < е, но и вообще для всех векторов ж. Лемма. Если для некоторого числа е > 0 многочлены /(ж) и д(х) совпадают при всех х с условием \х\ < е, то они совпадают тождественно вообще при всех ж. Доказательство. Представим каждый из многочленов /(ж) и д(х) как сумму однородных: N N /(*) = £>(*), 9(х) = Y,9k{x). (11.53) fc=0 k=0 Положим ж = от/, где |у| < е и число а е [0,1]. Тогда, очевидно, условие |ж| < е выполнено, и значит, /(ж) = #(ж). Подставляя ж = от/ в равенство (11.53), получаем Е^Л(») = ^аЧ(!/)- (П.54) /с=0 jfe=0 С одной стороны, равенство (11.54) справедливо для всех чисел а е [0,1], которых бесконечно много. С другой стороны, (11.54) представляет собой равенство двух многочленов от переменной а. Как известно, многочлены от одного переменного, принимающие равные значения при бесконечном числе значений переменного, совпадают тождественно, т. е. имеют одинаковые коэффициенты. Поэтому мы получаем равенства fk(y) = 9k(y) Для всех к = 0,..., N и всех у, для которых \у\ < е. Но так как многочлены /к^9к~ однородные, то отсюда следует, что эти равенства справедливы вообще для всех у. Действительно, любой вектор у мы можем представить в виде у = az с некоторым числом а и вектором z, для которого \z\ < е. Например, достаточно положить а = (2/е)\у\ . Следовательно, будем иметь Д(^) = дк(Ю- Но умножая обе части этого равенства на ак и пользуясь однородностью Д и дк, мы получаем равенство fk(az) = gk{a~z), т.е. fk(y) = gk(y), что и требовалось доказать. Заметим, что тот же вопрос об однозначности соответствия квадрик и задающих их уравнений мы должны были бы поставить и относительно квадрик в проективном пространстве. Но в проективном пространстве задаю-
410 Гл. 11. Квадрики щий квадрику многочлен однороден, и этот вопрос решается еще проще. Для того, чтобы не повторяться, мы рассмотрели его в более сложной ситуации. Теперь мы исследуем вопрос, который уже рассматривался в курсе аналитической геометрии для пространств размерности 2 и 3: к какому простейшему виду можно привести уравнение (11.49) за счет выбора подходящего репера в аффинном пространстве произвольной размерности п. Этот вопрос эквивалентен следующему: при каких условиях две квадрики могут быть переведены друг в друга с помощью невырожденного аффинного преобразования. Мы будем рассматривать квадрики в аффинном пространстве (V, L) размерности п, предполагая, что для меньших значений п эта задача уже решена. В связи с этим мы не будем рассматривать квадрики, являющиеся цилиндрами, т. е. имеющие вид Q = h-l(Q'), где (h, srf) — аффинное преобразование пространства (V, L) в аффинное пространство (V, L7) размерности т < п и Qf — некоторое подмножество V. Убедимся, что в этом случае Q' является квадрикой в V'. Пусть квадрика Q в системе координат, соответствующей некоторому реперу аффинного пространства V, определяется уравнением второй степени F(x\,... ,хп) = 0. Выберем в га-мерном аффинном пространстве V некоторый репер (Of;e\,... , e^J, тогда е\,...,е'т — базис в векторном пространстве L/. В определение цилиндра входит условие ^(L) = L'. Обозначим через ei,...,em такие векторы е^ Е L, что ^(e^) = ej, г = l,...,m, и рассмотрим натянутое на них подпространство М — (ei,...,em). Согласно следствию теоремы 3.4 существует такое подпространство N с L, что L = М © N. Пусть О G V — любая точка, для которой h(0) = О'. Тогда в системе координат, соответствующей реперу (Of',e'l9...,e'm), проектирование пространства L на М параллельно подпространству N и соответствующее проектирование h аффинного пространства V на V задаются условием: ll\X\, ... , Хп) = уХ^, ... , Хгп), где х\ — координаты относительно репера (0,;e'l,...,efm). To, что Q — квадрика, означает, что ее уравнение второй степени F(x\,...,xn) = 0 выполняется, какие бы значения вместо переменных жт+1,...,жп мы ни подставили, если точка с координатами (х\,...,хт) принадлежит множеству Q'. Например, мы можем положить хш+\ = 0,... ,хп = 0, тогда уравнение F{x\,..., х'п, 0,..., 0) =0 и будет уравнением квадрики Q'. То же рассуждение показывает, что если многочлен F зависит от менее чем п неизвестных, то квадрика Q, определенная уравнением F{x) = 0, является цилиндром. Поэтому далее мы будем рассматривать только квадрики, не являющиеся цилиндрами. Нашей целью является их классификация с помощью невырожденных аффинных преобразований. Две квадрики, которые могут быть переведены друг в друга таким преобразованием, называются аффинно эквивалентными.
11.5. Квадрики в вещественном аффинном пространстве 411 Прежде всего, мы рассмотрим действие сдвига на уравнение квадрики. Пусть уравнение квадрики Q в координатах, соответствующих некоторому реперу (0;еь ... ,еп), имеет вид F(x) = ф{х) + Дж) + с = О, (11.55) где ф(х) — квадратичная форма, /(ж) — линейная форма, с — число. Если &а — сдвиг на вектор а £ L, то квадрика &a(Q) задается уравнением ф(х + а) + Дж + а) + с = 0. Посмотрим, как при этом изменяется уравнение квадрики. Пусть (р(х,у) — симметрическая билинейная форма, соответствующая квадратичной форме ф(х), т.е. ф(х) = (р(х,х). Тогда ф(х + а) = (р(х + о, ж + а) = (р(х, х) + 2ср(х, а) + <р(а, а) = = ф(х) + 2<р(х, а) + ф(а). В результате получаем, что после сдвига &а\ а) Квадратичная часть ф(х) не изменяется. б) Линейная часть /(ж) заменяется на /(ж) + 2<^(ж,а). в) Свободный член с заменяется на с + /(а) + ф(а). Пользуясь утверждением б), при помощи сдвига 2Га в уравнении квадрики иногда можно уничтожить члены первой степени. Точнее говоря, это возможно, если существует такой вектор а е L, что f(x) = -2<p(x,a) (11.56) для любого ж G L. Согласно теореме 6.1 любую билинейную форму (р(х,у) можно представить в виде (р(х,у) — (х,я/(у)) с некоторым линейным преобразованием srf: L —► L*. Тогда условие (11.56) записывается в виде (ж,/) = —2(х,£/(а)) для любого ж е L, т.е. в виде / = -2^/(а) = srf(—2a). Значит, условие (11.56) состоит в том, что линейная функция / е L* содержится в образе преобразования stf. Прежде всего, исследуем те квадрики, для которых выполняется условие (11.56). В этом случае существует такой репер аффинного пространства, в котором квадрика задается уравнением F(x)=il>(x) + c = 0. (11.57) Это уравнение обладает замечательной симметрией: оно сохраняется при замене вектора ж на —ж. Исследуем его подробнее. Определение. Пусть V — аффинное пространство и А — некоторая его точка. Центральной симметрией относительно точки А называется отображение V —> V, сопоставляющее каждой точке В eV такую точку В1 е V, что АВ' = -АВ. Очевидно, что этим условием точка В', а следовательно, и такое отображение определяется однозначно. Тривиальная проверка показывает, что это
412 Гл. 11. Квадрики отображение является аффинным преобразованием и его линейная часть равна —<§. Определение. Множество Q с V называется центрально- симметричным относительно точки А Е V, если оно сохраняется при центральной симметрии относительно точки А, которая в этом случае называется центром множества Q. Из определения следует, что принадлежащая квадрике точка А является ее центром тогда и только тогда, когда квадрика переводится в себя линейным преобразованием —<§, т. е. х н-» —ж, где х — АХ для каждой точки X этой квадрики. Теорема 11.12. Если квадрика не совпадает с аффинным подпространством, не является цилиндром и обладает центром, то он — единственный. Доказательство. Пусть А и В — две различные центра квадрики Q. Это, по определению, значит, что для любой точки X е Q существует такая точка X' € Q, что > АХ = -АХ', (11.58) и для любой точки Y G Q существует такая точка Y' e Q, что BY = -BY'. (11.59) Применим соотношение (11.58) к произвольной точке X е Q, а соотношение (11.59) — к соответствующей ей точке X' = Y. Обозначим точку Y7, которая получается в результате этих действий, через Xм. Очевидно, что XX" = ХА + АВ + ВХ", (11.60) а из соотношений (11.58) и (11.59) следует, что ХА = АХ' и ВХ" = Х'В. Подставляя последние выражения в (11.60), мы получим, что XX" = 2АВ. Иначе говоря, это значит, что если вектор е = 2АВ, то квадрика Q сохраняется при сдвиге 3?е (рис. 11.5). Это утверждение также вытекает из рассмотрения подобных треугольников АВХ' и XX"X1 на рис. 11.5. Так как А ф Б, то вектор е ф 0. Выберем произвольный репер (0;еь... ,еп), где е\ = е. Положим L' = (е2,...,еп) и рассмотрим аффинное пространство V1 = (L;, L') и отображение h: V —> V, определенное условиями: h(0) = О, h(A) = О, если О А = Ле, и Л(А») = е$, если OAi = ei (г = 2,... ,п). Очевидно, что отобра- Подобные треуголь- жение /г — проектирование и множество Q — ники цилиндр. Так как по нашему условию, квадрика Q не является цилиндром, то таким образом мы приходим к противоречию.
11.5. Квадрики в вещественном аффинном пространстве 413 Итак, мы получаем, что, выбирая систему координат с началом в центре квадрики, любую квадрику, удовлетворяющую условиям теоремы 11.12, можно определить уравнением ф{х\,...,хп) = с, (11.61) где ф — невырожденная квадратичная форма (в случае вырожденной формы ф квадрика была бы цилиндром). Если с ф 0, то можно считать с = 1, умножив обе части равенства (11.61) на с-1. Наконец, можно сделать линейное преобразование, сохраняющее начало координат и приводящее квадратичную форму ф к каноническому виду (6.22). В результате уравнение квадрики приобретает вид x\ + ---+x2r- х2+1 х2п = с, (11.62) где с = О или 1, число г — индекс инерции квадратичной формы ф. Если с = 0 и г = 0 или г = п, то отсюда следует, что х\ = О,...,хп = О, т.е. квадрика состоит из одной точки — начала координат, что противоречит сделанному выше предположению, что она не совпадает ни с одним аффинным подпространством. Так же при с = 1 и г = 0 мы получаем, что —х\ — • • • — х^ = 1, а это невозможно при вещественных хь ... ,хп, так что квадрика состоит из пустого множества, что опять противоречит условию. Таким образом, нами доказано следующее утверждение: Теорема 11.13. Если квадрика не совпадает с аффинным подпространством, не является цилиндром и обладает центром, то в некоторой системе координат она задается уравнением (11.62). При этом О < г ^ п, а если с = 0, то г < п. В случае, когда с = О, можно за счет умножения уравнения квадрики на —1 добиться того, чтобы в (11.62) число положительных слагаемых было не меньше, чем число отрицательных, т. е. г ^ п — r или, эквивалентно, г ^ п/2. Дальше мы всегда будем считать, что в случае с = 0 это условие выполнено. Теорема 11.13 утверждает, что каждая квадрика, не являющаяся аффинным подпространством или цилиндром и обладающая центром, может быть переведена с помощью подходящего невырожденного аффинного преобразования в квадрику, заданную уравнением (11.62). При с = 0 (и только в этом случае) квадрика (11.62) является конусом (с вершиной в начале координат), т.е. вместе с каждой своей точкой х содержит и всю прямую (ж). Можно указать и другое характерное свойство квадрики, задаваемой уравнением (11.62) при с = 0: она не является гладкой, в то время, как в случае с — 1 квадрика гладкая. Это сразу следует из определения особых точек (равенств F = 0Hg=0). Рассмотрим теперь квадрики, не имеющие центра. Такая квадрика Q задается уравнением F(x) = ф(х) + f(x) + с = 0, (11.63)
414 Гл. 11. Квадрики где ф{х) — квадратичная форма, f(x) — линейная форма, с — число. Симметрическую билинейную форму (р(х,у), соответствующую квадратичной форме ф(х), запишем, как и раньше, в виде ср(х,у) = (х,£/(у)), где st\ L —> L* — линейное преобразование. Мы видели, что предположение о том, что квадрика Q не имеет центра, равносильно условию / £ ^(L). Выберем в гиперплоскости [_' = (/)а, определенной в пространстве L линейным однородным уравнением f(x) = 0, произвольный базис еь ... ,en_i и дополним его до базиса всего пространства L таким вектором еп _L L', что /(еп) = 1 (ортогональность здесь понимается, конечно, в смысле билинейной формы (р(х,у)). В полученном репере (0;еь... ,еп) уравнение (11.63) запишется в виде: F(x) = ф'(хи..., хп_х) + ах2п + хп + с = О, (11.64) где ?// — ограничение квадратичной формы ф на гиперплоскость L'. Выберем теперь в L' новый базис е\,..., е^_1э в котором квадратичная форма ^' имеет канонический вид: V/(zi,...,Xn-i) =х\ + '-- + х2г-х2г+1 х2п_х. (11.65) Очевидно, что про этом начало координат О и вектор еп не изменятся. Если бы в результате квадратичная форма ф' оказалась зависящей от меньшего, чем п — 1, числа переменных, то многочлен F в уравнении (11.63) зависел бы от меньшего, чем п, числа переменных, а это, как мы видели, означает, что квадрика Q — цилиндр. Покажем, что в формуле (11.64) число а = 0. Если а ф 0, то в силу очевидного соотношения ах2п + хп + с = а(хп + (З)2 + с\ где (3 = 1/(2а) и с' = с — (3/2, мы получаем, что с помощью сдвига ^ на вектор а — —f3en уравнение (11.64) приводится к виду F{x) = ф'(х19...,хп-\) +axl + c' = 0, где ф' имеет вид (11.65). Но такое уравнение, как легко видеть, задает квадрику, имеющую центр. Таким образом, предполагая, что квадрика Q не является цилиндром и не имеет центра, мы получаем, что ее уравнение имеет вид х2-\ Ь х\ - о^+1 х2п_х + хп + с = 0. Теперь произведем сдвиг 2?а на вектор а — —сеп. При этом координаты х\,... ,хп-\ не изменятся, а хп заменится на хп — с. В новых координатах уравнение квадрики приобретает вид х\ + • • • + х2 - х2г+1 х2п_х + хп = 0. (11.66) За счет умножения уравнения квадрики на —1 и замены координаты хп на — хп мы можем добиться того, чтобы число положительных квадратов в уравнении (11.66) было не меньше числа отрицательных, т. е. г ^ п — г — 1, или, эквивалентно, г > (п— 1)/2.
11.5. Квадрики в вещественном аффинном пространстве 415 Итак, нами получен следующий результат: Теорема 11.14. Любая квадрика, которая не является аффинным подпространством или цилиндром и не имеет центра, в некоторой системе координат может быть задана уравнением (11.66), где г — число, удовлетворяющее условию (п — 1)/2 ^ г ^ п — 1. Таким образом, объединяя теоремы 11.13 и 11.14, получаем следующий результат: любая квадрика, которая не является аффинным подпространством или цилиндром, в некоторой системе координат может быть задана уравнением (11.62), если она имеет центр, или уравнением (11.66), если она не имеет центра. Эти уравнения мы будем называть каноническими. Теоремы 11.13 и 11.14 не только дают простейший вид, к которому может быть приведено уравнение квадрики в соответственно выбранной системе координат; сверх того, из них следует, что квадрики, имеющие канонический вид (11.62) или (11.66), могут быть аффинно эквивалентными (т.е. переведены друг в друга невырожденным аффинным преобразованием) только в том случае, если их уравнения совпадают. На пути к этому утверждению мы сначала установим, что квадрики, определенные уравнением (11.66), никогда не имеют центра. Действительно, записав уравнение квадрики в виде (11.50), мы можем сказать, что она имеет центр, только если / е ^(L). Но простая проверка показывает, что это условие не выполнено для квадрик, определенных уравнением (11.66). Действительно, если в некотором базисе ei,...,en пространства L квадратичная форма ф(х) задана в виде 2 , _, 2 2 _ _ 2 Xi ~\-' • • -\~ Хг Хг+\ ••* Хп—\-> то, выбрав взаимный базис /i,...,/n сопряженного пространства L*, мы получим, что линейное преобразование srf\ L -» L*, связанное с ф соотношением <р(х,у) = (х,я/(у)), в котором <р(х,у) — симметрическая билинейная форма, задающая квадратичную форму ф, имеет вид s^{ei) = f{ для г — 1,...,г, srf{ei) = —fi для i = r+l,...,n— 1, и д/(еп) = 0, а линейная форма хп совпадает с fn. Таким образом, ^(L) = (/i,..., /n_i> и /' = /n £ ^(L). Теперь мы можем сформулировать основную теорему, дающую классификацию квадрик относительно невырожденных аффинных преобразований: Теорема 11.15. Любая квадрика, которая не является аффинным подпространством или цилиндром, в некоторой системе координат может быть задана каноническим уравнением (11.62) или (11.66), где число г удовлетворяет условиям, указанным в теоремах 11.13 и 11.14 соответственно. И наоборот, квадрики, имеющие в некоторых координатах канонические уравнения (11.62) или (11.66), могут быть преобразованы друг в друга невырожденным аффинным преобразованием, только если их канонические уравнения совпадают. Доказательство. Нам осталось доказать только вторую часть утверждения. Мы уже видели, что квадрики, заданные уравнениями (11.62) и (11.66), не переводятся друг в друга невырожденными аффинными преобразованиями,
416 Гл. 11. Квадрики так как в первом случае квадрика имеет центр, а во втором — не имеет. Поэтому мы можем рассматривать каждый случай в отдельности. Начнем с первого случая. Пусть существуют две квадрики Q\ и Q<i, задаваемые разными каноническими уравнениями вида (11.62) (заметим, что канонические уравнения в этом случае отличаются значением с = 0 или 1 и индексом г), причем Qi = g{Q\), где (g>si) — невырожденное аффинное преобразование. По условию, обе квадрики имеют единственный центр, который в выбранной системе координат совпадает с точкой О = (О,... ,0). Запишем преобразование д в виде (8.19): д = 3?адъ, где до(0) = О. По условию, Q2 = g(Q\), и значит, д{0) = О, т. е. вектор а = О. В уравнениях квадрик, которые мы можем записать в виде Fi(x) = ф{(х) + q = 0, г = 1 и 2, очевидно, Fi(0) = с$, и значит, постоянные q совпадают (дальше мы будем обозначать их через с). Таким образом, уравнения квадрик Q\ и Qi отличаются только квадратичной частью ipi(x). Согласно теореме 11.11 преобразование д переводит многочлен F\{x) — с в А(^(ж) — с), где А — некоторое ненулевое вещественное число. Следовательно, квадратичная форма ф\(х) переводится в A^faO линейным преобразованием si. Если обозначить индексы инерции квадратичных форм ф{(х) через Г{, то из закона инерции следует, что или г 2 = r\ (при А > 0), или Г2 = п — г\ (при А < 0). В случае с = 0 мы можем считать, что г» ^ п/2, и равенство Г2 = п — г\ возможно только при Г2=г\. В случае с = 1 этот же результат следует из того, что преобразование si переводит многочлен ф\{х) — 1 в А(^1(ж) — 1). Сравнивая свободные члены, получаем А = 1. В случае, когда квадрика не имеет центра, мы можем повторить те же рассуждения. Мы опять получим, что квадратичная форма ф\(х) переводится в Хф2(х) невырожденным линейным преобразованием. Так как каждая форма ipi(x), по условию, содержит член х\, то отсюда следует, что А = 1, а из закона инерции следует, что Г2 = г\ (при А > 0), или г2 = п — 1 — г\ (при А < 0). Так как по условию Т{^ {п— 1)/2, то равенство Г2 = п — 1 — г\ возможно только При Г2 =Г\. Таким образом, мы видим, что в вещественном аффинном пространстве размерности п существует только конечное число аффинно неэквивалентных квадрик, не являющихся аффинными подпространствами или цилиндрами. Каждая из них эквивалентна квадрике, записываемой или уравнением (11.62), или уравнением (11.66). Можно сосчитать число типов аффинно неэквивалентных квадрик. Уравнение (11.62) при с = 1 дает п возможностей. Остальные случаи зависят от четности или нечетности числа п. Если п = 2т, то уравнение (11.62) при с = 0 дает т разных типов, и столько же дает уравнение (11.66). Всего же мы получаем п + 2т = 2п разных типов в случае четного п. Если жеп = 2т + 1, то уравнение (11.62) при с = 0 дает т разных типов, и столько же дает уравнение (11.66). Всего же в этом случае мы получаем п + 2т — 1 = 2п — 2 разных типов. Таким образом, в вещественном аффинном пространстве размерности п число типов аффинно неэквивалентных квадрик, не являющихся аффинными подпространствами или цилиндрами, равно 2п, если п четно, и 2п — 2, если п нечетно.
11.5. Квадрики в вещественном аффинном пространстве 417 Замечание. Легко видеть, что содержание этого параграфа сводится к классификации многочленов второй степени F(x\,...,xn) с точностью до невырожденного аффинного преобразования переменных и умножения на ненулевой числовой множитель. Связь с геометрическим объектом — квадрикой — устанавливается теоремой 11.11. То, что мы исключили из рассмотрения случай аффинных подпространств, связано с тем, что мы хотели подчеркнуть различие возникающих геометрических объектов. Предположение, что квадрика не является цилиндром, сделано исключительно для того, чтобы подчеркнуть индуктивный характер классификации. Введенные ограничения можно было и не делать. Повторяя точно те же самые рассуждения, мы получим, что любое множество в n-мерном аффинном пространстве, заданное равенством нулю многочлена второй степени от п переменных — координат его точки, аффинно эквивалентно одному из множеств, определенных следующими уравнениями: х\ + xi + х\ + •• + xt , 2 _ 2 ~Г Ху, Хгр\\ + xi xr+l Xr+\ х: - х: х = 1, 2 =0, га— 1 + Хш = 0, Г > 0 ^ г ^ га ^ п, га ^ п, га — 1 га (11.67) (11.68) га<п. (11.69) После этого легко заметить, что в случае (11.67) при г = 0 получается пустое множество, а в случае (11.68) при г = 0 или г = га — аффинное подпространство. В остальных случаях легко указать прямую, пересекающую данное множество в двух различных точках и целиком не содержащуюся в нем. Вследствие теоремы 8.2, это значит, что такое множество не является аффинным подпространством. В заключение скажем немного о топологических свойствах аффинных квадрик. Если в уравнении (11.62) число с— 1 и индекс инерции г = 1, то это уравнение можно переписать в виде х\ — \ +х\-\ Ь #2, откуда следует х\ ^ 1, т. е. х\ ^ 1 или #1^—1. Очевидно, что точку квадрики, для которой координата х\ ^ 1, невозможно непрерывно деформировать в точку, для которой х\ ^ — 1, оставаясь на квадрике (см. определение на с. 16). Поэтому квадрика в этом случае состоит из двух компонент — т. е. таких ее подмножеств, что никакие две точки, принадлежащие разным подмножествам, нельзя непрерывно деформировать друг в друга, оставаясь на квадрике. Можно показать, что каждая из этих компонент линейно связна (см. определение на с. 17), так же, как и любая квадрика, задаваемая уравнением (11.66). Простейшим примером квадрики, состоящей из двух линейно связных компонент, является гипербола на плоскости (рис. 11.6). Рис. 11.6. Гипербола 14 А. О. Ремизов, И. Р. Шафаревич
418 Гл. 11. Квадрики Описанное нами выше топологическое свойство имеет обобщение на квадрики, задаваемые уравнением (11.62) при с= I с меньшими значениями индекса г, но предполагая все же, что г > 1. Здесь мы скажем о них, не приводя полностью строгие формулировки и, тем более, опуская доказательства. При г= 1 мы можем указать две точки: (1,0,... ,0) и (—1,0,... ,0), которые нельзя перевести друг в друга, непрерывно перемещаясь по квадрике (их можно было бы задать как сферу х\ = 1 в одномерном пространстве). Для произвольного значения г на квадрике содержится сфера х\-\ Ь х\ = 1, хг+\ = 0,..., хп = 0. Можно доказать, что эту сферу невозможно сжать в одну точку, непрерывно перемещаясь по поверхности квадрики. Но для любого т < г и непрерывного отображения / сферы Sm~l : у\ Л \-у^п= I в квадрику можно сжать образ сферы f(Sm~l) в одну точку, непрерывно перемещаясь по квадрике (читатель легко может сам понять, что значит непрерывное перемещение множества по квадрике, оно уже встречалось нам в случае г = 1). § 11.6. Квадрики в аффинном евклидовом пространстве Нам осталось рассмотреть невырожденные квадрики в аффинном евклидовом пространстве V. Мы по-прежнему будем исключать случаи, когда квадрики являются аффинными подпространствами или цилиндрами. Классификация таких квадрик с точностью до метрической эквивалентности использует точно те же рассуждения, которыми мы пользовались в § 11.5. Результаты этого параграфа частично могут быть применимы в нашем случае, так как движения являются аффинными преобразованиями. Поэтому мы только бегло напомним ход рассуждений. Обобщая постановку вопроса, идущего от аналитической геометрии (где рассматриваются случаи dimF = 2 и 3), мы будем называть две квадрики метрически-эквивалентными, если они переводятся друг в друга некоторым движением пространства V. Это определение является частным случаем метрической эквивалентности произвольных метрических пространств (см. с. 17), которыми, как легко видеть, являются квадрики в аффинном евклидовом пространстве. Прежде всего рассмотрим квадрики, в уравнении которых за счет сдвига может быть уничтожена линейная часть. Это — квадрики, имеющие центр (причем, как мы видели, единственный). Выбрав начало координат (т.е. точку О репера (О; е\,..., еп)) в центре квадрики, мы приведем ее уравнение к виду Ф(Х1,...,ХП) =С, где ф{х\,..., хп) — невырожденная квадратичная форма, с — число. Если с ф 0, то за счет умножения уравнения на с-1 мы можем считать, что с— 1. При с — 0 квадрика является конусом. С помощью ортогонального преобразования квадратичную форму ф можно привести к каноническому виду ф(х\,..., хп) = Aire? + А2^2 Н Ь Хпхп,
11.6. Квадрики в аффинном евклидовом пространстве 419 где все числа Ль..., Ап отличны от нуля, так как по условию наша квадрика невырождена и не является аффинным подпространством или цилиндром, и значит, квадратичная форма ф — невырожденная. Разделим эти числа на положительные и отрицательные: пусть Аь...,А& > 0 и А&+ь... ,ЛП < 0. Согласно традиции, идущей от аналитической геометрии, полагают А^ = а^2 при г = 1,..., к и Xj = —aj2 при j = к + 1,..., га, причем все числа аь..., ап положительны. Таким образом, каждая квадрика, обладающая центром, метрически эквивалентна квадрике с уравнением (^)2 + ...+ W2_(^±i)2_..._(^)2 = c, (Ц.70) \a\J \ак/ ^ufc+i' \anJ где с — 0 или 1. При с = 0, умножая уравнение (11.70) на —1, мы можем, как и в аффинном случае, считать, что к ^ га/2. Теперь рассмотрим случай, когда квадрика ф(х\9...,хп) + f(xi,...,xn) + с = 0 не имеет центра, т.е. / ^ «e^(L), где srf\ L —> L* — линейное преобразование, связанное с квадратичной формой ф соотношением ip(x,y) = (х,я/(у)), в котором (р(х, у) — симметрическая билинейная форма, задающая квадратичную форму ф. В этом случае легко проверить, что, как и в § 11.5, мы можем найти такой ортонормированный базис ei,...,en пространства L, в котором /(ei)=0, ..., /(en_!) = 0, /(^ = 1, и в системе координат, определенной репером (0;еь... ,еп)), квадрика задается уравнением Х\х2 + \2Х2 Н h Xn^ix^i + хп + с = 0. С помощью сдвига на вектор — сеп можно привести это уравнение к виду Х\х2 + Х2х1 -\ Ь An_i^_! + хп = 0, в котором все коэффициенты А; отличны от нуля, так как квадрика невырождена и не является цилиндром. Если Ai,...,Afc > 0 и Afc+ь..., Хп-\ < 0, то за счет умножения на — 1 уравнения квадрики и координаты хп можно считать, что к > (га — 1)/2. Полагая, как и прежде, А; — а^2 при г = 1,..., к и А^ = — aj2 при j = к + 1, к + 2,..., га — 1, где аь • • •, ап > 0, мы приводим предыдущее уравнение к виду И2 + -+(^)2-(^)2---(^)2 + ^ = 0. (11.71) Таким образом, любая квадрика в аффинном евклидовом пространстве метрически эквивалентна одной из квадрик, заданных уравнением (11.70) (тип I) или (11.71) (тип II). Проверим, что (при принятых условиях и ограничениях на г) две квадрики вида (11.70) или вида (11.71) метрически эквивалентны, только если все числа а\,... ,ап (для типа I) и аь ..., an_i (для типа II) в их уравнениях совпадают. При этом можно отдельно рассматривать 14*
420 Гл. 11. Квадрики квадрики I и II типа, так как они различаются с точки зрения даже аффинной эквивалентности. По теореме 8.11, любое движение аффинного евклидова пространства является композицией сдвига и ортогонального преобразования. Как мы видели в § 11.5, сдвиг не меняет квадратичную часть уравнения квадрики. Согласно теореме 11.11 две квадрики аффинно эквивалентны, только если многочлены, входящие в их уравнения, отличаются постоянным множителем. Но для квадрик типа I при с = 1 этот множитель должен быть равным 1. В случае квадрики типа I при с = 0 умножение на /л > 0 означает, что все числа ai умножатся на ц~ъ. Для квадрик типа II этот множитель также должен быть равным 1, чтобы сохранился коэффициент 1 при линейном члене хп. Таким образом, мы видим, что если исключить квадрики типа I с постоянной с = 0 (конусы), то квадратичные части уравнений должны быть квадратичными формами, эквивалентными относительно ортогональных преобразований. Но числа Xi определяются как собственные значения соответствующего линейного симметрического преобразования, а следовательно, этим определяются и числа щ. В случае конусов (квадрик типа I при с = 0) все числа Л^ могут быть умножены на общий множитель, являющийся положительным числом (в силу сделанных относительно г предположений). Это значит, что числа а* могут быть умножены на произвольный положительный общий множитель. Заметим, что хотя ход наших рассуждений здесь был в точности тем же, что и в случае аффинной эквивалентности, результат получается другой. Относительно аффинной эквивалентности мы получили лишь конечное число разных типов неэквивалентных квадрик, а относительно метрической эквивалентности их бесконечно много: они определяются не только конечным числом значений индекса г, но и произвольными числами а^ (которые в случае конусов определены с точностью до умножения на положительный общий множитель). Этот факт был известен уже из курса аналитической геометрии: например, эллипс с уравнением (;)' + (!)' = ' определяется своими полуосями а и Ь, и если для двух эллипсов они разные, то такие эллипсы не могут быть переведены друг в друга движением плоскости. При произвольном п квадрики, имеющие каноническое уравнение (11.70) с& = пис=1, называются эллипсоидами. Их уравнение можно переписать в виде п Е(|)2 = >. <"•*> откуда следует, что \xi/ai\ < 1 и, следовательно, \xi\ < а,{. Если наибольшее из чисел ai,...,an обозначить через а, то мы получим, что \xi\ ^ а. Это свойство выражают, говоря, что эллипсоид — ограниченное множество. Заинтересованный читатель легко может доказать, что из всех квадрик этим свойством обладают только эллипсоиды.
11.7. Квадрики на вещественной плоскости 421 Если мы перенумеруем координаты так, что в уравнении эллипсоида (11.72) коэффициенты а\ ^ а2 ^ • • • > ап, то получим \а\/ \ai/ \an/ откуда для каждой точки х = (х\,...,хп), принадлежащей эллипсоиду, следуют неравенства ап ^ \х\ ^ а\. Это значит, что расстояние от центра эллипсоида О до точки х не больше, чем до точки А = (а\,09... ,0) и не меньше, чем до точки В = (0,..., 0, ап). Эти две точки или, вернее, отрезки О А и О В называются большой и малой полуосями эллипсоида. § 11.7*. Квадрики на вещественной плоскости В этом параграфе мы не докажем никаких новых фактов. Цель его состоит в том, чтобы установить связь полученных ранее результатов с известными из аналитической геометрии фактами, в частности, интерпретацией квадрик на вещественной плоскости как сечений конуса, известной еще древним грекам. Рассмотрим сначала простейший пример, на котором можно увидеть разницу между аффинной и проективной классификацией квадрик: это квадрики на вещественной аффинной и вещественной проективной плоскости. Но для этого нам нужно сначала уточнить (или напомнить) саму постановку вопроса. Согласно определению из § 9.1 мы представляем проективное пространство любой размерности п в виде P(L), где L — векторное пространство размерности п+1. Аффинное пространство той же размерности п можно считать аффинной частью P(L), определенной условием <р ф 0, где (р — некоторая ненулевая линейная функция на L. Его можно также отождествить с множеством W^, определенным условием (р(х) = 1. Это множество является аффинным подпространством в L (можно считать L своим собственным пространством векторов). Именно такой конструкцией аффинного пространства мы и будем дальше пользоваться. Квадрика Q в проективном пространстве F(L) задается уравнением F(x) = 0, где F — однородный многочлен второй степени. В пространстве L совокупность векторов, для которых F(x) = 0, образует конус К. Напомним, что конусом называется такое множество К, которое вместе с каждым вектором х g К содержит и всю прямую (х). Конус, соответствующий квадрике, называется квадратичным. С этой точки зрения проективная классификация квадрик совпадает с классификацией квадратичных конусов относительно невырожденных линейных преобразований. Таким образом, аффинная квадрика Q представляется в виде W^ П К при указанных выше обозначениях W^ и К. Квадрики Q\ с W^x и Q2 С W^2, по определению, аффинно эквивалентны, если существует невырожденное аффинное преобразование W^ —► W^2, переводящее Q\ в Q2- Это значит, что имеется невырожденное линейное преобразование srf векторного пространства L, при котором £f(W<Pl) = W,P2 и s/(W<PlnKi) = W<P2nK2, где К\ и K<i — квадратичные конусы, соответствующие квадрикам Q\ и Q2.
422 Гл. 11. Квадрики Прежде всего посмотрим, как отображение si действует на множестве W^. Для этого напомним, что в пространстве L* линейных функций на L определено сопряженное преобразование si*, для которого si*((p)(x) = (p(si(x)) при всех векторах х Е L и ср Е L*. Другими словами, это значит, что если stf*((p) = яр, то линейная функция ф(х) — (p(si(x)). Поскольку преобразование si невырождено, сопряженное преобразование si* тоже невырождено, и следовательно, существует обратное преобразование (si*)~x. Согласно определению (si*)~l((p)(si(x)) = 1, если ip(x) = 1, т.е. si переводит W^ в множество W^yi^y Так как в предыдущих параграфах мы рассматривали только невырожденные проективные квадрики, то естественно наложить соответствующие ограничения и в аффинном случае. Для этого мы будем, как и раньше, пользоваться представлением аффинных квадрик в виде Q — W^ ПК. Квадратичный конус К определяет некоторую проективную квадрику Q. Легко выразить это соответствие в координатах. Если в L выбрана система координат (хо,х\,...,хп), то в WXQ определены неоднородные координаты у\,...,уп по формуле уi = Xi/xQ. Если квадрика Q задана уравнением f(yU'-'Vn) = 0 второй степени, то квадрика Q (и конус К) задается уравнением F(x0,xi,...xn) =0, где F = xlf(—,...,— ). Таким образом, проективная квадрика Q однозначно определяется аффинной квадрикой Q. Определение. Аффинная квадрика Q .называется невырожденной, если соответствующая ей проективная квадрика Q является невырожденной. В пространстве произвольного числа измерений п все квадрики с каноническими уравнениями (11.67)-(11.69) при т < п являются вырожденными. Кроме того, квадрика типа (11.68) вырождена и при т = п. Оба эти утверждения проверяются непосредственно, исходя из определений, нужно только обозначить координаты х\,...,хп через у\,...,уп, ввести однородные координаты хо : х\ : ... : хп, положив yi = xi/xq, и умножить все уравнения на Xq. Матрица квадратичной формы F(xq,x\, ... ,хп) выписывается очень просто. В частности, при п = 2 мы получаем три уравнения: 2/1+2/2 = 1- 2/1-2/2 = 1- 2/1+2/2=0. (11.73) Из результатов § 11.5 следует, что при п = 2 любая невырожденная аффинная квадрика аффинно эквивалентна квадрике одного (и только одного) из этих трех типов. Соответствующие квадрики называются эллипсами, гиперболами и параболами.
11.7. Квадрики на вещественной плоскости 423 С другой стороны, в § 11.4 мы видели, что все невырожденные проективные квадрики проективно эквивалентны. Этот результат может служить для наглядного представления аффинных квадрик. Как мы видели, любая аффинная квадрика может быть представлена в виде Q = W^ П К, где К — некоторый квадратичный конус. Она аффинно эквивалентна квадрике я/фу ПК) = WV*)-^ П st{K\ где srf — любое невырожденное линейное преобразование пространства L. Здесь и проявляется специфика случая п = 2 (dimL = 3). Согласно доказанному ранее все конусы К, соответствующие невырожденным квадрикам, переводятся друг в друга невырожденными преобразованиями я/. В частности, можно считать, что srf{K) — Ко, где конус Ко задается в некоторой системе координат жо»#ь#2 пространства L уравнением х\ + х\ = х$. Этот конус получается вращением одной из его образующих, т. е. прямых, целиком лежащих на нем, (например, прямой х\ = хо, Х2 = 0) вокруг оси xq (т. е. прямой х\ = Х2 = 0). В выбранном нами конусе Ко угол между образующей и осью хо равен 7г/4. Иначе говоря, это означает, что каждая пола конуса Ко получается вращением сторон равнобедренного прямоугольного треугольника вокруг биссектрисы. Положив (£/*)~1(ср) = ф, мы получим, что любая невырожденная аффинная квадрика аффинно эквивалентна квадрике W^ П Ко. Здесь W^ — это любая плоскость в пространстве L, не проходящая через вершину конуса Ко, т.е. через точку О = (0,0,0). Таким образом, всякая невырожденная аффинная квадрика аффинно эквивалентна плоскому сечению кругового конуса. Этим и объясняется термин коника, принятый для квадрик на плоскости. Из аналитической геометрии известно, каким образом три найденные нами выше типа коник (эллипсы, гиперболы и параболы) получаются из одной (с точки зрения проективной классификации) кривой. Если исходить из уравнений (11.73), то различие трех типов обнаруживается при записи этих уравнений в однородных координатах. Положив у\ = х\/хо и у2 = x<ijxo, мы получаем уравнения х\ + х\=Хо, х\-х\=Х%, xf — Ж()Ж2 = 0. (И.74) Различие этих уравнений состоит в разном характере множества пересечения с бесконечно удаленной прямой 1^, задаваемой уравнением хо = 0. Для эллипса это множество пусто, для гиперболы оно состоит из двух точек (0 : 1 : 1) и (0 : 1 : — 1), а для параболы — из одной точки (0:0: 1) (подстановка в уравнение (11.73) показывает, что прямая 1^ является касательной к параболе в точке их пересечения), см. рис. 11.7. Мы видели в § 9.2, что аффинное преобразование совпадает с проективным, сохраняющим прямую i^. Поэтому тип множества Q П 1^ (пустое множество, две точки, одна точка) должен быть одинаков у аффинно эквивалентных квадрик Q. Реальное содержание доказанного в § 11.4, в нашем случае заключается в том, что тип множества Q П1^ определяет квадрику Q с точностью до аффинной эквивалентности.
424 Гл. 11. Квадрики эллипс гипербола парабола Рис. 11.7. Пересечение коник с бесконечно удаленной прямой Если же исходить из представления коники как сечения конуса Kq плоскостью W^, то разные типы возникают за счет различного расположения плоскости ]¥ф относительно конуса Kq. Напомним, что вершина О конуса Kq разбивает его на две полы. Если уравнение конуса имеет вид х\ + х\ = ж§, то каждая пола определяется знаком xq. Обозначим через Ц/, плоскость, параллельную W^ и проходящую через точку О. Эта плоскость задается уравнением ф = 0. Если Ц не имеет с конусом Kq других точек пересечения, кроме О, то W^ пересекает одну его полу (например, ту, внутри которой лежит точка пересечения W^ и оси xq). В этом случае коника W^ П Kq содержится в одной поле и является эллипсом. Например, в частном случае, когда плоскость W^ ортогональна оси xq, мы получаем окружность. Если двигать плоскость W^ (например, уменьшая ее угол с осью xq), to в ее пересечении с конусом Kq получаются эллипсы, все более удлиняющиеся по мере уменьшения угла (рис. 11.8, а). Предельным будет положение, когда плоскость Ц/, коснется конуса Kq по его образующей. Тогда \¥ф пересечет его опять же в одной поле (той, внутри которой она пересекается с осью xq). Это пересечение является параболой (рис. 11.8, б). Если же плоскость Ц/, пересекает Kq по двум разным образующим, то W^ пересекает обе его полы (с той стороны от плоскости Ц/,, с которой находится параллельная ей плоскость W^). Это пересечение является гиперболой (рис. 11.8, в). а) б) в) Рис. 11.8. Конические сечения Связь плоских квадрик с сечениями конуса особенно ярко проявляется при метрической классификации таких квадрик, составляющей часть любого
11.7. Квадрики на вещественной плоскости 425 достаточно полного курса аналитической геометрии. Напомним лишь основные результаты. Как уже было сделано в § 11.5, нужно исключить из рассмотрения коники, являющиеся цилиндрами и объединениями векторных подпространств (т.е., в данном случае, прямых или точек). Тогда полученные в § 11.5 результаты дают нам (в координатах х, у) следующие три типа коник: ^ + Й = 1' 4-Й = 1' x2 + a2y = Q, (11.75) az bz az bz где а > 0 и 6 > 0. С точки зрения изложенной выше аффинной классификации, кривые первого типа являются эллипсами, второго типа — гиперболами, и третьего типа — параболами. Напомним, что в курсе аналитической геометрии эти кривые определяются как геометрические места точек плоскости, удовлетворяющих некоторым условиям. А именно, эллипс является геометрическим местом точек, сумма расстояний от которых до двух заданных точек плоскости постоянна. Гипербола определяется аналогичным образом с заменой суммы на разность. Парабола является геометрическим местом точек, равноудаленных от некоторой точки, и некоторой не проходящей через эту точку прямой. Существует изящное и элементарное доказательство того, что все эллипсы, гиперболы и параболы не только аффинно, но и метрически, т.е., как геометрические места точек, эквивалентны плоским сечениям кругового конуса. Напомним, что круговым называется конус К в трехмерном пространстве, который получается в результате вращения одной прямой вокруг некоторой другой прямой, называемой осью конуса. Прямые, составляющие конус, называются его образующими, они пересекаются с осью конуса в одной общей точке, которая называется его вершиной. Другими словами, этот результат означает, что сечение кругового конуса плоскостью, не проходящей через его вершину, является либо эллипсом, либо гиперболой, либо параболой, и любой эллипс, гипербола и парабола совпадает с сечением кругового конуса подходящей плоскостью1). 1) Доказательство этого факта принадлежит бельгийскому математику Данделену. Оно приводится, например, в книгах Б. Н. Делоне, Д. А. Райкова «Аналитическая геометрия» или А. П. Веселова, Е. В. Троицкого «Лекции по аналитической геометрии», указанных в списке литературы в конце книги.
Глава 12 ГЕОМЕТРИЯ ЛОБАЧЕВСКОГО Открытие геометрии Лобачевского оказало большое влияние на развитие математики и на осмысление взаимоотношения математики и внешнего мира. Обсуждения, возникшие в результате этого, видимо, повлияли и на взгляды многих гуманитариев. К сожалению, здесь они скорее закрепились в виде художественного образа: противопоставление «земной» — евклидовой геометрии и выдуманной учеными-математиками «заумной» — неевклидовой. Причем разница между этими двумя геометриями состоит будто бы в том, что в первой, всем понятной, параллельные линии не пересекаются, а во второй, обычному уму трудно постижимой, они пересекаются. Хотя, конечно, это прямо обратно истине — в неевклидовой геометрии Лобачевского как раз можно провести через точку, не лежащую на данной прямой, бесконечного много прямых, не пересекающихся с нею. В этом и заключается отличие неевклидовой геометрии Лобачевского от евклидовой. Вероятно, смутил гуманитариев Иван Карамазов, в качестве художественного образа сказавший: Между тем находились и находятся даже и теперь геометры и философы и даже из замечательнейших, которые сомневаются в том, чтобы вся вселенная, или еще обширнее, — все бытие было создано лишь по эвклидовой геометрии, осмеливаются даже мечтать, что две параллельные линии, которые по Эвклиду ни за что не могут сойтись на Земле, может быть, и сошлись бы где-нибудь в бесконечности. Приблизительно в то же время, когда создавался этот роман, Энгельс писал «Анти-Дюринг», где высказывался более ярко: Но в высшей математике находит свое осуществление и другое противоречие, состоящее в том, что линии, пересекающиеся на наших глазах, тем не менее уже в пяти-шести сантиметрах от точки своего пересечения должны считаться параллельными, т.е. такими линиями, которые не могут пересечься даже при бесконечном их продолжении. В этом автор видит проявление некоей «диалектики». И до настоящего времени можно встретить в печати художественный образ, противопоставляющий евклидову и неевклидову геометрию, в первой из которых параллельные линии не пересекаются, а во второй — «где-то пересекутся». Обычно под неевклидовой геометрией подразумевают геометрию Лобачевского. Она вполне доступна, по крайней мере, для всех, прошедших курс высшего технического обучения, а таких теперь очень много. Правда, сейчас на математических факультетах она излагается в более продвинутом
12.1. Пространство Лобачевского 427 курсе дифференциальной геометрии. Но геометрия Лобачевского столь тесно примыкает к первоначальному курсу линейной алгебры, что было бы жаль здесь о ней не сказать. § 12.1*. Пространство Лобачевского В этой главе мы будем рассматривать исключительно вещественные векторные пространства. Пространство Лобачевского размерности п, которое мы дальше будем обозначать через Ln или просто L, если не нужно явно указывать размерность, мы определим как часть n-мерного проективного пространства P(L), где L — вещественное векторное пространство размерности п + 1. Размерность пространства L мы будем обозначать через dimL. Снабдим L псевдоевклидовым скалярным произведением (ж, у), см. § 7.7. Напомним, что тогда квадратичная форма (ж2) имеет индекс инерции п, и в некотором базисе ei,...,en+i (называемом ортонормированным) для вектора x = a{ei + V апеп + an+ien+x (12.1) принимает вид о о (Х*) = а\ + --- + а1-а2п+х. (12.2) В псевдоевклидовом пространстве L рассмотрим световой конус V, определенный условием (ж2) = 0. Говорят, что вектор а содержится внутри конуса V, если (а2) < 0 (напомним, что в гл. 7 мы называли такие векторы временипо- добными). Очевидно, что тогда это же верно и для всех векторов прямой (а), так как {{аа)2) = а2(а2) < 0, и мы рассматриваем пространство над полем вещественных чисел. Такие прямые тоже называются содержащимися внутри светового конуса V. Точки проективного пространства P(L), соответствующие прямым пространства L, содержащимся внутри светового конуса V, называются точками пространства L. Следовательно, они соответствуют таким прямым (ж) пространства L, что в записи (12.1) выполнено неравенство а2 + ..-+а2 <а2+1. (12.3) Ввиду условия (12.3) множество L с Р(1_) содержится в одном аффинном подмножестве an+i 7^0 (см. § 9.1). Действительно, в случае an+i = 0 из (12.3) мы получили бы неравенство а2 + • • • + а2 < 0, что невозможно ввиду вещественности аь...,ап. Как мы уже делали в § 9.1, можно отождествить аффинное подмножество an+i ф 0 с аффинным подпространством Е: an+i = 1 и, таким образом, рассматривать L как часть Е (рис. 12.1). Пространством векторов аффинного прост- Рис- 12.1. Модель пространства ранства Е является векторное подпространство Лобачевского Ео С L, определенное условием ап+\ = 0. Иначе говоря, Eq = (ej,... ,еп).
428 Гл. 12. Геометрия Лобачевского Заметим, что пространство векторов Ео — не просто векторное пространство. Как подпространство псевдоевклидова пространства L, оно, казалось бы, тоже должно быть псевдоевклидовым. Но на самом деле, как видно из формулы (12.2), скалярное произведение (ж, у) делает его евклидовым пространством, в котором векторы е\,...,еп образуют ортонормированный базис. Значит, Е — аффинное евклидово пространство, и базис е\,...,еп+\ пространства L определяет в нем репер, относительно которого точка пространства Лобачевского L, с Е с координатами (yi,...,yn) характеризуется соотношением У1+-" + Уп<1> У» = —, г=1,...,га. (12.4) Это множество называется внутренностью единичного шара в Е и будет обозначаться через U. Перейдем к определению подпространств пространства Лобачевского. Они соответствуют таким векторным подпространствам V С L, которые имеют общую точку с внутренностью светового конуса V, т. е. содержат време- ниподобный вектор а е !_'. Скалярное произведение (ж, у), определенное в L, очевидно, определено и для всех векторов из подпространства L' С L. Пространство L7 содержит времениподобный вектор а, поэтому, согласно лемме 2 из § 7.7, оно является псевдоевклидовым, и следовательно, определено соответствующее ему пространство Лобачевского U с P(L7). Так как P(L') с Р(1_) — проективное подпространство, то L7 с P(L). Но пространство Лобачевского 1/ задается условием (ж2) < 0, как в P(L), так и в P(L'), и следовательно, L7 с L. При этом, согласно определению, diml/ = DimP(L/) = = dimL' — 1. Построенное таким образом пространство Лобачевского L/ называется подпространством в L. В частности, если L' — гиперплоскость в L, то diml/ = dimL — 1, и тогда подпространство U с L называется гиперплоскостью в L. Дальше нам понадобится разбиение пространства L на две части, осуществляемое гиперплоскостью U с L: L \ L' = L+ U L", L+ П L" = 0, (12.5) подобно тому, как в § 3.2 было определено разбиение векторного пространства L на два полупространства с помощью гиперплоскости L7 с L. Разбиение (12.5) пространства L невозможно осуществить через аналогичное разбиение проективного пространства P(L). Действительно, если мы воспользуемся определением подмножеств L+ и 1_~ из § 3.2, то увидим, что для вектора ж е L4" вектор ах G 1_~, если а < 0, так что условие ж е 1_+ не является свойством прямой (ж). Но такое разбиение возможно для евклидова аффинного пространства Е, оно было построено в § 8.2 (с. 299). Напомним, что разбиение аффинного пространства Е гиперплоскостью Е' с Е было определено через разбиение пространства векторов Eq аффинного пространства Е при помощи гиперплоскости Eq с Eq, соответствующей аффинной гиперплоскости Е', т.е. состоящей из векторов АВ, где А и В — всевозможные точки из Е'. Если задано разбиение Eq \ Eq = Eq" U E^", то мы должны выбрать произвольную точку О Е Е' и определить Е+ как
12.1. Пространство Лобачевского 429 совокупность тех точек А Е Е, для которых О А Е Eq~ (аналогично определяется и Е~). Получающиеся таким образом множества Е+ и Е~ называются полупространствами и не зависят от выбора точки О Е Е1. Таким образом, множество Е\Е' разбито нами на два полупространства: Е\Е' = Е+ U Е~. Пусть L' — гиперплоскость в псевдоевклидовом пространстве L, имеющая непустое пересечение с внутренностью светового конуса У, и Е' — соответствующая гиперплоскость в аффинном пространстве Е, т.е. Е' = ЕПP(L'). Тогда Е' имеет непустое пересечение с внутренностью единичного шара /7, заданного соотношением (12.4), и для множества L с Е мы получаем разбиение (12.5), где L' = Lntf, L+ = £+nL, L-=£-nL. (12.6) Рис. 12.2. Полупростран- ,, _ , _ _ ства Лобачевского Множества L^ и L , определенные соотношениями (12.6), называются полупространствами пространства L. Проще говоря, гиперплоскость Е' делит внутренность единичного шара U С Е, отождествляемую с пространством L, на две части С/+ и U~ (см. рис. 12.2), которые соответствуют полупространствам L+ и L-. Покажем, что оба полупространства L4" и L~ непусты, хотя это достаточно убедительно следует из рис. 12.2. Доказательство проведем для L+ (для L- оно аналогично). Рассмотрим произвольную точку О Е Е' П L. Она соответствует вектору а — а\е\ + • • • + апеп + en+i с (а2) < 0 (см. определение аффинного пространства Е на с. 427). Пусть с G Eq" и В е £"+ — такая точка, что ОБ = с. Рассмотрим векторы bt = а + tc E L и точки В^ Е £", для которых OBt = Ь^, при различных значениях t E R. Заметим, что если t > 0, то Bt E S+, а если при этом (Ь%) < 0, то Bt E i?+ П L = L+. Как нетрудно видеть, скалярный квадрат (Щ) представляет собой квадратный трехчлен относительно t: (b2t) = ((a + tc)2) = (a2) + 2t(a, с) + t2{c2) = P{t). (12.7) Согласно нашему выбору вектор с ф 0 содержится в евклидовом пространстве Ео, поэтому (с^) > 0. С другой стороны, по условию мы имеем (а2) < 0. Отсюда вытекает, что дискриминант квадратного трехчлена Pit), стоящего в правой части соотношения (12.7), положителен, и следовательно, P{t) имеет два действительных корня: t\ и <2» причем из условия (а2) < 0 следует, что они имеют разные знаки, т.е. t\t2 < 0. Тогда, как легко видеть, P(t) < 0 для любого £, заключенного между корнями t\ и t^. Такое положительное число t мы и выберем. Поскольку пространство Лобачевского L может рассматриваться как часть аффинного пространства Е, то на него с Е переносятся понятие отрезка прямой, понятие лежать между для трех точек отрезка и понятие выпуклости. Очевидная проверка (аналогичная сделанной нами в конце § 8.2) показывает, что введенные подмножества L+ и L~ множества L \ U характеризуются свойством выпуклости: если две точки ДВЕ L+, то и все точки, лежащие
430 Гл. 12. Геометрия Лобачевского на отрезке [4,В], тоже содержатся в L+ (очевидно, что это же верно и для подмножества L-). Рассмотрим линейные преобразования si векторного пространства L, являющиеся лоренцевыми относительно симметрической билинейной формы (р(х,у), которая соответствует квадратичной форме (ж2), и соответствующие им проективные преобразования Р(^). Последние, очевидно, переводят множество L в себя: из того, что преобразование si лоренцево и условия (ж2) < 0 следует, что (s/(x)2) = (ж2) < 0. Возникающие таким образом преобразования множества L называются движениями пространства Лобачевского L. Итак, движения пространства L — это проективные преобразования содержащего L проективного пространства P(L), переводящие в себя квадратичную форму (ж2). В соответствии со сказанным, определение внутренности светового конуса V в однородных координатах записывается в виде zf + --- + 4-4+i<0, (12.8) а в неоднородных координатах yi = Xi/xn+i — в виде y\ + ...+yl<\. (12.9) Мы рассматриваем движения пространства Лобачевского как преобразования множества L, т. е. как преобразования, переводящие внутренность единичного шара, заданного условием (12.9), в себя. Отметим некоторые простые свойства движений. Свойство 1. Последовательное выполнение двух движений f\ и fi (как преобразований множества L) является движением. Это сразу же следует из того, что последовательное выполнение невырожденных преобразований ^i и^2 является невырожденным преобразованием, и то же верно для соответствующих проективных преобразований Р(М) и Р(«я^). Кроме того, если si\ и si^ являются лоренцевыми относительно билинейной формы <р(ж,г/), то тем же свойством обладает и результат их последовательного выполнения. Свойство 2. Движение взаимно-однозначно отображает L на себя. Это утверждение следует из того, что соответствующие преобразования si\ L —> L и ¥(si): P(L) —> P(L) являются взаимно однозначными. Но, согласно определению пространства Лобачевского, нужно еще проверить, что в каждую прямую, содержащуюся внутри светового конуса V, переходит такая же прямая. Если мы имеем прямую (а) с времениподобным вектором а, то нам уже известно, что существует вектор Ь, для которого si{b) = а. Так как si — лоренцево преобразование псевдоевклидова пространства L, то имеет место соотношение (b2) = {si{b)2) = (а2) < 0, из которого следует, что вектор Ъ тоже времениподобный. Таким образом, преобразование si переводит прямую (Ь), содержащуюся внутри V, в прямую (а), также содержащуюся внутри V. Свойство 3. Как и всякое взаимно однозначное соответствие, любое движение / имеет обратное отображение f~l. Оно тоже является движением. Проверка этого свойства совершенно очевидна.
12.1. Пространство Лобачевского 431 С первого взгляда не видно, что движений пространства Лобачевского «достаточно много». Это мы установим чуть позже, а пока укажем некоторые важные типы движений. Тип а) — это преобразования д = ¥(#/), где я/ — такое лоренцево преобразование пространства L, что £/(еп+\) = еп+ь Так как базис ei,...,en+i псевдоевклидова пространства L ортонормиро- ванный, то имеет место разложение L = (en+i) 0 (en+1)-\ (en+i)-1 = (еь ..., еп), (12.10) и все обладающие указанным свойством преобразования я/: L —> L переводят подпространство Ео = (еь... ,еп) в себя. Наоборот, если определить stf\ L —> L как ортогональное преобразование евклидова подпространства Eq и положить ^(en+i) = еп+ь то Р(«я^) будет, конечно, движением пространства Лобачевского. Иначе говоря, эти преобразования можно описать как ортогональные преобразования неоднородных координат. Все построенные таким образом движения пространства L имеют неподвижную точку О, соответствующую прямой (en+i) в L или, иначе говоря, точку О = (0,... ,0) в неоднородной системе координат (уь... ,уп). С точки зрения пространства Лобачевского построенные движения в точности совпадают с теми движениями, которые оставляют на месте точку О G L. Действительно, как мы видели, точка О соответствует прямой (еп+\), а движение g — Р(«я^), где я? — лоренцево преобразование пространства L. Условие д{0) = О означает, что £/((еп+\)) = (en+i), т.е. я/(еп+\) = Аеп+ь Из того, что преобразование я/ лоренцево, следует, что А = ±1. Умножая я/ на ±1, что, очевидно, не меняет преобразования д = ¥(&/), мы можем добиться выполнения условия я/(еп+\) = ета+ь откуда по определению следует, что д — преобразование типа а). Тип б) связан с некоторой прямой Li С L пространства Лобачевского. По определению, прямая Li задается плоскостью L; с L, dimL' = 2. Так как, по условию, плоскость L7 должна содержать хотя бы один времениподобный вектор ж, то по лемме 2 из § 7.7 (с. 273), она является псевдоевклидовой. Из формулы (6.28) и теоремы 6.10 (закона инерции) следует, что все такие пространства одинаковой размерности изоморфны. Поэтому мы можем выбрать в L7 базис с какой угодно матрицей Грама, лишь бы только она определяла псевдоевклидову плоскость. Мы видели (в примере 7.12, с. 271), что в качестве такого базиса удобно выбрать светоподобные векторы f\,f<i, для которых (/?) = (/!) = о, (fi,f2) = l и значит, для любого вектора х = xfx + yf2 его скалярный квадрат (ж2) = ху. В примере 7.15 (с. 279) мы нашли явные формулы для лоренцевых преобразований псевдоевклидовой плоскости в таком базисе: ^(/,) = а/!, ^(/2) = «-1/2 (12.11) ИЛИ ^(/i) = a/2. ^(/2) = a"7i, (12-12)
432 Гл. 12. Геометрия Лобачевского где а — произвольное число, не равное нулю. Нам дальше понадобятся только преобразования, задаваемые формулой (12.11). Так как L' — невырожденное пространство, то по теореме 6.4 мы имеем разложение L = L' © (L7)-1. Определим теперь линейное преобразование si пространства L следующим условием: si{x + y) = W(x) + y, где xeU, yG^)1, (12.13) и fy — одно из определенных формулами (12.11) и (12.12) лоренцевых преобразований псевдоевклидовой плоскости L/. Очевидно, что тогда si — лоренцево преобразование пространства L. Тип б) движений пространства L — это преобразования F(si), получающиеся в случае, когда в формуле (12.13) в качестве <%£ принимаются преобразования, задаваемые соотношениями (12.11). Все построенные таким образом движения имеют неподвижную прямую Li, соответствующую плоскости L/. Совершенно очевидно, что движения типов а) и б) не исчерпывают всех движений плоскости Лобачевского, даже если бы при определении движений типа б) в качестве °М в формуле (12.13) мы использовали преобразования 9£, задаваемые не только соотношениями (12.11), но и (12.12). Например, они заведомо не включают в себя движения, соответствующие лоренцевым преобразованиям, которые имеют трехмерное циклическое подпространство (см. следствие теорем 7.9 и 7.21 и пример 7.17 на с. 285). Однако для наших дальнейших целей нам достаточно использовать движения только этих двух типов. Пример 12.1. Дальше нам понадобятся явные формулы преобразований типа б) в случае плоскости Лобачевского (т.е. при п = 2). В этом случае L является трехмерным псевдоевклидовым пространством, и в ортонормирован- ном базисе еье2,ез, таком, что (е?) = 1, (е|) = 1, (е23) = -1, скалярный квадрат вектора х — х\е\ + Х2в2 + #зез равен (ж2) = х\ + х\ — х\. Точки плоскости Лобачевского L содержатся в аффинной плоскости хз = 1, имеют неоднородные координаты х = x\jx% и у = x^jx^ и удовлетворяют соотношению х2 + у2 < 1. Для записи преобразования si рассмотрим псевдоевклидову плоскость !_' = (еьез) и выберем в ней базис, состоящий из светоподобных векторов /i,/2, связанных с векторами еьез соотношениями /i = ^. /* = ^р. (12-14) из которых также получаем обратные формулы: е\ = fi + /2 и ез = /1 — /г- Заметим, что ортогональное дополнение (L7)-1 = (ег), и согласно теореме 6.4, мы имеем разложение L = L/ © (ег). Тогда, в соответствии с формулой (12.13), для вектора z = х + у, где х е И и у G (ег), мы получаем значение si(z) — tf/{x) +у, где 9i\ L7 —>• L7 — лоренцево преобразование, определен-
12.1. Пространство Лобачевского 433 ное в базисе /i,/2 формулой (12.11). Отсюда с учетом выражений (12.14) получаем а + а 1 а —а 1 _, ч а —а 1 се + а 1 ) = Положим ^(ei) = 2 ei + 2 63' (бз) = 2 6l + 2 e3' a + a * a-a * a= , b = , (12.15) тогда a + b = а и a2 — b2 = 1. Очевидно, что любые числа а и 6, удовлетворяющие этим соотношениям, определяются из числа а = а + Ъ по формулам (12.15), поэтому мы получим линейное преобразование srf\ L —> L, для которого sf{e\) = ае\ + Ье3, ^(е2) = е2, ^(е3) = Ъе\ + ае3. Легко видеть, что при таком преобразовании вектор х = х\е\ + х2е2 + ^3^3 переходит в вектор д/(х) = (ах\ + 6жз)е1 + х2е2 + (tei + ахз)е3. В неоднородных координатах х = х\/х^ и у = ж2/жз это значит, что точка с координатами (х,у) переходит в точку с координатами {х1\у'), где , ах + Ъ , у 2 z2 1 /1П1м х' = т——, у7 = —^—, а^-Ь^ = 1. (12.16) Этот частный тип движений дает, тем не менее, важное общее свойство: Теорема 12.1. Для любых двух точек пространства Лобачевского существует движение, переводящее первую точку во вторую. Доказательство. Пусть первая точка задана прямой (а), а вторая — прямой (Ь), где а,Ъ е L Если векторы а и Ь пропорциональны, т.е. (а) = (Ь), то нашим требованиям будет удовлетворять тождественное преобразование пространства L (которое можно получить в виде P(<f), где <f — тождественное преобразование пространства L). Если же (а) ф (Ь), т.е. dim(a, Ь) — 2, то положим L' = (а, Ь). Рассмотрим лоренцево преобразование ty£\ L/ —* L' типа б), заданное формулой (12.11), соответствующее ему лоренцево преобразование st\ L —> L, определенное формулой (12.13), и проективное преобразование Р(«я^): P(L) —> P(L). Покажем, что построенное проективное преобразование Р(«й^) переводит точку, соответствующую прямой (а), в точку, соответствующую прямой (Ь), т.е. линейное преобразование <£/: L —> L переводит прямую (а) в (Ь). Так как векторы а и Ъ содержатся в плоскости L', то, по определению, нам достаточно доказать, что при соответствующем выборе числа а преобразование &: L/ —► L/, заданное формулой (12.11), переводит прямую (а) в (Ь). Это легко проверить простым вычислением, используя в псевдоевклидовой плоскости L7 базис /i,/2, заданный формулой (12.14). Рассмотрим време- ниподобные векторы a = a\fi + a2/2 и Ь = b\fi + ^2/2- Так как в выбранном базисе скалярный квадрат вектора равен произведению его координат, то (a2) = aia2 < 0 и (Ь2) = 6i&2 < 0. Отсюда, в частности, следует, что все числа ai,a,2,b\,b2 не равны нулю.
434 Гл. 12. Геометрия Лобачевского Из формулы (12.11) мы получаем, что *%f(a) = oca\fx Ч-оТ^Д* а условие (*%f(a)) = (Ь) означает, что <$/(а) = рЬ при некотором р^О. Отсюда вытекают соотношения аа\ = pb\ и a~la2 = /i&2> т. е. аа\ а аф2 о а2^1 а\а2Ъ\Ъ2 М=^—, a2 = apb2 = — , а = —г- = , , ,2 ■ oi oi ai02 («102) Очевидно, что последнее соотношение разрешимо при вещественном числе а, если aia2&i&2 > 0, а это неравенство выполнено, так как, по условию, а\а2 <0 И &1&2 < 0. Заметим, что мы пока еще не пользовались движениями типа а). Они будут нужны нам, чтобы усилить доказанную теорему. Для этого мы воспользуемся понятием флага, аналогичным введенному в § 3.2 для вещественных векторных пространств. Определение. Флагом в пространстве L называется последовательность подпространств L0 cLi С ••• cLn = L, (12.17) такая, что а) dim L^ = г для всех г = О,1,..., п, б) каждая пара полупространств (L;+i,lU) является направленной. Подпространство hi является гиперплоскостью в L^+i и, как мы видели (см. формулу (12.5)), определяет разбиение L^+i на два полупространства: L$+i \Lf = Lj_j UL^j. Как и раньше, пара (L^+i,L^) называется направленной, если указан порядок полупространств — например, через обозначение их L^j и LT^j. Заметим, что во флаге, определенном последовательностью (12.17), подпространство Lq имеет размерность 0, т.е. состоит из одной точки. Мы будем называть эту точку центром флага (12.17). Теорема 12.2. Для любых двух флагов пространства Лобачевского существует движение, переводящее первый флаг во второй. Такое движение существует ровно одно. Доказательство. Рассмотрим в пространстве L два флага ФиФ'с центрами в точках Р G L и Р' G L, соответственно. Пусть О £ L — точка, соответствующая прямой (en+i) в L, т.е. точка с координатами у\ = 0,... ,уп = О в соотношении (12.4). Согласно теореме 12.1, существуют движения / и /', переводящие Р в О и Р1 в О. Тогда флаги /(Ф) и /'(Ф') имеют центр в точке О. Каждый флаг представляет собой, по определению, последовательность подпространств (12.17) в L, которым соответствуют подпространства векторного пространства L. Таким образом, флагам /(Ф) и /'(Ф7) соответствуют две последовательности векторных подпространств (en+i) = 1_0 С Ц С • • • С Ц = L и (en+i) - 1'0 С Ц С • • • С \!п = L, где dim Ц = dim Ц = г + 1 для всех г — О,1,..., п. Напомним, что пространство L отождествлено с частью аффинного евклидова пространства Е, а именно, с внутренностью единичного шара U С Е, заданной соотношением (12.4). Для исследования L как части Е (см. рис. 12.1)
12.1. Пространство Лобачевского 435 нам удобно будет сопоставить каждому подпространству М с L, содержащему вектор еп+ь аффинное подпространство N С Е на единицу меньшей размерности, содержащее точку О. Для этого сначала сопоставим каждому подпространству М с L, содержащему вектор еп+ь векторное подпространство N с М, определенное разложением М = (en+i) © N. С учетом введенных ранее обозначений мы получаем, что N = ((en+i)±flM) = ((еь...,еп)ПМ) С (еь... ,еп) = Е0, т. е. N содержится в пространстве векторов аффинного пространства Е. Следовательно, векторное подпространство N с Eq определяет множество параллельных аффинных подпространств в Е, которые характеризуются тем, что их пространства векторов совпадают с N. Такие аффинные подпространства переводятся друг в друга сдвигом (см. с. 296), и для того, чтобы однозначно определить одно из них, достаточно только указать точку, содержащуюся в этом подпространстве. В качестве такой точки мы выберем О. Тогда векторное подпространство N с Ео однозначно определяет аффинное подпространство N С Е, при этом, очевидно, dimiV = dimN — dimM — 1. Таким образом, мы установили взаимно однозначное соответствие между fc-мерными векторными подпространствами М с L, содержащими вектор еп+ь и (к — 1)-мерными аффинными подпространствами N с Е, содержащими точку О. При этом, очевидно, понятия направленности для пары М'сМ и TV7 с N совпадают. В частности, флаги /(Ф) и /7(Ф7) пространства L с центром О соответствуют некоторым двум флагам евклидова аффинного пространства Е с центром в точке О. Согласно теореме 8.12 (с. 316) в евклидовом аффинном пространстве для любых двух флагов существует движение, переводящее первый флаг во второй. Так как в нашем случае оба флага имеют общий центр О, то это движение имеет неподвижную точку О, и, по теореме 8.11, оно есть некоторое ортогональное преобразование si евклидова пространства Eq. Рассмотрим д = ¥(si) — движение типа а) пространства L, соответствующее этому ортогональному преобразованию si. Очевидно, что оно переводит флаг /(Ф) в /7(Ф7), т.е. р/(Ф) = /'(Ф7)- Отсюда получаем, что f'~xgf{§) = Ф7, как и утверждалось в теореме. Остается доказать еще утверждение о единственности, содержащееся в формулировке теоремы. Пусть /i и /2 — два движения, переводящие некоторый флаг Ф с центром в точке Р в один и тот же флаг, т. е. такое, что /1(Ф) = /г(Ф). Тогда / = /f1^ является движением и /(Ф) = Ф. Если мы докажем, что / — тождественное преобразование, то отсюда будет следовать нужное нам равенство f\ = /2. Согласно теореме 12.1 существует движение д, переводящее точку Р в О. Положим Ф7 = д(Ф). Тогда Ф7 — флаг с центром в точке О. Из равенств /(Ф) = Ф и д(Ф) = Ф7 следует, что gfg~x{&) = Ф'. Обозначим движение 9f9~l через h. Оно, очевидно, переводит флаг Ф7 в себя и, в частности, обладает тем свойством, что h(0) = О. Из сказанного на с. 431 следует, что h является движением типа а), т.е. h — Р(«я^), где si — лоренцево преоб-
436 Гл. 12. Геометрия Лобачевского разование пространства L, которое, в свою очередь, определяется некоторым ортогональным преобразованием ^ евклидова пространства Ео. Пусть Ф;/ — флаг в евклидовом пространстве Ео, соответствующий флагу Ф' пространства L. Тогда из условия Л(Ф') = Ф' следует, что ^(Ф;/) = Ф", т.е. преобразование ^ переводит флаг Ф" в себя. Следовательно (см. с. 228), преобразование <%£ тождественно, откуда вытекает, что и определяемое им движение h тождественно. Из соотношения h = gfg~l тогда следует, что gf = д, т. е. / — тождественное преобразование. Итак, движения пространства Лобачевского обладают тем же свойством, которое установлено в § 8.4 (с. 316) для движений аффинных евклидовых пространств. В этом и заключается объяснение особого места пространств Лобачевского в геометрии. Норвежский математик Ли назвал это свойство «свободной подвижностью пространства». Существует теорема (которую мы не будем не только доказывать, но и точно формулировать), показывающая, что кроме пространства Евклида и пространства Лобачевского этим свойством обладает еще только одно пространство — так называемое пространство Римана (о нем немного будет сказано в § 12.3). Это утверждение называется теоремой Гелъмголъца-Ли. Для ее формулировки нужно было бы прежде всего определить, что здесь понимается под словом «пространство», но мы в это углубляться не будем. Выведенное нами свойство (теорема 12.2) достаточно для обсуждения аксиоматического обоснования геометрии Лобачевского. § 12.2*. Аксиомы геометрии на плоскости Геометрия Лобачевского исторически возникла в результате анализа системы аксиом Евклида. Взгляд на геометрию, согласно которому в основе ее лежит небольшое число утверждений, из которых все остальные результаты выводятся путем доказательств, возник в древней Греции примерно в VI в. до н.э. Традиция связывает его с именем Пифагора. Изложение геометрии с этой точки зрения содержится в «Началах» Евклида (III в. до н.э.). При развитии науки Нового времени этот взгляд был принят — долгое время геометрию преподавали прямо по книгам Евклида, потом появились упрощенные изложения. Более того, эта же точка зрения была распространена и на всю математику, и на физику. В таком духе написаны, например, «Математические начала натуральной философии» Ньютона. В физике и вообще в естествознании роль аксиом играло понятие «законов природы». В математике это направление мысли привело к более тщательному продумыванию системы аксиом Евклида. Те утверждения, которые Евклид кладет в основу своего изложения, он делит на три типа. Одни он называет «определениями», другие — «аксиомами», третьи — «постулатами» (принцип разделения двух последних современным исследователям не ясен). Многие из его «определений» вызывают сейчас вопросы. Например, следующее: «линия есть длина без ширины» (определение «длины» и «ширины» не дается). Некоторые «аксиомы» и «постулаты» (мы будем их все называть аксиомами) являются простыми следствиями других, так что их можно было бы
12.2. Аксиомы геометрии на плоскости 437 отбросить. Но более всего привлекал внимание «пятый постулат», который у Евклида был сформулирован так: И чтобы всякий раз, когда прямая при пересечении с двумя другими прямыми образует с ними внутренние односторонние углы, сумма которых меньше двух прямых, эти прямые пересекались с той стороны, с которой эта сумма меньше двух прямых. От других аксиом эта отличается тем, что ее формулировка заметно сложнее.. Поэтому возник (вероятно, еще в античности) вопрос: не может ли это утверждение быть доказано как теорема, исходя из других аксиом. Появилось громадное число «доказательств пятого постулата», в которых, однако, всякий раз находили логическую ошибку. Эти исследования все же помогли прояснению ситуации. Например, было доказано, что при наличии других аксиом пятый постулат равносилен тому утверждению о параллельных прямых, которое теперь обычно и приводится: через каждую точку А, не лежащую на прямой а, можно провести ровно одну прямую 6, параллельную а (прямые а и Ъ называются параллельными, если они не пересекаются). При этом существование прямой Ь, параллельной а и проходящей через точку Д может быть легко доказано. Все содержание пятого постулата сводится к утверждению о ее единственности. Наконец, в начале XIX в. ряд исследователей, среди которых был и Лобачевский, пришли к мысли, что доказательство пятого постулата невозможно, а его отрицание приводит к новой геометрии, логически не менее совершенной, чем геометрия Евклида, хотя содержащей в некоторых отношениях весьма непривычные для нее положения. Вопрос мог быть поставлен более точно в результате развития аксиоматического метода. Это и было сделано Пашем, Пеано и Гильбертом в конце XIX в. В своих работах по основаниям геометрии Гильберт сформулировал и те принципы, на которых строится аксиоматическая теория. Сейчас такой подход стал общепринятым, мы использовали его при определении векторных и евклидовых пространств. Общий принцип заключается в том, что фиксируется некоторое множество объектов, которые не определяются (например, в случае определения векторного пространства — это числа и векторы), и некоторые отношения, существующие между этими объектами, которые также не определяются (в случае определения векторного пространства — это сложение векторов и умножение их на числа). Наконец, приводятся аксиомы, фиксирующие определенные свойства введенных понятий (в случае определения векторного пространства они перечислены в § 3.1). При такой формулировке возможен только вопрос о непротиворечивости этой теории, т. е. вопрос о том, нельзя ли из данных аксиом вывести одновременно некоторое утверждение и его отрицание. Дальше мы приведем систему аксиом геометрии Лобачевского (ограничившись случаем размерности 2) и обсудим вопрос о ее непротиворечивости. Начнем с обсуждения аксиом. Те списки аксиом, которые Гильберт и его предшественники привели в первых своих работах, как оказалось, обладали некоторыми логическими дефектами — например, при рассуждениях на самом деле необходимо было использовать некоторые утверждения, которые в числе
438 Гл. 12. Геометрия Лобачевского аксиом не содержались. Гильберт потом сам дополнял свою систему аксиом. Позже эту систему аксиом упрощали, чтобы достичь большей наглядности. Мы воспользуемся1) системой аксиом, предложенной немецким геометром Фридрихом Шуром. При этом мы ограничимся (исключительно для краткости) лишь аксиоматикой плоскости. Плоскостью называется некоторое множество П, элементы которого А, В и т.д. называются точками. Некоторые взаимно однозначные отображения /: П —* П называются движениями. Это и есть основные объекты. Отношения между ними выражаются в том, что: А) Выделены некоторые подмножества 1,1' и т.д. множества П, которые называются прямыми. То, что элемент А е П содержится в подмножестве I, выражается словами «точка А принадлежит прямой I» или же «прямая I проходит через точку А». Б) Для любых трех точек А,ВиС, принадлежащих одной прямой I, указано, когда считается, что точка С лежит между точками Аи В. Это должно быть определено для любой прямой I и любых трех разных лежащих на ней точек. Эти объекты и отношения удовлетворяют условиям, называемым аксиомами, которые удобно объединить в несколько групп: I. Аксиомы связи: /. Для любых двух точек существует проходящая через них прямая. 2. Если эти точки различны, то такая прямая существует только одна. 3. На каждой прямой лежат по крайней мере две точки. 4. Для любой прямой существует не лежащая на ней точка. II. Аксиомы порядка: /. Если на некоторой прямой I точка С лежит между точками А и В, то она отлична от них и также лежит между точками В и А. 2. Если А и С — две различные точки некоторой прямой, то на этой прямой есть хотя бы одна такая точка В, что С лежит между точками А и В. 3. Из трех точек А, В и С, лежащих на одной и той же прямой, не более одной точки лежит между двумя другими. Перед формулировкой последней аксиомы этой группы дадим некоторые новые определения. Совокупность всех точек С некоторой прямой /, проходящей через точки А и В, лежащих между ними (включая сами точки А и В), называется отрезком с концами А и В и обозначается как [А,В]. Аксиома 2 группы II может быть переформулирована в виде [А,С] =£1\(АиС), неравенство здесь понимается как неравенство множеств. То, что отрезок [А, В] содержит точки, отличные от А и В, доказывается на основании аксиом группы I и последней аксиомы группы II, к формулировке которой мы сейчас переходим. Три точки А,ВиС, не лежащие на одной прямой, называются треугольником и обозначаются через [А, В, С]. Отрезки [А, В], [В, С] и [С, А] называются сторонами треугольника [А, В, С]. О Следуя ходу мысли Б.Н. Делоне, изложенному в его брошюре «Элементарное доказательство непротиворечивости планиметрии Лобачевского», М.: 1956.
12.2. Аксиомы геометрии на плоскости 439 случай 1 случай 2 Рис. 12.3. Пересечение прямой сторон треугольника 4. Аксиома Паша. Если точки А, В и С не лежат на одной прямой, ни одна из них не принадлежит прямой I, и прямая I пересекает одну сторону треугольника [А, В, С], то она пересекает и какую- то другую его сторону. Иначе говоря, если прямая I имеет общую точку D с прямой- V, проходящей через А и В, лежащую между ними на 1\ то прямая / или имеет общую точку Е с прямой 1\, проходящей через В и С, лежащую между ними на 1\, или имеет общую точку F с прямой fa, проходящей через А и С, лежащую между ними на fa. Оба случая, о которых идет речь в последней аксиоме, изображены на рис. 12.3. III. Аксиомы движения. /. Для всякого движения f обратное отображение f~l (существующее по определению движения как взаимно однозначного отображения множества Ц) также является движением. 2. Последовательное выполнение двух движений является движением. 3. Движение сохраняет порядок точек. То есть движение f переводит прямую I в прямую f(l), и если точка С прямой I лежит между точками А и В этой прямой, то точка /(С) прямой f(l) лежит между точками f(A) и f(B). Формулировка четвертой аксиомы движения требует некоторых результатов, которые могут быть получены как следствия аксиом связи и порядка. Мы не будем здесь их доказывать, а только приведем формулировки1). Начнем со свойств прямой. Пусть на прямой I выбрана точка О. Точки А и В этой же прямой, каждая из которых отлична от О, называются лежащими по одну сторону от О, если О не лежит между А и В. Если выбрать некоторую точку А, отличную от О, то точки В, отличные от О и лежащие вместе с А по одну сторону от О, образуют некоторое подмножество множества точек прямой Z, называемое полупрямой и обозначаемое Z4". Доказывается, что если выбрать в этом подмножестве другую точку А', то определенная с ее помощью полупрямая будет та же. Здесь важен только выбор точки О. Если выбрать такую точку А\, что О лежит между А и А\, то точка А\ определит другую полупрямую, обозначаемую 1~. Полупрямые 1+ и 1~, определяемые точками А и А\, не пересекаются, и в объединении дают I \ О, т. е. 1+ П 1~ = 0 и l+ U Ul~ = 1\0. Аналогичные свойства можно проверить для прямой / на плоскости П. Рассмотрим две точки А и В, не принадлежащие прямой I. Говорят, что они лежат по одну сторону от I, если либо проходящая через них прямая V О Часть из них доказывается в школьном курсе геометрии и, во всяком случае, элементарные доказательства всех этих результатов можно найти в книге Н. В. Ефимова «Высшая геометрия» (М.: 1953, гл. II).
440 Гл. 12. Геометрия Лобачевского не пересекает прямую /, либо прямые I и V пересекаются в такой точке С, которая не лежит между точками А и В на прямой V. Множество точек, не лежащих на прямой I и лежащих по ту же сторону от I, что и точка А, называется полуплоскостью. Опять можно доказать, что выбрав в этой полуплоскости другую точку А' вместо А, мы определим то же самое множество. Существуют две точки А и А\ не принадлежащие одной полуплоскости. Как бы мы ни выбирали эти точки (при фиксированной прямой I), мы всегда получим такие два подмножества П+ и П~ плоскости П, что П+ П П~ = 0 и П+ U П" = П \ I. Пусть дана точка О и прямая I, проходящая через нее. Если в разбиении I \ О на две полупрямые отмечена одна из них, а в разбиении П \ I на две полуплоскости отмечена одна из них (например, обозначением 1+ и П+, соответственно), то пару (0,1) называют флагом и обозначают через Ф. Как следует из сказаного в § 12.1, это частный случай (при п — 2) введенного там общего понятия флага. Всякое движение переводит любой флаг во флаг, т. е. если / — движение и Ф — флаг (О,/), то множества /(/)+ и f(l)~, объединением которых является f(l) \ /(О), совпадают с /(/+) и /(/""), где 1+ и 1~ — полупрямые на прямой I, определенные точкой О. При этом их порядок может измениться. Аналогично, пара полуплоскостей /(П)+ и /(П)~, определенных прямой f(l), совпадает с парой /(П+) и /(П~), где П+ и П~ — полуплоскости, определенные прямой I. Их порядок также может измениться. Теперь мы можем сформулировать последнюю (четвертую) аксиому движения: 4. Аксиома свободной подвижности. Для любых двух флагов Ф и Ф' существует движение f, переводящее первый флаг во второй, т. е. /(Ф) = Ф;. Такое движение существует только одно, оно определяется флагами Ф и Ф' однозначно. IV. Аксиома непрерывности. Пусть множество точек некоторой прямой I произвольным образом представлено как объединение двух множеств М\ и М% причем ни одна точка множества М\ не лежит между двумя точками множества М% и наоборот. Тогда существует такая точка О прямой I, что М\ и М2 совпадают с полупрямыми прямой I, определенными точкой О, к любой из которых, быть может, присоединена точка О. Эта аксиома называется также аксиомой Дедекинда. Приведенные нами аксиомы I—IV называются аксиомами «абсолютной геометрии». Они общие и для геометрии Евклида, и для геометрии Лобачевского. Последние две геометрии различаются добавлением одной аксиомы, касающейся параллельных прямых. Напомним, что так называются прямые, не имеющие общих точек. Таким образом, в обоих случаях добавляется еще одна V. Аксиома о параллельных: /. ( В геометрии Евклида.) Для любой прямой I и любой не принадлежащей ей точки А существует не более одной прямой V, проходящей через точку А и параллельной I.
12.2. Аксиомы геометрии на плоскости 441 /'. (В геометрии Лобачевского.) Для любой прямой I и любой не принадлежащей ей точки А проходят по крайней мере две различные прямые V и I", параллельные I. Разумный интерес именно к этим двум аксиомам определяется тем, что уже в абсолютной геометрии (т. е. только на основании аксиом I—IV групп) можно доказать, что для любой прямой и любой не принадлежащей ей точки А существует по крайней мере одна прямая V, проходящая через точку А и параллельная I. Теперь можно более точно сформулировать ту цель, которую ставили себе математики, пытавшиеся «доказать пятый постулат» — вывести утверждение 1 в группе аксиом V из аксиом групп I—IV. Убеждение же, к которому пришел Лобачевский (и несколько других исследователей той же эпохи), заключалось в том, что это невозможно, а значит, система, состоящая из аксиом групп I—IV, и аксиомы 1', непротиворечива. Собственно говоря, мы могли бы задаться подобными вопросами и раньше, в связи с любой встречавшейся нам теорией, базирующейся на некоторой системе аксиом, например, теории векторных или евклидовых пространств. Вопрос о непротиворечивости понятий векторных или евклидовых пространств решается просто: достаточно указать (в случае вещественных пространств) на М.п как примеры векторных пространств любой конечной размерности или как евклидовых пространств со скалярным произведением (ж, у) = = Х\У\ Н \~ хпУп- Конечно, это предполагает построение и доказательство непротиворечивости теории вещественных чисел, но последний вопрос лежит вне нашей области, и мы им заниматься не будем. Принимая же как данное, что свойства вещественных чисел определены и сомнений не вызывают, мы можем, например, сказать, что если бы система аксиом вещественного векторного пространства, приведенная в § 3.1, была бы противоречива, то мы могли бы получить два противоречащих друг другу утверждения для пространства R71. Однако любое утверждение для пространства Rn, согласно определению, может быть сведено к утверждению о вещественных числах, и тогда мы получили бы противоречие в области вещественных чисел. Такой же вопрос можно было бы задать и относительно геометрии Евклида, т. е. относительно системы аксиом, состоящей из аксоим групп I—IV и аксиомы 1 группы V. Здесь ответ, по существу, уже известен, поскольку мы построили теорию аффинных евклидовых пространств (даже в произвольной размерности п). Легко убедиться, что при п = 2 здесь выполняются все приведенные нами аксиомы евклидовой геометрии. Некоторые уточнения, пожалуй, нужны только в связи с группой аксиом порядка. Эти аксиомы не требуют евклидовости пространства и сформулированы для произвольного аффинного вещественного пространства V в § 8.2. Все утверждения, составляющие аксиомы порядка, теперь прямо следуют из свойств порядка вещественных чисел, за исключением только аксиомы Паша. Смысл ее заключается в том, что если прямая «входит» в треугольник, то она должна из него «выйти». Интуитивно это очень убедительно, но при нашем подходе мы должны вывести это утверждение из свойств аффинных
442 Гл. 12. Геометрия Лобачевского пространств. Это очень простое рассуждение, детали которого мы предоставляем заполнить читателю. Именно, согласно тому, что нам дано, точки Аи В (будем использовать те же обозначения, что и в формулировке аксиомы) лежат в разных полуплоскостях, на которые прямая I делит плоскость П. Все зависит от того, к какой полуплоскости принадлежит точка С: к той же, что и А, или к той же, что и В. В первом случае прямая I имеет общую точку с прямой \<i, которая лежит на ней между Б и С, во втором — общую точку с прямой 1\, которая лежит между А и С (рис. 12.3). В каждом из этих двух случаев утверждение аксиомы Паша легко проверить, вспомнив определения. Выполнение остальных аксиом фактически было нами в том или ином виде проверено, даже как утверждения, относящиеся к пространству произвольной размерности. Теперь мы обратимся к аксиомам геометрии Лобачевского, т. е. аксиомам групп I—IV и аксиоме V группы V. Мы докажем их непротиворечивость, основываясь на непротиворечивости обычных свойств (которые также легко можно свести к нескольким аксиомам) совокупности вещественных чисел R и построенной на основе этого теории евклидовых пространств размерности 2 и 3. На этой базе мы докажем следующий результат: Теорема 12.3. Система аксиом геометрии Лобачевского непротиворечива. Доказательство. Рассмотрим на евклидовой плоскости L открытый круг К, (например, заданный в некоторой системе координат условием х2_+у^ < 1). Множество его точек будем называть «плоскостью» (обозначая П), а «точками» — только точки этого круга. Каждая прямая I плоскости L, если она имеет хотя бы одну общую точку с кругом К, пересекает его по внутренности некоторого отрезка (это было доказано в предыдущем параграфе). Такие непустые пересечения I П К будем называть «прямыми», обозначая их 1J и т.д. Наконец, «движениями» будем называть проективные преобразования плоскости L, переводящие круг К в себя. Так как определение проективных преобразований предполагает рассмотрение проективной плоскости, а проективное пространство размерности п и его проективные преобразования были определены в гл. 9 с помощью векторного пространства размерности п + 1, то для анализа плоскости Лобачевского нам нужно здесь использовать понятия, связанные с трехмерным векторным пространством. Однако нетрудно было бы дать формулировки, апеллирующие лишь к свойствам евклидовой плоскости. Теперь определим основные отношения между «прямыми» и «точками». То, что «прямая» I проходит через «точку» А е П, будем понимать как усло^ вие, что прямая I проходит через точку А. Таким образом, любая «прямая» 1 есть множество принадлежащих ей «точек». Пусть «точки» А,ВиС лежат на «прямой» I. Будем говорить, что «точка» С лежит между «точками» А и В, если это верно для А,ВиС как точек евклидовой прямой I, содержащей I (это имеет смысл, так как I содержится в евклидовом пространстве).
12.2. Аксиомы геометрии на плоскости 443 Остается проверить, что указанные понятия и соотношения удовлетворяют аксиомам геометрии Лобачевского, т.е. аксиомам групп I—IV и аксиоме 1' группы V. Проверка этого для аксиом групп I, II и IV тривиальна, так как соответствующие объекты и отношения определены так же, как и в объемлющей евклидовой плоскости. Для аксиом группы III (аксиом движения) нужные нам свойства были доказаны (даже для случая пространства произвольной размерности п) в предыдущем параграфе. Нам остается рассмотреть только аксиому V группы V. Пусть I — «прямая», соответствующая прямой I евклидовой плоскости L. Тогда прямая I пересекает границу S круга К в двух различных точках: Р' и Р". Пусть А — «точка» плоскости П (т.е. точка круга К), не лежащая на прямой I. Согласно аксиомам геометрии Евклида через точки А и Р' плоскости L проходит некоторая прямая V. Она определяет «прямую» I = V П К «плоскости» П. Аналогично, точка РП определяет «прямую» Т=1"ПК (рис. 12.4). Прямые V и I" различны, так как они проходят через разные точки Р' и Р" плоскости L. Поэтому, согласно аксиомам геометрии Евклида, они не имеют других общих точек, кроме А. Но «прямые» 7 и 1 , как непустые отрезки евклидовых прямых с исключенными концами, содержат бесконечно много точек и, в частности, «точки» В' el и В" е J , причем В1 ф В". Значит, «прямые» f и f различны. С другой Рис 12А <<ПрЯмые» и «точки» стороны, В смысле наших определений обе ОНИ плоскости Лобачевского параллельны «прямой» I, т. е. не имеют общих с ней «точек» (точек из круга К). Например, прямая V имеет с I общую точку Рг на евклидовой плоскости L, значит, согласно аксиомам геометрии Евклида, они не имеют никаких других общих точек — и в частности, общих точек из круга К. _ Мы видим, что утверждение 1' верно для любой «прямой» / с П и любой «точки» А £ I. Предположим теперь, что из аксиом геометрии Лобачевского можно было бы вывести противоречивое утверждение (т. е. некоторое утверждение и его отрицание). Тогда мы могли бы применить то же рассуждение к понятиям, которые выше, при доказательстве теоремы 12.3, мы писали в кавычках: «точка», «плоскость», «прямая» и «движение». Так как они, как мы видели, удовлетворяют всем аксиомам геометрии Лобачевского, то мы снова пришли бы к противоречию. Но понятия «плоскость», «прямая» и «движение», а также отношение «лежать между» для трех точек прямой были определены нами в терминах геометрии Евклида. Тем самым мы пришли бы к противоречию внутри самой геометрии Евклида. Обратим внимание на эту тонкую логическую конструкцию: мы строим в некоторой области объекты, удовлетворяющие некоторой системе аксиом и тем самым доказываем непротиворечивость этой системы, если непротиворечивость той области, из которой берутся нужные объекты, уже не вызывает сомнений. Теперь говорят, что тем самым строится модель этой системы
444 Гл. 12. Геометрия Лобачевского аксиом в другой области. Мы, в частности, построили выше модель геометрии Лобачевского в теории векторных пространств. Только путем построения такой модели вопрос о доказуемости «пятого постулата» и был в математике решен. В заключение интересно остановиться на истории этого вопроса. Независимо от Лобачевского ряд исследователей пришел к выводу, что отрицание «пятого постулата» приводит к содержательной и непротиворечивой области — «новой геометрии», впоследствии названной «неевклидовой». Вопрос о приоритете здесь не стоит — все эти исследователи явно были независимы друг от друга (переписка Гаусса 20-х гг. XIX в., публикации Лобачевского 1829 г. и Больяи 1832 г.). Большая часть из тех, о ком стало потом известно, были «дилетанты» — не специалисты-математики. Но были и некоторые исключения: кроме Лобачевского, величайший математик той эпохи — Гаусс. Большинство известных нам исследователей, явно независимо пришедших к тем же выводам, что и Лобачевский, стали известны именно благодаря их переписке с Гауссом, опубликованной, как и все оставшиеся от Гаусса материалы, после его смерти. Из этих публикаций видно, что Гаусс с ранней молодости пытался доказать «пятый постулат», но потом пришел к выводу о существовании непротиворечивой и содержательной геометрии, в которой он не выполняется. Гаусс с интересом обсуждал в частной переписке аналогичные взгляды своих корреспондентов. Явно с сочувствием он воспринял и работы Лобачевского, когда они стали появляться на иностранных языках, по его предложению Лобачевский был избран членом Геттингенской академии наук. В дневнике Гаусса можно увидеть написанное русскими буквами: НИКОЛАЙ ИВАНОВИЧ ЛОБАЧЕВСКИЙ. Но поразительно, что Гаусс сам за всю свою жизнь не опубликовал на эту тему ни строчки. Почему? Обычно говорят, что он боялся быть непонятым. Действительно, в одном письме, где затрагивается вопрос о «пятом постулате» и неевклидовой геометрии, Гаусс пишет: «бойтесь крика беотийцев». Но кажется, что этот стимул не может быть полным объяснением его загадочного молчания: в других своих работах Гаусс не боялся быть непонятым читателями1). Возможно, однако, другое объяснение молчания Гаусса: он один из немногих понимал, что, как бы много интересных теорем неевклидовой геометрии ни было выведено, это еще ничего не доказывает — всегда теоретически остается возможность, что в качестве дальнейших следствий будет получено противоречивое утверждение. А может быть, Гаусс понимал (или чувствовал), что в то время (первая половина XIX в.) еще не найдены математические понятия, позволяющие точно поставить и решить этот вопрос. Видимо, к небольшому числу математиков, понимавших это, кроме Гаусса относился и Лобачевский. Для него, как и для Гаусса, стоял вопрос «непонимания». Для Лобачевского — в первую очередь непонимания русскими математиками, в основном, аналитиками, абсолютно не воспринимавшими его 1) Например, первая опубликованная им книга «Теоретико-числовые исследования» долгое время слыла недоступной для понимания.
12.2. Аксиомы геометрии на плоскости 445 работы. Во всяком случае, он постоянно пытался найти непротиворечивое обоснование своей геометрии. Например, обнаружил поразительный ее параллелизм со сферической геометрией и высказал мысль, что она является «геометрией на сфере мнимого радиуса». Его геометрию действительно можно было бы реализовать в виде некоторой другой модели, если бы само понятие модели было в то время достаточно разработано. Сверх того (на что обратил внимание ныне покойный французский математик А. Вейль), здесь мы имеем простейший случай двойственности между симметрическими пространствами компактного и некомпактного типа, открытой уже в XX в. Э. Картаном. Более того, Лобачевский доказал, что в трехмерном пространстве Лобачевского есть такая поверхность (называемая теперь орисферой), что если рассматривать только ее точки, а прямыми считать принадлежащие ей кривые определенного типа (называемые теперь орициклами), то будут выполняться все аксиомы геометрии Евклида. Отсюда следует, что если геометрия Лобачевского непротиворечива, то и геометрия Евклида также непротиворечива. Если даже и принять гипотезу, что не выполняется «пятый постулат», то геометрия Евклида реализуется на орисфере. Таким образом, в принципе Лобачевский был весьма близок к концепции модели. Но модель геометрии Лобачевского в рамках геометрии Евклида ему построить не удалось. Построение ее далось математикам нелегко. Следующий абзац претендует лишь на намек, а не на точную формулировку соответствующих утверждений. Сначала, в 1868 г., Бельтрами построил в трехмерном пространстве Евклида некоторую поверхность называемую псевдосферой или поверхностью Бельтрами, гауссова кривиза которой (см. определение на с. 268) в каждой точке равна одному и тому же отрицательному числу. На псевдосфере реализуется геометрия Лобачевского, причем роль прямых играют так называемые геодезические линии1). Однако речь идет только о куске псевдосферы и куске плоскости Лобачевского. При этом должна быть коренным образом изменена постановка вопроса, так как большинство приведенных нами аксиом предполагают (например, в геометрии Евклида) возможность продолжения прямой до бесконечности. Совпадение двух ограниченных кусков понимается в смысле совпадения измерения длин и углов, о чем, в случае геометрии Лобачевского, будет сказано в следующем параграфе. Более того, позже Гильберт доказал, что плоскость Лобачевского не может быть в таком смысле целиком отождествлена ни с какой поверхностью в трехмерном пространстве (гораздо позже было доказано, что это возможно для некоторой поверхности в 5-мерном пространстве). Изложенная нами при доказательстве теоремы 12.3 модель геометрии Лобачевского была построена Ф. Клейном в 1870 г. История ее возникновения тоже поразительна. Формально говоря, эту модель построил английский математик А. Кэли в 1859 г. Но он рассматривал ее лишь как некоторую конструкцию в проективной геометрии и, видимо, не заметил никакой связи ее с неевклидовой геометрией. В 1869 г. с его работой познакомился молодой 1) Более подробно об этом можно прочитать, например, в книге А. С. Мищенко, А. Т. Фоменко «Курс дифференциальной геометрии и топологии» (М.: 2000, § 2 гл. IV).
446 Гл. 12. Геометрия Лобачевского (20-летний) Клейн. Он вспоминает, что в 1870 г. сделал доклад о работах Кэли на семинаре знаменитейшего тогда математика Вейерштрасса и, как он пишет, «закончил его вопросом, не существует ли связи между идеями Кэли и Лобачевского. Я получил ответ, что это — две далеко отстоящие по идее системы». Как говорит Клейн, «я позволил переубедить себя этими возражениями и отложил в сторону уже созревшую мысль». Однако в 1871 г. он к этой мысли вернулся, оформил ее математически и опубликовал. Но и тогда его работа была воспринята не всеми. В частности, сам Кэли до своей смерти был убежден, что здесь есть какая-то логическая ошибка. Только через несколько лет эти идеи были полностью восприняты математиками. Разумеется, можно поставить вопрос не только о существовании геометрий Евклида и Лобачевского, но и о множестве разных (в каком-то смысле) геометрий. Здесь мы только сформулируем относящиеся сюда результаты1). Прежде всего, нужно придать точный смысл тому, что мы будем считать «разными» или «одинаковыми» геометриями. Это делается при помощи понятия изоморфизма геометрий, аналогичного введенному ранее понятию изоморфизма векторных пространств. В рамках принятой в этом параграфе системы аксиом это можно сделать следующим образом. Пусть ПиП'- две плоскости, удовлетворяющие аксиомам групп I—IV, a G и G — множества их движений. Отображения (р: П —> П' и ф: G —> G' определяют изоморфизм (<£, ф) этих геометрий, если выполнены следующие условия: 1) Оба отображения (риф взаимно однозначны. 2) Отображение ip переводит каждую прямую I на плоскости П в некоторую прямую (р(1) на плоскости П7. 3) Отображение (р сохраняет отношение «лежать между». Это значит, что если точки А, В и С принадлежат прямой Z, причем С лежит между А и В, то точка (р{С) лежит между <р(А) и (р(В) на прямой (р{1). 4) Отображения (риф согласованы в следующем смысле: для любого движения /gG его образ ф(/) = (pf(p~l. Это значит, что для любой точки A G П выполнено равенство (ф(/))((р(А)) = (p(f(A)). 5) Для каждого движения / е G выполнено ф(/~1) = Ф(/)~ , для любых двух движений /ь/г Е G имеет место равенство ^(/1/2) = Ф(1\)/Ф(/2)- Заметим, что некоторые из этих условий можно вывести из других, но для краткости мы не будем приводить вывод. Мы будем рассматривать геометрии с точностью до указанного изоморфизма, т. е. считать одинаковыми такие, между которыми изоморфизм существует. В частности, геометрии с аксиомами 1 и 1' в группе V, очевидно, не изоморфны друг другу, т. е. различны. С этой точки зрения геометрии (на плоскости), удовлетворяющие аксиомам 1 и I7, кардинально отличаются друг от друга. А именно, доказано, что все геометрии, удовлетворяющие аксиоме 1 в группе V, изоморфны2). Геометрии же, удовлетворяющие аксиоме 1' в группе V, с точностью до изоморфизма характеризуются некоторым 1) Их доказательства содержатся в любом курсе высшей геометрии, например, в упоминавшейся уже книге Н.В. Ефимова «Высшая геометрия» (М.: 1953, гл. II). 2) Конечно, при этом предполагается, что для них выполнены все аксиомы групп I—IV.
12.3. Некоторые формулы геометрии Лобачевского 447 вещественным числом с, называемым кривизной. Это число обычно полагают отрицательным, тогда оно может принимать любое значение с < 0. Клейн указывает, что евклидову геометрию можно рассматривать как предельный случай геометрии Лобачевского при стремлении отрицательной кривизны с к нулю1). Как замечает далее Клейн, из этого следует, что если в нашем мире выполнена аксиома 1 (Евклида), то мы этого никогда не узнаем. Так как всякое физическое измерение происходит с некоторой погрешностью, то установить точное равенство с — 0 невозможно, ведь всегда остается возможность, что число с < 0, но настолько мало по модулю, что лежит за пределами точности измерений. § 12.3*. Некоторые формулы геометрии Лобачевского Прежде всего мы определим расстояние между точками плоскости Лобачевского, используя ее определение как множества точек проективной плоскости P(L), соответствующих прямым трехмерного псевдоевклидова пространства L, содержащимся внути светового конуса, и ее интерпретацию как множества точек единичного круга U в аффинной евклидовой плоскости Е, см. § 12.1. Смысл понятия расстояния заключается в том, что оно должно сохраняться при движениях плоскости Лобачевского. Движение же мы определили как некоторое специальное проективное преобразование Р(^) проективной плоскости P(L). Теорема 9.5 показывает, что, вообще говоря, невозможно связать не только с двумя, но даже и с тремя точками проективной прямой такое число, которое бы не менялось при произвольных проективных преобразованиях. Но мы воспользуемся тем, что движения плоскости Лобачевского — это не произвольные проективные преобразования P(L), а только такие, которые переводят в себя световой конус в пространстве L. Именно, любым двум точкам А и В соответствуют прямые (а) и (6), находящиеся внутри светового конуса. Мы покажем, что они определяют еще две точки — Р и Q, которые соответствуют прямым, лежащим на световом конусе. Но четыре точки проективного пространства, принадлежащие одной прямой, уже определяют число, не меняющееся при любых проективных преобразованиях, — их двойное отношение (определенное в § 9.3). Его мы и используем для определения расстояния между точками А и В. Это определение имеет ту особенность, что использует точки, соответствующие прямым, лежащим на световом конусе (Р и Q), которые, таким образом, не являются точками плоскости Лобачевского. Будем предполагать, что точки А и В различны (если они совпадают, то расстояние между ними по определению равно нулю). Это значит, что векторы а и Ъ линейно независимы. Очевидно, что тогда через эти точки проходит единственная проективная прямая I, она соответствует плоскости L' = (а, 6). Прямая I определяет прямую V в аффинном евклидовом пространстве Е, изображенном на рис. 12.1 и 2. Так как прямая V содержит точки А [)Ф. Клейн. «Неевклидова геометрия» (М.-Л.: 1936).
448 Гл. 12. Геометрия Лобачевского и В, лежащие внутри круга С/, то она пересекает его границу в двух точках, которые мы и примем за Р и Q. Это фактически уже было доказано в § 12.1, но мы сейчас повторим соответствующее рассуждение. Точки прямой I — это прямые (ж), состоящие из всех векторов, пропорциональных векторам х = О A + tAB, где t — произвольное вещественное число. При этом вектор О А = а, а вектор АВ = с принадлежит подпространству Eq, если мы считаем, что точки А,Ви прямая I содержатся в аффинном пространстве Е. Значит, х = а + tc, причем вектор с можно считать фиксированным, а число t — переменным. Точки х пересечения прямой V со световым конусом V с L задаются условием (ж2) = 0, т. е. ((а + tcf) = (а2) + 2(а, c)t + (c2)t2 = 0. (12.18) Нам известно, что (а2) < 0, а вектор с е Ео- Так как Eq — евклидово векторное пространство, и точки А и В различны, то (с2) > 0. Из этого следует, что квадратное уравнение (12.18) относительно неизвестной t имеет два вещественных корня t\ и t^ разных знаков. Пусть, для определенности, t\ < <2- Тогда при t\ < t < £2 величина ((а + tcf) отрицательна, и все точки прямой V', соответствующие значениям t из этого интервала, содержатся в L. Мы видим, что прямая I пересекает световой конус V в двух точках, соответствующих значениям t = t\ и t = t<i, а значениям t\ < t < *2 соответствуют точки прямой Li (т.е. одномерного пространства Лобачевского), проходящей через А и В. Таким образом, прямая Li совпадает с отрезком прямой I с Е, имеющим концы в точках Р и Q, которые соответствуют значениям t = t\ nt = t2 (рис. 12.5). Очевидно, что точка А содержится в интервале _£_ о о <Р (P,Q)- Применяя к точке В те же рассуждения, по- Р 12 5 0 \РО\ лУчаем> что точка В тоже содержится в интервале Выберем обозначения точек Р и Q таким образом, что через Р будет обозначен тот конец интервала (P,Q), который ближе (в смысле евклидова расстояния) к точке А, а через Q — тот конец, который ближе к В, как это изображено на рис. 12.5. Теперь можно дать определение расстояния между точками А и Б, которое мы обозначим через г{А,В)\ r(A£)=logDV(AS,Q,P), (12.19) где DV (А, В, Q, Р) — двойное отношение (см. с. 336). Заметим, что в определении (12.19) не указывается основание логарифма. Можно было бы взять любое основание, большее 1, так как изменение его приводит к умножению всех расстояний на одно и то же положительное число. Но ведь и длина отрезка АВ может быть определена только с точностью до такого множителя, который соответствует произволу в выборе единицы длины на прямой.
12.3. Некоторые формулы геометрии Лобачевского 449 Почему в определении (12.19) участвует логарифм, мы поясним немного позже. Смысл же того, что здесь используется двойное отношение, объясняется следующим результатом: Теорема 12.4. Расстояние г (А, В) не меняется при произвольном дви- эюении f плоскости Лобачевского, т. е. r(f(A),f(B)) = г (А, В). Доказательство. Утверждение теоремы сразу же следует из того, что движение / плоскости Лобачевского определяется некоторым проективным преобразованием Р(л^). Это преобразование ¥(&/) переводит прямую 1\ проходящую через точки А и В, в прямую, проходящую через точки ¥(я/)(А) и ¥(^/)(В). Значит, это преобразование переводит точки Р и Q пересечения прямой V с границей круга U в точки Р' и Q' пересечения прямой ¥(&/)(1') с этой границей. То есть, Р' = Р(^)(Р) и Q' = ¥(^)(Q) или наоборот, Ql = P(j2/)(P) и Р' = F(s2/)(Q). При этом преобразование Р(^) сохраняет двойное отношение четырех точек на прямой (теорема 9.6). Для объяснения роли двойного отношения мы забежали несколько вперед и пропустили проверку того, что под знаком логарифма в формуле (12.19) стоит число, большее 1, и что для определенного таким образом г (А, В) выполнены все условия, входящие в определение расстояния (с. 14). Теперь мы к этому вернемся. Предположим, что точки Р, А, В, Q расположены в том порядке, что и на рис. 12.5. Для двойного отношения мы можем воспользоваться формулой (9.28): DVWB-«-p)-|^n^}>1- <12'20) так как, очевидно, \AQ\ > \BQ\ и \РВ\ > \РА\. Поэтому под знаком логарифма в формуле (12.19) стоит число, большее 1, и логарифм является положительным вещественным числом. Следовательно, г (А, В) > О для любых различных точек А и В. Заметим, что можно было бы отказаться от выбранного нами порядка точек Р и Q. Для этого достаточно проверить (это непосредственно следует из определения двойного отношения), что при перестановке точек Р и Q двойное отношение d превращается в 1/rf. Таким образом, логарифм (12.19), задающий расстояние, определен с точностью до знака, и мы можем определить расстояние как его абсолютную величину. Если поменять местами точки А и В, то определенные согласно принятому нами соглашению точки Р и Q тоже поменяются местами. Легко проверить, что двойное отношение, определяющее расстояние по формуле (12.19), при этом не изменится. Иначе говоря, имеет место равенство г(В,А) = г(ДВ). (12.21) Для любой третьей точки С, принадлежащей той же прямой, что А и В, и лежащей между ними, выполнено условие г(А, В) = г(Д С) + г{С, В). (12.22) 15 А. О. Ремизов, И. Р. Шафаревич
450 Гл. 12. Геометрия Лобачевского Оно вытекает из того, что (в принятых нами обозначениях) DV (А, В, Q, Р) = j^gj'.^j = DV (А, С, Q, Р) ■ DV {С, В, Q, Р), (12.23) так как ™^c-wJmffi- ™v-B-** = &!$%■ (1224> Для проверки остается только подставить выражения (12.24) в формулу (12.23). В любом достаточно полном курсе геометрии доказывается без использования аксиомы о параллельных (т.е. в рамках «абсолютной геометрии»), что существует функция г (А, В) пары точек Аи В, удовлетворяющая следующим условиям: 1. г (Д В) > 0, если А ф В, и г (А, В) = 0, если А = В; 2. г(В,А) — г (А, В) для любых точек А и В; 3. г(А,В) = г {А, С) +г(С,В) для любой точки С, принадлежащей той же прямой, что и А, В и лежащей между ними; и главное — 4. функция г(А,В) не меняется при движениях. Используя определения, данные в начале книги, можно кратко сказать, что г(А,В) — метрика на множестве точек рассматриваемой нами плоскости и движения являются изометриями данного метрического пространства. Такая функция единственна, если зафиксировать две разные точки Aq и Во» Для которых г(Ао,Во) = 1 («единица измерения»). Значит, эти утверждения верны и в геометрии Лобачевского, и формула (12.19) определяет это расстояние (а основание логарифма в (12.19) выбирается в соответствии с выбранной «единицей измерения»). Для любых трех точек А, В, С выполняется свойство г(Д В) < г(Д С) + г(В, С). (12.25) Это — известное неравенство треугольника, и во многих курсах геометрии оно выводится без использования аксиомы о параллельных, т. е. как теорема «абсолютной геометрии». Тем самым неравенство (12.25) верно и в геометрии Лобачевского. Но мы сейчас приведем прямое его доказательство, принадлежащее Гильберту. Напомним, что в рассматриваемой нами модели точками плоскости Лобачевского являются точки круга К на евклидовой плоскости L, а прямыми плоскости Лобачевского — отрезки прямых плоскости L, лежащие внутри круга К. Рассмотрим три точки А, В, С в круге К. Точки пересечения с границей круга К прямой, проходящей через А и Б, обозначим через Р и Q; прямой, проходящей через А и С — через U и У; а прямой, проходящей через В и С, - через S и Г (рис. 12.6). Точку пересечения прямой АВ и прямой SU обозначим X, а точку пересечения прямой АВ и прямой TV — Y. Тогда имеет место неравенство DV {А, Б, Г, X) ^ DV (А, Б, Q, Р). (12.26)
12.3. Некоторые формулы геометрии Лобачевского 451 Действительно, левая часть (12.26) по определению равна \AY\ • \ВХ\ БУ(ЛБ,Г,Х) = (12.27) \BY\-\AX\' а его правая часть задается соотношением (12.20). Поэтому неравенство (12.26) вытекает из того, что \AY\ > \AQ\ \ВХ\ > \ВР\ \BY\ \BQ\ \AX\ \АР\т (12.28) Докажем первое из неравенств (12.28). Обозначим а = \АВ\, t\ = \BQ\ и t2 = = \BY\. Тогда, очевидно, мы получаем выражения |AQ|/|-BQ| = (а + t\)/t\ и |АУ|/|ВУ| = (а + t2)/t2. При а > 0 функция (а + t)/t переменной t монотонно убывает с ростом t, поэтому из того, что t2 < t\ (как это очевидно из рис. 12.6) и следует первое из неравенств (12.28). Обозначив а = \АВ\, t\ = \АХ\ и t2 = = \АР\, с помощью совершенно аналогичных рассуждений мы докажем второе неравенство (12.28). Обозначим точку пересечения прямых SU и TV через W, соединим ее прямой с точкой С и точку пересечения последней прямой с прямой АВ обозначим через D. Тогда точки X,A,D,Y и точки U, А, С, V получаются друг из друга при помощи перспективного соответствия, точно так же, как точки Y,B,D,X и Т, Б, С, S. Тогда ввиду теоремы 9.7 мы имеет соотношения \AY\ • \DX\ \AV\ • \CU\ \BX\ • \DY\ \BS\ • \CT\ t Q Рис. 12.6. К неравенству треугольника |£>Г|-|АХ-| \CV\-\AUy Перемножая эти равенства, мы имеем |£>А"|-|АУ| |С5|-|ВГ|' \AY\ ■ \ВХ\ \AV\ ■ \CU\ \BS\ ■ \СТ\ \BY\ \AU\ \CS\-\BT\' с учетом (12.27) для DV(A,B,Y,X), \АХ\ \CV\ Логарифмируя последнее равенство, аналогичных выражений для DV (А, С, U, V) и DV (Б, С, 5, Г) и определения (12.19) мы получаем соотношение logDV(A,5,y,X)=r(A,C) + r(S,C), из которого с учетом (12.26) и вытекает нужное нам неравенство (12.25). Заметим, что если точка В стремится к Q по отрезку PQ (см. рис. 12.6), то \BQ\ стремится к нулю, и следовательно, г (А, В) стремится» к бесконечности. Это значит, что несмотря на то, что прямая, проходящая через точки А и В, представлена на нашем рисунке отрезком конечной длины, ее длина на плоскости Лобачевского бесконечна. 15*
452 Гл. 12. Геометрия Лобачевского Измерение углов аналогично измерению отрезков. Как мы знаем, любая точка О на прямой I разбивает ее на две полупрямые. Одна полупрямая вместе с точкой О называется лучом h с центром О. Два луча h и к с общим центром О называются углом, если они не составляют одну прямую (при этом мы предполагаем, что луч h получается из к вращением против часовой стрелки). Этот угол обозначается Z(h,k). В «абсолютной геометрии» доказывается, что каждому углу с вершиной в точке О можно однозначно сопоставить его величину — вещественное число Z(/i, к), удовлетворяющее следующим четырем свойствам: 1. Z(/i, к) > О при всех Кфк\ 2. Дк,К) = /(/*,&); 3. Если / — движение и f(h) = h\ f(k) = kf и Or = /(О) — вершина угла Z(/i',&')> то l(h,,k') = l{h,k). Для формулировки последнего свойства нужно ввести некоторые дополнительные понятия. Пусть лучи h и fc, образующие угол Z(/i, k), принадлежат прямым 1\ и 12. Точки плоскости, лежащие по ту же сторону от прямой 1\, что и точки полупрямой к, и по ту же сторону от прямой ^> что и точки полупрямой h, называются внутренними точками угла Z(h,k). Луч I с тем же центром О, что и лучи h и к, называется внутренним для угла Z(/i,/с), если он состоит из внутренних точек этого угла. Теперь можно сформулировать последнее свойство: 4. Если I — внутренний луч угла Z(/i, к), то Z(/i, I) + Z(Z, fc) = Z(/i, fe). Как и в случае расстояния между точками, величина угла определяется однозначно, если для нее выбрать «единицу измерения», т.е. принять некоторый угол Z(/io,&o) 3^ «единицу величины угла». Мы укажем явный метод определения величин углов в геометрии Лобачевского, которая реализуется в круге К, заданном соотношением х2 + у2 < 1 на евклидовой плоскости L с координатами х, у. Пусть Z(/i/, kf) — угол с центром в точке О' и / — произвольное движение, переводящее точку О1 в центр О круга К. Из определений очевидно, что / переводит полупрямые Ы и к' в некоторые полупрямые h и к с центром в точке О. Положим величину Z(/i/,fc/) равной евклидовому углу между полупрямыми Ник. Основная трудность в этом определении заключается в том, что оно использует движение /, и поэтому мы должны доказать, что получающееся значение угла не зависит от выбора этого движения / (разумеется, при выполнении условия f(0') = О). Пусть д — другое движение, обладающее этим же свойством: g{Of) = О. Тогда д {О) = & и значит, fg~l(0) = О, т.е. движение fg~l оставляет на месте точку О. Как мы видели в § 12.1 (с. 431), движение, обладающее таким свойством, относится к типу а), и значит, fg~x соответствует ортогональному преобразованию евклидовой плоскости L, т.е. угол Z(h,k) переводится в угол Z(h,k) с помощью ортогонального преобразования fg~l, которое сохраняет скалярное произведение в L, и следовательно, не меняет величины углов. Тем самым доказана корректность введенного определения величины угла. Так же просто проверяются и свойства 1-3.
12.3. Некоторые формулы геометрии Лобачевского 453 Наиболее известным свойством углов в геометрии Лобачевского является следующее свойство: Теорема 12.5. В геометрии Лобачевского сумма углов любого треугольника меньше двух прямых, т. е. меньше 7г. Поскольку речь идет о треугольнике, мы можем ограничиться плоскостью, в которой лежит этот треугольник, и считать, что мы имеем дело с плоскостью Лобачевского. Ключевой результат связан с тем, что угол Z(h,k) в геометрии Лобачевского определяет и евклидов угол, и тогда мы можем сравнить величины этих углов. Мы будем обозначать величину угла Z.(h,k) в геометрии Лобачевского по-прежнему через Z(/i, fc), а его евклидову величину — через ZE(/i, k). Лемма. Если один из лучей угла Z(/i, к) (например, h) проходит через центр О круга К, то его величина в смысле геометрии Лобачевского меньше евклидовой величины, т. е. l(h,k) <ZE(/i,fc). (12.29) Сначала мы покажем, как просто теорема 12.5 вытекает из леммы, а потом докажем саму лемму. Доказательство теоремы. Обозначим вершины рассматриваемого треугольника через Д £?, С. Так как величины углов не меняются при движениях, то, согласно теореме 12.1, мы можем выбрать движение, переводящее одну из вершин треугольника (например, А) в центр О круга К. Пусть вершины В и С перейдут при этом в В' и С (рис. 12.7). Нам достаточно доказать теорему для треугольника ОВ'С1\ Но для угла /.В'ОС мы, по определению, имеем равенство /глп1 / гглп! ^ИС' ^'^' Треугольник на /LB ОС = £ВВ ОС , плоскости Лобачевского а для двух оставшихся углов, согласно лемме, имеем неравенства ЮВ'С < ^ЕОВ'С\ ЮС В1 < ZBOC'B'. Складывая, получаем для суммы углов треугольника ОВ'С неравенство 1В'ОС1 + ЮВ'С + ЮС В1 < ^В'ОС + 1ЕОВ'С + АЕОСВ'. По известной теореме евклидовой геометрии, сумма в правой части равна 7г, что и доказывает теорему 12.5. Доказательство леммы. Нам нужно воспользоваться явным видом определения величины углов. Пусть луч h угла Z(h,k) проходит через точку О. Мы введем для описания круга К евклидову прямоугольную систему координат (х,у) и предположим, что вершина угла Z(h,k) находится в точке О' с координатами (А,0), где А ф 0. Для этого нужно совершить поворот вокруг
454 Гл. 12. Геометрия Лобачевского его центра так, чтобы точка О' перешла в некоторую точку прямой у = О, и воспользоваться тем, что при таком повороте углы не меняются. Теперь нам нужно явно записать движение / плоскости Лобачевского, переводящее точку О в О'. Такое движение уже было нами построено в § 12.1, см. пример 12.1 на с. 432. Мы доказали там, что существует движение плоскости Лобачевского, которое переводит точку с координатами (х,у) в точку с координатами {x',yf), заданными соотношениями ах + Ъ х' = Ъх + а' У = У 1. (12.30) Ъх + а Если мы хотим, чтобы точка О' = (А,0) переходила в начало координат О = (0,0), то должны положить аХ + Ъ = 0 или, эквивалентно, А = —Ъ/а. Нетрудно проверить, что в таком виде можно представить любое число А. Таким образом, преобразование (12.30) имеет вид: 1 — Ах' а(1 — Хх)' Пусть луч к пересекает ось у в точке А с координатами (0, /х), рис. 12.8. (Заметим, что эта точка вовсе не обязана содержаться в круге К.) Из формулы (12.31) видно, что наше преобразование переводит вертикальные прямые х = с в вертикальные же прямые х = с1'. Точка О переходит в точку О = (—А, 0), точка А = (0, ц) — в точку А = (—A,/i/a), а вертикальная прямая О А — в вертикальную^ прямую О А. По определению угла в геометрии Лобачевского, LOO1 A = £ЕООА. Тангенсы евклидовых углов нам известны, см. рис. 12.8: Рис. 12.8. Углы на плоскости Лоба невского М tg(ZE00'A) = ^ ^~-г. О А tgUEOOA) = = _М_ А Ха' Так как а2 = 1 + Ь2, то а> 1^_и мы видим, что в евклидовой геометрии имеет место неравенство tg(ZEOOA) < tg(ZE00/A). Тангенс — строго возрастающая функция, поэтому отсюда вытекает неравенство АЕООА < LEOOfА для самих евклидовых углов. Но ZOO''A = £ЕООА, и значит, ZOO1 A < Z^OO'A. Интересно сопоставить теорему 12.5 с аналогичным результатом сферической геометрии. Со сферической геометрией мы в этом курсе еще не сталкивались, хотя она была детально развита гораздо раньше геометрии Лобачевского — еще в античности. Роль прямых в сферической геометрии играют большие круги на сфере, т.е. окружности, полученные сечениями сферы всевозможными плоскостями, проходящими через ее центр. Аналогия между большими кругами на сфере и прямыми на плоскости состоит в том, что дуга большого круга, заключенная между точками А и Б, имеет длину
12.3. Некоторые формулы геометрии Лобачевского 455 не большую, чем любая другая кривая на сфере с концами А и В. Эта длина дуги большого круга (которая, разумеется, зависит и от радиуса R сферы) называется расстоянием на сфере от точки А до точки В. Вообще, измерение длин и углов на сфере может быть определено совершенно так же, как в геометрии Евклида или Лобачевского. При этом угол между двумя «прямыми» (т. е. большими кругами) равен величине двугранного угла, образованного плоскостями, проходящими через эти большие круги. Имеет место такой результат: Теорема 12.6. Сумма углов треугольника на сфере больше двух прямых, т. е. больше п. Доказательство. Пусть дан треугольник с вершинами А, В, С на сфере радиуса R. Начертим полностью большие круги, дугами которых являются стороны АВ, АС и ВС треугольника ABC (рис. 12.9). Обозначим через Ел часть сферы, заключенную между большими кругами, проходящими через точки А, В и А, С. Аналогично введем обозначения Е^ и Е^. Обозначим через А величину двугранного угла ВАС и аналогично для В и С. Тогда утверждение теоремы равносильно ТОМу, ЧТО А + В + С > 7Г. Но легко видеть, что площадь Ел составляет; от площади сферы ту же часть, что и угол 2А от 27г. Поскольку площадь сферы равна 47гД2, то площадь Ел равна 47ГД2 . U = 4Д2£ Аналогично получаем выражения для площадей Е# и Ее, они равны 4R2B и 4R2C соответственно. Теперь заметим, что области Ел, ^в и Ее вместе покрывают всю сферу. При этом каждая точка сферы, не входящая ни в треугольник ABC, ни в симметричный ему на сфере треугольник А'В'С, содержится только в одной из областей Ел, Е# и Ее, а каждая точка из треугольника ABC или симметричного ему треугольника А'В'С1 содержится во всех трех областях. Следовательно, мы имеем 4Д2(1 + В + С) = 4тгД2 + 2SAabc + 2SAA'B'c = 4тгД2 + 45длбс. Рис. 12.9. Треугольник на сфере Отсюда получаем соотношение А + В + С = тг + Saabc R2 ' (12.32) откуда следует, что А + В + С > it. Формула (12.32) дает пример серии систематически разработанных Лобачевским соотношений: если бы мы считали, что R2 < 0 (т. е. R — чисто
456 Гл. 12. Геометрия Лобачевского мнимое число), то, очевидно, получили бы из (12.32) неравенство А + В + С <тг, т.е. теорему 12.5 геометрии Лобачевского. Поэтому он и считал, что его геометрия реализуется «на сфере мнимого радиуса». Впрочем, аналогия между теми теоремами, которые получаются на основании отрицания «пятого постулата» и теми формулами, которые получаются из формул сферической геометрии заменой Вг на отрицательное число, была замечена уже многими математиками, занимавшимися этими вопросами (некоторыми даже еще в XVIII в.). Следует предупредить, что сферическая геометрия совершенно не укладывается в систему аксиом, рассмотренную нами в § 12.2. В ней не выполняется одна из основных аксиом связи: через две разные точки может проходить несколько разных прямых. Действительно, через две диаметрально противоположные точки на сфере проходит бесконечное число больших кругов. В связи с этим Риман предложил другую геометрию, менее радикально отличающуюся от евклидовой. Мы опишем ее в двумерном случае. Для этого воспользуемся описанием проективной плоскости П как совокупности прямых трехмерного пространства, проходящих через некоторую точку О. Рассмотрим сферу S с центром в О. Каждая точка Р £ S вместе с центром сферы О определяет некоторую прямую Z, т. е. некоторую точку Q проективной плоскости П. Сопоставление Р —» Q определяет отображение сферы S на проективную плоскость П, при этом большие круги на сфере переходят в точности в прямые на П. Очевидно, что в одну точку Q е П переходят ровно две точки сферы: вместе с точкой Р и вторая точка пересечения прямой I со сферой, т.е. диаметрально противоположная точка Р'. Но евклидовы движения, переводящие в себя сферу S (можно было бы назвать их движениями сферической геометрии), задают некоторые определенные преобразования проективной плоскости П, удовлетворяющие аксиомам движения. Можно также перенести меры длин и углов со сферы S на проективную плоскость П. При этом из сферической геометрии сохраняется аналог теоремы 12.6. Эта область геометрии называется геометрией Римана1). В геометрии Римана любые прямые пересекаются, поскольку это верно для проективной плоскости. Таким образом, там нет параллельных линий. Однако в «абсолютной геометрии» доказывается существование хотя бы одной прямой, проходящей через точку Д не лежащей на данной прямой I, и параллельной I. Значит, в геометрии Римана выполнены не все аксиомы «абсолютной геометрии». И легко увидеть причину этого: в геометрии Римана нет естественного понятия «лежать между». Действительно, на прямую I проективной плоскости П отображается большой круг на сфере S, причем в одну точку плоскости П переходят две диаметрально противоположные точки сферы: А и А', В и В\ С и С7 и т. д. (рис. 12.10). Из этого рисунка видно, что в геометрии Римана 1) В отличие от более общего понятия «римановой геометрии», которое мы в этом курсе даже не определяем.
12.3. Некоторые формулы геометрии Лобачевского 457 мы можем с равным основанием считать, что точка С лежит или не лежит между А и В. Рис. 12.10. Геометрия Римана Тем не менее геометрия Римана обладает свойством «свободной подвижности». Более того, можно доказать (теорема Гельмгольца-Ли), что среди всех геометрий (при некотором строгом определении этого термина) только указанные три геометрии — Евклида, Лобачевского и Римана — обладают этим свойством.
Глава 13 ГРУППЫ, КОЛЬЦА, МОДУЛИ § 13.1. Группы и гомоморфизмы Понятие группы определяется аксиоматически, аналогично понятию векторного, евклидова или аффинного пространства. Такое абстрактное определение оправдывается богатством его примеров. Определение. Группой называется множество G, в котором определена операция, сопоставляющая любым двум элементам этого множества некоторый третий его элемент, т. е. определено отображение G x G —> G. Элемент, сопоставляемый по этому правилу элементам д\ и #2> называется их произведением и обозначется д\ • д^ или, короче, g\g<i- При этом должны быть выполнены следующие условия: 1) Существует такой элемент е е G, что для любого д е G имеют место соотношения eg = д и де = д. Этот элемент называется единичным1). 2) Для каждого элемента g G G существует такой элемент g' e G, что дд' = е, и такой элемент д" Е G, что дПд = е. Элемент д! называется правым обратным, а элемент д" — левым обратным к элементу д. 3) Для любых трех элементов д\,д2,дз € G выполнено соотношение {д\92)дъ = 91(9293)' (13.1) Последнее свойство называется ассоциативностью, и мы уже неоднократно встречались с ним раньше — например, в связи с произведением отображений и матриц, а также при построении внешней алгебры. В самом общем виде свойство ассоциативности было рассмотрено на с. 11, где мы доказали, что равенство (13.1) позволяет определить произведение любого числа сомножителей д\д2--дк, которое зависит только от порядка этих сомножителей, но не от расстановки скобок в произведении. Приведенное там рассуждение, очевидно, применимо и к любой группе. Условие ассоциативности имеет и другие важные следствия. Из него вытекает, например, что если д1 — правый обратный элемент к #, а дп — левый обратный, то 9"{дд') = д"е = </', д"{дд') = {д"д)д' = eg' = </, О Единичный элемент в группе — единственный. Действительно, если бы существовал другой единичный элемент е е G, то, по определению, мы имели бы равенства ее' = е' и ее' = е, из которых следует, что е = е!.
13.1. Группы и гомоморфизмы 459 откуда следует д' = д". Таким образом, левый и правый обратные элементы к любому д е G совпадают. Этот единый элемент д' = д" называется просто обратным к д и обозначается символом д~х. Определение. Если число различных элементов, содержащихся в группе G, конечно, то группа G называется конечной, в противном же случае она называется бесконечной. Число различных элементов конечной группы G называется ее порядком и обозначается через \G\. Пусть М — любое множество, рассмотрим совокупность всех взаимнооднозначных отображений множества М в себя. Такие отображения называются также преобразованиями множества М. В параграфе, содержащем предварительные сведения, мы определили операцию произведения (т.е. последовательного выполнения) любых отображений произвольных множеств (с. 10). Из доказанных там свойств вытекает, что совокупность преобразований множества М с такой операцией произведения является группой, при этом обратным элементом к каждому преобразованию f:M^>M служит обратное преобразование /_1: М —> М, а единичным элементом, очевидно, будет тождественное отображение множества М. Такие группы называются группами преобразований, с ними связано подавляющее большинство применений групп. Иногда бывает нужно рассматривать не все преобразования множества, а ограничиться какой-нибудь их частью. Возникающую при этом ситуацию удобно сформулировать в общем виде: Определение. Подмножество G'cG элементов группы G называется ее подгруппой, если выполнены условия: а) для любых элементов g\,g2 £ G' их произведение g\g^ £ G'\ б) G' содержит единичный элемент е; в) для любого g е Gf обратный элемент g~l £ Gf. Очевидно, что подгруппа G' сама является группой. Так из группы всех преобразований мы получаем множество примеров (на самом деле, большинство примеров групп). Перечислим некоторые, чаще всего нам встречавшиеся. Пример 13.1. Группами являются множества: - невырожденных линейных преобразований векторного пространства; - ортогональных преобразований евклидова пространства; - собственных ортогональных преобразований евклидова пространства; - лоренцевых преобразований псевдоевклидова пространства; - невырожденных аффинных преобразований аффинного пространства; - проективных преобразований проективного пространства; - движений евклидова аффинного пространства; - движений пространства Лобачевского. Все перечисленные группы являются группами преобразований (множеством М, очевидно, является соответствующее пространство). Заметим, что в случае векторных и аффинных пространств существенно требование невырожденности линейного или аффинного преобразования, которое обеспечи-
460 Гл. 13. Группы, кольца, модули вает взаимную однозначность отображения и, тем самым, существование обратного элемента в группе1). Однако не все естественно возникающие группы являются именно группами преобразований. Например, относительно операции сложения все числа (как целые, так и рациональные, вещественные или комплексные) образуют группу, а также все векторы, принадлежащие любому векторному пространству. Заметим, что приведенные в § 12.2 аксиомы движения 1, 2 и 3 можно вместе выразить одним требованием, что движения составляют группу. Пример 13.2. Рассмотрим конечное множество М, состоящее из п элементов. Преобразования f:M—>M называются перестановками, а группа перестановок множества М называется симметрической группой степени п и обозначается Sn. Очевидно, что группа Sn конечна. Мы уже рассматривали перестановки в § 2.6 в связи с понятиями симметрических и антисимметрических функций и видели, что для задания перестановки f:M—±M можно ввести некоторую нумерацию элементов множества М, т.е. записать его в виде М = {ai,...,an} и указать образы /(ai),... ,/(an) всех элементов ai,...,an. А именно, пусть f(a\) = aj{i ..., /fan) — азп- Тогда перестановка задается матрицей A=(l 2 '" ПУ (13.2) \Л 32 •" Зп) v где в верхней строке записаны подряд все натуральные числа от 1 до п, а в нижней строке под числом к стоит число jk, такое, что /(a^) = a,jk. Так как перестановка f-.M^M — взаимно однозначное отображение, то элементы нижней строки — это те же числа от 1 до п, но только записанные в другом порядке. Иными словами, (ji,..., jn) — это некоторая перестановка чисел (1,... ,п). Запись перестановок в виде (13.2) позволяет, в частности, легко убедиться, что \Sn\ = п\. Доказательство проведем индукцией по п. При п = 1 это очевидно: группа S\ содержит одну-единственную перестановку, которая является тождественным отображением множества М, состоящего из одного единственного элемента. Пусть п> 1, тогда, занумеровав каким-либо образом элементы множества М, мы получим взаимно-однозначное соответствие между Sn и множеством матриц А вида (13.2), в первой строке которых стоят одни и те же элементы 1,..., п, а элементы второй строки j\,..., jn принимают всевозможные значения от 1 до п. Пусть А! — матрица, полученная из А вычеркиванием ее последнего столбца, содержащего элемент^. Зафиксируем этот элемент: jn = к. Тогда элементы j\,...,jn-\ матрицы А' принимают всевозможные значения из набора п—\ чисел (1,... ,fc,... ,п), где знак", как и прежде, означает отсутствие соответствующего элемента. Очевидно, *) К сожалению, здесь имеет место некоторая несогласованность терминологии, которую нужно иметь в виду: выше мы определили преобразование множества как его взаимно однозначное отображение в себя, в то время, как произвольное линейное (или аффинное) преобразование векторного (или аффинного) пространства не обязано быть взаимно однозначным, и для взаимной однозначности на него нужно еще наложить дополнительно условие невырожденности.
13.1. Группы и гомоморфизмы 461 что множество всевозможных матриц А1 находится во взаимно-однозначном соответствии с 5п_ь и, по предположению индукции, число различных матриц А' равно |5n_i | = (п — 1)!. Но так как элемент jn = к может быть равным любому натуральному числу от 1 до га, то число различных матриц А равно га (га — 1)! = га!. Это и означает равенство \Sn\ = п\. Заметим, что нумерация элементов множества М, использовавшаяся для записи перестановок играет такую же роль, что и введение координат (т. е. базиса) в векторном пространстве. При этом матрица (13.2) аналогична матрице линейного преобразования пространства, которая определена только после выбора базиса и зависит от него. Однако для наших дальнейших целей удобнее пользоваться понятиями, не связанными ни с каким выбором нумерации элементов. Мы воспользуемся понятием транспозиции, которое было введено нами в § 2.6 (с. 59). Приведенное там определение можно сформулировать следующим образом. Пусть а и Ъ — два различных элемента множества М, тогда транспозицией называется перестановка множества М, которая меняет элементы а и Ъ местами и не меняет никакие другие элементы множества М. Обозначив такую транспозицию через та>ь, это определение можно выразить соотношениями та,ъ{о) = Ь, rajb(b) = а, та$ь(х) = х (13.3) для всех х ^ а и х Ф Ъ. В этих обозначениях можно сформулировать доказанную в § 2.6 теорему 2.7 следующим образом: любая перестановка д конечного множества является произведением конечного числа транспозиций, т. е. 9 = ТаиЪх Та2,Ъ2 ' ' ' rak,bk- (13.4) Отметим, что в соотношении (13.4) число к и выбор элементов а\,Ь\,... ,dk,bk при заданной перестановке д, т. е. (как мы видели в § 2.6) определяются неоднозначно. Это значит, что для заданной перестановки д представление (13.4) не единственно. Однако, как было доказано в § 2.6 (теорема 2.8), четность числа к перестановкой д определяется однозначно. Перестановки, для которых число к в представлении (13.4) четно, называются четными, а перестановки, для которых число к нечетно, называются нечетными. Пример 13.3. Совокупность всех четных перестановок п элементов является подгруппой симметрической группы Sn (выполнение условий а), б), в) из определения подгруппы очевидно). Она называется знакопеременной группой степени п и обозначается Ап. Определение. Пусть д е G, тогда для любого натурального числа п определен элемент дп = д-- • д. Для отрицательного целого т элемент п раз дш = (д~1)~т, а для нуля элемент д° = е. Легко проверить, что для любых целых тип имеет место соотношение 9т9п = 9т+п.
462 Гл. 13. Группы, кольца, модули Из этого видно, что совокупность элементов вида дп, где п пробегает множество целых чисел, образует подгруппу. Она называется циклической подгруппой, порожденной элементом д, и обозначается {д}. При этом может представиться два случая: (а) Все элементы дп, когда п пробегает множество целых чисел, различные. В этом случае говорят, что д — элемент бесконечного порядка в группе G. (б) Для некоторых целых т ф п выполнено равенство дт = дп. Тогда, очевидно, дт~п = е. Это значит, что существует такое натуральное число к (например, равное \т — п|), что дк = е. В этом случае говорят, что д — элемент конечного порядка в группе G. Если g — элемент конечного порядка, то наименьшее натуральное число fc, такое, что gk = е, называется порядком элемента д. Если для какого-нибудь целого п выполнено дп = е, то число п делится на порядок к элемента д. Действительно, если бы это было не так, то мы могли бы разделить с остатком число п на к: п = qk + г, где 0 < г < к. Из равенств дп = е и дк = е тогда вытекало бы, что и дТ = е, в противоречии с определением порядка к. Если в группе G существует такой элемент д, что G = {#}, то группа G называется циклической. Очевидно, что если G — {д} и элемент д имеет конечный порядок к, то \G\ = к. Действительно, в этом случае е,д,д2,... ,дк~1 — это все различные элементы группы G. Теперь мы перейдем к отображениям групп (гомоморфизмам), которые играют в теории групп роль, аналогичную линейным преобразованиям векторных пространств в линейной алгебре. Пусть G и G1 — две произвольные группы, е G G и е' Е Gf — их единичные элементы. Определение. Отображение /: G —> G' называется гомоморфизмом, если для любых двух элементов д\ и д^ группы G выполнено соотношение /Ы2)=/Ы/(<72), (13.5) при этом, очевидно, подразумевается, что в левой и правой части равенства (13.5) стоит операция произведения в соответствующей группе (слева — в G, справа — в Gr). Из равенства (13.5) легко вывести простейшие свойства гомеоморфизма: 1. f(e) = e>, 2. f(g~l) = (f(g))~l для любого д е G, 3. f(gn) = (f(g))n Для любого д G G и любого целого числа п. Для доказательства первого свойства положим в формуле (13.5) элементы 9\ = 92 — е. Тогда, с учетом очевидно вытекающего из определения единичного элемента равенства е = ее, получим, что /(е)=/(ее) = /(е)/(е). Остается только умножить обе части соотношения /(e) = /(е)/(е) на элемент (/(е))-1 группы G\ после чего мы и получим нужное равенство е! = /(e). Из первого свойства сразу получается второе: положив в (13.5) элементы
13.1. Группы и гомоморфизмы 463 д\ = д и #2 = 9 , и с учетом равенства е = дд 1 мы имеем e' = f(e) = f(gg-l) = f(g)f(9-l\ откуда, по определению обратного элемента, следует, что f(g~l) = (f{g))~l- Наконец, третье свойство для положительных п получается по индукции из (13.5), а для отрицательных п нужно еще воспользоваться свойством 2. Определение. Отображение /: G —> G' называется изоморфизмом, если оно является гомоморфизмом и взаимно-однозначным отображением. Группы G и G' называются изоморфными, если существует изоморфизм /: G —> G'. Это обозначается так: G ~ G\ Пример 13.4. Сопоставив каждому невырожденному линейному преобразованию векторного пространства L размерности п его матрицу (в некотором едином фиксированном базисе пространства L), мы получаем изоморфизм группы невырожденных линейных преобразований этого пространства и группы невырожденных квадратных матриц порядка п. Понятие изоморфизма играет в теории групп такую же роль, что и понятие изоморфизма в теории векторных пространств, а понятие гомоморфизма — такую же роль, что и понятие произвольного линейного преобразования (векторных пространств произвольной размерности). Аналогия между этими понятиями проявляется, в частности, в том, что ответ на вопрос, является ли гомоморфизм /: G —► G' изоморфизмом, может быть сформулирован в терминах образа и ядра, аналогичных соответствующим понятиям для линейных отображений. Образ гомоморфизма / — это множество /(G), т.е. просто образ / как произвольного отображения множеств G —> G'. Из соотношения (13.5) следует, что f(G) является подгруппой в G'. Ядро гомоморфизма / — это множество элементов g e G, для которых f(g) = е'. Из (13.5) также нетрудно вывести, что ядро является подгруппой в G. Используя понятия образа и ядра, можно сказать, что гомоморфизм /: G —> G является изоморфизмом тогда и только тогда, когда его образ совпадает со всей группой G', а ядро состоит из одного лишь единичного элемента е Е G. Доказательство этого утверждения основано на соотношении (13.5) и свойствах 1 и 2: если для двух элементов д\ и д2 группы G выполнено равенство f(g\) — /(52)» то> умножая обе его части справа на элемент (f(g\))~l группы G, получаем е' = f{g2){f{g\))~l = /(s^f1)' 0ТКУДа следует, что д2д^1 = е, т. е. д\ = д2. Однако важно отметить, что аналогия между изоморфизмами групп и изоморфизмами векторных пространств не простирается слишком далеко: большинство теорем из гл. 3 не имеют верных аналогов для групп, причем даже конечных. Например, один из важнейших результатов гл. 3 (теорема 3.9) состоит в том, что любые два векторных пространства одинаковой конечной размерности изоморфны. Но даже конечные группы одного и того же порядка могут не быть изоморфными, см. пример 13.7 на с. 473.
464 Гл. 13. Группы, кольца, модули Еще одно важное свойство групп связано с тем, зависит ли определенное в ней произведение элементов от их порядка. В определени группы по этому поводу никаких условий не накладывалось, и поэтому можно предположить, что, вообще говоря, g\g2 ф 929\* Очень часто так дело и обстоит. Например, невырожденные квадратные матрицы заданного порядка п со стандратной операцией умножения матриц образуют группу, и, как показывает пример, приведенный в § 2.9 (с. 77), уже при п = 2, вообще говоря, АВ Ф В А. Определение. Если для любых двух элементов g\, g<i Е G выполнено равенство #i<72 = #2<7ь то группа G называется коммутативной или абелевой. Например, группа чисел (целых, рациональных, вещественных или комплексных) с операцией сложения является коммутативной. Точно также, векторное пространство образует коммутативную группу относительно операции сложения векторов. Легко видеть, что любая циклическая группа коммутативна. Приведем один результат, который верен для любых конечных групп, но особенно просто доказывается (и будет нами в дальнейшем использоваться) для коммутативных групп. Лемма. Для конечной коммутативной группы G порядок любого ее элемента делит порядок всей группы. Доказательство. Обозначим через д\,дъ--,9п все различные элементы группы G (при этом, очевидно, п = \G\) и умножим их все справа на некоторый элемент g e G. Полученные после этого элементы g\g,g2g, • •• ,9п9 все также будут различны. Действительно, из равенства gig = g^g, умножая обе части на g~l, мы получили бы равенство gi = gj. Так как в группе G всего п элементов, то элементы g\g,g<ig, ... ,9п9 — это те же элементы #ь #2, ••• ,9п, только, быть может, расположенные в другом порядке: 919 = 9ч, 929 = 9i2> • -• > 9п9 = 9in- Перемножив эти равенства, мы получаем (9\9)(929) ' •' (9п9) = 9ц 9i2 " • 9in- (13-6) Ввиду коммутативности группы G имеем (gi9)(92g) • - - (gng) = 9192 • • • 9п9п, а так как ftpft2»---»ffin ~" это те же элементы g\,g2,... ,#п, то, обозначив h = g\g2 - - - gn, получаем из (13.6) равенство hgn = h. Умножив обе части последнего соотношения слева на /гГ1, мы получим дп = е. Как мы видели выше, отсюда следует, что порядок элемента д делит число п = \G\. Определение. Пусть Н\, #2, • • •, Нг — подгруппы группы G. Группа G называется прямым произведением подгрупп Нх^Щ,... ,НГ, если для любых элементов hi е Щ и hj e Hj из разных подгрупп выполнено соотношение hihj = hjhi, любой ее элемент g E G может быть представлен в виде g = hih2"-hr, hie Щ, г =1,2,...,г,
13.1. Группы и гомоморфизмы 465 и такое представление для каждого элемента д е G единственно. То, что группа G является прямым произведением подгрупп Н\,Н2, ••• ,НГ, обозначается записью G = H{xH2x--'xHr. (13.7) В случае коммутативных групп обычно принята иная терминология, связанная с большинством интересных примеров. А именно, операция, определенная в группе, называется не умножением, а сложением, и обозначается не д\д2, а д\ + д2. В соответствии с этим единичный элемент называется нулевым и обозначается не е, а 0. Обратный элемент называется противоположным и обозначается не g~l, a — д, и степень дп заменяется кратным пд, которое определяется аналогично: пд — дЛ Ьд, если п > 0, п раз пд = (—д) -\ Ь (-д)у если п < 0, и пд = 0, если п — 0. Определение 4 v ' —п раз гомоморфизма в этом случае сохраняется дословно, нужно лишь заменить в формуле (13.5) знак операции: /(01+й) = /Ы + /Ы- Свойства 1-3 при этом принимают вид: 1. Д0)=0', 2. f(-g) = -f(g) для любого д е G, 3- f(ng) = nf(g) для любого д е G и любого целого числа п. Такая терминология согласуется с примером множества целых чисел и, в принятой нами выше терминологии, векторов, которые образуют коммутативную группу относительно операции сложения. В случае коммутативных групп (с операцией сложения) вместо прямого произведения подгрупп ЯьЯг,... ,ЯГ говорят о прямой сумме. Тогда определение прямой суммы сводится к тому, что любой элемент д е G представим в виде д = hi +h2 H Ь/ir, hie Щ, г= 1,2, ...,r, и такое представление для каждого элемента д е G единственно. Очевидно, последнее требование равносильно тому, что равенство h\ + h2 H Ь hr = 0 возможно только, если h\ = 0, h2 = 0,... ,hr = 0. То, что группа G является прямой суммой подгрупп Н\,Н2,... ,ЯГ, обозначается записью G = #ietf2e---e#r. (13.8) Очевидно, что и в случае (13.7), и в случае (13.8) порядок группы G равен |G| = |#iH#2|.....|#r|. Совершенно аналогично тому, как это было сделано в § 3.1 для векторных пространств, мы можем определить прямое произведение (или прямую сумму) групп, которые, вообще говоря, изначально не являются подгруппами никакой общей группы и даже, быть может, имеют совершенно различную природу. Пример 13.5. Сопоставив каждому ортогональному преобразованию % евклидова пространства его определитель |^|, который, как мы знаем, равен +1
466 Гл. 13. Группы, кольца, модули или —1, мы получаем гомоморфизм группы ортогональных преобразований в симметрическую группу #2 порядка 2. Сопоставив каждому лоренцеву преобразованию % псевдоевклидова пространства пару чисел e(W) = (|^|,z/(^)), определенную в § 7.8, мы получаем гомоморфизм группы лоренцевых преобразований в группу ^2 х S2- Пример 13.6. Пусть (V, L) — евклидово аффинное пространство размерности п и G — группа его движений. Тогда утверждение теоремы 8.10 можно сформулировать в виде равенства G = Тп х Оп, где Тп — группа сдвигов пространства V и Оп — группа ортогональных преобразований пространства L. Заметим, что Тп ~ L, где L понимается как группа относительно операции сложения векторов. Действительно, определим отображение /: Тп —► L, которое каждому сдвигу 2?а на вектор а ставит в соответствие этот вектор. Очевидно, что отображение / взаимно однозначно, а в силу свойства ^а^ъ — ^а+ь оно является изоморфизмом. Таким образом, теорему 8.10 можно сформулировать в виде соотношения G ~ L х Оп. § 13.2. Разложение конечных абелевых групп Далее в этой главе мы ограничим себя рассмотрением конечных групп. Идеальной целью в этой области было бы найти конструкцию, которая дает описание всех конечных групп. Но такая цель вряд ли достижима или, по крайней мере, мы сейчас от нее очень далеки. Однако для конечных абелевых групп ответ на этот вопрос оказывается неожиданно простым. К тому же он, как и его доказательство, очень похож на теорему 5.3 о разложении векторного пространства в прямую сумму циклических подпространств. Для доказательства нам понадобятся следующие леммы. Лемма 1. Пусть В — подгруппа группы А и а — элемент группы А порядка к. Если существует число т Е КГ, взаимно простое с к, такое, что та G В, то и а е В. Доказательство. Так как числа тик взаимно просты, то существуют такие целые числа г и s, что кг + ms — 1. Умножив та на s и прибавив к нему кг а (равное нулю, так как к — порядок элемента а), мы получим а. Но sma — s(ma) принадлежит подгруппе В. Отсюда следует, что а тоже принадлежит В. Л е м м а 2. Если А = {а} — циклическая группа порядка п и та — Ъ — ее элемент, причем число meN взаимно просто с п, то циклическая подгруппа В = {Ь}, порожденная элементом Ъ, совпадает с А. Доказательство. Так как а Е А, то, согласно лемме из предыдущего параграфа, порядок к элемента а делит порядок группы А, т. е. число n, a взаимная простота чисел тип влечет взаимную простоту А: и т. Из леммы 1 следует, что а е jB, значит, А с В, а так как очевидно, что и Б с Л, то отсюда получаем нужное нам равенство В = А.
13.2. Разложение конечных абелевых групп 467 Следствие. В предположениях леммы 2 каждый элемент с Е А может быть представлен в виде c = md, deA, meZ. (13.9) Действительно, если в обозначениях леммы 2 группа А = {&}, то элемент с имеет вид кЪ, а так как Ъ = та, то мы получаем равенство (13.9), в котором d = ka. Определение. Подгруппа В группы А называется максимальной, если В ф А и В не содержится ни в какой подгруппе, отличной от А. Очевидно, что в любой конечной группе, не состоящей из одного лишь единичного элемента, существуют максимальные подгруппы. Действительно, начав с единичной (т. е. состоящей из одного лишь единичного элемента) подгруппы, мы можем включить ее, если она не максимальная, в подгруппу В\, отличную от А. Если В\ еще не максимальная, то мы можем включить ее в подгруппу Б2, отличную от А. Продолжая этот процесс, мы в конце концов остановимся, так как все подгруппы £?i,I?2> ••• содержатся в конечной группе А. Подгруппа, на которой мы остановимся, и будем максимальной. Заметим, что мы не утверждаем (да это и не верно), что максимальная подгруппа — единственна. Лемма 3. Для любой максимальной подгруппы В конечной абелевой группы А существует такой элемент а Е А, не содержащийся в В, что наименьшее число т Е N, для которого та Е В, является простым, и любой элемент х Е А можно представить в виде х = ка + Ъ, (13.10) где к — целое число, Ъ Е В. Позже мы будем обозначать простое число га, о котором идет речь в лемме 3, через р. Доказательство. Возьмем в качестве а любой элемент группы А, не содержащийся в подгруппе В. Совокупность элементов вида ка + Ъ, где к — произвольное целое число, а Ъ — произвольный элемент из Б, образует, очевидно, подгруппу, содержащую В и состоящую из элементов ж, у которых в представлении х = ка + Ъ число к = 0. Очевидно, что эта подгруппа не совпадает с В, так как содержит элемент а (при к = 1 и Ъ = 0), а значит, ввиду максимальности подгруппы Б, она совпадает с А. Отсюда уже следует представление (13.10) для любого элемента х группы А. Нам остается доказать, что для некоторого простого числа р элемент pa G В. Так как элемент а имеет конечный порядок, то па = 0 для некоторого п > 0. В частности, па Е В. Возьмем наименьшее число mGN, для которого та Е Б, и докажем, что оно простое. Пусть это не так, и р — один из простых делителей числа т. Тогда т = рт\ с некоторым целым т\ < т. Положим а\ = т\а. Как мы видели, совокупность всех элементов вида ка\ + Ъ (при любом целом к и любом
468 Гл. 13. Группы, кольца, модули Ъ G В) образует подгруппу группы А, содержащую В. Если бы элемент а\ содержался в В, то это противоречило бы выбору т как наименьшего натурального числа, для которого та G В. Значит, а\ 0 В и ввиду максимальности подгруппы В построенная подгруппа элементов вида ка\ + Ъ совпадает с А. В частности, она содержит элемент а, т. е. а = ка\ + Ъ при некоторых к и Ъ. Отсюда следует, что ра = кра\ +рЪ. Но ра\ — рт\а = та G Б, и так как pb G В, то значит, pa G В, что противоречит минимальности т. Значит, предположение о существовании у числа т простых делителей, меньших га, ложно, и т = р — простое число. Замечание. В качестве а мы выбрали любой элемент группы А, не содержащийся в В. В частности, вместо а можно взять любой элемент а1 = а + Ъ, где Ъ G В. Действительно, из а = а! — Ъ и a1 G В следовало бы, что и a G В. Теперь мы можем перейти к основной теореме: Теорема 13.1. Всякая конечная абелева группа является прямой суммой своих циклических подгрупп, порядки которых равны степеням простых чисел. Таким образом, теорема утверждает, что для любой конечной абелевой группы А имеет место разложение А = Ах®---®АТ1 (13.11) где подгруппы Ai — циклические, т.е. Ai — {а^}, и их порядки — степени простых чисел, т.е. \А{\ —^1, где pi — простые числа. Доказательство проведем индукцией по порядку группы А. Для группы порядка 1 теорема очевидна. Поэтому, доказывая ее для группы А, мы можем считать ее справедливой для всех подгрупп В с А, В ф А, так как для любого подмножества В с А, В ф А, число элементов В меньше, чем \А\. Пусть, в частности, В — максимальная подгруппа группы А. По предположению индукции, для нее теорема справедлива и имеет место разложение B = Ci®---®Cr, (13.12) в котором Ci — циклические подгруппы, порядки которых равны степеням простых чисел: d = {Ci}, РГСг = 0. Для подгруппы В справедлива лемма 3, пусть a G А, а £ В — элемент, указанный в формулировке этой леммы. По условию, любой элемент х G В представляется в виде х = к\С\ -\ + кгсг. В частности, это верно для элемента Ъ = ра (в обозначениях леммы 3): ра = к\с\ Л + кгСг. Отберем в этом разложении те слагаемые /ад, которые можно записать в виде pdi, где di G Ci. Такими являются прежде всего слагаемые /ад для тех г, при которых pi ф р. Это вытекает из следствия леммы 2. Кроме того, этим же свойством обладают все элементы вида /ад, если pi = р и ki делится на р. Пусть таким образом отобраны элементы /ад, г = l,...,s— 1. Тогда для
13.2. Разложение конечных абелевых групп 469 оставшихся элементов /ад, г = s, ...,г, имеем pi = р и к{ не делится на р. Полагая _ . г г i/ г, г г, , (13.13) d\ H h as_i = a, мы получаем pa = pd + kscs + • • • + krcr. Мы можем теперь воспользоваться свободой в выборе элемента а е А, о которой было сказано в замечании после доказательства леммы 3, и взять вместо а элемент а! = а — d, так как d £ Б ввиду формулы (13.13). Для него мы имеем pa! = fcscs H Ь fcrcr. (13.14) Теперь могут представиться два случая. Случай 1. Число s — 1 = г, тогда равенство (13.14) дает pa' = 0. В этом случае группа А разлагается в прямую сумму циклических подгрупп следующим образом: -А — Oi 0 • •' ф От- Ш C/^-f-i, где Cy+i = {a7} — подгруппа порядка р. Действительно, лемма 3 утверждает, что любой элемент х е А представим в виде ка' + Ъ, а так как ввиду (13.12) элемент Ъ можно представить в виде Ъ — к\С\ + • • • + кгсг, то х имеет вид х = к\с\ + • • • + krCr + fca7. (13.15) Этим доказано первое условие в определении прямой суммы. Докажем единственность представления (13.15). Для этого достаточно доказать, что равенство fcici Н Ь кгсг + ка! = 0 (13.16) возможно только при к\с\ — - - - = fcrCr> = ка! = 0. Перепишем (13.16) в виде ко! = —к\С\ — ... — кгсг. (13.17) Это значит, что элемент ка' Е В. Если бы число к не делилось на р, то А; и р были бы взаимно просты, так как элемент а; имеет порядок р, и по лемме 1 тогда мы получили бы, что а1 £ В. Но это противоречит выбору элемента а и конструкции элемента а'. Значит, р должно делить к, а так как ра! = 0, то отсюда следует, что и ка! = 0. Таким образом, равенство (13.17) сводится к к\с\ + ••• + fcrCr — 0, и из того, что группа В является прямой суммой подгрупп Сь ... ,СГ, мы получаем, что и fcici = 0,... ,krcr = 0. Случай 2. Число 5 — 1 < г. Положим kscs = ds, ..., fe^cv = dr, а для г = 1,... ,5 — 1 положим Сг = с?г- Согласно лемме 2 элемент d; порождает ту же циклическую подгруппу С*, что и с$. При г ^ s — 1 это утверждение —
470 Гл. 13. Группы, кольца, модули тавтология, а при г > s — 1 следует из того, что числа ki по условию не делятся на р, a pmiCi = 0, при всех г ^ s. Равенство (13.14) перепишется тогда так: pa! = d8 + -- + dr. (13.18) Пусть ms < • • • < тг. Обозначим через С'г циклическую группу, порожденную элементом а', т.е. положим С'г = {а7}. Докажем, что порядок элемента а', а значит, и группы С'г, равен ртг+1: \c,r\=pmr+l. (i3.i9) Действительно, ввиду (13.18) имеем pmr+la/ = pmrds + . . . + p™rdr = о, так как рт^ = 0, mj < тг. С другой стороны, ввиду соотношения (13.18) мы имеем pmra! = pmr-lds + • • • +pmr-ldr ф 0, так как pmr~~ldr ф 0, а ввиду (13.12) сумма элементов pmr~ldi e Ci не может быть равна 0, если хоть одно слагаемое не равно 0. Это и доказывает (13.19). Теперь докажем, что A = Ci©-.-0Cr-i©C;, (13.20) т. е. что любой элемент х G А однозначно представляется в виде х = у\ Н \-уг-\ +Уг' У1 ^ Сь ..., Уг-1 € Сг-и Уг е С'г. (13.21) Сначала докажем возможность представления (13.21). Так как любой элемент х Е А представляется в виде ко! + 6, Ь G Б, то достаточно доказать, что в виде (13.21) можно представить отдельно а' и любой элемент Ъ Е В. Для элемента а' это очевидно, так как он содержится в циклической группе С'г = {а'}. Каждый же элемент Ъ е В представим в виде Ь — k\d\ H + krdr, согласно формуле (13.12) и ввиду того, что С{ = {di}. Поэтому достаточно доказать, что каждый из элементов di представим в виде (13.21). Для di,... ,dr-\ это очевидно, так как di eCi = {di}, i= l,...,r- 1. Наконец, ввиду (13.18) имеем dr = — ds — •.. — dr-\ + pa , а это и есть представление нужного нам типа для элемента dr. Докажем теперь единственность представления (13.21). Для этого достаточно доказать, что равенство Ml + • • • + /cr_idr_i + kra! = 0 (13.22) возможно только при k\d\ = ••• = кТо! = 0. Предположим, что кг взаимно просто с р. Тогда кга = — k\d\ — • • • — kr-\dr-\,
13.3. Единственность разложения 471 а ввиду того, что рШг+1а' — О, согласно лемме 1 мы получаем, что а1 е В. Но элемент a G А был выбран нами как элемент, не принадлежащий подгруппе В. Значит, и элемент о! тоже не принадлежит В. Рассмотрим теперь случай, когда число кт делится на р. Пусть кг = pi. Тогда pla = —k\d\ — • • • — kr-\dr-\. Заменим ро! в левой части этого соотношения выражением ds + • • • + dr на основании равенства (13.18). После перенесения всех членов в левую часть мы получим: lds + • • • + ldr + k\d\ + • • • + kr-\dr-\ = 0. Из того, что, по предположению, группа В является прямой суммой групп С\,...,СГ, следует, что в этом равенстве ldr = 0. Так как порядок элемента dr равен рШг, то это возможно только если рШг делит I и, значит, pmr+1 делит кг. Но мы видели, что порядок элемента аг равен pmr+l и, значит, кго! = 0. Тогда из равенства (13.22) следует, что k\d\ + • • • + kr_\dr-\ = 0. А так как, по предположению индукции, группа В является прямой суммой групп С\,...,СГ, то отсюда следует, что k\d\ — • • • = kr-\dr-\ = 0. Теорема доказана. § 13.3. Единственность разложения Теорема единственности жордановой нормальной формы имеет свой аналог в теории конечных абелевых групп: Теорема 13.2. При различных разложениях конечной абелевой группы А в прямую сумму циклических подгрупп, порядки которых являются степенями простых чисел, существование которых устанавливает теорема 13.1: A = Ai®.--®Ar, |Ах|=рГ> (13.23) порядки р™* циклических подгрупп А{ одинаковы. Иначе говоря, если — другое такое разложение, то s — r и подгруппы А[ можно перенумеровать таким образом, что будут выполнены равенства \А^\ = \Аг\ для всех г = 1,...,г. Доказательство. Мы покажем, как порядки циклических подгрупп в разложении (13.23) однозначно определяются самой группой А. Для любого натурального числа к обозначим через кА совокупность элементов а группы А, которые могут быть представлены в виде а = кЪ, где Ъ — какой-либо элемент этой группы. Очевидно, что совокупность элементов кА образует подгруппу группы А. Докажем, что порядки \кА\ этих подгрупп (для различных к) определяют порядки циклических групп \Ai\ в разложении (13.23).
472 Гл. 13. Группы, кольца, модули Рассмотрим произвольное простое число р и разберем случай, когда к — степень простого числа р: к = рг. Разложим порядок \ргА\ группы ръА в произведение степени р и числа щ, взаимно простого с р: |р*А|=рг*тц, (гц,р) = 1. (13.24) С другой стороны, для простого числа р обозначим через k число входящих в разложение (13.23) подгрупп Ai, имеющих порядок рг. Мы укажем явную формулу, выражающую числа k через г^. Так как последние определяются лишь самой группой А, то и числа k не зависят от разложения (13.23) (в частности, они все равны нулю тогда и только тогда, когда все простые числа pi, для которых \Ai\ =pf[H, отличны от р). Прежде всего подсчитаем порядок самой группы А другим способом. Заметим, что А = р°А, так что это случай, когда г — 0. Определение числа k показывает, что в разложении (13.23) мы имеем 1\ групп порядка р, l<i групп порядка р2,..., а остальные группы имеют порядки, взаимно простые с р. Отсюда следует, что |A|=pV2---n0, (гю,р) = 1. Положим |Л| =pr°n0i (n0,p) = 1. Тогда мы можем записать предшествующее соотношение в виде Zi + 2Z2 Ч- 3Z3 Ч = г0. (13.25) Теперь рассмотрим случай, когда к = рг > 1, т. е. число г > 0. Прежде всего, очевидно, что для любого натурального числа к из (13.23) следует: кА = кА\ Ф кА2 © • • • © кАг. Выполнение всех свойств прямой суммы здесь очевидно. Теперь, как и в рассмотренном выше случае, подсчитаем порядок группы ргА другим способом. Очевидно, что |ргА| = \ргА\\ • • • |ргАг|. Если для некоторого j порядок \Aj\ = р™° и pj ф р, то лемма 2 показывает, что p%Aj = Aj и порядок \plAj\ = \Aj\ = р™3 взаимно прост с р. Таким образом, в разложении \ргА\ = \ръА\\ • • • \ргАг\ все сомножители |pM.j|, где \Aj\ = рТ° и pj фр, вместе дают число, взаимно простое с р, и в формуле (13.24) не дадут никакого вклада в число г*. Осталось рассмотреть случай pj = р. Так как Aj — циклическая группа, то Aj = {aj}. Тогда, очевидно, что plAj = {plaj}. Найдем порядок элемента plaj. Так как p^aj — 0, то ртэ~г (plaj) = 0, если г ^ rrij, и plaj = 0, если г = щ. Докажем, что рто~г в точности совпадает с порядком элемента plaj. Пусть этот порядок равен s. Тогда s должно делить рто~г и, значит, имеет вид р1. Если t <rrij — i, то равенство pl (plaj) = 0 показывало бы, что pt+taj = 0, т. е. элемент aj имел бы порядок меньший, чем ршк Значит, \plAj\ = рто~г при г ^ rrij. То, что plAj = 0 при г ^ щ (и, значит, \plAj\ = 1), — очевидно.
13.4. Конечнопорожденные периодические модули над евклидовым кольцом 473 Теперь мы можем буквально повторить то же рассуждение, которым мы пользовались выше. Мы видим, что в разложении ргА = ргА\ 0 ргА2 © • • • © ргАт встречаются подгруппы порядка р, когда rrij — г — 1, т. е. rrij = г + 1 и, значит, согласно принятым обозначениям, они встречаются li+\ раз. Точно так же подгруппы порядка р2 встречаются, когда тj = г + 2, т. е. li+2 раз, и т. д. Кроме того, некоторые подгруппы будут иметь порядок, взаимно простой с р. Это значит, что \р{А\ = pl*+lp*li+2 • • • щ, где (щ,р) = 1. Иначе говоря, в соответствии с предыдущими обозначениями, мы имеем Zi+i + 2Zi+2 + • • ■ = г*. (13.26) В частности, формула (13.25) получается из (13.26) при г = 0. Вычитая теперь из каждой формулы (13.26) последующую, мы получаем, что для всех г = 1,2,... выполнены равенства k + k+i + ••• =r»_i -п. Повторяя тот же прием, получаем, что k = n-i -2ri + ri+x. Эти соотношения и доказывают теорему 13.2. Теоремы 13.1 и 13.2 легко дают возможность указать число различных (с точностью до изоморфизма) конечных абелевых групп заданного порядка. Пример 13.7. Пусть, например, мы хотим определить число различных с точностью до изоморфизма групп порядка p3q2, где р и q — различные простые числа. Теорема 13.1 показывает, что такая группа представляется в виде А = Gi ф • • • ф Gs, где d — циклические группы, порядки которых — степени простых чисел. Из этого разложения следует, что |A| = |d|-...-|Ce|. Иначе говоря, среди групп С% имеются либо одна циклическая группа порядка р3, либо одна — порядка р2 и одна — порядка р, либо три — порядка р. И точно также: либо одна — порядка q2, либо две — порядка q. Комбинируя эти возможности (3 для групп порядка рг и 2 для групп порядка qi), мы получаем 6 вариантов. Теорема 13.2 гарантирует, что все полученные таким образом 6 групп не изоморфны. § 13.4*. Конечнопорожденные периодические модули над евклидовым кольцом Доказательство теоремы о конечных абелевых группах и теоремы о жор- дановой нормальной форме (точно так же, как и доказательства соответству-
474 Гл. 13. Группы, кольца, модули ющих теорем единственности) настолько параллельны друг другу, что явно являются частными случаями каких-то более общих теорем. Это действительно так, и основной целью настоящей главы является доказательство этих общих теорем. Для этого нам будут нужны еще два абстрактные (т. е. определяемые аксиоматически) понятия. Определение. Кольцом называется множество Д, в котором определены две операции (т.е. два отображения Rx R —► Л), одна из которых называется сложением (при этом элемент, сопоставляемый двум элементам a е R и Ъ е R, называется суммой и обозначается через а + 6), а вторая — умножением (элемент, сопоставляемый двум элементам а е R и Ъ е Д, называется произведением и обозначается через аЪ). Для операций сложения и умножения должны выполняться следующие свойства: 1) относительно операции сложения кольцо образует коммутативную группу (единичный элемент которой обозначается 0); 2) для любых а,Ъ,с G R выполняются соотношения а(Ъ + с) = ab + ас, {Ь + с)а = Ьа + са\ 3) для любых a,b,c £ R выполняется свойство ассоциативности а(Ъс) = (аЪ)с. Дальше мы будем обозначать кольцо буквой R и предполагать, что оно обладает единицей, т. е. что в нем содержится элемент, который мы будем обозначать как 1, обладающий свойством: а • 1 = 1 • а = а для любого a е R. В этой главе будут рассматриваться только коммутативные кольца, т. е. предполагается, что аЪ = Ъа для любых a,b G R. Мы уже встречались с важнейшим частным случаем кольца — алгебрами — в связи с конструкцией внешней алгебры векторного пространства в гл. 10. Напомним, что алгебра — это кольцо, являющееся векторным пространством, причем, конечно, предполагается согласованность входящих в эти определения понятий. Это означает, что для любого числа а (из поля, над которым рассматривается векторное пространство) и любых элементов а, Ъ кольца R выполнено равенство (aa)b — a(ab). С другой стороны, нам хорошо знаком пример кольца, которое ни в каком естественном смысле не является алгеброй — это кольцо целых чисел Z с обычными арифметическими операциями сложения и умножения. Отметим связь введенных понятий: если все элементы коммутативного кольца, отличные от 0, образуют группу относительно умножения, то такое кольцо называется полем. Простейшие свойства полей и колец мы предполагаем известными читателю.
13.4. Конечнопорожденные периодические модули над евклидовым кольцом 475 Понятие, которое обобщает и векторное пространство (над некоторым полем К) с заданным на нем линейным преобразованием, и абелеву группу, называется модулем. Определение. Модулем М над кольцом R называется абелева группа М (операция в ней записывается как сложение), если дополнительно определена операция умножения элементов кольца R на элементы модуля М, дающая элементы модуля и обладающая свойствами: а (т + п) = am + an (а + Ъ)т — am + bm (ab) m = a (bm) 1 m = m для любых элементов a, b e R и любых элементов т,п е М. Для удобства мы будем обозначать элементы колец обычными буквами: а, Ь,..., а элементы модулей — жирными буквами: т,тг,... Пример 13.8. Многократно встречавшимся нам примером модуля является векторное пространство над произвольным полем К (здесь кольцо R = К). С другой стороны, любая абелева группа G является модулем над кольцом целых чисел Z — определенная в ней операция целого кратного kg для k e Z и g Е G, очевидно, обладает всеми перечисленными свойствами. Пример 13.9. Пусть L — векторное пространство (вещественное, комплексное или над произвольным полем К) и я/: L —► L — некоторое фиксированное линейное преобразование. Тогда мы можем считать L модулем над кольцом многочленов R от одной переменной х (вещественных, комплексных или над полем К), положив, как мы это делали раньше, для многочлена f(x) e R и вектора е е L /Or) e =/00(e). (13.27) Легко проверить, что все свойства, входящие в определение модуля, будут выполнены. Нашей ближайшей целью будет найти такое ограничение общего понятия модуля, которое охватывало бы векторные пространства и абелевы группы, и тогда доказать для них теорему, обобщающую теоремы 5.3 и 13.1. Эти два примера — кольцо целых чисел Z и кольцо многочленов от одной комплексной переменной (для простоты мы ограничиваемся частным случаем К = С, но многие результаты верны и в общем случае) — имеют много похожих свойств, главным из которых является однозначность разложения на неразложимые множители — простые числа в случае кольца целых чисел и линейные многочлены в случае кольца многочленов с комплексными коэффициентами. Оба эти свойства, в свою очередь, вытекают из одного — возможности деления с остатком, которое мы и введем в определение колец, для которых можно обобщить рассуждения из предыдущих параграфов. Определение. Кольцо R называется евклидовым, если аЪфО для любых a,b G R, а ф 0 и b 7^ О,
476 Гл. IS. Группы, кольца, модули и для его элементов а ф О определена функция ср(а) с неотрицательными целыми значениями, обладающая следующими свойствами: 1) (p(ab) ^ (р(а) для любых элементов а, Ъ G R, а ф О, Ь т^ О"» 2) для любых элементов а,Ъ Е R, где а ^ О, существуют такие q,r e R, что b = aq + r (13.28) и либо г = 0, либо у?(г) < (р(а). Для кольца целых чисел эти свойства выполняются при ср(а) = \а\, для кольца многочленов — если ср(а) — степень многочлена а. Определение. Элемент а кольца R называется обратимым, если существует такой элемент Ъ е R, что ab = 1. Элемент Ъ называется делителем элемента а (или говорят, что а делится на Ь), если существует такой элемент с, что а = be. Очевидно, что свойство делимости не меняется при умножении а или Ъ на обратимый элемент. Два элемента, отличающиеся обратимым множителем, называются ассоциированными. Например, в кольце целых чисел обратимыми являются +1 и —1, а ассоциированными — такие числа, которые равны или отличаются друг от друга знаком. В кольце многочленов обратимы постоянные многочлены, отличные от тождественного нуля, а ассоциированными являются такие многочлены, которые отличаются друг от друга постоянным ненулевым множителем. Элемент р кольца называется простым, если он не обратим и не имеет других делителей, кроме ассоциированных с ним и обратимых элементов. Теория разложения на простые множители в евклидовом кольце в точности повторяет то, что известно для кольца целых чисел. Если элемент а не простой, то он имеет такой делитель Ъ, что а = be, но с не обратим. Значит, а не является делителем Ъ, и существует представление b = aq + г с (р(г) < <р(а). Но г = Ъ — aq = 6(1 — cq) и поэтому (р(г) > <р(Ь), т. е. (p(b) ^ (p(r) < (f(a), значит, ср(Ь) < (р(а). Применяя эти же рассуждения к Ь, мы, в конце концов, дойдем до простого делителя а и покажем, что любой элемент представляется как произведение простых. Точно те же рассуждения, что и в случае целых чисел или многочленов, показывают единственность такого разложения в следующем точном смысле. Теорема 13.3. Если в евклидовом кольце R имеется два разложения одного элемента а на простые множители: a>=Pl--Pr, a, = qi---qs, то г = s и при надлежащей нумерации множителей pi и qi ассоциированны. Как и в кольце целых чисел, в любом евклидовом кольце каждый необратимый элемент а ф 0 представляется в виде а = ир^...р?г,
13.4. Конечнопорожденные периодические модули над евклидовым кольцом 477 где элемент и обратим, все щ — простые и не ассоциированные друг с другом элементы, щ — натуральные числа. Такое представление в естественном смысле единственно. Как и в кольце целых чисел или многочленов от одной переменной, представление (13.28) при г ф 0 можно применить к элементам Ъ и г, и повторять до тех пор, пока мы не придем к случаю г = 0. Так мы получим наибольший общий делитель (НОД) элементов а и Ъ, т. е. такой их общий делитель, что любой другой общий делитель делит его. НОД элементов а и Ъ обозначается d = (a,b). Этот процесс, как и для целых чисел, называется алгоритмом Евклида (откуда и название колец). Из алгоритма Евклида следует, что НОД элементов а и Ъ представим в виде d = ах + by, где х и у — некоторые элементы кольца R. Два элемента а и Ь называются взаимно простыми, если они не имеют общих делителей, кроме обратимых. Тогда можно считать, что НОД [а, Ь) = 1 и, как следует из алгоритма Евклида, существуют такие элементы х,у Е R, что ах + Ъу= 1. (13.29) Теперь вспомним, что теорема о жордановой нормальной форме верна в случае конечномерных векторных пространств, а теорема об абелевых группах — для конечных абелевых групп, и введем аналогичные условия конечности и для модулей. Определение. Модуль М называется конечнопорожденным, если в нем существует такое конечное число элементов т\,... ,тг, называемых образующими, что любой его элемент т е М может быть представлен в виде га = а\т\ -\ Ь агтг (13.30) при некоторых элементах а\,... ,аг кольца R. Для векторного пространства, рассматриваемого как модуль над некоторым полем, это и есть определение конечномерности, и представление (13.30) — это представление вектора т в виде линейной комбинации векторов mi,'...,mr (заметим, что система векторов mi,...,mr, вообще говоря, может не быть базисом, так как нет условия линейной независимости). В случае конечной абелевой группы за т\,...,тг можно взять вообще все элементы группы. Сформулируем еще одно условие такого же типа: Определение. Элемент т модуля М над кольцом R называется периодическим, если существует такой элемент ат ф 0 кольца R, что агпт = 0, здесь 0 — нулевой элемент модуля М, индекс в ат введен для того, чтобы показать, что этот элемент зависит от т. Модуль называется периодическим, если все его элементы — периодические (иногда такие модули называются модулями кручения). Для конечнопорожденного периодического модуля существует такой единый элемент а ф 0 кольца R, что ат = О для всех элементов т G М.
478 Гл. 13. Группы, кольца, модули Действительно, для этого достаточно положить а — аТП1 • • • а^ для элементов mi, ••• ,тпг в представлении (13.30). Считая кольцо R евклидовым, мы можем заключить, что а ф 0. Для случая конечной абелевой группы за а можно взять порядок группы. Пример 13.10. Пусть М — модуль, определенный векторным пространством L размерности га и линейным преобразованием si по формуле (13.27). Для любого вектора е Е L рассмотрим векторы е, ^(е), ..., ^п(е). Их число га + 1 больше размерности га пространства L, поэтому эти векторы линейно зависимы, и значит, существует такой многочлен f(x), не равный тождественно нулю, что f(g/)(e) = О, т.е. в нашем модуле М элемент е периодичен. Если же, как мы делали в примере 13.8, рассматривать векторное пространство как модуль над соответствующим полем R или С, то ни один его ненулевой вектор не будет периодическим элементом модуля. Пусть М — модуль над кольцом R. Подгруппа М! группы М называется подмодулем, если для любых элементов а Е R и m! Е М' элемент am! Е Mr. Пример 13.11. Для абелевой группы как модуля над кольцом целых чисел, очевидно, любая подгруппа является подмодулем. Аналогично, для векторного пространства как модуля над кольцом, совпадающим с соответствующим полем, подмодулем является любое подпространство. Если М — модуль, определенный векторным пространством L и его линейным преобразованием srf по формуле (13.27), то, как легко проверить, его подмодуль — это векторное подпространство, инвариантное относительно линейного преобразования srf'. Если М1 С М — подмодуль, и m — произвольный элемент модуля М, то, как легко проверить, совокупность элементов вида am + m/, где а — любой элемент кольца Rum' — любой элемент подмодуля М;, образует подмодуль. Мы обозначим его через (m,Mf). Так как мы предполагаем кольцо R евклидовым, то для любого периодического элемента m £ М существует элемент а Е Л, обладающий свойством атт! = 0 и такой, что для него функция (р(а) принимает наименьшее значение среди всех элементов с этим свойством. Тогда любой элемент с, для которого С771 = 0, делится на а. Действительно, если бы это было не так, то мы имели бы соотношение с = aq + r, cp(r) < ср(а) и, очевидно, Г771 = 0, что противоречит определению а. В частности, два таких элемента а и а' делятся друг на друга, т. е. ассоциированы. Элемент а Е R называется порядком элемента m E М. Надо иметь в виду, что это не точное выражение, так как порядок определяется лишь с точностью до ассоциированности. Пример 13.12. Если, как в примере 13.9, модуль — это векторное пространство L, рассматриваемое как модуль над кольцом многочленов f(x) с помощью формулы (13.27), то любой элемент е Е L является периодическим,
13.4. Конечнопорожденные периодические модули над евклидовым кольцом 479 и его порядок — то же самое, что минимальный многочлен вектора е (см. определение на с. 154), а указанное свойство периода совпадает с теоремой 4.6. Определение. Подмодуль М' модуля М называется циклическим, если в нем существует такой элемент т1, что все элементы модуля М' представляются в виде am! с некоторыми а Е R. Это записывается так: М* = {т'}. Определение. Модуль М называется прямой суммой своих подмодулей Mi,... ,МГ, если любой элемент т Е М представляется в виде суммы т = т\ + • • + rnr, rrii E Mi, и такое представление единственно. Очевидно, что для установления единственности этого разложения достаточно доказать, что из равенства т\ Н Ь mr — О, mi E Mi, следует, что все rrii = 0. Это записывается в виде равенства m = Mi е---емг. Основная теорема, которую мы докажем, содержащая как частный случай и теорему 5.3 о жордановой нормальной форме, и теорему 13.1 о конечных абелевых группах, заключается в следующем: Теорема 13.4. Любой конечнопорожденный периодический модуль М над евклидовым кольцом R является прямой суммой таких циклических подмодулей м = сг е • • • е сг, а = {пи}, (13.31) что порядок каждого элемента rrii является степенью простого элемента кольца R. Пример 13.13. Если М — конечная абелева группа, рассматриваемая как модуль над кольцом целых чисел, то эта теорема непосредственно превращается в основную теорему о конечных абелевых группах (теорема 13.1). Пусть модуль М определяется конечномерным комплексным векторным пространством L и его линейным преобразованием я/ по формуле (13.27). Тогда Ci — это инвариантные относительно si векторные подпространства, и в каждом из них существует такой вектор rrii, что все остальные векторы записываются в виде f{s/){rrii). Простыми элементами в кольце комплексных многочленов являются многочлены вида х — Л. По условию, для каждого вектора rrii существует такое Л^ и натуральное число щ, что Если мы возьмем минимальное возможное значение щ, то, как было доказано в § 5.1, векторы гщ, (я/- \г£)(тщ), ..., ^ - \{§)п'-\ггц) будут образовывать базис этого подпространства, т.е. Ci — циклическое подпространство, соответствующее корневому вектору rrii. Мы получаем основную теорему о жордановой форме (теорему 5.3).
480 Гл. 13. Группы, кольца, модули Вспомним, что теорему 5.3 мы доказывали индукцией по размерности пространства. Точнее говоря, для линейного преобразования srf в пространстве L мы строили инвариантное относительно set подпространство L', размерности на 1 меньшей, и доказывали теорему для L, считая ее уже доказанной для L'. Реально это означало, что мы построили последовательность вложенных друг в друга подпространств L = Lo D Ц э L2 э ... Э U D Ln+i = (0), (13.32) инвариантных относительно si и таких, что diml_i+i = dimL; — 1. Потом мы сводили доказательство теоремы 5.3 для L к доказательству ее для Ц, далее — для L.2 и т. д. Сейчас нашей первой целью будет построить в каждом конечнопорожденном периодическом модуле последовательность подмодулей, аналогичную последовательности подпространств (13.32). Л е м м а 1. В каждом конечнопорожденном периодическом модуле М над евклидовым кольцом R существует такая последовательность подмодулей М = М0 Э Mi D М2 D ... D Mn D Мп+1 = {О}, (13.33) что Mi ф М{+\, Mi = (mi,Mi+i), где rrii — элементы модуля М, и для каждого из них существует такой простой элемент щ кольца R, что Pimi e Mi+i. Доказательство. По определению конечнопорожденного модуля, существует такое конечное число образующих m\,...,mr e M, что элементы а\гп\ + • • • + агтг исчерпывают все элементы модуля М, когда ai,...,ar пробегают все элементы кольца R. Совокупность элементов вида а^ти + + --- + armr, где a/c,...,ar — всевозможные элементы кольца Д, очевидно, составляет подмодуль модуля М. Обозначим его через М&. Очевидно, что Mk D Mfc+i и Mk = (rrijb,Mjfe+i). Без ограничения общности можно считать, что rrtk £ Mfc+i, так как в противном случае элемент rrtk можно исключить из числа образующих. Построенная цепочка подмодулей Mk еще не является фигурирующей в лемме 1 ^цепочкой подмодулей Mi. Эту цепочку мы получим из цепочки подмодулей Mk, вставив еще между модулями Mk и М&+1 несколько промежуточных подмодулей. Так как элемент rrtk EM- периодический, то существует элемент а е R, для которого arrtk = 0 и, в частности, arrtk £ Mk+\. Пусть а — элемент кольца Я, для которого arrik G M^+i и (р(а) принимает наименьшее значение среди всех элементов с таким свойством. Если элемент а прост, то мы положим pi = а, и тогда между Mk и Mk+\ никаких подмодулей вставлять не нужна Если же а не прост\ то пусть р\ — один из его простых делителей и а = р\Ь. Положим т^\ = brrik и M^j = (m^.M^i). Тогда, очевидно, Pi га/с, 1 £ Mk,\ и brrik G Mk,\. Как мы видели, (p(b) < (р(а) (неравенство строгое). Поэтому, повторяя этот процесс конечное число раз, мы вставим между Mk и Mk+\ конечную цепочку подмодулей (13.33) с нужными свойствами. Замечание. Можно показать, что длина п всех цепочек вида (13.33), удовлетворяющих условиям леммы 1, одинакова. Более того, любая цепочка подмодулей М = М0 D Mi D M2 D • • • D Мт,
13.4. Конечнопорожденные периодические модули над евклидовым кольцом 481 в которой Mi ф Mi+\, имеет длину т ^ п, причем это верно при гораздо меньших ограничениях на кольцо R и модуль М, чем мы предполагали в этой главе. Существенным здесь является лишь то, что между соседними подмодулями Mi и Mi+\ в цепочке не существует «промежуточного» подмодуля М[, такого, что Mi D М[ э М^+ь отличного от самих М{ и Mi+\. Например, рассмотрим n-мерное векторное пространство L над полем К как модуль над кольцом R = K. Пусть ai,...,an — некоторый базис. Тогда подпространства Ц = (а*,..., оп), г = 1,...,п, обладают указанным свойством. Используя это, мы могли бы дать определение размерности векторного пространства, не апеллирующее к понятию линейной зависимости. Таким образом, длина п всех цепочек вида (13.33), удовлетворяющих условиям леммы 1, — это «правильное» обобщение размерности пространства на конечнопорожденные периодические модули. Следующая лемма аналогична той, которой мы пользовались при доказательстве теорем 5.3 и 13.1. Лемма 2. Если порядок элемента т модуля М является степенью простого элемента: рпт = 0, и элемент х циклического подмодуля {га} не делится на р (т. е. не представляется в виде х = ру, где у Е М), то {га} = {х}. Доказательство. Очевидно, что {х} с {га}. Таким образом, нам остается показать, что {га} с {х}, а для этого достаточно убедиться, что га Е {х}. По условию, х = am, где а — некоторый элемент кольца R. Если а делится на р, то очевидно, что и х делится на р. Действительно, если а — pb с некоторым Ь Е R, то из равенства х — am мы получаем х = ру, где у = Ьт, вопреки предположению, что х не делится на р. Значит, аир взаимно просты, и следовательно, ввиду однозначности разложения на простые элементы в кольце R, а взаимно просто и с рп. Тогда, на основании алгоритма Евклида, найдутся такие элементы и и v из R, что au+pnv = 1. Умножая обе части этого равенства на га, мы получим, что га = их, и значит, т Е {х}. Л е м м а 3. Пусть М\ — подмодуль модуля М над евклидовым кольцом R, такой, что М = (т,М\) и М ф М\. Тогда если для некоторых а,р Е R выполнены включения am Е М\ и рт Е М\, где элемент р — простой, то а делится на р. Доказательство. Предположим, что элемент а не делится на р. Так как элемент р — простой, то тогда (а,р) = 1, и из алгоритма Евклида в кольце R следует, что существуют два элемента u,v E R, для которых аи + pv — 1. Умножая обе части этого равенства на га, с учетом включений am E М\ и рт Е М\ мы получаем, что га Е М\. По определению, (га,Mi) состоит из элементов Ът + т! при всевозможных Ъ Е R и т/ Е М\. Следовательно, М = (га,Mi) = Mi, что противоречит условию леммы. Доказательство теоремы 13.4 почти дословно повторяет доказательство теорем 5.3 и 13.1. Мы можем воспользоваться индукцией по длине п 16 А. О. Ремизов, И. Р. Шафаревич
482 Гл. 13. Группы, кольца, модули цепочки (13.33), т.е. предполагать теорему верной для модуля М\. Пусть М{ =Ci0---©Cr, (13.34) где Ci = {c{} — циклические подмодули, а порядок каждого элемента ci — степень простого элемента. Согласно лемме 1 М = (т,М\) и рт £ М\, где р — простой элемент. Тогда на основании разложения (13.34) мы имеем: pm = zi-{ \-zr, ZieCi. (13.35) Отберем те элементы Zi, которые делятся на р. За счет изменения нумерации мы можем предполагать, что это первые s — 1 слагаемых. Положим zi = pz\ для г = 1,..., s — 1. Далее мы должны рассмотреть два случая. Случай 1. Число s — 1 = г. Тогда рт = рт', где т! = z\ + • • • + z'r. Положим т — т/ = т. Очевидно, что рт — 0. Докажем, что модуль М представим в виде М = {т} © С\ © • • • Ф Сг. Действительно, по условию любой элемент х Е М можно представить в виде х = am + у, где а е R и у G М\, а значит, и в виде х = am + у', где yf = = am' + у е Mi. Докажем, что для двух таких представлений х = ат + у, х = а,т + у\ (13.36) выполнены равенства am — а'т и у = у'. Отсюда будет вытекать, что м = {т} © Mi = {т} © Ci © • • • © сг, т.е. соотношение (13.31) в нашем случае. Из равенств (13.36) мы получаем, что am = у, где а = а — а',у = yf — у и, по условию, у е Mi. Согласно лемме 1 существует такой простой элемент р кольца Л, что рт е Mi, и значит, рт е М\. По лемме 3, из включений am e Mi и рт G Mi вытекает, что элемент а делится на р, т.е. а = Ър для некоторого Ъ е R. Отсюда, очевидно, получаем, что am = b(pm) = 0. Следовательно, am = а'т и у = у1. Случай 2. Число s — 1 < г. Если элемент с; имеет порядок р^ и р^ не ассоциированно с р, то р^ не делится на р и, следовательно, все элементы модуля С{ = {с;} делятся на р, согласно лемме 2. Поэтому в число отобранных 5—1 подмодулей Сг входят все, для которых порядок элемента q есть р^ и р; не ассоциировано с р. Так как порядок элемента вообще определен с точностью до замены его ассоциированным элементом, то мы можем считать, что у оставшихся подмодулей Cs = {cs},... ,Cr = {сг} порядок элемента с* есть степень р. Согласно построению в разложении (13.35) мы имеем z% = pz\, z\ e С», для всех г = 1,..., s — 1. Обозначив z\-\ Ь z/s_l = z1 и m — z' = т, мы получим равенство рт — zs -\ У zr. (13.37) Так как порядок элемента q при г = 5,...,г есть степень р, то порядок любого элемента Zi в разложении (13.37) тоже есть степень р. Обозначим
13.4. Конечнопорожденные периодические модули над евклидовым кольцом 483 его через рщ. Очевидно, мы можем выбрать нумерацию слагаемых в формуле (13.37) таким образом, чтобы числа щ не убывали: 1 ^ ns < ns+i ^ ... ^ пг. Докажем, что порядок элемента т равен рПг+1 и имеет место равенство м = {т} © С\ © • • ■ © cs_i © • • • © сг_ь т.е. в разложении будут встречаться все подмодули С%, кроме Сг. Этим соотношение (13.31) будет доказано и во втором случае, т.е. доказательство теоремы 13.4 будет полностью завершено. Умножая обе части равенства (13.37) на рПг и пользуясь тем, что pnrZi = О для всех г = s,...,г, мы получим, что рПг+1т = 0. Если порядок а элемента т не ассоциирован с рПг+1, то он делит его и с точностью до ассоциированности равен рк при некотором к < пг + 1. Умножая соотношение (13.37) на рк~1 и пользуясь тем, что подмодули С\,...,СГ образуют прямую сумму, мы получим, что pk~lZi = О при всех г = s,...,г. В частности, pk~lzr = О, а это противоречит предположению к < пг + 1 и тому, что порядок элемента zr равен рПг. Таким образом, порядок элемента Тп равен рп^т Заметим, что, по построению, в разложении (13.37) элемент zr не делится на р. Из доказанного на основании леммы 2 следует, что {zr} = {сг} = Сг. Отсюда вытекает, что любой элемент m E M представляется в виде суммы элементов модулей {т}, Си ..., Св_ь ..., Cr_i. (13.38) Действительно, аналогичное утверждение верно для модулей {т}, Си ..., С5_ь ..., Сг, (13.39) так как согласно нашему построению, rfi = m — z' и z' = z\ Л V z's_l9 где z[ e Ci. Следовательно, m = Ш + z\ Л V z's_x и, значит, любой элемент тп^М является суммой элементов модулей (13.39). Теперь нам нужно проверить, что все элементы подмодуля СТ выражаются в виде суммы элементов подмодулей (13.38). Так как Cr = {zr}, то достаточно проверить это для одного элемента zr. Но соотношение (13.37) как раз и дает нужное нам представление: zr = prn — zs — • • • — zr-\. Остается проверить второе условие, входящее в определение прямой суммы: что такое представление единственно. Для этого достаточно доказать, что в соотношении am + /!+-•• + /в_! + • • • + Д_! =0, fi e Си (13.40) все слагаемые обязаны быть равными 0. Действительно, из соотношения (13.40) с учетом (13.34) вытекает, что am G М\. Но по построению элемента т, тогда и am £ М\. Согласно лемме 3 из включений am G М\ и pm G М\ вытекает, что элемент а делится на р, т. е. а — Ър для некоторого Ъ е R. Кроме того, мы знаем, что prn = zs-\ V zr, 16*
484 Гл. 13. Группы, кольца, модули причем порядок элемента zr есть рПг, а порядок элемента т есть p"r_r\ Подставив все эти соотношения в разложение (13.40), мы получим b(zs + ... + Zr) + fl + ... + /s_! + • • • + /r_! = 0. Тогда из формулы (13.34) следует, что то bzr = 0, а так как порядок элемента zr равен рПг, то рПг делит Ъ. Значит, элемент а делится на рПг+1, и am = 0. Но тогда из равенства (13.40) вытекает, что /1+--- + /г_1 =0. Снова воспользовавшись индуктивным предположением (13.34), мы получаем, что fi = О,..., fr_i = 0. Это и завершает доказательство теоремы 13.4. Для теоремы 13.4 имеет место такая же теорема единственности, как и в случае теоремы 5.3 и теоремы 13.1. А именно, если М = Ci0---eCr, Ci = {rrti}, M = D\ ®--®Ds, Dj = {nj} — два разложения конечнопорожденного периодического модуля М, в которых порядки элементов mi и щ — степени простых, т.е. p^rrti = 0 и (h3rtj =0, где pi и qj — простые элементы, то при надлежащей нумерации слагаемых С% и Dj элементы pi и qi ассоциированы и п = Si. Однако естественное доказательство этой теоремы потребовало бы введения некоторых новых понятий, и мы не будем его здесь приводить.
Глава 14 ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ Теория представлений является одним из наиболее «прикладных» разделов алгебры: она имеет множество приложений в различных разделах математики и математической физики. В этой главе мы будем заниматься задачей о том, как найти все конечномерные представления для конечных групп. Но аналогичная теория построена и для некоторых типов бесконечных групп, важных для других разделов математики. § 14.1. Основные понятия теории представлений Напомним некоторые определения из предшествующей главы, которые будут играть здесь ключевую роль. Гомоморфизмом группы G в группу G' называется такое отображение /: G —> G\ что для любых двух элементов д\,д2 G G выполнено соотношение Изоморфизмом группы G в группу G' называется взаимно однозначный гомоморфизм /: С? —> G'. Определение изоморфизма получается добавлением требования взаимной однозначности отображения. Группы G и G' называются изоморфными, если между ними существует изоморфизм /:(?—> G'. Это обозначается как G ~ G'. Определение. Представлением группы G называется ее гомоморфизм в группу невырожденных линейных преобразований векторного пространства L. При этом пространство L называется пространством представления, а его размерность dim L — размерностью представления. Таким образом, для того, чтобы задать представление группы G, нужно каждому элементу g e G сопоставить невырожденное линейное преобразование srfg\ L —> L, причем для всех g\,g2^G должно быть выполненным условие ^9192=^91^92- (14Л) Так как группа невырожденных линейных преобразований n-мерного пространства изоморфна группе невырожденных квадратных матриц порядка п, то для задания представления достаточно сопоставить каждому элементу g E G невырожденную квадратную матрицу А9 так, чтобы выполнялось условие (14.1).
486 Гл. 14. Элементы теории представлений Из (14.1) сразу же следует, что для представления srfg и любого числа элементов g\,...,gk группы G справедливо соотношение ^-9к=< ••'<<• (14.2) Кроме того, очевидно, что если е — единичный элемент группы G, то я?е = ё, (14.3) где & — тождественное линейное преобразование пространства L. А если g~l — обратный элемент к д, то j*g-i=s*g~l, (14.4) т.е. si/g-i — это преобразование, обратное к srfg. Пример 14.1. Пусть G = GLn — группа невырожденных квадратных матриц порядка п. Положим для матрицы д Е GLn **д = Ы- Так как \д\ — это число, по условию отличное от нуля, то мы имеем одномерное представление. Очевидно, что для любого целого п равенство Яя = \д\п тоже будет определять одномерное представление. Пример 14.2. Пусть G = Sn — симметрическая группа степени п, т.е. группа перестановок множества М, состоящего из п элементов, и L — векторное пространство размерности п, в котором выбран базис ei,...,en. Для перестановки ,-П 2 - п * \3\ 32 '" Зп определим srfg как такое преобразование, что ^д(е0 = eh> ^д(е2) = ej29 ..., srfg(en) = ejn. Тогда мы получим n-мерное представление группы Sn. Для того, чтобы не пользоваться определенной нумерацией элементов множества М, сопоставим элементу а е*М базисный вектор еа. Тогда описанное выше представление задается формулой &fg{ea) = eb, если д(а) = Ъ для любого преобразования д: М —> М. Пример 14.3. Пусть G = S^ — симметрическая группа третьей степени, L — двумерное пространство с базисом е\,в2. Положим вектор ез = — (ei +ег). Для перестановки 4 2 3 ^'i к Зъ определим srfg как такое преобразование, что
14.1. Основные понятия теории представлений 487 Легко проверить, что таким образом мы получаем двумерное представление симметрической группы S3. Пример 14.4. G = GL<i — группа невырожденных матриц второго порядка, L — пространство многочленов от двух переменных х и у, степень которых по совокупности переменных не превосходит п. Для невырожденной матрицы ^=\c d) определим &tQ как линейное преобразование пространства L, переводящее многочлен f(x, у) в f(ax + by, ex + dy), т. е. £/g(f(x, у)) = f(ax + by, ex + dy). Легко проверить, что при этом выполнено соотношение (14.1), т.е. мы имеем представление группы невырожденных матриц второго порядка. Его размерность равна размерности пространства многочленов от х и у, степень которых (по совокупности переменных) не превосходит п, т.е., как легко видеть, она равна (п+ 1)(п + 2)/2. Пример 14.5. Для любой группы и n-мерного пространства L представление, определенное формулой h/g = &, где £ — тождественное преобразование пространства L, называется n-мерным единичным представлением. В определении представления пространство L может быть и бесконечномерным. В этом случае представление также называется бесконечномерным. Например, определив представление так же, как и в примере 14.4, но взяв за L пространство всех непрерывных функций, мы получим бесконечномерное представление. Дальше мы будем рассматривать только конечномерные представления. Пространство L будет всегда предполагаться комплексным. Пример 14.6. Во многих вопросах интересны бывают представления симметрической группы Sn. Все они известны, но здесь мы опишем лишь все одномерные представления группы Sn. В этом случае невырожденное линейное преобразование srfQ задается матрицей первого порядка, т.е. одним комплексным числом (которое, конечно, не равно нулю). Таким образом, мы приходим к функции с числовыми значениями на группе. Обозначим эту функцию через <р(д). Тогда, согласно определению, она должна удовлетворять условиям (р(д) т^Ои <р№) = <р(д)ф) (14.5) для любых элементов д и h из группы Sn. Легко найти все возможные значения <р(т)9 если г — транспозиция. А именно, полагая д — h — т, пользуясь тем, что т2 = е (тождественное преобразование), и что, очевидно, (р(е) = 1, из соотношения (14.5) мы получаем равенство <р(т)2 = 1, откуда ср(т) — ±1. Теоретически можно предположить, что для некоторых транспозиций <р(т) = 1, а для других ср(т) — — 1. Однако на самом деле такого не бывает, и равенство <р(т) = 1 или <р{т) = — 1 выполнено сразу для всех транспозиций г, выбор знака зависит лишь от одномерного представления (р. Докажем это.
488 Гл. 14. Элементы теории представлений Пусть г = та£ и т1 = rcrf — две транспозиции, где a,b,c,d — элементы множества М (см. формулу (13.3)). Очевидно, что существует такая перестановка g множества М, что д(с) = а и g(d) = 6. Тогда, как легко проверить, исходя из определения транспозиции, имеет место равенство д~1 та^д = тсд, т.е. т' = д~1 тд. Ввиду соотношений (14.2), (14.4) и (14.5) из последнего равенства получаем vtf) = <р(д)~1 Ф) via) = ^(г)> что и доказывает наше утверждение для любых транспозиций т и т'. Теперь воспользуемся тем, что любой элемент д группы Sn является произведением конечного числа транспозиций, см. формулу (13.4). Из нее с учетом сказанного выше следует, что Ч>(9) = 4>(та1м) Фа2,Ъ2) ••' <Р(Так,Ък) = 4>(т)к, (14.6) где (р(т) = +1 или —1. Таким образом, возможны два случая. Первый случай — это когда для всех транспозиций г Е Sn число (р(т) = 1. В силу формулы (14.6), и для любой перестановки д G Sn число <р(д) = 1, т. е. функция (р на Sn тождественно равна 1, и следовательно, задает одномерное единичное представление группы Sn. Второй случай — это когда для всех транспозиций г Е Sn число <р(т) — — 1. Тогда, в силу формулы (14.6), для перестановки д Е Sn число ^(я) — (~ l)fe» гДе ^ соответствует четности или нечетности перестановки д. Другими словами, <р(д) = 1, если перестановка д четная, и (р(д) = — 1, если перестановка д нечетная. Из соотношения (13.4) сразу следует, что такая функция ip действительно определяет одномерное представление группы Sn, оно обозначается е(д). Таким образом, нами получен следующий результат: симметрическая группа Sn имеет ровно два одномерных представления: единичное и е{д). Одномерные представления группы Sn и связанных с нею групп (например, знакопеременной группы Ап) играют большую роль в различных вопросах алгебры. Например, одним из известнейших результатов алгебры является вывод формул для решения уравнений степеней 3 и 4. Математики долго бились над попытками найти аналогичные формулы для уравнений степени 5 и выше. Наконец, было доказано, что это невозможно, т. е. что не существует формулы, выражающей корни уравнения степени ^ 5 через его коэффициенты при помощи арифметических операций и извлечений корней произвольной степени. Ключевым моментом в доказательстве этого утверждения является установление того факта, что знакопеременная группа Ап при п ^ 5 не имеет одномерных представлений, отличных от единичного. При п = 3 и 4 такие представления группы Ап есть, и этим объясняется существование формул для решения уравнений соответствующих степеней. Теперь установим, какие представления мы будем считать одинаковыми. Определение. Два представления д *-> s£g и д н-> «я^ одной и той же группы G с пространствами L и L' одинаковой размерности называются
14.1. Основные понятия теории представлений 489 эквивалентными, если существует такой изоморфизм с€\ L' —> L векторных пространств L' и L, что ^ = <е-1д/д<& (14.7) для любого элемента д G G. Пусть e'p ..., е!п — базис пространства 1_; и ei = ^(e'j),..., en = ^(eJJ — соответствующий ему базис пространства L, так как линейное преобразование с^\ I/ —> L — изоморфизм. Сравнивая соотношение (14.7) с формулой замены (3.43), мы видим, что это определение означает, что матрица преобразования srfg в базисе е\,...,е'п совпадает с матрицей преобразования srfg в базисе ei,...,en. Таким образом, представления stg и si1 эквивалентны тогда и только тогда, когда в пространствах L и L' можно выбрать такие базисы, в которых для каждого элемента д е G преобразования srfg: L —> L и £$'• L/ —> !_' будут иметь одинаковые матрицы. Пусть д ь-> ^ — представление группы G и L — его пространство представления. Подпространство М с L называется инвариантным относительно представления я/д, если оно инвариантно относительно всех линейных преобразований sig\ L —> L для всех д EG. Обозначим через 3§д ограничение srfg на подпространство М. Очевидно, что 3§д является представлением группы G с пространством представления М. Зёд называется представлением, индуцированным представлением srfg в инвариантном подпространстве М. Это выражают также, говоря, что представление SSg содержится в представлении h/ga Пример 14.7. Рассмотрим n-мерное представление группы Sn, описанное в примере 14.2. Как легко проверить, совокупность векторов вида Y, аа^а, аеМ где аа — любые числа, удовлетворяющие условию ^ аа = О, образует подаем пространство L' с L размерности п— 1, инвариантное относительного этого представления. Индуцированное таким образом в L' представление является (п — 1)-мерным представление группы Sn. В случае п = 3 оно эквивалентно представлению группы 5з, описанному в примере 14.3. Пример 14.8. В примере 14.4 обозначим через М/~ (А; = 0, ...,п) подпространство, состоящее из многочленов степени ^ к от переменных х и у. Каждое из М& является инвариантным подпространством любого М/ с индексом I ^ к. Определение. Представление называется приводимым, если его пространство представления L имеет инвариантное подпространство, отличное от (0) и от всего L. В противном случае представление называется неприводимым. Примеры 14.2 и 14.4 дают приводимые представления. Очевидно, что n-мерное единичное представление приводимо, если п > 1: любое подпространство пространства представлений инвариантно. Любое одномерное представление неприводимо. Докажем, что представление из примера 14.3 неприводимо. Действительно, инвариантное подпространство, отличное от (0) и L, должно быть одно-
490 Гл. 14. Элементы теории представлений мерным. Пусть и — его базисный вектор. Условие инвариантности означает, что **дЫ) = Х9и для любого д € £з> где Хд — некоторое число, зависящее от элемента д, т.е. и — общий собственный вектор для всех преобразований я/д. Легко проверить, что такого быть не может: собственные векторы преобразования (\ 2 3\ д/91 с д\ — ( 2 1 о) имеют вид а(е\ + e<i) и /3(е\ — e,<i), а собственные (\ 2 3\ векторы преобразования srfg2 с д^ = ( о 9 i ) имеют ВИД 7е2 и 5(2ei + ег), и, очевидно, не могут совпадать. Определение. Представление я/д называется прямой суммой г представлений если его пространство представления L является прямой суммой г инвариантных подпространств L = Li©...0Lr, (14.8) и я/д индуцирует в каждом Ц представление, эквивалентное srfg, , г = 1,...,г. Пример 14.9. Единичное n-мерное представление является прямой суммой п единичных одномерных представлений. Чтобы в этом убедиться, достаточно разложить пространство этого представления любым способом в прямую сумму одномерных подпространств. Пример 14.10. В ситуации примера 14.7 обозначим через Ц инвариантное подпространство L' размерности п — 1, а через 1_2 — одномерное подпространство, натянутое на вектор Y1, еа- Очевидно, что 1_2 тоже является инвари- авМ антным подпространством этого представления, и имеет место разложение L = Ц © 1_2. В частности, представление, введенное в примере 14.2, при п = 3 является прямой суммой представления примера 14.3 и единичного одномерного представления. Может случиться, что пространство представления L имеет инвариантное подпространство Ц, однако к нему нельзя подобрать второго такого инвариантного подпространства 1_2, что L = Ц © 1_2. Иными словами, представление приводимо, но не является прямой суммой никаких двух других представлений. Пример 14.11. Пусть G = {д} — бесконечная циклическая группа, a L — двумерное пространство с базисом е\,е2. Обозначим через srfn преобразование, имеющее в этом базисе матрицу ( Л . Очевидно, что s^ns^m = £4+m. Отсюда следует, что, положив srfgn = srfn, мы получим представление группы G. Прямая Ц = (ег) является инвариантным подпространством: ^п{^2) = е2- Однако других инвариантных подпространств нет: так, например, преобразование srf\ не имеет других собственных векторов, кроме в2. Поэтому наше представление приводимо, но не является прямой суммой.
14.2. Представления конечных групп 491 Заметим, что в примере 14.11 группа G была бесконечной. Оказывается, что для конечных групп такое явление не может иметь места. А именно, в следующем параграфе будет доказано, что если представление srfg конечной группы приводимо, т.е. векторное пространство L этого представления содержит инвариантное подпространство Ц, то L является прямой суммой Ц и другого инвариантного подпространства 1-2. Отсюда вытекает, что любое представление конечной группы является прямой суммой неприводимых. Что касается неприводимых представлений, то в § 14.3 будет доказано, что (с точностью до эквивалентности) их имеется лишь конечное число. § 14.2. Представления конечных групп Доказательство основного свойства представлений конечных групп, которое было сформулировано в конце предыдущего параграфа, использует некоторые свойства комплексных векторных пространств. Рассмотрим представление конечной группы G. Пусть L — пространство этого представления. Определим на L некоторую эрмитову форму (р(х,у), для которой соответствующая квадратично-эрмитова форма ф(х) = <р(х9х) является положительно определенной, то есть принимает положительные значения для всех х ф 0. Например, если L = Сп, то для векторов х и у с координатами (xi,...,xn) и (yi,...,yn) положим п г=\ Дальше мы будем обозначать (р(х,у) через (ж, у) и называть скалярным произведением в пространстве L. На этот случай дословно переносятся понятия и простые результаты, доказанные нами в гл. 7 для евклидовых пространств. Перечислим те из них, которыми мы будем сейчас пользоваться: 1. Понятие ортогонального дополнения подпространства L'cL- совокупность всех векторов у Е L, для которых (ж, у) = 0 для всех х Е L'. Ортогональное дополнение подпространства L' само является подпространством в L и будет обозначаться (L')1-. Имеет место разложение L = L/©(L/)±. 2. Понятие унитарного преобразования (аналог ортогонального преобразования для случая комплексного пространства). Унитарным называется такое линейное преобразование <$/: L -» L, что для всех векторов ж, у Е L выполняется соотношение (&(х),&(у)) = (х,у). 3. Комплексный аналог теоремы 7.8: если подпространство L7 с L инвариантно относительно унитарного преобразования ^, то и его ортогональное дополнение (V)-1 тоже инвариантно относительно ^.
492 Гл. 14. Элементы теории представлений Определение. Представление tyg группы G называется унитаризуе- мым, если в его пространстве представления L можно так ввести скалярное произведение, что все преобразования fyg станут унитарными. Свойство представления быть унитаризуемым, очевидно, не меняется при замене представления эквивалентным. Действительно, пусть g н-» <2fg — унитаризуемое представление некоторой группы G с пространством L и эрмитовой формой (р(х,у). Рассмотрим произвольный изоморфизм ^: L/ —> L. Как мы знаем, он определяет эквивалентное представление g н-> W той же группы с пространством L'. Покажем, что представление g i-> W тоже унитаризуемое. В качестве скалярного произведения в L' возьмем форму, определенную соотношением r/>(u,v) = <p{V{u),V(v)) (14.9) для векторов и, v е L'. Очевидно, что ip(u,v) — эрмитова форма на L' и ф(и, и) > О для любого ненулевого вектора и е L'. Проверим, что скалярное произведение ip(u,v) действительно устанавливает унитаризуемость представления g i-* fyg. Подставляя в равенство (14.9) в качестве аргументов векторы %д{и) и %fg(v), с учетом (14.7) и унитаризуемости представления д I—► 9/д мы получаем соотношение = <p(%V(u), %V(v)) = <p(V(u), V(v)) = ф(и, v), которое и означает, что представление д ь-» <%£д унитаризуемое. Лемма. Если пространство L унитаризуемого представления ^9 группы G содержит инвариантное подпространство \J, то оно содержит и другое инвариантное подпространство L", такое, что L = L' ® L". Доказательство. Возьмем в качестве L" ортогональное дополнение (L')-1. Тогда подпространство L" инвариантно относительно всех преобразований %д, и мы имеем разложение L = L' © L"'. Применение этой леммы к представлениям конечных групп основывается на следующем основном факте. Теорема 14.1. Всякое представление srfg конечной группы G унитаризуемое. Доказательство. Введем в пространстве представления L скалярное произведение таким образом, чтобы все линейные преобразования s#g стали унитарными. Для этого возьмем произвольное скалярное произведение [ж, у] в пространстве L, определенное произвольной эрмитовой формой (р(х,у), такой, что соответствующая квадратичная форма (р(х,х) положительно определена: ср(х,х) > О для любого ж^О. Положим теперь (X,y) = ^2[^g(x)^g(y)}i (14.10) geG
14.2. Представления конечных групп 493 где сумма распространена на все элементы g группы G. Мы докажем, что (ж, у) также является скалярным произведением и что относительно него все преобразования s^g унитарны. Нужные свойства скалярного произведения для (ж, у) вытекают из аналогичных свойств для [ж, у] и того, что я/д — линейное преобразование: 1°. (у, Ж) = X; Wg{v)>*fg{*)\ = Е КО*)'*£(»)] = (^У). geG geG 2°. (А*,у) = Е К(А*),^(у)] = ^АК(44(г/)1 = Мж,у), 3°. (Ж1 + Ж2, У) = Е [<*4(Ж1 + Ж2), ^(Х/)] = geG = Е Кр(Ж0 +^(Ж2),^4(1/)] = (Х\,у) + (Ж2,у), 4°. (ж, ж) = ^2№д(х),я/д(х)] > О, если ж ^ 0. Для доказательства последнего свойства нужно заметить, что в этой сумме все слагаемые [^(ж),^(ж)] положительные. Это следует из аналогичного свойства скалярного произведения [ж,у], т.е. из того, что [ж,ж] > 0 для всех ж^О. Так как линейное преобразование srfg: L —> L невырождено, то оно переводит всякий ненулевой вектор ж в ненулевой вектор я/д(х). Проверим теперь, что относительно скалярного произведения (ж, у) любое преобразование л4, h е G, унитарно. Ввиду (14.10) имеем И, (ж), £4(у)) = ]Г [*/д И,(ж)), £/д (^4(у))] = Е Иг<(ж)> ^4^4(2/)] • geG geG (14.11) Положим gh — и. В силу свойства (14.1) мы имеем srfgsrfh — £/gh = srfu. Поэтому мы можем переписать равенство (14.11) в виде (жЦаО.яШ) = J2 К(ж)-<(2/)] • (14-12) u=gh Заметим теперь, что когда д пробегает все элементы группы G, a h фиксировано, то элемент u — gh также пробегает все элементы группы G. Это следует из того, что для любого элемента и Е G элемент д = uh~l удовлетворяет соотношению gh = и, и того, что для разных д\ и д^ так получаются разные элементы щ и щ. Таким образом, в равенстве (14.12) элемент и пробегает всю группу G, и мы можем переписать это равенство в виде geG откуда ввиду определения (14.10) следует, что («й4(ж),л4(1/)) = (ж,у), т.е. преобразование ^ унитарно относительно скалярного произведения (ж, у).
494 Гл. 14. Элементы теории представлений Следствие 1. Если пространство L представления конечной группы содержит инвариантное подпространство V, то оно содержит и другое инвариантное подпространство L", такое, что L = L' © L". Оно непосредственно вытекает из леммы и теоремы 14.1. Следствие2. Всякое представление конечной группы является прямой суммой неприводимых представлений. Доказательство. Если пространство L нашего представления srfg не имеет инвариантных подпространств, отличных от (О) и самого L, то это представление само неприводимо, и наше утверждение верно (хотя и тривиально). Если же пространство L имеет инвариантное подпространство L', то согласно следствию 1 теоремы 14.1, существует такое инвариантное подпространство L", что L = L' © L". Теперь применим это же рассуждение к каждому из пространств L' и L"'. Продолжая далее этот процесс, мы в конце концов вынуждены будем остановиться, так как размерности получающихся подпространств все время уменьшаются. В результате мы придем к такому разложению (14.8) с некоторым числом г ^ 2, что инвариантные подпространства Ц не содержат инвариантных подпространств, отличных от (О) и самого Ц. Это и значит, что представления st$ \...,щ\ которые индуцируются в подпространствах l_i,...,Lr нашим представлением ^, неприводимы, а представление stfq раз- ложено в прямую сумму s&g , ••• ,£*g • Теорема 14.2. Если представление srfn разлагается в прямую сумму неприводимых представлений stg ,...,Щ , то всякое неприводимое представление SSg> содержащееся в srfg, эквивалентно одному из srfg . Доказательство. Пусть L = Ц 0 • • • 0 Lr —- такое разложение пространства L представления я/9 в прямую сумму инвариантных подпространств, что srfg индуцирует в Ц представление srfg \ и пусть М —- то инвариантное подпространство L, в котором &fg индуцирует представление 9Sg. Тогда, в частности, для любого вектора х е М мы имеем разложение X = Х\ Н \~ХГ, Ж; G Ц- (14.13) Оно определяет линейное преобразование «^: М —> Ц — проектирование подпространства М на Ц параллельно Ц © • • • 0 Ц_1 © Ц+i © • • • Ф Lr, см. пример 3.19, стр. 112. Другими словами, преобразования ^: М —» Ц определяются условием &i(x) = Xi, г=1,...,г. (14.14) Доказательство теоремы основывается на соотношениях */д&(х) = &ц*д(х)9 i=l,...,r, (14.15) справедливых для любого вектора х е М. Для доказательства соотношений (14.15) применим преобразование я49 к обеим частям равенства (14.13). Тогда
14.2. Представления конечных групп 495 получаем srfg{x) = tfg{x{) + • • • + */g(xr). (14.16) Так как srfg{x) G М и srfg(xi) G Ц, г = 1,... ,г, то соотношение (14.16) является разложением (14.13) для вектора л^(ж), откуда и следует равенство (14.15). П) (г) Из неприводимости представлений «яф ;,... ,srfg J и ^ следует, что проектирование 3*i, определенное формулой (14.14), является либо тождественно нулевым, либо изоморфизмом пространств М и Ц. Действительно, пусть вектор х G М содержится в ядре преобразования ^, т.е. £?i(x) — 0. Тогда, очевидно, srfg&i(x) = О, и в силу соотношения (14.15) мы получаем, что ^^(ж) = 0, т.е. вектор sfg(x) тоже содержится в ядре <^. Из неприводимости представлений srfg теперь следует, что это ядро либо равно (0), либо совпадает со всем пространством М (в последнем случае проектирование ^ будет, очевидно, нулевым преобразованием). Точно так же из равенства (14.15) следует, что образ преобразования ^ либо равен (0), либо совпадает с подпространством Ц. Однако заведомо существует по крайней мере один такой индекс г из числа 1,...,г, для которого преобразование ^ не является тождественно нулевым. Для этого нужно взять любой ненулевой вектор х G М, одна из его компонент Xi в разложении (14.13) не равна нулю, и, следовательно, &*%{х) Ф 0. С учетом предыдущих рассуждений это показывает, что соответствующее преобразование «^ является изоморфизмом векторных пространств М и Ц, а соотношение (14.15) означает эквивалентность соответствующих представлений вёд И Щ . Следствие. В заданном представлении содержится только конечное число различных с точки зрения эквивалентности неприводимых представлений. Действительно, все неприводимые представления, содержащиеся в данном, эквивалентны одному из тех, которые встретятся в произвольном разложении этого представления в прямую сумму неприводимых. Замечание. Из теоремы 14.2 следует некоторое свойство однозначности разложений представления на неприводимые. Именно, как бы мы ни раскладывали представление, в разложении будут встречаться одни и те же (с точностью до эквивалентности) неприводимые представления. Действительно, выберем некоторое разложение нашего представления на неприводимые. Неприводимое представление, встречающееся в любом другом разложении, входит в наше представление, и, значит, по теореме 14.2, оно эквивалентно одному из слагаемых выбранного разложения. Более сильное свойство однозначности заключается в том, что если в одном разложении имеется к слагаемых, эквивалентных данному неприводимому представлению, то столько же таких слагаемых будет и в любом другом разложении. Это утверждение нам дальше не понадобится, и мы не будем его доказывать.
496 Гл. 14. Элементы теории представлений § 14.3. Неприводимые представления В этом параграфе мы докажем, что конечная группа имеет только конечное число различных (с точностью до эквивалентности) неприводимых представлений. Это будет сделано так: мы построим одно особенно важное представление, называемое регулярным, про которое потом докажем, что в нем содержится любое неприводимое представление. Конечность их числа будет тогда вытекать из следствия теоремы 14.2. Пространство регулярного представления состоит из всевозможных функций на группе — это частный случай общего понятия пространства функций на произвольном множестве (см. пример 3.16, с. 105). Для произвольной конечной группы G рассмотрим векторное пространство M(G) функций на этой группе. Так как группа G конечна, то пространство M(G) имеет конечную размерность: dimM(G) = \G\. Определение. Регулярным представлением группы G называется представление fflg, пространством которого является пространство M(G) функций на группе G, и в котором элементу g e G сопоставляется линейное преобразование &д, переводящее функцию f(h) e М(<7) в.функцию cp(h) = f(hg): (&g(f))(h) = f(hg). (14.17) Формула (14.17) означает, что результатом применения линейного преобразования &д к функции / служит «сдвинутая» функция / в том смысле, что значение ££g{f) на элементе h G G равно f(hg). Мы пропускаем очевидную проверку того, что полученное таким образом преобразование пространства M(G) линейно. Проверим, что S£g — представление, т.е. что для него выполнено требование (14.1). Положим Mgx92{f) = (р. Согласно формуле (14.17), <p(h) = f(hgig2). Пусть M92(f) = ф, тогда ФЫ = 1Ы92)- Наконец, если &gi&g2(f) = ¥>ь т0 Ф\ = &g\W) и ^(ц) = Ф(и9\)' Подставляя в предыдущую формулу и = hg\, мы получим, что (р\(и) = ф(ид\) = f{ug\g2) для произвольного элемента и G G. Значит, <р = (р\ и &gi92 = &gi&g2- Пример 14.12. Пусть G — группа второго порядка, состоящая из элементов е и д, где д2 = е. Такой группой является, в частности, S2 — симметрическая группа второй степени. Пространство M(G) двумерно, и каждая функция / G M(G) определяется двумя числами: а = /(e) и /3 = f(g), т. е. может быть отождествлена с вектором (а,/?). Как и для любого представления, &е — тождественное преобразование. Найдем &д. Согласно формуле (14.17) имеем (*,(/)) (е) = f(g) = (3, (Щ/)) (д) = / (<?2) = /(e) = а.
14.3. Неприводимые представления 497 Значит, линейное преобразование 8йд переводит вектор (а,/?) в вектор (/3,а), т. е. представляет собой отражение относительно прямой а = (3. Теорема 14.3. Всякое неприводимое представление конечной группы G содержится в ее регулярном представлении М9. Доказательство. Пусть stg — неприводимое представление с пространством L. Обозначим через I произвольную отличную от нуля линейную функцию на пространстве L и сопоставим каждому вектору ж е L функцию f(h) = /(.й4(аз)) € M(G), которая получается, когда вектор ж фиксирован, а элемент h пробегает все возможные значения из группы G. Очевидно, что таким образом мы получаем линейное преобразование с€\ L —► М', определенное соотношением V(x) = l(£/h(x)), (14.18) где М7 — некоторое подпространство векторного пространства M(G). При этом, согласно построению, ^(L) = М7, т. е. М7 является образом преобразования ^. Докажем следующие свойства: 1) для всех элементов g e G и векторов х е L выполнено соотношение {&stQ) (ж) = (&д<#) (ж); (14.19) 2) подпространство М7 инвариантно относительно представления ё%9\ 3) преобразование *& является изоморфизмом пространств L и М7. Сравнивая формулы (14.19) и (14.7), с учетом остальных двух свойств мы заключаем, что неприводимое представление &/д эквивалентно представлению, индуцированному регулярным представлением <%д в инвариантном подпространстве М7 С M(G). В силу данных выше определений это означает, что srfg содержится в 3%д, как и утверждает теорема. Доказательство свойства 1). Положим ^(ж) = / е M(G). Тогда, по определению, f(h) = I (^(ж)) для любого элемента h e G. Применяя формулу (14.17), мы получаем соотношение (&gV)(x)=&g(f)=(p, (14.20) где (р — функция на группе G, определенная соотношением <p(h) = I (£/Пд(х))- С другой стороны, подставляя в формулу (14.18) вектор &/д(х) вместо ж, мы получим равенство V К(ж)) = (<*f^) (ж) = ^(Л), (14.21) где функция <p\(h) определена соотношением <pi(h) = I (*/h£/g(x)) = I №hg{x)), и, как легко видеть, совпадает с <p(h). С учетом того, что (p(h) = y?i(ft), равенства (14.20) и (14.21) означают, что (Фя/д) (ж) == (&д&) (ж). Доказательство свойства 2). Нам нужно показать, что для любого элемента д е G образ линейного преобразования <^(М7) содержится в М7.
498 Гл. 14. Элементы теории представлений Пусть / е М', т. е., по определению образа, / = ^(ж) для некоторого ж е L. Тогда с учетом доказанной выше формулы (14.19) мы имеем равенство я9и) = (&gv) (*) = 0^4) (*) = ^Ы> где вектор у = ^(ж) G L, а согласно нашему построению, это и значит, что &g(f) Е М'. Это доказывает требуемое включение &9{М') с М'. Доказательство свойства 3). Так как, по построению, пространство М; является образом преобразования ^: L —» М', то нам остается лишь показать, что преобразование ^ взаимно-однозначно, т.е., что его ядро равно (0). Значит, нам нужно доказать, что из равенства ^(ж) = О7 (где О7 означает функцию, тождественно равную нулю на группе G) следует равенство ж = 0. Обозначим ядро преобразования ^ через L/. Как известно, оно является подпространством в L. Покажем, что L' инвариантно относительно представления Srfg. Действительно, предположим, что ^(ж) = О' для некоторого вектора ж е L, и положим вектор у = £#д{х). Применив преобразование ^ к вектору г/, с учетом формулы (14.19) мы получим Щу) = (<#£/д(х)) = (&д<#) (Ж) = &9(V(X)) = ЩО') = О'. Но из неприводимости представления srfg теперь следует; что либо L' = L, либо L/ = (0). Первое означало бы, что I (^4(ж)) = 0 для всех h e G и ж е L. Но тогда даже для h — е мы имели бы равенство I {srfe(x)) = I (&{х)) = /(ж) = 0 при всех ж G L, а это невозможно, так как при определении преобразования ^ функция I была выбрана ненулевой. Значит, подпространство L' = (О), что нам и требовалось доказать. Следствие. Конечная группа имеет только конечное число различных (с точностью до эквивалентности) неприводимых представлений. Пример 14.13. Пусть srfg — единичное одномерное представление группы G. Тогда пространство L одномерно. Пусть е — его базис. Определим функцию I условием 1{ае) = а. Формула (14.18) дает для вектора ж = ае значение if(ae) = /, где f(h) = l(s/h(ae)) = 1(ае) = а. Таким образом, вектору ае сопоставляется функция /, принимающая для всех h e G одно и то же значение а. Очевидно, что такие постоянные функции действительно образуют инвариантное подпространство относительно регулярного представления и что индуцируемое в нем представление является единичным, как и утверждается теоремой 14.3. § 14.4. Представления коммутативных групп Напомним прежде всего, что пространство представления L мы всюду предполагаем комплексным. Теорема 14.4. Неприводимое представление коммутативной группы одномерно.
14.4. Представления коммутативных групп 499 Доказательство. Пусть g — некоторый фиксированный элемент группы G. Соответствующее ему линейное преобразование srfg: L —> L имеет хотя бы одно собственное значение Л. Пусть М с L — собственное подпространство, соответствующее собственному значению Л, т. е. совокупность таких векторов х е L, что £/9(х) = Хх. (14.22) По построению, М ^ (О). Мы сейчас докажем, что М — инвариантное подпространство нашего представления. Из неприводимости представления тогда будет следовать, что М = L, то есть равенство (14.22) верно для любого вектора х е L. Иначе говоря, srfg = Х<§, и матрица преобразования srfg равна ХЕ. Матрицы такого вида называются скалярными. Это рассуждение верно для любого д е G, нужно лишь заметить, что собственное значение Л в формуле (14.22) зависит от элемента д, а остальная часть рассуждения от него не зависит. Таким образом, мы заключаем, что матрицы всех преобразований srfg — скалярные и если dimL > 1, то любое подпространство пространства L инвариантно. Следовательно, если представление неприводимо, то оно одномерно. Осталось доказать инвариантность подпространства М. Именно здесь будет использована коммутативность группы G. Пусть х е М, h e G. Докажем, что £4(ж) € М. Действительно, если ^4(ж) = у, то £/д(у) = £?д Whip)) = *fgh(x) = Srfhg(x) = = sth (д/д(х)) = ^h(Xx) = Xs^h{x) = Ay, т.е. вектор j/GM. Ввиду теоремы 14.4 всякое неприводимое представление коммутативной группы можно представить в виде srfQ = х(#), где х(д) — число. Условие (14.1) записывается тогда следующим образом: X(9i92)=x(9i)x(92). (14.23) Определение. Функция х(д) на коммутативной группе G, принимающая комплексные значения и удовлетворяющая соотношению (14.23), называется характером. Согласно теореме 14.4 всякое неприводимое представление конечной коммутативной группы является характером x(fiO- С Другой стороны, из теоремы 14.3 следует, что это представление содержится в регулярном представлении. Иными словами, в пространстве M(G) функций на группе G существует инвариантное подпространство М', в котором регулярное представление индуцирует представление, эквивалентное нашему. Так как наше представление одномерно, то и подпространство М; тоже одномерно. Пусть некоторая функция / е M(G) является базисом в М'. Тогда, так как представление, индуцированное регулярным в М', имеет матрицу x(flO> a &g(f)(h) — fi^g), то должно выполняться соотношение f(hg) = x(g)f(h).
500 Гл. 14. Элементы теории представлений Подставим в это равенство h — е и положим /(e) = а. Мы получим, что f{g) = ах(д), т.е. в качества базиса подпространства М' можно принять сам характер х (веДь он является функцией на G и, значит, х £ M(G)). Как мы видели, тогда M(G) = М' © М", где М" — тоже инвариантное подпространство. Применяя аналогичные рассуждения к М" и всем получающимся далее инвариантным подпространствам размерности больше 1, мы в конце концов придем к разложению пространства M(G) в прямую сумму одномерных инвариантных подпространств. Таким образом, нами доказан следующий результат: Теорема 14.5. Пространство M(G) функций на конечной коммутативной группе G разлагается в прямую сумму одномерных подпространств, инвариантных относительно регулярного представления. В каждом таком подпространстве можно взять за базисный вектор некоторый характер x(s)- Тогда матрица представления, которое индуцируется в этом подпространстве, совпадает с тем же характером х(#). Очевидно, что таким образом мы устанавливаем взаимно-однозначное соответствие между характерами группы G и одномерными инвариантными подпространствами пространства M(G) функций на этой группе. Действительно, два разных характера х\ и Х2 не могут быть базисными векторами одного и того же представления: это означало бы, что Xi(g) = ax2(g) при всех geG. Полагая здесь g = е, мы получим а = 1, так как х\ И Х2 — гомоморфизмы группы G в С, и следовательно, Х\(е) = Х2(е) = 1. Так как, согласно следствию теоремы 14.1, регулярное представление разлагается в прямую сумму неприводимых, то отсюда для любой конечной коммутативной группы G вытекают следующие результаты. Следствие 1. Характеры образуют базис пространства M(G) функций на группе G. Следствие2. Число различных характеров группы G равно ее порядку. Это вытекает из следствия 1 и того, что размерность пространства M(G) равна порядку группы G. Следствие 3. Любая функция на группе G является линейной комбинацией характеров. Пример 14.14. Пусть G = {д} — циклическая группа конечного порядка п, дп = е. Обозначим через £о> ••• >£n-i различные корни степени п из 1 и положим Xi(9k)=tt fc = 0,l,-,n-l. Легко проверить, что Хг — характер группы G и что характеры Хъ> соответствующие различным корням & степени п из 1, различны между собой. Так как число их равно |G|, то они должны исчерпывать все характеры группы G. Согласно следствию 1 они образуют базис в пространстве M(G).
14.4. Представления коммутативных групп 501 Иначе говоря, в n-мерном пространстве векторы 1,&» •••»£?, соответствующие п корням £i степени п из 1, образуют базис. Это можно проверить и непосредственно, вычисляя определитель, составленный из координат этих векторов, как определитель Вандермонда. Пример 14.15. Обозначим через S группу вращений окружности на плоскости. Элементы группы S соответствуют точкам окружности: если вещественному числу р> мы сопоставим точку окружности с аргументом р, то одной точке окружности будут соответствовать числа, отличающиеся друг от друга на целые кратные 27г. Поэтому саму группу S часто называют окружностью. Взяв некоторое целое число га, сопоставим точке t окружности S, имеющей аргумент р, число cos mp + ismmp, где г означает мнимую единицу. Очевидно, что от прибавления к р целого кратного 27г это число не изменится и, значит, оно однозначно определяется точкой t e S. Положим Xm(t) = cosmp + isinmp, m = 0,±1, ±2,... (14.24) Нетрудно проверить, что функция Xmif) является характером группы S. Для бесконечной группы, какой является 5, естественно ввести в определение характера кроме требования (14.23) еще требование непрерывности функции Xm(t). Смысл этого требования для группы S следующий: надо, чтобы вещественная и мнимая части функций Xm(t) были непрерывными функциями. Можно доказать, что определенные формулой (14.24) характеры Хт(*) непрерывны, и что ими исчерпываются все непрерывные характеры окружности. Этим в значительной мере объясняется роль тригонометрических функций cosmp и smmp в математике: они являются вещественными и мнимыми частями непрерывных характеров окружности. Следствие 3 утверждает, что любую функцию на конечной коммутативной группе можно представить как линейную комбинацию характеров. В случае бесконечной группы, такой, как 5, на функции естественно накладываются некоторые аналитические ограничения, которые мы сейчас не будем уточнять. Выясним только смысл функций на группе S. Такая функция /(*) может быть представлена как функция F(p) от аргумента р точки t e S. Она не должна, однако, зависеть от выбора аргумента р точки *, т. е. не должна изменяться при прибавлении к р целого кратного 27г. Иначе говоря, F(p) должна быть периодической функцией с периодом 27г. Аналог следствия 3 для группы S утверждает, что такая функция может быть представлена как линейная комбинация (в данном случае, бесконечная) функций Xm(^)» m = 0, ±1,±2,... Иначе говоря, это теорема о том, что периодическая функция (с некоторыми аналитическими ограничениями) разлагается в ряд Фурье.
Историческая справка Здесь будет изложена краткая хронология возникновения понятий, обсуждавшихся в книге. Развитие математических идей вообще происходит так, что одни концепции постепенно вырастают из других. Поэтому зафиксировать точно появление какой-то идеи, как правило, невозможно. Мы укажем лишь основные этапы — и, разумеется, приблизительно. В частности, мы ограничимся рамками западно-европейской математики. Основным толчком являлось, конечно, создание аналитической геометрии Ферма и Декартом в XVII в. Это позволило задавать точки (на прямой, плоскости и в трехмерном пространстве) с помощью чисел (одного, двух, трех), кривые и поверхности — уравнениями, и классифицировать их на основании алгебраической классификации их уравнений. При этом часто использовались линейные преобразования, особенно Эйлером (в XVIII в.). Определители (в основном как формульный аппарат для нахождения решений систем п линейных уравнений с п неизвестными) рассматривались еще Лейбницем в XVII веке (правда, лишь в частном письме) и подробно — Крамером в XVIII в. Любопытно, что конструировались они на основе правила «общего развертывания» определителя, т. е. самого сложного (из рассматривавшихся нами в гл. 2) способа их определения. Это определение было найдено «эмпирически», т.е. угадано на основании формул для решения систем линейных уравнений с двумя и тремя неизвестными. Самое широкое использование определителей пришло в XIX в., особенно в работах Коши и Якоби. Понятие «многомерности», т.е. переход от одной, двух и трех координат к произвольному их числу, стимулировалось развитием механики, где рассматривались системы с произвольным числом степеней свободы. Идея распространить на этот случай геометрическую интуицию и понятия была систематически разработана Кэли и Грассманом в XIX веке. Тогда же стала ясной и необходимость исследования квадрик в пространстве произвольной размерности (Якоби и Сильвестр в XIX в.). Впрочем, этот вопрос интересовал еще Эйлера. Исследование понятий, определенных некоторыми абстрактными аксиомами (группы, кольца, алгебры, поля) началось еще в XIX в. в работах Гамильтона и Кэли, но расцвета оно достигло в XX в., в основном, в школах Э. Нетер и Э. Артина. Понятие проективного пространства было впервые исследовано Дезаргом и Паскалем в XVII в., но систематически это направление стало развиваться в XIX в., начиная с работ Понселе. То аксиоматическое определение векторного и евклидова пространства, которое было дано в этой книге и окончательно порывает с приматом координат, было впервые четко сформулировано практически одновременно Г. Вейлем
Историческая справка 503 и Дж. фон Нейманом. Оба исходили из запросов физики. Тогда были созданы два варианта квантовой механики: «волновая механика» Шредингера и «матричная механика» Гейзенберга. Необходимо было пояснить, что в некотором смысле это «одно и то же». Оба математика развили аксиоматическую теорию евклидовых и векторных пространств и показали, что квантово-механические теории связаны с двумя изоморфными пространствами. Правда, отличие от имеющегося в книге изложения заключалось в том, что они оперировали с бесконечномерными пространствами. Во всяком случае, при этом для конечномерных пространств появилась инвариантная (т. е. не связанная с выбором координат) теория, которая с тех пор стала общепринятой. Введение аксиоматического подхода в геометрию достаточно подробно обсуждается в гл. 11, посвященной геометрии Лобачевского. Такие исследования начались в конце XIX в., но определяющее их влияние в математике относится к началу XX в. Центральной фигурой здесь был Гильберт — он, например, способствовал тому, что геометрическая интуиция стала применяться ко многим задачам анализа.
Список литературы Прежде всего вспоминаются, конечно, те книги, которые были в ходу, когда читались лекции, являющиеся основой этого учебника. Многие из этих книг впоследствии переиздавались, и здесь мы, как правило, будем указывать последнее известное нам издание: 1. Гельфанд И.М. Лекции по линейной алгебре: Учеб. пособие. — 5-е изд., исправл. - М.: Добросвет, МЦНМО, 1998. - 320 с. 2. Курош А. Г. Курс высшей алгебры: Учеб. пособие. — 11-е изд., стер. — М.: Наука. Физматлит, 1975. — 431 с. 3. Гантмахер Ф. Р. Теория матриц. — 4-е изд., доп. — М.: Наука. Физматлит, 1988. - 548 с. 4. Мальцев А. И. Основы линейной алгебры: Учеб. пособие. — 4-е изд., стер. — М.: Наука. Физматлит, 1975. — 400 с. 5. Халмош П. Конечномерные векторные пространства / Пер. с англ. Д. Ф. Борисовой. — М.: Физматгиз, 1963. — 263 с. 6. Шилов Г. Е. Математический анализ. Конечномерные линейные пространства: Учеб. пособие. - М.: Наука. Физматлит, 1969. — 432 с. 7. Шрейер О., Шпернер Г. Введение в линейную алгебру в геометрическом изложении / Пер. с нем. — М.-Л.: ОНТИ, 1934. — 210 с. 8. Шрейер О., Шпернер Е. Теория матриц / Пер. с нем. — М.-Л.: ОНТИ, 1936. - 156 с. 9. Широков П. А. Тензорное исчисление. Ч. 1: Алгебра тензоров: Учеб. пособие. — М.-Л.: Гостехиздат, 1934. — 464 с. Книга [6] особенно интересна большим числом аналитических приложений. Можно было бы, конечно, еще рекомендовать студентам следующие книги, но сжатость и абстрактность изложения в них далеко превосходят возможности среднего студента: 10. Ван дер Варден Б. Л. Современная алгебра: В 2 ч. / Пер. с нем. под ред. А. Г. Куроша. - М.-Л.: Гостехиздат, 1947. Ч. 1 - 339 с; Ч. 2 - 260 с. 11. Бурбаки Н. Алгебра: Модули, кольца, формы / Пер. с фр. под. ред. Ю.И. Манина. — М.: Наука. Физматлит, 1966. — 555 с. С тех пор, как читались эти лекции, было написано или переведено так много книг, что мы приведем только некоторые примеры: 12. Винберг Э.Б. Курс алгебры: Университетский учебник. — 3-е изд., перераб. и доп. — М.: Факториал Пресс, 2002. — 544 с. 13. Кострикин А.И., Манин Ю.И. Линейная алгебра и геометрия: Учеб. пособие для вузов. — 3-е изд., стер. — СПб.: Лань, 2005. — 304 с.
Список литературы 505 14. Кострикин А. И. Введение в алгебру. Ч. 2: Линейная алгебра: Университетский учебник. — 3-е изд. — М.: Наука. Физматлит, 2004. — 368 с. 15. Ленг С. Алгебра / Пер. с англ. — М.: Мир, 1968. — 564 с. 16. Постников М. М. Лекции по геометрии. Семестр П. Линейная алгебра. - М.: Наука, 1986. - 400 с. 17. Фаддеев Д. К. Лекции по алгебре. — 5-е изд., стер. — СПб.: Лань, 2007. - 416 с. По поводу механических приложений см. [3], а также: 18. Гантмахер Ф.Р., Крейн М. Г. Осцилляционные матрицы и ядра и малые колебания механических систем. — 2-е изд., перераб. и доп. — М.-Л.: Гостехиздат, 1950. — 359 с. Связи с дифференциальной геометрией, которые мы бегло затронули в этом курсе, изложены, например, в книге 19. Мищенко А. С, Фоменко А. Т. Курс дифференциальной геометрии и топологии: Университетский учебник. — 2-е изд., перераб. и доп. — М.: Факториал Пресс, 2000. — 448 с. В изложении геометрии Лобачевского мы следовали, в основном, брошюре 20. Делоне Б. Н. Элементарное доказательство непротиворечивости планиметрии Лобачевского. — М.: Гостехиздат, 1956. — 139 с. Все результаты, касающиеся оснований геометрии, доказательства которых были пропущены, содержатся в книгах: 21. Александров А. Д., Нецветаев Н.Ю. Геометрия: Учеб. пособие для студентов мат. спец. вузов. — М.: Наука. Физматлит, 1990. — 671 с. 22. Ефимов Н.В. Высшая геометрия: Учеб. пособие для студентов мат. спец. вузов. — 7-е изд., стер. — М.: Наука. Физматлит, 2003. — 584 с. Факты аналитической геометрии, которые кратко упоминались в этом курсе, например, в связи с теорией квадрик, можно найти в книгах: 23. Делоне Б. Н., Райков Д. А. Аналитическая геометрия: В 2 т. — Учеб. пособие. — Т.2. - М.-Л.: Гостехиздат, 1949. — 516 с. 24. Александров П. С. Лекции по аналитической геометрии, пополненные необходимыми сведениями из алгебры. — Учеб. пособие. — М.: Наука. Физматлит, 1968. — 911 с. 25. Веселов А. П., Троицкий Е. В. Лекции по аналитической геометрии. — СПб.: Лань, 2003. - 160 с. Связь геометрии Лобачевского с другими разделами проективной геометрии очень хорошо проясняет книга: 26. Клейн Ф. Неевклидова геометрия / Пер. с нем. Н.К. Брушлинского. — 2-е изд., стер. - М.: УРСС, 2004. - 360 с. В связи с теорией представлений можно рекомендовать книгу: 27. Серр Ж.-П. Линейные представления конечных групп / Пер. с фр. В. А. Псковских под ред. Ю. И. Манина. — М.: Мир, 1970. — 132 с.
Предметный указатель 5-функции, 105, 356 m-ая внешняя степень (векторного пространства), 357 т-вектор, 357 — разложимый, 363 Аксиомы геометрии на плоскости, 438 — о параллельных (в геометриях Евклида и Лобачевского), 440 Алгебра, 366 — внешняя, 367 — градуированная, 368 Алгебраическое дополнение, 54, 374 Алгоритм Евклида (в кольце), 477 Аннулятор, 133 Ассоциативность, 11, 76, 367, 458 Аффинно эквивалентные подмножества, 307 Аффинное подмножество (проективного пространства), 322 Базис — алгебры, 366 — векторного пространства, 100 взаимный, 131 ортонормированный (в евклидовом пространстве), 221 ортонормированный (в псевдоевклидовом пространстве), 268, 271 ортонормированный (относительно билинейной формы), 394 Базисы — одинаково ориентированные, 162, 279 — противоположно ориентированные, 162 Блоки матрицы, 78 Векторы, 90, 92 — времениподобные, 271 — корневые, 168 — линейно зависимые, 97 — линейно независимые, 97 — ортогональные, 203, 220 — пространственноподобные, 271 — разложимые, 358 — светоподобные (изотропные), 271 — собственные, 145 Вложение, 9 Высота (корневого вектора), 169 Геометрия — Римана, 456 — абсолютная, 440 — проективная, 318 — сферическая, 454 Гипербола, 422 Гиперплоскость, 99, 295, 321, 428 — касательная, 263, 326, 380 Гиперповерхность, 380 Гомеоморфизм, 14 Гомоморфизм (групп), 462 Горизонт, 323 Грассманиан, 352 Группа, 458 — абелева, 464 — знакопеременная степени п, 461 — коммутативная, 464 — преобразований, 459 — симметрическая степени п, 460 — циклическая, 462 Движения — аффинного евклидова пространства, 310 — в аксиоматике планиметрии, 438 — пространства Лобачевского, 430 Делитель — (элемента в кольце), 476
Предметный указатель 507 — наибольший общий (НОД), 477 Деформация (непрерывная), 16, 165, 342 Диагональ (матрицы), 20, 184 Дистрибутивность, 77, 116, 366 Дифференциал, 139, 294 Длина вектора, 219 Жорданова — клетка, 176 — нормальная форма, 176 Закон инерции, 210 Зеркальное отражение (евклидова пространства), 232 Изометрия, 17 Изоморфизм — аффинных пространств, 303 — векторных пространств, 121 — групп, 463 — евклидовых пространств, 226 Инверсия, 63 Индекс инерции, 210, 269 Интерполяция, 32 Инцидентность (точки и прямой), 318 Канонические уравнения (квадрики), 415 Канонический вид (квадратичной формы), 206 Квадрика, 379, 407 — невырожденная, 380, 422 Квадрики — аффинно эквивалентные, 410 — метрически эквивалентные, 418 Кольцо, 474 — евклидово, 475 — коммутативное, 474 Коммутативность, 77, 464, 474 Компактность, 339 Комплексификация, 158 Коника, 386, 423 Конус — в аффинном пространстве, 413, 421 — световой (изотропный), 272 Координаты — вектора, 100 — плюккеровы (подпространства), 348 — точки, 292 неоднородные, 322 однородные, 319 Кривизна — гауссова, 268 — нормальная, 266 Кривизны главные, 267 Критерий Сильвестра, 211 Лента Мёбиуса, 344 Линейная — замена переменных, 75 — комбинация, 70, 97 — часть (аффинного преобразования), 301 Линейно связная компонента, 17 Матрица, 19 — антисимметрическая, 67 — билинейной формы, 197 — блочная, 78 — блочно-диагональная, 78, 145 — вырожденная, 51 — диагональная, 87 — единичная, 48 — квадратная, 20 — линейного преобразования, 113 — невырожденная, 51 — непрерывно деформируемая, 165 — нулевая, 73 — обратная, 85 — ортогональная, 228 — перехода, 117 — присоединенная, 86 — противоположная, 73 — симметрическая, 67 — системы линейных уравнений, 20 — ступенчатая, 30 — транспонированная, 67 — эрмитова, 215 Матрицы — коммутирующие, 77 — подобные, 143 — эквивалентные, 207 Метод Гаусса, 24 Метрика, 14, 309 Минор, 45 — угловой, 210 Миноры соответствующие, 81
508 Предметный указатель Многообразие — Грассмана (грассманиан), 352 — проективное алгебраическое, 321 двойственное, 326 неприводимое, 402 Многочлен, 32, 136, 294 — аннулирующий, 153, 154 — минимальный, 154 — однородный, 136 — от линейного преобразования, 148 — от матрицы, 82 — характеристический, 146 Множества гомеоморфные, 14 Множество, 7 — выпуклое (в аффинном пространстве), 299 — центрально-симметричное (в аффинном пространстве), 412 Модуль (над кольцом), 475 — конечнопорожденный, 477 — периодический (кручения), 477 Неизвестные — главные, 30 — свободные, 30 Неравенство треугольника (Коши, Бу- няковского, Шварца), 309 — в сферической геометрии, 455 — в геометрии Лобачевского, 450 Нулевой вектор, 92 Образ — (линейного преобразования), 124 — гомоморфизма, 463 — произвольного отображения, 9 Объем параллелепипеда — неориентированный, 223 — ориентированный, 225 Ограничение (отображения), 9 Однополостный гиперболоид, 391 Окружность (группа вращений), 501 Оператор, 111 — дифференциальный первого порядка, 138 Операции — в алгебре, 366 — в группе, 465 — в кольце, 474 Определитель, 40, 44 — Вандермонда, 55 — Грама, 220 — квадратной матрицы, 45 — линейного преобразования, 120 Ориентация — векторного пространства, 163 — евклидова пространства, 232 — псевдоевклидова пространства, 279 Ортогональное дополнение, 203, 222, 491 Ортонормированная система векторов, 221 Отношение — трех точек (простое), 298 — четырех точек (двойное, ангармоническое), 335 — эквивалентности, 8 Отображение, 8 — взаимно-однозначное, 10 — обратное, 10 — перспективное, 337 — сопряженное, 11 — тождественное (единичное), 9 Отрезок, 299, 438 Пара полупространств направленная, ПО, 301 Парабола, 422 Параллелепипед (натянутый на векторы), 223 Перестановка, 58, 460 — нечетная, четная, 62 Поворот евклидова пространства вокруг оси, 232 Подгруппа, 459 — максимальная, 467 — циклическая, 462 Подмножество, 7 Подмодуль, 478 — циклический, 479 Подпространства параллельные (в аффинном пространстве), 296 Подпространство — аффинного пространства, 295 — векторного пространства, 94 — вырожденное (псевдоевклидова пространства), 269 — изотропное, 388 — инвариантное
Предметный указатель 509 (относительно линейного преобразования), 143 (относительно представления), 489 — натянутое на векторы, 97 — невырожденное (псевдоевклидова пространства), 269 — проективного пространства, 321 двойственное, 325 — пространства Лобачевского, 428 — решений системы линейных уравнений, 94 — циклическое, 169 Поле, 474 — характеристики, отличной от 2, 93, 200 Полуоси (эллипсоида), 256, 421 Полупространство, 109, 429 Полы (светового конуса), 273 Порядок — группы, 459 — элемента в группе, 462 — элемента в модуле, 478 Правило Крамера, 57 Предел (последовательности), 14, 338 Представление, 485 — бесконечномерное, 487 — единичное, 487 — индуцированное, 489 — неприводимое, приводимое, 489 — регулярное, 496 — унитаризуемое, 492 Представления эквивалентные, 489 Преобразование — антисимметрическое, симметрическое, 208, 248 — аффинное, 301 вырожденное, невырожденное, 304 линейное, 306 собственное, несобственное, 307 — блочно-диагонализируемое, 159 — векторного пространства в себя, 141 — вырожденное, невырожденное, 120 — диагонализируемое, 147 — линейное, 111 — лоренцево, 278 — нулевое, 114 — ортогональное, 227, 327, 394 — собственное, несобственное, 143, 278, 395 — сопряженное, 134 — тождественное (единичное), 112 — унитарное, 257, 491 Принцип двойственности, 134, 325, 385 Проективизация, 319 Проективная — оболочка, 324 — плоскость, 319 — прямая, 319 Проектирование, 112, 303 — ортогональное, 223 Проекция, 112 — ортогональная, 219, 223 Произведение — векторов внешнее, 357, 364 скалярное, 217 — линейных преобразований, 115 — матриц, 74 — множеств, 13 — отображений, 10 — подгрупп прямое, 464 — элементов в алгебре, 366 в группе, 458 Прообраз, 9 Пространство — т-векторов, 357 — Лобачевского, 427 — Минковского, 97, 271 — аффинное, 290 евклидово, 309 — векторное, 92 — векторов аффинного пространства, 292 — второе сопряженное, 132 — евклидово, 217 — касательное, 263, 326, 380 — метрическое, 14 — представления, 485 — проективное, 319 двойственное, 324 — псевдоевклидово, 271 — сопряженное, 130 Прямая сумма — подгрупп, 465 — подмодулей, 479
510 Предметный указатель — подпространств, 94 — представлений, 490 Прямолинейные образующие (гиперболоида), 391 Путь (в метрическом пространстве), 16 Радикал (билинейной формы), 203 Размерность — алгебры, 366 — аффинного пространства, 292 — векторного пространства, 98 — представления, 485 — проективного пространства, 319 Ранг — билинейной формы, 200 — линейного преобразования, 127 — матрицы, 68 Расстояние между точками, 309 Репер, 292 — ортонормированный, 310 Решение системы линейных уравнений, 22 Свободная подвижность (евклидова аффинного пространства), 316 Свободные члены, 19 Сдвиг (аффинного пространства), 293 Система линейных уравнений, 19 — ассоциированная, 28 — врехнетреугольная, 31 — однозначно разрешимая, 22 — однородная, 27 — определенная, определенная, 22 — совместная, несовместная, 22 — ступенчатая, 30 — эквивалентная, 24 Слой проектирования, 303 Собственное — значение, 145 — подпространство, 145 Собственный вектор, 145 Соотношения Плюккера, 350 Степень многочлена, 32, 136 Стереографическая проекция, 341 Ступенчатый вид (системы линейных уравнений), 30 Сумма — матриц, 73 — подпространств, 94 прямая, 94 Суммы Ньютона, 213 Супералгебра, 369 Сфера, 226 Сходимость, 14, 185, 338 Таблица умножения (в алгебре), 367 Теорема — Больцано-Вейерштрасса, 250 — Брианшона, 387 — Гамильтона-Кэли, 155 — Гельмгольца-Ли, 436 — Кронекера-Капелли, 70 — Куранта-Фишера, 255 — Лапласа, 374 — Паскаля, 386 — Эйлера, 315 Тождество Эйлера, 139 Тор, 407 Точка — аффинного пространства, 290 — бесконечно удаленная, 318, 323 — критическая, 256 — лежащая между двумя другими, 299, 438, 442 — неподвижная, 305 — особая гиперповерхности, 381 проективного алгебраического многообразия, 326 — проективного пространства, 319 — пространства Лобачевского, 427 Точки независимые, 298, 330 Транспозиция, 59 Треугольник, 438 Углы между плоскостями, 239 Угол между — векторами, 219 — двумя прямыми, прямой и плоскостью, 237 Универсальность (внешнего произведения), 362 Флаг, ПО, 301,434, 440 Форма, 136 — билинейная, 196 антисимметрическая, симметрическая, 198
Предметный указатель 511 невырожденная, 200 — квадратичная, 196 первая, вторая (гиперповерхности), 265 положительно, отрицательно определенная, 209 — полуторалинейная, 214 — эрмитова, 215 Формула -Бине-Коши, 81, 372 — Эйлера, 267 — замены координат вектора, 117 матрицы билинейной формы, 200 матрицы линейного преобразования, 120 — полного развертывания определителя, 66 — разложения определителя по столбцу, 54 Функция, 9 — антисимметрическая, 60 — квадратично-эрмитова, 215 — линейная, 20, 129 — полилинейная, 65, 355 — полулинейная, 214 — полуторалинейная, 214 — симметрическая, 58 — экспоненциальная от матрицы, 187 Характеры, 499 — окружности (непрерывные), 501 Центр — множества, 412 -флага, 301, 434 Центральная симметрия (аффинного пространства), 411 Цилиндр, 303 Шар, 226 Шестиугольник — вписанный конику, 386 — описанный вокруг коники, 387 Элемент — единичный, 366 — нулевой, 465 — обратимый (в кольце), 476 — обратный (правый, левый), 458 — периодический (в модуле), 477 — простой (в кольце), 476 — противоположный, 465 Элементарные преобразования (над матрицами), 24 Элементы — ассоциированные (в кольце), 476 — взаимно простые (в кольце), 477 — однородные (в градуированной алгебре), 368 Эллипс, 422 Эллипсоид, 420 Эндоморфизм, 111 Ядро — (линейного преобразования), 124 — гомоморфизма, 463
Учебное издание ШЛФАРЕВИЧ Игорь Ростиславович РЕМИЗОВ Алексей Олегович ЛИНЕЙНАЯ АЛГЕБРА И ГЕОМЕТРИЯ Редактор С.А. Кулешов Корректор В. Р. Игнатова Оригинал-макет: С.А. Кулешов Оформление переплета: Н.В. Гришина Подписано в печать 19.08.09. Формат 70x100/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 41,6. Уч.-изд. л. 42. Тираж 1000 экз. Заказ №5713. Издательская фирма «Физико-математическая литература» МАЙК «Наука/Интерпериодика» 117997, Москва, ул. Профсоюзная, 90 E-mail: fizmat@maik.ru, fmlsale@maik.ru; http://www.fml.ru Отпечатано с готовых диапозитивов в ПФ «Полиграфист», Вологда, Челюскинцев, 3, тел. (8172) 72-61-75, E-mail: forma@pfpoligrafist.com ISBN 978-5-9221-1139-3 9"785922"111393I