Текст
                    ББК 22.14$
П63
УДК 512.64@75.8)
Постников М. М. Лекции по геометрии. Семестр II. Линей-
Линейная алгебра: Учеб. пособие для вузов. — 2-е изд., перераб. и доп. —
М.: Наука. Гл. ред. физ.-мат. лит., 1986.—400 с.
Непосредственное продолжение пособия того же автора «Лек-
«Лекции по геометрии. Семестр I. Аналитическая геометрия».
Особое внимание уделено в книге полилинейной алгебре (косо-
симметрическим функционалам), образующей базу современной тео-
теории интегрирования на гладких многообразиях, излагаемой в се-
семестре III.
1-е издание вышло в 1979 г.
Для студентов математических специальностей вузов.
Ил. 19.
Рецензенты:
кафедра геометрии Казанского государственного университета
им. В. И. Ульянова-Ленина (заведующий кафедрой — профессор
А. П. Широков);
доктор физико-математических наук профессор В. А. Ильин
661 ПВ
Михаил Михайлович Постников
Лекции по геометрии
Семестр II
ЛИНЕЙНАЯ АЛГЕБРА
Редакторы В. Л. Попов, Т. А. Панькова
Художественный редактор Т. Н. Кольченко
Технический редактор С. #. Шкляр
Корректоры Я. Я. Кришталь, О. М. Березина
ИБ АГ9 12808
•Сдано в набор 28.10.85. Подписано к печати 04.07.86. Формат 84Х108/зг.
Бумага тип. № 2. Гарнитура литературная. Печать высокая. Усл. печ. л. 21.
Усл. кр.-отт. 21. Уч.-язд. л. 20,18. Тираж 27500 экз. Заказ 828. Цена 1 р.
Ордена Трудового Красного Знамени издательство «Наука»
Главная редакция физико-математической литературы
117071 Москва В-71. Ленинский проспект. 15
Ленинградская типография № 2 головное предприятие ордена Трудового
Красного Знамени Ленинградского объединения «Техническая книга» им. Ев-
геини Соколовой Союзполиграфпрома прн Государственном комитете СССР
по делам издательств, полиграфии и книжной торговли. 198052. г. Ленинград.
Л-52, Измайловский проспект. 29.
ПЕРВОМАЙ dW5T^eHHF^ WO И А
г. МОСКВЫ t


СОДЕРЖАНИЕ Предисловие ЛЕКЦИЯ 1 Линейные пространства. — Подпространства. — Пересечевие под- подпространств. — Линейные оболочки. — Сумма подпространств. — Размерность подпространства. — Размерность суммы подпро- подпространств. — Размерность линейной оболочки. ЛЕКЦИЯ 2 17 Теорема о ранге матрицы. — Ранг произведения матриц. — Теоре- Теорема Кронекера — Капелли. — Решение систем линейных уравнений. ЛЕКЦИЯ 3 25 Прямые суммы подпространств. — Разложение пространства в пря- прямую сумму подпространств. — Факторпростраиства. — Гомоморфиз- Гомоморфизмы линейных пространств. — Прямые суммы пространств. лекция 4 за Сопряженное пространство. — Двойственные пространства. — Вто- Второе сопряженное пространство. — Преобразование сопряженного базиса и координат ковекторов. — Аннуляторы.—Пространство ре- решений системы однородных линейных уравнений. — Аннулятор ан- нулятора н аннуляторы прямых слагаемых. ЛЕКЦИЯ 5 4* Билинейные функционалы. — Корреляции. — Невырожденные били- билинейные функционалы. — Пространства со скалярным умноже- умножением. — Теорема об изоморфизме. — Метрические коэффициенты и взаимные базисы. — Пространство билинейных функционалов. — Билинейные функционалы от ковекторов.—Смешанные бнлнней- ные функционалы. ЛЕКЦИЯ 6 5S Полилинейные функционалы. — Тензоры. — Алгебра тензоров. — Базнс пространства тензоров. — Свертка тензоров. — Тензоры в пространстве с невырожденным скалярным умножением. — Подъ- Подъем и спуск индексов. ЛЕКЦИЯ 7 72 Подстановки. — Поливекторы. — Базисные поливекторы.— Внешние произведения уннмодулярно эквивалентных семейств векторов. — Отождествление поливекторов с классами унимодулярио эквива- эквивалентных семейств векторов. 1* 3
ЛЕКЦИЯ 8 7Э Кососимметрнческие тензоры. — Поливекторы степеней п и п — 1. — Плюккеровы координаты подпространств. ЛЕКЦИЯ 9 8Э Плоскости в аффинном пространстве. — Плоскости в проективном пространстве. — Многообразия Грассмана. ЛЕКЦИЯ 9а 9Э Внешнее произведение кососнмметрического тензора на вектор. — Корректность его определения. — Ассоциированные векторы. — Со- Соотношения Плюккера. ЛЕКЦИЯ 96 . ЮЭ Достаточность соотношений Плюккера. — Внешнее умножение про- произвольных кососимметрическнл тензоров. — Алгебра Грассмана. — Оператор Ходжа. — Свойства оператора Ходжа. ЛЕКЦИЯ 10 124 Кососнмметрические билинейные функционалы.— Пфаффиаи косо- симметрической матрицы. — Снмплектические пространства. — Сим- плектическая группа. — Изотропные подпространства. ЛЕКЦИЯ И 135 Симметрические билинейные функционалы. — Квадратичные функ- функционалы н квадратичные формы. — Теорема Лагранжа. ЛЕКЦИЯ 12 144 Теорема Якобн. — Квадратичные формы над полями комплексных и вещественных чисел. — Закон инерции. — Положительно опреде- определенные квадратичные функционалы и формы. ЛЕКЦИЯ 12а 153 Псевдоевклидовы пространства. — Псевдоортонормнрованиые бази- базисы и псевдсортогональные матрицы. — Собственно псевдоевклидова геометрия плоское™. — Углы на псевдоевклидовой плоскости. — Парадокс близнецов. ЛЕКЦИЯ 126 165 Ориентации линейных пространств и компоненты группы CL(re).— Ориентации евклидовых пространств. — Орие.нтации псевдоевклн- довой плоскости. — Условия псевдоортогональности матрицы. — Ориентации псевдоевклндовых пространств. — Компоненты группы О(р, д). ЛЕКЦИЯ 12в 178 Модель геометрии Лобачевского на сфере псевдоевклидова про- пространства.— Модель Бельтрами.— Модель Пуанкаре.— Модели Пу- Пуанкаре гиперболической плоскости.
ЛЕКЦИЯ 13 194 Проективные гиперквадрики. — Конусы в проективном простран- пространстве.— Перечисление проективных гиперквадрик. — Гиперквадрики в комплексном н вещественно-комплексном проективном про- пространстве. — Цнлиидры н конусы в аффинном пространстве. — Аф- Аффинные гиперквадрики. — Гиперквадрики, имеющие центр. ЛЕКЦИЯ 13а 214 Гиперквадрики, не имеющие центра. — Перечисление аффинных ги- гиперквадрик. — Гиперквадрики в комплексном пространстве. — Ги- Гиперквадрики в вещественно-комплексном пространстве. — Плоско- Плоскости, содержащиеся в гиперквадрике. — Оценка их размерности. — Степень планарности центральных гиперквадрик. — Степень пла- иариости параболоидов. ЛЕКЦИЯ 136 230 Асимптотические и неаснмптотическяе векторы. — Касательные. — Особые точки. — Характеризацня неасимптотических направлений. — Асимптотический конус гиперквадрики. — Диаметральные плоско- плоскости. — Теорема единственности. ЛЕКЦИЯ 14 е 243 Линейные операторы и смешанные билинейные функционалы. — Алгебра линейвых операторов.-г-Дефект и ранг линейного опе- оператора. — Идемпотентные операторы. — Сумма, разность и произ- произведение идемпотентов. ЛЕКЦИЯ 15 , 250 Матрица линейного оператора. — Переход к другому базису. — След оператора. — Сопряженвый оператор. — Невырожденные опе- операторы. — Изометрии н их матрицы. ЛЕКЦИЯ 16 261 Инвариантные подпространства. — Собственные векторы. » Харак- Характеристический многочлен в характеристические корни.—Алгебраи- корни.—Алгебраическая кратность собственного значении. — Теорема о прямой сум» ме. — Диагоналнзнруемые операторы. — Операторы с простым спектром. ЛЕКЦИЯ 17 ., „ . 272 Операторы со спектром в поле К. — Нильпотеитные н цикличе- циклические операторы. — Корневые подпространства. — Корневое разло- разложение. — Жорданова нормальная форма. ЛЕКЦИЯ 18 283 Теорема Гамильтона — Кэли. — Комплексификация линейного опе- оператора.— Собственные подпространства, принадлежащие характе- характеристическим корням. — Комплексно-диагонализируемые операторы, ЛЕКЦИЯ 18а 295 з!»-модули. — Весовые и примитивные элементы. — Простые gli- модули. — Теорема разложения и ее следствия.
ЛЕКЦИЯ 19 ...»., 3°7 Полулинейные изоморфизмы. — Полулинейные функционалы. — Обобщенные тензоры. — Полуторалннейные функционалы. — Эрми- Эрмитовы фукционалы. — Эрмитовы матрицы и формы. ЛЕКЦИЯ 20 , . . 319 Унитарные пространства. — Пространство, сопряженное унитарно- унитарному пространству. — Сопряженные операторы. — Самосопряженные операторы. — Положительные операторы. ЛЕКЦИЯ 20а 328 Самосопряженные проекторы. — Ортогональные проекторы. ЛЕКЦИЯ 21 333 Спектральные свойства самосопряженных операторов. — Ортого- Ортогональная диагоналнзируемость самосопряженных операторов. — Приведение квадратичных н эрмитовых форм к нормальному ви- виду. — Одновременное приведение к нормальному виду двух квад- квадратичных форм.—Характеризацня положительных операторов. ЛЕКЦИЯ 21а 343 Гиперквадрики в «-мерном евклидовом пространстве. — Мини- Минимаксное свойство собственных значений. — Классификация эллип- эллипсоидов. — Главные направления и завершение классификации ев- евклидовых гиперквадрик. ЛЕКЦИЯ 22 352 Изометрические операторы.—Унитарные матрицы. — Теорема о полярном разложении. — Нормальные операторы в унитарном про* странстве. — Ортогональная диагонализируемость унитарных onfe» раторов. — Связность групп GL(/t;C) и V(n}. ЛЕКЦИЯ 23 . «362 Комплексификация евклидова пространства. — Нормальные опера- операторы в евклидовом пространстве. — Приведение к нормальному виду ортогональных операторов. — Аффинные и ортогональные преобразования. — Параллельные переносы н центроаффинные преобразования. — Вращения и несобственные вращения. ЛЕКЦИЯ 24 372 Спиноры и спннтензоры. — Спинорная модель геометрии Минков- ского. — Гомоморфизм SL B: С) -> О^ U. 3).— Спииориая модель трехмерной геометрии Евклида. — Кватернионы. — Гомоморфизм SUB)->- SOC). —Доказательство предложения 1. — Гомоморфизм SLB: R)->O*(l, 2). ЛЕКЦИЯ 25 . . . , . 5 4 387 Овеществления и комплексные структуры. — Ориентация ове- овеществленного пространства. — Овеществление унитарного про- пространства.— Операторы L и Л. — Теорема Лефшеца. Предметный указатель ........ .... .. ....... . . . 398
ПРЕДИСЛОВИЕ Настоящая книга является переработанным и зна- значительно расширенным вторым изданием моей книги «Линейная алгебра и дифференциальная геометрия»1), являвшейся почти точной записью лекционного курса на механико-математическом факультете МГУ им. М. В. Ломоносова. Этот характер книги не только создал определенные трудности при использовании ее как учебного пособия при другом построении курса (и, тем более, при другой программе), но и лишил воз- возможности должным образом завершить ряд важных тем, прерванных в лекционном курсе по организацион- организационным причинам. Поэтому в этом издании книге придана большая универсальность и широта. Основная часть программного материала перешла во второе издание почти без всяких изменений. Исклю- Исключением является лишь теория кососимметрических тен- тензоров, изложение которой полностью перестроено с целью дать лектору возможность без особого ущерба опустить при желании ряд более трудных вопросов (скажем, вывод соотношений Плюккера). Добавленный — в основном внепрограммный — ма- материал вынесен в лекции, номера которых снабжены буквами (исключением является лекция 10, материал которой, по моему мнению, обязательно должен входить в программу). Конечно, хотя бы часть материала этих дополнительных лекций желательно излагать в ауди- аудитории, но, по-видимому, для этого придется чем-то жерт- жертвовать. Особняком стоят заключительные лекции 24, 25 и тесно связанная с лекцией 25 лекция 18а, содержащие ') Постников М. М. Лекции по геометрии. Семестр II. Ли- Линейная алгебра и дифференциальная геометрия. — М.: Наука, 1979.
материал, до сих пор в курсах линейной алгебры не излагавшийся (строго говоря, это не относится к лек- лекции 24, материал которой можно найти в известном учебнике А. И. Кострикина и Ю. И. Манина1)). Я не решаюсь рекомендовать весь этот материал для изло- изложения в аудитории в обязательном курсе, но студенту будет очень полезно изучить его самостоятельно, а, ска- скажем, преподаватели, ведущие практические занятия, мо- могут извлечь из этих лекций ряд новых нетривиальных задач. Для более углубленного изучения линейной алгебры и лучшего осознания ее места в структуре математиче- математического знания я горячо рекомендую уже упомянутый выше замечательный, очень своеобразный учебник А. И. Кострикина и Ю. И. Манина, который может по- показаться при первом чтении несколько трудным, но вни- внимательное изучение и продумывание которого безус- безусловно себя окупит. Очень полезным также будет изуче- изучение — в определенном отношении противоположно ори- ориентированной, но в своем роде также замечательной,— переводной книги Халмоша 2). К сожалению, из-за ограниченности объема лекции, посвященные дифференциальной геометрии, пришлось из книги исключить, хотя я по-прежнему считаю пра- правильным включение их во второй, семестр. *) Кострикин А. И., М а н и н Ю. Й. Линейная алгебра и геометрия.— М.: Наука, 1985. 2) X а л м о ш П. Конечномерные векторные пространства. — М.: Физматгиз, 1963.
Лекция 1 Линейные пространства. — Подпространства. — Пересе- Пересечение подпространств. — Линейные оболочки. — Сумма подпространств. — Размерность подпространства. — Раз- Размерность суммы подпространств. — Размерность линей- линейной оболочки. В этом семестре мы перенесем результаты семестра I на случай любого п. В основном мы будем следовать прежнему плану изложения1). Напомним (см. определение 1 лекции 1.1), что ли- линейным пространством (или линеалом) над полем К на- называется множество У, элементы которого называются векторами и в котором определены операция сложения х, у ь->х + у и для любого числа k e К операция xi—^-kx умножения на это число. При этом требуется, чтобы от- относительно сложения У было абелевой группой и чтобы для умножения на числа из К были выполнены четыре естественные аксиомы. В таком пространстве имеют смысл понятия линей- линейной комбинации векторов и линейно зависимых или не- независимых семейств и множеств векторов. Пространство У называется конечномерным, если в нем существует конечный базис, т. е. семейство векторов, через которые единственным образом линейно выражается любой век- вектор из У. Число векторов во всех базисах одно и то же. Оно называется размерностью линеала У и обозна- обозначается символом 6\гпУ. Пусть У— произвольное линейное пространство. Определение 1. Подмножество &> пространства У на- называется его подпространством, если каждая линейная комбинация k\X\-\- ... -\-kmxm любых векторов жь ... ..., хт <= $Р принадлежит &>. Очевидно, что 0* тогда и только тогда является подпространством, когда х + у е $Р и kx<=$P для лю- любых векторов х, у е ?Р и любого числа k e К. *) См. Постников М. М. Лекции по геометрии. Семестр I. Аналитическая геометрия. — М.: Наука, 1986. Ссылка «см. определе- определение 1 лекции I. 1» означает, что нужно смотреть определение 1 лек- лекции 1 семестра I.
Иначе говоря, тот факт, что i? является подпростран- подпространством, означает, что соответствия х, у\—>х-\-у и х\—=> >—->kx, где х, у е 0* и k е К, определяют в i? некоторые операции. Ясно, что относительно этих операций под- подпространство 0* является линейным пространством. Примеры подпространств. 1. В любом линеале Ж одноэлементное подмноже- подмножество {0} и все множество У являются подпространства- подпространствами. Подпространство {0} (обыкновенно обозначаемое просто 0) называется нулевым, а подпространство У— тривиальным. 2. В линеале К" для любого m ^ n совокупность всех векторов вида (х\ ..., хт, 0, ..., 0), у которых равны нулю последние п — т координат, является подпростран- подпространством. Это подпространство естественным образом изо- изоморфно пространству Кт. 3. В линейном пространстве многочленов (или, более общо, любых функций, удовлетворяющих тем или иным условиям) подпространством будет множество всех мно- многочленов (функций), равных нулю в одной или несколь- нескольких фиксированных точках. 4. Подпространством будет множество всех много- многочленов, коэффициенты которых при данных фиксирован- фиксированных степенях равны нулю, а также множество всех чет- четных или всех нечетных многочленов. Предложение 1. Пересечение произвольного семейства подпространств !?а. ci У яв- является подпространством. Доказательство. Если х, у е ?Р, то х, у^ 0*а для любого а, и потому * + ys ^*a, kx e ^а, и, значит (так как а произвольно), х + у''е ^*, kx<^!P. П Заметим, что пересечение подпространств не может быть пустым, поскольку любое подпространство содер- содержит нулевой вектор 0. Если ^ПС = 0, то подпространства $р и Q назы- называются дизъюнктными. Несмотря на свою простоту, предложение 1 влечет важные следствия. Пусть S — произвольное подмножество линеала У, 10
Определение 2. Подпространство ?РаУ называется линейной оболочкой, множества S, если SatP и 0* яв- является наименьшим подпространством, обладающим этим свойством, т. е. если каждое подпространство С$, для которого S си Q, содержит &*. Линейная оболочка множества S обозначается символом [S]. Она назы- называется также подпространством, порожденным множе- множеством S. Предложение 2. Линейная оболочка [S] существует для любого множества S cz У. Ею является пересечение всех подпространств, содержащих S. Доказательство. Так как в этом пересечении (являющемся, согласно предложению 1, подпростран- подпространством) участвует каждое подпространство Q =э S, то оно содержится в Q. С другой стороны, оно, очевидно, со- содержит S. О В связи с этим доказательством возникает вопрос: имеем ли мы вообще право говорить о пересечении подпространств, содержащих S? Почему, собственно, та- такие подпространства существуют? Формальный ответ со- состоит в том, что, в соответствии с общими принципами теории множеств, пересечение семейства подмножеств произвольного множества У определено даже тогда, когда семейство пусто, и является в этом случае, как ни парадоксально, всем У. В нашей же конкретной си- ситуации дело еще проще, потому что рассматриваемое семейство никогда не пусто. Действительно, одним из подпространств, содержащих S, заведомо является все пространство У. Более наглядное описание линейной оболочки [5] дает следующее предложение: Предложение 3. Линейная оболочка [S] множества S состоит из всевозможных линейных комбинаций (\) k{x{ -j- ... + kmxm, x\, ..., xm ^ S, fej йяеК, векторов из S. Доказательство. Если ?? — подпространство,со- дерлсащее S, то оно, очевидно, содержит все векторы вида A). С другой стороны, ясно, что совокупность всех векторов A) является подпространством, содержащим S. а Из этого предложения следует, что множество век- векторов пространства У тогда и только тогда полно, когда оно порождает все У, и
Напомним (см. лекцию I. 7), что два множества век- векторов называются линейно эквивалентными, если каж- каждый вектор любого из множеств линейно выражается через векторы другого множества. Ясно, что это равно- равносильно тому, что вектор тогда и только тогда представ- представляет собой линейную комбинацию векторов одного мно- множества, когда он является линейной комбинацией век- векторов другого множества, т. е., согласно предложению 3, — тому, что линейные оболочки обоих множеств сов- совпадают (оба множества порождают одно и то же под- подпространство) . В отличие от пересечения, объединение подпрост- подпространств, вообще говоря, подпространством не является. Чтобы получить подпространство, надо от объединения перейти к его линейной оболочке. Определение 3. Суммой ]? ^*а произвольного семей- а ства подпространств <Ра.<^У° называется линейная обо- оболочка их объединения: Для двух подпространств &> и Q Ясно, что любая линейная комбинация векторов из &[}(? имеет вид х + у, где х^?Р, y^Q. Этим доказано следующее предложение: Предложение 4. Сумма ?Р + <? подпространств 0> и Q состоит из всевозможных векторов вида х + у, где х е ea$>,ys=Q. п Аналогичное предложение имеет место, конечно, и для суммы любого семейства подпространств. Все сказанное выше справедливо для любого — даже бесконечномерного — линеала У". Предположим теперь, что этот линеал конечномерен. Нам понадобится следующая простая лемма: Лемма 1. Если для линейного пространства У суще- существует такое число N, что любые N векторов этого про- пространства линейно зависимы, то пространство У конеч- конечномерно и B) dim T <N. 12
Доказательство. При У = 0 доказывать нечего. Если же У =#= 0, то в У существуют линейно независи- независимые семейства векторов и, согласно условию, каждое такое семейство содержит не более, чем N векторов. Поэтому существуют линейно независимые семейства векторов, состоящие из максимального числа векторов. Поскольку добавление любого вектора к такому семей- семейству делает его линейно зависимым, каждое такое се- семейство полно (является базисом). Таким образом, в линейном пространстве У существуют конечные пол- полные семейства векторов, т. е. это пространство конечно- конечномерно. Неравенство B) теперь очевидно. О Предложение 5. Каждое подпространство 0* произ- произвольного конечномерного линейного пространства У ко- конечномерно, и его размерность не превосходит размер- размерности пространства У: C) dim & < dim У. Доказательство. Пусть dim^° = n. Тогда лю- любые п + 1 векторов пространства У линейно зависимы. В частности, линейно зависимы любые п + 1 векторов подпространства $р. Таким образом, линейное простран- пространство {р удовлетворяет условиям леммы 1 (с N = п -{- I). Значит, оно конечномерно и для его размерности имеет место неравенство B). Для завершения доказательства остается заметить, что при N = п-\-1 (и п = й'ипУ) последнее неравенство равносильно неравенству C). а Если dim^5 = п, то любой базис в Ф, являясь линей- линейно независимым семейством, состоящим из п векторов, будет базисом и в У. Поэтому {р = У. Если же dim Ф <С <С п, то базис в ?Р, имея менее п векторов, не может быть полным семейством в 7 и, значит, не порождает У. Поэтому ?Р =г= У. Таким образом, подпространство 0*czy тогда и только тогда совпадает с У, когда 5 = dimF. Теорема 1 (о размерности суммы подпро- подпространств). Для любых двух подпространств <р и Q справедлива формула dim (#» + ?) = dim & + dim Q — dim @> f] Q). Доказательство. Пусть dim &> = p, dim Gt = q, dim {& Л Q) = r. 13
Рассмотрим в ^Т|?? произвольный базис еь ..., ег. До- Добавляя к этому базису вектор за вектором, мы в конце концов получим некоторый базис D) i?i, ..., er, f{, ..., /р_г подпространства !Р гэ <p[\Q. Аналогично, и в подпро- подпространстве Q мы можем построить базис вида E) еи ... ., er, g^ .... gq_r. Теорема 1 будет, очевидно, доказана, если мы покажем, что р + д — г векторов F) еи ..., er, /i, ..., fp_r, glt ..., gq_r составляют базис подпространства &> + G?. Линейная независимость. Пусть Полагая e = 6^! + ... + krer, • • • + mq_rgq_r, мы получим такие векторы е е ^ f| ??» f ^ & и ge^, что е + / + g = 0- Тогда е + / ^ ^5, и потому ? = = — (е + /)е^. Значит, gе ^ П^, и, следовательно, вектор g линейно выражается через векторы е\, ..., ег. Но, по условию, вектор g линейно выражается через век- векторы g\, ..., gp-r- Поскольку два различных выражения через базис E) одного и того же вектора существовать не могут, этим доказано, что оба выражения имеют рав- равные нулю коэффициенты. Таким образом, тп\ = 0, ... ..., тд-г = 0, и, значит, g = 0. Но тогда е + f = 0, и, следовательно (поскольку D) —базис), ft, =0, .... kr = 0, /,=0, ..., lp-r = 0. Этим доказано, что векторы F) линейно независимы. Полнота. Любой вектор из {р + Q имеет, как мы знаем, вид х + у, где х^д9, у^С?. Сложив разложение вектора х по базису D) с разложением вектора у по базису E), мы, очевидно, получим представление век- вектора х + у в виде линейной комбинации векторов F). Следовательно, семейство F) векторов подпространства & + €? полно. Являясь линейно независимым и полным, семейство F) представляет собой базис. О 14
Следствие 1. Если &> + Q = T, то = p + q — n. Следствие 2. Если р + q > п, то &> {\С? ф 0. ? Как вычислять размерность подпространства? Ответ на этот вопрос зависит, конечно, от того, каким спосо- способом подпространство задано. Поэтому каждый раз, когда нам встретится новый способ задания подпро- подпространств, мы будем к этому вопросу возвращаться. Пока же нам известен, по существу, один способ эффектив- эффективного задания подпространств, а именно как линейной оболочки некоторого конечного множества векторов. По- Поэтому наш общий вопрос конкретизируется в задачу о вычислении размерности dim [S] линейной оболочки произвольного (конечного) множества векторов S. Этой задачей мы сейчас и займемся. Пусть S — произвольное конечное множество векто- векторов. Без ограничения общности мы можем считать, что оно содержит отличные от нуля векторы и, следователь- следовательно, обладает линейно независимыми подмножествами. В силу конечности числа векторов в S, среди этих под- подмножеств есть максимальные, т. е. такие, что от присо- присоединения к ним любого другого вектора из S они пре- превращаются в линейно зависимые множества. Поскольку это возможно только тогда, когда присоединяемый век- вектор линейно выражается через векторы подмножества, мы получаем, что любое максимальное линейно незави- независимое подмножество So множества S линейно эквива- эквивалентно всему множеству S, т. е. (см. выше) порождает то же подпространство [S]. Это означает, что множе- множество So полно в [S], а так как оно, кроме того, и линейно независимо, то, следовательно, после произвольного за- нумерования, оно становится базисом в [S]. Итак, каж- каждое максимальное линейно независимое подсемейство множества S является базисом линейной оболочки [S] множества S. Поскольку все базисы любого пространства состоят из одного и того же числа векторов, отсюда, в частности, следует, что все максимальные линейно независимые подмножества множества S состоят из одного и того же числа векторов. Определение 4. Число векторов максимального ли- линейно независимого подмножества множества 5 назы- называется рангом множества S. 15
Согласно только что сказанному это определение корректно. Кроме того, мы видим, что справедливо следующее предложение: Предложение 6. Размерность dim [5] линейной обо- оболочки мнооюгства векторов S равна рангу этого мно- множества. ? На первый взгляд это предложение представляется малосодержательной тавтологией. На самом деле его содержание весьма глубоко, поскольку оно отождеств- отождествляет интересующее нас число dim [5] с неким числом (рангом), для которого существует, хотя бы принципи- принципиальная, возможность вычисления в конечное, заранее оцениваемое, число шагов, т. е. которое, как говорят, эффективно вычислимо. Действительно, чтобы вычислить ранг, можно, например, последовательно пе- перебирать все подмножества множества 5 (а их конечное число!) и для каждого подмножества определять, не будет ли оно линейно независимо (что также осуществ- осуществляется в конечное число шагов). Таким образом, значе- значение предложения 6 состоит в том, что оно указывает конечную процедуру вычисления размерности подпро- подпространств (в случае — подчеркнем, — когда подпростран- подпространства заданы как линейные оболочки конечных — для эффективности это обязательно! — множеств векторов). Конечно, за счет разумной организации вычислений объем необходимых вычислений можно существенно уменьшить. Соответствующую методику мы рассмотрим в следующей лекции.
Лекция 2 Теорема о ранге матрицы. — Ранг произведения мат- матриц. — Теорема Кронекера — Капелли. — Решение систем линейных уравнений. Ответ на поставленный в конце предыдущей лекции вопрос о рациональном методе вычисления ранга мно- множества векторов зависит, естественно, от способа зада- задания этих векторов. Мы рассмотрим лишь один, но зато самый важный вариант, когда векторы задаются их ко- координатами в некотором базисе. Это все равно, что счи- считать наши векторы принадлежащими пространству век- векторов-строк Кп. Итак, пусть нам даны т взкторов A) Г1 Г. п1.и.".'\ а!п! / \ пространства К". Расположив компоненты этих векто- векторов в виде прямоугольной матрицы мы можем переформулировать интересующую нас за- дачу з следующем виде: Дана прямоугольная матрица B). Чему равен ранг множества ее строк? В этой формулировке мы и будем ее решать. Пусть 1 s?^ р ^Z min(m, n). Выбрав в матрице А про- произвольным образом р строк и р столбцов и рассмотрев элементы, находящиеся на их пересечении, мы получим квадратную «подматрицу», имеющую р строк и р столб- столбцов. Определители таких подматриц называются мино- минорами порядка р матрицы А. Определение 1. Наивысший порядок отличных от нуля миноров, т. е. такое число р, что в матрице А нет отличного от нуля минора порядка р т{- 1, но есть такой минор порядка р, называется рангом матрицы А. Заметим, что если все миноры порядка р + 1 равны нулю, то все миноры порядка р + 2 также равны нулю, поскольку по формуле разложения определителей любой I/
минор порядка р + 2 является линейной комбинацией миноров порядка р + 1. Равны нулю, конечно, и все ми- миноры большего порядка. Ясно, что ранг р матрицы B) удовлетворяет нера- неравенствам О ^ Р ^ min (tn, n), причем р = О тогда и только тогда, когда все элементы матрицы равны нулю. Перебирая один за другим миноры все больших и больших порядков, мы в конечное число шагов всегда можем вычислить ранг произвольной матрицы. Поэтому ответ на поставленный выше вопрос дает следующая теорема: Теорема 1 (о ранге матрицы). Ранг р произволь- произвольной матрицы равен рангу г множества ее строк: Доказательство. Заметим прежде всего, что при любой перестановке строк или столбцов матрицы А множество всех ее миноров каждого порядка биективно отображается на множество миноров того же порядка преобразованной матрицы, причем отличные от нуля миноры переходят в отличные от нуля миноры. Следо- Следовательно, при каждой такой перестановке ранг р мат- матрицы А не меняется. Что происходит с рангом строк? Ясно, что при пере- перестановке строк он не меняется. Перестановка же столб- столбцов сводится к одновременному переобозначению ком- компонент всех векторов A), от чего все имеющиеся между этими векторами (или между частью их) линейные за- зависимости очевидным образом не меняются. Поэтому ранг г множества строк матрицы А при любой переста- перестановке столбцов также остается прежним. Поскольку перестановкой строк и столбцов мы мо- можем добиться того, чтобы отличный от нуля минор по- порядка р матрицы А оказался в левом верхнем углу, отсюда следует, что при доказательстве равенства р = г мы можем без ограничения общности предполагать, что «tip ^0. ... а рр Если бы теперь первые р строк матрицы А были ли- линейно зависимы, то строки определителя А также, оче- 18
видно, оказались бы линейно зависимы и потому опре- определитель был бы равен нулю. Это доказывает, что строки аи ..., ар матрицы А линейно независимы, и, сле- следовательно, р sg; г. Поэтому для доказательства равенства р = г доста- достаточно установить, что любая строка а,- с i> p линейно выражается через строки аи, ..., ар. С этой целью мы рассмотрим следующий определи- определитель порядка р + 1: C) а,р а2\ ¦¦' а2Р а2/ аРх ¦¦¦ арр api ап ••• aiP ац где 1 г?Г / г?Г п. Если 1 г^ / г?Г р, то определитель C) имеет два одинаковых столбца и потому равен нулю. Если же р + 1 г?Г / г?Г п, то определитель C) представ- представляет собой минор матрицы А порядка р + 1 (получаю- (получающий выбором первых р строк и столбцов и, кроме того, /-го столбца и t-й строки) и потому также равен нулю. Следовательно, разложив этот определитель по элемен- элементам последнего столбца, мы при любом /=1, ..., п получим равенство вида D) A ia4 + А&2, + • • • + АраР1 + Aatj = О, где А\, Аг, ..., Ар, А — алгебраические дополнения эле- элементов этого столбца. Эти алгебраические дополнения зависят только от элементов, находящихся в первых р столбцах определителя C), и, в частности, одни и те же для всех /. Поэтому в векторной записи п равенств D) равносильны одному равенству вида Поскольку, по условию, А =т^= 0, это доказывает, что век- вектор a-t, p -j- I ^ i ^ п, линейно выражается через век- векторы а\, ..., ар. Следовательно, г = p. Q Изложенное доказательство показывает, в частности, что если в матрице А имеется отличный от нуля минор порядка р, обладающий .тем свойством, что все «окайм- «окаймляющие» его миноры порядка р + 1 равны нулю, то ранг матрицы равен р. Это замечание существенно упрощает, конечно, вы- вычисление ранга. 19
В частном случае, когда матрица А квадратная, а ее ранг равен ее порядку, мы получаем Следствие. Определитель тогда и только тогда отли- отличен от нуля, когда его строки линейно независимы. О Ясно, что при транспонировании матрицы А ранг р не меняется. Вместе с тем ранг строк транспонирован- транспонированной матрицы равен рангу столбцов исходной матрицы. Это доказывает, что ранг множества строк произволь- произвольной матрицы равен рангу множества ее столбцов. Удивительный результат, связывающий ранги се- семейств векторов двух линейных пространств, имеющих, вообще говоря, даже различные размерности! Что происходит с рангом при умножении матриц? Пусть А — матрица, имеющая (как и выше) п столб- столбцов и m строк, а В — матрица, имеющая п строк и s столбцов. Тогда определена матрица АВ, имеющая m строк и s столбцов. Если г(А) — ранг матрицы А и г (В)—ранг матрицы В, то что можно сказать о ранге г(АВ) матрицы АВ? Оказывается, что в общем случае можно лишь утверждать, что ранг г(АВ) не превосходит наимень- наименьшего из рангов г (А) и г (В): Предложение 1. Имеют место неравенства Си Доказательство. Пусть 1ац ••• а\п II || Ь\\ ... bis || |. 5 = | \, АВ= II II Ьп\ ... b У п\ ... bns ст\ ... cms По определению умножения матриц п cik — Zj aijbik> 1=1, ..., т, k — I, ..., s. /-i Введем в рассмотрение векторы-строки матриц В и С: •••» bls)> <?1 = (СИ> •••> cls)> Ьп z==z \Рп\г • • •» Ons), Cm === \Pmlt • • • > Cms)' Тогда формулы для с»* можно будет переписать в сле- следующем виде: 2j iijbj, i= 1, -.., т, •20
означающем, что векторы с\, ..., ст линейно выра- выражаются через векторы Ь\, ..., Ьп. Следовательно, [cit .... ст] cr [&,, ..., Ьп], и потому dimfd, ..., cm] <; dim [&,, ..., Ьп], т. е., по теореме о ранге матрицы, г(АВ) г?Г г (В). Неравенство r{AB) ^ г(А) доказывается аналогично (следует только вместо строк рассмотреть столбцы). Впрочем, его можно вывести из уже доказанного нера- неравенства, если воспользоваться тем, что при транспони- транспонировании ранг не меняется и (АВ)Г = ВТАГ. Действи- Действительно, (г) {гт)(т) П В случае, когда одна из матриц А или В является квадратной и невырожденной, можно доказать более точный результат: Предложение 2. Если В — квадратная (n = s) и не- невырожденная (det В ф= 0) матрица, то для любой мат- матрицы А г (A3) = г (Л). Аналогично, если А — квадратная (я = га) « невырож- невырожденная (det A =7^0) матрица, то для любой матрицы В г (АВ) = г (В). Короче, при умножении на невырожденную матрицу ранг матрицы не меняется. Доказательство. Для невырожденной мат- матрицы В существует обратная матрица В~1 и А ==- = (АВ)В~1. Поэтому, согласно предложению 1, = r {(AB) B~l)^r (AB). Следовательно, г (А) = г(АВ). Равенство г(В) = = г(АВ) для невырожденной матрицы А доказывается аналогично. а Теорема о ранге матрицы позволяет не только эф- эффективно вычислять ранги и находить максимальные линейно независимые подмножества, но с ее помощью можно, например, устанавливать, выражается ли дан- данный вектор Ь через данные векторы а\, ..., ат, без того,, чтобы в явном виде находить коэффициенты линейной зависимости.
Действительно, очевидно, что вектор Ь тогда и только тогда линейно выражается через векторы а,\, ..., ат, когда каждое максимальное линейно независимое под- подмножество множества Оь ..., ат является максималь- максимальным линейно независимым подмножеством и расширен- расширенного множества «ь .... ат, b и, значит, когда ранг мно- множества аи ..., ат равен рангу множества аи •••» ат, Ь. Полезно этот факт переформулировать на языке теории линейных уравнений. Если Ь = {ЬХ, .... Ьп), то векторное равенство E) х,о, + ... + хтат = Ь равносильно п числовым равенствам аПх\ ~Г • • • ~Ь О-т\хт ===О1 F) Соотношения F) представляют собой систему п неод- неоднородных линейных уравнений от т неизвестных. Эта система совместна, т. е. обладает хотя бы одним реше- решением х\, ..., хт, тогда и только тогда, когда имеет место равенство E), т. е. когда вектор Ь линейно выражается через векторы аи • ¦ ¦, Лт. С другой стороны, по теореме 1 ранг множества век- векторов аи ..., а,п равен рангу матрицы коэффициентов системы F), а ранг множества векторов аи •¦-, Q-m, равен рангу расширенной матрицы коэффициентов !а\\ — ат\ Ь\ а\п ... amn bn лолучающейся из матрицы G) добавлением столбца свободных членов. Этим доказана следующая теорема: Теорема 2 (теорема Кронекера — Капел- л и). Система линейных уравнений F) тогда и только 22
тогда совместна, когда ранг матрицы ее коэффициентов G) равен рангу расширенной матрицы (8). ? Пусть система F) совместна. Как найти все ее ре- решения? Пусть г — ранг матрицы G). Переставив уравнения и переименовав (если нужно) неизвестные, мы без огра- ограничения общности можем считать, что (9) аи ахт ... атг 0. Так как система F) по условию совместна, то по тео- теореме „Кронекера — Капелли ранг матрицы (8) также ра- равен г. Это означает (ввиду условия (9)), что первые г строк матрицы (8) (т. е. первые г уравнений F)) ли- линейно независимы и любая другая строка матрицы (8) (любое другое уравнение F)) является их линейной комбинацией. Поэтому система F) равносильна системе (Ю) аХгхх + ... + arrxr + ... 4- amrxm = br, состоящей из ее первых г уравнений, т. е. любое решение системы F) будет решением системы A0) и, наоборот^ любое решение системы A0) будет решением системы F). Таким образом, все свелось к решению системы A0), состоящей из линейно независимых уравнений. Чтобы решить эту систему, мы перепишем ее в виде ^~ ••• -\- &rixr== Ь\ ar+i, \Xr+l ... amXxmt. (П) aXrx{ + ... -\-aTTxr = bT — ar+1, rxr+l — ... — amrxm. Если мы дадим неизвестным xr-f-i, ..., xm произвольные значения, то система A1) превратится в систему г урав- уравнений от г неизвестных х\, ..., х, с отличным от нуля (в силу (9)) определителем Д. Поэтому по известным из курса алгебры формулам Крамера мы можем единственным образом найти неизвестные хи ..., хг. Ясно, что этот прием даст нам все решения системы A0) (т. е. системы F)). На практике, конечно, нет нужды в предварительной перестановке уравнений и в переименовании неизве- неизвестных. Процедура решения произвольной системы ли- линейных уравнений F) состоит поэтому в следующем: 23.
Этап 1. Вычисляя миноры матрицы коэффициен- коэффициентов G), находим ее ранг г, одновременно обнаруживая хотя бы один отличный от нуля минор А порядка г. Этап 2. Окаймляя найденный минор в матрице (8), убеждаемся, что ранг этой матрицы также равен г. (Если он больше г, т. е. равен г-j-l, то система F) несовместна.) На этом этапе достаточно, очевидно, вы- вычислить только п — г миноров порядка г-\-\. Этап 3. В минор А входят коэффициенты при г не- неизвестных в г уравнениях. Оставляя только эти урав- уравнения, придавая остальным п — г неизвестным произ- произвольные значения и, следовательно, получая систему г уравнений от г неизвестных с отличным от нуля опре- определителем, решаем эту систему по формулам Крамера. Тем самым мы найдем значения и остальных г неиз- неизвестных. Полученные на этапе 3 значения неизвестных х\, ... ..., хт являются решениями системы F), и любое ре- решение этой системы может быть так получено.
Лекция 3 Прямые суммы подпространств. — Разложение простран- пространства в прямую сумму подпространств. — Факторпро- странства. — Гомоморфизмы линейных пространств. — Прямые суммы пространств. Пусть ?Р и Q — подпространства линейного простран- пространства У. Напомним, что их сумма 9> -\- Q состоит из всех векторов вида х -\- у, где х е SP, у е Q. Определение 1. Подпространство ?Р -f- Q называется прямой суммой подпространств <р и Qt если каждый era вектор единственным образом представляется в виде Q \y В этом случае вместо $Р -f- Q пишут 3* Ф Q или Предложение 1. Подпространство 9* -\- Q тогда и только тогда является прямой суммой подпространств zP и Q, когда эти подпространства дизъюнктны, т. е. д> п Q = 0. Доказательство. Если имеет место равенство х-\-у = xi-{¦ уи где х, х\<=& и у, yx<=Q, то вектор х — Х\ = у\ — у лежит в 3 П Q- Поэтому, если 3 П Q = 0,- то х = Х\ и у = у\, т. е. представление каждого вектора из 9> -f- Q в виде х-\-у, х<=&, у ^С?, единственно. Об- Обратно, если ^TlC^Q и ое^П^ афО, то для лю- любых векторов х ^.ZP, у ^ Q будет иметь место равенство х + У = (х + а) + (У — а), где j-f-ae^HJ — a^.Q, показывающее, что представ- представление векторов из 9> -\- Q в виде х + у, х е 0*, у ^ ^, не единственно, и Имеет смысл, конечно, говорить и о прямой сумме произвольного числа подпространств. Например, сумма & + Q + 52 трех подпространств называется прямой, если представление каждого вектора из ^ -\- Q. -\- 0t в виде х -\-у -\- z, где х ^. ?Р, у ^Q, z ^ <%., единственно. По аналогии с предложением 1 хочется думать, что для этого необходима и достаточна попарная дизъюнктность пространств 3, Q и ОЙ,. Это неверно. Например, для лю- любых двух некоялинеарных векторов а и Ь подпростран- подпространства 3 = [а], Q = [Ь], 0? — \а + Ь] попарно дизъюнкт- дизъюнктны, но тем не менее их сумма 9*.+ Q -f- & = ta> b] пря- прямой не является. 25-
Правильное условие того, что сумма 0* + Q 4- Si является прямой суммой, дается следующим предло- предложением: Предложение 2. Сумма 9* -{- С? -{- 9R. трех подпро- подпространств тогда и только тогда является их прямой сум- суммой, когда каждое из них дизъюнктно с суммой двух других: A) ^Л(? + ^) = 0, ?Л(^ + ^) = 0, ЯП(Р + СП = 0. Доказательство. Если имеет место равенство #-f у-f z = #! +yl-\-zx, где х, хх<=3>, у, y^Q, z, *i е= Ш, то х — xl = (jfj — у) + («1 — z) «ее ^ П (^ + ^)- По- Поэтому, если хх Ф х, то ^ П (Q -\- &) Ф 0. Аналогично, если У\Фу, -юС1{\{& + &)ФЪ, а еслиг^-г, то & Л (& + {2)фО. Таким образом, если сумма 3* + Q -{- 01 не прямая, то не все условия A) выполнены. Обратно, если, напри- например, 3> Л {Q 4- #) ^ 0 и а г ^ Л {Q + &)> афО, то для любых векторов х^ 0>, у е Q, z ^ M имеет место ра- равенство x + y-\-z = (x — a) 4-(У:.+ 6) + B + с), где b ^Q, с ^ 52 — такие векторы, что а = 6 -j- с, и по- потому сумма ^ -{- <3? + 52 не является прямой. ? Конечно, аналогичное предложение справедливо и для сумм любого числа подпространств. Особо важное значение имеет случай, когда ZP®Q = = У. В этом случае говорят, что пространство У разло- разложено в прямую сумму подпространств & и Q. Рассмотрим следующие свойства подпространств ^ и ф 1° Любой вектор из У имеет вид х-\-у, где x^ZP, у е а, т. е. г = ? + а. 2° Подпространства 9* и ^ дизъюнктны, т. е. ^>Л^' = = 0. 3° Сумма размерностей подпространств & и Q равна размерности пространства У: dim & -f dim (S? = dim F. Предложение З. Любые два из свойств 1°, 2°, 3° тег/г третье. Доказательство. Если имеют место свойства 1 и 2°, то по теореме о размерности суммы (см. теорему 1 26 о
лекции 1) dim У = dim (^ + ф = = dim & + dim <? — dim (^ Л Ф = dim ^ + dim Если имеют место свойства 1° и 3°, то по той же теореме dim (^ Л Ф = dim (& + ф — dim ^ — dim # = = dim У — dim & — dim <? = О, значит, ^ Л ^ = 0. Если имеют место свойства 2° и 3°, то снова по той же теореме dim (^ + ф = dim ?» + dim ? = dim У, и, значит, & + ?? == Т. п Согласно предложению 1 свойства 1° и 2° означают,, что У = ^*ФQ. Тем самым доказано Следствие. Равенство У — SP Ф Q имеет место тогда и только тогда, когда выполнены любые два из свойств 1°, 2°, 3° (а значит, и третье свойство). Определение 2. Если У = SP Ф С?, то подпространства '9* и Q называются дополнительными. Предложение 4. Если подпространства SP и Q до- дополнительны, то для любого базиса е\, ..., ер подпро- подпространства ЗР и любого базиса ер+\, ..., еп подпростран- подпространства Q векторы составляют базис пространства У. Обратно, если произвольный базис еи ..., еп про- пространства У" разбить на два подсемейства ех, .... е? и ep+u ..., еп, то подпространства 9> = [еи .... ер] и Q = [ер+и ..., еп) будут дополнительны. Доказательство. В первом утверждении век- векторы в\, ..., ер, ео+\, ..., еп составляют полное семейство» состоящее из п = р -\- q векторов. Поэтому оно является базисом. Во втором утверждении подпространства &> и Q обладают указанными выше свойствами 1° и 3°. Поэтому У = 9* Ф Q. ? Следствие. Для любого подпространства SP czy су- существует дополнительное подпространство 0.. Доказательство. Пусть в\, ..., ер — произволь- произвольный базис подпространства ЗР. Дополним этот базис 27
какими-то векторами ер+\, ..., еп до базиса всего про- пространства У. Тогда подпространство Q = [ep+i, .... еп] будет дополнительным к <р. ? Замечание 1. Полезно иметь в виду, что дополни- дополнительные векторы е0+и ..., еп, порождающие подпро- подпространство Q, всегда можно выбрать среди векторов произвольного, наперед заданного базиса аь ..., ап про- пространства У. Действительно, выбросив из семейства векторов все векторы, линейно выражающиеся через предыдущие, мы получим базис пространства У, состоящий из век- векторов е\, ..., е„ и некоторых векторов из базиса аь ... ...,ап. и Видно, что дополнительное пространство Q строится с большим произволом. Оказывается, что существует конструкция, позволяющая этот произвол обойти (хотя бы и частично). Пусть '<? — произвольное подпространство линейного пространства У. Определение 3. Векторы х, у ^У называются сравни- сравнимыми по модулю ?Р, если х — у ^ 9*. В этом случае пишут Отношение сравнимости является, очевидно, отноше- отношением эквивалентности. Соответствующие классы сравни- сравнимых по модулю 0> векторов называются смежными клас- классами пространства У по подпространству 3*. Ясно, что класс, содержащий вектор х, состоит из всех векторов вида х -\- а, а ^ zP. Мы будем его обозначать символом х-\-?Р. Другое распространенное обозначение: х mod ^. Легко видеть, что сравнения можно складывать и умножать на числа, т. е. если и хх = у\ mod ^*, то х-\-Х\^у-\-ух mod & и 28
для любого числа ^sK. Действительно, если х — и хх—ухшР, то (* + *i) —dr + jri) = (* — Ух)<^9, и, аналогично, Аус — ky=k(x — у)^9. П Для смежных классов это означает, что формулы B) (х + 9) + (у + ?) = (* + у) + ^ и C) & (ж + 0") = kx + ?» корректно определяют их сумму и произведение на число. Непосредственная проверка показывает, что эти опе- операции удовлетворяют аксиомам линейного пространства. Таким образом, по отношению к операциям B) и C) множество всех смежных классов Т по 9 является ли- линейным пространством. Определение 4. Это пространство называется фактор- пространством пространства У по подпространству 9. Обозначается оно символом У'/?Р. В первом семестре в курсе алгебры аналогичная кон- конструкция была подробно изучена для случая групп и колец. Предложение 5. Каждое подпространство Q, допол- дополнительное к подпространству 9, изоморфно факторпро- странству Т/9. Доказательство. Рассмотрим отображение <р: Q-^-y/9, определенное формулой Ф(*) = * + ^, где x<=Q. Если ф(лс)== ф(дс]), т. е. х + 9 = Xi -4- 9, то х — xi e 9,' и, значит, х = х\. С другой стороны, любой вектор zs^y имеет вид х-\- у, где хе^, у е.9, и потому z -\- 9 = х -\- 9. Этим доказано, что отображение ф биек- биективно. Поскольку отображение ф, очевидно, сохраняет суммы и произведения на числа, оно является, следова- следовательно, изоморфизмом. ? Геометрический факт, лежащий в основе предложе- предложения 5, состоит в том, что каждый смежный класс по 9 имеет с Q ровно один общий вектор. Предложение 5 означает, что вместо дополнений Q мы можем рассматривать факторпространство У/9, конструкция которого никакого произвола не содержит. 29
Из предложения 5 вытекает, что D) dim TI& = dimT— dim 3>. Действительно, dim У/9> = dim Q = dim У — dim &. P Пусть У и W — два линейных пространства. Определение 5. Отображение <р: У-+Ж называется линейным отображением или гомоморфиз- гомоморфизмом (а также просто морфизмом) линейных пространств, если оно сохраняет линейные операции, т. е. если и Ф (kx) = kcp (х) для любых векторов х, у^У и любого числа k^K. Таким образом, отличие гомоморфизмов от изомор- изоморфизмов состоит только в том, что гомоморфизм не обя- обязан быть биективным отображением. Определение 6. Совокупность всех векторов х^У * переходящих при гомоморфизме <р в нуль пространства W, называется ядром гомоморфизма ер и обозначается символом Кег ф. Таким образом, Определение 7. Совокупность всех векторов из F, имеющих вид ф(х), х^У, называется образом гомо- гомоморфизма ф и обозначается символом Im ф: Иногда 1т ф обозначают также символом ц>(У) и назы- называют образом пространства У при гомоморфизме ф. Очевидно, что множества Кег ф и Im ф являются подпространствами (пространств У и Ж соответственно). Факторпространство W/lmtp обозначается символом Coker ф и называется коядром гомоморфизма ф. Гомоморфизм ф называется мономорфизмом, если он является инъективным отображением, т. е. если q>(x) — = ф(*1) при^л: ф Х\. Гомоморфизм ф называется эпиморфизмом, если он отображает У на Ж, т. е. если для любого вектора у<^Ж найдется такой вектор х е У, что у = гр(х). 30
Таким образом, гомоморфизм <р тогда и только тогда представляет собой изоморфизм, когда он является одновременно мономорфизмом и эпиморфизмом. По определению гомоморфизм <р тогда и только тогда является эпиморфизмом, когда Im ф = JF, т. е. когда Coker ф = 0. Аналогично, легко видеть, что гомоморфизм ф тогда и только тогда является мономорфизмом, когда Кег ф = = 0. Действительно, если ф(лс) = ц>(х\), то ф(лс— лг()=О, и потому х — xi <= Кег ф. Следовательно, если Кег ф = 0, то х = Х\. Обратно, если из ф(дс) = ф(.«1) следует, что х = xi, то, в частности, ф(лс)=О тогда и только тогда, когда х = 0. Следовательно, Кег ф = 0. ? Если Кег ф = 0, то ф, очевидно, представляет собой изоморфизм пространства У на подпространство Im ф сг сг Ж. Поэтому dim Im ф = dim У. Отсюда следует, что если Кег ф = Ои dim У = й\хп Ж, то гомоморфизм ф яв- является изоморфизмом. Действительно, тогда dim Im ф = = dim Ж, и, значит, 1тц> = Ж. П При Кег ф =?^ 0 целесообразно ввести в рассмотрение ф а ктор простр анство которое называется иногда кообразом гомоморфизма ф. Очевидно, что формула корректно определяет некоторый гомоморфизм называемый индуцированным гомоморфизмом, и, как нетрудно видеть, гомоморфизм ф' является изоморфиз- изоморфизмом факторпространства ^°/Кег ф на подпространство Im ф. В частности, мы видим, что для любого эпиморфизма ф: У-^-W пространство Ж изоморфно фактор простран- пространству У/К.&С ф. Кроме того, так как dim У/Кег ф = dim У—dim Кег ф, то для любого гомоморфизма ф: У—*-Ж имеет место формула E) dim Кег ф -+- dim Im ф = dim У. Все эти утверждения, за исключением формулы E), имеют весьма общий характер и справедливы, как мы 31
знаем из курса алгебры первого семестра, для любых групп и колец. Вернемся теперь к прямым суммам. Пусть $Р и Q — произвольные линейные пространства (над одним и тем же полем К). Рассмотрим множество У всех пар вида (х, у), где х <= 0*, y<=Q. Полагая (ж. У) + (*ь Ух) = (*+*i, У + 5fi> и &(#, y) = (kx, ky), мы, очевидно, превратим У в линейное пространство. Определение 8. Построенное пространство У назы- называется прямой суммой пространств 0* и Q (иногда — внешней прямой суммой, чтобы отличить ее от рассмот- рассмотренной выше «внутренней» прямой суммы, когда про- пространство У было задано заранее, а 9> и Q были его подпространствами). Эта терминология оправдывается тем, что векторы из У вида (х, 0), Х(=&>, составляют подпространство §*, изоморфное пространству ^, а векторы вида @, у), y^Q, — подпространство Q, изоморфное пространству Q. Кроме того, подпространства §* и Q дизъюнктны (имеют общим только нулевой вектор @, 0)) и в сумме составляют все У (ибо (х, у) = (х, 0)-|-@, у)). Таким образом, У = §>® Q. Обычно Ф отождествляют с ^, a. Q — с??и пишут У = &&Q (или У = 0* 4- Q) • К недоразумениям это не приводит. Конструкция внешней прямой суммы также встре- встречалась в курсе алгебры первого семестра применительно к случаю групп. По существу, ею же мы пользовались в первом семестре при построении комплексификаций. В следующей лекции мы рассмотрим конструкции, более специфичные для теории линейных пространств.
Лекция 4 Сопряженное пространство. — Двойственные простран- пространства. — Второе сопряженное пространство. — Преобразо- Преобразование сопряженного базиса и координат ковекторов. — Аннуляторы. — Пространство решений системы однород- однородных линейных уравнений. — Аннулятор аннулятора и аннуляторы прямых слагаемых. Пусть У— произвольное линейное пространство над полем К. Определение 1. Функция %:У^>-К называется линей- линейным функционалом, если она является гомоморфизмом линейных пространств, т. е. если и для любых векторов х, у(=У и любого числа k <= К. Ли- Линейные функционалы называются также ковекторами пространства У. Непосредственная проверка показывает, что сумма | +1| двух линейных функционалов % я ц (определяемая формулой (%-\-ц) (х) = ?,(х) + ц(х)) и произведение k\ линейного функционала % на произвольное число k (определяемое формулой (&§) {х) = k\(x)) являются ли- линейными функционалами. Это означает, что множество всех линейных функционалов представляет собой под- подпространство пространства всех функций на У и, зна- значит, само является линейным пространством. Это линей- линейное пространство обозначается символом Т^(У) или У. Определение 2. Линейное пространство У" называет- называется пространством, сопряженным пространству У. Пусть е\, ..., еп — произвольный базис простран- пространства У. Предложение 1. Значение %(х) произвольного линей- линейного функционала. % на векторе х = ххв\ -]-...-{- хпеп выражается формулой A) !(*) =?!**+ ••• +1пхп, где B) I, =!(*,). .... 1п = 1{еп). 2 1Л. 1Л. Постников, сем. И 33
Для любых чисел |ь •••» ?л s К формула A) однознач- однозначно задает некоторый линейный функционал % е У", для которого имеет место B). Доказательство. Формула A) непосредственно вытекает из свойства линейности: ? (ж) = &(*'«!+ ••• +хяеа) = = х1Ъ(е1)+ ... + x"Z(ea) = llx1 + ... + ?„*«. Обратно, если функционал § задан формулой A), то и 1 (**) = ?, (А:^1) + ...-+?« (^") = — A(g^1 -4- ... +lax») дтя любых векторов л:, у^У'и любого числа k^K. Кроме того, ?(<?,-)= gr0 + ... +g/-l+ ... +gn.0 = = It. п Из предложения 1 вытекает, что формула 0, если 1Ф\, . . 1, если i = j, l' /=1"-" »• однозначно определяет /г линейных функционалов C) в1, .... в". Ясно, что для любого вектора х <= У е'(х) — хг, i=\, .... п. Предложение 2. Функционалы, C) составляют базис пространства У"'. Координатами произвольного функ- функционала !• в этом базисе являются коэффициенты B) его представления A): D) ё = ?,«1+ ... +5„е". Доказательство. Для любого вектора х = = -v'ei -f- ••• +¦*"?« и любых чисел |ь .--i ^л^К мы имеем Следовательно, если %и •••» ^п — коэффициенты B) функционала |, то (gie! -f: ... + g«e") (х) = ^(л:) длл 34
любого вектора х е У. Это доказывает формулу D) и полноту семейства е1, ..., еп в У. С другой стороны, если то для любого i = 1, ..., п Следовательно, семейство е1, .... еп линейно независимо и, значит, является базисом. ? Следствие. dim У = dim У. Базис е1, ..., еп называется сопряженным базису ех, ..., еп. В обозначениях Эйнштейна формула A) имеет вид а формула D) — вид В дальнейшем мы будем писать подобного рода формулы без каких-либо оговорок. Пусть У и W — два линейных пространства над по- полем К. Предположим, что любым двум векторам х <= Ж, у ^Ж сопоставлено такое число <#, у> е К, что выпол- выполнены следующие условия: а) для каждого фиксированного у<^.Ж функция х\—s* <лг, уУ является линейным функционалом на У, т. е. <*i + *2> У) = <*i. У) + (х2, у), (kx, y)=k (х, у) для любых векторов хи Х2, х^У и любого числа k ^ К; б) для каждого фиксированного х <= У функция у\—>(.х,у} является линейным функционалом на W, т. е. (х, Ух + у2) = (х, у!> 4- (х, у2), (х, ky) = k(x, у) для любых векторов у\, у2, у ^ W и любого числа k <= К; в) для каждого вектора л:<= "У существует такой век- вектор у <= Ж, что (х, уУ Ф 0, и, наоборот, для каждого вектора у^W существует такой вектор х^У, что <х, у} Ф 0. 2* 35
Условия а) и б) называются условиями билиней- билинейности, а условие в)—условием невырожденно- невырожденности. Определение 3. Функция х, у>—><х, у}, удовлетворяю- удовлетворяющая условиям а), б) ив), называется спариванием между пространствами У и Ж. Пространства У и W, для которых существует хотя бы одно спаривание, на- называются двойственными. Обозначение: У\Ж. Заметим, что отношение двойственности, очевидно, симметрично, т. е. если У\Ж, то Ж\У. Предложение 3. Линейное пространство У двойст- двойственно сопряженному пространству У: У\У. Доказательство. Для любых х^У и %^У положим (х, 1) = %(х). Очевидно, что условия билинейности а) и б) выполнены (например, <х, ?, + fe> = (|i + Ь) (*) = Ь (*) + Ы*) = = (,х, li> + <д:, ^2>). Неравенство % Ф 0 означает, что существует такой вектор х^У, что %{х)Ф0. Следова- Следовательно, <л:, 1> ^ 0. Аналогично, неравенство х Ф 0 озна- означает, что х*° Ф 0 хотя бы для одного /о, и поэтому при §=е'° имеем (х, §) = |(л:) = х{" Ф 0. Таким образом, условие в) также выполнено. О Обратное утверждение верно в следующей формули- формулировке: Предложение 4. Если пространства У и Ж двойствен- двойственны, то каждое из них изоморфно пространству, сопря- сопряженному с другим: У «У, W «* У. Доказательство. В силу симметричности отно- отношения двойственности достаточно доказать только первый из этих изоморфизмов. Пусть х <= У. Согласно условию б) функция у\—> (.х, у} является линейным функ- функционалом на Ж, т. е. вектором пространства Ж'. Обо- Обозначая этот линейный функционал символом <р(х), мы, следовательно, получим некоторое отображение Таким образом, по определению Ф (*) (У) = <*» У>- 36
Поэтому, в силу условия а), Ф (ж 1 4- х2) (у) = <*i + х2, у) = = (х1г у> + <х2, у) = Ф (ж, т. е. Ф (ж, + х2) = ф (дг() + Ф («а)- Аналогично, ф (Л*) (У) = <?*. y) = k(x, У) = kq> (x) (у), т. е. Этим доказано, что отображение ф является гомомор- гомоморфизмом. Если ф(х)=0, то <jk, у} = 0 для всех у <=2Г, и, зна- значит (условие в)), х = 0. Таким образом, Кегф = 0. По- Поэтому Imф « f, и, значит, dim^° = dim 1тф ^ dimW. Но в силу симметричности отношения двойственно- двойственности, если имеет место неравенство dim^" ^ &\тЖ, то должно иметь место и неравенство d\m7f s^ <ИтУ. Сле- Следовательно, А\тУ = diraW, и потому, в частности, dim 1тф = dim Ж1, т. е. lmq> = W*. Это доказывает, что гомоморфизм ф является изоморфизмом. О Так как F|F', то, в частности, Т « (Т')'. Этот ре- результат настолько важен, что заслуживает звания тео- теоремы: Теорема 1. Пространство {У")', сопряженное сопря- сопряженному, изоморфно исходному пространству. (ТУ я» Т. а В явном виде изоморфизм У-+(У")' задается соот- соответствием, сопоставляющим вектору х е У функционал х на У", определенный формулой *A) = !(*), 6еГ. Как правило, функционал х отождествляется с векто- вектором дс и потому, в частности, обозначается просто через х. На первый взгляд теорема 1 представляется три- тривиальным следствием того факта, что пространства У и (У")' имеют одинаковую размерность. На самом же деле ее фактическое содержание состоит в том, что между пространствами^* и (У)' имеется «естественный» 37
изоморфизм У-*~'(У")', строящийся без какого бы то ни было произвола. Именно этот факт и позволяет отождествлять х с х (и, значит, (У9')' с Пространства У и У также имеют одну и ту же раз- размерность, но никакого естественного изоморфизма меж- между ними в общем случае установить нельзя. В нашем распоряжении пока нет необходимых для доказатель- доказательства этого утверждения понятий (например, у нас нет аккуратного определения, что такое «естественный» изо- изоморфизм), и потому мы вынуждены ограничиться дока- доказательством того, что самая, казалось бы, простая и ес- естественная попытка построить такой изоморфизм к цели не приводит. Пусть в\, ..., еп — произвольный базис пространства У, а е1, ..., еп — сопряженный базис пространства У. Можно пытаться рассмотреть изоморфизм У-+У", дей- действующий по равенству координат в этих двух базисах (этот изоморфизм каждому вектору х = xle\ -j- ... ... -J- хпеп сопоставляет ковектор | = х1е1 -{- ... -f- xnen, имеющий в базисе е1, ..., еп те же координаты, что и вектор х в базисе е\, ..., еп), в надежде, что он ока- окажется не зависящим от базиса еь ..., еп (и потому «естественным»). Однако эта надежда не оправды- оправдывается. Чтобы показать это, необходимо рассмотреть в об- общем виде вопрос о преобразовании координат ковекто- ров при замене базиса е\ъ ..., еп- Мы проведем соответствующие вычисления в обсзна- .чениях Эйнштейна. Для этого целесообразно ввести так называемый символ Кронекера Ь\, определяемый фор- формулой 0, если i ф /, 1, если i = j. Основное свойство этого символа выражается форму- формулами (действительно, в левых суммах все члены равны нулю, кроме, соответственно, членов а!-\ = ai и Ъг\ = Ы). С помощью символа Кронекера определяющее свойство сопряженного базиса записывается единой 38
формулой: e Аналогично, тот факт, что матрицы ||с*'| и |с|,| ваа- имно обратны, может быть записан в двух равносиль- равносильных видах: ri'ri A/ ri'ri Хг' Имея все это в виду, рассмотрим, наряду с базисом ev ..-, еп, другой базис ev, ..., еп„ для которого где C==flcM—матрица перехода, а С~1 = |сГ|—обратная матрица. Тогда, как мы знаем (см. лекцию 1.6), для координат х1 и х1' векторов будут иметь место формулы Пусть теперь еу, ..., еп' — базис, сопряженный с ба- базисом ev, ..., еп,. Тогда, по определению, ег (в|/) = б/;. Следовательно, Но, согласно предложению 2, для любого ковектора \^У". Поэтому, в частности, и, значит, е1 = с\,е1' (последнюю формулу можно написать либо по симмет- симметрии, либо получить выкладкой: с\,е1' = с\,с*{'е1 = б*е! = е1). Аналогично, для координат ii = g(ej) и ^,=|(е.) произвольного ковектора !• имеем т. е.
и — по симметрии (или той же выкладкой) — Мы видим, что ковекторы сопряженного базиса пре- преобразуются как координаты векторов и, соответственно, координаты ковекторов — как векторы базиса. Принято называть преобразование базиса когреди- ентным, а преобразование координат векторов (т. е. пре- преобразование с обратной и транспонированной матрицей) контрагредиентным. Таким образом, сопряженные ба- базисы преобразуются контрагредиент но, а координаты ковекторов — когредиентно. Поэтому, если в одном каком-нибудь базисе (и ему сопряженном) вектор х и ковектор % имели одинаковые координаты, то в другом базисе — из-за того, что коор- координаты векторов и ковекторов преобразуются по разным формулам, — вектор х и ковектор "ё, будут иметь различ- различные координаты. Следовательно, отображение по равен- равенству координат в сопряженных базисах зависит от ба- базиса и никакой естественностью не обладает. Пусть SczW— произвольное подмножество линей- линейного пространства У. Определение 4. Совокупность всех линейных функ- функционалов %<= У", равных нулю на любом векторе «sS, называется аннулятором множества S и обозначается символом Ann S или S°. Таким образом, Ann S = {| е= :Г"; g(jc) = O для любого х «eeS}. , Очевидно, что S° является подпространством про- пространства У". При этом, если S cz T, то S°Z) T°. Предложение 5. Аннулятор произвольного множества S с^У совпадает с аннулятором его линейной оболочки: = Ann[S]. Доказательство. Так как S с: [S], то 5°zd[S]°. Обратно, пусть % <= S°. Тогда для любого вектора &i*i + ... 4- kmxm из [S], где хи ..., xm <= S, будет иметь место равенство так как |(jd)=O, ..., %(xm) — 0. Следовательно, e[S]°,T.e.S°c[S]0. a 40
Согласно этому предложению при рассмотрении аннуляторов можно ограничиваться подпространствами. Ясно, что Ann О = У" и, наоборот, если Ann S = У, то S = {0} (ибо если |(х) = 0 для всех|е^', то х=0). Аналогично, Апп>° = 0 и если Ann 5=0, то [S] =¦ = У. Действительно, если \Е>\ФУ и если еи ..., еп — такой базис пространства У, что [5] = [еь ..., ет\, т<л,тоеле [S]°, и потому S° ф 0. ? Предложение 6. Для любого подпространства 0* а У имеет место равенство dim &° = n— dim &. Доказательство. Пусть dim ^» = р и пусть е\, ..., ер, .... е„ — такой базис пространства У, что 0> = [е\, ..., ер]. Рассмотрим сопряженный базис Если ! < р и / > р, то заведомо i=^=/, и потому в.'(в*) =0. Следовательно, еР+х, ..., еле[еь .... ер\°==911Р. С дру- другой стороны, если %,^&°, то |(ei)=0, ..., |(ер)=0, и, значит, ^ = |р-н<?р+1 + - • • + Еяв". Этим доказано, что ковекторы ep+l, ..., еп образуют базис подпространства 9**. Следовательно, dim 9** — — п — р. О Поскольку (теорема 1) У — (У)', во всем сказан- сказанном выше У можно заменить на У, а У" — па У. В част- частности, для любого множества S czy будет определено подпространство AnnS czy, состоящее из таких векто- векторов х&У, что дг(|)=О (т. е. |(л:)=0) для любого ковектора |eS, и размерность этого подпространства будет равна п — г, где г — размерность подпространства [S], т. е. ранг множества S. Таким образом, во-первых, подпространства про- пространства У можно задавать не только как линейные оболочки, но и «двойственным» образом, как аннуля- торы множеств ковекторов S= {1Ь ...t %m}, т. е. урав- уравнениями вида E) 6i(*) = 0, .... |m(*) = 0. Во-вторых, мы имеем эффективный способ вычисле- вычисления размерности заданного таким способом подпро- подпространства: она равна п — г, где г — ранг множества •-> == {felt • • • » §»!/• 41
Целесообразно переформулировать все это в терми- терминах координат. Ковекторы ii, ..., |m в координатах записываются (предложение 1) линейными формами от х1, ..., хп. По- Поэтому уравнения E) приобретают в координатах вид аих1 -Ь ... +а1пхп — О, F) т. е. представляют собой обыкновенные линейные одно- однородные уравнения. Поскольку ранг г множества (или —лучше сказать — семейства) ковекторов ii, ..., |m равен рангу матрицы коэффициентов (?) Iе" v:ai: II О-т\ • • • О.тп этих уравнений, мы получаем, таким образом, следую- следующую теорему: Теорема 2. Множество всех решений (х1, ..., хп) си- системы F) однородных линейных уравнений является подпространством пространства Кп размерности п — г, где г — ранг матрицы коэффициентов G). ? Чтобы найти базис этого подпространства, т. е. п — г линейно независимых решений (которые называются обычно фундаментальной системой решений), нужно, решая систему F) способом, указанным в лекции 2, придавать п — г «свободным» неизвестным п — г набо- наборов значений, следя за тем, чтобы получались линейно независимые решения. Для этого достаточно указанные наборы выбрать так, чтобы, расположенные в квадрат- квадратную матрицу порядка п — г, они составляли бы невы- невырожденную матрицу (проще всего их выбирать так, чтобы получилась единичная матрица). Тот факт, что аннуляторы определены и для подмно- подмножеств пространства У", позволяет говорить об аннуля- торе аннулятора Ann Ann S = S°° произвольного подмножества Scf. Предложение 7. Для любого подпространства имеет место равенство 42
Доказательство. Если х<^&, то 1(дс) = О для любого g s 0**, т. е. х A) = 0. Это означает, что х s &** Таким образом, 5е»00 с= 5е», и. значит, ^°° = 9>, ибо dim ^°° = п — dim 9^ = п — {п — dim ^*) = dim 5е*. ? Если же 5 — произвольное множество, то, очевидно, [ [) Предложение 8. Если Т = 9> Ф Q, то Т' = 9аР@СГ- При этом 0» та Q' и Q° « 9». Доказательство. Пусть длхпд* = р и d\mQ=q. Тогда р-\- q — п и &{\Q == 0. Поэтому dim^° -j- + dim^>o = (n — р)-\-(п — q)=n. Кроме того, если is е/'П ^°. то | (х) = 0 для любого «е^и |(#) = 0 Для любого y<^Q. Поэтому 1(ж + у) = 0, и, значит, i(z) = 0 для любого ге7. Следовательно, | == 0, т. е. 0"° ПСГ = = 0. Этим доказано (см. следствие из предложения 3 лекции 3), что Г = /Ф<Т- Отнесем теперь каждому линейному функционалу ? е 5*° его ограничение на подпространстве ??. Тем самым мы получим некото- некоторое отображение ii—^-i7 пространства 9** в пространство Q', очевидно линейное (являющееся гомоморфизмом). Его ядро состоит из всех функционалов 1^^°, для ко- которых \\Q — 0, т. е. таких, что i e С?°. Но, по доказан- доказанному, 0** П Q° = 0- Следовательно, отображение iv—*-|' является мономорфизмом. Пусть г] ^ Q''. Определим на ^° функционал 1, пола- полагая для любого вектора вида х-\-у, где х^.0>, y<=Q, Ч (У)- Ясно, что функционал | корректно определен, линеен, принадлежит ^° и |' = щ. Этим доказано, что отображе- отображение gi—•»¦ ?' является изоморфизмом. Изоморфизм ^° л? 5е" доказывается аналогично, о Заметим, что изоморфизмы предложения 8 «есте- «естественны».
Лекция 5 Билинейные функционалы. — Корреляции. — Невырож- Невырожденные билинейные функционалы. — Пространства со скалярным умножением. — Теорема об изоморфизме. — Метрические коэффициенты и взаимные базисы. — Про- Пространство билинейных функционалов. — Билинейные функционалы от ковекторов. — Смешанные билинейные функционалы. Определение 1. Функция В: х, у —*¦ В (х, у)<= К двух векторных аргументов х, у <^.У называется билинейным функционалом на У, если при каждом фиксированном значении одного аргумента она является линейным функционалом от другого, т. е. если В (*i + х2, у) = В (хи у) + В (х2, у), В (kx, у) = kB (x, у) и В (х, ух +у2) = В (х, ух) + В (х, у2), В (х, ky) = kB (x, у) для любых векторов хи х2, х, уи у2, у е Т и любого числа k<= К. Пусть ех, ..., еп — произвольный базис пространства У. Полагая A) ьи = В(е{, es), мы получим для любых двух векторов х = x'ei и у = = у'е/ равенство В {х, у) = В(еи е,)х'у/ = Ьпх1у1. Этим доказано, что В (х, у) = Ьцх'у/ = B) + &2,*V+ ... +b2nx2y ...+bnlxnyl 44
Как мы знаем (см. лекцию 1.12), стоящее справа алгеб- алгебраическое выражение называется билинейной формой от х1, ..., хп и у1, ..., уп. Таким образом, любой билиней- билинейный функционал выражается в координатах билинейной формой с коэффициентами A) (которые для сокращения формулировок называются коэффициентами функцио- функционала В). Обратно, легко видеть, что любая билинейная форма задает (по формуле B)) некоторый билинейный функционал. Следовательно, между билинейными функ- функционалами и билинейными формами имеется (при за- заданном базисе!) биективное соответствие. Коэффициенты A) билинейного функционала В со- составляют матрицу П Ьц ... bin II C) В = \\ , II bni ... bnn У которая называется матрицей билинейного функционала В (в данном базисе). С помощью матрицы C) формула B) записывается в виде В(х, у) = XхBy, где, как всегда, — столбцы координат векторов х и у. Если от базиса еи ..., еп мы перейдем к базису е,„ ..., еп, и если то для коэффициентов bv^ функционала В в базисе ех„ ..., еп, будет иметь место формула D) bir = c\fi\btp поскольку в силу линейности В(е{„ ег) = ?(ф^, a/,ei)==c1./cf,B(ei, e,). В матричной записи эта формула имеет вид E) В'=СТВС, где ?-|fr<y|. 5' = IVII и С = И4 45
Поскольку матрица С невырождена, из формулы E) следует — в силу предложения 2 лекции 2,— что матрицы В и В' имеют один и тот же ранг. Определение 2. Ранг г матрицы C) называется ран- рангом билинейного функционала В. В силу только что сделанного замечания это опреде- определение корректно. Для любого вектора у ^У функционал 1У: жн>В (х, у), очевидно, линеен, т. е. является ковектором. Определение 3. Говорят, что ковектор %у ассоцииро- ассоциирован с функционалом В. Ясно, что отображение фв: yv—>§y пространства У в пространство У линейно, т. е. является гомоморфиз- гомоморфизмом. Оно называется корреляцией, отвечающей функ- функционалу В. Так как для любого гомоморфизма ср: У'—»-У" фор- формула В (х, у) = q> (у) (*), х, у ее У, определяет на У билинейный функционал В, для кото- которого фВ = Ф, то соответствие В >—> срв между билиней- билинейными функционалами на У и гомоморфизмами у-*-У биективно. Ядро Кегфв корреляции ц>в называется ядром (или нуль-пространством) функционала В. Оно состоит из таких векторов у <= У, что В (х, у) = 0 для любого век- вектора х^У. Предложение 1. Размерность нуль-пространства Кег фв выражается формулой dim Ker q>B = п — г, где г—ранг функционала В. Доказательство. В произвольном базисе е\, ... .... еп пространства У векторы из Кег фВ характери- характеризуются как векторы у = yfe/, для которых Ьцх1у1 = О тождественно по х1, 1 =sC i =gC n, и потому F) Ьцу1 = 0 для любого i = 1, ..., п. Это означает, что координатный изоморфизм У-*-Кп, отвечающий базису ег, ..., еп, отображает подпростран- подпространство Кегфв на подпространство решений системы одно- однородных уравнений F). Для завершения доказательства 46
остается заметить, что, согласно теореме 2 лекции 4., размерность последнего подпространства равна п— л, где г — ранг матрицы ||6,7||. ? Билинейный функционал В называется невырожден- невырожденным, если г = п. Следствие 1. Функционал В тогда и только тогда не- невырожден, когда отображение срв: У-^-Уг является изо- изоморфизмом. Доказательство. Согласно предложению 1 функционал В тогда и только тогда невырожден, когда Кег фВ — 0, и, значит, — поскольку dim У = dim У, — когда гомоморфизм фВ является изоморфизмом. ? Следствие 2. Функционал В тогда и только тогда не- невырожден, когда для любого вектора у0 ф О существует такой вектор дс0 Ф О, что В (х0, »о) ^ °- Доказательство. Если функционал В невырож- невырожден, и, значит, отображение фВ является изоморфизмом, то для любого отличного от нуля вектора у0 ковектор | =.фв(^й) также отличен от нуля. Поэтому существует такой вектор х0, что 1_у0 (х0) ф О, т. е. В (х0, уо)фО. Обратно, существование вектора х0 означает, что |уо ф о и, значит, что фв(#о)=т^О. Таким образом, Кег фв == 0, и потому функционал В невырожден. ? Замечание 1. Легко в-идеть, что в следствии 2 векторы х0 и у0 играют симметричные роли, т. е. функ- функционал В тогда и только тогда невырожден, когда для любого вектора хо ф 0 существует такой вектор уо ф О, что В (дсо, Уо) Ф 0. Определение 4. Линейное пространство У с задан- заданным на нем билинейным функционалом G называется пространством со скалярным умножением. Подчеркнем, что в этом определении на основное поле К никаких ограничений не накладывается. Значение G (х, у) функционала G на векторах х и у называется скалярным произведением этих векторов и обычно обозначается символом (х,у). Если (х,^)=0, то векторы х и у называются ортогональными (или, бо- более точно, — G-ортогональными). Примером пространства со скалярным умножением (над полем R) является- произвольное евклидово про- пространство (см. определение 3 лекции I. 12). 47
Согласно определению 6 лекции I. 13 линейное биек- биективное отображение ср: У-^Ж пространств со скаляр- скалярным умножением называется изоморфизмом (употреб- (употребляется также термин изометрия), если оно сохраняет скалярные произведения, т. е. если (Ф*> 4>у) — (*» У) для любых векторов х, у е У. Заметим, что в пространстве со скалярным умноже- умножением отличный от нуля вектор х вполне может быть ортогонален самому себе, т. е. для него будет иметь место равенство (х, х) = 0. Такие векторы называются изотропными. Билинейный функционал В называется симметриче- симметрическим, если В (у, х) = В(х,у) для любых векторов х, у е У, и кососимметрическим, если В (у, х) = =*—В(х,у). Ясно, что в пространстве с симметричным или ко- сосимметричным скалярным умножением G отноше- отношение ортогональности симметрично: если (х, у) = 0, то (у,х) = 0. Пусть S — произвольное подмножество простран- пространства У с симметричным или кососимметричным скаляр- скалярным умножением. Определение 5. Ортогональным дополнением под- подмножества 5 называется множество S-1- всех векторов из У, ортогональных каждому вектору из S: Sx = {yeT; (х, у) = 0 для любого *<=S}- Свойства ортогональных дополнений аналогичны свойствам аннуляторов. Например, ясно, что а) ортогональное дополнение любого множества яв- является подпространством; б) если S<=zT, то Sx zd Tx; в) (ср. предложение 5 лекции 4) ортогональное до- дополнение произвольного множества S совпадает с орто- ортогональным дополнением его линейной оболочки: г) если S является нулевым подпространством {0}, то SJ- = Т. Однако — в отличие от аннулятора — ортогональное дополнение Ух всего пространства У может не совпа- совпадать с подпространством {0}. Действительно, это орто- 48
тональное дополнение состоит из векторов уа е У, обла- обладающих тем свойством, что (х, у0) = 0 для любого век- вектора х^У, т. е. является не чем иным, как нуль-про- нуль-пространством билинейного функционала G. Значит, со- согласно следствию 1 из предложения 1 равенство Ух = = {0} имеет место тогда и только тогда, когда скаляр- скалярное умножение в У невыроокдено. Замечание 2. Вообще, согласно предложению 1 ранг функционала G равен п — dim У-1. Как правило, в линейной алгебре рассматривают лишь невырожденные скалярные умножения, хотя имеются и содержательные примеры пространств с вы- вырожденным умножением. Пример 1. Рассмотрим на плоскости с координа- координатами х, t скалярное умножение с матрицей о о 0 1 Изометрии этого пространства на себя задаются, как легко видеть, формулами х' = ах + bt, Изометрии, сохраняющие ориентацию оси t (т. е. такие, что f = t) и обладающие свойством унимодуляр- ности (т. е. такие, что а = 1), имеют, следовательно, вид х' = х — о/, G) ,,_, / — I, где положено v — —6. Поскольку преобразование G) является известным из механики преобразованием Гали- Галилея, описывающим связь между координатами мате- материальной точки в двух инерциальных системах отсчета, движущихся друг относительно друга со скоростью v, отсюда следует, что геометрия нашего пространства яв- является (по крайней мере, в отношении свойств, инва- инвариантных относительно преобразований вида G)) пере- переложением на геометрический язык кинематики точки (на этом основании рассматриваемая геометрия назы- называется обычно геометрией Галилея). Таким образом, занимаясь кинематикой, мы факти- фактически занимаемся геометрией некоторого пространства (для кинематики точек в трехмерном пространстве — 49
четырехмерного) с вырожденным скалярным умноже- умножением! Основное свойство пространств с невырожденным ска- скалярным умножением указывается следующей теоремой. Теорема 1. Каждое пространство У с невырожденным скалярным умножением естественно изоморфно своему сопряженному пространству: (8) У -^> У. Доказательство. Изоморфизмом (8) будет кор- корреляция ср: У —*-У, соответствующая скалярному умно- умножению, т. е. отображение, сопоставляющее вектору у е У ковектор 1_у, определенный формулой 1у (*) — (*. #)> где х — произвольный вектор пространства У. ? По определению для любого множества S azy анну- лятор S° cz У состоит из таких ковекторов § е У, что !(*) == 0 для каждого вектора ^eS, а ортогональное дополнение S-1 — из таких векторов у ^У, что (х, у) =0 для каждого вектора xeS. Поскольку %у(х) = (х, у), это доказывает, что изоморфизм (8) отображает под* пространство S-1 на подпространство S°. Это объясняет отмеченный выше параллелизм между аннуляторами и ортогональными дополнениями. Кроме того, из предложения 6 лекции 4 теперь сле- следует, что в любом пространстве У с невырожденным скалярным умножением для каждого подпространства & имеет место формула (9) dim ^*J- = n — dim ^*, где, как всегда, п = dim У. При этом A0) ^)ii=^ (ср. предложение 7 лекции 4). Действительно, ясно, что g>\.i. cz<py а, согласно формуле (9), /z — dim 33-1-= dim 33. ? Из формулы (9) вытекает, что если ^)П^эх==0, то y° — g>Qgi±. Так как каждый вектор из 5е* П^-1- изо- изотропен, то, следовательно, если в пространстве У нет отличных от нуля изотропных векторов, то A1) У = ^ 50
В частности, равенство A1) имеет место, если простран- пространство У евклидово. Замечание 3. Равенство A1) для евклидовых пространств можно доказать, не пользуясь — по край- крайней мере явно — изоморфизмом (8) (что даст другое доказательство равенства (9), а потому и равенства A0)). Действительно, поскольку в евклидовом простран- пространстве 5е* Л ^ = 0, достаточно доказать, что У — 9* + ?3-L, т. е. что каждый вектор х е У допускает представление х = х' + х"> х' е= 9>, х" <= &*-. Имея это в виду, мы положим х1 = ххе\ + ... -+- хрер, где ей ..., ер— произвольный ортонормированный ба- базис подпространства 9>, а х\, ..., хр — коэффициенты Фурье (см. определение 2 лекции 1.13) вектора х отно- относительно базиса в\, ..., ер (рассматриваемого как орто- нормированное семейство векторов в У). Согласно пред- предложению 2 лекции 1.13 вектор х" = х — х' ортогонален всем векторам е\, ..., ер, и, значит, принадлежит под- подпространству 9iX-. Следовательно, х = х' + х"', где х' е^3, X" (&1 П Скалярное умножение, заданное на пространстве У, мы посредством изоморфизма (8) можем перенести в пространство У. Это означает, что мы определяем в У скалярное умножение, полагая для любых ковекторов (i. ч) = (ж, у). где х, у — такие векторы из У, что 1^ = 1 и %у = ц. Иначе говоря, (I, Ц) = Ц (*), если 1 = %х. Пусть в\, ..., еп — произвольный базис пространства с невырожденным скалярным умножением. По аналогии со случаем евклидова пространства (см. лекцию I. 12) числа 8ц = (ei> ei) называются метрическими коэффициентами базиса еь ..., е„. Они составляют матрицу являющуюся не чем иным, как матрицей функциона- функционала С? в базисе еи ..., еп. 51
Аналогично определяется матрица метрических коэффициентов gi'={ei,el) сопряженного базиса е1, ..., еп. Чтобы установить связь между матрицами G и G', удобно отождествить пространства У и У посредством изоморфизма (8). Тогда базис е\ ..., еп превратится в базис пространства У (в этом качестве базис е1, ..., еп называется обычно базисом пространства У взаимным базису е\, ..., еп), и для его векторов будут иметь место формулы вида el /"•*/р / * 1 п где с1! — некоторые числа (элементы основного поля К), Но, так как согласно определению (е1, е') = в' (е1) (где справа е' рассматривается как ковектор), то gn = (е«, е') == cikei (ek) = cik&k = с«. Этим доказано, что матрица G' совпадает с матрицей С=||с'Л| перехода от базиса е\, ..., еп к взаимному ба- базису е1, ..., еп (откуда, в частности, следует, что мат- матрица С симметрична). Но согласно общей формуле E) Gf = CTGC (см. также формулу A9) лекции 1.12). Поэтому G' = = G'GG', и, значит, G' — G~x. Таким образом, матрицей G' =||g'7II метрических коэффициентов взаимного (со- (сопряженного) базиса является матрица G~x, обратная матрице G —\\gij\\ метрических коэффициентов исход- исходного базиса. Для евклидова пространства У отсюда, в частности, следует, что базис еи ..., еп тогда и'только тогда орто- нормирован, когда он совпадает с взаимным базисом. Ясно, что в произвольном линейном пространстве У сумма двух билинейных функционалов и произведение билинейного функционала на число (элемент поля К) яв- являются билинейными функционалами. Это означает, что совокупность Тг (У°) всех билинейных функционалов на пространстве У является линейным пространством. 62
Симметрические билинейные функционалы состав- составляют подпространство S2(^) пространства TziT), а ко- сосимметрические — подпространство Д2(^). Если ха- характеристика char К основного поля К равна двум, то S2 {Г) = Л2 СП; в противном же случае S2 ОН П Л2 (У) = = 0. Более того, легко видеть, что если char К ф 2, то т. е. любой билинейный функционал единственным обра- образом представляется в виде суммы кососимметрического и симметрического функционалов: A2) В = Всиы -Ь Вкос, где Всиы — симметрический, а Вкос — кососимметрический функционалы. Действительно, если представление A2) существует, то В (х, у) = ?сим (х, у) + Вкос (х, у) и В (у, х) = Всям (х, у) — Вкос (х, у) для любых векторов х и у. Поэтому Я (Х ,л — В (х, у) + В (у, х) ?>сим \х> У) — 2 ' 2 В{Х'У) что доказывает единственность функционалов Всам и Вкос. Обратно, ясно, что функционалы Бсим и Бкос, опре- определенные формулами A3), обладают требуемыми сим- метриями и удовлетворяют соотношению A2). ? При сложении билинейных функционалов их матрицы складываются, а при умножении билинейного функцио- функционала на число его матрица умножается на то же число. Это означает, что соответствие, сопоставляющее били- билинейному функционалу его матрицу, представляет собой изоморфизм линейного пространства Т2 (У°) на линейное пространство квадратных матриц порядка п. Пусть |, ц ^ Tj {T) — два линейных функционала. Ясно, что формула определяет некоторый билинейный функционал % ® ц. Определение 6. Функционал % ® ц называется тензор- тензорным произведением функционалов | и ц. 53
Рассмотрим, в частности, тензорные произведения е1 <8> е< ковекторов сопряженного базиса. Так как el(x) = = х1 и е> (у) —у>, то Поэтому для функционала В' = Ьц (е1 <8> е') имеет место формула A4) В' (ж, у) = Ъц {el ® el) (ж, у) = ft,y*V. В частности, B'(ei, е,) = &(/, откуда следует, что билиней- билинейные функционалы е'<8>е>, i, / = 1, .... /г, линейно неза- независимы (если В' = 0, то Ьц = 0). Кроме того, если мы возьмем произвольный функционал В ^ Тг (У) и по его коэффициентам Ьц составим функционал В', то, согласно формуле A4), будет иметь место равенство В' — В. Этим доказано следующее предложение: Предложение 2. Тензорные произведения el <®e', i, /=1, . . ., п, векторов сопряженного базиса составляют базис линей- линейного пространства ТчСУ). Координатами произвольного билинейного функционала В ^ Т2 (У) в этом базисе яв- являются его коэффициенты Ьц: B = bijei<&ei. ? В частности, мы видим, что где, как всегда п = dim У. Совершенно аналогично определяются и изучаются билинейные функционалы В: %, щ—>5(|, ц) от ковекто- ковекторов %, ц^ У. Единственное изменение состоит в поло- положении индексов. Значения каждого такого функционала выражаются формулой в а, ц)=ь*%г1,, где &'' = В (е1, е'), а |,- = % (е,-) и гц = ц (е,) — координаты ковекторов % и ц. Для другого базиса ег, = с!,е.мы имеем bt'r==ct'c^b4m Билинейные функционалы от ковекторов составляют линейное пространство размерности п2. 54
Тензорным произведением х®у векторов х и у на- называется функционал из Т2(У), определяемый формулой Тензорные произведения вида в,-<8>е/? i, j=l, ..., п, составляют базис пространства Т2^), причем для любого функционала В<=Т2(У°). Замечание 4. Можно рассматривать билинейные функционалы, аргументы которых принадлежат различ- различным линейным пространствам. (Такими функционалами, являются, например, введенные в лекции 4 спаривания.) В частности, для любых двух линейных пространств У: и Ж мы можем ввести в рассмотрение билинейные функ- функционалы от ковекторов над Т и Ж. Такого рода функ- функционалы составляют линейное пространство, которое обозначается символом Т <S> W и называется тензорным, произведением линейных пространств У и W. Если е\, ..., еп — базис пространства Т, a f\, ...,fm — базис пространства W, то (очевидным образом определяемые) функционалы е( <8> f,, I ^ i ^ п, 1 ^ / ^ пг, составляют базис пространства Т <S> W, т. е. любой элемент этого пространства единственным образом представляется в виде суммы bllet ®fj, i = 1 ,...,«,/= 1, . .., m* Таким образом, в этих обозначениях Т2 (Т) = Т ® Т и Т2 {Т) = Т' ®Т' (во второй формуле мы воспользовались отождествле- отождествлением {Т')'=Т). Впрочем, произведение У® Ж при Т ФЖ нам в этом семестре не понадобится. Можно рассматривать также билинейные функцио- функционалы В: х, один аргумент которых является вектором х^У, а дру- другой — ковектором % е У". Такие функционалы мы будем называть смешанными. Они также образуют /г2-мерное линейное пространство. Мы будем обозначать это 65
пространство символом Т! (У). (Оно является не чем иным, как тензорным произведением У <8> У.) В координатах значения смешанного функционала В выражаются формулой В (х, 1) = b{x%, где Ь[ — В(ег е>), а х{ — е1(х) и |; == i (еу.) — коорди- координаты вектора х и ковектора % (в сопряженных базисах «1, ..., «лие1 е"). Определив тензорное произведение ц<8>у ковектора tj и вектора у формулой D<8>у)(х, 1) = ц(хI(у), мы немедленно получим, что тензорные произведения вида е1 ® е/ составляют базис пространства Т{ {У), причем В = ъ\е любого В(=Т\{У). В базисе e= c в/ {' коэффициенты &{' функционала Б формулой {15) ЬГ = с\,сГЬ{. Ti выражаются Это совсем другой тип преобразования, чем для коэф- коэффициентов билинейных функционалов из Т2(У) или Т2(У). Чтобы придать ему наглядную форму, запишем, его в матричных обозначениях (и одновременно заново выведем). Пусть ь\ ... ь1п и fe ~ \fel» • • • > 5/г/' Тогда, как легко видеть, В{х, 1) = 56
Пусть, далее, ?,/ ... Dn, и, соответственно, ?„/), и потому Как мы знаем, В (x, |) = %'B'x'. % r*vr Лг *~™~~ v^ Лг (координаты ковекторов преобразуются когредиентно). Поэтому %Вх = %'С~1ВСх' = %'В'х', т. е. Это и есть формула A5) в матричной записи. Вместо транспонированной матрицы Ст здесь появилась обрат- обратная матрица С-1,
Лекция 6 Полилинейные функционалы. — Тензоры. — Алгебра тен- тензоров. — Базис пространства тензоров.— Свертка тензо- тензоров. — Тензоры в пространстве с невырожденным ска- скалярным умножением. — Подъем и спуск индексов. Построения предыдущей лекции допускают далеко идущее обобщение. Определение 1. Полилинейным функционалом типа (р, q) на линейном пространстве У, где р, q ^ О, назы- называется произвольная функция Т' v v Ё1 tiq i => Т (v v &• ?(>\ X • Л|, • • • , Apj Ъ > • • • , ъ ^ i V"*l» • • • » л pt Ъ г •••» Ъ ) р векторных аргументов хх, ..., хр и q ковекторных аргу- аргументов I1, ..., !<?, линейная по каждому аргументу (при фиксированных значениях других). Таким образом, билинейные функционалы от векто- векторов— это полилинейные функционалы типа B,0), били- билинейные функционалы от ковекторов — полилинейные функционалы типа @, 2) и смешанные билиней- билинейные функционалы — полилинейные функционалы типа A.1). Аналогично, ковекторы — это полилинейные функцио- функционалы типа A,0), а векторы, в силу отождествления У = (Т")', — полилинейные функционалы типа @, 1). В соответствии с общими соглашениями о функциях полилинейные функционалы типа @,0), вообще не имею- имеющие аргументов, отождествляются с элементами поля К. Множество всех полилинейных функционалов типа (р, q) обозначается символом Тр(^), причем индекс, равный нулю, опускается. Это находится в согласии с введенными выше обозначениями Тг^), Т2(У) и Т\(У) для пространств билинейных функционалов, а также с обозначением Ti {У) для сопряженного пространства У". Согласно сказанному выше Т1 (У) — УиТо (У) = К. Ясно, что каждое из множеств Tpq (У) является линей- линейным пространством (относительно обычных линейных операций над функциями). Пусть ей ...,еп—произвольный базис пространства У, а е1, ..., еп — сопряженный базис пространства У'. 58
Пусть, далее, Ж *• I/» у v I 1 ^i» '••' Ло ло I 1 i, оо1* ?1 _ tl g/l S<7 fc<7 g/,j ' 1 ' q Тогда, в силу полилинейности, т(ж ж Ё1 ?Л Ti где Числа Т[1 У'ш \q называются коэффициентами функцио- функционала Т. Их число равно np+q. Для сокращения формул удобно ввести мультиин- дексы а = (г„ ..., ip) и 0 = (/i. ••-./<?)• Полагая И „а vii „ip 6 Ь1 69 д: — хх . . . хр , бр — §7] . . . 6^, мы можем формулу A) записать в следующем сокра- сокращенном виде: C) Т (ж„ ..., жр, б1, ..., I") «= Г^д;а|в. Эта формула означает, что в координатах любой по- полилинейный функционал выражается полилинейной фор- формой вида Га-*:а|з- Обратно, каждая полилинейная форма ТаХа?,ц = _ pi •¦• /q^i _ _ _ д-'pil ... |f задает по формуле C) не- 1 "'• р ™ '1 'q который функционал i . Л1> • • • , яЛгр9 Ъ , • • * , Ъ ' =^ -* V"*!» • • • j Лр> t5, •••, =>/» очевидно полилинейный. Таким образом, при заданном базисе е1, ..., е" про- пространства У полилинейные функционалы типа (р, q) на- находятся в биективном соответствии с полилинейными формами вида Т%ха%& и, значит, с наборами = (Т1,1 '" {А элементов поля К.
Перейдем от базиса е\, ..., еп к новому базису ev, .. ., еП'. Пусть Тогда, в силу полилинейности, для коэффициентов Г*1 •¦ • Iq —— Т (Р Р Р 1 tJi V М ••• 'о V Ч 'о /- функционала Т в базисе ev en, будут иметь место формулы Это так называемый тензорный закон преобразова- преобразования. Условно можно сказать, что в формуле D) каждый индекс преобразуется независимо от других, причем ниж- нижние индексы преобразуются когредиентно, а верхние — контрагредиентно. JB сокращенных обозначениях формула D) имеет вид где положено и предполагается, что по а и р производится суммиро- суммирование. Пусть Е (У) — множество всех базисов е = (еи ..., еп) линеала У*. Рассматривая каждый набор (Т^) = (Т^1 '" { чисел Т^ = ТЬ "' \q как элемент пространства где Л' = пР+ч, т. е. предполагая заданным некоторый спо- способ выписывания этих чисел в строчку длины N, мы мо- можем сказать, что каждый полилинейный функционал Т типа (р, q) определяет некоторое отображение E) Е(У)->К", е^(Т§, множества Е.(У) в пространство К", обладающее тем свойством, что для любых двух базисов е, е' s E (У) со- соответствующие векторы пространства К" связаны фор- формулой D). Определение 2. Каждое отображение E), обладаю- обладающее указанным свойством, называется тензором типа (р, q) на линейном пространстве У. 60
Таким образом, чтобы задать тензор, надо в каждом базисе еи ..., еп линеала У задать пр+(> чисел Т1.1 " '«, 1 ••• ip следя за тем, чтобы для них имел место тензорный за- закон преобразования D). Эти числа называются компо- компонентами тензора E) в данном базисе. Согласно формуле D) тензор Т полностью опреде- определен своими компонентами Т\1 " [q в любом фиксирован- фиксированном базисе ех, ..., еп пространства У. При этом легко видеть, что произвольно задав компоненты T!i '" !я в ба- зисе в\, ..., еп и определив их в каждом другом базисе еу, ..., еп, формулами D), мы получим тензор, т. е. для любых двух базисов ех„ .... еп, и е,„, . . ., еп„ ком- компоненты и где |cf|, |cf|| и ||c*7|— соответствующие матрицы пере- перехода. Действительно, так как С^/уС^/==== С|» И CiiCl = С'. , то будут связаны тензорным законом преобразования: с У С1РЛ c'yrll-'q^ 1 lp h }q I "• *Р V / i' i \ / t" i'\ / f" /' \ ,/ ... / 1 "* <r
Таким образом, любой набор (Т1,1'" (<Л элементов поля К однозначно определяет некоторый тензор, имею- имеющий в данном базисе линеала У компоненты Т[1'" [я. В случае, когда базис линеала У фиксирован, удобно отождествлять тензоры с их компонентами и говорить просто о тензоре Т'Л'" [ч. Как мы видели, любой полилинейный функционал Т определяет некоторый тензор, компоненты Т'?1'"{" кото- которого — в произвольном базисе! — являются коэффициен- коэффициентами этого функционала. Ясно, что формула задает биективное соответствие между множеством-всех полилинейных функционалов типа (р, q) и множеством всех тензоров того же типа (р, q). Действительно, лю- любые числа Т[1 '" [ч — Гд могут быть приняты за коэффи- коэффициенты полилинейной формы ГаЛа|р, а, значит, — при фиксированном базисе — и за коэффициенты соответ- соответствующего полилинейного функционала. При этом полу- получающийся функционал не зависит, очевидно, от выбора базиса. ? Посредством соответствия F) полилинейные функ- функционалы и тензоры обычно отождествляются. Поэтому мы в дальнейшем, как правило, не будем педантично различать функционалы и тензоры и будем считать тер- термины «полилинейный функционал» и «тензор» синони- синонимами. [Заметим, что это соглашение несколько отли- отличается от принятого в первом издании этой книги.] Тем не менее следует иметь в виду, что во многих ситуациях переход от тензоров к полилинейным функ- функционалам существом дела не вызывается. [В физике, например, так дело обстоит почти всегда.] Отождеств- Отождествление векторов из 7 с тензорами типа @, 1) состоит всего лишь в том, что от вектора л: е У мы переходим к его координатам хг, тогда как отождествление вектора х с полилинейным функционалом типа @, 1) требует существенно более сложных конструкций (отождествле- (отождествления У с (У)'). Однако в формально математических конструкциях мы можем подобного рода обстоятельства игнорировать. 62
Для тензоров могут быть определены алгебраические операции сложения и умножения. Операция сложения тензоров одного и того же типа определяется покомпонентно, т. е. формулой В силу линейности тензорного закона преобразования это определение корректно (т. е. приводит к одному и тому же результату во всех базисах) и, очевидно, согла- согласовано со сложением полилинейных функционалов. Кроме операции сложения для тензоров определена также операция умножения, которая обозначается сим- символом .®. Перемножать можно тензоры любых типов (р, q) и (г, s), и в результате получается тензор типа (р + г, q + s). На компонентах умножение определяется (очевидно, корректной) формулой 1р+г *1 ••• 'р 1р+1 ¦¦¦ 1р+г (таким образом, каждая компонента тензора Т умно- умножается на каждую компоненту тензора S), а при интер- интерпретации тензоров как функционалов — формулой ,, ..., хр+г, б1, .... Ясно, что умножение ® дистрибутивно относительно сложения: и ассоциативно: (Г ® S) ® R = Т ® (S ® R). Однако, вообще говоря, оно некоммутативно: Если один (или оба) из сомножителей является тензо- тензором типа @,0), т. е. числом k, то тензорное произведе- произведение совпадает с обычным: Относительно операций -J- и ® все линейные про- пространства Тр (У) составляют алгебраический объект, 63
являющийся примером так называемой дважды гра- градуированной алгебры. Эта алгебра обозначается символом Т (У3) и называется тензорной алгеброй линей- линейного пространства У. Пусть, как всегда, ей •••, еп — произвольный базис пространства У, а е1, ..., еп — сопряженный базис про- пространства У. Для любых мультииндексов a=(r"i, ..., ip) и р = — (/i> • • •» 1ч) мы положим е ... , р ^ ... ^. Тогда е v^i' • • •' жр) == *i * *" хр == х и, аналогично, ^^ \о » • • •» S / —" ъ] \ * • • fe/_ === ъ$ для произвольных векторов Х\, ..., хр и ковекторов ^г, ..., "?,д. Поэтому для любых чисел Г„ имеет место ра- равенство В частности, отсюда следует, что Т^еа <?> е$ == 0 тогда и только тогда, когда Та = 0 для всех а и р, т. е. что элементы еа®ер линеала Тр(^°) линейно независимы. Кроме того, в случае, когда Га — коэффициенты не- некоторого тензора Г и, значит, отсюда также следует, что Т = Г?еа О ев. Следовательно, элементы еа ® е^ линеала Тр (>°) состав- составляют его базис, причем координатами произвольного тензора Т в этом базисе являются его коэффициенты Га- Для удобства ссылок мы сформулируем это утверж- утверждение в виде отдельного предложения: Предлоэюение 1. Всевозможные тензорные произведе- произведения вида еа ® ей = е'1 ® ... ®etp®e(. ® ... ®е. 64
составляют базис пространства ТЧР(Т). Координатами тензора Т в этом базисе являются его коэффициенты: 'l •'• р 'I . 'q а р Для случая билинейных функционалов это предло- предложение нам уже известно из лекции 5. В частности, мы видим, что dim Tqp (Г) = пр+\ так что размерность пространства тензоров типа (р, q) равна, как и следовало ожидать, числу их компонент. Заметим, что все компоненты тензора еа ® е$ равны нулю за исключением одной (которая равна единице). Пусть Т — произвольный тензор типа (р, ^),где р > О и q > 0, и пусть 1 ^ k ^ р, 1 ^ / ^ q. Подставив в тен- тензор Т вместо &-го векторного аргумента вектор базиса e-i, а вместо /-го ковекторного аргумента ковектор е1 и произведя суммирование по i (от 1 до п), мы получим некоторый новый тензор 5 типа (р — 1, q — 1). Таким образом, S\Xi x | ..., I ) = •••> xk—1> eu xk> •••» xp-u где справа, в соответствии с соглашением Эйнштейна, подразумевается суммирование по /. Компоненты тен- тензора 5 выражаются, очевидно, формулой /, ,_! W, ... it-iHi ¦¦¦ fq-l Определение 3. Построенный тензор 5 называется сверткой тензора Т по k-му нижнему и 1-му верхнему ин- индексам. Нужно проверить, что это определение корректно, т. е. что тензор S не зависит от выбора базиса еь ..., еп. Но это легко. Действительно, если ev, ..., еп, — любой дру- другой базис и e^f — с ^е^у 3 М. М. Постников, сем. II 65
то, обозначив «несвертываемые» аргументы многото- многоточиями, мы получим, что 1 ^». ., е^/, ..., е f •••) — — f (. . . et ... в' .). П Примеры сверток. 1. Свернув смешанный билинейный функционал В (х, |) = Ъ\х%\ по единственному нижнему и единствен- единственному верхнему индексам, мы получим тензор типа @,0), т. е. число В (ей е1). Это число называется следом функ- функционала и обозначается символом tr В. Таким образом, по определению tr В = Ъ\ = Ъ\ + ... -\-Ьп, откуда видно, что след функционала равен следу его мат- матрицы, т. е. сумме ее диагональных элементов. 2. В частности, для любого вектора х и любого ко- вектора | 3. Пусть Т—¦ произвольный тензор и (р, q)—его тип. Взяв р векторов Х\, ... , хр и q ковекторов %1, ..., %q, мы можем построить тензор типа (р -f- q, p -f- q). Свернув этот тензор р + q Раз по нижним и верхним индексам с одинаковыми номерами, мы, очевидно, получим число т. е. значение тензора Г на векторах Х\, ..., хр и ковек- торах I1, ..., |". Предположим теперь, что У является пространством с невырожденным скалярным умножением (например евклидовым) и, значит, пространство У" естественно изо- изоморфно пространству зК Пользуясь этим изоморфизмом, -66
мы можем отождествить пространства У и У и каждый ковектор рассматривать как вектор из У. Таким образом, в силу этого отождествления будет иметь место равенство Более того, каждый билинейный функционал от ко- векторов, а также каждый смешанный билинейный функ- функционал мы можем теперь считать функционалом от век- векторов, что даст нам отождествления Например, смешанный билинейный функционал В^Т\ (У) мы отождествляем с функционалом В^Т2{У), опреде- определенным формулой G) В (х, у) = В (х, |у), х, у<^У, где, как и в лекции 5, символ %.у обозначает ковектор 1у\ х н-> (х, у). Вообще, в пространстве с невырожденным скалярным умножением мы можем отождествлять полилинейные функционалы (тензоры) любых типов (р, q) с одной и той же суммой р -\- q, по произволу объявляя те или иные их аргументы векторами или ковекторами. Однако здесь возникает одна характерная трудность. Отождествление смешанного функционала В с били- билинейным функционалом по формуле G) означает, что ко- векторный аргумент функционала В мы отождествляем со вторым аргументом билинейного функционала. Но ничто не мешает нам отождествить этот аргумент с пер- первым аргументом, что даст, — вообще говоря, другой —• билинейный функционал В* (определяемый формулой (8) В*{х,у) = В(у,1х), х.уевУ, и связанный с функционалом G) формулой В*{х,у) = = В(у,х)). Аналогично — и только хуже — дело обстоит и для тензоров других типов. Рассмотрим, например, тензор T(xi, х2, х3; %{) типа C, 1). Объявив вектор л:3 ковектором (и обозначив его, скажем, через ^2), мы отождествим этот тензор с тензором Г(хх, х2; %2, %i) типа B, 2). Но мы можем считать новый ковекторный аргумент ^2 не пер- первым, а вторым аргументом, а тогда получится, вообще 3* 67
говоря, другой тензор типа B,2). Более того, считая ко- вектором не вектор х3, а вектор х2, мы можем получить еще один тензор того же типа B, 2), отличный от первых двух. Мы можем, объявив, например, аргумент Х\ ковек- тором, одновременно объявить аргумент ^i вектором! Тогда получится тензор прежнего типа C, 1), отличный от исходного, и т. д., и т. п. Чтобы добиться определенности, следует ввести еди- единую нумерацию (или хотя бы единое упорядочение) век- векторных и ковекторных аргументов и записывать их в этом порядке вперемежку. Так, например, обозначение Т(хи х2,1=з, Х4) для тензора типа C, 1) означает, что при объявлении ковектора ^3 вектором получается тензор типа D,0), у которого новый векторный аргумент яв- является третьим, а при объявлении вектора х% (вектора х4) ковектором получается тензор типа B,2), у кото- которого новый ковекторный аргумент является — среди ко- ковекторных аргументов — первым (вторым). Во избежание недоразумений подчеркнем, что, ска- скажем, символы Т (х\, х2, xs, %i) и Т(хи х^ \ъ, х4) оба обо- обозначают тензор типа C, 1) с тремя векторными и одним ковекторным аргументами. Эти тензоры отличаются только их происхождением — первый из них получен из некоторого тензора Т{х\, х2, х3, х*) типа D,0) присвое- присвоением звания ковектора аргументу ж4, а второй — аргу- аргументу ж3. В произвольных линейных пространствах (без ска- скалярного умножения) различение тензоров вида Т (хи х2,%з, хА) и вида Т(х\,х2,хг,%4) смысла не имеет. По понятной ассоциации идей скалярное умножение G в произвольном пространстве У со скалярным умно- умножением называется метрическим тензором или просто метрикой. Его компонентами йц в произвольном базисе в\, ..., еп являются метрические коэффициенты gt/ = — (ei, e,) этого базиса. Для любого вектора х пространства У его тензорное произведение х® G с метрическим тензором G представ- представляет собой тензор типа B, 1). Этот тензор мы можем свернуть по единственному верхнему и одному, — ска- скажем, для определенности, второму — нижнему индексу. В результате получится некоторый тензор типа A,0), т. е. ковектор 1. Значение %(у) этого ковектора на про- произвольном векторе у равно свертке tr (§ ® у) тензорного 68
произведения % ® у и, значит, результату полного свер- свертывания тензора х Ф G ® у, т. е. значению G (х, у) = = (х, у) тензора G на векторах х и у. Поскольку равен- равенство %{у) — (х, у) по определению, означает, что ковек- тор 1 отождествляется с вектором х, тем самым дока- доказано, что вектор х, рассматриваемый как ковектор, пред- представляет собой свертку тензора х® G, или, как чаще говорят, является сверткой вектора х с тензором G. В базисе еь ..., еп тензор х ® G имеет координаты gijXk, а его свертка — координаты Числа Х\, ..., хп называются ковариантными координа- координатами вектора х в базисе ех, ..., еп. По определению они представляют собой координаты соответствующего ко- вектора \ в сопряженном базисе ех, ..., еп или — что равносильно — координаты вектора х в базисе е1, ..., еп, рассматриваемом как базис пространства У. «Настоя- «Настоящие» координаты х1, ..., хп- вектора х в базисе еи ..., еп называются — для отличия от ковариантных координат — его контравариантными координатами. Операция перехода от координат х1 к координатам х{ называется иногда спуском индекса i, а обратная опера- операция — подъемом этого индекса. В соответствии с единым упорядочением аргументов произвольного тензора (см. выше) верхние и нижние индексы его координат (компонент) также должны быть упорядочены. Поэтому, если индексы имеются и сверху и снизу, то вверху надо оставлять пробелы для мест, за- занимаемых нижними индексами, и, наоборот, внизу — про- пробелы для мест, занимаемых верхними индексами. Для наглядности в пробелах иногда пишут точки. Таким образом, например, координаты тензора Т(х\, х2, хз, Ю обозначаются символом Г* ¦ • /i т h а координаты тензора Т(хи х2, %\, хз)—символом В частности, для координат смешанного билиней- билинейного функционала возникают два обозначения: bt1 и Ь1/ — первое, когда функционал получен из билинейного функционала с координатами Ъц объявлением ковекто- 69
ром второго аргумента (формула G)), а второе — объяв- объявлением ковектором первого аргумента (формула (8)) Так как bl, = B(ei, e,), bi1 = B{et, e1), b11 = В(е', et), то имеют место формулы (9) b k k а также формулы (Ю) *,' где gV — элементы матрицы G~l, обратной матрице G = \\gu\\, T- е- метрические коэффициенты сопряжен- сопряженного (взаимного) базиса ех, ..., еп. Числа Ьц, bt', d}' (а также числа bli == gikgnbki) можно рассматривать как различного рода координаты одного и того же билинейного функционала. Координаты bi/ называют его координатами, ковариантными по обоим индексам, координаты bi1 — координатами, ковариант- ковариантными по первому индексу и контравариантными по вто- второму, и т. д. Как показывают формулы (9) и A0), все эти коор- координаты получаются друг из друга тензорным умноже- умножением на «взаимно обратные» тензоры gi/ и gl>, сопро- сопровождаемым свертками по соответствующим индексам. Аналогичным образом спуск и подъем индексов осу- осуществляется и для других тензоров. Например, Если пространство У евклидово, а базис ей ...., еп ортонормирован, то сопряженный базис ех, ..., е"сним совпадает и все формулы спуска и подъема индексов превращаются просто в равенства соответствующих (имеющих одни и те же индексы независимо от их поло- положения) координат. Например, A1) ^ = ^; = б/ для билинейных функционалов и для векторов. Именно поэтому мы еще в первом се- семестре употребляли для координат векторов в ортонор- мированном базисе обозначения с индексами внизу. 70
Подчеркнем, что все это жонглирование индексами имеет смысл лишь при фиксированном метрическом тен- тензоре G (например в евклидовом пространстве). Замечание 1. Следует иметь в виду, что, несмотря на равенства A1), неверно, что функционалы В, свя- связанные формулой G), имеют в ортонормированном ба- базисе одну и ту же матрицу. Действительно, в матрице билинейного функционала элемент Ьц мы по традиции пишем на /-м месте в j-й строке, а в матрице смешан- смешанного функционала элемент bi1 — на i-u месте в /-й строке (см. формулу C) и A5) лекции 5). Значит, эти мат- матрицы транспонированы по отношению друг к другу.
Лекция 7 Подстановки. — Поливекторы. — Базисные поливекто- поливекторы. — Внешние произведения унимодулярно эквивалент- эквивалентных семейств векторов. — Отождествление поливекторов с классами унимодулярно эквивалентных семейств век- векторов. Напомним, что подстановкой степени m называется произвольное биективное отображение множества {1, ..., пг} на себя. Любая такая подстановка о обычно изображается двустрочной таблицей / 1 2 ... пг \ \а{\) а B) ... a (m) ) ' хотя, вообще говоря, вполне было бы достаточно нижней строчки. Все подстановки степени пг образуют группу (относи- (относительно композиции), которая называется симметрической группой и обозначается символом Sm- Подстановки делятся на четные и нечетные в зависи- зависимости от того, четно или нечетно число инверсий, т. е. пар (a(i), a(j)), для которых i < /, но a(i) > a(j). Мы будем называть знаком подстановки число -f-1, если подстановка четная, и число —1, если подстановка нечетная. Обозначать знак подстановки а мы будем сим- символом ест. Известно, что для любых двух подстановок а и т, откуда, в частности, следует, что все четные подстановки составляют под- подгруппу группы Sm- Примером нечетной подстановки является транспози- транспозиция, переставляющая лишь два элемента. Любая под- подстановка разлагается в произведение транспозиций (и даже транспозиций соседних элементов), причем число множителей четно для четной подстановки и не- нечетно для нечетной. Пусть хи ..., Хт-— векторы линейного простран- пространства Т. 72
Определение 1. Тензор A) Еест(жстA)<8> ... ®ха(т)) типа @, га), где суммирование распространено на все подстановки а степени т, называется внешним произве- произведением векторов Х\, ..., хт и обозначается символом #1 Л • • • Л хт. Например, Тензоры типа @, т), являющиеся внешними произве- произведениями векторов, называются поливекторами степени m или, короче, пг-векторами. Векторы считаются поливекторами степени 1, а числа (элементы основного поля К)—поливекторами сте- степени 0. Множество всех m-векторов пространства У мы бу- будем обозначать символом А (У). Таким образом, по определению А0 (Т) = К, А1 (Т) = Т. Замечание 1. В первом издании этой книги в оп- определении тензора х\ Л ... А хт участвовал множитель \/т\, который мы теперь опускаем. Легко видеть, что -j- xx Л • • • Л xm_l Л х'^ для любых векторов хх, ..., хт_х, х'т, х"т. Действи- Действительно, если хт = х'т + х"т и т = о (k), то в а-ом члене суммы A) множитель xa(k) = хт будет суммой х'а (й) + х'а{к) и, значит, — в силу дистрибутивности тензорного произведения — этот член будет суммой двух произведений, одно из которых получается заменой МНОЖИТелЯ XO(k) = Хт МНОЖИТелеМ Жа(?)=Жт, а ДРУГОЙ — множителем x"tbi = x"m. ? Ясно, что аналогичная формула имеет место и по от- отношению к любому из векторов хи ..., хт. 73
По определению это означает, что внешнее умноже- умножение дистрибутивно относительно сложения. Аналогично, только еще проще, доказывается, что внешнее умножение однородно, т. е. что при умножении одного из векторов хх, .... хт-\, хт (скажем, вектора хт) на произвольное число Xе К все произведение *i Л ... Л «m-i Л хт умножается на то же число: ж, Л ... Л xm_i Л Ялгл1 = к(хх Л ... Л жт-1 Л хт). Пусть, как всегда, ех, ..., еп — базис в У и пусть Х\ Хт~ Тогда, в силу дистрибутивности и однородности, ! Л • • • Л хт = О J т. е. B) где ж, Л а(т) Р Ttl т [Числа X*1' матрицы 'т называются обобщенными минорами «г ••• *•, составленной из координат векторов х\, .... хт.] Формула B) означает, что компонентами внешнего произведения xi/\ ... Л xm являются миноры X1*'" tm- Кроме того, в силу теоремы о ранге матрицы из этой формулы немедленно следует, что *i A ... 'Лхт=О тогда и только тогда, когда векторы Xi, ..., xm линейно зависимы. Так как определитель с одинаковыми строками равен нулю, то X'1'" 'т = 0, если среди индексов и, ..., im есть одинаковые. 74
Пусть все индексы h, ..., im различны. Расположив эти индексы в возрастающем порядке, обозначим их че- через /ь ..., /т. Таким образом, /[<•..< }т и t[ == /стA), ..., im = Ja{ms, где а — некоторая подстановка степени т. При этом e Xl •• 'т. Отсюда следует, что формулу B) мы можем перепи- переписать в следующем виде: Ж! Л ... Ахт = ... Ае,т. т. Таким образом, C) ж,Л ... Л«« = = Z ••• Е X't-'ne^A ... Ле/я, где суммирование распространено на все индексы /ь • • • з /т, удовлетворяющие неравенствам 1 ^ /i < ... ... < /m < n- Формула C) означает, что любой т-вектор является линейной комбинацией пг-векторов вида D) е. Л • • • Л е , где КД < ... < /т < п. /т Заметим, что это представление единственно, т. е. что пг-векторы D) линейно независимы. Действительно, пусть ? ... ? л/'-'-е/1л ... л в, =0, где Д'г "¦¦ //га — некоторые числа (определенные только при 1 ^ /i <С ... <С /„ ^ л). Тогда ?...? л7'-/я*с?евв/аМ)® ... ®в/о< тЛ = 2 • • • Е Е ? 75
Ясно, что все тензоры е/ст(!)® ••• ®ei ia{my встречаю- встречающиеся в этой сумме, различны. Но мы знаем, что все различные тензоры вида e?i <g> .. . <g> eifn линейно незави- независимы. Поэтому eaA!l "' 'т = 0, т. е. Afl '" *т~0 при 1 ^/i <С ... <С ]'щ^ п. Значит, т-векторы D) линейно независимы. ? Мы будем называть т-векторы D) базисными т-век- торами. При выводе формул B) и C) мы нигде не пользова- пользовались линейной независимостью векторов в\, ..., е„. По- Поэтому те же самые выкладки дадут нам следующее пред- предложение: Предложение 1. Пусть векторы Ху, ..., хт линейно выражаются через векторы у.г .. ., yq, т. е. пусть c1jpi Тогда л где — обобщенные миноры матрицы '/1 A ? Приг q = m мы получаем отсюда, что (б) Ж! Л ... Л*т = С(у, Л ... - где С — определитель матрицы F) Напомним (см. лекцию 1.7), что два семейства век- векторов хи ..., хт и у и . . ., ут называются унимодулярно эквивалентными, если векторы у\, ..., ут линейно выра- 76
жаются через векторы хи ..., хт с матрицей F), опре- определитель которой равен 1. Мы видим, таким образом, что если семейства Х\, ... , . . , Хщ U У\, . . . , Ут уНиМодуЛЯрНО ЭКвивпЛвНТНЫ, ТО хх Л Л Обратная теорема имеет следующий вид: Теорема 1. Если ж, Л ... Л хт = ух Л ... Л ут и ух Л ... Лутт^О, то семейства х\, ..., хт и ух, ... ..., ут унимодулярно эквивалентны. Докажем сначала следующую лемму: Лемма 1. Если в матрице все миноры порядка пг, кроме минора X1 равны нулю (а Х{ х m+l тф0), то — О ... хт = О *•! — О хт — О лп v, . . ., лп и. Доказательство. Пусть хи ..., хт, ..., хп.— строки данной матрицы (рассматриваемые как векторы пространства Rm). В силу теоремы о равенстве нулю определителя строки хх, ..., хт линейно независимы, а для любого i—\, .... т и любого j = m-\-\, .... п строки линейно зависимы. Поэтому строка xi линейно выра- выражается через строки Иначе говоря, эта строка линейно выражается через 77
строки хи . .., хт, причем коэффициент при строке ж,- равен нулю. Поскольку в силу линейной независимости строк хи ..., хт это линейное выражение единственно и поскольку i является произвольным (от 1 до т) чис- числом, мы видим, что строка х/ линейно выражается через строки Х\, ..., хт с равными нулю коэффициентами. Значит, Xj — О. Таким образом, хт+\ = ... = хп = О, что и утверждается в лемме. ? Доказательство теоремы КТаккак^Л ... . . . /\ут =И= 0, то векторы у\, ..., ут линейно независимы. Дополним их до базиса е\==У\1 •••> ет==Ут> ет+1' • • • > еп пространства У и напишем в этом базисе формулу C). Так как по условию хх Л • • • Л хт = У\ Л • • • Aym = ^i A ••• А ет, то, в силу единственности выражения m-векторов через базисные m-векторы, коэффициент X1 ••¦ т в этой формуле равен 1, а все остальные коэффициенты Х1л '" lfn равны нулю. Это означает, что матрица, состоящая из коорди- координат векторов хи ..., хт, удовлетворяет условиям леммы 1 и, значит, согласно этой лемме, векторы лгь ..., хт выражаются только через векторы ех = уи ..., ет = Ут. Следовательно, векторы хи ..., хт и у\, •¦-¦> Ут линей- линейно эквивалентны, а так как Х1"'т = 1, то эта эквивалент- эквивалентность унимодулярна. П В силу теоремы 1 мы можем отличные от нуля m-векторы отождествить с классами унимодулярно экви- эквивалентных линейно независимых семейств т-векторов (с «геометрическими» m-векторами, см. лекцию 1.8). Нулевой m-вектор следует при этом отождествить с клас- классом, состоящим из всех линейно зависимых /п-членных семейств (нулевым «геометрическим» m-вектором). Тем самым мы на новом уровне возвращаемся к построениям из первого семестра (см. лекцию 1-8).
Лекция 8 Кососимметрические тензоры.— Поливекторы степеней п яп— 1. — Плюккеровы координаты подпространств. В первом семестре (см. лекции 1.9 и 1.10) мы при п = 3 и т = 2 (а также при т = п) ввели в множество Ат (У) всех m-векторов структуру линейного простран- пространства. (Заметим, что множество А2 (У) обозначалось в лекции 1.9 символом У А У, а множество А2 (У) — символом У А У А У-) Рассмотрим теперь этот вопрос в общем виде. Легко видеть, что для любых векторов х\, ..., хт и любых ковекторов %}, ..., |т имеет место формула !'(*.) •-• lm(*0 A) (ж, Л ... Ахт)AК ..., Ът)= V (Хт) ... \т (хт) Действительно, по определению (Ж, Л ... Л Хт) (I1, . . ., lm) = Z Eat1 (*a(l)) • • . I (*a(m)) = Из формулы A) следует, что внешнее произведение векторов антикоммутативно, т. е. при транспозиции мно- множителей оно меняет знак, и, значит, Ха{\) Л ••• Л Ха (ш) = ест (#1 Л ••• Л Хт) для любой подстановки ае5т. Действительно, транс- транспозиция множителей означает транспозицию строк опре- определителя, стоящего справа в формуле A). D Определитель меняет знак и при транспозиции столбцов. Это означает, что при транспозиции аргу- аргументов тензор Х\ Л ... Лхт меняет знак и, значит, (ж, Л ... Лхт)(Гп\ .... |a(m)) = = ест («1 Л -.. Л хт) (I1, ..., 1т) для любой подстановки o^Sm. Последнее свойство заслуживает специального опре- определения. 79
Определение 1. Полилинейный функционал (тензор) А типа @, т) называется кососимметрическим, если для любых ковекторов I1, ..., §."* и любой подстановки о степени т, т. е. — что, очевидно, равносильно, — если он меняет знак при любой транспозиции аргументов. Таким образом, любой поливектор является кососим- кососимметрическим тензором. Число m называется степенью кососимметрического тензора А и обозначается символом deg A. Замечание 1. Некоторые авторы кососимметриче- ские тензоры называют поливекторами, а поливекторы в нашем смысле — разложимыми (или простыми) по- поливекторами. Пусть еь ..., еп — базис пространства Т,е1, .... е" — сопряженный базис пространства У" и — компоненты кососимметрического тензора А в этом базисе. Тогда для любой подстановки а е Sm т. е. B) а*ощ— Это свойство компонент (равносильное тому, что при транспозиции индексов компоненты меняют знак) назы- называется их кососимметричностью. Таким образом, мы доказали, что кососимметриче- ский тензор имеет кососимметрические компоненты. Обратно, оказывается, что каждый тензор типа @, пг) с кососимметрическими компонентами кососимметричен. Например, при m = 2 (когда имеется лишь одна не- нетождественная подстановка о — транспозиция) условие B) сводится к равенству Ан = — Л17, которое должно иметь место для всех i, /== 1, ..., п. Поэтому для любых двух ковекторов 1 — |,-е* и ц — г]ге' А(ц, S) = i4%6/ = .A/iT],ii (переобозначили индексы) — A'%ii)j (переставили множители) 80
= — А*%1\1 (использовали кососимметричность) = - А (|, ц), и, значит, функционал А кососимметричен. В общем случае вычисление ведется фактически точно так же. По определению, для любых ковекторов 11==|) в'1, ... ..., ъ'п = ?7 е'т и любой подстановки о е 5т имеет место равенство Ho 'cr(l) la(m) (каждый индекс суммирования ik, k=l, ..., m, обозна- обозначаем СИМВОЛОМ ia(k)) И (слева и справа находятся одни и те же числа, но в раз- разном порядке). Поэтому и, значит, в силу условия B), = eaA(Ml, .... |m). D Ясно, что кососимметрические тензоры (данной сте- степени т) составляют линейное пространство (подпро- (подпространство пространства Тт(У))- Это линейное простран- пространство обозначается символом Ат('^)- Пространство /\т{У) содержит все m-векторы и, значит, все их линейные комбинации. Оказывается, что этим исчерпываются все кососимметрические тензоры, т. е. каждый кососимметрический тензор А степени пг является линейной комбинацией m-векторов. Мы дока- докажем даже большее, а именно, что C) А= </ Л ... Ле, 81
Действительно (ср. с доказательством формулы C) лекции 7), л ... л Замечание 2. При перестановке индексов /i, ... ..., jm число А'1'" 'т и поливектор ejx Л • • • Л в/т либо не меняются, либо оба умножаются на —1. Это показы- показывает, что в сумме D) Ah-fm eh Л ... Ае1т, кроме слагаемых, равных нулю (отвечающих повторяю- повторяющимся индексам /ь ..., jm), все остальные слагаемые равны слагаемым суммы C), причем для каждого сла- слагаемого суммы C) в сумме D) найдется пг\ равных ему слагаемых. Значит, Лв/от. Формула C) означает, что базисные т-векторы со- составляют базис линейного пространства j\m(У) косо' симметрических тензоров степени т. Следовательно, размерность этого пространства равна ( п J . . В частности, если гп> п, то dim /\т(У) = 0, и, зна- значит, /\m(T) = Q. Таким образом, при т> п каждый кососимметрический тензор степени m (и, в частности, каждый гп-вектор) равен нулю. Далее, из того, что пространство Дт (У) обладает базисом, состоящим из m-векторов, следует, что множество Am (f) тогда и только тогда замкнуто отно- относительно сложения {и, значит, является линейным про- пространством), когда оно совпадает с Дт C^°)- Таким образом, поставленный выше вопрос сводится к вопросу, при каких пг имеет место равенство F) А 82
Поскольку Л° (У) = К и Л°(Л = К, а также А'.(У) = Г я /\1{У) = У> равенство F) справедливо при /п —0 и Кроме того, согласно формуле C) для любого тен- тензора А <= Л" (У) имеет место равенство Л = Л1 •••"*?, Л ... Аеп, показывающее, что каждый тензор из Ап (У) является n-вектором, т. е. что равенство (б) справедливо при m = п. Таким образом, в п-мерном пространстве все п-век- торы образуют линейное пространство. Размерность этого пространства равна единице и «-вектор г\ /V ... Л еп составляет его базис. (Ср. с лек- лекцией I. 9.) Оказывается, что равенство (б) справедливо и при тп = п—1 и, следовательно, множество А™ {У) яв- является линейным пространством (размерности п = = &1тУ). [Факт, при л = 3 нам уже известный из первого семестра; см. лекции 1.9 и I. 10.] Для доказательства этого утверждения мы восполь- воспользуемся следующим предложением (ср. предложение 2 лекции I. 9). Предложение 1. Для любых векторов хи • • •¦> хп—\-> У\> • • •' Уп—\ линейного пространства У существуют такие векторы Z\, . • ., 2T/i_2» *» У' ЧТО ж, Л ... Л *Л_1 =«i Л -•• Л г„_2 Л х, Ух Л ... Луп-\=2\ Л ... Лг„_2Лг/. Ввиду дистрибутивности внешнего умножения отно- относительно сложения из этого предложения следует, что «1 Л ... Л хп_г-\~у1 Л ••• Луп-1 = = г{ Л ••• Л г„_2 Л (х + у). Значит, сумма любых п—1-векторов снова является п— 1-вектором. Поэтому А" (Т)= Л*"' (У)- Доказательство предложения 1. В случае, когда Ц\ Л ... /\уп-\ = 0, утверждение очевидно (го- (годятся, скажем, векторы гх = хи ..., гп~2 — хп-2, х = хп-\ 83
и «_1==0). Поэтому без ограничения общности мы можем считать, что^Л ... Л.Уп-i =5^=0, т. е. что векторы Ух, .--. if«—1 линейно независимы и, значит, порождают п—1-мерное подпространство Q =\yi, ••-, Уп-г]- По аналогичным соображениям мы можем считать, что векторы хи ..., хп-\ также линейно независимы, т. е. что они порождают п—1-мерное подпространство &> = [хи ..., xn-i]. Рассмотрим пересечение 9> П Согласно теореме 1 лекции 1 dim (9> Г) Q) = dim & + dim Q — dim >(n — 1) + (л— 1) — n = n — 2. Поэтому в пространстве 9> П Q можно найти п — 2 ли- линейно независимых векторов z\, ..., гя_2. Семейство векторов Z\, ¦ • •, Zn-2 мы можем допол- дополнить до базиса пространства Ф, добавив еще один век- вектор х'. Семейства векторов z\, .... гя_2, х? тл. Х\, ..., хп-\ линейно эквивалентны (как базисы одного и того же пространства) и потому, согласно предложению 1 лек- лекции 7 (точнее, его частному случаю, выраженному фор- формулой E) лекции 7), ' ж, Л • • • Л жя_1 =Сfo Л ... Л г„_2 Л *')> где С — определитель соответствующей матрицы пере- перехода. Положив теперь х = Сх', мы, в силу однородности внешнего умножения, получим первую из формул G). Вектор у, для которого справедлива вторая из фор- формул G), отыскивается аналогично. П Замечание 3. Обратим внимание, что в первом семестре мы с помощью аналога предложения 1 (пред- (предложение 2 лекции 1.9) вводили в множество А2 {У)=У° Л Л У сложение, тогда как теперь мы только прове- проверяем, что множество А" (У) замкнуто относительно уже имеющейся в Д" (У) операции сложения. Это существенно все упрощает, позволяя не доказывать ни корректности этой операции, ни ее свойств (ср. с теоре- теоремой 1 лекции 1.9). Значения т = 0, 1, п— 1, п исчерпывают все значе- значения, при которых имеет место равенство D) (и, значит, Ат(У) является линейным пространством), т. е. при 2 ^ т s-S n — 2 существуют кососимметрические тензоры, степени пг, не являющиеся т-векторами. 84
Пример 1. Пусть п = 4, т = 2 и пусть А = е, Л е2 + е3 Л е4. Предположим, что Л является бивектором, т. е. суще- существуют такие векторы х = Xх х3г3 и что А = х Л у. Тогда, согласно формуле C) лекции 7, должны иметь место равенства xl yl ¦v-2 ii2 = 1 с3 yz (8) и (9) Но соотношения (9) означают, что X3 X2 X3 У1 У3 Уг У3 = 0, = 0, ¦ X* X2 X4 У1 У4 У2 У4 — I = 0, = 0. у1 ~ т. е. что Поэтому X1 У1 X1 xi У' ' X2 X* Уг X3 = 0, У4 = 0, что противоречит (8). Следовательно, равенство А = = х Л у невозможно, о При любом т, 2 ^ m ^ n — 2 (и любом л ^4), можно аналогично показать (сделайте это!), что тензор е{ Л ••• Л е,га_2 Л ет_х Л еот + m-вектором быть не может. Л • • • Л sm_2 Л en_! Л е^ Для каждого отличного от нуля m-вектора А = = #i Л ... Л*т линейная оболочка ^л векторов Х\, ... ..., хт зависит, очевидно, только от А (но не от спе- специального выбора векторов хх, ..., хт) и является m-мерным подпространством пространства У. Кроме того, из формулы E) лекции 7 непосред- непосредственно вытекает, что $Ра = !?в тогда и только тогда, когда m-векторы А и В пропорциональны. 85
Класс m-векторов, пропорциональных данному /п-век- тору А =?= О, мы будем обозначать символом [А], а множество всех классов [А] — символом Рт(У). Так как любое m-мерное подпространство имеет вид !Ра Для некоторого А, то формула корректно определяет биективное соответствие между множеством Рт(У) и множеством всех m-мерных под- подпространств пространства У. Обыкновенно множество всех m-мерных подпро- подпространств отождествляется посредством этого соотноше- соотношения с множеством Рт (У), и, в частности, символ [А] используется для обозначения подпространства &а- О векторах а подпространства SPa иногда говорят, что они параллельны m-вектору А (и пишут а||Л). Ясно, что а || А тогда и только тогда, когда либо а = О, либо существуют такие векторы Ь\, .... bm-\, что A — aAbiA ... Л &m-i. (Ср. определение 3 лекции 1.9.) Компоненты А*1 m-вектора А называются плюк- керовыми координатами подпространства [А] = 9*а (в данном базисе в\, ..., еп пространства У). Они опреде- определены (при фиксированном базисе пространства У) только с точностью до пропорциональности, т. е. яв- являются однородными координатами. Через произвольный базис хи ..., хт подпространства &А плюккеровы координаты выражаются по формуле A0) х\ • • • хт где р — произвольный множитель пропорциональности. Являясь компонентами кососимметрического тензора, плюккеровы координаты А'1' обладают свойством кососимметричности B). Однако для того чтобы произ- произвольно заданные числа А1^' были плюккеровыми координатами некоторого m-мерного подпространства ^, одного этого свойства недостаточно: необходимо т^кже, Ш
чтобы они удовлетворяли так называемым соотноше- соотношениям Плюккера, характеризующим m-векторы среди всех кососимметрических тензоров степени т. Пример 2 (ср. пример 1). При т — 2 и /2 = 4 имеется шесть существенных плюккеровых координат Л12, Л13, Л14, Л23, А24, А34 (остальные координаты АЧ либо равны нулю, либо отличаются от указанных зна- знаком). Через базис х = х'йг-, у = у1в{ подпространства ёР~а они выражаются по формулам рЛ12 = A1) X1 X2 X2 X3 У1 У2 У2 У3 Л 13 . р — , РЛ24 = X1 X3 X2 X* У1 У3 Уг У' g\ A 14 ____ l^jti —¦¦— , рЛ34 = X1 X* X3 X* У1 У4 У3 У' В теории определителей известна формула Лап- Лапласа, дающая разложение произвольного определителя порядка п по минорам данных т столбцов (и сводя- сводящаяся при т== 1 к формуле разложения определителя по элементам столбца). При т = 2 и «= 4 эта фор- формула утверждает, что произвольный определитель чет- четвертого порядка с1 у1 и1 v является суммой шести членов, каждый из которых представляет произведение некоторого минора второго порядка, составленного кз элементов первых двух столб- столбцов (т. е., во введенных выше обозначениях, — являю- являющимся одним из определителей рЛ'"' нз списка (9)), на взятый со знаком (—1 )г+/-м дополнительный минор, по- получающийся вычеркиванием строк и столбцов, входящих в минор рЛ'"'. В случае, когда в определителе А третий столбец совпадает с первым, а четвертый — со вторым (заметим, что в этом случае определитель заведомо ра- равен нулю), эти дополнительные миноры совпадают с ми- минорами A1) и шесть членов суммы распадаются на пары равных слагаемых. Поэтому в этом случае определитель А равен 2р2(Л12Л34 —Л13Л24 + Л14Л23). Поскольку же А = 0, мы получаем тем самым (в предположении, что характеристика char К поля К не равна двум), что при 87
m = 2 и п = 4 для плюккеровых координат А11 имеет место равенство A2) Л12Л34 — Л13Л24 + Л14Л23 = 0. Это и есть соотношение Плюккера при m = 2 и п = 4. В лекции 96 мы найдем соотношения Плюккера в об- общем виде и, в частности, покажем, что при пг = 2 и п = 4 все они являются следствием соотношения A2) (и соотношений кососимметричности). В этом смысле A2) является при т = 2 и л = 4 единственным соотношением Плюккера (т. е., другими словами, при выполнении этого соотношения уравнения A1) разре- разрешимы относительно х1 и у').
Лекция 9 Плоскости в аффинном пространстве.— Плоскости в про- проективном пространстве. — Многообразия Грассмаиа. Прежде чем переходить к соотношениям Плюккера, мы — в порядке непосредственного обобщения построе- построений первого семестра — займемся аффинной геометрией, а точнее — теорией m-мерных плоскостей в л-мерном аффинном пространстве. Пусть зФ — аффинное л-мерное пространство (см. оп- определение 3 лекции 1.4) и Т — ассоциированный ли- линеал. В полной аналогии с определением прямой и пло- плоскости (см. лекцию 1.4) мы введем следующее опреде- определение: Определение 1. Для любой точки Мо е s? и произ- произвольного отличного от нуля m-вектора А^Ат(У) мно- множество всех точек М i= s?, для которых .МоМЦЛ, назы- называется т-мерной плоскостью, проходящей через точку Мо параллельно m-вектору А. Этот m-вектор называется также направляющим т-вектором плоскости. При m = 1 плоскость называется прямой (ср. опре- определение 7 лекции 1.4), а при пг — п—1—гиперпло- п—1—гиперплоскостью. При пг = 0 плоскости являются точками простран- пространства зФ. Легко видеть (ср. предложение 2 лекции 1.10), что плоскость, проходящая через точку Мо параллельно m-вектору А, тогда и только тогда совпадает с пло- плоскостью, проходящей через точку No параллельно тп-век- тору В, когда пг-векторы. А и В пропорциональны (т. е. ] []) Если А = а,\ Л ... 5Л. ат и в пространстве s4> выбрана точка О, то условие М0М||Л равносильно равенству A) x = xQ + tlax+ ... -\-Гат, где х0 = ОМ0 и х = ОМ — радиус-векторы точек Мо и МТ a t\ ..., tm — произвольные числа. Равенство A) назы- называется векторным параметрическим уравнением пло- плоскости 8»
В произвольной аффинной координатной системе Ов\ ... е„ векторное уравнение A) равносильно п чис- числовым уравнениям хх = х\ + tla\ + ... + tmaxm, x" = ^ + /!af+ ... +tmanm, которые называются координатными параметрически- параметрическими уравнениями плоскости. Для задания плоскости вместо направляющего m-вектора А можно использовать соответствующее под- подпространство $Р с; У, состоящее из векторов, параллель- параллельных m-вектору А. Это подпространство называется на- направляющим подпространством плоскости, а о его век- векторах говорят, что они параллельны этой плоскости. Равенство A) означает, что точка М с радиус-векто- радиус-вектором х тогда и только тогда принадлежит плоскости, когда х — хо^!Р, т. е. когда вектор х принадлежит смежному классу Хо-\-!Р пространства У по подпро- подпространству 9>. Это мотивирует следующее определение: Определение 2. Подмножество С? линейного простран- пространства "У называется линейным многообразием, если суще- существует (очевидно, единственное) подпространство 0><zift смежным классом по которому является Q. Размерность <Р называется размерностью линейного многообразия Q. Мы можем, таким образом, сказать, что т-мерные плоскости аффинного пространства s4- — это в точности те его подмножества, которые переходят в m-мерные ли- линейные многообразия пространства У при биективном отображении Мь>х = ОМ. Другими словами, выбор точки О е зФ позволяет отож- отождествить плоскости аффинного пространства зФ с линей- линейными многообразиями линейного пространства У. Мы знаем (см. лекцию 4), что подпространства & а У можно задавать как аннуляторы семейств ковек- торов |!, ..., |р е У, т. е. условиями вида &'(*) = 0, .... ?*(*) = (). При этом вектор х&У тогда и только тогда принадле- принадлежит линейному многообразию х0 + &*, когда C) &(*)*=&, ..., 1»(х) = Ьр, «О
где Ъх = |1(жо), .... Ър = |"(дг0). Это означает, что ра- равенства C) характеризуют радиус-векторы точек соот- соответствующей плоскости пространства зФ. В координатах эти равенства имеют вид D) т. е. представляют собой систему неоднородных линей- линейных уравнений. Этим доказана следующая теорема: Теорема 1. Для любой системы линейных уравнений D) точки пространства $Ф {векторы пространства У), координаты Xх, .... хп которых удовлетворяют этой си-* стеме, составляют—когда они существуют — некоторую плоскость (линейное многообразие), причем любая пло- плоскость (любое линейное многообразие) может быть по- получена таким образом. ? Уравнения D) называются, в соответствии с этим, уравнениями плоскости (линейного многообразия). Раз- Размерность этой плоскости равна п — г, где г — ранг мат- матрицы коэффициентов системы D) (см. теорему 2 лек- лекции 4). Переход от уравнений плоскости D) к ее параметри- параметрическим уравнениям B) означает на языке алгебры на- нахождение общего решения системы D) (которое осуще- осуществляется известным нам методом; см. лекцию 2), а об- обратный переход от уравнений B) к уравнениям D)— составление уравнений, общее решение, которых имеет вид B). Так как векторы а.\, ..., ат по условию линейно не- независимы, то в составленной из их координат матрице «! найдется отличный от нуля минор порядка т. Рассмат- Рассматривая соответствующие равенства B) как уравнения относительно t1, ..., tm, мы можем по формулам Кра-. мера выразить t1, ..., tm через х1, ..., хп. Подставив затем найденные выражения в остальные п — т урав- уравнений B), мы и получим для хх, ..., хп уравнения вида D) (ср = п — т). 91
Все это означает, что геометрическая теория пло- плоскостей в аффинном л-мерном пространстве полностью равносильна алгебраической теории систем неоднород- неоднородных линейных уравнений от п неизвестных. Обе теории говорят об одном и том же, но на разных языках. Необ- Необходимо уметь без затруднений переходить от одного языка к другому. Пример 1. Тот факт, что система уравнений D) имеет единственное решение, означает, что соответ- соответствующая плоскость имеет размерность 0 и является точкой пространства s&. Отвечающее ей подпространстзо & czy состоит в этом случае только из нулевого век- вектора 0. Следовательно, система однородных уравнений имеет только тривиальное (нулевое) решение @, ..., 0). Обратно, если система E) имеет только тривиальное решение, то определяемое ею подпространство & состоит только из вектора 0. Поэтому каждый смежный класс x-j-53 состоит только из вектора х, и, значит, уравнения D) имеют единственное решение. Таким образом, мы видим, что (совместная) система D) неоднородных ли- линейных уравнений тогда и только тогда имеет един- единственное решение, когда система E) однородных линей- линейных уравнений имеет только тривиальное решение. Геометрический факт, равносильный этому алгебраи- алгебраическому утверждению, состоит просто в том, что если 53 = 0, то х0 + & = х0 для любого х0 е Т, и обратно. Аналогично, по определению вектор х тогда и только тогда принадлежит смежному классу х0 + ^*. когда он имеет вид Хо -\- а, где а<^!?. На алгебраическом языке это означает, во-первых, что сумма некоторого фиксиро- фиксированного решения системы D) с произвольным решением системы E) будет решением системы D), и, во-вторых, что любое решение системы D) может быть так по- получено. Пример 2. Гиперплоскости задаются одним линей- линейным уравнением вида F) где хотя бы один из коэффициентов Ль ..., Ап отличен от нуля (мы выбираем обозначения, максимально при- 92
ближенные к использованным в первом семестре). Если, например, А\ =?= 0, то гиперплоскость (б) проходит через точку Мо с координатами (—С/Ах, О, .... 0) парал- параллельно п — 1-вектору ах Л а2 Л ... Л ап-и где е + е а= -~ = —-~- е, • > ап—\ — ^р е\ Поскольку = е2 Л е3 Л ... Л е„ — -^-Si Л е3 Л • • • Л ея — — -^7й2 Л в! Л •• • Л еп — . . . — — е2Л Ле„_, Л е;== == -я-(Aie2 Л е3 Л ... Л еп — ^2ei Л е3 Л • ¦ • Л в„ + + Агех Л й2 Л ••• Л в„ — ... ... + (- О""' Агв, Л е2 Л ... Л в„_,), мы видим, что гиперплоскость F) параллельна п — 1- вектору Аге2 Л ... А еп— Л2е, Л е3 Л ... Л«„ + ... +(—1)л"'Лдв! Л ... Лв„_,. (Заметим, что это заключение остается в силе и при А\ = 0 (почему?).] Называя две гиперплоскости параллельными, если они параллельны одному и тому же п — 1-вектору, мы немедленно получаем отсюда, что две гиперплоскости А2х2+ ... + Апхп+С = 0 и А\хх + Кх, + • • - + А'пхп + С = 0 тогда и только тогда параллельны, когда Ап 93
При этом, если А2 Ап С At А2 — • ' ' — Ап ~ С ' то гиперплоскости не пересекаются (ибо если и то, вычтя из второго равенства пероое, умноженное на К А' п 1 | ft А мы, вопреки предположению, получили бы, что С — В частности, этим доказано (теорема един- единственности для уравнений гиперплоско- гиперплоскостей), что две гиперплоскости и тогда и только тогда совпадают, когда их уравнения пропорциональны, т. е. А\ А' С' Аналогичным образом могут быть алгебраически оха- охарактеризованы любые возможности взаимного располо- расположения произвольного числа плоскостей произвольной размерности. Мы не будем этим заниматься, поскольку в общем виде это в высшей степени громоздко, и в каждой конк- конкретной ситуации все необходимые формулы могут быть заново выведены без особого труда. Громоздкость теории плоскостей аффинного простран- пространства объясняется (хотя бы частично) существованием параллельных плоскостей. Естественно поэтому, что в проективном пространстве эта теория не- несколько облегчается (хотя и остается достаточно слож- сложной) . 94
Общее определение п-мерного проективного простран- пространства над произвольным полем К было дано в лекции I. 30. Согласно этому определению одной из моделей этого пространства является множество всех одномерных под- подпространств п-\- 1-мерного линейного пространства К"+1. Конечно, вместо Кп+1 мы можем взять любое п + 1-мер- 1-мерное линейное пространство У и, значит, любое л 4-1- мерное аффинное пространство s& с отмеченной в нем точкой О. В последнем варианте точками получающейся модели проективного пространства будут прямые про- пространства ^, проходящие через точку О, т. е. это будет уже известная нам для случая п — 2 модель «в связке» (см. лекцию 1.29). Для определенности мы будем рассматривать мо- модель Р(У), точками которой являются одномерные подпространства п -\~ 1-мерного линейного простран- пространства У. Определение 3. Плоскостью размерности г проектив- проективного пространства Р (У) называется множество всех его точек, являющихся одномерными подпространствами не- некоторого г + 1-мерного подпространства ffl а У. Таким образом, каждая г-мерная плоскость является, по определению, r-мерным проективным пространством ) Допуская определенную неточность (но зато достигая краткости речи), обыкновенно говорят, что плоскостями пространства Р {У) являются подпространства простран- пространства У (на единицу большей размерности). Так, напри- например, еще в лекции 1.29 прямые модели !?о мы отож- отождествляли с плоскостями аффинного пространства зФ, проходящими через точку О (т. е. с двумерными под- подпространствами ассоциированного линеала). Как было подробно объяснено (для случая п — 2) в лекции I. 29, проективные координаты Х° : X1 : ... : Хп то- точек пространства Р (У) задаются произвольным бази- базисом е0, еи ..., е„ пространства У. Для каждой точки М пространства Р (У) они представляют собой координа- координаты в этом базисе произвольного вектора х i= У, порож- порождающего эту точку как одномерное подпространство про- пространства У. Это означает, что координаты Х°: X1 : ... ... : Хп являются плюккеровыми координатами этого од- одномерного подпространства. Более общим образом, мы можем определить (при заданной проективной координатной системе) проектив- проективные координаты произвольной плоскости РBР(У) 95
как плюккеровы координаты подпространства 5Z. Таким образом, эти координаты имеют вид р*0'1 "•>, ioii • • • ir — = 0,1, ..., п, подчинены соотношениям Плюккера и об- обладают свойством кососимметричности. Ввиду кососимметричности координат pl°tl "'lf мож- можно без ограничения общности считать, что i0 < к <С ... ... <С ir. (Соответствующие координаты pl°il'" 'г мы бу- будем называть существенными.) Все остальные коорди- координаты /?'о'1 "¦'г либо равны нулю, либо отличаются от су- существенных только знаком. Что же касается соотношений Плюккера, то можно показать, что среди них независимых соотношений имеет- имеется ровно G) ^«.г [Хотя в следующей лекции мы найдем все соотношения Плюккера в явном виде, но это еще не даст нам сразу числа G); требуются еще дополнительные довольно изо- изощренные комбинаторные рассуждения. В следующем се- семестре мы разовьем общую технику вычисления подоб- подобного рода констант, с помощью которой число G) вы- вычисляется тривиально.] Можно развивать геометрию, основными элементами («точками») которой являются r-мерные плоскости л-мерного проективного пространства (или, что равно- равносильно, г + 1-мерные подпространства л+ 1-мерного ли- линейного пространства). Аналитически это делается на основе координат pioii-~lr> T_ е> ДруГИМи словами, по- посредством отождествления r-мерных плоскостей «-мер- «-мерного проективного пространства с имеющими координаты р1в11---1гг i0 < tj < ... <z ir, точками /^-мерного проек- проективного пространства, где Л^ = { п~_Г \ — 1. Пусть, например, г — п—1 (случай гиперплоско- гиперплоскостей). Тогда существенными координатами будут п-\-\ координат (8) ро...Т...пг ,-_(), !,...,„ (значок ~ над индексом означает, что этот индекс дол- должен быть опущен). С другой стороны, гиперплоскости задаются, очевид- очевидно, одним линейным уравнением для координат Х° i X1: ...
... : %п- При этом, как можно без труда проверить (сде- (сделайте это!), коэффициентами этого уравнения являются числа <7i = (—l)(p°v7-«, t = 0, 1, .... п. В первом семестре (см. лекции 1.29 и 1.30) для прямых на плоскости (случай л = 2, г = 1) и плоскостей в про- пространстве (случай п = 3, г = 2) мы принимали за коор- координаты коэффициенты их уравнений. Мы видим, таким образом, что плкжкеровы координаты p'o'i*" ln являются прямым обобщением этих координат. Согласно результатам лекции 8 координаты р'о •••¦*№ при г — п — 1 не подчинены никаким нетривиальным со- соотношениям Плюккера. Это означает, что при изображе- изображении гиперплоскостей точками (("„ J— 1J-мерного проективного пространства получается все это простран- пространство. Поскольку Г " J — 1 = п, мы видим, следова- следовательно, что геометрия гиперплоскостей эквивалентна гео- геометрии точек и, значит, во всяком случае не сложнее последней. Иначе дело обстоит уже для прямых в трехмерном пространстве (случай п==3 и г = 1). Здесь имеется ( Л = 6 существенных координат put\ 0 ^ i0 < h ^ 3, которые, таким образом, определяют (ввиду однород- однородности) точку пятимерного пространства КР5. Кроме того, эти шесть координат должны удовлетворять еще соотно- соотношению р01р23 _ р02р13 + р03р12 ^ 0 (см. формулу A0) лекции 8; индексы уменьшены на 1, потому что теперь они принимают значения от 0 до 3), которое определяет в КР5 «гиперповерхность второго порядка». Таким образом, мы видим, что геометрия пря- прямых в пространстве эквивалентна геометрии точек неко- некоторой «кривой гиперповерхности» пятимерного простран- пространства. Неудивительно поэтому, что геометрия прямых в пространстве существенно сложнее, скажем, геометрии плоскостей. Именно в этом причина, почему эту геомет- геометрию мы в первом семестре, по существу, полностью игно- игнорировали. 4 М.. М. Постников, сем. II 97
Конечно, еще сложнее ситуация для любых г и п. Многообразие r-мерных плоскостей л-мерного проектив- проективного пространства (= многообразие рЛ+1 (у) классов пропорциональных г + 1 -векторов п -f- 1-мерного линей- линейного пространства У) изображается точкамиГГ п J~ j — — 1J-мерного пространства, принадлежащими пересе- пересечению Nn, r гиперповерхностей второго порядка. Это пе- пересечение называется многообразием Грассмана и много лет подвергалось и до сих пор подвергается интенсив- интенсивному изучению. Однако полного представления о его гео- геометрии мы все еще не имеем.
Лекция 9а Внешнее произведение кососимметрического тензора на вектор. — Корректность его определения. — Ассоцииро- Ассоциированные векторы. — Соотношения Плюккера. Для вывода соотношений Плюккера нам понадо- понадобятся некоторые общие конструкции, имеющие и само- самостоятельный интерес. Пусть А — произвольный кососимметрический тензор степени т в линейном пространстве У. Предположив, что в пространстве У выбран базис еь ..., еп, мы мо- можем этот тензор единственным образом разложить по базисным т-векторам: Л ... Л е* (см. формулу C) лекции 8). Наша ближайшая цель со- состоит в том, чтобы определить внешнее произведение ЛЛ* тензора А на произвольный вектор х пространства У. Для вектора базиса e-t и базисного т-вектора е-н Л ••• Л е1т, где 1 <; i{ < ... < im ^ п, это есте- естественно сделать по формуле (e*j Л ... Л eifn) /\ ei = eil А • • • Л elfn Л eit а в общем случае — предполагая справедливыми свой- свойства однородности и дистрибутивности, т. е. по формуле A) ЛЛ* = (конечно, слева суммирование производится не только по tb ..., im, но также и по tm+!). Таким образом, произведение А /\х является, по оп- определению, кососимметрическим тензором степени m + 1. Если индекс im+i совпадает с одним из индексов it, ..., im, то соответствующий член суммы A) равен нулю. Пусть все индексы i\, ..., im, im+i различны. Распо- Расположив эти индексы в возрастающем порядке, обозначим 4* 99
их через /ь ..., }т+\. Таким образом, если im+x=j3, то == (/|> ' • • у Js> • • • > ]т+ 1> Js)> где значок ~ над буквой означает, что эта буква должна быть опущена. Иначе говоря, \11* '•'' 1т> *т+\) ~ \)о(\у •'•• ^а(ттг)' /аG?г+1))» где а <= 5/71+1 — подстановка A s — 1 s ... т m+ I \ I ... s—l s+ I ... т+1 s )' Поскольку, как легко видеть, отсюда в силу антикоммутативности внешнего умноже- умножения векторов вытекает, что •'.Л -.. Ле<тЛГ-*+Ч Следовательно, л ... лв/и m+i <t 771+1 2 /и1+|. где B) Число B) принято обозначать символом В этих обозначениях формула для А Лх принимает сле- следующий окончательный вид: • • • Л е,т+1. Подчеркнем, что эта формула дает определение тензора А Лх. В случае, когда А является вектором (т. е. т=\), формула C) переходит в формулу C) лекции 7 (при Xi = А и х2 = х), ибо 100
Таким образом, обе операции Л в этом случае совпа- совпадают. Ясно, что по каждому из сомножителей операция C) дистрибутивна и однородна, т. е. (аЛ + рВ) Л х = а (А Л *) + Р (В Л *). А Л (ах + $у)=а(А Л х) + $ (А Л у) для любых тензоров А, В, любых векторов х, у и любых чисел а, р <= К. В конструкции тензора А/\х участвует базис е\, ... ..., еп пространства Т, и потому следует проверить ее корректность, т. е. независимость от выбора этого базиса. Пусть Ci', ..., еп'— другой базис пространства У и пусть D) — матрица перехода в!', • • •, е„'. Тогда с', <?, от базиса в], е„ к базису и, значит, — с точностью до обозначений — мы находим- находимся в условиях предложения 2 лекции 7. Поэтому, со- согласно этому предложению, E) е.%' Л л s-s Л где — обобщенные миноры матрицы D). Формула E) описывает переход от базиса в/, Л • • • ... Л «im, l<t"i< ... <t"m<«. пространства Дт (F к его базису в/ Л • • • Л«('.К1|< • • • < i'm 1 /?г « Поэ- 101
I ... t »¦' /' тому соответствующие координаты А1'" т и Л1"" т элементов этого пространства будут связаны (см. лекцию 1.6) контрагредиентным преобразованием По определению, тензор А А х имеет в базисе «ix А — Л eim координаты Altl'" imxlm+l\ а в базисе Г/'... \' f 1 <V Л ••• A et' —координаты А11 тхт+\\% Следова- 1 т тельно, это определение корректно (приводит к одному и тому тензору) тогда и только тогда, когда эти коор- координаты связаны формулой G) =. V ... V Таким образом, нам надо доказать, что из формулы (R) вытекает формула G). Соответствующая выкладка (проведите ее обяза- обязательно!) включает в себя вычисления с определителями, хотя и достаточно простые, но несколько громоздкие. Поэтому мы выберем несколько иной путь, основанный на том, что компоненты А*1' (рассматриваемые для всех наборов индексов it, ..., im) являются координа- координатами тензора А в базисе е,-, ® ... ® eim пространства Тт(У), т. е. обладают тем свойством, что <8>ei m. С другой стороны, формула B) имеет, конечно, смысл для любых индексов /ь ..., /т+1 (а не только удовлет- удовлетворяющих неравенствам /j < ... < jm+i) и определен- определенные ЭТОЙ формулой ЧИСЛа Blx "' fm+i — Ai!l'" 'mxl'm+i] Qg_ ладают свойством кососимметричности. [Например, при транспозиции индексов /j и /г все члены в правой части формулы B)—кроме двух последних — меняют знак (по- (поскольку компоненты А1' кососимметричны), а два последних — имеющие противоположные знаки — пере- переставляются. Поэтому Btall'"tm+l = — Bfli*'"im+l. Анало- 102
гично доказывается, что числа Bfl'"lm+1 меняют знак и при транспозиции любых двух других соседних индек- индексов. Поскольку же в произведение транспозиций сосед- соседних индексов разлагается произвольная подстановка, этим все доказано.] Имея кососимметрические компоненты, тензор В = кососимметричен и, значит (в силу формулы C) лек- лекции 9), совпадает с тензором C). Этим доказано, что (8) А Л х = т. е. что числа A^1'" imxfm+1^ являются компонентами тензора А Л х. Следовательно, для доказательства корректности конструкции тензора А /\х достаточно доказать, что чис- числа А^ ' mx m+1J и A*- i'" тх m+i-i связаны тензорным законом преобразования, т. е. что (9) Л11'" /«л/|Я+1^ = с,1 ... c.m [Формула (9) равносильна, таким образом, формуле G)! Убедитесь в этом непосредственной выкладкой.] Но, по определению, m+l i' Tr __ V / l)m~s+lAl " s" m+l ,' --?> = Z <-1Г~в+1сA ... с1^ ... 'm 'm+i ' ' ,' ,/ m+l = c » ... с * ... ¦ckV+i ? (_ 1)«-ч-> 'i -"s y/n J/n+i ^i = c'1 ... cV что все и доказывает, п 103
Заметим, в заключение, что, как и следовало ожи- ожидать, если тензор А является m-вектором Xi Л ... Л хт+и то A0) ЛЛ* = ЛмЛ ••• АхтАх. Действительно, в этом случае и, значит, д*. от+1 х\ г1т *1 xtl AVl - '^Wll^V' {— /n+1 \m—s+l s-я строчка отсутствует что, согласно формуле разложения определителя по эле- элементам последнего столбца, равно c, ... Хг„ л Следовательно, A /\x — xi /\ ... /\ xm A x. ? Зафиксировав в произвольном кососимметрическом тензоре А степени т (кососимметрическом полилиней- полилинейном функционале типа @, т)) все аргументы кроме первого, мы получим тензор типа @, 1), т. е. вектор. Об этом векторе мы будем говорить, что он ассоциирован с тензором А. (Ср. определение 3 лекции 5.) Если А = А*1'" l т. е. и если мы фиксируем ковекторы g2, ..., gm, то соответ- соответствующий ассоциированный вектор х имеет координаты A1) х =А 2<" OTli2 ... \im. 104
Например, если А = Л ... Л хт, и, значит, ... X" X\ ... Xr ТО ... x" xf» . . X ... xr г1 *1 hn ¦•¦ *mtlm т. е. !*, -f ... -fDmXm, где Di, .... Dm — алгебраические дополнения элементов первой строки. Таким образом, любой вектор, ассоциированный с пг-вектором А = Xi ;Л ... Л хт, линейно выражается че- через векторы. х\, ..., Хт, т. е. (при А=фО) лежит в под- подпространстве &а (параллелен m-вектору А). Кроме того, если А ф 0, т. е. если векторы х\, ..., хт линейно независимы, то мы без ограничения общности можем считать их первыми т векторами базиса еи ..., еп. Тогда, если %2, .... %т — ковекторы е2, ..., ет сопря- сопряженного базиса, и, значит, ^(жй) = б^, то йхФО, а D-2 — ... =D,n — 0. Следовательно, х = х\. Таким об- образом, если т-вектор А=х\г/\ ... Лхщ отличен от нуля, то вектор х\ с ним ассоциирован. Но мы знаем (см. лекцию 7), что для любого век- вектора х е 0*а существуют такие векторы Ь2, ..., bm, что А=хЛЬ27\ ... ЛЬп. Следовательно, принимая за Х2, ..-, Хт. векторы 62, ..-, Ь,п, а за Х\ — вектор х, мы получаем, что каждый вектор х е Фа ассоциирован с tn-вектором А. Тем самым доказано, что вектор х тогда и только тогда ассоциирован с пг-вектором А Ф 0, когда он при- надлеоюит подпространству ЗРл. Это означает, что понятие ассоциированного вектора является обобщением на любые кососимметрические 105
тензоры понятия вектора, параллельного отличному от нуля т-вектору. К сожалению, ассоциированные векторы, вообще го- говоря, не составляют подпространства (приведите при- пример!), и потому, чтобы получить подпространство, надо рассматривать их линейную оболочку. Эта линейная оболочка называется ранговым про- пространством тензора А (а ее размерность — рангом этого тензора). Мы будем обозначать это пространство преж- прежним символом З^ Если вектор х параллелен отличному от нуля т-век- ТОру А — Х\ Л ... Л Хщ, ТО X = k\Xx -f- . . .. + kmXm, И ПО- тому А Л x = k,{A Л *i)+ ...+km(AAxm). С другой стороны, как мы знаем (см. формулу (9)), А Л xs = #! Л •-. Л хт Л xs, s = 1, ..., т, что в силу антикоммутативности умножения векторов равно нулю (поскольку справа множитель xs повторяет- повторяется дважды). Этим доказано, что для любого вектора х<^$Ра имеет место равенство A2) ЛЛ* = 0, т. е. равенство A3) д[Л — W"*+i] = o. Но, поскольку вектор х ассоциирован с m-вектором А, его координаты х' выражаются формулой A1). Поэтому равенство A3) приобретает вид Alh - tmAfm+i} Ч - <т|*я . . . l?m = О, где |?2, ..., %?т — произвольные числа. ?2, 2 т Это означает, что для любых /ь ..., jm, jm+\ поли- полилинейный функционал типа @, m—1) с коэффициен- коэффициентами равен нулю. Следовательно, его коэффициенты равны нулю. 106
Этим доказано следующее предложение (мы заме- заменяем jm+\ на i\): Предложение 1. Если кососимметрический тензор А степени m является m-вектором, то его компоненты дч ¦•• lm удовлетворяют соотношениям для всех /i, ..., lm, ib ..., tm- Это и есть соотношения Плюккера, которые мы искали. Замечание 1. Обратим внимание, что последние рассуждения полностью обратимы, и, значит, соотноше- соотношения A4) равносильны выполнению равенств A2) для любого ассоциированного вектора. Всего имеется п2т соотношений Плюккера. Однако часть из них является следствием косокоммутативности компонент А*1 "' ifn (а также косокоммутативности чи- чисел Д1;1 ¦¦-'тДЧ] *2---*т по индексам /,, ..., jm.h). Та- Такие соотношения мы будем называть тривиальными. Они не накладывают на кососимметрический тензор А ника- никаких ограничений. Например, соотношение A4) тривиально, если среди индексов /ь .... jm, k есть повторяющиеся. Поскольку при m = п это заведомо так (при m = п число этих ин- индексов равно п-\- 1, а каждый из них не превосходит п), мы видим, что при пг = п все соотношения Плюккера тривиальны. Среди нетривиальных соотношений Плюккера доста- достаточно рассматривать только соотношения, для которых /i <С ... < jm <Z ii и t2 <...<: im, поскольку все остальные соотношения отличаются от них лишь знаком. Таким образом, например при ш = п—1, рассмот- рассмотрению подлежат лишь соотношения где ? = 1, .... п— 1. Но, по определению, д\\... а-1 »п\ х ... Г... я—1 ==_ ¦у1 / l)/l~sAi '" *'"" nAsi '"^ •••я~1> где Asl'" 1 -•п~1 отлично от нуля только при з = г и при s = n (причем д»-^-»-1в=(-_1)'-1д1-»-\ 107
а А«1...Г...«-1Я=(_1)»Л1...Т...»)# Поэтому д[1 ... П-1дП] I ... Г... п-1 Следовательно, при т = п — 1 все соотношения Плюк- Плюккера также тривиальны. Это находится в полном соответствии с уже известным нам фактом, что при пг — п и пг==п—1 любой косо- симметрический тензор степени пг является т-вектором. При m = 2 соотношения Плюккера имеют вид Al'l!aAtlil* —0, т. е. — с точностью до знака — вид A5) AtxhAbb — А'ЛА'*ь + АЫАМ* = 0. Поскольку при 12==}\, /г, м соотношение (J5), как легко видеть, тривиально (если, например, i2 = j\, то в этом соотношении первые два члена сокращаются, а третий равен нулю), мы без ограничения общности мо- можем предположить, что /i <C /2 < i\ и h=^=j\, /2, i\. (За- (Заметим, что и при любом m соотношение A4) тривиально, если хотя бы один из индексов i2, ..., im совпадает с од- одним из индексов /ь ..., jm, ji,) Например, при (/ь /2, i\, 12) ==(Ь 2, 3, 4) мы получаем соотношение A6) Л12Л34 — Л13Л24 + Л23ЛИ = 0. При п = 4 возможны еще три аналогичных соотно- соотношения, но, выписав нх, мы немедленно убедимся, что они совпадают с соотношением A6). Таким образом A6) яв- является при п = 4 (и m = 2) единственным нетривиаль- нетривиальным соотношением Плюккера. Соотношение A6) было уже получено другим мето- методом в лекции 8 (см. формулу A2) лекции 8). Внимательный читатель должен был уже заметить, что мы пока еще не доказали, что соотношения A4) яв- являются соотношениями Плюккера в смысле лекции 8, т. е. что они исчерпывают все соотношения, которым должны удовлетворять координаты m-векторов. Другими словами, мы доказали только необходимость этих соот- соотношений (для того чтобы кососимметрический тензор был поливектором), но не их достаточность. Мы сделаем это в следующей лекции.
Лекция 96 Достаточность соотношений Плюккера. — Внешнее умно- умножение произвольных кососимметрическнх тензоров. — Алгебра Грассмана. — Оператор Ходжа. — Свойства опе- оператора Ходжа. Пусть Л — произвольный кососимметрический тензор степени т и пусть г — его ранг (размерность соответ- соответствующего рангового пространства ^д). Пусть, далее, еь ..., еп — такой базис пространства У, что векторы е\, ..., ег составляют базис пространства 0>А, и пусть дм ••• 1т— компоненты тензора Л в базисе еь ..., en- Предложение 1. Если хотя бы один из индексов »ь •.., im больше г, то A) Л''-'« = 0. Доказательство. В рассматриваемом базисе ко- координаты каждого вектора из &а и, в частности (см. формулу A) лекции 9а), координаты Л"'" iml\ .. . |™ произвольного ассоциированного с тензором вектора равны нулю при i > г, что ввиду произвольности чисел И2, ..-, lTm возможно только тогда, когда А1*2'" 1пг— О для любых fa, ..., im. Этим равенство A) доказано при ii > г. В силу кососимметричности компонент Л'1 '" *т это равенство справедливо поэтому а тогда, когда любой из индексов i\, ..., im больше г. ? Следствие 1. Для любого базиса х\, .... хт простран- пространства ?Ра тензор А линейно выражается через т-векторы вида xt{ A ... Л xim. Доказательство. Если базис еь ..., еп про- пространства У выбран так, что ?{ === Х\, •. ., ег = хг, то, согласно предложению 1, в разложении А Е Е А '«, Л ... Aei тензора Л по базисным m-векторам (см. формулу C) лекции 7) могут быть отличны от нуля только члены, 109
для которых im <Г г. Поэтому это разложение имеет вид Л ... A*tm. П \<iil<...<im<r l m Следствие 2. Если А =^=0, то m ^ r. Q Заметим, что если A = xx Л ... Л xm, то m — г (по- (потому что в этом случае подпространство &А порождает- порождается, как мы знаем, векторами хх, ..., хт) • Верно и обрат- обратное утверждение: Предложение 2. Если т = г, то А является т-векто- ром. Доказательство. При m = r разложение B) А= ' i содержит только один член (отвечающий индексам h = 1, ..., im — m), и потому Д = Д1 -»*! д ... Л хт. ? Теперь мы уже можем непосредственно приступить к доказательству достаточности соотношений Плюккера. Согласно замечанию 1 лекции 9а соотношения Плюк- Плюккера равносильны тому, что для любого вектора х^.0*А. Поэтому нам нужно лишь доказать, что любой кососимметрический тензор А сте- степени т, удовлетворяющий условию C), является гп-век- тором. Имея это в виду и предполагая, что A=?=Q, рассмот- рассмотрим снова произвольный базис Х\, ..., хг пространства &>&. Согласно условию, для любого s=l, ..., г имеет место равенство Л Л xs = О, которое ввиду формулы B) может быть переписано в следующем1 виде: D) Е--- Е Ah---lmx Л ... Л Xi Л ж* = 0. Если s содержится среди индексов г'ь ..., im, то со- соответствующий член суммы D) равен нулю. Поэтому ПО
можно считать, что в отношении D) суммирование ве- ведется лишь по индексам i\, ..., im, отличным от s. Но при i\, ..., im, не равных s, все /n + 1-векторы вида Xix Л • • • Л Xim Л xs, очевидно, линейно независимы (с точностью до знака они являются базисными т-\- 1-векторами пространства &а). Поэтому все коэффициенты в (сокращенной) сумме D) равны нулю, т. е. А*1'" 'т = 0, если iu •••» im=?=s. Этим доказано, что если Л*1 "" ifn =/= О, то среди ин- индексов h, .... im непременно присутствует индекс s, т. е. — поскольку индекс s был произволен — непременно присутствуют все индексы 1, ..., г. Следовательно, если т < г, то Л'» •¦•'»»¦= 0 для любых индексов гь .... im, и, значит, А =0. Таким образом, если А=/=0, то необходимо т ^ г. Но согласно следствию 2 предложения 1, всегда т г$ г (при АфО). Поэтому т = г, и, значит, согласно предложению 2, тензор Л является m-вектором. С Обсудим теперь внешнее умножение произвольных кососимметрических тензоров, которое определяется по очевидной аналогии с уже известным нам внешним ум- умножением тензора на вектор. Для базисных поливекторов естественно положить (е^ А ... Л «*Р).Л (в/, Л ... Л ejq) = = <Ji, Л ... Л eip Л в/, Л ¦•• Л е./(г (правая часть либо равна нулю, либо — после соответ- соответствующей перестановки множителей — является с точ- точностью до знака базисным р + q^-вектором). Соответ- Соответственно этому для тензоров Л= Z---E A^--lPeh Л ... Aet К1Х<... <ip<n р и ш
мы положим E) ЛЛВ- ?•••? А^-*РВ'*-'*е, л ... ... Л eip Ле,-, Л ... Л */д# В последней формуле заведомо равны нулю члены, для которых среди индексов (") А> •••» г'р> /it • ••» /$ есть одинаковые. Если же индексы F) различны, то их можно един- единственным образом представить в виде kad), •••» kaim), ГП == р + q, где k\ <C ... < ^m, a a — некоторая подстановка степени т, и тогда соответствующий член суммы E) будет равен i д _ д ^ не производится), ано, что G) А Л В = (суммирование не производится). Этим доказано, что где положено (8) Суммирование в формуле (8) распространено на все подстановки а степени т = р -+- q, которые сохраняют взаимный порядок отдельно индексов i\ lp и от- отдельно индексов /ь ...» jq, т. е. обладают тем свойством, что аA)< ... <а(р) и <х(р+1)< ... <а(т). (Такие подстановки называются иногда перетасовками типа (p,q).) Заметим, что ЛЛВе АР+д (У), т. е. deg (АЛВ) = deg A + deg 3. 112
Конечно, следует проверить корректность определения тензора А Л В, т. е. его независимость от выбора ба- базиса. Для этого, как и в рассмотренном в лекции 9а частном случае д= 1, достаточно ввести в рассмотрение числа (8) для всех индексов k\, ..., km и проверить, что а) они обладают свойством кососимметричности, 6} при изменении базиса преобразуются по тензор- тензорному закону. Действительно, тогда в силу б) тензор будет корректно определен, а в силу а) он будет совпа- совпадать с тензором А Л В. Утверждение б) проверяется простой выкладкой, по существу не отличающейся от соответствующей выкладки для случая q = 1 в лекции 9а: так как для любой под- подстановки а и любых индексов k\, ..., k'm и k{, ...,km имеет место равенство к' k k' k' k' k' ft r a(.p)r a(p+l) p a(m)==r 1 r pr p+l r m (справа содержатся те же множители, что и слева, но В другом порядке), то о k' аа(т) Сьт У. В Д Г? ... & & ... fe 1 ' Р/? Р+1 mJ n Что же касается утверждения а), то для его доказа- доказательства достаточно проверить, что числа (8) меняют знак при транспозиции любых двух соседних индексов ka и ka+u а = 1, ..., т—1, т. е., что (9) где 1\, ,.., 1Р, 1р+\, ..., 1т — переставленные индексы 113
\, ... ( — \ v. ь .. i, kp, kp+\, ..., km (так что ^a+i» если b = a, ka, если & = a+l, kb, если b =Ф a, a + 1 для любого b = 1, ..., m), а a (суммирование распространено на те же перетасовки а, что и в сумме (8)). Рассмотрим сначала случай, когда перетасовка a обладает тем свойством, что оба числа а и а + 1 содер- содержатся либо среди чисел аA), .... а(р), либо среди чи- чисел <j(p+l), ..., а(т). Если, например, а и а-\-\ со- содержатся среди чисел а (р+1),-..., a (m), то индексы ^a(l)> • • • » la(p) СОВПа-даЮТ С Индексами &a(l)» • • • » ka(p), а индексы 1О(р+\), • •., ^a(m) получаются из индексов &о(р+п, ,.., fea(m) транспозицией. Поэтому Л?a(I)'"/a!p),= ко(т)> И} довательно, —е„ To же равенство будет иметь место, конечно, и когда числа а и а + 1 содержатся среди чисел оA), ..., о{р). Пусть теперь одно из чисел а или а + 1 содержится среди чисел оA), ..., о(р), а другое — среди чисел о(р+1), ...» о(т) и пусть т — композиция подстановки ас транспозицией (а, а+1), переставляющей индексы а и a + 1. Легко видеть, что т также будет перетасовкой (т. е. будут иметь место неравенства тA)< ••• <х(р) и т(р+1)< ... <г(ш)), С другой стороны, ясно, что 1О(т) и 8Т — —е0. Поэтому Таким образом, мы видим, что каждому члену суммы (8) отвечает член суммы A0), отличающийся лишь 114
знаком (и соответствующий в первом случае той же пе- перетасовке а, а во втором — перетасовке т, получаю- получающейся из о транспозицией). Это доказывает равенство (9) и вместе с ним — корректность определения G). О Ясно, что внешнее умножение однородно, т. е. (ХА)ЛВ = А Л(ЯВ) = Я(Л А В) для любых кососимметрических тензоров А^1\{) 5еЛ'(Л и любого числа ЯеК, и дистрибутивно относительно сложения, т. е. (Ai + Л2) Л В = А1 А В + А2 А В, A A (Bi -f А>) = А А В: -f А А В2 для любых кососимметрических тензоров А, ЛьЛ2е еЛ"(Л и В,ВиВ2е=Л«{Г). Вместе с равенством дег(Д Л В) = degA -f- deg В это по определению означает, что линейные простран- пространства составляют градуированную алгебру. Эта ал- алгебра обозначается символом Д (У) и называется ал- алгеброй Грассмана линейного пространства У. Напомним, что до (F) = К, Д! (Г) = Т1 (F) = Т и Д(^) = 0 при пг>п. Очевидно, что на базисных поливекторах внешнее умножение ассоциативно, т. е. ((e?l/\ • • • Aeip) А (в/,Л • • • Aelq)) Л (е*, Л • • • Л в*г)= =(<?*, Л ... Л вгр) Л ((«/, Л ••• Л elq) Л (вй, Л •. • Л еиг)) для любых индексов iu ..., ip, /ь ..., /9, fei, ..., kr (ибо обе части этого равенства равны одному и тому же по- поливектору etl Л ... Л в/р Л в/, Л ... Л ву</ Л в*, Л ••• ... Л вАг). Поэтому внешнее умножение ассоциативно и для произвольных кососимметрических тензоров, т. е. (ЛЛВ)ЛС-ДЛ(ВЛС) для любых тензоров А <= ДР(Л. Д s Л"(Л= С s ДГ(Л- И5
[В частности это доказывает, что для любых индексов iu .... ip, ju ..., jq, k\, ..., kr. До- Докажите равенство A1) непосредственным вычислением с суммами.] Таким образом, мы видим, что алгебра Грассмана Л(У) ассоциативна. Далее, так как для подстановки а = ( J '•• р р + 1 ... р + д\ \q + l ... p + q I ... q ) имеет место, как легко видеть, равенство то для любых базисных поливекторов eil Л • • • Л «t и ejl Л • • • Л в/ справедливо тождество (в/, Л ... Л e/ff) А (е^ Л ... Л eip) = = (- \)pq (е1{ Л ... Л eip) А (в/, Л ... Л в/J. Поэтому аналогичное тождество A2) ВАА = (—1)МААВ справедливо для любых кососимметрических тензоров ДЛр(Л ВЛ'(П Свойство, выражаемое формулой A2), называется косокоммутативностью. Замечание 1. В первом издании этих «Лекций» внешнее умножение кососимметрических тензоров строи- строилось иначе: посредством конструкции, не зависящей от выбора базиса (см. ниже формулу A4)). Конечно, воп- вопрос о корректности тогда не возникал, но зато, напри- например, доказательство ассоциативности оказывалось до- довольно трудным. Для полного освоения техники работы с кососимметрическими тензорами желательно владеть обоими подходами к внешнему умножению. Поэтому мы советуем читателю проработать соответствующий мате- материал и по первому изданию (это конец лекции 6, лек- лекции 7—9 и первая половина лекции 10). Замечание 2. Все понятия и результаты, касаю- касающиеся тензоров типа @, гп), естественным образом пе- переносятся и иа тензоры типа (ш,0), т. е. на полилиней- полилинейные функционалы А: х\, ..., Хщ*—>А(хи ..., хт} от 116
векторов. Единственное отличие состоит в том, что там, где индексы были внизу, они теперь окажутся {вверху, и наоборот. В частности, компоненты тензоров типа (т, 0) имеют вид Ail...im и любой такой тензор един- единственным образом записывается в виде а в случае, когда он кососимметричен, то и в виде где е''Л ... Ле'т Нужно приобрести навык работы с такими тензорами, поскольку именно они будут играть основную роль в следующем семестре (в связи, скажем, с интегриро- интегрированием на гладких многообразиях). Задача. Докажите, что значение А{х\, ..., хп) ко- сосимметрического тензора А типа (т, 0) на векторах хи ..., хт выражается формулой A3) А(х» ..., жт) = - E-Z -¦lm ,lm Докажите также, что A4) (Л Л ?)(*,, •-., хр, хр+и для любых кососимметрических тензоров А я В соответ- соответственно типов (р, 0) и (^, 0) и любых векторов хр, Хр+и ¦ ¦ ¦, xp+q, где суммирование распространено на все перетасовки типа (р,д). Предположим теперь, что пространство У ориенти- ориентировано и евклидово. Как мы знаем из первого семестра (см. лекцию I. 15), в евклидовом ориентированном трехмерном простран- пространстве Т пространство бивекторов /\2У = У*АУ есте- естественно изоморфно самому пространству У = /\1У. 117
Оказывается, что аналогичный изоморфизм имеет место и в общем случае. Теорема 1. Для любого ориентированного евклидова п-мерного пространства У и любого г, О ^ г ^ п, суще- существует естественный изоморфизм A5) *: АГТ -> ДЯ-ГГ. На базисных r-вгкторах «г, Л • • • Л «ir, I ^ h < • • • < ir^n, соответствующих положительно ориентированному орто- нормированному'базису ех еп пространства У, изо- изоморфизм A3) действует по формуле A6) *(е*,Л .-• Л eir) =(—l)weh Л . •• A e,n_r, где /i < ... <Z jn-r — расположенные в возрастающем порядке числа отрезка [1, ..., п\ натурального ряда, отличные от чисел i\, ..., ir, a w — число инверсий в пе- перестановке (ti, ..., ir, /ь •.., /п-г). Доказательство. На первый взгляд теорема 1 кажется очевидной, поскольку формула A6) определяет, конечно, некоторый изоморфизм f\rT -> /\n~rT. Од- Однако в этой формуле участвует базис eit ..., е„ про- пространства У и суть дела состоит в том, что получаю- получающийся изоморфизм от выбора этого базиса на самом деле не зависит. Поскольку непосредственная проверка этого факта требует довольно длинных и искусных вы- вычислений (см. ниже замечание 3), мы не будем опреде- определять изоморфизм A5) формулой A6) и пойдем дру- другим путем. Евклидова структура и ориентация пространства У позволяет (см. лекцию 1.9) однозначно определить в этом пространстве некоторый элемент объема (отлич- (отличный от нуля я-вектор) е. В произвольном положительно ориентированном ортонормированном базисе еь ..., вп пространства У этот элемент объема задается формулой « = ех Л ... А еп. |Это определение корректно, так как при переходе к другому положительно ориентированному ортонормиро- ванному базису n-вектор в! Л ... /\еп умножается на определитель det С матрицы перехода С и, значит (по- (поскольку det С = 1), остается прежним.] Для каждого кососимметрического тензора Ле 1\ГУ' степени г на сопряженном пространстве У*' тензорное 113
произведение Т = г ® А является тензором типа (г, п) с компонентами где е*1"— компоненты л-вектора е, a Au.x...k —ком- —компоненты тензора А. Произведя в тензоре Т свертку по первым г индексам и разделив на г!, мы получим тен- тензор В типа @, п — г) с компонентами Так как компоненты е*1"" tftl"' in~r кососимметричны по индексам /ь ..., ir, /ь ..., jn-r и, значит, в частности, по индексам /i, ..., jn-r, то тензор В кососимметричен, т. е. принадлежит пространству $\п~гУ. Ясно, что соответ- соответствие Ah-*¦ В (определенное — заметим — без какого- либо произвола) является линейным отображением Это отображение, рассматриваемое в силу естествен- естественного отождествления У" = У как отображение f\rY-+ —> [\п~ГТ', мы и примем за отображение A5). В компонентах (относительно произвольного базиса еь ..., еп пространства Т) отображение A5) опреде- определяется, таким образом, формулой где Akl'"kr — компоненты тензора А ^ /\ГТ в базисе е\, ..., en, a gtk — метрические коэффициенты этого ба- базиса (см. в лекции 6 общие правила спуска и подъема индексов). В частности, если базис еь .... еп ортонор- мирован, то — V U-rAh--- V — 119-
(в последнем преобразовании мы воспользовались ко- кососимметричностью компонент е*< ¦"' Vi ••• in-r и д'1---'г по г, ... *,.). Поскольку компоненты е'1'"'irix'" ln~r кососиммет- ричны по всем индексам (и, значит, равны нулю, если хотя бы два индекса совпадают), то мы можем считать, что в последней сумме суммирование распространено лишь на индексы Л, ..., ir, отличные от индексов /ь ... ..., jn-r. Но так как в (единственно интересном) слу- случае, когда индексы j\, ..., /я_, все различны, это вместе с условием i\ <C ... <С ir однозначно определяет индексы г'ь ..., ir, то, следовательно, эта сумма содержит только одно слагаемое. Тем самым доказано, что в любом ортонормирован- ном базисе пространства У компоненты (*А)'1'" jn-rt 1 ^ /i < ... < jn-r ^ п, тензора * А выражаются через компоненты Л'1 " 'r, I ^ i\ <С ... <С ir ^ п, тензора А по формуле где все индексы i'i, ..., ir, j\, ..., /n-r различны (и, зна- значит, составляют некоторую перестановку чисел 1, ... ...., п). Поскольку в силу кососимметричности где w, как и выше, число инверсий в перестановке (м, .... iV, /ь •••. /п-г), и поскольку для положительно ориентированного базиса е1""— 1, тем самым дока- доказано, что в положительно ориентированном ортонорми- рованном базисе (, А)'1 •" '*-г = (— l)w Ail ••ir. Применительно к Л=«1,Л ••• Л «ir это, очевидно, дает A6). Таким образом, мы корректно построили некоторое линейное отображение A5) и показали, что в любом положительно ориентированном ортонормированном ба- базисе ей . • •, «п пространства У оно действует по фор- формуле A6). Поскольку, как уже выше было замечено, отобра- отображение, определенное формулой A6), является, очевидно, изоморфизмом, теорема 1 тем самым полностью дока- доказана. П Изоморфизм A5) называется оператором Ходжа. 120
Наглядно геометрически изоморфизм A5) сопостав- сопоставляет каждому r-вектору, рассматриваемому как г-мер- ная ориентированная площадка, ортогональную пло- площадку дополнительной размерности, п — r-мерный объем которой равен r-мерному объему данной площадки. Замечание 3. Пусть ех, . .., еп и ех>, ..., еп> — два положительно ориентированных ортонормированных базиса пространства У и пусть С—-соответствующая матрица перехода.Тогда для любых индексов i[, ..., l'r, \-^.i\<. ... < i'r^.n, векторы е1{, .... eir и е{', ..., efr будут удовлетворять условиям предложения 1 лекции 7, и потому, согласно этому предложению, будет иметь ме- место равенство где С ( .' .' ) — минор матрицы С, соответствующий 4*1 ••• lr J строкам и столбцам с номерами iv ..., ir и i[, ..., i'r соответственно. Поэтому *(et' Л ... Л еЛ Л еЛ = т. е. в понятных обозначениях (_l)""e, Л ... Ле/ == 'l 'п-т л ... Поскольку, с другой стороны, е,> Л ... Л е,' ¦= 121
этим доказано, что Здесь справа стоит произвольный минор порядка г соб- собственной ортогональной матрицы С, а слева—его ал- алгебраическое дополнение. Таким образом, мы доказали, что любой минор собственной ортогональной матрицы равен своему алгебраическому дополнению. Обратно из этого утверждения (прямое вычислительное доказатель- доказательство которого отнюдь не просто) непосредственно выте- вытекает, что формула A6) корректно определяет изомор- изоморфизм A5). На базисном векторе 1 линеала Д°^° = R оператор Ходжа действует по формуле *1 = е, т. е. по формуле * 1 = в, Л ... Л еп, а на базисных векторах еи ..., еп линеала f\lT — T (составляющих положительно ориентированный орто- нормированный базис) — по формуле *е? = (— 1)'*»! Л ... Л е{ Л ... Л еп, i=l, ..., п, где, как всегда, знак ' означает, что соответствующий множитель должен быть опущен. Поскольку оператор * определен для любых г, мы, в частности, можем применить его к тензору *А, где Де ДТ", и получить тензор ** Ле /\,1У°. При этом оказывается, что A7) **л = (_ 1)(га+1>гд для любого Де=ДгГ. Действительно ясно, что формулу A7) достаточно дока- доказать лишь для базисных r-векторов А = е^ /\ ... Л е^ 1 ^ ix < ... < ir<n. Но если А = ei{ Л • • • Л ?<г. т у, согласно формуле A.6), где хю — число инверсий в перестановке {h, ..., in, /i, ..., jn-r), a w' — число инверсий в перестановке (/i, ..., jn-r, i\, .... и). С другой стороны, если as — та- такой номер, что las ^ ls ^ las+1> s == *» • • • > Г 122
(при W<Zji считается, что а\ = 0, а при /„_,-<:*,— что. ат = п — г), то w = <2) + ... + аг и w' = (п — г — а,) + ... + (п — г — аг) (напомним, что по условию h <с ... </, и /i <С .... ... < jn-r). Поэтому w 4- w' = (п — г) г = (п 4- 1) г — — (г2 — г) и, значит, что и доказывает формулу A7). Q
Лекция 10 Кососимметрические билинейные функционалы. — Пфаф- фиан кососимметрической матрицы. — Симплектические пространства. — Симплектическая группа. — Изотропные подпространства. Изучим более внимательно кососимметрические били- билинейные функционалы на линейном пространстве У. В заданном базисе еи ..., еп пространства У каж- каждый кососимметрический билинейный функционал А мо- может быть выражен через ковекторы е1, ..., еп сопряжен- сопряженного базиса пространства У" посредством формул A) А = а1} (е1 ® в1) = Е atJ {el А е% коэффициенты ач = А (е,-, е{) которых для любых i, \ = 1, ..., п удовлетворяют соотношению пц = — а1{, т. е составляют кососимметрическую матрицу 1яц aln\\ я„1 ... апп II которая — см. лекцию 5 — называется матрицей функ- функционала А в базисе в\, ..., еп, а ее ранг — рангом функ- функционала А. Замечание 1. Столбцы матрицы B) состоят из координат ассоциированных ковекторов х\—>А(х, е,), / = 1, ..., п, и потому ее ранг равен размерности линей- линейной оболочки этих ковекторов. Поскольку эта линейная оболочка является не чем иным, как ранговым про- пространством функционала А (являющимся для функцио- функционалов от векторов подпространством сопряженного про- пространства У"), ранг кососимметрического билинейного функционала А совпадает, следовательно, с его рангом как кососимметрического тензора (см. лекцию 9а). Значение А (х, у) функционала А на любых векторах х = xlet и у = у'в} пространства У выражается косо- симметрической билинейной формой ацх1у^ от координат этих векторов, что в параллель к формулам A) можно 124
записать следующими двумя равносильными способами: C) A(x,y) i'? il ii) ?l l,(y y В матричных обозначениях первая из формул C) имеет вид А (х,у) = хтАу, где х и у — столбцы координат векторов х и у, а А—¦ матрица B). Предложение 1. Для любого кососимметрического би- билинейного функционала А существует базис еи ..., еЛ пространства У, в котором матрица этого функционала имеет вид О D) 0 —1 1 0 \ о ! —1 1 0 ; ! 1 О о 1 —1 о Доказательство. Проведем индукцию по раз- размерности п пространства У, учитывая, что при п = О предложение 1 заведомо справедливо (впрочем, оно, очевидно, справедливо и при п = 1). Если Л = 0, доказывать нечего. Пусть А Ф 0, т. е. пусть существуют такие (автоматически линейно неза- независимые) векторы х0 и у0, что А (хо,уо) Ф 0. Мы по- положим ?! = x0, e2 = Тогда А (еи е2) = 1 (а А (е2, ех) = — 1). Ясно, что множество ?Р всех векторов х е У, для ко- которых А(х, е,) —0 и А(х, е2) = 0, является подпространством пространства Ж. 125
Кроме того, для любого вектора х е У вектор х — А (х, е2)вх + А (х, ех)е2 принадлежит, очевидно, под- подпространству ZP, а если аех + Ье2 е ^>, то а = A (aei + _+. be2, e2) = 0 и, аналогично, 6 = 0. Следовательно, В частности, мы видим, что &\тЗ° = п — 2. Следовательно, по предположению индукции, при- примененному к ограничению А | & функционала А на ^, в подпространстве $Р существует базис е3, ..., еп, в ко- котором матрица функционала A\j> имеет вид D). По- Поэтому в базисе еи е2, е3, ..., еп пространства Т матрица функционала А также имеет вид D). ?И Следствие 1. Ранг г произвольного кососимметриче- ского функционала А является четным числом, п На языке бивекторов предложение 1 означает, что для любого кососимметрического билинейного функцио- функционала А ранга г = 2т в пространстве Ж существует та- такой базис ei, ..., е«, что Л = е1 Л е2 + е3 Л е4 + • • • + е2т~1 Л е2; на языке билинейных форм — что любая кососимметри- ческая билинейная форма линейным невырожденным преобразованием неизвестных может быть приведена к нормальному виду (х1у2 — х2у1) + (л:3г/4 — х4у3) + ... + (х2т-1у2т — х2ту2т-1); на языке матриц, — см. формулу E) лекции 5 — что лю- любая кососимметрическая матрица может быть представ- представлена в виде E) A=CTDC, где D — матрица вида D) (а С — некоторая невырож- невырожденная матрица). Из формулы E) непосредственно следует, что опре- определитель d&iA любой кососимметрической матрицы А является точным квадратом. Действительно, перейдя в E) к определителям, мы получим, что и detD равен либо нулю, либо {при г = п) единице. а Оказывается, что имеет место следующее значительно более сильное утверждение: 126
¦ о —1 1 0 • « 1 о I.-L 1 0 I Предложение 2. Для любого tn~^z 1 существует такой многочлен Pf Л с целыми коэффициентами от элементов кососимметрической матрицы, А порядка 2т, что F) det Л =-(Pf ЛJ, причем Pf А = 1, если матрица А имеет вид G) Этими условиями многочлен Pf А определен един- единственным образом. Доказательство. Разъясним прежде всего ра- равенство F). Пусть Р — кольцо многочленов с целыми коэффи- коэффициентами от гп{2тп — 1) независимых переменных ац, где 1 ^ i < у ^ 2т; и пусть ац = —ац при i > j и аи = 0. Пусть, далее, А — кососимметрическая мат- матрица порядка 2т с элементами ац. Тогда det А является элементом кольца Р и предложение 2 утверждает, что в Р существует единственный многочлен Pf Л, для кото- которого имеет место формула F) и который при ац, отве- отвечающих матрице G), принимает значение 1. Чтобы доказать существование этого многочлена, мы введем в рассмотрение поле отношений кольца Р, т. е. поле рациональных функций от переменных ац, 1 ^ i <C X у ^ 2т, и будем рассматривать матрицу А как мат- матрицу над этим полем. (Обратим внимание, что таким образом, мы — впервые! — существенно пользуемся по- полем К, отличным от поля R.) Согласно сделанному выше замечанию det A = (det СJ, где С — матрица из представления E) матрицы А. Поскольку элементы матрицы С принадлежат тому же полю, что п элементы матрицы А, эти элементы, — а, значит, и определитель матрицы С — являются рациональными функциями от ац. Это означает, что h(A) detC = g(A) ' где h(A) и g(A) — некоторые многочлены от ац с це- 127
лыми коэффициентами, не имеющие общих множителей {отличных от единицы). Но тогда в кольце многочле- многочленов Р будет иметь место равенство g (ЛJ det A = h(AJ, из которого следует (ввиду известной из алгебры тео- теоремы о единственности разложения многочленов с це- целыми коэффициентами на неприводимые множители), что каждый неприводимый множитель многочлена g(A) должен делить многочлен h(А). Следовательно, много- многочлен g(A) тождественно равен единице. Этим доказано, что det С является многочленом h(А) от <хц с целыми коэффициентами. Поскольку А(ЛJ =5 det А, то на матрице G) мно- многочлен h{A) принимает либо значение +1, либо значе- значение —1. В первом случае мы положим PfA— h(A), а во втором Pf Л =—h(A). Тем самым существование многочлена Pf А пол- полностью доказано. Для доказательства его единственности достаточно заметить, что — в силу той же теоремы алгебры о един- единственности разложения многочленов на неприводимые множители — соотношение F) определяет многочлен Pf Л с точностью до знака однозначно и что этот знак фиксируется условием, что на матрице G) этот много- многочлен равен единице. ?И Многочлен Р1А называется пфаффианом кососим- метрической матрицы Л. Непосредственное вычисление определителей пока- показывает, что PfA—al2 при п = 2, Pf Л = а12а34 — ai3a24 + au<h5 при п — 4. Подчеркнем, что поскольку коэффициенты многочле- многочлена Pf Л являются целыми числами, он имеет смысл для кососимметрических матриц Л над произвольным полем К, и для таких матриц сохраняется соотношение F), Легко видеть, что для любой матрицы С и любой кососимметрической матрицы А имеет место равенство (8) Pf <СТЛС) = det С Pf Л. Действительно, пусть С — матрица, элементы сц которой являются независимыми переменными, и пусть, как и выше, А — кососимметрическая матрица, элементы ац, 128
i <; /, которой также представляют собой независимые переменные (отличные от переменных Сц). Тогда в кольце целочисленных многочленов от переменных ац„ i < /, и сц будет иметь место равенство det (СТАС) = (det СJ det A, а, значит, и равенство Pf (CTACJ = (det С Pf Af (поскольку (СТАС)Т =СТАТСТТ = — СТАС, матрица Ст АС кососимметрична). Поэтому (9) Pf (CTAC) = е det С Pf A, где е = ±1. Но при значениях переменных ац и сцу обращающих матрицы А и С соответственно в матрицы G) и Е, левая часть равенства (9) равна 1, а правая г. Поэтому 8=1. Тем самым формула (8) доказана для матриц А и С с алгебраически независимыми элементами, а по- потому и для любых матриц Ли С. о Определение 1. Линейное пространство У с невы- невырожденным кососимметрическим скалярным умноже- умножением G называется симплектическим пространством (а скалярное умножение в нем—симплектическим умно- умножением) . Размерность п симплектического пространства необ- необходимо четна: п = 2т. Если характеристика char К поля К не равна двум» то в каждом симплектическом пространстве У любой вектор х изотропен (т. е. (х,х) = О). Базис в\, ..., eim симплектического пространства на- называется симплектическим, если ( 1, когда i-^.m и / = m + /, " ' \ 0 для всех остальных i и / > i, т. е. если метрические коэффициенты gij = (ег-, е;) этого базиса составляют матрицу вида где Е—единичная матрица порядка пг. 5 М. М. Постников, сем. II 125
Согласно предложению 1 в любом симплектическом пространстве У существует базис, для которого числа gu = (ei, в/) составляют матрицу вида G), т. е. такой, что Г 1, если / нечетно и / = г-4- 1, (И) (е е ,)==<_ I ' (. О для всех остальных i и / > I. Положив ( e2i-iy если 1^г^т, е, = \ , , ^ . -о г= 1, . . ., 2т—п, I е2(/_т), если т + 1 sS^ f =s^ 2/л, мы, очевидно, получим симплектический базисej, . . ., в^. Тем самым доказано, что в любом симплектическом пространстве существует симплектический базис. Замечание 2. Некоторые авторы не перенумеро- перенумеровывают базисы, доставляемые предложением 1, и назы- называют симплектическими базисы, удовлетворяющие соот- соотношению A1). В симплектическом базисе симплектическое произве- произведение векторов х — xlei и у = г/'е/ выражается форму- формулой A2) (х, у)^=(х1ут+] — xm+lyi) + .. - + (хту2т — х2тут). В соответствии с общим определением из лекции 5 линейное биективное отображение ф: У—*-Ж симплекти- симплектических пространств называется изометрией (цлшсимплек- тическим изоморфизмом), если оно сохраняет симнлек- тические произведения, т. е. если (фЖ, (ру) = (х, у) для любых векторов х, у ^ У. Из формулы A2) непосредственно вытекает," что для любых симплектическкх пространств У и W одной и той же размерности отображение У->F по равенству ко- координат в любых двух симплектических базисах этих пространств является изоморфизмом. Следовательно, по- подобно евклидовым пространствам, любые два симплек- симплектических пространства одной и той же размерности изо- изоморфны. Мы видим, таким образом, что симплектические ба- базисы играют в симплектических пространствах роль ор- тонормированных базисов евклидовых пространств. . Матрицы, яи.-:;моши<:ч-и матрицами перехода от одного симплектического базиса к другому, называются симп- 130
лектическими матрицами. Так же, как их евклидовы ана- аналоги— ортогональные матрицы (см. лекцию I. 13), симп- лектические матрицы данного порядка п (необходимо четного) образуют группу, которая называется симплек- тической группой порядка п над полем К и обозначается символом Sp(m; К), где 2т = п. Если С---матрица перехода от базиса еь ..., еп к ба- базису в,-, ..., еп> и если G — матрица \\дИ\\, gu = (в,-, в,), a G' — матрица [|gt-yil, gi-f = (eL. e7-'), то согласно об- общей форхмуле, связывающей матрицы билинейного функ- функционала в различных базисах (см. лекцию 5), G'=CTGC. Применив эту формулу к случаю, когда базисы еи ..., еп и еу, ..., еп симплектичны и, значит, матрицы G и G' являются матрицей A0), мы немедленно получим, что матрица С порядка п = 2т тогда и только тогда являет- является симплектической матрицей, когда имеет место равен- равенство где J — матрица A0). Положив ^ I! С3 С, где Сь С2, С3, С4 — матрицы порядка т, мы без труда найдем — пользуясь возможностью перемножать мат- матрицы поклеточно, — что условие A3) равносильно соот- соотношениям A4) (Заметим, что первые два из этих соотношений озна- означают, что матрицы CJC:J> и CJC, симметричны.) Перейдя в формуле A3) к определителям, мы — так же, как для ортогональных матриц, — получим, что (detCJ = l, т. е. что det С = ± I. Однако — в отличие от ортогональных матриц — равенство tie\ С =—1 на са- самом деле невозможно, т. е. каждая симплектическая матрица С унимодулярна: del С - 1. б* 131
Действительно, в силу формул (8) и A3) Pf / = Pf (CTJC) = det C Pf /, и, значит, det С = 1. Замечание 3. В силу нашей нормировки пфаф- фиана Следует иметь в виду, что многие авторы нормируют пфаффиаи требованием, чтобы Pf / = 1. Геометрия симплектических пространств (над произ- произвольным полем К) может быть теперь развита сколь угодно глубоко. За недостатком времени и места мы ограничимся лишь несколькими простыми утвержде- утверждениями об изотропных подпространствах (т. е. подпро- подпространствах ?Р, обладающих тем свойством, что {Ра!?1-), в которых симплектическая геометрия наиболее далеко уходит от привычной евклидовой геометрии. При этом мы будем предполагать, что char К =Ф2. В силу этого предположения любой вектор пространства У будет изо- изотропен (и, значит, будет порождать одномерное изотроп- изотропное подпространство). Предложение 3. Размерность р = dim $Р произволь- произвольного изотропного подпространства $Р czy не превосходит половины m размерности п = 2т пространства У°. Любое изотропное подпространство $р содержится в изотроп- изотропном подпространстве максимальной возможной размер- размерности гп. Доказательство. Так как & изотропно, то ^l. Следовательно, dim & < dim ^-L = п — dim <p, и, значит, 2dim^z>^ п. Это доказывает первое утвержде- утверждение. Для доказательства второго утверждения мы рас- рассмотрим ограничение метрического тензора пространства У на подпространстве $РХ. Так как EZ>-L)-L =^J, то — см. замечание 2 лекции 5 — это ограничение является косо- симметрическим линейным функционалом ранга dim ^-l — dim & = п — 2р = 2 (m — р). Поэтому, согласно предложению 1, в подпространстве ^J-L существует базис еи ,.., еп~р, в котором матрица 132
этого функционала имеет вид D) cm — р клетками О 1 I! | При этом р векторов е2(т-р)+\, . •., еп~Р будут составлять базис подпространства (^>±)х =&>. Добавив к этим век- векторам векторы ех, е3, ..., е2(т-Р)+\, мы получим т век- векторов, порождающих изотропное подпространство раз- размерности т, содержащее подпространство 53. п На основании предложения 3 мы будем - называть изотропные подпространства ?Р размерности т макси- максимальными. Они характеризуются тем, что ?РХ=?Р. Для любого симплектического базиса в\, ..., еп про- пространства У и любого подмножества К множества {1, . . . , т} векторы elt I ^ К, и em+i, / ф К, порождают m-мерное изотропное подпространство <рк простран- пространства У. Оставляя неизменным базис в\, ..., еп и варьи- варьируя множество К, мы получим таким образом 2т изо- изотропных подпространств вида ^V Предложение 4. Для любого максимального изотроп- изотропного подпространства $Р czY существует такое макси- максимальное изотропное подпространство ?Р&, что Подпространство !?& можно выбрать среди подпро- подпространств вида &к, отвечающих произвольному наперед заданному симплектическому базису еи ..., еп про- пространства У. Доказательство. Пусть 5эо = 5эи т\ —под- —подпространство, порожденное первыми т векторами в\, ... ..., ет данного симплектического базиса, и пусть К — такое подмножество множества {1, ..., т}, что векторы ей ь ^ К, порождают в 5^0 подпространство ??, дополни- дополнительное к подпространству ^оП^3 (см. замечание 1 лек- лекции 3). Так как ^0 Г) & <= & = 0>± и Qci&>K = &>±, то и, значит, & П &*к <=^ &*?¦ = &Q- Следовательно, ^ П &к = (^ П ^о) П {?к П ^о) = (^ П ^о) П Q. = 0. Поскольку dim^-f- dim 5^ = я, этим доказано, что Так как пространство У является пространством с не- невырожденным скалярным умножением, то оно естественно 133
изоморфно сопряженному пространству У, и легко видеть, что композиция вложения 9*-*-У, изоморфизма У —^*~ У и отображения ограничения У -*-&" представ- представляет собой изоморфизм A5) Действительно, ядром гомоморфизма У-^-?Р' является, очевидно, подпространство &*х, а так как ?РХ = & и $А [}<?# = 0, то на подпространстве ^# этот гомомор- гомоморфизм инъективен и потому — ввиду равенства размер- размерностей пространств ?Р* и &' — является изомор- изоморфизмом. Q Отсюда следует, что для любой пары (&>, &*) взаимно дополнительных изотропных подпространств существует такой симплектический базис ех, ..,, еп пространства"/0, что A6) <? = [е„ ..., ет] и 0>*=*[ет+1, ..., еп]. Действительно, пусть е>, ..., ет — произвольный базис подпространства 53, а ет+\, ¦¦-, еп — базис подпростран- подпространства й5*, переходящий при изоморфизме A5) в базис е1, ..., ет пространства &', сопряженный базису еи ..., ет. Тогда векторы еи .... ет, ет+и ..., еп со- составляют симплектический базис пространства У, обла- дающ-ий свойством A6). ? Это означает, что любые две пары {$>, <р#) и (Q, Q&) взаимно дополнительных изотропных подпространств одинаково расположены в пространстве У, т. е. суще- существует изометрия ф: У~*-У, переводящая подпростран- подпространство & в подпространство Q\ а подпространство ^= в подпространство Q#. (Изометрией ф будет отображение по равенству координат в таких симплектических бази- базисах еи ..., еп и fb ..., fn, что & = [еь em], Q — [f Ы &*=[ет+1, ..., еп], С«==[/ f}) Подчеркнем, что все эти результаты справедливы в предположении, что char К Ф 2.
Лекция 11 Симметрические билинейные функционалы. — Квадратич- Квадратичные функционалы и квадратичные формы. — Теорема Лагранжа. По аналогии с кососимметрическими функционалами симметрические полилинейные функционалы определяют- определяются как функционалы В из ТР{Т) (или изТр(Т)), значе- значения которых не меняются при любой перестановке аргу- аргументов. Однако в общем случае теория таких функцио- функционалов оказывается очень сложной и о них до сих пор мало что известно. Исключением является лишь случай р = 2, т. е. случай билинейных функционалов. Этими функционалами мы и займемся. Для определенности мы будем рассматривать функционалы от векторов (т. е. из Т2(Л). При этом мы будем предполагать, что char \\ф2. Согласно общим результатам лекции 5, при заданном базисе еи ..., еп пространства У каждый симметриче- симметрический билинейный функционал В выражается через ко- векторы е\ ..., еп сопряженного базиса пространства У" посредством формулы коэффициенты Ъц = В (ег-, е,-) которой составляют мат- матрицу II &и ... Ъ\п II A) В = \\ , II ипЛ • • • ипп II называемую матрицей функционала В в базисе еь ..., еп (и ранг которой — независимо от выбора базиса ех, ... ..., еп — называется рангом функционала В). При этом для значения В (х, у) функционала В на векторах х = xlei и у — у!е; имеет место формула B) В(х, y) = bilxiyi, означающая, что это значение является билинейной фор- формой от координат векторов х и у. В матричных обозна- обозначениях формула B) имеет вид В(х, у) = хгВу, где хну — столбцы координат векторов хну. 135
Симметричность билинейного функционала В по оп- определению означает, что В (у, х) = В (х, у) для любых векторов х, у^Т. При х — ег- и у = е> от- отсюда в частности следует, что Ъц = 6/г-, т. е. что матрица A) симметрична. Обратно, если матрица A) симметрична, то для лю- любых векторов х и у имеет место равенство В {у, х) = Ьиу1х! = Ь,{у*х1 (переименовали индексы) =zblixlyi (использовали симметричность) = В {х, у), показывающее, что функционал В симметричен (см. со- соответствующее рассуждение в лекции 8 для кососиммет- рических функционалов). Таким образом, билинейный функционал В тогда и только тогда симметричен, когда симметрична его мат- матрица. Замечание 1. Так же как и для кососимметри- ческих функционалов, аналогичное утверждение справед- справедливо для симметрических функционалов любой степени, т. е. функционал тогда и только тогда симметричен, когда его коэффициенты не меняются при любой перестановке индексов. Определение 1. Функционал Q: x*~>Q(x)<=K назы- называется квадратичным, если существует такой билиней- билинейный функционал В, что C) Q(x) = B(x, х) для любого вектора же У. Ясно, что все квадратичные функционалы составляют линейное пространство (являющееся подпространством линейного пространства всевозможных функций У->~К). Представив В в виде суммы симметрического и косо- симметрического функционалов (см. формулу A2) лек- лекции 5) и приняв во внимание, что А (х, х) — 0 для любого кососимметрического функционала Л, мы немедленно по- получим, что без ограничения общности функционал В в формуле C) можно считать симметрическим, 136
Легко видеть, что тогда функционал В однозначно восстанавливается по функционалу Q, т. е., другими сло- словами, соответствие является биективным соответствием между линейными пространствами симметрических билинейных и квадра- квадратичных функционалов. Действительно, ясно, что если Q(x)— B(x, х) и функционал В симметричен, то Q (* + у) - Q (*) - Q (у) ^в (х> ^ для любых векторов х, уеУ (напомним, что по усло- условию char К Ф2). ? Поэтому в принципе совершенно безразлично, рас- рассматривать симметрические билинейные или квадратич- квадратичные функционалы: любое утверждение о квадратичных функционалах можно переформулировать как утвержде- утверждение о симметрических билинейных функционалах, и на- наоборот. В качестве основных мы выберем квадратичные функционалы, переформулировку же утверждений о них на язык симметрических билинейных функционалов мы оставим читателю. Для упрощения обозначений симметрический били- билинейный функционал, соответствующий квадратичному функционалу Q, мы будем обозначать тем же символом Q. Его ранг мы будем называть рангом квадратичного функционала Q. В каждом базисе еи ..., еп пространства У квадра- квадратичный функционал Q задается его матрицей 4) |«.".V II Яш •¦ элементы которой определяются формулой qij = Q(ei, e,), i, /==1,... п. Матрица D) является квадратной симметрической мат- матрицей порядка п, и соответствие «функционал» i—5- «его матрица» представляет собой биективное соответствие между мно- множеством всех квадратичных функционалов на У и мно- множеством всех симметрических матриц порядка п с эле- элементами из поля К. Это соответствие зависит от выбора 137
базиса: в другом базисе матрица D) умножится слева и справа на матрицы С1" и С, где С — матрица перехода. Считая базис фиксированным, мы, чтобы не вводить но- новых букв, будем обозначать матрицу D) тем же симво- символом Q, что и квадратичный функционал. Поскольку ковекторы из У" являются, по определе- определению, К-значными функциями на У, для любых двух ко- векторов 1, Tj <= У" формула (&!)(«)—!(*)Ч (*). х^Т, определяет их произведение \х\: У-*-К. Сравнив опреде- определения, мы немедленно получим, что функционал Ъц яв- является квадратичным функционалом, отвечающим (не симметрическому]) билинейному функционалу %®ц. В частности, билинейному функционалу е1 ® е' отве- отвечает квадратичный функционал е1е> и, значит, билиней- билинейному функционалу q^e1 ® е> — квадратичный функционал qije'ef. Этим доказано, что любой квадратичный функ- функционал Q выражается через ковекторы в1, ..., еп сопря- сопряженного базиса по формуле + g^ (e2J + - • • + 2q2ne^en + где qu — элементы матрицы D). Для значения Q(x) функционала Q на произвольном векторе х==х1в{ пространства У отсюда вытекает фор- формула 4- q-я (х2J + . .. + 2q2nx2xn + или, в матричных обозначениях, — формула E) Q(x) = XrQX, где х — столбец координат вектора х, a Q — матрица D). Определение 2. Многочлен Q(jc1, .... хп) от перемен- переменных хх, ..., хп называется квадратичной формой, если он однороден (все его члены имеют одну и ту же степень) и его степень равна 2. (См. лекцию 1.12.) 13а
Любая квадратичная форма имеет вид Q (лл, • • •, хп) = qijxixi = = qn{x'f + 2qi2x'xi + ... + 2qlnxlxn 4- 922 U2J -Ь ... -Ь 2^2пх2хя и потому однозначно определяется матрицей 1Чи Ян ¦¦¦ Я\п II Чп\ Яп.2 ¦ ¦ ¦ Чпп II которая называется матрицей этой формы. Таким образом, мы видим, что значение Q{x) произ- произвольного квадратичного функционала Q на векторе х^У выражается квадратичной формой = Q(jc1, ..., Xя) от координат х1, ..., хп этого вектора. Это устанавливает (зависящее от выбора базиса) биективное соответствие между квадратичными функ- функционалами и квадратичными формами. Определение 3. Две квадратичные формы называются эквивалентными, если они соответствуют одному и тому же квадратичному функционалу в различных базисах. Можно также сказать, что две квадратичные формы эквивалентны, если для их матриц Qx и Q2 имеет место равенство вида C где С — некоторая невырожденная матрица. Если же ввести в рассмотрение однородные линейные преобразования G) __ спх\ _!_,__!_ спх с невырожденными матрицами -1 с1 '1 ••• сп с, ... с. о, '1 •••'-« то молено будет сказать, что форма О\(хх, ..., хп) экви- эквивалентна форме Qz(x\ ..., хп), если существует такое 139
преобразование G), что, обозначив переменные формы Qi символами у\ ..., у" и подставив вместо них выра- выражения G), мы получим форму Q2. В соответствии с общими определениями лекции 5 векторы х и у пространства У называются Q-ортого- налъными, если Q(x, y) = 0. Базис еи ..., еп пространства У мы будем называть Q-ортогональным, если (8) Q{ei,ej) = Q при i Ф /. Теорема 1 (теорема Лагранжа)". Для любого квадратичного функционала Q на У существует Q-орто- гональный базис еи ..., е^ пространства У. Доказательство. Мы не только докажем эту теорему, но и укажем практический алгоритм, позволяю- позволяющий произвольный базис пространства У преобразовать в базис, обладающий свойством (8). Этот алгоритм называется алгоритмом Ла- Лагранжа. Он состоит в последовательном применении трех элементарных преобразований, одно из которых мы назовем основным, а два остальных — вспомогатель- вспомогательными. Основное преобразование Лагранжа. Это преобразование применяется к базису еи ..., еп> если Оно переводит этот базис в базис e\ = ev со ct I *^о» (9) е' _: _ j?i«. e 4- e Полученный базис обладает тем свойством, что его пер- первый вектор Q-ортогонален всем остальным: Q (е\, е\) = 0 при * > 1. Действительно, Q (е[, е\) = < 140
Если теперь q'22 — Q (e2, eQ ф О, то применяя к век- векторам е2, ..., е'п(т. е., точнее, к ограничению функцио- функционала Q на подпространстве [е2, .... е^] ) то же преобра- преобразование, мы получим базис е", е", ..., е", первые два вектора которого е" и е" будут Q-ортогональны друг другу и остальным векторам, и т. д. В случае, когда это построение до самого конца' не останавливается, т. е. каждый раз (пока мы не исчер- исчерпаем базис или не получится нулевой функционал) ос- основное преобразование применимо, теорема 1 окажется тем самым доказанной. Этот случай называется регу- регулярным. Если же на некотором этапе основное преобразова- преобразование (9) оказывается неприменимым, то следует сделать вспомогательные преобразования, в результате которых получается базис, к которому преобразование (9) уже применимо. Первое вспомогательное преобразова- преобразование. Это преобразование применяется в случае, когда qu = О, но существует такой индекс i0, что qt . фО. Оно состоит в перестановке /о-го вектора базиса на первое место: ^1 = в/п» &io === в], e'i = ei, если i ф 1, /0- Очевидно, что в новом базисе q'n ф 0. Второе вспомогательное преобразова- преобразование. Это преобразование применяется в случае, когда qu = 0 для всех i = 1, ..., п, но функционал Q не нуле- нулевой и потому существуют такие индексы /0 и /о, что (ЦыФО. Если, например, д^^О (это предположение общности, конечно, не ограничивает), то рассматривае- рассматриваемое преобразование задается формулами е\ = в\ -р в2, ei±=ei, если г^2. Тогда я'и = Q Wi) == Q (ei + е2, е\ + е2) = 2ql2 ф 0 и можно применять основное преобразование. Ни одно из этих преобразований не применимо толь- только тогда, когда все коэффициенты qtj равны нулю, т. е. 141
когда Q = 0. Но в этом случае любой базис, очевидно, Q-ортогонален, и потому делать с ним ничего не надо. Следовательно, применяя в нужной последовательно- последовательности наши преобразования, мы рано или поздно получим Q-ортогональный базис. П В Q-ортогональном базисе матрица формы Q, очевид- очевидно, диатональна, т. е. имеет вид (Ю) и, значит, 0 0 Q (х) = Х-, (х1J + . . . + Кп (хп? для любого вектора х. Поэтому на языке квадратичных форм теорема Лагранжа утверждает, что любая квад- квадратичная форма Q(x\ ..., хп) эквивалентна форме вида О форме A1) говорят, что она имеет нормальный вид. Таким образом, мы видим, что любая квадратичная форма Q(x*, ..., к") невырожденным линейным преоб- преобразованием G) может быть приведена к нормальному виду A1). Последнее утверждение, также известное как тео- теорема Лагранжа, полностью относится к алгебре, и в нем исчезли все следы его геометрического происхож- происхождения. Поэтому оно применимо к квадратичным фор- формам, возникающим в любых вопросах (скажем, в меха- механике), априори никак не связанных с геометрией ква- квадратичных функционалов. На практике приведение квадратичной формы Q(x\ ..., хп) к нормальному виду следует проводить, последовательно «выделяя квадраты», т. е. пользуясь тождеством Q(xK ...,xre)=-^7{g,,*l+ ...+?|п/J + б'(х2, ...,ха), где форма Q' уже не содержит, как легко видеть, пере- переменной хх. Это тождество соответствует основному пре- преобразованию Лагранжа. В нерегулярном случае, кроме 142
того, приходится перенумеровывать переменные и поль- пользоваться преобразованиями вида У{ — xt, если / ^ 2. Часть коэффициентов ^ь ..., Хп (или все они) формы A1) может быть равна нулю. Ясно, что число г отлич- отличных от нуля этих коэффициентов равно рангу матрицы F) и, следовательно, рангу функционала Q. Перестав- Переставляя, если нужно, элементы базиса, мы всегда можем до- добиться того, чтобы были отличны от нуля первые коэф- коэффициенты Я,1, ..., К. Поскольку членов с коэффициен- коэффициентами, равными нулю, писать не нужно, мы окончательно получаем, что нормальным видом квадратичной формы ранга г является форма А-! (х1J + • • ¦ + К (хгJ, где кх =& 0, .... Хг Ф 0.
Лекция 12 Теорема Якоби. — Квадратичные формы над полями комплексных и вещественных чисел. — Закон инерции. — Положительно определенные квадратичные функциона- функционалы и формы. Напомним, что квадратичная матрица называется треугольной (точнее, верхнетреугольной), если все ее элементы, расположенные ниже главной диагонали, рав- равны нулю. Определитель такой матрицы равен, очевидно, произведению ее диагональных элементов. Поэтому тре- треугольная матрица тогда и только тогда невырождена, когда все ее диагональные элементы отличны от нуля. Особо важное значение имеют треугольные матрицы, все диагональные элементы которых равны единице. Такие матрицы мы будем называть унитреугольными матри- матрицами. Непосредственное вычисление показывает, что произ- произведение двух (уни) треугольных матриц и матрица, об- обратная (уни) треугольной матрице, также являются (уни)треугольными матрицами. Поскольку матрица основного преобразования бази- базисов в алгоритме Лагранжа является унитреугольной матрицей <7l2 <?lra <7п Яп О мы видим, следовательно, что в регулярном случае пере* ход к Q-ортогональному базису осуществляется унитре- унитреугольной матрицей. Пусть А— произвольная квадратная матрица по- порядка п и пусть 1 ^ k <: п. Вычеркнув из матрицы А последние п — k строк и п — k столбцов, мы получим квадратную матрицу порядка k. Определение 1. Эта матрица называется главной под- подматрицей порядка k матрицы Л, а ее определитель — главным минором порядка k матрицы А. Пусть Q и О/ — матрицы квадратичного функционала Q в двух базисах еь ..., еа и еи ..., е'п, связанных 144
унитреугольной матрицей перехода С. Тогда имеют ме- место следующие очевидные утверждения: а) Главная подматрица С* порядка k матрицы С является матрицей перехода, связывающей базисы в[, ..., ек и е\, ..., ей подпространства ^ = [e1, ... б) Ограничение Q \&k функционала Q на подпро- подпространстве !?k является квадратичным функционалом, матрицей которого в базисе ei} ..., еь. является главная подматрица Qn порядка k матрицы Q, а в базисе е[, ..., е'к — главная подматрица Q'k порядка k матри- матрицы Q'. Отсюда следует, что для любого k = 1, ..., п. Переходя к определителям и учитывая, что detCk == det Cft == 1» мы получаем, следо- следовательно, что A) detQ'ft = detQft для любого k = 1, В частности, если п. О О то detQA для любого k = 1, ..., п. Этим доказано (мы переходим на язык квадратичных ) д д (l ) р р форм), что если для квадратичной формы Q(xl, фф хп) р р фр ( имеет место регулярный случай, то коэффициенты А,ь ..., Яге ее нормального вида удовлетворяют соотноше- соотношениям B) п, где Оь — главные миноры ее матрицы. Заметим теперь, что, производя основное преобразо- преобразование алгоритма Лагранжа, мы каждый раз получаем отличный от нуля коэффициент Я,г- (например, при самом первом преобразовании получается коэффициент 145
^i = qu Ф 0). В регулярном случае процесс останавли- останавливается, когда после некоторого (скажем, г-ro) шага мы получаем тождественный нуль (так что все остальные коэффициенты V+i, ..., А,я оказываются равными нулю). Отсюда и из соотношений B), во-первых, вытекает, что в регулярном случае C) ОХФЪ, ..., Огф0, где г—ранг формы (функционала), и, во вторых, — что Dj_ . Dr h * ••"' Кт~ Dr-: ' ?)i, Ao = M» Обратно, предположим, что для матрицы квадратич- квадратичной формы имеют место неравенства C), где г — ее ранг. Тогда, поскольку qn — D\ Ф0, к форме применимо основное преобразование алгоритма Лагранжа. Согласно формулам A) главные миноры полученной после преоб- преобразования матрицы Q' будут совпадать с главными ми- минорами матрицы Q, и потому эта матрица по-прежнему будет обладать свойствами C). Но главный минор D2 матрицы Q' равен, очевидно, произведению <7п<722 (где Qn — <7и = ^.i), и значит, q-яфЪ- Следовательно, к ог- ^>аничению функционала Q на подпространстве е2' '¦> еп\ снова применимо основное преобразова- преобразование Лагранжа и т. д. После г шагов мы получим матрицу вида D) 0 0 \G\ где %\ Ф 0, ..., X, ф 0 и G — некоторая матрица. Но так как матрицы квадратичного функционала во всех оа- оазисах имеют один и тот же ранг л, то матрица D) также имеет ранг г, что, очевидно, возможно только тогда, когда все элементы матрицы G равны нулю. Таким образом, матрица D) является матрицей ква- квадратичной формы в нормальном виде, а поскольку мы получили ее лишь основными преобразованиями алго- алгоритма Лагранжа, то, следовательно, для исходной фор- формы имеет место регулярный случай. Тем самым нами доказана следующая теорема: 146
Теорема 1 (теорема Я ко б и). Для квадратичной формы ранга г тогда и только тогда имеет место регу- регулярный случай, когда первые г главных миноров ее матрицы отличны от нуля: D, ФО Dr Ф 0. Алгоритмом Лагранжа такая форма приводится к виду Эта теорема часто бывает очень полезна. Дальнейшее упрощение нормального вида E) М*'J-т- ••• + квадратичной формы зависит от арифметических свойств поля К. Самый простой случай возникает при К=.С<. В этом случае преобразованием вида yr = мы можем привести форму E) к виду (мы опускаем штрихи в обозначении координат) F) (а:1J + . . . 4- (xrf. Этим доказано следующее предложение: Предложение 1. Любую квадратичную форму над по- полем С \(т. е. с коэффициентами из С) линейным невы- невырожденным преобразованием переменных (тоже с коэф- коэффициентами из С) можно привести к виду F), где г — ранг формы. ? Иначе говоря, любая квадратичная форма Q(x\ ... ..., хп) ранга г над полем С имеет вид где <pi(jr), ..., фг(х) — линейно независимые линейные формы от х1, ..., х", 147
Следствие (теорема классификации квад- квадратичных форм над полем С). Две квадратич- квадратичные формы над полем О тогда и только тогда эквива- эквивалентны., когда их ранги одинаковы. с Над полем R вещественных чисел мы можем сделать преобразование приводящее форму E) (после, быть может, дополни- дополнительной перестановки координат) к виду (мы снова опускаем штрихи у координат) G) (л:'J + • • • + (хрJ - (хр+1J - ... — (xrf, где г—ранг формы, а р — некоторое число (удовлетво- (удовлетворяющее неравенствам 0 ^р ^ г). Этим доказано следующее предложение: Предложение 2. Любую квадратичную форму над по- полем R линейным невырожденным преобразованием пе- переменных можно привести к виду G), где г — ранг фор- формы, а О ^ р ^ г. П В связи с предложением 2 немедленно возникает во- вопрос, нельзя ли данную квадратичную форму привести к двум формам вида G) с различными р, т. е., другими словами, не могут ли две формы вида G) с различными р быть эквивалентны (над полем R). Оказывается, что ответ на этот вопрос отрицателен: Предложение 3 (закон инерции квадратич- квадратичных форм). Если две формы '8) (х1J + ... + (хрJ — {xp+xf — ... — (хУ и (9) {у1? + ... + ОТ - (у"+ О2 - ... эквивалентны (над полем R\, то р — q. 148
Доказательство. Эквивалентность форм (8) и (9) означает, что они являются выражениями в двух раз- различных базисах еь ..., еп и /ь ..., fn одного и того же квадратичного функционала Q, заданного в /г-мерном линейном пространстве У. Пусть 9* — подпространство пространства У, порожденное векторами в\, ..., ер, а Q — подпространство пространства У, порожденное век- векторами /,+ь •-.,/«: ..^=[в„ ..., ер), Q = [fq+X, ..., fn). Поскольку в базисе еи ..., е„ функционал Q выража- выражается формой (8), для любого отличного от нуля вектора х е 9* имеет место соотношение Аналогично, для любого вектора ys$ мы имеем Q (У) == - (yq+lf - ... — (УгJ < 0. Поэтому ^A^ = 0, т. е. подпространства ^ и Q дизъ- дизъюнктны, и, значит (следствие 2 теоремы 1 лекции 1)» для их размерностей справедливо неравенство dim ^4- dim ??</г, т. е. неравенство р + (п — ?)< п, равносильное неравенству Аналогично доказывается, что q ^ р. Следовательно, p = q. ? Предложение 3 обеспечивает корректность следую- следующего определения: Определение 2. Число р «положительных квадратов» в приведенной форме G) называется положительным индексом инерции данной квадратичной формы (квадра- (квадратичного функционала), а число г — р «отрицательных квадратов» — ее (его) отрицательным индексом инерции. Кроме того, из предложения 3 немедленно вытекает следующее следствие: Следствие (теорема классификации квад- квадратичных форм над полем R). Две квадратич- квадратичные формы над полем R тогда и только тогда эквива- 14»
лентны, когда совпадают их ранги и индексы инер- инерции. ? Особо важное значение в линейных пространствах над полем R имеют квадратичные функционалы Q, об- обладающие тем свойством, что Q(x)^>0 при х Ф 0. Их значение определяется тем, что соответствующие сим- симметрические билинейные функционалы — это в точности всевозможные скалярные умножения па. У в смысле определения 2 лекции 1.12 (евклидовы структуры). Определение 3. Квадратичный функционал Q на ве- вещественном линейном пространстве У называется поло- оюительно определенным, если О(х)> 0 для любого век- вектора хфО. Квадратичная форма Q(x\ ..., х") называется поло- положительно определенной, если она является выражением положительно определенного функционала в некотором базисе, т. е., иными словами, если Q(x\ ..., хп) > 0 при (х\ .... х*)?*@, ..., 0). Матрица Q называется полоокительно определенной, если она является матрицей положительно определен- определенного квадратичного функционала (квадратичной фор- формы), т. е., иными словами, является матрицей метриче- метрических коэффициентов некоторого базиса евклидова про- пространства (см. лекцию 1.12). Предложение 4. Квадратичный функционал (квадра- (квадратичная форма) тогда и только тогда положительно опре- определен (определена), когда его {ее) ранг и положител.ь- ный индекс инерции равны п: г = п, р — п. Доказательство. Если р = г — п, то в некото- некотором базисе функционал Q выражается формой (X1J + . . . + (ХП)\ и, значит, Q(x) = 0 тогда и только тогда, когда х1 = = 0, ... , хп — 0, т. е. когда х = 0 Обратно, если р <Z п или г < л, то в некотором ба- базисе ей ..., еп функционал Q выражается формой вида Q'(xK .... хп-1)-\-е{хпJ, где Qf(x\ ..., хп~^) — квадратичная форма от координат 'х1, .... л-"-1, а е ^ 0. Тогда Q(en) — e ^ 0, и, следова- следовательно, функционал Q не положительно определен. ? 150
Это предложение требует предварительного приведе- приведения формы к нормальному виду и потому на практике, как правило, бесполезно. Более интересно следующее предложение, дающее необходимые и достаточные усло- условия положительной определенности квадратичной фор- формы непосредственно по ее матрице: Предложение 5 (критерий Сильвестра). Мат- Матрица Q тогда и только тогда положительно определена, когда все ее главные миноры положительны: Я и Яи <7i2 Яг\ Чгг О, Я\\ Яг\ Яг\ <7l2 <722 032 <7is <723 <733 >0, Яп\ Япп Доказательство. Если все главные миноры мат- матрицы Q положительны (и, следовательно, отличны от нуля), то по теореме 1 для квадратичной формы с мат- матрицей Q имеет место регулярный случай и эта форма приводится к виду + (хп)\ где Z)i > О, ?>2 > О, ...,?>„> О. Таким образом, р = = г = п, и потому форма (а значит, и матрица) поло- положительно определена. Обратно, если форма с матрицей Q положительно оп- определена, то она приводится к сумме п квадратов, т. е. к форме с единичной матрицей Е. Поэтому матрица Q имеет вид Q = СТС, где С—некоторая невырожденная матрица. Следова- Следовательно, detQ==(detCJ> 0. Этим доказано, что определитель положительно опреде- определенной матрицы положителен. С другой стороны, положив в квадратичной форме Q(xl, ..., х") от п переменных п — k последних перемен- переменных хк+1, ..., х" равными нулю, мы получим квадратич- квадратичную форму 151
от k переменных Xх, ..., xk, для которой будут, очевид- очевидно, справедливы следующие утверждения:, а) Если форма Q(х\ ..., хп) положительно опреде- определена, то форма Qk(xl, ..., xk) также положительно опре- определена. б) Матрицей формы Qk(xl, ..., xk) служит главная подматрица Q& порядка k матрицы формы Q(x\ ..., хп). Следовательно, в силу сделанного выше замечания все главные миноры Dk, «= 1, ..., п, положительно оп- определенной матрицы положительны. П Предложение 5 отвечает, в частности, на поставлен- поставленный в лекции I. 6 вопрос о необходимых и достаточных условиях, которым должна удовлетворять квадратная матрица для того, чтобы она была матрицей коэффи- коэффициентов некоторого базиса евклидова пространства.
Лекция 12а Псевдоевклидовы пространства. — Псевдоортонормиро- ванные базисы и псевдоортогональные матрицы. — Соб- Собственно псевдоевклидова геометрия плоскости. — Углы на псевдоевклидовой плоскости. — Парадокс близнецов. Определение 1. Линейное пространство У над полем: R с симметрическим скалярным умножением называется псевдоевклидовым. Аффинное пространство s4 над по- полем R называется псевдоевклидовым, если структура псевдоевклидова пространства введена в его ассоцииро- ассоциированный линеал У. Псевдоевклидово пространство У (или S4-) с невы- невырожденным скалярным умножением называется невы- невырожденным. В дальнейшем мы всегда будем предполагать — если только явно не оговорено противное, — что все рассма- рассматриваемые псевдоевклидовы пространства невырождены. Индекс инерции р скалярного умножения в Т назы- называется индексом (невырожденного) псевдоевклидова пространства У (или ?#¦), а пара (р, q), где q = п — р„ п — dim У, — его типом (или сигнатурой). Евклидово пространство (в смысле определения 3 лек- лекции 1.12) —это невырожденные псевдоевклидовы про- пространства индекса п. Свойства псевдоевклидовых пространств типов (р, q) и (q, p) получаются друг из друга тривиальными пере- переформулировками. Поэтому обычно предполагают, что р ^ q, т. е. что 2р ^ п. Псевдоевклидово пространство индекса 0 (т. е. с от- отрицательно определенным скалярным умножением) на- называется антиевклидовым. Его геометрия переходит в евклидову после умножения всех скалярных произведе- произведений на —1. Замечание 1. Некоторые авторы псевдоевклидовы пространства называют евклидовыми, употребляя термин «псевдоевклидовы» лишь для пространств с Ps5sl,<7S=sl я р -{- q = п и называя евклидовы в нашем смысле пространства собственно евклидовыми. Вырожденные псевдоевклидовы пространства (для ко- которых р-\- q <Zn\ они называют полуевклидо- полуевклидовыми. 151
Пространство-время специальной теории относи- относительности (обычно называемое пространством Минков- ского) является четырехмерным псевдоевклидовым про- пространством типа A,3). Его точки называются событиями. Начало отсчета интерпретируется при этом как событие, происходящее «здесь и сейчас». Для любого вещественного числа а мы положим Г Vа, если а / V—а> если а где слева имеется в виду так называемый «арифмети- «арифметический» корень. Тогда для любого вектора х псевдо- евклидова пространства У будет определено число | х | = V(*> *)» называемое его длиной. Для любых точек А, В точечного псевдоевклидова пространства М- длина вектора АВ называется длиной отрезка АВ и обозна- обозначается символом |^4В|. При (х, ж)<0 вместо длины |*| (являющейся мни- мнимым числом) иногда удобно рассматривать положитель- положительное вещественное число | х |вещ = у | (х, х) \. В пространстве Минковского число \АВ\ называется пространственно-временным интервалом между собы- событиями А я В. Вещественный интервал называется вре- мениподобным, мнимый — пространственноподобным, а равный нулю — светоподобным. Те же названия приме- применяются к вектору АВ и прямой АВ. Таким образом, век- вектор времениподобен, если его длина вещественна, про- странственноподобен, если его длина мнима, и светопо- добен, если его длина равна нулю (вектор изотропен). Эту терминологию мы будем использовать и в псевдо- псевдоевклидовом пространстве любого типа. Векторы а и Ь псевдоевклидова пространства мы бу- будем называть векторами одного характера, если они оба либо времениподобны, либо пространственноподоб- ны, либо изотропны. Множество всех изотропных векторов псевдоевкли- псевдоевклидова линейного пространства называется изотропным ко- конусом. В точечном пространстве изотропным конусом с вершиной О называется множество всех изотропных пря- прямых (т. е. прямых с изотропными направляющими век- векторами), проходящих через точку О. 8 пространстве Минковского изотропный конус назы- называется световым. 154
Определение 2. Базис еи ..., е„ невырожденного псевдоевклидова пространства У типа (р, q) называется псевдоортонормированным, если {О, когда i Ф /, 1, когда i = / и / = 1, . . ., р, — 1, когда г = / и / = p+i, ..., п. В псевдоортонормированком базисе скалярное произве- произведение (х, у) векторов х = x'ei я у — у'е, выражается формулой (х, $)=х1у1+ ... + xpyp — xp + lyp+l — ... —хпуп. В частности, (х, х) = (х1J + ... + (хрJ — (хр+1J - ... — (хУ. Предложение 2 лекции 12 означает, что в любом псевдоевклидовом пространстве существуют псевдаорто- гональкые базисы. ' Поскольку отображение по равенству координат в двух псвдоортогональных базисах является, очевидно, изометрией, отсюда следует, что любые два псевдоевкли- дова пространства одного и того же типа (р, q) изомет- ричны (а разных типов — в силу закона инерции — нет). Матрица перехода от одного псевдоортонормирован- ного базиса к другому называется псевдоортогональной матрицей типа (р, q). Все такие матрицы образуют группу, называемую псевдоортогональной группой типа (р, а) и обозначаемую символом О(р, q). Ясно, что группы О(р, q) и O{q, p) изоморфны. Группа О@, п) является не чем иным, как известной нам из первого семестра ортогональной группой О(п). Группа О A,3) называется общей группой Лоренца. Ковариантные координаты хх, ..., х„ вектора х — = x'et в псевдоортонормированном базисе еь ..., еп определяются формулой ( х1, если i = 1, . .., р, 1 { — х1, если / = р -\~ 1, ..., п. Скалярное произведение выражается в ковариантных координатах той же формулой, что и в контравари- антных: {X, у) = Х{у{ -{-... -\~ ХрУр Хр+хУр+1 • • • хпУп' 155
В частности, (х, х) — х2 + ... + *р — х%+\ •' • хп для каждого вектора же/1. При /г = 1 (на прямой) возможны три типа псевдо- псевдоевклидовых геометрий: евклидова, антиевклидова (лишь формально отличающаяся от евклидовой) и вырожден- вырожденная (в которой расстояние между любыми двумя точ- точками равно нулю). На прямых псевдоевклидова про- пространства произвольной размерности евклидова геоме- геометрия реализуется на времениподобных, антиевклидова — на пространственноподобных, а вырожденная — на свето- подобных прямых. При п — 2 (на плоскости) кроме евклидовой и анти- антиевклидовой геометрий имеется только одна невырожден- невырожденная псевдоевклидова геометрия типа A,1). Она назы- называется собственно псевдоевклидовой геометрией пло- плоскости. Изучим эту геометрию подробнее. Векторы некоторого фиксированного псевдоортонор- мированного базиса на собственно псевдоевклидовой плоскости — как и на евклидовой плоскости — будем обозначать символами i и /, а соответствующие коорди- координаты— символами х и у. Таким образом, (i, 0 = 1, (i, /) = o, (/, /) = - i и | г f = х2 — у2 для любого вектора г с координатами х, у (т. е. такого, что r = xi-\-yj). Удобно эту геометрию сопоставить с евклидовой гео- геометрией, в которой векторы i и / ортонормированы. Мы будем называть эту геометрию сопутствующей евклидо- евклидовой геометрией. Заметим, что она зависит от выбора ба- базиса i, /. Изотропные прямые собственно псевдоевклидовой геометрии имеют уравнения у = ±х, т. е. являются — в сопутствующей евклидовой геометрии — биссектрисами координатных углов. Таким образом, на плоскости изо- изотропный конус является парой прямых. Прямые у — kx при |/г|>1 пространственноподоб- ны, а при \k\ <Z 1 времениподобны. 156
Две прямые у — ktx и у = k2x тогда и только тогда ортогональны (т. е. ортогональны их направляющие век- векторы A, ki) и A, &г)), когда &i&2 — 1, т. е. когда в со- сопутствующей евклидовой геометрии они симметричны относительно биссектрис координатных углов. Таким об- образом, вращение одной из этих прямых вызывает встречное вращение второй прямой, причем, когда первая прямая приходит в совпадение с изотропной пря- прямой, вторая прямая совпадает с ней же. В частности, мы видим, что каждая изотропная пря- прямая ортогональна сама себе. Для любого вещественного числа а множество всех точек А, для которых I OA\— *Ja, называется окруою- ностью радиуса Vя- В сопутствующей евклидовой гео- геометрии окружность радиуса Va ^ 0 является равно- равнобочной гиперболой х2 — у2 = а, действительной осью которой является ось ординат, если а < 0, и ось абсцисс, если а > 0. Окружностью радиуса 0 является изотропный конус. За эталон площади на псевдоевклидовой плоскости мы принимаем бивектор i Л /. Поскольку определитель произвольной псевдоортогональной матрицы равен ±1, этот эталон с точностью до знака не зависит от выбора базиса i, /. Заметим, что этот эталон совпадает с эталоном пло- площади в сопутствующей евклидовой геометрии. Таким об- образом, площадь произвольной фигуры в псевдоевклидо- псевдоевклидовой геометрии совпадает с ее площадью в сопутствую- сопутствующей евклидовой геометрии. Поэтому для ее вычисления мы можем применять все известные средства (например интегралы). Отличные от нуля векторы а = ОА и Ь = ОВ (или лучи ОА и ОВ) на псевдоевклидовой плоскости назы- называются одноименными (понятие, не имеющее аналогов в евклидовой плоскости!), если ни один из векторов ца + vb, где ц ^ 0, v ^ 0, неизотропен (в частности, неизотропны сами векторы а и Ь). Наглядно это означает, что лучи О А и ОВ пере- пересекают одну и ту же ветвь окружностей радиуса ±1 с центром в точке Ot 157
Заметим, что одноименные векторы заведомо имеют один и тот же характер (оба либо времениподобны, либо пространственноподобны). При этом для любых нензо- тропных (и отличных от нуля) векторов а и Ь одного характера одноименны либо векторы а, Ь, либо векторы а, -Ь. _J Угол Z (а, Ь)= ZAOB между векторами а = ОА и Ь~ОВ (лучами ОА и ОВ) на псевдоезклидовой пло- плоскости определяется только для одноимен- одноименных векторов а и Ь. На евклидовой плоскости этот угол равен удвоенной площади кругового секто- сектора, отсекаемого от круга радиуса 1 лучами ОА и ОВ. На псевдоевклидозой плоскости угол АО В оп- определяется как удво- удвоенная площадь аналогич- аналогичного гиперболического сектора ОА*В*. [Для не- неодноименных векторов эта площадь бесконечна.] Напомним, что функция chG = называется гиперболическим косинусом. Предложение 1. Для псевдоевклидова угла 6 = = Z. (а, Ь) между одноименными векторами & и Ь имеет место формула (Л) спи |вЦб| • Доказательство. Пусть сначала векторы а и Ь времениподобны и, значит, |й| = а и \Ь\ = Ь, где а > 0 и й>0. Если в некотором псевдоортонормированном базисе вектор а имеет координаты а{, а2, то вектор а', имею- имеющий в том же базисе координаты аз, а\, будет, очевидно, пространственноподобньш вектором длины \a'\ — ia, ортогональным вектору о.. •; 1оэтому векторы ? =^- ¦1 а 15S
будут составлять псевдоортонормированныи базис, обла- обладающий тем свойством, что а — at, где а > 0. Пусть bbi + bj Условие, что вектор Ь одноименен с вектором о. (и, зна- значит,— с вектором i), означает, что \b2\<Cbi (так что, в частности, Ь\ >0). При этом (a, b) = abu |а | = < и, значит, (а, Ь) = л/ь21 — b\, Поскольку che >0 (на самом деле даже ch 0 ^ 1), от- отсюда следует, что в рассматриваемом случае для дока- доказательства формулы A) достаточно доказать, что B) Ы - Ы Обе стороны формулы B) не меняются при измене- изменении знака координаты Ь2 (для левой части это следует из того, что при симметрии в оси абсцисс площадь гиперболиче- гиперболического сектора А*ОВ* остается прежней). Поэтому без ограни- ограничения общности можем счи- считать, что Ьъ ^ 0. По определению 6 = 2 площ. А*ОВ*, где под площ. А* О В* мы мо- можем понимать площадь гипер- гиперболического сектора А*ОВ* в сопутствующей евклидовой геометрии (в которой ба- базис i, / ортонормирован). Поэтому а 0 = [ г2 flfq), о где C — евклидов угол между векторами ачЬ (угол на- наклона луча ОВ), а г, ср — полярные координаты, согла- согласованные с прямоугольными координатами х, у (т. е. та- такие, что x = rcostp, y = rsmq>). Поскольку в коор/п*- 159
натах г, ф правая ветвь гиперболы х2— у2 = 1 (которую пересекают лучи ОА и ОВ) имеет уравнение * ' cos2 ф — sina ф * этим доказано, что /л\ о— С d<9 * |п 1 +tgp К ' J cos2 ф - sin2 ф ~~ 2 ш 1 — tg p ' о т. е. что th9 = tgp, где thO= — гиперболический тангенс угла 0. Так как это доказывает формулу B). Пусть теперь векторы а и Ь пространственноподоб- ны и, значит, | а | = ia и | 6 | = ib, где а > 0 и Ъ > 0. В этом случае можем найти такой псевдоортонорми- рованный базис г, /, что в==а/ и & = 6i? + 62/» где Ь2 > 0 и |61|<62- Кроме того, без ограничения общности мы можем пред- предполагать, что Ь\ > 0. Поэтому, если г, ц> — полярные ко- координаты, согласованные с координатами у, х (т. е. та- такие, что лс —гэшф, у — г cos ф), то для угла 0 будет иметь место прежняя формула D) (ибо с лучами ОА и ОВ теперь пересекается верхняя ветвь гиперболы Х2 — у2 __—1 и эта ветВь в координатах г, ф имеет урав- уравнение C)), а, значит, и формула th8 = tgE. Но теперь tgp=-rr-, и поэтому °2 (напомним, что Ъг > 0 и Ь\ — Ь\ > 0). Для завершения доказательства остается заметить, что в рассматривае- рассматриваемом случае (а, Ь) = — аЬ2, | а | = ш и \b\ = i +Jb\ — b\. ? 160
Следствие 1. Для любых одноименных векторов а и Ъ имеет место равенство E) (а, &) = 1 а & 1 ch в. а Следствие 2. Времениподобные векторы а и b тогда и только тогда одноименны, когда {а, &)>0, а пространственноподобные — тогда и только тогда, когда (а, Ъ) < 0. Иначе говоря, неизотропные векторы а и Ь тогда и только тогда одноименны, когда все три числа (а, а), (Ь, Ь) и (а, Ь) имеют один и тот же знак. Доказательство. Длины \а\ и |6| временипо- добных векторов положительны. Поэтому, если эти век- векторы одноименны, то справа в формуле E) все числа положительны. Следовательно, (а, 6) > 0. Аналогично, если векторы а и Ь пространственноподобны, то |а| = = ia и \b\ = ib, где а>0 и Ь > 0. Поэтому в этом случае \а, Ь\ = — а6сЬ6<0. Обратные утверждения непосредственно вытекают из того, что неизотропные векторы а и 6 одного характера тогда и только тогда неодноименны, когда одноименны векторы а и —Ь. ? Следствие 3 (обращенное неравенство Ко- ши — Буняковского). Для любых векторов а и Ь одного характера имеет место неравенство F) (а, 6J>(а, а)F, &). Доказательство. Для изотропных векторов а и & неравенство F) верно автоматически. Кроме того, если оно верно для векторов а и 6, то оно верно и для векторов а и —Ь. Поэтому без ограничения общности можно считать, что векторы а я b одноименны. Но тогда для них имеет место равенство E), возводя которое в квадрат, мы и получаем F) (ибо ch в ^ 1). ? Замечание 1. Для векторов а и 6, один из кото- которых времениподобен, а другой пространственноподобен, справедливо обычное неравенство Коши — Буняковского вида (а, &J<|(а, а) ||F, &)|. 8 М. М. Постников, сем. II 161
Замечание 2. Для одноименных времениподобных векторов а, и Ь G) («, 6)>|а|1Ы, а для одноименных пространственноподобных (8) (а, 6)<|а||&| (ИЛИ, В Другой Записи, | (а, &) |^> |а|вевд |^|вещ). Замечание 3. Равенство в формулах F), G) и (8) достигается лишь для пропорциональных векторов а и Ь (так как только в этом случае 8=0 и ch9 = l). Следствие 4 (обращенное неравенство тре- треугольника). Для любых одноименных временипо- времениподобных векторов а и Ь имеет место неравенство \a + b\>\a\ + \b\. (Заметим, что вектор а-\- b времениподобен.) Доказательство. Согласно неравенству G) |J. ? Замечание 4. Для пространственноподобных одноименных векторов а и & неравенство треугольника имеет аналогичный вид I а. -+- Ь \веи1> I а. |вещ + | Ь |вещ. На первый взгляд кажется, что все эти результаты автоматически переносятся на векторы а и & псевдо- псевдоевклидова пространства У произвольной размерности — достаточно рассмотреть двумерное подпространство, по- порожденное этими векторами. Однако на самом деле си- ситуация здесь несколько более сложная, поскольку это подпространство может быть (по отношению к скаляр- скалярному умножению, индуцированному скалярным умноже- умножением в пространстве У) не только собственно псевдо- псевдоевклидовым, но и евклидовым или антиевклидовым, и даже вырожденным. Если оно евклидово или антиевкли- антиевклидово, то для векторов о, и b будет иметь место обычное неравенство Коши — Буняковского (а, бJ <; (a, a) (b, b), а угол 9 = Z. (а, 6) будет вычисляться по формуле в = arccos —| д я fr I • Если оно собственно псевдоевклидово, а векторы а и b одноименны, то для них будет иметь место обращенное неравенство Коши — Буняковского (а, ЬJ ^ (а, а) F, 6), а угол 9 будет вычисляться по формуле 9 = arch , д Л & . . Наконец, если это подпро- 162
странство вырождено (что вполне может быть для не- неизотропных и даже одноименных векторов а и 6), то неравенство Коши — Буняковского превращается в ра- равенство (а, ЪJ — (а, а) (Ь, b), a угол 9 смысла не имеет. Таким образом, зная лишь характер векторов а и Ь (т. е. знак скалярных квадратов {а, а) и F, Ъ)) и факт их одноименности или неодноименности (т. е. зная знак скалярного произведения (а, &)), мы, в общем случае, еще ничего не можем сказать о том, какое неравенство Коши — Буняковского выполнено для векторов а и 6 (и, значит, — определен ли угол Q = Z, (а, Ь) и по какой формуле он вычисляется). Однако здесь есть одно заме- замечательное исключение. Пусть $Р — произвольное подпространство линейного псевдоевклидова пространства У. Мы будем называть подпространство 0> невырожденным, если ограничение на 0* скалярного умножения в У невырождено. Ясно, что это имеет место тогда и только тогда, когда $р обла- обладает ортогональным базисом, состоящим из неизотроп- неизотропных векторов (или — что равносильно — псевдоортонор- мированным базисом). В вырожденном же подпростран- подпространстве 0> любой ортогональный базис непременно содер- содержит изотропный вектор (и тогда 0> содержится в орто- ортогональном дополнении этого вектора). Поскольку нуль- пространством подпространства SP служит пересечение 0>{\0>х-, этим доказано, что подпространство SP тогда и только тогда невырождено, когда & f] 5я х = 0, т. е. (см. лекцию 5) когда Т В частности, мы видим, что любой псевдоортонорми- рованный базис невырожденного подпространства 0* можно дополнить до псевдоортонормированного базиса всего пространства У (достаточно объединить его с про- произвольным псевдоортонормированным базисом подпро- подпространства 52>х также, очевидно, невырожденного). Для типа (р', q') подпространства 0 отсюда выте- вытекает, что он связан с типом (р, q) пространства У не- неравенствами р'<р, q'<q- Применим эти общие результаты к случаю, когда (р>^) = A,я—1), а 0* является двумерным подпро- подпространством, порожденным времениподобными векторами а и Ь. Так как р'^ 1, a dim^>= 2, то подпространство 6* 163
& заведомо не евклидово. Так как это подпространство содержит времениподобные векторы, то оно не может быть и антиевклидовым. Если оно вырождено, то орто- ортогональное дополнение вектора а (являющееся, очевид- очевидно, п — 1-мерным антиевклидовым пространством) будет содержать изотропный вектор, что невозможно. Следо- Следовательно, подпространство 0* может быть лишь соб- собственной псевдоевклидовой плоскостью и, значит, для векторов а и Ь будет иметь место обращенное неравен- неравенство Коши — Буняковского. Этим доказано следующее предложение: Предложение 2. В псевдоевклидовом пространстве индекса (I, п—1) для любых времениподобных векто- векторов а и Ь имеет место обращенное неравенство Коши — Буняковского (а, ЬJ^{а, а){Ь, Ь) и — в случае, когда векторы а и Ь одноименны, — обра- обращенное неравенство треугольника |а+61>|а| + 1Н а В пространстве Минковского времениподобные лучи ОА изображают траектории (мировые линии) инерци- ально движущихся наблюдателей, причем длина \ОА[ отрезка ОА равна времени, протекшему от события О до события А, измеренному по часам, движущимся вме- вместе с наблюдателем (это — так называемое собственное время наблюдателя). [Пространственноподобны.е лучи физической интерпретации не имеют.] Одноименность двух времениподобных лучей ОА и ОВ означает, что время для обоих наблюдателей течет в одну сторону — «в будущее». Представим себе двух близнецов-наблюдателей—¦ один инерциален и движется по своей мировой линии от точки О до точки А, а другой («космонавт») толчком стартует из точки О, инерциально (с выключенными двигателями) движется в точку В, достигнув точки S, снова толчком меняет скорость и, продолжая двигаться инерциально, приходит в ту же точку А. Так как \ОА | > \ОВ\ + \ВА |, то при встрече возраст близнецов окажется различным—домосед будет старше своего брата-космонавта. Это — известный парадокс близнецов, неодно- неоднократно обыгрывавшийся в научно-фантастической лите- литературе.
Лекция 126 Ориентации линейных пространств и компоненты группы GL(n).—Ориентации евклидовых пространств. — Ориен- Ориентации псевдоевклидовой плоскости. — Условия псевдо- псевдоортогональности матрицы. — Ориентации псевдоевклидо- псевдоевклидовых пространств. — Компоненты группы О(р, q). Пусть G— некоторая группа матриц (подгруппа группы GL(n) всех невырожденных матриц). Определение 1. Путем в группе G называется произ- произвольное непрерывное отображение отрезка / = [0, 1]] в группу G, т. е. семейство невырожденных матриц из группы G, элементы cl{t) которых непрерывно зави- зависят от параметра t. Подмножество М группы G назы- называется связным, если для любых его элементов А и В существует путь C(t), соединяющий А и В в М, т. е. такой, что А = С@), В =. СA) и C(/)sM для всех t. Связное подмножество, не содержащееся ни в каком большем связном подмножестве, называется компонен- компонентой группы G. Легко видеть (докажите!), что 1) компоненты группы G не пересекаются; 2) компонента Ge, содержащая единичную мат- матрицу Е, является (инвариантной) подгруппой группы G; 3) любая другая компонента является смежным классом группы G по подгруппе GE- Группа G тогда и только тогда связна, когда G =* = Ge, т. е. когда она состоит только из одной компо- компоненты. Напомним (см. определение 2 лекции 1.5), что де- деформацией базисов линейного пространства У назы- называется такое семейство векторов A) с, @, .... cn{t), непрерывно зависящих от параметра t, 0^?^1, что для любого t векторы A) составляют базис простран- пространства У. Два базиса B) alt ..., ап и &!, ..., &„ называются деформируемыми друг в друга, если суще- существует такая деформация (J), что Cj(O)=tti и с,A)= 6? 165
для любого 1= 1, ..., п. Это отношение является отно- отношением эквивалентности (предложение 1 лекции 1.6) и классы деформируемых друг в друга базисов назы- называются ориентациями пространства У. Основная тео- теорема теории ориентации (теорема 1 лекции 1.7) утверж- утверждает при этом, что базисы B) тогда и только тогда де- деформируемы друг в друга (определяют одну и ту же ориентацию), когда они одноименны, т. е. определитель связывающей их матрицы перехода положителен. Пусть в\, ..., еп — произвольный базис пространства У и пусть А и В— матрицы перехода от базиса е\, ... ..., е„ к базисам B). Тогда для любой деформации A) базисов B) матрицы перехода C{t) от базиса е\, ..., еп к базису A) будут составлять путь в группе GL(n), со- соединяющий матрицу А с матрицей В, и обратно, любой путь C(t) в группе GL(n), соединяющий А с В, будет определять некоторую деформацию A) базисов B), со- состоящую из базисов, связанных с базисом в\, ..., еп матрицами перехода C(t). Поэтому базисы B) тогда и только тогда опредвг ляют одну и ту же ориентацию линейного пространства У, когда соответствующие матрицы А и В принадлежат одной компоненте группы GL(n). Теорема 1 лекции 1.7 равносильна, следовательно, утверждению, что группа GL(n) имеет точно две компо- компоненты GL+(n) и GL~(n), одна из которых состоит из матриц с положительным определителем, а другая — из матриц, определитель которых отрицателен. Чтобы аналогичным образом охарактеризовать ком- компоненты групп Q{p,q) (и в частности — группы О (л)), мы примем следующее определение: Определение 2. Деформация базисов A) псевдоев- псевдоевклидова пространства У называется псевдоортонорми- рованной, если для любого t, 0 ^ t ^ 1, базис A) псев- доортонормирован. Ориентацией псевдоевклидова про- пространства У называется класс псевдоортонормированных базисов, псевдоортонормированно деформируемых друг в друга. (Ясно, что доказательство предложения 1 лекции 1.6 дословно сохраняется и для псевдоортонор- псевдоортонормированных деформаций и, значит, отношение псевдо- ортонормированной деформируемости является отноше- отношением эквивалентности.) Если теперь е\, ..., еп — произвольный псевдоорто- нормированный базис пространства У, а А и В — маг- 166
рицы перехода от базиса в\, ..., еп к псевдоортонорми- роваиным базисам B), то псевдоортонормированные деформации A) базисов B) находятся во взаимно од- однозначном соответствии с путями в группе О (р, q) (где (р,д)— тип пространства У), соединяющими матрицы Л и В, и, значит, базисы B) тогда и только тогда опре- определяют одну и ту оке ориентацию псевдоевклидова про- пространства У, когда матрицы А и В принадлежат одной компоненте группы О (р, q). Поэтому число ориентации пространства У равно числу компонент группы О(р, q). Конечно, каждая компонента группы О (р, q) содер- содержится в единственной компоненте группы GL(n), где п = р -\- q (каждая псевдоортонормированная деформа- деформация является деформацией), но обратное, вообще го- говоря, неверно. Теорема 1. Группа О (р, q) при р =^= 0, п имеет четыре компоненты. Группа О (/г) имеет две компоненты. Поскольку существуют ортогональные матрицы с от- отрицательным определителем, утверждение о группе О(п) означает, что каждая компонента группы GL(n) содержит точно одну компоненту группы О(д). Оно рав- равносильно утверждению, что группа SO(n) собственных ортогональных матриц связна, или — на языке бази- базисов— что любые два одноименных ортонормированных базиса B) евклидова пространства можно связать орто- нормированной деформацией. Мы дадим два доказа- доказательства этого утверждения. Первое доказательство. Так как базисы B) одноименны, то по теореме 1 лекции 1.7 их можно свя- связать деформацией A) (состоящей, вообще говоря, из неортонормированных базисов). Применив к каждому базису A) процесс ортогонализации Грама — Шмидта, мы получим ортонормированный базис C) c\(t), ..., c'n(f), 0</<l, векторы которого по-прежнему будут непрерывно зави- зависеть от t. Поскольку процесс ортогонализации не меняет ортонормированных базисов, семейство C) будет, сле- следовательно, ортонормированной деформацией, связы- связывающей базисы B). п Второе доказательство (только при п^ ^3). При п = 1 утверждение очевидно (одноименные ортонормированные базисы одномерного евклидова про- пространства совпадают) . При п.> 1 достаточно для каждой 167
собственной ортогональной матрицы С порядка п найти в группе SO(n) путь, соединяющий единичную матрицу Е с матрицей С. Но при п — 2 (см. лек- лекцию 1.13) cos а — sin а . ^ sine cosa ' где -«<<*<«• Заменив в этой матрице а на t<x, мы и получим путь в группе SO (я), соединяющий матрицу Е с матрицей С. При п = 3 в соответствующих координатах любое вращение пространства имеет матрицу вида 110 0 | 0 cos a — sin a У 0 sin a cos a || (см. лекцию 1.26). Для группы SOC) это означает, что любая собственная ортогональная матрица С третьего порядка представляется в виде где Со — некоторая ортогональная матрица, а D — мат- матрица D). Поэтому формула где D (t)—матрица D), в которой а заменено на ia, определяет путь в группе SOC), связывающий мат- матрицу Е с матрицей С. О Замечание 1. Чтобы перенести второе доказатель- доказательство на случай любого п, требуется аналогичное описа- описание собственных ортогональных матриц порядка п. Мы получим его — с учетом замечаний, сделанных в конце лекции 15, — в теореме 2 лекции 23. Чтобы понять, почему при р 'ф 0, п получается че- четыре ориентации, мы рассмотрим сначала случай п = 2 (и (р,?) = A,1)). Для любого псевдоортонормированного базиса i, / соб- собственно псевдоевклидовой плоскости У вектор i време- ниподобен, а вектор / — пространственноподобен. То же самое верно и для векторов i(t) и j(t), составляющих произвольную деформацию базиса i, /. Непрерывно ме- меняясь вместе с t и не обращаясь в нуль, вектор i{t) должен поэтому оставаться в том же вертикальном угле, образованном изотропными прямыми, что и век- 163
TOp i (если *@== a(t)i + 6@/ и если функция а(?) меняет знак, то a(to)==O при некотором t0, 0 =s^0 ^ 1, и, значит, вектор i(to)=b(to)j пространственноподобен, что невозможно). Это означает, что все векторы i(t) должны быть одноименны. По аналогичным соображе- ' ниям должны быть одноименны и все векторы j(t). Этим доказано, что, если псевдоортонормированные базисы i, / и i', ? собственно псевдоевклидовой плоско- плоскости деформируемы друг в друга, то вектор V одноиме- нен с вектором i, а вектор /' одноименен с вектором /. В частности, отсюда следует, что для любого псевдо- ортонормированного базиса i, / четыре базиса определяют различные ориентации псевдоевклидовой плоскости. Таким образом, на собственно псевдоевклидовой пло- плоскости существует не менее четырех ориентации. Чтобы доказать, что этих ориентации ровно четыре, нам нужно доказать, что любой псевдоортонормирован- ный базис V', ?, для которого вектор V одноименен с векто- вектором V, а вектор ? одноименен с вектором /, деформируем в базис i, j. Для этого мы — имея а виду применить прием, кото- который выше (во втором доказа- доказательстве) был использован для ортогональных матриц, — най- найдем в явном виде псевдоорто- псевдоортогональную матрицу, связываю- связывающую базис (,/ с базисом V, f'. Так как векторы i и i' одноименны, то определен угол между этими векторами, причем согласно фор- формуле A) ch9 = (*, if) (по условию \i\= 1 и |</|= 1). Аналогично, между век- векторами / и ? определен угол 9ь причем = —1). Это озна- озна(так как |/| = i и \?\ = i, то чает, что в разложениях 169
векторов V и /' по векторам i и / коэффициент а равен ch 9, а коэффициент Ъ\ равен ch9i. С другой стороны, так как (i', i')— 1, то а2 — Ъ2 = 1, т. е. Ь2 == а2 — 1 = ch2 6 — 1 = sh2 9, где ¦—гиперболический синус угла 9. Следовательно, Ь — — ±sh9. Поскольку ch(—9) = ch 9 и sh(—9)==—sh9, мы можем без ограничения общности, заменив, если нужно, 9 на —9, считать, что b = sh 9. Аналогично мы можем считать, что ai = sh9i. Но так как (/', /') — О, т. е. аа\ — ЪЪ\ = 0, то ch9sh6, — sh9ch9l = 0, т. е. sh(9 — вО = 0, и потому 9 — 6i = 0. Этим доказано, что матрица С, связывающая базис i, / с базисом V, j', выражается формулой /с\ /-> II ch 6 sh 6 II -. . п . , ^ C==|Sh8 ch9 I' где -оо<9< + оо. Теперь, чтобы построить деформацию базиса i, j в базис Г, /' или — что равносильно — соответствующий путь в группе ОA, 1), достаточно в матрице E) заме- заменить 9 на /9. Таким образом, действительно, на собственно псевдо- псевдоевклидовой плоскости имеется точно четыре ориентации. В произвольном псевдоортогональном пространстве дело обстоит совершенно аналогично. Вывод условия симплектичности матрицы в лекции 12 (см. формулу A3) лекции 12) носит на самом деле общий характер и в применении к псевдоортогональным матрицам дает, что матрица С порядка п = р + q тогда и только тогда является псевдоортогональной матрицей типа (р, q), когда имеет место равенство где теперь J — матрица о" —Eq I метрических коэффициентов произвольного псевдоорто- нормированного базиса (напомним, что символом Ег мы обозначаем единичную матрицу порядка г). 170
Представив матрицу С в клеточной форме сх в F) С- А где С\ и Съ — квадратные матрицы порядков р и q со- соответственно, а А я В — прямоугольные матрицы раз- размеров q X Р и рУСд, мы, произведя умножение «покле- точно», немедленно получим, что матрица F) тогда и только тогда является псевдоортогональной матрицей типа (р, q), когда имеют место равенства G) C7Cl — ArA = Ep, CjC2 — BrB = Eq, С7в = АгС2. Лемма 1. Для любой матрицы А размера q X Р мат- матрица Ер -f- ATA невырождена. Доказательство. Если матрица ЕР + А1А вы- вырождена, то существует такой столбец х ф 0 высоты р (матрица размера рХ1), что (Ер + АгА)х = 0, т. е. х — —АгАх. Но тогда хтх = — хтАтАх == — (Лх)т (Лх), что невозмолсно, поскольку число хгх (матрица раз- размера 1X1) положительно, а число —(Ах) т (Ах) отри- отрицательно (или равно нулю), о В силу первых двух равенств G) из этой леммы (примененной к матрицам Ер -f- Ar А и ?"fl -f- BrВ) сле- следует, что для любой псевдоортогональной матрицы F) матрицы С\ и Сч невырождены. Следовательно, для любого пути C(t) в группе О (р, q) псевдоортогональных матриц знаки чисел detCi(^) и detC2(?) не меняются. Поскольку, очевидно, существуют псевдоортогональ- псевдоортогональные матрицы С, для которых det C\ и det C2 имеют лю- любые наперед заданные знаки, этим доказано, что группа О(р, щ) при р =7^= 0, п содержит не менее четырех компо- компонент {и, значит, псевдбевклидово пространство индекса р -ф 0, п имеет не менее четырех ориентации). Для доказательства, что их ровно четыре, нужно показать, что, если два псевдоортонормированных ба- базиса а\, ..., ап и &ь ..., Ъп обладают тем свойством, что для связывающей их матрицы перехода С — пред- представленной в виде F)—имеют место неравенства det C[>0 и det C2 >¦ 0, то эти базисы деформируемы друг в друга (в группе O(p,q) существует путь, соеди- соединяющий матрицу Е с матрицей С). 171
Лемма 2. Для любой невырожденной матрицы С су- существуют такие ортогональные матрицы V и U (причем det V — 1) и такая диагональная матрица D с положи- положительными диагональными элементами, что С = VDU. Лемма 2 будет доказана в лекции 22. (Заметим, что для наиболее интересного случая р — 1 эта лемма три- тривиальна.) Мы применим лемму 2 к невырожденной матрице Су порядка р. Так как det Cj > 0, то в предусмотренном леммой 2 разложении С\ = VDU обе матрицы U и V являются собственными ортогональными матрицами. Поэтому в группе SO(p) существуют пути U(t) и V(t), соеди- соединяющие единичную матрицу Е с матрицами U и V со- соответственно. Поскольку матрицы \\U(t) о | \\v(t) О II О Ея \ || 0 Eq принадлежат, очевидно, группе О (р, q), отсюда следует, что матрицы IV(t) о Ih11 d v-lB \\U(t) о О Eq 1 I ЛС/-1 С2 \\ I О Ея | V(t)-lDU(t) V(t)-'VB "j AU~1U(t) C2 составляют в группе O(p,q) путь, соединяющий мат- матрицу | D VB I A U-1 С2 с матрицей r—l Cl в II 1 А С2 |- Следовательно, не теряя общности, мы с самого начала можем считать, что матрица С\ является диагональной матрицей D с положительными элементами, т. е. что Ь\ — «lfli + b\, ..., Ьр — арар-\-Ър, где d\ > 0, ..., dp > 0, a &i, ..., 6Р—линейные ком- комбинации векторов ар+\, ..., ап. 172
Имея это в виду, мы для любого i— 1, ..., р по- положим где 0 ^ t ^ 1. Так как (at, a,) — {at, bt) = (bit bt) = О при i?=j, а (а{, о<) = 1, (bt, &*) = 1 и (аь b^ — dt, то Г A — ?J + 2/ A — t) dt +12, если / = /', (Ci (t), Ci (/)) = \ n ' к 0 в противном случае; откуда непосредственно следует, что подпространство g>t пространства У, порожденное векторами ci{t), ... .... Cp(t), является евклидовым р-мерным подпростран- подпространством с ортонормированным базисом Ci (*) , С„ (t) {0} eiW==____) _!f epW= \Cp(t)\ • и, значит, в частности, что Пусть (9) — проекции векторов ap+i, .,., а„ на подпространство fpj- параллельно подпространству ^V В произвольном псевдоортонормированном базисе ep+i(t), ..., en{t) под- простргГнства &f столбцы координат векторов (9) яв- являются не чем иным, как столбцами нижней правой клетки С2 матрицы перехода, связывающей с базисом «ь ..., ап базис пространства У, получающийся добав- добавлением к базису (8) векторов ep+\(t), ..., en(t). По- Поскольку, как мы знаем, det C2 ?= 0, это доказывает, что векторы (9) составляют базис подпространства <pf- Подпространство SPt, очевидно, антиевклидово. По- Поэтому, поменяв знаки всех скалярных произведений (и тем самым превратив &t в евклидово пространство), мы можем применить к базису (9) процесс ортогонали- зации Грама — Шмидта. Получающийся ортонормиро- ванный базис мы обозначим через (Ю) вР+1@. •••> en(t). Ясно, что базис A0) непрерывно зависит от t. Он свя- связан с базисом (9) треугольной матрицей перехода, диа- диагональные элементы которой положительны. Поэтому базисы (9) и A0) одноименны. 173
Рассмотрим базис <?i =«! A), .... cp = ep(l), пространства У. Базисы, получающиеся объединением базисов (8) и A0), составляют, как легко видеть, псев- псевдоортонормированную деформацию базисов, связываю- связывающую базис а\, ..., ап с базисом с\, ..., с„ (если 0 ^ ^ / ^ р, то е, @) = ai по построению, а если р -f- 1 ^ ^ / ^ п, то проДг = o,i, и потому также ег@) = а,). По- Поэтому для завершения доказательства нам осталось лишь доказать, что базис С\, ..., сп псевдоортонормиро- ванно деформируем в базис Ьи ¦ ¦ ¦, Ьп. Но по построению c = ei(l) = bu .... Ср = ерA)==6р, а базис подпространства 3>i (являющийся базисом A0) при t = I) одноименен, по доказанному, базису 02) пр!ар+„ ..., пр,а„. Поскольку в1A) = й»1, ..., ерA)= Ьр, пространство 0>\- совпадает с подпространством, порожденным векторами A3) Ьр+и • • •» Ьп, составляющим его базис, и матрицы перехода от базиса A3) к базису A2) является не чем иным, как правой нижней клеткой С2 матрицы перехода С от базиса 6Ь ..., Ьп к базису аи ¦¦¦, йп. Так как, по условию, det С2 > 0, то, следовательно, базисы A3) и A2) одно- именны. Поэтому базис A1) одноименен с базисом A2) и, значит, существует семейство ортонормированных ба- базисов bp+l{t), .... bn(t), 0</<1, связывающих базис A1) с базисом A2). Положив, до- дополнительно, мы и получим псевдоортонормированную деформацию, связывающую базис си ..., сп с базисом Ьи ..., Ьп. Тем самым псевдоортонормированная деформируе- деформируемость базиса а\, ..., ап в базис Ь\, ..., Ь„ полностью доказана. 174
Это завершает доказательство теоремы 1. О Компоненты группы O(p,q), рФ 0, п, обозначаются символами , q), Ot(p, q), Ot(p, q), O±(p,q). Распределение знаков чисел det Ci и det C2 по этим компонентам описывается таблицей: "—¦—. det det C'i det С, ——•* > < det ¦—.. 0 0 c2 det C2 > 0 o? (л ч) O% (p, q) det ol ot c2 (p. (p. <o <7) Заметим, что объединение О*{р, q) = Ol(p, q)\JOi(p, q) компонент из первой строчки этой таблицы является подгруппой группы O(p,q). Матрицы этой подгруппы называются ортохронными. При р=1, q — З (в про- пространстве Минковского) это — в точности матрицы пе- перехода, связывающие координаты в двух инерциальных системах отсчета (так что именно группа О*A,3) — называемая обычно полной группой Лоренца — является фундаментальной группой релятивистской механики). Аналогично, подгруппами группы O(p,q) будут мно- множества Ot(p, q)UO*(p, q) и Ol(p, q)\JOt(p, q), состоящие из псевдоортогональных матриц С, для кото- которых det С[ • det С2>0и соответственно det Сч. > 0. В ли- литературе матрицы одной из этих групп — какой именно, зависит от автора — называются собственными псевдо- псевдоортогональными матрицами. Замечание 2. Легко видеть, что условие detCr •det C2 > 0 равносильно условию det С > 0, т. е. (ввиду равенства |detC|2—1) — условию detC=l. Действи- Действительно, если det Ci > 0 и det C2 > 0, то матрицу С можно соединить путем с матрицей ?, а так как вдоль любого пути знак определителя не меняется, то det С имеет тот же знак, что и det Е = 1, т. е. det С > 0. Если 175
же det C\ < 0 и det C2 <С О, то матрицу С можно соеди- соединить путем с матрицей вида имеющей определитель 1. Значит, по тем же соображе- соображениям, det С > 0. Наконец, если det C{ • det C2 <L О, то матрицу С можно соединить путем с одной из матриц 1 1 • 1 0 0 — 1 J и — t о о определитель каждой из которых равен —1. Поэтому в этом случае det С <С 0. Группу О+ A, 1) мы выше фактически описали. Она состоит (см. формулу E)) из всевозможных матриц вида ch 8 sh 9 sh 9 ch 9 — оо <6 < + оо, и соответствие Ci—>Q определяет, как легко видеть, изо- изоморфизм этой группы с аддитивной группой R всех ве- вещественных чисел. 178
Группы О+A, 2) и Ol(l, 3) мы найдем в лек- лекции 23а. Согласно предложению 3 этой лекции группа О + A, 2) изоморфна факторгруппе PSLB; R) = SLB; R)/{E, — Е) группы SLB; R) унимодулярных вещественных матриц второго порядка по подгруппе {Е,—Е}, состоящей из скалярных матриц ±Е, а группа О+A, 3) изоморфна аналогичной факторгруппе PSLB; C)=SLB; C)/{E, — Е} группы SLB;jQ) унимодулярных комплексных матриц второго порядка. Замечание 3. Группу PSL B; .С.) можно интер- интерпретировать как группу дробно-линейных преобразо- преобразований расширенной плоскости JCi+ (см. лекцию 1.32), а группу PSLB; R) — как ее подгруппу, состоящую из преобра- преобразований с вещественными коэсЬФициентами.
Лекция 12в Модель геометрии Лобачевского на сфере псевдоевкли- псевдоевклидова пространства.— Модель Бельтрами. — Модель Пуан- Пуанкаре.— Модели Пуанкаре гиперболической плоскости. Псевдоевклидова геометрия тесно связана с геомет- геометрией Лобачевского, являющейся первой по времени и наиболее важной из так называемых неевклидо- неевклидовых геометрий. . Геометрия Лобачевского — неожиданный плод мно- многовековых усилий по доказательству аксиомы Евклида о параллельных линиях — отличается от евклидовой гео- геометрии лишь тем, что если в евклидовой плоскости через каждую не лежащую на некоторой прямой точку прохо- проходит единственная прямая, не пересекающая данную пря- прямую, то в плоскости Лобачевского таких прямых беско- бесконечно много. Парадоксальность этой геометрии сильно задержала признание ее широкими кругами математи- математиков. Фактически, полные права гражданства она полу- получила лишь к концу XIX века, когда были найдены ее наглядные модели. (См. подробности в лекции I. 33.) Сейчас известно довольно много различных (но, ко- конечно, изоморфных) моделей геометрии Лобачевского (или, в другой терминологии, гиперболической геомет- геометрии), но, по-видимому, простейшей из них является модель на одной поле сферы вещественного радиуса псевдоевклидова пространства типа A,я). Опишем эту модель подробнее. Пусть «^ — точечное л + 1-мерное псевдоевклидово пространство типа A,я). Выбрав в Ж начало отсчета О, отождествим Ж с ассоциированным псевдоевклидовым линеалом У. Для любого R > 0 множество всех точек А пространства Ж, для которых вектор ОА времениподо- бен и \ОА |2 = R2, называется сферой радиуса R2 с цент- центром в точке О. В координатной системе Oe0ei ... еп> для которой базис ей ..., е„ псевдоортонормирован, эта сфера задается уравнением /1\ V2 V2 v2 _ ?>2 (I) XQ X{ ... Xn К (нам сейчас удобно писать индексы у координат снизу). При гс=1-*=-это гипербола, а при д == 2 — двуполост- 178
R. ный гиперболоид. Для любого п сфера A) также со- состоит из двух частей (пол): для одной из этих пол хо > R, а для другой х0 ¦<—R. Пусть Г—пола х0 Определение 1. Пола Г на- называется п-мерным гиперболи- гиперболическим пространством (пля мо- моделью п-мерной гиперболиче- гиперболической геометрии). Число R назы- называется его радиусом кривизны. Пересечения пространства Г с m -f- 1-мерными плоскостями пространства У называются его m-мерными плоскостями (при m = 1 —прямыми). ¦ р Замечание 1. Это опре- определение непосредственно переносится на случай лсевдо- евклидовых пространств произвольного индекса (воз- (возможно, даже вырожденных). Возникающая серия неев- неевклидовых геометрий подробно изучена, но мы не будем здесь ими заниматься. Для любых двух точек А,В <= Г времениподобные векторы ОА и ОВУ очевидно, одноименны. Поэтому опре- определен угол АОВ. Умноженный на R этот угол назы- называется гиперболическим расстоянием (или расстоянием Лобачевского) между точками А и В. Чтобы не путать это расстояние с расстоянием \АВ\ в пространстве У, мы будем обозначать его символом |ЛВ|л - Предложение 1. По отношению к расстоянию \АВ\Л пространство Г является метрическим пространством. Докажем предварительно следующую лемму: Лемма 1. Для любых трех времениподобных векто- векторов а, Ь, с псевдоевклидова пространства У типа A, п) их определитель Грама (а, а) (а, Ь) (а, с) B) (Ь, а) (Ь, Ь) (Ь, с) (с, а) (с, 6) (с, с) неотрицателен. Доказательство. Для линейно зависимых век- векторов а, Ь, с определитель B), очевидно, равен нулю. Пусть векторы а, Ь, с линейно независимы и, следова- следовательно, составляют базис их линейной оболочки 0>. Так как 3> обладает базисом, состоящим из неизотропных векторов, то скалярное умножение на 3* невырождено, т. е. ?Р является невырожденным псевдоевклидовым про- 179
странством, а так как & содержит времениподобные векторы, то его индекс положителен и потому равен 1. Таким образом, & представляет собой псевдоевклидово пространство индекса A,2), и, значит, определитель Грама любого его псевдоортонормированного базиса (т. е. определитель матрицы его метрических коэффи- коэффициентов) имеет вид 1 о о 0—1 0 о o—t и потому равен 1. Поскольку определители Грама всех базисов имеют один и тот же знак (при переходе к дру- другому базису определитель Грама умножается на ква- квадрат определителя матрицы перехода), отсюда следует, что для линейно независимых векторов а, Ь, с определи- определитель B) положителен. ? Доказательство предложения 1. Расстоя- Расстояние |ЛВ|л определено для любых точек Л, В е Г неот- неотрицательно, невырождено (|ЛВ|л = 0 тогда и только тогда, когда А = В) и симметрично (\ВА | л = \АВ|л )• Поэтому нужно проверить лишь аксиому треугольника. Пусть А, В и С — три точки пространства Г и пусть а= ZBOC, §= Z.AOC, \=\/АОВ. Пусть, кроме того, а — ОА, b — ОВ и с = ОС. Тогда C) cha = i^, и \AB\ji*=Ry, Поэтому неравенство треугольника D) \АС\л<\АВЬ+\ВС\л равносильно неравенству р ^ a -J- у, т. е. — ввиду моно- монотонности функции ch на положительной полуоси — не- неравенству chp <ch(a-f v). Поскольку ch (a -J- y) = ch a ch y + sh a sh y, последнее неравенство равносильно неравенству ch p — ch a ch y ^ sh a sh y> 180
для доказательства которого достаточно, очевидно, установить, что (ch 0 — ch a ch yJ < (sh a sh YJ- Поскольку sh2 а = ch2 а — 1 и sh2 у — ch2 у — 1, дока- доказательство неравенства D) сводится, следовательно, к доказательству неравенства ch2 р — 2ch a ch p ch y + ch2a ch2 y < <: ch2 a ch2 y — ch2 a — ch2 y + U т. е. неравенства 1 — ch2a — ch2{5 — ch2 y + 2chach В ch y> 0. Но левая часть этого неравенства равна, как легко ви- видеть, определителю 1 ch y ch р ch у 1 ch a ch 0 ch a 1 который в силу формул C) (и равенств (a, a) = R2t (Ь, Ь) = R2, (с, с) = R2) лишь множителем R6 отличается от определителя Грама B). Тем самым предложение 1 полностью доказано, о Любая кривая L в пространстве Г задается непре- непрерывной вектор-функцией t\—>a(t), \a(t)\ = R, опреде- определенной на некотором отрезке [а, В] числовой оси, и со- состоит из таких точек A(t), что a(t)— OA(t). Мы будем считать, что вектор-функция a(t) дважды непрерывно дифференцируема (т. е. в произвольном базисе простран- пространства У координаты ai(t) вектора a{t) имеют непрерыв- непрерывные вторые производные). Тогда определены векторы , гл t.a{t + h)—a(t) ..... .. a'(t + h) — a'(t) a' (t) = hm ——^-4 —, a" (t) = hm —^——-± y-*- ft0 " ft->0 " с координатами a\{f) и a"{t) соответственно. Пусть h > 0. Лемма 2. Для расстояния Лобачевского между точ- точками A(t) и A (t + h) имеет место формула E) | A (t)A (t + А)|л =h\a' (OU, + о(h), где, как всегда, o(h) — такое число, что o(h)/h-*~0 при 181
Доказательство. По определению | А (/) A (t + А)|л = RQ, где ch6 = (д @' «<*+ h)) С другой стороны, легко видеть, что (а @, а (/))' = 2 («(/), а'(/)), (а @, а'(/))' = («'(/), а'(/)) + (а(/), а"@) и Ь* / / t\ /ji/ \\ I / / j\ _ (а @, а (/ + Л)) U=o = (а @. «" @) (для доказательства можно либо дословно повторить известные для числовых функций рассуждения, либо проверить эти формулы вычислением в координатах). Поскольку по условию (a(t),a(t)) — R2 (и, значит, (a(t),a(t))'= 0), отсюда следует — в силу формулы Маклорена для функции /(/г) = (a(t), a(t + h)), —что (a(/), a (/+ А)) = (a (/), a{t)) + (a{l), «'(/)) A+ + -i-(a @, a" (/)) A2 + о (A2) = R2 ^- | д' (t) f + о (А2). Поэтому ch9= 1 --^Ha'@ |2 + о(Д2). Но из анализа известно, что l+ + Поэтому \a'(t) \2 <Z 0 (т. е. вектор a'(t) пространствен- ноподобен),и что равносильно формуле E). СЗ Длина кривой L в пространстве Г определяется — аналогично евклидову случаю — как предел длин впи- вписанных ломаных (это определение имеет смысл в про- произвольном метрическом пространстве, а значит, в силу предложения 1—ив пространстве Г), т. е. как предел сумм вида N 132
где ti, i = 1, ..., N,—точки, делящие отрезок [а, ?] на N-{-1 отрезков длины /г = ^~°. Так как, согласно лемме 2, этот предел равен интегралу от функции |а7@|вещ, то, следовательно, длина s кривой t\—>a(t)t. ос =SS t =SS Р, в гиперболическом пространстве Г выра- выражается формулой F) s=\\a'(l)[ веш ' однако, не очень вполне аналогичной известной формуле для длины кри- кривой в евклидовом пространстве. Для более наглядного представления геометрии про- пространства Г можно ортогонально спроектировать его на гиперплоскость лго = 0 (ясно, что эта проекция биек- биективна). Получающаяся модель в Rn (точками которой являются векторы (хи ..., хп)), удобна, поскольку прямые про- пространства Г изображаются в ней ветвями гипербол. Более удобна модель, полу- получающаяся при центральном проектировании пространства Г из точки О на гиперплоскость Xo=R (касающуюся гипербо- гиперболоида A) в точке (R, 0, ... ..., 0)). Так как для любой точки (хо,хи ..., л„)еГ пря- прямая, соединяющая ее с точкой О, пересекает гиперплоскость Модель Бельтрами х0 = ? в точке ( R, -^-Ч ... , —т— Ь то в этой модели V Хо Хо J точки пространства Г изображаются точками у = (уъ ... .... Уп) пространства R", для которых х0 Уп = Поскольку
изображающие точки у принадлежат открытому шару \y\<R радиуса R пространства R" (в его стандартной евклидовой метрике). Так как для каждой точки у = = (уи ¦ ¦ ¦» Уп) этого шара прямая, проходящая через точку О и точку (R, у\, ..., уп) гиперплоскости х0 = R, пересекает Г в точке с координатами Хл = то, тем самым, мы получаем биективное соответствие между точками пространства Г и точками шара \у\ <Z R. Эта модель в шаре называется также моделью Бельт- Бельтрами (или моделью Бельтрами — Клейна) простран- пространства Г. По определению каждая гиперплоскость (п—1-мер- (п—1-мерная плоскость) пространства Г высекается на Г неко- некоторой гиперплоскостью (8) Аохо + Axi + ... + Апхп = О пространства М, проходящей через точку О. Подставив в уравнение (8) вместо координат х0, xi, ..., хп их вы- yj D1 . | „ |2 ражения G) и умножив на — а » мы получим, что эта гиперплоскость задается в координатах у\, ..., уп уравнением <9) До/? + Л1Ух + ... + АпУп = О. Поскольку уравнение (9) задает в R" гиперплоскость и поскольку как в Г, так и в R", плоскость любой раз- размерности является пересечением гиперплоскостей, тем самым доказано, что плоскости (и, в частности, пря- прямые) пространства Г изображаются в модели Бельтрами плоскостями (прямыми) пространства Rn (или точнее — их пересечениями с шаром |#|<С R). Числа у и ..., уп называются бе льт рампе выми коорди- координатами на гиперболическом пространстве Г (а числа хо, xi, ..., хп — вейерштрассовыми координатами). Пло- Плоскости (и, в частности, прямые) задаются в этих коор- координатах линейными уравнениями. 184
В вейерштрассовых координатах формула F) для длины кривой L в пространстве Г имеет вид ^ = \ V ~ КJ + (КУ + • • • + (х'пу dt. а Удобно эту формулу записывать в следующем услов- условном виде: s = jj V— dxl + dx\ + • • • + dxl или даже в виде где ds2 = — dx\ -f- dx\ + ... + ^x%. Выражение ds2 называется квадратом элемента длины. Так как, согласно формулам G), dyi +'''+ Уп dyn) + v^ttp dyi при t = 1, ..., n, то, как показывает несложное — хотя и несколько утомительное вычисление, — в бельтрамие- вых координатах квадрат элемента длины выражается формулой A0) , , „* (*' ~ I g la) W + • • • + dlJn) + (У1^У1 + - • • + уАJ as —к (/?2_|у|2J В частности, при « = 2 . 2ио где положено и = yi, v — у2- Другую полезную модель пространства Г (называе- (называемую моделью Пуанкаре) можно получить, спроектиро- 185
вав Г на координатную плоскость х0 = О из точки N с координатами (—R, О, ..., 0). (Это — аналог известной нам из лекции 1.27 стереографической проекции.) Так Модель Пуанкаре как прямая пространства Ж, проходящая через точку N и точку (х0, х\, ..., лСг)еГ, пересекает плоскость ха — 0 в точке @, 0) = (О, уи .... уп), где причем ,yp- обратно, прямая пространства «^ точку JV и точку @, у) = @, уи .... ресекает Г в точке с координатами <R2), и R A2) R2-\y\2' проходящая через я), где |i/|<^, пе- пе2/?2 I,» |2 J//1» то в качестве модели пространства Г здесь снова полу- получается шар \y\<R пространства Rn. Однако прямые и плоскости изображаются теперь по-другому. Действительно, подставив в уравнение (8) выраже- выражения A2), мы после сокращения получим, что гиперпло- гиперплоскости пространства Г задаются в координатах уи ..., уп уравнениями вида I2) + 2AiRyx + ... + 2AnRyn = 0. При Aq =0 это — уравнение гиперплоскости, проходящей через начало координат (центр шара \y\<lR), а при 186
д0 Ф О — уравнение сферы с центром в точке Mi -j-R, . • •, л2"^) и радиусом A4) ^^^д/л^ + ... + А2п-А (который для непустой гиперплоскости обязан быть ве- вещественным числом). Сравним сферу A3) с граничной сферой A5) y\+...+yl = R2 шара \y\<LR (которая, кстати сказать, называется аб- абсолютом рассматриваемой модели). Так как для евкли- евклидова расстояния |ОМ| между центрами сфер A3) и A5) имеет место формула ом то сферы A3) и A5) имеют общие точки, и в каждой такой точке Р пересекаются под прямым углом (т. е. треугольник ОРМ прямоугольный). Таким образом, гиперплоскости пространства Г изо- изображаются в модели Пуанкаре евклидовыми сферами {или гиперплоскостями), ортогонально пересекающими абсолют (или, точнее, — их частями, принадлежащими шару \у\< R). Так как, согласно формулам A2), 4/?s dX = ( dX0 = {R2 _ \ у [2J И ... +t/ndyn) (R2-\y I2J прИ i=\, ..., n, то — снова несложное вычисление — в координатах yi} .... уп модели Пуанкаре квадрат 187
элемента длины выражается формулой A6) ds* = 4R (/?,_|y|a), • В частности, при п = 2 do2 — IT?1 rf + dv% где положено и = уи v = у2. При п = 2 точками модели Пуан- Пуанкаре являются точки (и, и) круга и2 -f- 4-f2 <С/?2, а прямыми — дуги окруж- окружностей, ортогонально пересекающих абсолют и2 + у2 = Я2 (или отрезки прямых, проходящих через его центр). Здесь удобно ввести комплексное Модель Пуанкаре число w = и + ш. Тогда точками мо- в круге дели Пуанкаре (называемой в этом случае также моделью в круге) будут комплексные числа w, принадлежащие кругу \w\<:R плоскости комплексных чисел. Поскольку dw = du + idv, dw — du — idv и соответственно dw dw = du2 + dv2, то в комплексной координате да формула A7) имеет вид dwdw R* — \w |2J' которую можно записать — извлекая корень — также в следующем виде: A9) ^ L^i Так как дробно-линейное преобразование R — w B0) - z = i R + w взаимно однозначно отображает круг | да | < R на верх- верхнюю полуплоскость у > 0 комплексной переменной г = = л: + iy, то с равным правом моделью гиперболической плоскости можно считать полуплоскость у > 0 плоско- плоскости переменной 2 = х -f- ^- Эта модель называется жо- делью Пуанкаре на верхней полуплоскости (или просто полуплоскостью Пуанкаре). Ср. лекцию 1.33, 183
Мы знаем (см. лекцию 1.32), что каждое дробно-ли- дробно-линейное преобразование переводит окружности (и пря- прямые) снова в окружности (или прямые), сохраняя отно- отношение их ортогональности. Поэтому в модели Пуанкаре на верхней полуплоскости прямые геометрии Лобачев- Лобачевского будут изображаться полуокружностями (и полу- полупрямыми), ортогональными вещественной оси у = О (в которую преобразование B0) переводит окружность \w\ —R и которая является, следовательно, абсолютом этой модели). В модели на верхней полуплоскости наглядно видно, что в геометрии Лобачевского сохраняются все свойства расположения точек на прямых (выражаемые на языке отношения «между»), известные в геометрии Евклида. Вместе с тем евклидова аксиома о параллельных явным образом нарушена. Это доказывает независимость ак- аксиомы о параллельных от остальных аксиом геометрии Евклида. Более того, из рисунка непосредственно видно, что среди прямых, не пересекающих данную прямую L и проходящих через заданную точку Мо, имеются точно две прямые, имеющие с прямой L общую точку на абсолюте Параллельные прямые на пло- Расходящиеся прямые на пло- плоскости Пуанкаре скости Пуанкаре ^ = 0. Эти прямые называются параллельными (по Ло- Лобачевскому) прямой L. Остальные проходящие через точ- точку Мо прямые, не пересекающие прямую L, называются расходящимися с этой прямой. См. лекцию 1.33. Так как 1 + и то и, значит, , 2//? , dw = а), dz, 189
Кроме того, Отсюда следует, что элемент длины на полуплоскости Пуанкаре выражается формулой B1) ds = R^-, y = lmz. Подчеркнем, что формула B1) (так же, как и все предыдущие формулы для ds) имеет условный, мнемони- мнемонический характер. Содержательно она означает, что длина произвольной кривой z — z(t), a ^ t ^ fJ, на полупло- полуплоскости Пуанкаре выражается формулой B2) где Рассмотрим, например, прямую L (в смысле геомет- геометрии Лобачевского), проходящую через точки z\ = Х\ + + iyx и z2 = х2 + /г/2 полуплоскости Пуанкаре. Ясно, что длина отрезка этой прямой с концами в точках z\ и 22 равна расстоянию |.гьг2| между этими точками. С другой стороны, L является либо вертикальной евклидовой прямой (если Х\ — х2), либо евклидовой ок- окружностью, ортогональной абсолюту (если Х\ =?*= х2). В первом случае прямая L задается уравнением г = = Х\ + it. Поэтому, согласно формуле B2), длина It, Случай xt ф х2 Случай Xi = \z\,z2\ отрезка прямой L между точками z\ и z2 будет выражаться (при у\ <С у2) интегралом B3) 190 \г» г21 = = 4-In У1
Во втором случае удобно ввести в рассмотрение точ- точки /й и it, встречи прямой L (ориентированной от z\ к z2) с абсолютом у = О (см. рис.; для определенности мы предполагаем, что /» < lt>). Тогда уравнение прямой L будет иметь вид Z — '? + ,-** где Таким образом, и sin Поэтому B4) = /?1п где t\ и t% — значения параметра t, отвечающие точкам Z\ И Zi. Чтобы вычислить эти значения, мы заметим, что, по- поскольку в формуле B2) функцияx(t)= Rez(t) участвует только через ее производную x'(t), интеграл B2) не ме- меняется при сдвиге на постоянное число вдоль веществен- вещественной оси. Поэтому, не теряя общности, мы можем пред- предполагать, что центром по- полуокружности L является Zz точка 0, т. е. что IZ, = • too. Имея это в виду, рас- рассмотрим прямоугольный треугольник с вершинами в точках lZ> у zb it. Пусть Д^=-*<? О IZ, а и Ь — его катеты, соеди- соединяющие вершину z\ с вершинами IZ и it соответственно. Из равносторонности треугольника с вершинами 0, z\, it немедленно следует, что угол а, противоположный ка- катету а, равен половине угла t\. Поэтому 1 t\ a 191
С другой стороны, ясно, что a—\zx — /то | и Ь = | zx — lt\- Более того, аргумент числа zx — IZ> равен углу р, проти- противоположному катету Ъ, а аргумент числа zx — IZ> равен л — а. Поскольку а + р =—, отсюда следует, что аргу- аргументы чисел zx — /~ и 2, — /+ отличаются на -^-, и, значит, z\ — /со .а zi-lt b Аналогично доказывается, что h B5) _—_ __ i tg — . Z2 'oo J- Число ^9 '„, 2i — l+ ' ? — /+ ! — 'oo z] — 'oo называется двойным отношением точек /«,, zu z2, it- По доказанному оно вещественно и равно отношению Сопоставляя это с формулой B4), мы немедленно получаем, что для расстояния между точками z\ и z2 по- полуплоскости Пуанкаре имеет место формула B6) \zltZ2\=^R\nW, где W — двойное отношение B5). Мы доказали формулу B6), предполагая, что IZ < it (что имеет место тогда и только тогда, когда х\ <С..Х2). Однако легко видеть, что она остается верной и при /^ > it (когда Х\ > хг)- При Х\ = х2 (когда прямая L является вертикальной прямой х = хх) естественно принять за точку /» (при У\ < Уг) точку ЛГ1 вещественной оси, а за точку it, — точку оо. Тогда W будет равно Zz — хх . Zx — хх __ уг - 1 ' -1 ~~ Ух и, значит, — см. формулу B3)—формула B6) будет справедлива и в этом случае. 192
При Z\ = % естественно считать, что W—1. Тогда формула B6) будет верна и при Z\ = z2. Таким образом, формула B6) имеет место при лю- любом расположении точек z\ и z2. (Другое доказательство формулы B6) см. в лекции 1.33.] Автоматическая выкладка показывает, что любое дробно-линейное преобразование (и, в частности, преоб- преобразование B0)) сохраняет двойное отношение любых че- четырех точек плоскости комплексных чисел (заметим, что, вообще говоря, двойное отношение не обязано быть ве- вещественным числом; более того, легко можно пока- показать— сделайте это! — что двойное отношение четырех точек плоскости комплексного переменного тогда и толь- только тогда вещественно, когда эти точки лежат на одной окружности). Отсюда следует, что формула B6) имеет место и для точек модели Пуанкаре в круге (а потому — при само собой разумеющемся определении двойного от- отношения — и для точек любой модели Клейна или Бель- трами). При этом под IZ и l?> нужно, разумеется, пони- понимать точки пересечения соответствующей прямой с аб- абсолютом. Когда точка z\ движется до прямой L к точке IZ или точка г2 — к точке /i> двойное отношение W — а значит, и расстояние — стремится к оо. Имея это в виду, точки lZ> и it, обычно называют бесконечно удаленными точ- точками прямой L. Заметим, что, таким образом, параллельность (в смыс- смысле Лобачевского) двух прямых означает, что эти пря- прямые имеют общую бесконечно удаленную точку. 7 М.. М. Постников, сем. II
Лекция 13 Проективные гиперквадрики. — Конусы в проективном пространстве. — Перечисление проективных гиперквад- гиперквадрик. — Гиперквадрики в комплексном и вещественно- комплексном проективном пространстве. — Цилиндры и конусы в аффинном пространстве. — Аффинные гипер- гиперквадрики. — Гиперквадрики, имеющие центр. Пусть снова К — произвольное поле с char К =?= 2. Напомним (см. лекцию 9), что каждое п + 1-мерное линейное пространство У над полем К определяет соот- соответствующее /г-мерное проективное пространство Р = Р (У), точками которого являются одномерные под- подпространства пространства У или, что равносильно,— классы отличных от нуля пропорциональных векторов из У. Таким образом, каждый вектор х^О изУ опреде- определяет некоторую точку М — [ж] из Р, причем два вектора л, j/e ^"\0 тогда и только тогда определяют одну и ту же точку М е Р, когда у = Хх, где К е К. Задание в пространстве У базиса е0, еь ..., еп позво- позволяет сопоставить каждой точке М пространства Р ее проективные координаты Хо, Хи ..., Хп> определенные с точностью до пропорциональности и являющиеся не чем иным, как координатами в базисе е0, еи ..., еп про- произвольного вектора х^У, задающего точку М. (Сейчас нам удобно писать индексы у координат снизу.) Пусть Q — произвольный квадратичный функционал на линейном пространстве У. Из однородности этого функционала немедленно вытекает, что если для неко- некоторого вектора х=^= 0 имеет место равенство О) то аналогичное равенство имеет место и для любого пропорционального вектора. Поэтому условие A) кор- корректно определяет в пространстве Р некоторое множе- множество. Проективные координаты Хо, Хи ..., Х„ точек этого множества характеризуются тем, что они удовлет- удовлетворяют уравнению вида <2) Q(XO,XU .... Хп) = 0, где Q(X0,Xlt ..., Хп)—квадратичная форма, выражаю- выражающая в базисе е0, ех, ..., еп значения функционала Q. 194
При п =: 2 уравнения вида B) задают линии второго порядка (см. определение 4 лекции I. 29). В общем слу- случае мы принимаем следующее определение: Определение 1. Множество точек «-мерного проективг ного пространства Р, заданное уравнением вида B) (или A)), называется гиперповерхностью второго порядка (или, короче, проективной гиперквадрикой). Таким образом, при п = 2 гиперповерхностями яв- являются линии. При п = 3 префикс «гипер» опускается. Наша ближайшая цель состоит в том, чтобы пере- перенести на случай любого п результаты первого семестра, касающиеся линий второго порядка. Основным орудием здесь служит теорема Лагранжа из лекции 11. Теорема 1 (о приведении к нормальному виду уравнений проективных гиперквад- гиперквадрик). Для любой гиперквадрики п-мерного проектив- проективного пространства над полем К, char К^2, существует система проективных координат, в которой ее уравнение имеет вид C) у»+...+я^г = о, где 0 ^ г ^ п и Ко, ..., К Ф 0. Доказательство. Эта теорема является очевидной переформулировкой теоремы Лагранжа. О Заметим, что число г + 1 в C) является не чем иным, как рангом квадратичной формы Q. При г = п гиперквадрика C) называется невырож- невырожденной. Так как для любого й-мерного подпространства ?Р0 пространства У и любого вектора х^О, не принадлежа- принадлежащего ?Р0, существует единственное k + 1-мерное подпро- подпространство, содержащее ^*0 и х, то для любой k— 1-мер- 1-мерной плоскости По проективного пространства Р (У) и лю- любой его точки М, не принадлежащей плоскости По, суще- существует единственная й-мерная плоскость, содержащая По и М. Мы будем эту плоскость обозначать символом ЛШ0. [К числу плоскостей мы причисляем как точки (счи- (считая их плоскостями размерности 0), так и пустое мно- множество 0 (считая его плоскостью размерности— 1). Для любой точки М плоскость М0 совпадает с М.] Пусть Ф — произвольная гиперповерхность простран- пространства Р (У). (Так же, как для линий на плоскости, — см. 7* 195
лекцию 1.17 — мы не даем общего определения поня- понятия гиперповерхности. В дальнейшем под гиперповерх- гиперповерхностью можно по желанию понимать либо произвольное множество, либо гиперквадрику.) Заметим, что случай Ф = 0 мы не исключаем. Определение 2. Плоскость По пространства Р (У) на- называется вершинной плоскостью гиперповерхности Ф, если а) для любой точки М е Ф\П0 плоскость ЛШо со- содержится в гиперповерхности Ф; б) не существует плоскости большей размерности, со- содержащей плоскость По и обладающей свойством а). [В первом издании этой книги вершинные плоскости называ- назывались осевыми.] Так как свойством а) обла- обладает, конечно, пустая плоскость 0, то вершинная плоскость су- существует для любой гиперповерх- гиперповерхности Ф. Пусть По и По —две различ- различные вершинные плоскости одной и той же гиперповерхности Ф и пусть По — плоскость наименьшей размерности, содержащая обе плоскости по и По'. Пусть, далее, МеФ\П0 и пусть N — произ- произвольная точка плоскости МИ0. Так как По ф По, то по крайней мере одна из плос- плоскостей По и По' непуста. Предположив, что По' ф 0, и произвольно выбрав точку м" е По', рассмотрим пря- прямую NM . Эта прямая пересекает плоскость МПо в некоторой точке iv'. Так как ЛШо с: Ф, то N' <= Ф, и потому Л^'По'сзФ (если, конечно, Ы'фИ"). В ча- частности, N'M" с= Ф, т. е. NM" с: Ф. Следовательно, N s Ф. Поскольку этот вывод остается, очевидно, в силе и при N е По'» тем самым доказано, что МИ0 с= ф, т. е. что плоскость По обладает свойством а). С другой стороны, так как По Ф ЦТ (и По' Ф 0). то dim По > dim По- Таким образом, для плоскости По мы нашли плоскость По большей размерности, также обла- обладающей свойством а). Поскольку это противоречит свой- свойству б), первоначальное предположение о существова- 196
нии двух различных вершинных плоскостей По и По' вер- верным быть не может. Следовательно, вершинная плос- плоскость произвольной гиперповерхности Ф единственна. [Изложенное рассуждение иллюстрируется чертежом на предыдущей странице. Верность этого чертежа, т. е. выполнение всех инциденций (например, существование точки N'), доказывается с помощью следствия 2 теоре- теоремы 1 лекции 1 на основе интерпретации плоскостей проективного пространства Р(У) как подпространств (на единицу большей размерности) линейного простран- пространства У. Проведите аккуратно соответствующее доказа- доказательство!] Определение 3. Гиперповерхность Ф с непустой вер- вершинной плоскостью По называется конусом. Число 1 -{- dim По называется кратностью конуса Ф. Впрочем, гиперповерхности, не являющиеся конусами (т. е. обладающие пустой вершинной плоскостью) иногда удобно называть конусами кратности 0. Для конуса Ф кратности 1 вершинной плоскостью По является точка, и Ф состоит из прямых, проходящих че- через эту точку, т. е. является элементарно-геометрическим конусом с вершиной По- Это оправдывает нашу термино- терминологию. [В первом издании этой книги конусы называ- назывались цилиндрами. Выбор этой терминологии объясняется тем, что в этом случае, когда пространство Р (У) аффин- но-проективно (т. е. в нем выбрана несобственная ги- гиперплоскость), гиперповерхность Ф будет цилиндром в элементарно-геометрическом смысле, если точка По ока- окажется несобственной точкой. Вместе с тем в дальнейшем проективные координаты мы, как правило, будем выби- выбирать так, чтобы плоскость По содержалась в координат- координатной гиперплоскости Хо = 0. Поскольку в аффинно-проек- тивных координатах уравнение Хо = 0 задает несобствен- несобственную гиперплоскость, такой выбор координат означает, что точки плоскости По мы наглядно представляем себе в виде несобственных точек и, значит, гиперповерх- гиперповерхность Ф — в виде элементарно-геометрического ци- цилиндра. С этим представлением был связан и выбор эпитета «осевая» для плоскости По, поскольку для цилиндра крат- кратности 1 — когда По является точкой — элементарно-гео- элементарно-геометрическая ось этого цилиндра является не чем иным, как прямой с несобственной точкой По. Однако по многим 197
другим соображениям «конусная» терминология представ- представляется все же более предпочтительной. Заметим, что, согласно определению 2, любая k—1- мерная @ ^ k ^ п) плоскость По пространства Р (У) является ^-кратным конусом! Хотя такое представление, конечно, несколько расходится с наглядным, с этим при- приходится мириться. Пусть Ф — конус кратности k и По — его вершинная плоскость (размерности k— 1). Для любой п — й-мерной плоскости П, скрещивающейся с плоскостью По (т. е. с ней не пересекающейся), пересечение Ф|~)П (рассмат- (рассматриваемое как гиперповерхность в П) имеет, очевидно, пустую вершинную плоскость, т. е. является конусом кратности 0. (Действительно, для любой точки Мо вер- вершинной плоскости гиперповерхности Ф П П плоскость М0Т10 будет — докажите! — удовлетворять по отношению к ги- гиперповерхности Ф условию а) определения 2, что невоз- невозможно.) Пересечение Ф П П называется основанием конуса Ф. Говорят также, что Ф является конусом над Ф П П. [Если П' — другая п — ^-мерная плоскость, скрещи- скрещивающаяся с плоскостью По, то для любой точки М е П плоскость МИ0 пересекает плоскость П' в единственной точке М'. Получающееся отображение М\—>УИ' плоскости П на плоскость П' является, как легко видеть, проектив- проективным отображением, переводящим Ф|~)П в Ф П П'. Это означает, что с точностью до проективной эквивалент- эквивалентности основание Ф [~| П не зависит от выбора гиперпло- гиперплоскости П.] Для данных скрещивающихся плоскостей По и П (размерностей, соответственно, k—1 и п — k) всегда су- существует — докажите! — система проективных коорди- координат Zo, .... Хп, в которой плоскость П задается урав- уравнениями D) хг+1 = 0, .... Zn = 0, где r = n — k, а плоскость По — уравнениями E) Xq = 0, ..., Хп = 0. Эта система координат обладает тем свойством, что для любой точки М е По с координатами Хо, ..., Хп пло- плоскость МП0 состоит из точек, имеющих координаты вида рХо, .... рХг> Xr+i, ..., Хп, где р и Zr+i, ..., Хп — про- произвольные числа (подчиненные лишь тому условию, что хотя бы одно из них отлично от нуля). 198
Отсюда следует, что если в плоскости П (в которой Хо, ¦ ¦ ¦, Хг являются, очевидно, проективными коорди- координатами) основание конуса Ф с осевой плоскостью По имеет уравнение F) F(X0, .... Хг) = 0, то то же самое уравнение (но рассматриваемое как уравнение от Хо, .. ., Хп) будет уравнением конуса ф во всем пространстве. Обратно, если в координатах Хо, • • •, Хп уравнение некоторой гиперповерхности Ф имеет вид F), то плоскость По с уравнениями E) будет обладать по отношению к гиперповерхности Ф свой- свойством а) из определения 2, и, значит, гиперповерхность Ф будет конусом кратности ^k = п — г. При этом, если в плоскости П с уравнениями D) уравнение F) задает конус Ф' кратности 0, то гиперповерхность Ф будет кону- конусом кратности k над Ф'. Применение этих общих понятий и результатов к ги- гиперквадрикам основывается на следующем предложении: Предложение 1. Каждая невырожденная гиперквад- гиперквадрика является конусом кратности 0. Доказательство. Если гиперквадрика B) пред- представляет собой конус кратности ^1, то без ограничения общности мы можем считать, что координаты Хо, ..., Хп выбраны так, что его вершинная плоскость По содержит точку @: ... : 0: 1) и, значит, для любой точки (Хоо>: ... : Х{п-\ '. Х(пУ) этой гиперквадрики все точки вида (^оо) • • ¦ • '. X^-i : Хп) также ей принадлежат. Записав квадратичную форму Q(X0, .., Хп) в виде Q {Хо, .. ., Хп) = аХп. + Ь {Хо, . • ., Хп-\) Хп + + Qo уХо, ..-, Xn-i)i где а — константа (элемент поля К), Ь(Х0, ..., Хп-\) — линейная форма от Хо, ..., Х„_и a Qo(^o, •••> Хп-\) — квадратичная форма от Хо, •••, Xn-i, мы получим, та- таким образом, что для любой точки (Х00)"...". X^-i • Хп*) гиперквадрики многочлен п -+¦ О \Ло , . . ., Ля-iJ ля -\- Ц/о \Ло , • • • , л.п-1) от Хп должен быть тождественно равен нулю, и, следо- следовательно,— что все его коэффициенты равны нулю. 199
Поэтому, в частности, а= 0, т. е. Q(X0, ..., Хп) = Ь (Xq, •••» Хп_{) Хп-\-Qq(Xq, ..., An_i). В случае, когда форма Ь(Х0, ..., Xra_i) не равна тож- тождественно нулю, существуют такие чиела .Хо , .... Хп-\> не все равные нулю, что Ъ (До0), .... Х^-\) Ф 0. Тогда то- точка {Xf : .:.: Xf-i: X™), где @) будет принадлежать рассматриваемой гиперквадрике и, значит, многочлен . (у@) у@) \у , а / у@) у<°) "\ от А"„ будет тождественно равен нулю, что невозможно. Полученное противоречие доказывает, что линейная форма Ь(Х0, ..., Хп-х) тождественно равна нулю, и, сле- следовательно, Q(X0, .... Xn) = QQ(XQ, ...» A"rt_i). Поэтому, r^n — 1, и, значит, гиперквадрика B) вы- вырождена. О Возможность приведения уравнения гиперквадрики к виду C) показывает теперь, что любая гиперквадрика B) является конусом кратности п — г над невырожден- невырожденной гиперквадрикой r-мерного проективного простран- пространства. Поскольку свойство быть конусом данной кратности k проективно инвариантно (не зависит от системы коор- координат и от выбора уравнения), отсюда следует, что для любых двух уравнений Qi = 0 и Q2 == 0 гиперквадрики п-мерного проективного пространства квадратичные фор- формы Q\ и Q2 имеют один и тот же ранг (свойство ин- инвариантности ранга). [Заметим, что квадратичные формы Qt и Q2 вполне могут быть различны. Например, над полем R все поло- положительно определенные квадратичные формы опреде- определяют одну и ту же — пустую — гиперквадрику.] Окончательный результат произведенного исследова- исследования мы сформулируем в виде следующей теоремы. Теорема 2 (о перечислении проективных гиперквадрик над произвольным полем К). Каждая гиперквадрика п-мерного проективного про- 200
странства над полем К, char К =ф 2, либо невырождена, либо является k-кратным (I ^ k ^ п) конусом над не- невырожденной гиперквадрикой п — k-мерного простран- пространства. Одномерным проективным пространством является прямая, а невырожденной гиперквадрикой в ней — пара различных точек (или пустое множество). Поэтому при k = п — 1 соответствующий п—1-кратный конус пред- представляет собой пару различных гиперплоскостей (или является п — 2-мерной плоскостью). При k = п уравнение Хо = 0 определяет в п-мерном проективном пространстве «дважды взятую» гиперпло- гиперплоскость Хо = 0, являющуюся гг-кратным конусом под дважды взятым пустым множеством. Это также подхо- подходит под общую формулировку, так как нульмерным про- проективным пространством является точка, а гиперпло- гиперплоскостью в нем — пустое множество. При К = С. все коэффициенты Хо, ..., А,г в уравне- уравнении C) мы можем считать равными единице. Поэтому для любого г, 0 ^ г sS^n, будет иметься только одна ги- гиперквадрика C), и в силу инвариантности ранга эти ги- гиперквадрики при различных г будут проективно не экви- эквивалентны. Этим доказана следующая теорема: Теорема 3 (о классификации проективных гиперквадрик над полем С). В комплексном п-мерном проективном пространстве имеется только п + 1 проективно неэквивалентных гиперквадрик: одна невырожденная гиперквадрика и для любого г, 0 ^ г ^ ssS п — 1, конус кратности п — г над невырожденной гиперквадрикой r-мерного пространства. В случае К=К, как мы знаем, геометрическая си- ситуация не адекватна алгебраической (существуют оди- одинаковые гиперквадрики с различными уравнениями) и приходится вводить вещественно-комплексные простран- пространства (т.е. переходить в ситуацию (C,R); см. лек- лекцию 1.20). Подчеркнем, что алгебраическая ситуация при этом не меняется: все преобразования координат по-прежнему будут преобразованиями над R и все уравнения будут иметь вещественные коэффициенты. Поэтому в ситуации (С,R) уравнение C) мы можем привести к виду G) Хй+ ... +*р — X2p+i— ... — X2r = 0, 0<r<rt 201
(допускается значение р =—1, при котором уравнение G) принимает вид — xl —... —Х2г^=0), причем за счет умножения уравнения на —1 мы можем без ограничения общности считать, что где I—g—I — целая часть числа —^— ( если г = 1т + 1, то —1 = т + 1, а если г = 2т, то V—^—1 == При г = п уравнение G) имеет вид (8) Хо + ... + Хр — Xp+i — ... — Хп = О, и соответствующая гиперквадрика называется невырож- невырожденной гиперквадрикой индекса р. При р = —1 гиперквадрика (8) не имеет веществен- вещественных точек и называется мнимой. При р = 0 гиперквад- гиперквадрика (8) называется овальной. Чтобы выяснить геометрический смысл индекса р, мы введем следующее определение: Определение 4. Гиперквадрика вещественно-комплекс- вещественно-комплексного проективного пространства называется s-планарной (s ^—1), если она не содержит ни одной s + 1-мерной вещественной плоскости, но через любую ее веществен- вещественную точку проходит хотя бы одна-вещественная s-мерная плоскость, целиком содержащаяся в гиперквадрике. В трехмерном пространстве двуполостный гипербо- гиперболоид О-планарен, а однополостный 1-планарен. Гиперквадрика — 1-планарна тогда и только тогда, когда она не содержит вещественных точек (является мнимой гиперквадрикой индекса —1). Таким образом, s=—I тогда и только тогда, когда р =»—1, так что при s=—1 справедливо равенство p = s. Оказывается, что это равенство имеет место всегда: Предложение 2. Невырожденная гиперквадрика тогда и только тогда р-планарна, когда ее индекс равен р. Мы докажем это предложение в следующей лекции (см. замечание 1 лекции 13а). Поскольку р-планарность является, очевидно, проек- тивно инвариантным свойством, из предложения 2 сле- следует, что все невырожденные гиперквадрики (8) проек- тивно не эквивалентны. При г < п гиперквадрика G) является п — г-крат- ным конусом над невырожденной гиперквадрикой в 202
r-мерном пространстве, задаваемой тем же уравнением G). Поэтому все гиперквадрики G) также проективно не эквивалентны. Этим доказана следующая теорема: Теорема 4 (о классификации гиперквад- гиперквадрик в вещественно-комплексном «-мер- «-мерном проективном пространстве). В веще- вещественно-комплексном п-мерном (п > 0) проективном про- пространстве имеется только X—z—1+ 1 проективно не эквивалентных, не являющихся конусами, гиперквад- гиперквадрик. Эти гиперквадрики различаются своими индексами р=—1,...,Г-^-?—1—1, причем при р = —1 гипер- гиперквадрика мнима, а при р = 0 овальна. Все остальные гиперквадрики являются k-кратными A ^ k ^ п) конусами над невырожденными гиперквад- гиперквадриками п — k-мерного пространства (при k = п — двой- двойными гиперплоскостями). ? Аналогичная теорема имеет место, конечно, и в аф- финно-проективном пространстве, получающемся из про- проективного пространства выбором некоторой гиперпло- гиперплоскости в качестве несобственной. В дополнение ко всему прежнему гиперквадрики в таком пространстве будут раз- различаться еще и их расположением относительно несоб- несобственной гиперплоскости. В частности, в едином классе конусов выделяются теперь цилиндры (конусы с несоб- несобственной вершинной плоскостью). Поэтому классифика- классификация гиперквадрик даже в комплексном аффинно-проек- тивном пространстве хотя и тривиальна, но довольно гро- громоздка. Соответствующих теорем мы по этой причине не будем даже формулировать. Удалив из аффинно-проективного пространства несоб- несобственную гиперплоскость, мы получим аффинное про- пространство. Поэтому классификацию гиперквадрик в аффинном пространстве можно получить из их класси- классификации в аффинно-проективном пространстве, причем число классов только уменьшится. Однако для большей геометрической ясности мы предпочтем получить эту классификацию непосредственно. Пусть ?Ф — аффинное га-мерное пространство (над пока произвольным полем К характеристики, отличной от двух) и У — ассоциированный линеал. Пусть, далее, Ф — произвольная гиперповерхность в бФ. 203
Определение 5 (ср. с определением 2). Подпростран- Подпространство Ф линеала У называется осью гиперповерхности Ф, если а) для любой точки Мо гиперповерхности Ф все точ- точки плоскости, проходящей через точку Мо параллельно подпространству &*, принадлежат Ф (эта плоскость на- называется образующей гиперповерхности Ф); б) не существует подпространства большей размер- размерности, содержащего подпространство 0* и обладающего свойством а). Если f(x) = O — уравнение гиперповерхности Ф, то условие а) означает, что / (*о) = 0 **=*- / (*о + а) = 0 для любого вектора а^&>. Поэтому, если два подпространства &\ и SP?. удовлетво- удовлетворяют условию а), то их сумма 3*1 + ^2 также будет удов- удовлетворять этому условию. Следовательно (ср. аналогич- аналогичный вывод для вершинных плоскостей гиперповерхностей проективного пространства), ось SP произвольной гипер- гиперповерхности Ф единственна. Если dim^X) (т. е. &>Ф0), то гиперповерхность Ф называется цилиндром, а число к = й\п\!Р — кратностью цилиндра Ф. Впрочем, как и в случае конусов проективного про- пространства, гиперповерхности Ф с dim 5* = 0 иногда удоб- удобно называть цилиндрами кратности 0. Для любой г-мерной (г = п — k) плоскости П, на- направляющее подпространство которой дополнительно к оси 9* цилиндра Ф, пересечение ФЛ П (рассматриваемое как гиперповерхность в аффинном пространстве П) бу- будет, очевидно, цилиндром кратности 0. Это пересечение называется основанием, цилиндра ф. Говорят также, что Ф является цилиндром над Ф П П. Если система Ое\ ... еп аффинных координат в про- пространстве «я? выбрана так, что векторы ег+и .. ¦, еп по- порождают подпространство ^*, то левая часть уравнения f(xi ..., х„) = 0 гиперповерхности Ф не будет зависеть от Хг+и ..., х„, т. е. это уравнение будет иметь вид (9) f(xu ..., хг) = 0. При этом в координатной плоскости A0) П: хг+1 = 0, ..., хп = 0 уравнение (9) будет определять (в системе координат Ое\ ... ег) основание ФЛ П цилиндра Ф. 204
Обратно, если в некоторой системе аффинных коор- координат гиперповерхность Ф имеет уравнение вида (9), то эта гиперповерхность является цилиндром кратности -^.k = п — г, причем если в координатной плоскости A0) уравнение (9) задает гиперповерхность Ф' с нульмерной осью (т. е. задает цилиндр кратности 0), то гиперповерх- гиперповерхность Ф будет цилиндром кратности k над Ф'. Определение 6. Гиперповерхность Ф аффинного про- пространства бФ называется конусом, если а) существует такая точка Мо е Ф (называемая вер- вершиной конуса), что для любой точки М -ф- Мо гиперпо- гиперповерхности Ф прямая М0М целиком содержится в ф; б) предусмотренная условием а) точка Мо един- единственна. Изучим в общем виде гиперповерхности Ф, удовлет- удовлетворяющие лишь условию а) определения 6. (Такие ги- гиперповерхности мы будем называть обобщенными кону- конусами.) [Заметим, что здесь наша терминология отличается от принятой в случае проективного пространства.] Пусть Ф — цилиндр, основанием Ф П П которого яв- является конус, и пусть Мо — вершина конуса Ф П П; М'о—произвольная точка образующей По цилиндра Ф, проходящей через точку Мо; М — произвольная точка цилиндра Ф, отличная от точки М'о; N — произвольная точка пря- прямой M'qM; Mi — точка пересечения с пло- плоскостью П образующей цилиндра Ф, проходящей через точку М; Ni — точка пересечения с пло- плоскостью П образующей цилиндра Ф, проходящей через точ- точку N. Если л?о и л?1 — радиус-векторы точек Мо и Mi, то радиус-векторы точек М'о и М имеют вид х0 + а0 и хх + аь где а0, а\ е !Р и, соответственно этому, радиус-вектор точки N имеет вид A—t)(x0 + ao)-|- t(xi -+- a\), где ieK. По- Поскольку Мо Л Hi «о н ¦1м In r+i) = (A - 0 *о + **i) + ((I - 0 «о + 205
где (i _ t)a0 + ta\ <= &>, а (! — t)xQ -f- tx\ — радиус-век- радиус-вектор некоторой точки плоскости П, отсюда следует, что вектор (I —t)xo-\- tx\ является как раз радиус-вектором точки N\. Это означает, что точка N\ является точкой прямой МОМХ (или — при Mq = Mx — совпадает с Мо) и потому принадлежит конусу Ф Л П- Следовательно, ци- цилиндру Ф будет принадлежать любая точка плоскости, проходящей через точку Ni параллельно подпространству &*, и, в частности, точка N. Таким образом, для любой точки М'о плоскости По и любой точки М гиперповерхности Ф, отличной от точки М'о, каждая точка прямой М'0М принадлежит Ф. По оп- определению это означает, что Ф является обобщенным ко- конусом с вершиной M'Q. (Заметим, что, таким образом, вся плоскость По состоит из вершин обобщенного конуса Ф.) И обратно, оказывается, что любой обобщенный ко- конус является цилиндром, основанием которого является конус. Действительно, легко видеть, что для доказательства этого утвер- утверждения достаточно показать, что для любых двух различных вершин Мо и М'о обобщенного конуса Ф и любой его точки М каждая точка М' прямой, проходящей через точку М параллельно прямой МОМ'О, при- принадлежит Ф. Но так как М'о — вершина конуса, то вся прямая М'0М принадлежит Ф. В частности Ф принадлежит точка N пересечения прямой М'0М с пря- прямой MqM' (заметим, что прямые М'0М и М0М' лежат в одной двумерной плоскости). Поэтому ф принадлежат все точки прямой M0N и, в частности, точка М'. П Это. доказательство не проходит в случае, когда пря- прямые М'0М и М0М параллельны. В этом случае нужно повторить рассуждение, меняя роли точек Мо и М'о, т. е. принимая за N точку пересечения прямых MQM и М'0М'. Поскольку диагонали параллелограмма пересекаются, эта точка обязательно существует. Полезно повторить изложенное рассуждение в анали- аналитической форме. Пусть A1) /W-o 206 .
— уравнение обобщенного конуса Ф. Утверждение, что точка с радиус-вектором х0 является вершиной конуса Ф, означает, что равенство f(x) = O имеет место тогда и только тогда, когда для любого ?е К имеет место равенство /(A — t)xo-{- tx)= 0. Символически, A2) / (*) = 0 <*=>-/(( 1—/)*о-W*) = G yisK. В частности, начало отсчета О тогда и только тогда яв- является вершиной обобщенного конуса Ф, когда A3) f (*) = о ««=}-/ (/*) = 0 v^^ IK. Если теперь Мо и М'о — две вершины конуса Ф, то без ограничения общности мы можем считать, что одна из этих вершин (скажем, Мо) является началом от- отсчета О и, значит, что функция f(x) обладает свой- свойствами A3) и A2) (где Xq — радиус-вектор МаМ'о точки Мо)> а потому и свойством A4) f(x) С другой стороны, радиус-вектор х' произвольной точки М' прямой, проходящей через точку М парал- параллельно прямой MqM'q, выражается формулой xf = x -\- + Ixq, где /еК, и, значит, имеет вид ^[A—s)*:0 + s*:] при . , ; 1 t—i-t-i, s— {+1 (если, конечно, \-\-1-фО). Поэтому при / -ф-—1 A5) f (ж) = 0 <=>/(*') = О, так что точки М и М' одновременно принадлежат (или не принадлежат) обобщенному конусу Ф. Чтобы охватить случай /= —1, достаточно заметить, что одновременно со свойством A4) функция f(x) обла- обладает также и свойством s)xo-\-s(tx)) = Q yt, seK. Поскольку A—s) х0 + s (tx) = x + lx0 при это доказывает A5) при 1ф 1 (и, в частности, при 207
Тем самым наше утверждение об обобщенных кону- конусах доказано и аналитически. О В частности, мы видим, что для любого обобщенного конуса все его вершины заполняют плоскость. Размер- Размерность этой плоскости равна кратности этого конуса как цилиндра. Условие A3), характеризующее вершину обобщен- обобщенного конуса, являющуюся началом О отсчета радиус- векторов, заведомо выполнено, если функция f(x) одно- однородна, т. е. существует такое число m {степень однород* ности функции f{x)), что для любого вектора х е У и любого элемента t e К. Поэтому для произвольной однородной функции f{x) уравнение A1) задает в пространстве s4> обобщенный конус с вершиной О. Замечание 1. Обратное, конечно, неверно: если <р{х)фО для всех х^У°, то уравнение q>{x)f{x) = О, где f{x)— однородная функция, задает тот же конус, что и уравнение f{x) = 0. Однако если конус задается урав- уравнением A1), в котором f{x) — многочлен {от координат xi, ..., х„ вектора х) второй {или первой) степени, то этот многочлен необходимо однороден. Действительно, пусть / = /о + /i + /2, где /о, f\ и f2 — однородные мно- многочлены от Х\, ..., х„ степени 0, 1 и 2 соответственно (так что /о — константа, /i — линейная форма, а /г —• квадратичная форма от х\, ..., хп) ¦ Так как /(**) —/о+ *М*)+*8М*). то многочлен f тогда и только тогда обладает свойством A3), когда /о = 0 и A6) f(*) = 0«=>/,(*) = 0, Ы*) = 0. Но если многочлен f\ не равен тождественно нулю и, значит, существует такой вектор xq, что /1 {x0) f% {х0) =? 0 (мы предполагаем, что степень многочлена f равна двум, т. е. что форма /г не равна тождественно нулю), то при , f 1 (*о) будет иметь место равенство / (Ш = ^0 [Л (хо) + t0f2 {x0)} =* 0, 208
а, значит, в силу свойства A2), примененного к вектору х = toXo и элементу t==to~l (элемент t определен, так как по условию ^ФО), и равенство f(jco) = O. Поэтому 6 силу A6) = О, fa(*0)==0, что противоречит выбору вектора х0. Следовательно, fi = 0, и, значит, многочлен f = f2 однороден. U Определение 7. Гиперповерхности, задаваемые урав- уравнениями A1), в которых f — многочлен второй степени, называются гиперповерхностями второго порядка аф- аффинного 'пространства s4- или, короче, — аффинными гиперквадриками. Уравнение каждой аффинной гиперквадрики имеет, следовательно, вид A7) где А — некоторый (отличный от нуля) квадратичный функционал: А(х)= t, о — некоторый линейный функционал! п а (*) == Z aio*i l и ,floo — некоторая константа. [Здесь х — радиус-вектор произвольной точки гиперквадрики, а х\, ..., хп — его координаты (в некоторой системе Оех...еп аффинных координат). В соответствии с принятыми в первом се- семестре обозначениями вместо индекса 0 надо было бы писать индекс п+ 1, но по чисто типографским сообра- соображениям мы предпочли сменить обозначения.] Согласно замечанию 1 гиперквадрика A6) тогда и только тогда является конусом (обобщенным) с вер- вершиной в начале координат, когда аОо = 0 и а = 0, г. е. когда ее уравнение имеет вид A8) Л(х) = О. Переместив начало координат О в точку О', мы для каждой точки М пространства s4- получим новый ра- радиус-вектор х' = О'М, связанный с прежним радиус-век- 209
тором х = ОМ соотношением * = *' + . где х0 = ОО''. Поэтому уравнение A7) заменится урав- уравнением т.е. поскольку Л (ж/ + л:о) = Л (х')-{- 2А (х', х0)-\-А (х0) = = Л (л:') + 2а0 (л:7) + Л (ж0), где а0 — ассоциированный ко- вектор х н—s* Л (ж, лг0), — уравнением (мы убираем штрих в обозначении вектора х'), где A' = At A9) а' = ао + а, аоо = Л(*о) + 2а(*о) + аоо- Определение 8. Точка с радиус-вектором х0 назы- называется центром гиперквадрики A7), если а0 + а = О, т. е. если для любого 1=1, ..., п (Щ Ivf' + ^o^o. где л^0), ..., х^ — координаты вектора х0. [Заметим, что априори центр может зависеть от вы- выбора уравнения A7).] В частности, начало координат тогда и только тогда является центром гиперквадрики, когда ее уравнение имеет вид B1) Сравнив уравнения A8) и B1), мы немедленно по- получим, что гиперквадрика A7) тогда и только тогда является обобщенным конусом, когда она обладает центром, ей принадлежащим. При этом все центры та- такой гиперквадрики ей принадлежат (и являются не чем иным, как ее вершинами). Соотношения B0) представляют собой систему п уравнений от п неизвестных х\0), ..., х{°\ Если эта си- система имеет единственное решение, т. е. если существует 210
единственный центр, то гиперквадрика A7) называется центральной, а в противном случае — нецентральной. Таким образом, гиперквадрики A7), являющиеся ко- конусами,— это в точности центральные гиперквадрики, центр которых им принадлежит. Конусы, являющиеся гиперквадриками, называются также конусами второго порядка. Определителем системы B0) является определитель аи ... а\п 6 = ап\ ... апп матрицы функционала А. Поэтому, если 6^0, то по правилу Крамера система B0) имеет единственное ре- решение. Если же 6 = 0, то ранг г матрицы системы A7), т. е, ранг функционала А, меньше п. Поэтому (теорема Кронекера — Капелли) это система либо несовместна (центров нет), что имеет место, когда ранг матрицы ||аю au ... ain If I! are0 arei ... ann || равен r-f-1, либо определяет в пространстве s4- пло- плоскость (плоскость центров) размерности п — г, когда ранг последней матрицы равен г. Таким образом, гиперквадрика A7) тогда и только тогда центральна, когда б =#= 0, т. е. когда ранг функ- функционала s4- равен п. Если гиперквадрика A7) обладает хотя бы одним центром, то, поместив начало координат в этот центр, мы получим для нее уравнение вида B1). Если аОо Ф 0, то, разделив уравнение B1) на —а0о, мы получим урав- уравнение вида А(х)= 1. Этим доказано, что каждая гипер- гиперквадрика, имеющая центр, может быть задана уравне- уравнением вида B2) А (х) = 8, где е = 0,1. При этом легко видеть, что гиперквадрика B2) тогда и только тогда нецентральна (ранг г функционала А меньше п), когда она является цилиндром (кратности 15=1). Действительно (мы фактически повторяем дока- доказательство предложения 1), если гиперквадрика B2) является цилиндром кратности ^1, то без ограничения общности можно считать, что координатный вектор еп 21!
принадлежит ее оси в?. Тогда квадратичная форма А(х\, ..., хп), выражающая в координатах функцио- функционал А, будет обладать тем свойством, что если записать ее в виде A(xi> •¦¦>xn) = ax2n + b(xi>--->xn-i)xn + Ao(xi>--->xn}> где а — константа, Ь{х\, ..., xn—i) — линейная форма от хи ..., лг„_ь а А0(хи ..., xn-i)—квадратичная форма от Х\, ..., хп-1, то для любой точки (х\0), ••-, Jc^li» х(п) гиперквадрики B2) тождественно по хп будет иметь место равенство ихп ' ° \Х1 ' ш • ¦ ' xn-l) хп ' л0 Кх\ ' • ' • ' хп-\) и* В частности, отсюда следует, что а = 0, т. е. что A(xit ..., xn) = b(xi7 ..., xrt_i)jcn + AQ(xu ..., xn_i). Если линейная форма b (xv ..., xn_^ не равна тож- тождественно нулю, то в поле К существуют такие эле- элементы xf\ .... x^_v что b(xf\ ..., Jci?li)^»O. Тогда точка с координатами (xf\ ..., x(°]_v x^), где в. — А (х^ jk@> \ (О) __ 6 л0\х1 > •••' ^п-1/ будет принадлежать гиперквадрике B2) и, значит, тож- тождественно по хп будет иметь место равенство что при Ъ {х(^, ..., x^l^ Ф 0 невозможно. Следова- Следовательно, Ъ — 0, т. е. Это означает, что г ^. п — 1, т. е. что гиперквадрика B2) нецентральна. Обратно, из теоремы Лагранжа непосредственно сле- следует, что при соответствующем выборе векторов базиса уравнение гиперквадрики B2) приобретает вид B3) \xf-\- ... + Vr = e> где Хи ..., Хгф0, а е = 0, 1. Поэтому при г «g; п—1 эта гиперквадрика является цилиндром. ? Поскольку свойство быть цилиндром аффинно инва- инвариантно (не зависит ни от выбора системы координат, 212
ни уравнения гиперквадрики), из доказанного предло- предложения непосредственно вытекает, что свойство гипер- гиперквадрики обладать единственным центром аффинно ин- инвариантно и, значит, центр центральной гиперквадрики определен корректно (не зависит ни от выбора системы координат, ни уравнения гиперквадрики). Заметим, что по ходу дела мы также доказали, что для любой гиперквадрики, обладающей центром, суще- существует система аффинных координат, в которой ее урав- уравнение имеет вид B3). В частности, для любой центральной гиперквадрики существует система аффинных координат, в которой уравнение гиперквадрики имеет вид B4) Vi+---+V3 = 8' где г1ь...Дп^0,а8 = 0, 1. При е = 0 гиперквадрика B4) является конусом вто- второго порядка. При 8=1 гиперквадрика B4) называется невырожденной центральной гиперквадрикой. Кроме того, поскольку гиперквадрика B4) является цилиндром кратности 0 (и, значит, гиперквадрика B3) — цилиндром кратности, п — г), мы получаем, что любая гиперквадрика A7), обладающая центром, является п — r-кратным (l^r^n) цилиндром над централь- центральной гиперквадрикой r-мерного аффинного пространства. Замечание 2. Для гиперквадрики, являющейся цилиндром над центральной гиперквадрикой, вместо оси &> обычно рассматривают параллельную ей пло- плоскость пространства А, проходящую через центр осно- основания. Иногда ее называют точечной осью гиперквад- гиперквадрики.
Лекция 13а Гиперквадрики, не имеющие центра. — Перечисление аффинных гиперквадрик. — Гиперквадрики в комплекс- комплексном пространстве. — Гиперквадрики в вещественно-ком- вещественно-комплексном пространстве. — Плоскости, содержащиеся в гиперквадрике.— Оценка их размерности. — Степень планарности центральных гиперквадрик. — Степень пла- нарности параболоидов. Продолжим изучение аффинных гиперквадрик A) Д(*) + 2а(*)+лЬо = О аффинного га-мерного пространства s&. Согласно теореме Лагранжа в ассоциированном ли- линеале У существует базис в\, ..., еп, в котором функ- функционал А выражается формулой B) А (х) = \х\ + . . . + Vr« где V .... К ф 0. Поэтому для любых векторов х = х,е, + ... + хпеп и х0 = будет иметь место равенство А (х, xQ) = V(i0)*i + • означающее, что в сопряженном (базису вх, ..., еп) ба- базисе е1, ..., еп пространства У" ассоциированный ковек- тор ко'- xt—ъ-А (х, х0) имеет координаты X{xfK ..., ЯГ4О>, 0, .... 0. Этим доказано, что ковектор a0 = a{el -f- . .. + апеп тогда и только тогда ассоциирован с функционалом А, когда at = 0 при i > г, т. е. когда ковектор а0 линейно выражается через ковекторы е1, ..., ет. Таким образом, в частности, если гиперквадрика A) центра не имеет (н, значит, ковектор а не ассоциирован с функционалом А), то любой базис в\, ..., еп простран- пространства Ж, в котором для функционала А имеет место форму- формула B), обладает тем свойством, что ковектор а не выра- выражается линейно через ковекторы е1, ..., ег, и потому, не меняя ковекторов е1, ..., ег (и, значит, оставляя прежним видB)функционала А), этот базис можно пре- преобразовать в базис, для которого а = —er+i. Этим до- доказано, что для любой гиперквадрики A), не имеющей 214
центров, существует базис еи ..., еп пространства Уг в котором функционал А имеет вид B), а ковектор а выражается формулой а0 = — er+1 (и, значит, а(х) = = —Xr+i для любого вектора х = ххех + ... + хпеп про- пространства >°). В таком базисе при любом начале координат О урав- уравнение A) приобретает вид C) V? + ¦ • - + М* - 2хг+1 + а00 = 0. Сдвинув начало координат О в точку с координатами г раз га—г—1 раз мы, очевидно (см. последнюю из формул A9) лек- лекции 13), получим уравнение вида C) с а00 = 0. Таким образом, для любой гиперквадрики, не имею- имеющей центра, существует система аффинных координат,, в которой ее уравнение имеет вид где Х\, ..., К ф 0. Вместе с результатами предыдущей лекции это дока- доказывает следующую теорему: Теорема 1 (о приведении к нормальному виду уравнений аффинных гиперквадрик над произвольным полем К). Для любой гипер- гиперквадрики п-мерного аффинного пространства над по- полем К, char К -ф 2, существует система аффинных ко- координат, в которой ее уравнение имеет либо вид (I) v.+ -"+W=8' где 1^г^.пие = 0 или 1, либо (что возможно только при п > 1) вид (II) Vi+ •• где l^r^n — 1, причем в обоих случаях Х\, ... ...,-КгфО. а При г — п и 8=1 гиперквадрика (I) является не- невырожденной центральной гиперквадрикой, а при г = = 0 — конусом второго порядка. При г < п гиперквад- гиперквадрика (I) является п — г-кратным цилиндром, основанием которого при 8 = 1 является невырожденная централь- центральная гиперквадрика в г-мерном пространстве, а при е = 0 — конус.
При г = п—1 гиперквадрика (II) называется пара- параболоидом. Она имеет уравнение вида D) "кхх\ + ... + A,n_iJc«-i = 2xn, где Яь ...» Kn-i Ф 0. Легко видеть, что никакой параболоид не является цилиндром {кратности ^1). Действительно, утвержде- утверждение, что параболоид D) является цилиндром, означает, что существует такой вектор о^О, что вектор х тогда и только тогда удовлетворяет уравнению D), когда этому уравнению удовлетворяет каждый вектор вида х -f- ta, т. е. когда тождественно по t имеет место ра- равенство t 2tf, XtOfXt + t2 f, Я,,а? = 2 (xn + tan), i l i l где Xi, ..., xn — координаты вектора х, a a\, ..., an—~ координаты вектора а. Поскольку же вектор х удовле- удовлетворяет уравнению D), т. е. 1-Х 2 ^i^i = 2хп> это равенство имеет место тогда и только тогда, когда E) Л "KiaiXi = ап и Л hta2 = 0. *=.i »-i Второе из этих соотношений показывает, что точка с радиус-вектором х — (а\, .... ап-\, 0) принадлежит параболоиду D), откуда в силу первого соотношения следует, что га-1 F) а„=Хя*а! = 0. «—i Поскольку а-ф 0, отсюда вытекает, что хотя бы одна из остальных координат а\, ..., ап-\ вектора а не равна нулю. Предположив для определенности, что а\ ф 0, рассмотрим точку с радиус-вектором лс = A, 0, .... 0, Ач/2). Эта точка принадлежит параболоиду D) и по- потому ее координаты удовлетворяют первому из соотно- соотношений E). Следовательно, Ха\ = ап, что при Аа ф. 0 и ai фО противоречит {Q\. 216
Полученное противоречие доказывает, что вектор а существовать не может. ? Отсюда следует, что каждая гиперквадрика (II) яв- является цилиндром кратности п — г — 1 над параболои- параболоидом в г-}- 1-мерном пространстве. Все это означает, что справедлива следующая тео- теорема: Теорема 2 (о перечислении аффинных ги- гиперквадрик над произвольным полем К). Каждая гиперквадрика в п-мерном аффинном простран- пространстве над полем К, char К =?*= 2, принадлежит одному иа следующих четырех классов: а) невырожденные центральные гиперквадрики; б) конусы второго порядка; в) параболоиды (при п >> 1); г) цилиндры кратности k, I ^ k <: га— 1, над гипер- гиперквадриками типов а)—в) в п — k-мерном аффинном про- пространстве. При этом гиперквадрики различных классов аффинна не эквивалентны. Последнее утверждение вытекает из того, что 1) только гиперквадрики а) и б) центральны; 2) только гиперквадрики б) являются конусами; 3) только гиперквадрики в) и г) не центральны; 4) только гиперквадрики г) являются цилиндрами. D Как и в случае проективного пространства, при К = С или R (в ситуации (С, R)) можно получить бо- более точный результат. Например, при К = G в каждом из уравнений (I) и (II) можно преобразованием коор- координат сделать все коэффициенты Х\, ..., К равными единице. Поэтому при К — С в каждом из классов а)* б) и в) теоремы 2, имеется, с точностью до аффинной эквивалентности, лишь одна гиперквадрика. Это озна- означает, что справедлива следующая теорема: Теорема 3 (о классификации аффинных ги- гиперквадрик над полем С). В комплексном п-мер- п-мерном аффинном пространстве при п — \ имеется только две аффинно не эквивалентные гиперквадрики: невы- невырожденная центральная гиперквадрика, состоящая из двух различных точек, и конус второго порядка, пред- представляющий собой две совпадающие точки, а при п > 1 — три аффинно не эквивалентные гиперквадрики, не являющиеся цилиндрами: невырожденная гиперквад- гиперквадрика, конус второго порядка и параболоид. 217
Остальные гиперквадрики в п-мерном (п > 1) аф- аффинном пространстве являются k-кратньши A ^ k г^Г ^ п — 1) цилиндрами над указанными тремя (при k — = п — 1 двумя) гиперквадриками в п — k-мерном аф- аффинном пространстве. П Невырожденная гиперквадрика и конус второго по- порядка являются центральными гиперквадриками и имеют уравнение вида G) х\ -Ь ... -Ь х\ = а, где а = 0 для конуса и а ф^ 0 для невырожденной цент- центральной гиперквадрики (нам теперь удобно не требо- требовать, чтобы в последнем случае имело место равенство а = 1). Напомним (см. лекцию 1.20), что точка О является центром симметрии гиперповерхности Ф с уравнением f(x) = 0, если f(x) = Q тогда и только тогда, когда /(—х) = 0. Поэтому любой центр гиперквадрики яв- является ее центром симметрии. Оказывается, что для центральных гиперквадрик в ситуации jCj— т. е. для гиперквадрик вида G) — верно и обратное, т. е. что любая такая гиперквадрика имеет единственный центр симметрии (совпадающий с ее цент- центром О). Действительно, при п = 1 эта гиперквадрика состоит из двух (возможно, совпадающих) точек ± л/а и в этом случае утверждение очевидно верно. Применяя принцип математической индукции, предположим, что оно уже доказано для гиперквадрик вида G) в п—1- мерном пространстве, где п > 1. Пусть A(ait ..., ап) — произвольный центр симметрии гиперквадрики G) и пусть П — гиперплоскость х,г — ап. Гиперквадрика G) высекает на гиперплоскости П гиперквадрику также имеющую точку А (принадлежащую по построе- построению гиперплоскости П) своим центром симметрии. Сле- Следовательно, по предположению индукции а\ = 0, ... ..., а„_1 = 0. Рассмотрев гиперплоскость х\ — аь мы аналогично покажем, что а2 = • • • = а„ = 0. Поскольку п > 1, это доказывает, что а\ = ... = ап = 0, т. е. что А == О. О Доказанное утверждение означает, что при К = О центр любой центральной гиперквадрики однозначно ха- характеризуется как ее центр симметрии. 213
При К = R (в ситуации (С, R)) уравнение (I) можно привести к виду (I) х\ + • • • + х2р — xp+i — ... — х2г = г, где е = —1, 0 или 1 и l^r^/z, а уравнение(П) — к виду (II) х\ -f • • ¦ + хР — x2p+i — ... — xl — 2хг+и где l^r^n—1, причем за счет умножения на —1 (и изменения знака у координаты xr+i) можно без огра- ограничения общности в обоих случаях считать, что (8) 0<р<-?- (а в случае (I) при р = -? и, значит, при г четном — еще, кроме того, что е Ф> —1). При г — п гиперквадрика (I), как мы знаем, центральна. При е =Ф 0 и р — О цент- центральная гиперквадрика называется мнимым эллипсои- эллипсоидом, если 8 = 1, и действительным, если г = —1. При п = 2 это мнимый и действительный эллипсы, а при п = 1 — пары мнимых или действительных точек. При 8 = 0 центральная гиперквадрика (I) является конусом второго порядка. При р = 0 конус второго по- порядка содержит только одну вещественную точку и на этом основании обычно называется мнимым конусом. При е^О и 1^р^ п/2 центральная гиперквад- гиперквадрика (I) называется ^.-гиперболоидом индекса р. При п. = 2 существует только один гиперболоид — гипербола и два конуса — пары мнимых и действитель- действительных пересекающихся прямых. При п. = 1 гиперболоидов нет, а конус существует только один — пара совпадаю- совпадающих точек. Центром (а потому и центром симметрии) централь- центральной гиперквадрики (I) является точка О. Поскольку эта квадрика является также центральной гиперквадрикой над полем С;, то других центров симметрии у нее нет. Таким образом, и в ситуации (iC,R) центр любой цент- центральной гиперквадрики геометрически характеризуется как ее единственный центр симметрии. При г < п гиперквадрики (I) являются цилиндрами кратности п — г над центральными гиперквадриками r-мерного пространства. 219
При r = n—1 гиперквадрика (II) является пара- параболоидом. Если р = 0, то этот параболоид назы- называется эллиптическим (при п = 2 — это парабола), а если 1 ^ р ^ п, то гиперболическим параболоидом индекса р. При г < п—1 гиперквадрика (II) представляет со- собой цилиндр кратности п — г — 1 над параболоидом г -\- 1-мерного пространства. Так же, как и в вещественно-комплексном проективном пространстве, гиперквадрика в вещественно-комплекс- вещественно-комплексном аффинном пространстве называется s-планарной, если она не содержит ни одной вещественной 5 -f- 1-мер- 1-мерной плоскости, но через любую ее вещественную точку проходит хотя бы одна вещественная s-мерная пло- плоскость, целиком принадлежащая гиперквадрике. Ниже мы докажем следующие два предложения: Предложение 1. Каждая центральная гиперквадрика (9) х\ + • • . + хр — 4+i — • • • — х2я = е, 0 < р < л/2, s-планарна, где ( р — 1, если е=1, \ р, если 8 = 0 или — 1 {при п четном и р = пJ предполагается, что е=#= — 1). Предложение 2. Каждый параболоид A0) Х\ -\- ... + хр р-планарен. Замечание 1. Пусть У — произвольное п + 1-мер- 1-мерное линейное пространство. Тогда в соответствующем проективном пространстве уравнение — ... — Хп = 0 задает невырожденную гиперквадрику Ф индекса р, а в пространстве Ж (рассматриваемом как аффинное п -\- 1-мерное пространство с началом отсчета О) — ко- конус Фафф индекса р-\- 1, причем точками гиперквадрики Ф являются^как раз образующие конуса Фафф- Следова- Следовательно, все одномерные подпространства каждого s-\- 1- мерного подпространства пространства У°, целиком со- содержащегося в конусе Фафф, будут составлять s-мерную плоскость пространства р (У), целиком содержащуюся в Ф, и обратно. Значит, гиперквадрика Ф тогда и только 220
тогда s-планарна, когда s -(- l-планарвн конус Фаф<{). Поэтому предложение 2 лекции 13 является непосред- непосредственным следствием предложения 1 (при е = 0). Согласно теореме 6 лекции 12 ни один эллипсоид или гиперболоид аффинно не эквивалентен параболоиду, ко- конусу или цилиндру. Аналогично, ни один параболоид аффинно не эквивалентен конусу или цилиндру и ни один конус аффинно не эквивалентен цилиндру. С другой стороны, поскольку свойство быть р-пла- нарной гиперквадрикой, очевидно, аффинно инвариант- инвариантно, из предложения 2 следует, что при разных р пара- параболоиды A0) аффинно не эквивалентны, а из предло- предложения 1 — что при разных р аффинно не эквивалентны конусы, а также е-гиперболоиды с одним и тем же е. Действительный и мнимый эллипсоиды очевидным об- образом аффинно не эквивалентны и не эквивалентны ни одному е-гиперболоиду, за возможным исключением 1-гиперболоида при р= 1 (т. е. 0-планарного). Но среди сечений последнего гиперболоида двумерными плоско- плоскостями имеются гиперболоиды, что неверно для эллип- эллипсоида. Поэтому эллипсоид и 0-планарный 1-гиперболоид также аффинно не эквивалентны. Таким образом, все формально различные гиперквад- гиперквадрики (9) и A0) аффинно не эквивалентны, за возмож- возможным исключением ±1 —гиперболоидов s-планарных для одного и того же s ^ 1, т. е. гиперболоидов вида (И) *?+...+2f» i и A2) Д;2+.<.+ где в первом случае s -f- 1 ^ п/2, т. е. s ^ /г/2— 1, а во втором, s < п/2. Предложение 3. Гиперболоиды A1) и A2) аффинно не эквивалентны. Мы докажем это предложение в следующей лекции. Мы видим, таким образом, что справедлива следую- следующая теорема: Теорема 4 (о классификации аффинных ги- гиперквадрик в ситуации (О, R)). В вещественно- комплексном п-мерном аффинном пространстве имеются только следующие аффинно не эквивалентные гипер- гиперквадрики, не являющиеся цилиндрами: а) два эллипсоида {мнимый и действительный) \ 221
б) один s-планарный I-гиперболоид для любого [] [] в) один s-планарный —1-гиперболоид для любого s = 1, ..., т, где т — -т- — 1, если п четно, и ш = п—\ — —5 , если п нечетно; г) один р-планарный конус второго порядка для лю- любого р = 0, 1, ..., [-тН (при р=0 это мнимый конус); д) один р-планарный параболоид для любого р == 0,... ..., |-7г| (при р = О — это эллиптический парабо- параболоид, а при р = 1, .... \— j — гиперболические парабо- параболоиды) . Все остальные гиперквадрики п-мерного простран- пространства являются k-кратными цилиндрами A ^ k ^ п— 1) над перечисленными гиперквадриками п — k-мерного пространства. П При п = 2 мы получаем таким образом девять линий второго порядка (см. теорему 1 лекции I. 22): а) два эллипса (мнимый и действительный); б) и в) одну гиперболу (при п = 2 линии класса в) отсутствуют); г) две пары различных пересекающихся прямых (действительных и мнимых комплексно сопряженных); д) одну параболу и три пары параллельных прямых (действительных раз- различных или совпадающих и комплексно сопряженных различных), а при л = 3 — семнадцать поверхностей второго по- порядка (см. лекцию 1.24): а) два эллипсоида (мнимый и действительный); б) один двуполостный гиперболоид; в) один однополостный гиперболоид (обладающий прямолинейными образующими, т. е. 1-пленарный); г) два конуса (мнимый и действительный); д) два параболоида (эллиптический и гиперболиче- гиперболический) ; и девять цилиндров над плоскими линиями (два эллиптических, один гиперболический, один параболиче- параболический и пять, являющихся парами плоскостей). Для доказательства предложений 1 и 2 нам понадо- понадобятся некоторые предварительные рассмотрения, 222
Пусть Оех, .еп — аффинная координатная система, в которой уравнение данной центральной гиперквад- гиперквадрики имеет вид (9), и пусть У<+>— подпространство ас- ассоциированного линеала У, порожденное векторами ей •••» ер> а У(~^— дополнительное подпространство, по- порожденное векторами ep+i, ..., еп. Тогда т. е. каждый вектор х е У единственным образом пред- представляется в виде *<->, где Именно, если де = Х\ех + .. . + Хпеп, то xt+> — xlel + ... + хрер и *(->=- Мы положим (ж(+>J = х\ + ... + 4. (*(-}У = 4-м + • • • + xl Это равносильно тому (см. лекцию I. 12), что мы вводим в пространства ум и у(-) скалярные умножения (ев- (евклидовы структуры), по отношению к которым базисы ех, ..., ер и ер+и ..., еп этих пространств ортонормиро- ваны. [Не нужно искать в этих умножениях глубокий геометрический смысл; они вводятся ad hoc в основном лишь с целью сокращения записи алгебраических вы- вычислений.] Заметим, что вместо базиса еи ..., еп мы можем рассматривать любой другой базис пространства У, об- обладающий тем свойством, что его первые р векторов со- составляют ортонормированный базис евклидова про- пространства У(-+>) а остальные п — р векторов — ортонор- ортонормированный базис пространства У(~^, поскольку в таком базисе уравнение рассматриваемой гиперквадрики со- сохранит прежний вид (9). Этой свободой в выборе базиса мы будем в дальнейшем неоднократно пользоваться. Как мы знаем, радиус-векторы точек произвольной плоскости П аффинного пространства sf выражаются формулой A3) х = хо + а, где хо — радиус-вектор некоторой фиксированной точки плоскости П, а а — произвольный вектор соответствую- соответствующего линейного подпространства 3* пространства У (т.е. принадлежат линейному многообразию Хо + ^; см. лек- лекцию 8). 223
В соответствии с разложением У = У(+) © У(~) мы будем формулу A3) записывать в виде двух формул: A4) *<+> = 4+) + e(+)' *<-> = л:<)~~) + л(~>' где 4+)> «(+)е=Г<+> и *<,->, «<->€= Г<~>. В введенных обозначениях уравнение (9) имеет вид A6) (*<+>J — (ж(->J = е, и, значит, точка A3) тогда и только тогда содержится в гиперквадрике (9), когда ( ) ( ) е, т. е. когда A6) (*(+>J - (*&->)« + 2 (**+>а<+> - *<->а<->) + + (<+>J — (а<->J = е. В случае, когда точка хо принадлежит гиперквадрике (9), и, значит, A7) это условие сводится к равенству A8) 2 (*<+>«<+> — x^-W-)) + (e<+>J — (а<-)J = 0. Таким образом, плоскость П тогда и только тогда со- содержится в гиперквадрике (9), когда для любого век- вектора а е $Р имеет место равенство A8). Но если это равенство имеет место для любого век- вектора а е ЗР, то оно, в частности, имеет место и для лю- любого вектора вида ta, где а<=^ и ?eR. С другой сто- стороны, подставив в A8) ta вместо а и сократив на t, мы получим соотношение 2 D+)а(+) — xk-W-У) + t {{a(+)f — (a^f) = 0, которое имеет место для всех t тогда и только тогда, когда A9) 4f)a(+)=:=jco~)«(~) и B0) (а<+>J = (а<->J. Этим доказано, что плоскость П тогда и только тогда содержится в гиперквадрике (9), когда для любого век- 224
тора а^$Р имеют место равенства A9) и B0) (а для вектора х0— равенство A7)). Векторы а<+> е Т{+) (векторы а<-> <= У(->), отвечающие всевозможным векторам а <= ^, составляют, очевидно, подпространство пространства ^с+> (пространства 3^(~>). Мы будем обозначать это подпространство символом ^*н> (соответственно — символом &><¦->). Ясно, что Подчеркнем, что равенства здесь, вообще говоря, нет, поскольку для данного вектора а' е ^(+) отнюдь не все векторы а" е ^(-> обладают тем свойством, что а' 4- -j- a" <= ^. Более того, если для подпространства 0* вы- выполнено условие B0), то для каждого вектора а' ^ ^(+) существует лишь единственный вектор а" (= 5Э(->, обла- обладающий тем свойством, что а' + а" <= ^, т. е. существует единственный вектор а е ^, для которого а<+> = а'. Та- Таким образом, при выполнении условия B0) соответствия а\—>а(+> и ai—>a(-> определяют изоморфизмы 0>-^-& и &-*-в*--**. Пусть m — размерность dim ^(+) подпространства (а значит, и подпространства З3). Так как ^(+) c то 0 ^ m ^ р. Поскольку dim П = dim 93, этим доказа- доказано, что в гиперквадрике (9) могут содержаться лишь плоскости размерности ^р, т. е., что если эта гипер- гиперквадрика s-планарна, то s ^ р. Кроме того, пользуясь отмеченной выше свободой в выборе базиса еь ..., еп, мы без ограничения общ- общности можем считать, что первые m векторов е\, ..., е,п этого базиса составляют ортонормированный базис про- пространства ^(+). Имея это в виду и выбрав для любого i = 1, ..., пъ такой вектор at e ZP, что a(*) = ei, рассмотрим векторы а\~\ ..., а(т\ Так как по предположению условие B0) выполнено для всех векторов a e 35, то, в частности, оно выполнено для каждого вектора a,, i = 1, ..., га, и, значит, Кроме того, так как это условие выполнено также и для каждого вектора а,- + Я/, где i ф /, го (а<-> 4- а^1J = D+> + а<+>J = (в, + etf = ej + e] =-- 2. S M. M. Постников, сем. 11 225
С другой стороны, по уже доказанному (а<-> + а^J = (а<->J + ЩГЦ~" + («ГО2 = 2 Следовательно, а<г~>а(~) = О при i =??=/. Таким образом, мы видим, что векторы а\^\ ... ..., а<^)^. &H~)cz T(~) составляют ортонормированное се- семейство векторов. Дополнив это семейство до ортонорми- рованного базиса пространства >°(-> и приняв этот базис за базис ер+1, ..., еп, мы без ограничения общности мо- можем, следовательно, считать, что B1) а\~) = () При этом, согласно сделанному выше замечанию, отображения а\—>а<-+'> и а>—>а(-) являются — при вы- выполнении условия B0) — изоморфизмами. Поэтому век- векторы B1) составляют базис пространства fP<--\ а век- векторы е\ ~\~ ер+1> •••» ет ~Ь ер+т — базис пространства ?Р (причем («i + ер+г)(+> = ег и (е« +ep+i)l--> = ep+i для любого i — I, ..., т). Воспользуемся теперь условием A9). Принимая за а векторы еь 1=1, ..., т, мы видим, что при описанном выше специальном выборе базиса в\, ..., еп это условие равносильно равенствам B2) которые должны иметь место для любого г = 1, ..., т. (Здесь, как и выше, xf>— координаты xoei вектора х0 в ортонормированном базисе гь ..., ет.) В частности, при т = р из B2) следует равенство Ит>J - К"J и, значит, неравенство Ввиду A7) этим доказано, что при е = 1 равенство m = р невозможно, т. е. что при е = 1 необходимо s г^р— 1. Теперь мы уже можем доказать предложение 1. Доказательство предложения 1. В свете полученных оценок нам достаточно доказать, что через 226
любую точку х0 гиперквадрики (9) проходит s-мерная плоскость П, целиком содержащаяся в этой квадрике, где s = р — 1, если е — 1, и s = р — в противном случае. При этом мы без ограничения общности можем пред- предполагать базис в\, ..., еп выбранным так, что х[+) = Хе{, х\>~} — 1*-ер+и где Я, цеК. Тогда (*@+)J — (*@~ *J = А,2 — ц2, и, значит, — поскольку точка х0 принадлежит гиперквадрике (9), — числа к и \х удовлетворяют соотношению Я2 — ц2 = е. Пусть сначала е =0 (т. е. гиперквадрика (9) являет- является конусом). Тогда X = ±щ и меняя, если надо, знак у вектора ep+i, мы без ограничения общности можем счи- считать, что А, = jx. Но тогда подпространство SP, порожден- порожденное векторами е1 ~Ь ep+U е2 ~Г ер+2 ер "~Г" ^2р> удовлетворяет условиям A9) и B0), и потому соответ- соответствующая р-мерная плоскость П целиком содержится в гиперквадрике (9). Таким образом, в этом случае s — р, как и утверждалось. При е = —1 (когда р,2 = Л,2+1) мы примем за & подпространство, порожденное векторами Н Я + е2р+1, е2 + ер+2, . •., ер + е2р (вектор в2Р+1 существует, так как при s = —1 по усло- условию р < /г/2), а при е = 1 (когда Л,2 == ц2 + 1) — подпро- подпространство, порожденное векторами е2 + е0+2, ..., ер_х + е2р_1. В обоих случаях условия A9) и B0), как легко видеть, выполнены и, значит, соответствующая плоскость П (раз- (размерность которой в первом случае равна р, а во-втором — равна р— 1) содержится в гиперквадрике (9). Таким об- образом, s = р при е = —1 и s = р — 1 при 8 = 1.0 Чтобы завершить доказательство теоремы 1, нам ос- осталось доказать предложение 2. Доказательство предложения 2. Найдем предварительно необходимые и достаточные условия того, что m-мерная плоскость П с направляющим под- подпространством ^, проходящая через точку ха парабо- параболоида A0), целиком содержится в этом параболоиде. По- 8* 227
ступая как и выше, мы с этой целью разложим линейное пространство Ж в прямую сумму у =. у(+) 0 у(-) 0 >°@) трех евклидовых пространств У<+\ У°(-> и У@> с ортонор- мированными базисами {еь ..., ер}, {ер+\, ..., en_i} и {еп} соответственно. Тем самым каждый вектор х = = Х\в\ + • - • + хпеп пространства У будет единственным образом представляться в виде суммы где уравнение A0) будет иметь вид а формула A3) для радиус-векторов точек произвольной плоскости П распадется на три формулы: где4+). «(+)е=Г(+), 4}. ^еУ*» и Поэтому плоскость П тогда и только тогда будет со- содержаться в параболоиде A0), когда для вектора х0 бу- будет иметь место равенство и для любого вектора а, параллельного плоскости П (т. е. принадлежащего соответствующему направляю- направляющему подпространству <р), —равенство B4) 2 D+>а<+> - *&->а<->) + ((а<+>J - (а<~>J) = 2а„. „. Но так как в этом равенстве при замене вектора а вектором ta первое слагаемое слева умножается на /, второе — на t2, а правая часть умножается на /, то (см. выше аналогичное рассуждение в связи с соотношением A8)) соотношение B4) тогда и только тогда выполнено для всех векторов а е &, когда отдельно B5) 4+W+)-x(Q-W-)=an и отдельно B6) 228
Таким образом, плоскость П тогда и только тогда со- содержится в параболоиде A0), когда для любого вектора я <= ^ имеют место равенства B5) и B6) (а для вектора х0— равенство B3)). Но условие B6) идентично условию B0). Поэтому, по уже доказанному, размерность m плоскости П не мо- может превышать р, т. е- если параболоид A0) s-планарен. то s ^ р. С другой стороны, для любой точки х0 параболоида A0) мы, пользуясь свободой в выборе базисов еь ..., ер и ep+i, .... еп, можем без ограничения общности счи- считать, что дс@+)==Яе1 и л4~) = ц.ер+1, где и "К + \л ф 0 при Хо ф 0. Тогда тривиальное вычисле- вычисление показывает, что р-мерное подпространство &, по- порожденное векторами ер+1 "Т~ сеп> е2 ~Ь ер+2' • • • » ер где {2*@) TTF при 0 при лео = О, удовлетворяет условиям B5) и B6) и, значит, соответ- соответствующая р-мерная плоскость П целиком содержится в параболоиде A0). Поэтому s = р. ? Таким образом, для доказательства теоремы 4 о клас- классификации гиперквадрик нам осталось лишь доказать предложение 3. Мы сделаем это в следующей лекции.
Лекция 136 Асимптотические и неасимптотические векторы. — Каса- Касательные. — Особые точки. — Характеризация неасимпто- неасимптотических направлений. — Асимптотический конус гипер- гиперквадрики. — Диаметральные плоскости. —Теорема един- единственности. Следуя пути, намеченному в первом семестре, мы для более подробного изучения гиперквадрик в n-мерном аф- аффинном пространстве рассмотрим вопрос о взаимном рас- расположении гиперквадрики A) А (х) + 2а (х) -+-аОо = О и произвольной прямой B) х = xQ + tu, и фО. Поле К мы пока считаем произвольным полем харак- характеристики, отличной от двух. Значения параметра t, отвечающие "точкам пересече- пересечения гиперквадрики A) с прямой B), находятся из урав- уравнения А (хо + ?«) —О, т. е. из уравнения A (a) t2 + 2 [А (а, х0) + а («)] / •+• [А (х0) + 2а (ж0) + а00] = О C) (ср. уравнение A7) в лекции 1.20). Определение 1. Вектор и ^ 0 называется вектором асимптотического направления (или просто — асимптоти- асимптотическим вектором) по отношению к данной гиперквадрике A), если Л(а)=0. (Ср. определение 3 лекции 1.20.) Если же А(и)ф0, то вектор иФО называется неасимп- неасимптотическим. Для неасимптотического вектора а уравнение C) от- относительно t является квадратным уравнением и потому имеет не более двух корней. Если эти корни совпадают (и, значит, обязательно лежат в поле К), то прямая B) называется касательной к гиперквадрике A). Если точка Мо с радиус-вектором д:0 принадлежит ги- гиперквадрике A), то прямая B) тогда и только тогда является касательной, когда D) А {и, *о) + а (и) = 0. 230
Если уравнение D) относительно и удовлетворяется тождественно, то точка Мо называется особой точкой ги- гиперквадрики A). Любая прямая (не асимптотического направления), проходящая через такую точку, является касательной. Уравнение D) можно рассматривать и для точки Мо, не обязательно принадлежащей гиперквадрике. Оно тогда и только тогда удовлетворяется тождественно, когда точ- точка Мо является центром гиперквадрики A). Таким об- образом, особые точки гиперквадрики — это в точности центры, этой гиперквадрики, ей принадлежащие. Для неособой точки Мо гиперквадрики A) уравнение D) определяет в ассоциированном линеале У подпро- подпространство размерности п—1. Соответствующая этому подпространству гиперплоскость пространства s&, прохо- проходящая через точку Мо, обладает тем свойством, что она содержит все касательные к гиперквадрике A) в точке Мо. Эта гиперплоскость называется касательной гипер- гиперплоскостью гиперквадрики A) в ее неособой точке. Для параболоида A,[XT + ... -f- hn_xxn-i = 2хп, Я[, . . -, А,л_! т& О, уравнение D) имеет вид Г, + ... + K-^f-iUn-i - 2и„ = О, где мь ..., ип — координаты вектора а, а х[0), ..., х^— координаты вектора ха. Так как это уравнение тожде- тождественно никогда не удовлетворяется, то, следовательно, никакой параболоид особых точек не имеет. По аналогичным соображениям особых точек нет и у цилиндра над параболоидом. . Для центральной гиперквадрики E) Ххх\+... +Хпх1 = е, А,,, .... Кп Ф О, уравнение D) имеет вид 2V = о и удовлетворяется тождественно только при Мо = О. С другой стороны, точка О тогда и только* тогда принадлежит гиперквадрике E), когда е = 0. Следо- Следовательно, невырожденные центральные гиперквадрики (эллипсоиды и гиперболоиды) особых точек не имеют, а конус второго порядка обладает единственной особой точкой — его вершиной (являющейся также его центром). 231
Вообще, для любого г, 1 ^ г ^ п, гиперквадрика F) %\Х\ -\- ... -\- лгхг = 6, A»i, •.., Я, =з^= 0> при е = 1 особых точек не имеет, а при е = 0 ее особые точки заполняют п — r-мерную плоскость х\ = 0, ... ..., хр = 0. (При е = 0 гиперквадрика F) является обоб- обобщенным конусом и ее особые точки — это ее вершины.) Специальный интерес представляет случай г=1, 8=0, когда гиперквадрика F) имеет уравнение х* — 0. Такая гиперквадрика называется двойной гиперплоскостью Х\ — 0. Так как в этом случае особые точки заполняют ту же гиперплоскость Xi = 0, мы получаем, следователь- следовательно, что при г = 1 ие = 0 гиперквадрика F) неособых точек не имеет. Ясно, что в ситуациях ;С: и (.С:, R) все остальные ги- гиперквадрики обязательно имеют неособые точки. Предложение 1. Если в ситуации (C^R) (или 1С) гиперквадрика A) не является двойной гиперплоскостью, то для любого неасимптотического вектора и существует прямая B) с направляющим вектором и, пересекающая гиперквадрику A) в двух различных (вообще говоря, комплексных) точках. Доказательство. В случае, когда гиперквадрика A) обладает центром, ей не принадлежащим (т. е. яв- является либо эллипсоидом или гиперболоидом, либо ци- цилиндром над эллипсоидом или гиперболоидом), доста- достаточно за B) принять прямую, проходящую через этот центр. Действительно, для такой прямой уравнение C) принимает вид Л(и)*2 +0H = 0, где А(и)ф0 я ОооФО, и, следовательно, имеет (в поле Ю) два различных корня ± -л/поо/А (и). Если гиперквадрика A) является конусом (обобщен- (обобщенным), то при переносе начала координат в ее центр (являющийся в этом случае вершиной) уравнение гипер- гиперквадрики приобретает, как мы знаем, вид /4(лс) —0. В первоначальной системе координат это означает (см. формулы A9) лекции 13), что в уравнении A) G) а (х) = — А (х, у0), а00 = А (у0), где уо — радиус-вектор центра Мо (мы заменили х0 на уо, 232
поскольку символ хо у нас теперь занят для обозначения радиус-вектора точки, через которую проходит пря- прямая B)). С другой стороны, легко видеть, что если ранг г функ- функционала А больше единицы, то существует такой вектор г0, что А («о, иJ ФА (и) А B0). [Действительно, если базис еь ..., еп пространства У выбран так, что где %\, ..., Яг==±], то существует такое /о, 1 ^ г'о ^ г, что А(и) ф huu\ (ибо в противном случае Л(а) = Л(а)+ ... +Л(а) = гЛ(а), что при А (а) ф О и г > 1 невозможно). Поэтому, если гп = еи, и, значит, Л(г0, u) = Kiuut,, то Л («0, аJ - А (а) Л (г0) = (Я1ои,0J - Л (а) Я,о = -=^и{^ии\— А(и))фО.] Мы положим хо = Уо + 2о- Тогда, в силу тождеств G), А (а, дс0) + а (а) = Л (а, г0) я Л (дсо) + 2а (ж0) + аоо = А (х0) — 2А (дс0, уо) + ^Ы = = Л (дс0 — Уо) = А (го). Следовательно, при таком векторе х0 уравнение C) имеет вид Л (а)/2 + 2Л (а, г0) t + А (г0) = О и, значит (так как по условию его дискриминант А (и, гоJ — Л(а)Л(г0) отличен от нуля), обладает двумя различными корнями. Наконец, если гиперквадрика A) является парабо- параболоидом или параболическим цилиндром, то ее уравнение преобразованием координат может быть приведено к виду (П) из лекции 13а. Это означает, что существуют такие векторы у0 и е (радиус-вектор начала канониче- канонической системы координат и вектор er+i канонического ба- базиса) и такой ковектор C (лишь знаком отличающийся от ковектора er+l базиса, сопряженного с каноническим), что Р (е) ф 0, 000 = А (Уо) 233
и а (ж) = р (ж) — А (х, у0), А(х, е) = 0, для любого вектора•*?У. В этом случае мы положим x0 = лое -+- y0 где . Э (иJ - 2Л (и) Л° — 2А (и) Э (в) Тогда А (а; *0) ¦+ а (а) = Л (а, у0) + Р (а) — Л (a, jr0) = Р (я) и (поскольку Л (Яое + jf0) = А (у0) и Л (Яое + yQ, yQ) = Л (*ь) + 2а (дс0) + аоо = Л (А,9г + = ^4 (Уо) + 2Р (Яое + у„) — 2Л (у0) + Л (у0) = 2р (Яое + у0). и, значит, дискриминант уравнения C) будет равен р (аJ - 2Л (а) р (Яое + у0) = = р (аJ - 2А.И (а) р (е) - 2Л (а) р (а0) = 1. Поэтому и в этом случае уравнение C) имеет два раз- различных корня. Таким образом, мы не можем получить двух различ- различных корней уравнения C) только в случае, когда гипер- гиперквадрика A) является обобщенным конусом и ранг г функционала А равен единице, т. е. в случае, когда эта квадрика является двойной гиперплоскостью. Тем самым предложение 1 полностью доказано. О Замечание 1. Для доказательства предложения 3 лекции 13а (что является нашей непосредственной целью) утверждение предложения 1 фактически нужно лишь в тривиальном случае гиперболоидов. В полной общности оно требуется лишь для доказательства теоремы един- единственности (см. ниже теорему 1). Для асимптотического вектора и уравнение C) либо является уравнением первой степени (и потому имеет единственный корень), либо от него остается лишь сво- свободный член (и в этом случае прямая B) с гиперквад- гиперквадрикой A) общих точек не имеет; такие прямые назы- называются асимптотами), либо удовлетворяется тождествен- тождественно (прямая B) лежит на гиперквадрике A)). Поэтому из предложения 1 следует, что в ситуации (С, R) (или С) для любой гиперквадрики различие между асимпто- 234
тическими и неасимптотическими векторами может быть охарактеризовано чисто геометрически: если гиперквад- гиперквадрика не является двойной гиперплоскостью, то вектор иф0 тогда и только тогда не асимптотичен, когда су- существует прямая с направляющим вектором и, пересе- пересекающая гиперквадрику в двух точках, а для двойной гиперплоскости неасимптотические векторы — это в точ- точности векторы этой гиперплоскости не параллельные. Таким образом, для гиперквадрик в вещественно- комплексном {или комплексном) аффинном пространстве свойство вектора быть асимптотическим аффинно инва- инвариантно (не зависит ни от выбора системы координат, ни от выбора уравнения гиперквадрики). Все прямые асимптотического направления централь- центральной гиперквадрики, проходящие через ее центр, состав- составляют конус, который называется асимптотическим кону- конусом этой гиперквадрики. Если началом координат является центр гиперквад- гиперквадрики и, значит, гиперквадрика задается уравнением вида (8) А{х)-\-аоа = О, то асимптотический конус будет иметь уравнение (9) А(и) = 0. В случае, когда аОо ?= 0, т. е. когда гиперквадрика (8) является эллипсоидом или гиперболоидом, асимпто- асимптотический конус (9) состоит из асимптот этой гиперквад- гиперквадрики (заметим, что при п>2 существуют асимптоты,не принадлежащие асимптотическому конусу, т. е. не прохо- проходящие через центр; напомним, что при п = 2 все асимп- асимптоты— их в этом случае ровно две—проходят через центр). При аоо — 0, т. е. в случае, когда гиперквадрика (8) является конусом, уравнение (9) совпадает с уравнением (8). Поэтому для конуса асимптотический конус совпа- совпадает с ним самим. Поскольку асимптотические направления определены геометрически инвариантно, а для центральных гипер- гиперквадрик то же самое верно и для центра, то асимптоти- асимптотический конус центральной гиперквадрики определен гео- геометрически инвариантно. Следовательно, асимптотические конусы аффинно эквивалентных центральных гиперквадрик аффинно экви- эквивалентны. 235
Замечание 2. Часто об асимптотическом конусе говорят и для нецентральных гиперквадрик, помещая его вершину в начало координат или, что фактически равно- равносильно, считая его подмножеством ассоциированного ли- линеала У. В обоих интерпретациях этот конус задается уравнением (9). Ценность этого обобщения весьма про- проблематична. Теперь мы можем, наконец, доказать предложение 3 предыдущей лекции. Доказательство предложения 3 лекции 13а. Согласно предложению I лекции 13а асимптотиче- асимптотический конус гиперболоида ...-** = 1, 0<5< л/2 - 1, s -J- 1-планарен, а гиперболоида х\ + .. . + х\ — x2s+l — ... — х\ = _ 1, 0 < s < /г/2, s-планарен. Поэтому эти конусы аффинно не эквива- эквивалентны. Следовательно, аффинно не эквивалентны и сами гиперболоиды. ? Тем самым наконец-то полностью доказана теорема классификации аффинных гиперквадрик в ситуации (C,R) (теорема 3 лекции 13а). Для любого фиксированного неасимптотического век- вектора и ковектор х\—>А(и, х) не равен тождественно нулю и потому уравнение A0) А (и, ж) + а(а) = 0 определяет в пространстве sf некоторую гиперпло- гиперплоскость. Заметим, что плоскость A0) зависит только от на- направления вектора и (не меняется при умножении этого вектора на произвольное, отличное от нуля число). Определение 2. Гиперплоскость A0) называется диа- диаметральной гиперплоскостью гиперквадрики A), сопря- сопряженной с неасимптотическим направлением, задаваемым вектором и. Замечание 3. Диаметральная гиперплоскость A0) определена и для некоторых асимптотических направле- направлений (такие направления называются неособыми). Од- Однако реальной пользы это обобщение, по-видимому, не дает. Сравнив формулу A0) с формулой D), мы немедлен- немедленно получим, что точки пересечения гиперплоскости A0) 236
с гиперквадрикой A) — это в точности точки, в которых прямые с направляющим вектором и касаются этой ги- гиперквадрики. Аналогично, сравнение формулы A0) с уравнением C) показывает, что радиус-векторы точек гиперплоскости A0) — это в точности векторы х0, обладающие тем свой- свойством, что для соответствующей прямой B) в уравнении C) равен нулю коэффициент при t, т. е. — в силу фор- формулы Виета — равна нулю сумма t\ + t2 корней t\ и ?2 этого уравнения. Но так как точки М\ и М2 пересечения прямой B) с гиперквадрикой A) имеют радиус-векторы x\—xQ-\- txu и х2 = х0 -f- t2u, то равенство ti + t2 = 0 равносильно равенству 2 — 0> т. e. тому, что точка Мо с радиус-вектором х0 является серединой отрезка МХМ2 (мы допускаем к рассмотрению «отрезки» с одинаковыми концами; середина такого от- отрезка совпадает с его кон- концами) . Следовательно, точки гиперплоскости A0)—это в точности середины отрезков, высекаемых гиперквадрикой A) на всевозможных пря- прямых с направляющим векто- вектором и. В частности, это показы- показывает, что диаметральная ги- гиперплоскость A0) определе- определена геометрически инвариант- инвариантно (не зависит ни от выбора системы координат, ни от выбора уравнения гиперквадрики). Подчеркнем, что этот вывод законен только в ситуа- ситуации (С1,К) (или С), когда любая прямая вида B) пе- пересекает гиперквадрику A) в двух (возможно, совпа- совпадающих) точках. В произвольной аффинной координатной системе Оех ... еп левая часть уравнения гиперквадрики A) представляет собой многочлен f (хи ..., хп)— i второй степени, где + 2 а00 и ад, = 237
а уравнение A0) имеет вид y? alxutj *,+ ...+ (^ atnj xn + ? а-юЩ — 0, где и\, ..., ип — координаты вектора и. В частности, при и = еп уравнение A0) приобретает вид A1) аяХхх + ... +аппхп + ап0 = 0. Поэтому если точка О принадлежит гиперплоскости A1), а векторы ех, ..., е„~\ ей параллельны (т. е. если гипер- гиперплоскость A1) является координатной гиперплоскостью хп = 0), то а„]=0, ..., ап,„_] = 0 и а„0 = 0, и, значит (напомним, что матрица ||а*/|| симметрична и, в частности ) A2) f(*lf где fi(xi, ..., xn^i)—многочлен степени ^2 от хи ... ..., xn-i (аапп ф 0). Этим доказано, что если вектор еп имеет неасимпто- неасимптотическое направление, точка О лежит в диаметральной гиперплоскости, сопряженной с направлением вектора е„, а векторы ех, ..., еп-\ параллельны этой гиперплоскости, то уравнение гиперквадрики A) имеет вид О-ПП^п > /1 (Xl> • • • г Хп_\) = 0, где апп =Ф 0, a f i — многочлен степени ^2. Мы применим это утверждение к доказательству сле- следующей теоремы, обеспечивающей адекватность аналити- аналитической теории гиперквадрик геометрической сути дела: Теорема 1 (теорема единственности), б ве- вещественно-комплексном {или комплексном) аффинном п-мерном пространстве два уравнения второй степени ¦A3) / = 0 и ? = 0 тогда и только тогда определяют (в произвольно задан- заданной аффинной координатной системе) одну и ту же ги- гиперквадрику, когда эти уравнения пропорциональны, т. е. существует такое {отличное от нуля) число "К ^ К, что A4) ? = ЛЛ 238
Доказательство. Ясно, что если A4) выполнено, то уравнения A3) задают одну и ту же гиперквадрику. Поэтому в доказательстве нуждается лишь обратное утверждение. Пусть уравнения A3) задают одну и ту же гипер- гиперквадрику Ф. Перейдем от данной аффинной координат- координатной системы к другой системе Ое\ ... еп, для которой а) вектор еп имеет неасимптотическое (по отношению к данной гиперквадрике Ф) направление; б) точка О расположена в диаметральной гиперпло- гиперплоскости, сопряженной с направлением вектора е„; в) векторы еи ..., е„_! параллельны этой гиперпло- гиперплоскости. Заметим, что система Ое\ ... еп характеризуется гео- геометрически и ее выбор никак не связан с уравнениями A3) гиперквадрики Ф. Подставив в многочлены fag выражения старых ко- координат через новые, мы получим многочлены f и |, также обладающие тем свойством, что каждое из урав- уравнений f = О и g = 0 задает (в новых координатах) ги- гиперквадрику Ф. При этом ясно, что многочлены fug тогда и только тогда пропорциональны, когда пропор- пропорциональны многочлены fug. Следовательно, без ограничения общности мы можем с самого начала предполагать, что данная аффинная ко- координатная система обладает свойствами а), б) ив). Но тогда, по сделанному выше замечанию, каж- каждый из многочленов fag должен иметь вид A2), т. е. должны иметь место равенства f(X\, ••., Хп) = G>n;iXn -f- /i {Xx, ..., Xn_i), g(xu ..^xn) = bnnxl-jrgl(xl, ..., *„_!>, где аппф0, ЬппФО, a f\ и g\ — многочлены степени ^2 от хи ..., хп-и Пусть теперь Фо — пересечение гиперквадрики Ф с координатной гиперплоскостью П: хп = 0. В этой ги- гиперплоскости числа Х\, ..., Хп-х являются аффинными координатами и оба уравнения A5) f, = 0 и gl = 0 от Хи ¦ ¦ •. хп-\ определяют в П множество Фо (т. е. .... лся_,)б=Ф0). 239
Случай /.Многочлен fx тождественно ра- равен нулю. В этом случае Фо совпадает со всей пло- плоскостью П и, следовательно, многочлен gx также тож- тождественно равен нулю. Поэтому / = аппх\, g — bnnx\, и, значит, A4) выполнено (с X = bnn/ann). Случай 1а. Многочлен g\ тождественно ра- равен нулю. Этот случай полностью аналогичен слу- случаю !. Случай 2. Многочлен fx является отличной от нуля константой. В этом случае множество Фо пусто и, следовательно, многочлен gx также является отличной от нуля константой (в силу так называемой основной теоремы алгебры для каждого мно- многочлена gi Ф const множество решений уравнения gx = 0 не может быть пустым). Таким образом, f = аппх\ + аю и g = ЬппХп + bm, где аОо Ф 0, &0о Ф 0. Поэтому уравнение / = 0 задает пару гиперплоскостей хп = ±-\/ — «оо/а«я' а уравнение g = 0 — пару гиперплоскостей хп = ± V — boo/bnn. По- Поскольку же эти гиперплоскости составляют, по условию, одну и ту же гиперквадрику Ф, это возможно только при 7Q0 т. е. -^- = -^0-. Поэтому -^_=-^-, и, значит, многочлены f и g пропорциональны. Случай 2а. Многочлен gx является отлич- отличной от нуля константой. Этот случай полностью аналогичен случаю 2. Случай 3. Многочлен fi является отлич- отличным от нуля многочленом первой степени (и, значит, множество Фо является в П гиперплоскостью). Этот случай подразделяется на два подслучая — в зави- зависимости от степени многочлена g\. Случай 3''. Многочлен g\ также является многочленом первой степени. Тогда, в силу теоремы единственности для уравнений гиперплоскостей (см. лекцию 8), многочлен gi пропорционален много- многочлену /ь т. е. существует такое число Ки что Об) g» = a.i/i. 240
Имея это в виду, рассмотрим в П произвольную точку (х[°К ¦ • ¦ ,х (^_,),не принадлежащую множеству Фо, '". е. такую, что число c = f,(.x:A0), .... х{^_х) отлично от нуля. Положив a-nn мы немедленно получим, что точка (л:*0), пространства удовлетворяет уравнению f = О, т. е. принадлежит гиперквадрике Ф. Но тогда эта точка должна удовлетворять и уравнению g = О, т. е. должно иметь место равенство Сокращая на с, мы получаем отсюда, что A,i = ЬПп/аПп, откуда непосредственно следует, что уравнения A5) про- пропорциональны (с Л, = Л,1>. Случай 3". Многочлен gx является много- многочленом второй степени. Не уменьшая общности, мы можем считать fx = xn-i (т. е. что в П гиперпло- гиперплоскость Фо задается уравнением Xn-i =0; условия а)—в) никак не ограничивают координатную систему Оех ... ... е„_1 в П). Если многочлен gi(xi, ..., л:«-2,0) от Х\, .... х„-2 не равен тождественно нулю, то в П суще- существует такая точка (х[0), ..., х{°]_2, 0), что g{ (x\0), ... ¦ • •' х{п-2' 0) ?= 0, и, значит, уравнение gx = 0 задает в П гиперповерхность, отличную от гиперплоскости хп-\ = 0. Это доказывает, что многочлен g\ (х\, ..., хп-2, 0) тож- тождественно равен нулю, и, значит, gx = xn-\h, где h — не- некоторый многочлен первой степени от д;ь ..., х„-2. В п — 2-мерной плоскости хп-х =0, хп = 0, с коорди- координатами хи ..., хп-2 рассмотрим гиперплоскость h = 0. Так как g = Ъппх\ + xn_xh и / = аппх\ + xn_v то для л к> бой точки (-^10)> • • • > х%-2) этой гиперплоскости точка (а;^1, . . ., л:^012, 1, 0) удовлетворяет уравнению g = 0, но не уравнению /=0. Поскольку это противоречит условию, что уравнения / = 0 и g = 0 задают одну и ту же гиперквадрику, от- отсюда следует, что случай 3" невозможен. Случай 4. Оба многочлена fx и gi являют- являются многочленами второй степени. В этом случае Фо является гиперквадрикой в П, и, таким 241
образом, в гиперплоскости П (являющейся п—1-мерным аффинным пространством) мы имеем два уравнения вто- второй степени A5), задающие одну и ту же гиперквад- гиперквадрику. Поэтому если мы предположим, что для гипер- гиперквадрик в п — 1-мерном пространстве теорема 1 спра- справедлива, то многочлены f{ и gi будут пропорциональны, т. е. для них имеет место равенство A6). Но тогда по тому же рассуждению, что и в случае 3' (очевидно, со- сохраняющему силу и для многочленов f{ и g{ второй сте- степени), многочлены fug также будут пропорциональны. Поскольку рассмотренные случаи исчерпывают все возможности, теорема 1 для гиперквадрик в л-мерном пространстве тем самым доказана в предположении, что она справедлива для гиперквадрик в п — 1-мерном про- пространстве. Поэтому, согласно принципу полной матема- математической индукции, для завершения доказательства тео- теоремы 1 остается доказать ее при п = 1. Но при п = 1 многочлены fug являются многочле- многочленами второй степени от одной переменной хи а гипер- гиперквадрика Ф — парой (возможно, совпадающих) точек. Поэтому условие, что уравнения A3) задают одну и ту же гиперквадрику, означает, что многочлены / и g имеют одни и те же корни и, следовательно, пропорциональны. Теорема 1 тем самым полностью доказана, о
Лекция 14 Линейные операторы и смешанные билинейные функ- функционалы. — Алгебра линейных операторов. — Дефект и ранг линейного оператора. — Идемпотентные операто- операторы. — Сумма, разность н произведение идемпотентов. Возвращаясь к теории линейных пространств, рас- рассмотрим последний еще нами не изученный тип билиней- билинейных функционалов — смешанные функционалы В : х, |t—> у-^В{х,\), где же?", \^У (см. лекцию 5). Оказы- Оказывается, что эти функционалы тесно связаны с гомомор- гомоморфизмами (см. определение 5 лекции 3), для которых ЗГ = Г. Определение 1. Гомоморфизмы из У в У называются эндоморфизмами линейного пространства У или линей- линейными операторами на У. Таким образом, отображение A) А: Т^У является линейным оператором, если А (х + у) = Ах + Ау, для любых векторов х, у^У и любого числа йеК. Сумма А-\- В линейных операторов Л и В и произве- произведение kA линейного оператора Л на число k e К опре- определяются обычным образом: (Л -\- В)х = Ах-\- Вх, и являются, очевидно, линейными операторами. Непо- Непосредственно проверяется, что относительно этих опера- операций множество End У всех линейных операторов на У является линейным пространством. Нулем этого пространства служит нулевой оператор О, действующий по формуле О (х) = 0. Вместо О мы, как правило, будем писать просто 0. Автоматическая проверка показывает, что имеют ме- место следующие утверждения: 243
1° Каждый линейный оператор Л определяет по фор- формуле А (х, |) = | (Ах) некоторый смешанный билинейный функционал А е 2° Для любого смешанного билинейного функционала А соответствие, сопоставляющее произвольному вектору х^У ассоциированный ковектор Ах: I н-» А (х, |) пространства У (т. е. в силу отождествления (У')' = — У — вектор пространства У), является линейным опе- оператором Л е End У. 3° Построенные отображения А*—>А, At—>Л взаимно обратны и потому биективны. 4° Эти отображения сумму переводят в сумму и про- произведение на число в произведение на то же число и, значит, являются изоморфизмами. Таким образом, линейные пространства End У и Т! (У) естественно изоморфны. Как правило, мы будем отождествлять оператор с со- соответствующим билинейным функционалом. В частности, следом Тг Л произвольного линейного оператора Л мы будем называть след Тг Л соответствую- соответствующего билинейного функционала А (см. лекцию 6). Заметим, что Тг (kA + lB) = kTrA + ntB для любых операторов Л, В е End У и любых чисел k, /еК, т. е. функционал Тг: End^°->K линеен (при- (принадлежит сопряженному пространству (End^°)'). Кроме сложения, для операторов определено и умно- умножение А,В>—>АВ, где, как обычно для отображений, произведением АВ операторов считается их композиция Л о В. [Таким образом, (АВ)х=А(Вх). для любого вектора х е У.] Оператор АВ, очевидно, ли- линеен. Тривиальная выкладка показывает, что умножение операторов ассоциативно: (АВ) С = А (ВС) 244
(так что в произведении любого числа операторов мож- можно не писать скобки), и дистрибутивно относительно сло- сложения: Это означает, что множество Endy является кольцом. Это кольцо обладает единицей, которой является тождественный оператор Е: Ж-*~У, оставляющий каж- каждый вектор хе^на месте: Вообще говоря АВфВА, так что кольцо ULn&T не- некоммутативно (при п > 1). Умножение операторов связано с их умножением на числа k e К формулой B) (kA) B = A (kB) = k (AB), доказательство которой сводится к тривиальной вы- выкладке. Кольца, которые одновременно являются линеалами и в которых выполнено соотношение B), называются алгебрами. Таким образом, подытоживая все сказанное выше, мы видим, что множество End У является алгеб- алгеброй с единицей Е. Из соотношения B), в частности, вытекает, что для любого оператора А. Таким образом, операторы вида kE — они называются скалярными операторами — перестановочны со всеми операторами. Ниже мы покажем, что это свойство характеризует скалярные операторы, т. е. любой оператор, перестано- перестановочный с каждым оператором из End У, скалярен. Можно сказать, таким образом, что алгебра Endy не- некоммутативна в максимальной степени (насколько это допускает структура алгебры). Поскольку каждый линейный оператор А является гомоморфизмом, можно говорить о его ядре КегЛ и об- образе 1тЛ. Согласно общим определениям лекции 3 ядро КегЛ состоит из всех векторов х е У, для которых Ах = О, а образ 1тЛ из всех векторов вида Ах, где х^У, Как 245
ядро, так и образ являются подпространствами про- пространства У. Определение 2. Размерность ядра называется дефек- дефектом оператора Л, а размерность образа — рангом. Де- Дефект обозначается символом def Л, а ранг — символом гкЛ. Таким образом, def A = dim Ker А, rk A = dimlm A. Согласно формуле E) лекции 3 для любого линей- линейного оператора Л: у-*~У сумма его дефекта и ранга равна размерности п пространства У: <3) def A + rk А = п. Формула C) наводит на мысль, не является ли про- пространство У прямой суммой подпространств КегЛ и 1тЛ? Однако, вообще говоря, это неверно. (На- (Например, для, очевидно линейного, оператора Л, действую- действующего в двумерном пространстве У по формуле А{хе\ -j-i + Уе2) = уви ядром и образом является одно и то же одномерное подпространство [е\\, и, значит, сумма 1тЛ + КегЛ заведомо не является прямой.) Из формулы C) лишь следует, что равенство D) 1 имеет место тогда и только тогда, когда E) 1т Л П Кег Л = О, т. е. когда подпространства 1тЛ и КегЛ дизъюнктны. Рассмотрим один важный класс операторов, для ко- которых условие E) выполнено. Определение 3. Линейный оператор Р (или, более общо, — элемент произвольного кольца) называется идемпотентным (или просто — идемпотентом), если Р2 = Р. Если Р — идемпотент и х = Ру, то Рх = Р*у = Ру = х. Таким образом, х = Рх. Поэтому если х е ImP П Кег Р, то х = Рх = 0. Зна- Значит, для любого идемпотента Р условие E) выполнено и, 246
следовательно, F) ^ = I Формула F) означает, что каждый вектор хеУ единственным образом представляется в виде G) х = ж, + х2, где xielmP и ж2 ^ Кег Р. Но так как Рх е Im Р и Р(х — Рж) = Рх — Р2х — 0, т. е. ж — РлгеКегР, то разложение х = Рх + (х — Рх) имеет вид G). Поэтому, в силу единственности, (8) *, = Рх и х2 = х — Рх. Таким образом, мы видим, что любой идемпотент Р е End У задает разложение F) пространства Т в пря- прямую сумму подпространств I'm P и Кег Р, причем для компонент хх и дг2 разложения G) произвольного век- вектора х^У° имеет место равенство (8). Оказывается, что так можно получить любое разло- разложение пространства У в прямую сумму. Предложение 1. Для каждого разложения (9) T пространства У в прямую сумму подпространств суще- существует такой идемпотент Р: У°—*-У, что AG)\ 0> = 1mP, Q = Кег P. Этот идемпотент единствен. Доказательство. Формула (9) означает, что любой вектор х е У единственным образом представ- представляется в виде G), где теперь хх е 0> и х2 е Q. Поэтому если идемпотент Р существует, то он должен задаваться формулой Рх = Х\ (см. первую из формул (8)). Это до- доказывает его единственность. Для доказательства существования мы опреде- определим оператор Р формулой Рх = Х\. Непосредственная проверка показывает, что оператор Р а) линеен; б) идемпотентен; в) обладает свойствами A0). ? Оператор Р, действующий по формуле Рх = Х\, на- называется проектором на 9* вдоль Q. Таким образом» 247
мы видим, что любой проектор является идемпотентом, любой идемпотент — проектором и что тем самым уста- устанавливается биективное соответствие между разложе- разложениями пространства W в прямую сумму подпространств и идемпотентами алгебры Ed>° Это соответствие позволяет полностью свести геомет- геометрию прямых разложений к алгебре идемпотентов. Например, так как (Е — РJ = Е — 2Р + Р2, то равенство {Е — РJ — Е — Р имеет место тогда и только тогда, когда Р2 — Р, т. е. оператор Е — Р тогда и только тогда идемпотентен, когда идемпотентен опе- оператор Р. При этом если Р — проектор на ^ вдоль Q, то Е — Р будет проектором на Q вдоль &. Таким образом, переходу от Р к Е — Р соответствует перестановка пря- прямых слагаемых в разложении (9). Более содержательный пример мы получим, рассмот- рассмотрев для двух идемпотентов Pi и Р% операторы Р\ -h P% и Р\ —Рг. Так как (Pi + Р2J = Р\ + Pi + Р1Р2 + Р2Р1 = Pi +P2+P1P2+P1PU то сумма Pj Ц- Рг двух идемпотентов Pi и Р2 тогда и только тогда является идемпотентом, когда PiPajfj -f P2Pi == 0. Но если РКР2 -f- P2Pi— 0, то 2PiP, = РхР2 — Р2Р{ = Р\Р2 — Р2Р\ = = Рх (PiP2 + *2>i) ~ (Р.Р2 + Р*Рх) Pi = 0, и, значит, если характеристика char К поля К отлична от двух, то Р\Р-2 — 0 и Р2Р1 = 0. Следовательно, при char К ф 2 сумма Р\ -j- P2 идемпотентов Р\ и Р2 тогда и только тогда является идемпотентом, когда Р\Р2 — = P^Pi = 0. Если при этом Pi — проектор на &>i вдоль Qx,a. P2 — проектор на ^»2 вдоль Q2 (т. е. lmPx— &>u KerP!=^i и Im Р2 = ^2, Кег Р2 = Q2), то подпространства <Р\ и &г дизъюнктны (и, значит, составляют в У прямую сумму) и идемпотент Р\ -f- P2 является проектором на &i Ф !?2 вдоль ??if)<22 (т.* е. Ira(Pi -f P2)= &\ ® &2 и Кег(Р!-^ -f р2) = ^i ПQs). Действительно, если хе^П^а, т. е. х = Рхх и х = Р2х, то х = Р2дс = P2Pi« = 0. Кроме того, «ели «ie^i и х2*~,&2, т. е. xt = Рхх^ и дг2 = Р-2.х2, то лг?+^2==(Pi + P2)[«i + «2l, т. е. Jd-f-xaG 243
+ Рг), а если же Im^ -\- Р2), и потому ж = (Р, -f P2)x, то х = #i -j- ж2, где #i = Pi* e S8, и ж2 = Р2д: <= &>2. Следо- Следовательно, Im (Pj -\- Р2) = 5я! ф <р2. Наконец, если же е- Q\ П ^2, то (Pi -j- Р2) ж = Pi« + -Pa« = 0, и, наоборот, если (Pi+P2)x = 0, то Pi* = Р?ж = (Р? + PiPa)* = = Pt(P,+ Р2)л; = 0 и, аналогично, P2jc = 0. Следова- Следовательно, Ker (Pi + Р2) = C2i П ?2- П Так как ? _ (Р, _ Р2) = (? _ /»,) + Р2, то оператор ? — (Pt — Р2), а значит, и оператор Pi—Р2 тогда и только тогда являются идемпотентами (при ус- условии, что char К Ф2), когда (Е — Р1)Р2 = Р2(Е — _-Pi)=O, т. е. когда PiP2 = P2Pi = P2. Таким обра- образом, разность Pj — Рг <5вг/л: идемпотентов Pi и Рг тогда и только тогда является идемпотентом, когда PiP2 = = Р2РХ в Р2. При этом, так как идемпотент (f? — РО + Рг яв- является проектором на lm(E — Р^Ф ImP2 == КегР! ф © Im Р2 == Qi Ф ^2 вдоль Кег (? — Pi)П Кег Р2 = ^»2 П Qu то идемпотент Р\ — Р2 представляет собой проектор на &2 П ^i вдоль С?! Ф ^2. Для произведения Р1Р2 двух идемпотентов столь пол- полных результатов получить нельзя. Можно лишь утверж- утверждать, что если идемпотенты Р\ и Р2 перестановочны (т. е. Р\Ръ = Р2Р\), то их произведение также будет идемпотентом (ибо (PiP2J=P|P2PiP2= P1P1P2P2 = Р\Р\= = PiP2)- При этом Im PjP2 = 9>\ П ^2 (ибо если х = = P\P2x, то ж = Р!(Р2ж) и х = P2(Pi«), а если х = = Pijc и х = Р2л, то ж = Р, (Р2лг) = (P,P2)*) и Кег Р\Р2 = = ^1+^2 (ибо если Pxxi = 0 и Р2л:2 = 0, то (Р\Р2) (х\-\- J4- х2) = P2Pi«! 4- Р1Р2Х2 — 0, а если PtP2* = 0, то ж = '= Р2ж -Ых- Р2х), где Pi (Р,*) = 0иР2(«- Р-2*) = Р-2« — — Р|л = о). Следовательно, идемпотент Р\Р2 является проектором на &>\ П !?2 вдоль Qi + Q% (обратим внима- внимание, что сумма С%\.-\-B2, вообще говоря, не прямая!). Заметим в заключение что (при char К ф 2) идемпо- идемпотенты тесно связаны с инволютивными операторами (короче, инволюциями) — такими операторами А, что А2 == Е. Именно, легко видеть, что оператор Р тогда и только тогда идемпотентен, когда оператор А = 2Р —. — Е инволютивен. Это сводит изучение инволюций к изучению идемпо- идемпотентов.
Лекция 15 Матрица линейного оператора. — Переход к другому ба- базису. — След оператора. — Сопряженный оператор. — Невырожденные операторы.— Изометрии и их матрицы. Пусть снова А— произвольный оператор в линейном пространстве У°. Если в пространстве У выбран некоторый базис et, ..., еп, то для любого вектора х = х1е1 -f- ...-}- хпеп будет иметь место равенство A) Ах = х'ах + ... +хпап, где а\ = Леь ..., ап = Аеп. Обратно, для любого семей- семейства векторов а,, .... ап формула A) однозначно опре- определяет некоторый, — очевидно, линейный — оператор А, для которого а\ = Ае\, ..., ап — Аеп. Таким образом, при фиксированном базисе в\, ..., еп операторы А е ^ End У находятся в биективном соответствии с п-член- ными семействами векторов а\, ..., ап. Каждому такому семейству отвечает квадратная матрица, столбцы которой состоят из координат век- векторов п\, ..., ап в том же базисе еь ..., еп: Поскольку это, очевидно, устанавливает биективное со- соответствие между матрицами и семействами щ, ..., ап векторов,, мы получаем тем самым биективное соответ- соответствие между операторами и квадратными матрицами порядка п. По определению матрица Л = |а{|, отвечающая опе- оператору А, состоит из координат векторов Ав\, ..., Аеп в базисе еь ..., еп, так что Aei = a[ej, i, /==1, ..., п. Определение 1. Матрица А называется, матрицей оператора А в базисе е\, ..., еп. Легко видеть, что сумме операторов отвечает сумма матриц, а произведению операторов — произведение риц. Действительно, сумма матриц Л==|а{| и /? = 250
имеет элементы а\ 4- Ц, а произведение — элементы акЪ{- С другой стороны, если Aei=aliej и Bej=^biiej, та (Л + В) еь = Aet = (а/ + 6|) е. ? Это означает, что соответствие «оператор» =>¦ «его мат- матрица» является изоморфизмом алгебры операторов End>° на алгебру Matrt К квадратных матриц порядкам с элементами из поля К. Подчеркнем, что этот изоморфизм зависит от выбора базиса еь .-., еп. Ясно, что матрица оператора Л скалярна (т. е. имеет вид kE, где Е — единичная матрица и &еК) тогда и только тогда, когда скалярен оператор Л. По теореме о ранге матрицы ранг матрицы А равен рангу семейства ее столбцов «ь ..., ап, т. е. размерно- размерности их линейной оболочки [#ь ..., ап]. С другой сто- стороны, ясно, что эта линейная оболочка является не чем иным, как образом 1тА оператора Л, и, значит, ее раз- размерность— рангом этого оператора. Таким образом, ранг rk А оператора равен рангу г его матрицы. Если оператор Л является идемпотентом (= проек- проектором), то в пространстве У существует такой базис е\, .... еп (а именно базис, для которого векторы еь ... ..., ег составляют базис пространства 1mA, а векторы ег+\, ..., еп — базис пространства КегЛ), что в этом базисе матрица оператора Л имеет вид 1 о о Ц* где Ег — единичная матрица порядка г. И обратно, лю- любой оператор с матрицей такого вида идемпотентен. Для инволютивных операторов отсюда непосред- непосредственно следует, что оператор А тогда и только тогда инволютивен, когда в некотором базисе он имеет мат- матрицу вида о -Vrl' Для любых /, / s= 1, ..., п мы будем символом Ef обозначать квадратную матрицу порядка п, все эле- элементы которой равны нулю за исключением одного, рав- равного 1 и находящегося на пересечении i-ro столбца и 251
j-й строки. Для каждой матрицы Л=|а{| имеет место формула А = аЩ (напомним, что по / и / производится суммирование от 1 до л), показывающая, что матрицы ЕУ составляют ба- базис линейного пространства матриц MatrtK. Соответствующий матрице Ej линейный оператор ?» характеризуется тем, что все векторы базиса еь ..., еп он переводит в нуль, за исключением вектора е„ перехо- переходящего в вектор е,-. Поэтому О, если k Ф j, Е\, если k = /. При этом операторы Е\ составляют базис пространства End Г и для любого линейного оператора А: У^У. В частности, мы видим, что АЕ) = а*Е* и Е)А = а1кЕ*, и, значит, АЕ1. = ЕУА тогда и только тогда, когда а\ = аУ и а{ = 0 при k = j, I ф j и при I = i, кф1 (сум- (суммирование по i и / не производится!). Поэтому опера- оператор А тогда и только тогда перестановочен со всеми ли- лилейными операторами (и, в частности, со всеми опера- операторами вида Ej), когда а\ — 0 при i ф j я а\ = al для лю- любых / и /, т. е. когда этот оператор, скалярен. (См. стр. 245.) Если е1, ..., еп — сопряженный базис пространства У°\ то, как мы знаем, el(x)=-x' для любого вектора jx = х1еи Применительно к вектору Aei это дает, что элементы а| матрицы А оператора А выражаются фор~ мулой <2) а{ = е'(Авг), /, у= 1, ..., п. В частности, мы видим, что матрица А совпадает с мат- матрицей смешанного билинейного функционала х, §»—*• *—>'g(Ax), отвечающего оператору А. Поэтому след оператора А равен следу его матрицы! 252
Кроме того, согласно формуле A4) лекции 5, матрица ^4' = ]|а*,'| оператора А в любом другом базисе е\>, ..., еп' выражается формулой где С = |с^,| — матрица перехода. Впрочем, формула C) без труда устанавливается и непосредственным вычислением: так как el. = cii,ei и е} — с1'е}„ то а[',е., = Aei, = cil,Aei = ciiA[ej~ci.,a[ci'ej,, а это равносильно C). Конечно, это вычисление факти- фактически является повторением выкладки из лекции 5. Чтобы провести то же вычисление в матричных обо- обозначениях, введем в рассмотрение векторные матрицы- строки Ае~{Ав\, ..., Аеп), Ае' — (Аеу, ..., Тогда (ср. с формулой A4) лекции 1.10) е' = еС, е = е'С~1, С другой стороны, в силу линейности Следовательно, е'Аг = Ае' = (Ае) С = еАС = е'С~хАС, и, значит, А' =¦ С-1 АС. ? Поскольку следы матриц А и А'', совпадая со следом оператора А, одинаковы, отсюда, в частности, следует, что D) ТтС~1АС = ТгА для любых матриц А я С (конечно, при условии, что матрица С невырождена). Заменив в D) матрицу А матрицей АВ и обозначив матрицу С через А, мы получим соотношение E) Тг В А = Tr AB, которое тем самым доказано в предположении, что мат- матрица А невырождена. Однако легко видеть, что соотношение E) справед- справедливо для любых матриц А и В. Проще всего это доказы- 253
вается прямым вычислением: если Л=|а{| и J3=|&*|| то АВ=-\а[Ь*\ и В А — || Ь)а\ \. Поэтому' ТгВЛ = &*а? = а^* = Тг АВ. и Конечно, аналогичное равенство F) Тг В А = Tr АВ имеет место и для операторов. Каждый линейный оператор А: У-^-У позволяет со- сопоставить произвольному ковектору |еУ функционал А'\ на У, определенный формулой G) (А%)(х)=1(Ах), х<=У. Автоматическая проверка показывает, что а) функционал А'\ линеен, т. е. является ковекто- ром из У; б) возникающее отображение Л": У^-У линейно, т. е. А' представляет собой линейный оператор. Определение 2. Оператор А' называется оператором, сопряженным с оператором Л. Если ввести естественное спаривание <ж, §>=1(ж) между пространствами У и У' (см. лекцию 4), то фор- формула G), определяющая сопряженный оператор А', приобретет вид Из симметричности этой формулы немедленно выте- вытекает, что отображение At—>A' пространства ЕпйУ в пространство End У и н в о л ю т и в н о, т. е. А" = А. В частности, отсюда следует, что отображение Ль-^Л' биективно. Более того, ясно, что (Л -Ь ВУ = А' + В' и Это означает, что отображение Л>—>Л' является изо- изоморфизмом линеала End У на линеал End У. Таким образом, между линеалами У и У нет есте- естественного изоморфизма, а между линеалами End 2^ и ЕпйУ такой изоморфизм есть! В отношении умножения отображение Ai—^-A' изо- изоморфизмом не является, поскольку порядок сомножи- 254
телей оно меняет: (ABY = В'А'. [Действительно, <ж, (АВ) '|> = (АВх, §> = <Вж, А'|> = = <ж, В'А'%у.] Обладающий этим свойством линейный изоморфизм алгебр называется обычно антиизомор- антиизоморфизмом. Формула B) для элементов матрицы оператора А в базисе еь ..., еп означает, что Поэтому для элементов a'i матрицы сопряженного опе- оператора А' в сопряженном базисе е1, ..., еп мы имеем и потому a'J = a{, т. е. Ael = a[ei, Однако отсюда не следует, что матрицы операторов Л и А' совпадают. Действительно, по определению столбцами матрицы оператора являются координаты векторов, получаю- получающихся применением оператора к векторам базиса. Для оператора А это означает (в силу формулы Ae[ = afie.\ что 1-й столбец его матрицы состоит из чисел а\, ..., ая Что же касается оператора А', то формула А'е> = а[е1 означает, что /-й столбец его матрицы состоит из чи- чисел а[, ..., afn, т. е. из тех же чисел, что и у-я строка матрицы оператора А. Таким образом, матрицей сопря- сопряженного оператора А' в сопряженном базисе ех, ..., еп является матрица Ат, получающаяся транспонирова- транспонированием матрицы А оператора А в базисе еь ..., еп. Сравним теперь ядра и образы операторов А и А'. Предложение 1. Имеют место равенства Кет А' = (Im A)°, Im А' = (Кег А)°, Кег А = (Im A'f, Im A = (Кег A'f. Доказательство. Включение ieKerA' равно- равносильно тому, что для любого вектора х е У имеет место равенство (А'|) (х) = 0, т. е. равенство %(Ах) = О, характеризующее ковекторы из AгаД)° Следовательно, Кег А' = AтЛ)°. Заменяя здесь А на А', получаем, что Кег А = (Im A')°, а переходя к аннуляторам (и поль- пользуясь предложением 5 лекции 4) — что (КегА/)°== ImA и (KerA)°= ImA'. ? 255
В частности, мы видим, что либо 1тА=У°, либо Кег А' Ф 0. Это утверждение известно как альтерна- альтернатива Фредгольма. Ясно, что если оператор Р идемпотентен, то оператор Р' также идемпотентен. При этом, как непосредственно вытекает из предложения 1, если Р — проектор на вдоль С?, то Р' — проектор на Cf вдоль 0^ Важный класс операторов составляют операторы А, для которых def^=O. Они характеризуются тем, что в любом базисе их матрица невырождена. На этом осно- основании они называются невырожденными операторами. Значение невырожденных операторов определяется тем, что они совпадают с обратимыми операторами, т. е. с операторами А, для которых существует обратный опе- оператор А~х, удовлетворяющий соотношениям Фактически это непосредственно вытекает из правила Крамера для решения систем неоднородных линейных уравнений, но мы предпочтем дать здесь независимое доказательство, четче выявляющее геометрические осно- основания этого совпадения. Линейный оператор А называется обратимым слева, если существует такой линейный оператор В, что и обратимым справа, если существует такой линейный оператор С, что В произвольных кольцах (или алгебрах) существуют обратимые элементы, которые обратимы только спраза или только слева. Для линейных операторов же дело обстоит совсем по-другому: оператор обратим, если он обратим хотя бы слева или справа. Это тесно связано с тем (поистине удивительным) фактом, что линейный оператор биективен, если он всего лишь инъективен или надъективен. (Заметим кстати, что хотя обратимый опе- оператор, очевидно, биективен, но утверждение, что любой биективный линейный оператор обратим, т. е. что обрат- обратный оператор линеен, требует доказательства.) Предложение 2. Для любого линейного оператора А:У^>-У следующие утверждения равносильны: 1° Оператор А обратим слева. 256
2° Оператор А инъективен, т. е. Кег А = 0. 3° Оператор А обратим справа. 4° Оператор А надъективен, т. е. 1тпА=Уа_) 5° Оператор А обратим. 6° Оператор А биективен. 7° Оператор А невырожден. 8° Для каждого базиса еь ..., еп пространства У" век- векторы Леь ..., Аеп также составляют базис. Доказательство. Равносильность утверждений 7° и 8° немедленно следует из совпадения ранга опера- оператора с рангом его матрицы. Поэтому нам надо доказать лишь равносильность утверждений 1° — 6° и 8 . Мы сде- сделаем это, доказав следующую диаграмму импликаций: п Импликация 5° =*-1°. Если А~г — обратный опе- оператор, то А~ХА = Е. Импликация 1° =4* 2°. Если В А = Е и Ах = 0, то х = Ех = ВАх = ВО = 0. Импликация 2° =^8°. Если векторы Ае\, ...,Аеп линейно зависимы, т. е. k\Aex + ... + kn.Aen = 0, где (ki, ..., kn)?=@, ..., 0), то для вектора e — kie\-\- ... ... -f- knen =#= 0 будет иметь место равенство Ае =0. Сле- Следовательно, если Кег А = 0, то векторы Леь ..., Ае линейно независимы и потому составляют базис. Импликация 5° =>¦ 3°. Если А~1 — обратный опе- оператор, то АА-1 = Е. Импликация 3° '=*- 4°. Если АС = Е, то Ау = х для любого вектора х г= У, где у = Сх. Импликация 4° =^8°. Если для любого вектора х е У° существует такой вектор у ^У, что Ау = х, то х — у1Аех + ... + упАеп. Это доказывает, что семейство Аех, ..., Аеп, состоящее из п векторов, полно. Следова- Следовательно, оно является базисом. Импликация 8° =s- 5°. В базисе е'1==Ае1, ..., е^= = Лв„ семейство векторов Ь\ = ех, ..., Ъп = еп опреде- определяет оператор В, для которого Be[ — bv .. ., Ве'п = Ьл и, значит (BA)ei = ei, ..., (ВЛ)е« = е„, т. е. ВА — Е. Для этого же оператора (АВ)е'1 — е[, ..., (АВ)е'п=егп 9 М- М. Постников, сем, II 257
и, значит, АВ = Е. Следовательно, оператор А обратим (иВ = А-1). а Заметим, что согласно утверждению 8° любой невы- невырожденный оператор А является оператором, действую- действующим по равенству координат в базисе еи .. ., еп и е' = = Аех, . . ., е'п = Агп. Поскольку произведение АВ обратимых операторов также, очевидно, обратимо, множество Auty всех обра- обратимых операторов y*-*-if является по умножению группой. Соответствие оператор =ф- его матрица является при этом изоморфизмом группы Auty на груп- группу GL(n; К) всех невырожденных матриц порядка п над полем К. В случае, когда в У введено скалярное умножение, символ Auty обыкновенно используется для обозначе- обозначения множества всех операторов А: У-*-У, являющихся изометриями, т. е. (см. лекцию 5) удовлетворяющих для любых векторов х,у^У соотношению (Ах, Ау) = (х, у) (такие операторы называются также изометрическими операторами). Множество же всех обратимых операторов на У обозначается в этом случае каким-нибудь другим символом, например Аи^инУ. Поскольку произведение двух изометрий и отображение, обратное к изометрии, также, очевидно, являются изометриями, множество Auty всех изометричных операторов У-+У является подгруппой группы Autnim У. Пусть G — матрица метрических коэффициентов gtj =(e;, в/) некоторого базиса еь ..., еп пространства У. Предложение 3. Линейный обратимый оператор А: У-*-У тогда и только тогда изометричен, когда его матрица А в базисе в\, ..., е„ удовлетворяет соотно- соотношению (8) ATGA = G. Доказательство. Если А = [а{||— матрица изо- изометрии А, то Si} = (ei> ei) = (Aet> Aei) = 268
что в точности равносильно (8). Обратно, если (8) вы- выполнено, т. е. если gif = gpqafaf, то (Ах, Ау) = (*'" ер, eq)= для любых векторов х = х1ег, у = y!et, и, значит, опера- оператор А является изометрией. ? Если скалярное умножение в пространстве У невы- невырождено и, значит, det G ф 0, то, переходя в равенстве .(8) к определителям и сокращая на det G, мы немед- немедленно получим, что (detЛJ = 1, т. е. что (9) det^ = ±l. В частности, отсюда следует, что любая матрица А, удовлетворяющая условию (8), невырождена. Это озна- означает, что в определении изометрических операторов условие обратимости может быть опущено (напомним: в предположении, что скалярное умножение невырождено). Все невырожденные матрицы, удовлетворяющие ус- условию (8), образуют группу, изоморфную группе Aut Т. Эта группа обозначается символом Оо(л), а ее под- подгруппа, состоящая из унимодулярных матриц, символом SOa(n). Для любого изометрического оператора А и любого базиса в\, ..., е„ пространства У векторы Ав\, ..., Аеп образуют базис, матрица метрических коэффициентов ко- которого совпадает с матрицей G метрических коэффициен- коэффициентов gtjг=(ег, е,) базиса еи ..., en.f Обратно, если е\, ..., е'п — базис, для которого {е\, е'^ — gtj a A — оператор, действующий по равенству координат в бази- базии (х, у) = {xlet, у'е}) = (Ах, Ay) = (*'*;, yie',) = g^xhji для любых векторов х и у, т. е. оператор А изометричен. Поскольку матрица оператора А в базисе е\, ..., еп яв- является не чем иным, как матрицей перехода от базиса еь ..., еп к базису Аеи ..., Аеп, этим доказано, что матрицы из Оа (п) — это в точности матрицы перехода, 9* 259
связывающие базисы, в которых метрический тензор имеет матрицу G. Например, если G = Е, т. е. пространство У евкли- евклидово, а базисы ех, ..., еп и е[, ..., е'п ортонормированы, то матрицы из Ое{п) — это ортогональные матрицы (см. лекцию 1.13). Таким образом, Ое(п) = О(п). На этом основании матрицы из Оо(п) называются обычно G-ортогональными матрицами. В случае Е" -EJ (и n — p-\-q)' мы получаем псевдоортогональные мат- матрицы, а в случае п — \ ° Е™\ U \Бт О (и п = 2т) — симплектические матрицы (обратим вни- внимание, что в последнем случае SOO («) = Og (n)). Таким образом, изометрические операторы евклидова (псевдо- (псевдоевклидова или симплектического) пространства задаются в ортонормированных (соответственно, в псевдоортонор- мированных и симплектических) базисах ортогональными (соответственно, псевдоортогональными и симплектиче- скими) матрицами. На этом основании изометрические операторы на ев- евклидовом (псевдоевклидовом или симплектическом) про- пространстве называются обычно ортогональными (соответ- (соответственно, псевдоортогональными или симплектическими) операторами.
Лекция 16 Инвариантные подпространства. — Собственные, векто- векторы. — Характеристический многочлен и характеристиче- характеристические корни.— Алгебраическая кратность собственного значения. — Теорема о прямой сумме. — Диагонализи- руемые операторы. — Операторы с простым спектром. Определение 1. Подпространство 9* пространства У называется инвариантным относительно оператора А: У-+У, если Ах ^ 9* для любого вектора х^9>. В этом случае определен оператор А \& е= End &, действующий по формуле (А \#>)х = Ах, XSEE 9>, где справа вектор Ах рассматривается как элемент под- подпространства 9*. Оператор А \& называется ограничением оператора А на инвариантном подпространстве 9*. Говорят также, что он индуцирован оператором А. Легко видеть, что если подпространство ^ инва- инвариантно относительно оператора А, то A) РАР = АР для каждого проектора Р на 9*. Действительно, так как 9* инвариантно и 9>=lmP, то для любого вектора х ^ У* вектор у = АРх принадлежит 9*. Но тогда Ру = у, что и означает справедливость соотношения A). ? Обратно, если соотношение A) выполнено хотя бы для одного проектора Р на 9*, то подпространство 9* ин- инвариантно относительно оператора А. Действительно, если х е 9*, т. е. х = Рх, то вектор Ах = АРх = Р(АРх) принадлежит 9*, и, значит, подпространство 9* инва- инвариантно. О Поскольку dim^^dimF (при 9*ФТ), оператор А \& легче оператора А поддается изучению. Вместе с тем, изучив его, мы часто можем получить достаточно много информации и о самом операторе А. 261
Особенно удовлетворительно дело обстоит в случае (к.сожалению, имеющем место не всегда), когда суще- существует второе инвариантное подпространство Q, допол- дополнительное к подпространству SP, т. е. когда пространство У является прямой суммой У = &@С1 инвариантных подпространств & и Q. В этом случае оператор А пол- полностью восстанавливается по операторам А \&> и A\Q Действительно, для любого вектора z — x-\-y простран- пространства У, где х ^ &, у ^Q, мы, очевидно, имеем Говорят, что пара {ЗР, Q) взаимно дополнительных инвариантных подпространств приводит оператор А. Легко видеть, что пара {ЗР, Q) тогда и только тогда приводит оператор А, когда проектор Р на $Р вдоль Q перестановочен с оператором А: B) РА = АР. Действительно, если B) выполнено, то ; РАР = РРА = РА (Е — Р) А {Б — Р) = А — РА — АР + РАР = = А — АР = (Е — Р) А.- Поэтому оба подпространства iP—lmP и ?? = КегР инвариантны относительно А. Обратно, если подпространства & и Q инвариантны относительно А, то РАР = РА (Е — Р)А(Е — Р) = (Е — Р) А, т. е. РАР = АР. Поэтому Полная сводимость оператора А к операторам А \& и A\q наглядно видна на матрице Л = |а{|| оператора А в таком базисе е\, ..., е„ пространства У, что 0* — = [еи ..., вр] и Q — [ер+и ..., еп]. Действительно, так как Ае1 — а\ег <s 53 при 1 ^ i ^ р, то flj = 0, если 1^г^р и p -\- I ^.j^.п. 262
Аналогично, так как Ае, е Q при р -+- 1 ^ i ^ п, то а{ = 0, если /7+l^t^w и 1^/ Это означает, что матрица А в базисе еь ..., е„ имеет блочно-диагональный вид: где Ах—матрица оператора А \<? в базисе вь ..., ер, а Л2 — матрица оператора A \q в базисе ер+ь ..., в„. О матрице А вида C) говорят, что она разложена в прямую сумму матриц А\ и А2 (и пишут А =Аг ФЛ2). Таким образом, каждое разложение пространства У в прямую сумму инвариантных подпространств определяет разложение матрицы оператора в прямую сумму матриц индуцированных операторов. В случае, когда инвариантное подпространство ^* ин- инвариантного дополнения Q не имеет (или мы его не знаем), мы можем представить матрицу А (выбрав ба- базис еь ..., е„ так, чтобы 9* = \е\, ..., ер]) в блочно- т ре угольном виде: где Ах — матрица оператора А 1^». Из того, что подпространство & инвариантно относи- относительно оператора А, непосредственно вытекает, что фор- формула корректно определяет на факторпространстве некоторый (очевидно, линейный) оператор Об операторе В также говорят, что он индуцирован опе- оператором А. Если базис ей ..., е„ пространства У выбран так, что 5* —[еь ..., ер], то смежные классы ep+i -{- &, ... ..., еп-\- 0* будет составлять, очевидно, базис фактор- пространства У/3° и в этом базисе матрицей оператора В будет матрица В из D). Простейшими инвариантными подпространствами яв- являются одномерные подпространства. 263
Определение 2. Вектор хфО называется собственным вектором оператора А, если он порождает одномерное инвариантное подпространство. Ясно, что это имеет место тогда и только тогда, когда существует такой элемент % ^ К, что E) Ах = кх. Каждый элемент %^ К, для которого существует вектор хфО, удовлетворяющий соотношению E) (и, значит, являющийся собственным вектором оператора А), назы- называется собственным значением оператора А. О собствен- собственном векторе х, для которого ^— при данном к — имеет место E), говорят, что он принадлежит собственному значению к. Удобно считать, что каждому собственному значению к принадлежит также и нулевой вектор 0 (не являю- являющийся, по определению, собственным вектором). Тогда для любого собственного значения к множество 0*\ всех принадлежащих ему векторов х^У будет, очевидно, подпространством. Оно называется собственным подпро- подпространством, принадлежащим собственному значению к. Его размерность px = dim0>tt. называется геометриче- геометрической кратностью собственного значения к. По определе- определению 1 ^ рх =?^ п. Для любого собственного вектора хфО, принадле- принадлежащего собственному значению к, одномерное инвари- инвариантное подпространство [х], им порожденное, целиком лежит в ЗР},. Обратно, каждое одномерное подпростран- подпространство пространства 0*^ инвариантно, и потому, в част- частности, пространство 0>х разлагается в прямую сумму од- одномерных инвариантных подпространств. Чтобы полу- получить такое разложение, достаточно выбрать в 0>% произ- произвольный базис. Геометрически подпространство 0*% можно охаракте- охарактеризовать как максимальное инвариантное подпростран- подпространство, на котором оператор А (точнее, его ограничение А 0>^) является скалярным оператором кЕ. Можно так- также сказать, что 0>ъ. представляет собой ядро оператора А — кЕ: Действительно, равенство (А — кЕ^х — О в точности рав- равносильно равенству E). п 264
Мы видим, таким образом, что число ЯеК тогда и только тогда является собственным значением оператора Д, когда оператор А — КЕ имеет ненулевое ядро, т. е. вы- вырожден; см. предложение 3 лекции 15. Иными словами, К тогда и только тогда является собственным значением, когда det (Л — КЕ) = О, где Л — матрица оператора А в произвольном базисе Определитель det (Л — КЕ) = а\-Х ... а\ является, как легко видеть, многочленом степени п от К. Этот многочлен не зависит от выбора базиса еь ..., еп. Действительно, в любом другом базисе матрица опера- оператора А будет иметь вид С~ХАС (см. формулу C) лек- лекции 15), а С~1АС — КЕ = С (Л — КЕ) С, и потому det (€~lAC — КЕ) = (det С) det (А — КЕ) (det С) = = det (А—КЕ). п Определение 3. Многочлен fA(K)= det (А —КЕ) называется характеристическим многочленом оператора А (или матрицы Л), а его корни (в соответствующем расширении поля К) — характеристическими корнями оператора А (матрицы Л). В частности, мы видим, что от выбора базиса не за- зависит свободный член det Л многочлена $а(К). Он назы- называется определителем оператора А и обозначается сим- символом det А. Так как ?а (К) = (— К)п + ... + det А, то согласно формуле Виета определитель det А равен произведению всех характеристических корней оператора Л: det А = Л} . • • Кп. Коэффициент при (—А,)"-1 в характеристическом мно- многочлене—-т. е., согласно формуле Виета, сумма его кор- 265
ней — совпадает, очевидно, с коэффициентом при (—"к)*1-1 в произведении всех диагональных элементов матрицы А— ХЕ. Поэтому он равен следу Тг А — а\ -{-... ... _j_ a? оператора Д. Таким образом, след Тг А опера- оператора А равен сумме его характеристических корней: Тг А = Х1-\- ... -\-Хп. Замечание 1. Если оператор А является изомет- изометрическим оператором в пространстве с невырожденным скалярным произведением (и, значит, ArGA = G, где detG =5^0), то где е = ±1 (при 8 = 1 многочлены, удовлетворяющие этому условию, — это известные возвратные многочлены). Действительно, так как detA —±1 и А = G~l{A^)-lGt то det|A — A?|= det G-1 det (A1") det | E — XAT | det G = = ± det j ?" — XAT | = ± det | E — XA j == l ± ( — Л)" det п (Заметим, что при det Л = 1 ия четном — например для симплектических матриц—получается е= 1, т. е. обыч- обычный возвратный многочлен.) Для характеристических корней отсюда следует, что вместе с числом X корнем будет и число -у-, а в случае основного поля R —также и числа Я, и —. Таким образом, для вещественных л (псевдо) ортогональных и симплектических матриц ха- характеристические корни появляются четверками, симмет- симметричными относительно вещественной оси (преобразова- (преобразование Xi—ъ-'к) и единичной окружности (преобразование Конечно, вещественные характеристические —J. корни или корни, расположенные на единичной окруж- окружности, появляются лишь парами. Согласно сказанному выше любое собственное значе- значение оператора А является его характеристическим кор- 266
нем и, обратно, любой характеристический корень, при- принадлежащий полю К, является собственным значением. Практический способ нахождения собственных про- пространств основывается на этом утверждении (и на том, что 5\ = Ker(A — ХЕ)). Сначала, решая уравнение /л(^) = 0, мы находим все его корни, лежащие в К, а затем для каждого такого корня Яо находим подпростран- подпространство 5\„ решая систему однородных линейных уравне- уравнений с матрицей А — KqE. Кратность собственного значения Яо как корня харак» теристического многочлена, т. е. такое число п\0, что многочлен /д (Я) делится на (Я— Я0)"Ч но не делится на (Я— Я0)'гА"+1, называется алгебраической кратностью собственного значения Яо. Легко видеть, что алгебраическая кратность собствен- собственного значения не меньше его геометрической кратностш Ph, ^ ЛДо- Действительно, пусть р = р^ и пусть еи ..., е„—• такой базис пространства У, что ^Ae = [ei» -.«t «p]« В этом базисе матрица оператора А имеет вид () II О В\\' и потому fA (Я) = det (А — %Е) = det {Ах — %Е) det (В — ЬЕ). Но Ai является матрицей оператора А 1,9», = и потому det (Л!—XE) = (ko — ^)р. Этим доказано, что многочлен ^л (Я) делится на (Я—Я0)р, и, значит, Замечание 2. Оператор А имеет матрицу вида F) в любом базисе, для которого подпространство 0* = = [е\, ..., ер] инвариантно. При этом А\ будет матри- матрицей оператора А \з>, а В — матрицей индуцированного оператора В: У/^р-ъ-У/^Р. Это доказывает, что .для лю- любого инвариантного подпространства 0*cz.y3 имеет место разложение 267
В частности, многочлен 1а(Л>) делится на многочлен fa (Я). Пусть Аь ..., Ят — различные собственные зна- значения оператора А и пусть — принадлежащие им собственные подпространства. Предложение 1. Сумма подпространств 0>х, ..., 0>т является прямой, т. е. ра- равенство G) *i+...+*m = 0, где х\^.&\, ..., Xm^SPm, имеет место тогда и только тогда, когда Х\ U, • • •, 3*tn "• Д о к а з а т ел ь с т в о. Проведем индукцию по т. При т = 1 утверждение очевидно (и бессодержательно). Пусть уже доказано, что сумма т—1 пространств &\, • • •, tPm-i является прямой. Применив к равенству G) оператор А, мы получим соотношение (8) Я1Л:1Ч-...+Ятл;т = О. Умножив G) на Ят и вычтя из (8), мы, далее, получим, что (А, — Лт)ж,+ •• По предположению индукции отсюда следует, что (Я, — Кт)х1 = 0, ..., (Аж_, - Ят) д;т_, = 0 и, значит (поскольку по условию Ai — Ят =7^= 0, ... ..., Яш_! — Ят ^ 0), что Х\ = 0, . .., ^m—i111113©. Но тогда, согласно G), и хт = 0. ? Пусть . существуют такие (обязательно различные)^ собственные значения (9) Aj, ..., /\>т, 263
что (Ю) и, значит, Легко видеть, что в этой ситуации числа (9) исчерпы- исчерпывают все собственные значения оператора А. Действи- Действительно, для любого другого собственного значения Хо подпространство 0}хо будет, согласно предложению 1, образовывать с У прямую сумму, что невозможно. П Выбрав в каждом из пространств S?^, ...,5\m no базису, мы получим базис пространства У, состоящий из собственных векторов. Матрица оператора А в этом ба- базисе диагональна: х, О A2) и ее диагональными элементами являются собственные значения (9), причем каждое Xi повторено р%г раз. Обратно, пусть в пространстве Т существует базис, в котором матрица А оператора А диагональна. Тогда векторы этого базиса будут собственными векторами, а диагональные элементы матрицы А—собственными зна- значениями оператора А. Пусть %\, ..., Хт — все различные диагональные элементы матрицы А и пусть элемент %t, i= 1, ..., т, повторен qt раз. Пусть, далее, Qi, i = = 1, .... т, — подпространство пространства У, порож- порожденное векторами базиса, принадлежащими собствен- собственному значению Xt. Тогда dim Qi = qu и G?tCz&>Ki. Поэтому, в частности, A3) qx +...+ qm = n и <7i<p*,, •••» Ят Но, согласно предложению 1, сумма 9>\х + .. • + 9>кт подпространств ^я,, ••-, &\т является их прямой сум- суммой и потому имеет размерность р%х + ... + рят- Ъъъ- чит, pKl + ... + рхт =< п, откуда, в силу соотношений 269
A3), вытекает, что <7i Следовательно, для подпространств ^\, ..., 0>\т имеет место разложение A0). Поскольку существование базиса, в котором матрица оператора А диагональка, равносильно тому, что про- пространство У разлагается в прямую сумму одномерных инвариантных подпространств, этим доказано следую- следующее предложение: Предложение 2. Для любого линейного оператора А: У-+У следующие утверждения равносильны: Iе Существуют такие собственные значения Яь ... ..., Am, ЧТО 2° Пространство У является прямой суммой одномер- одномерных подпространств, инвариантных относительно опера- оператора А. 3° В пространстве У существует базис, состоящий из собственных векторов, т. е. базис, в котором матрица оператора А диагональна. О При этом фигурирующие в 1° (и неявно в 2°) соб- собственные значения Яь ..., %т необходимо различны и исчерпывают все собственные значения оператора А. Каждый базис, в котором матрица оператора А диаго- диагональна, получается объединением базисов пространств 3*%х, • • •, ^*хт, так что для любого собственного значения %i в этом базисе имеется точно pKt векторов, принадле- принадлежащих Яг. Определение 4. Оператор А называется диагонализи- руемым, если для него имеют место утверждения 1° — 3° предложения 2. Диагонализируемым оператором является, например, произвольный проектор (идемпотентный оператор), а также произвольный инволютивный оператор. Собствен- Собственные значения проектора равны 0 и 1, а инволютивного оператора равны ±1. Вычисляя характеристический многочлен диагонали- зируемого оператора А в базисе, состоящем из собствен- собственных векторов, мы немедленно получим, что ит ^ (я - ххр... (я - kmf™, •470
где %i, ..., Кт — собственные значения оператора А, a Pi — P%x, • • •> Рт — Рьт— их геометрические кратности. Это доказывает, что для диагонализируемого оператора любой его характеристический корень Ао лежит в поле К (и, значит, является собственным значением), а его ал- алгебраическая кратность пхь совпадает с его геометри- геометрической кратностью р^. Оказывается, это необходимое условие диагонализи- руемости также и достаточно, так что имеет место сле- следующая теорема: Теорема 1. Линейный оператор А тогда и только тогда диагонализируем, когда любой его характеристи- характеристический корень Ао лежит в поле К и пка = /?*.„. Доказательство. Нам нужно доказать только достаточность этого условия. Пусть Ki, ..., Am — все характеристические корни оператора А. По условию они лежат в. К и потому яв- являются также собственными значениями. Следовательно, определены подпространства &\х, . .., &хт-, размерность суммы которых (как мы знаем, прямой) равна (сумма кратностей всех корней многочлена равна его степени). Значит, 5%® • • • ®&>хт—-Ур и оператор А диагонализируем. П Определение 5. Множество всех характеристических корней оператора А называется его спектром. Спектр называется простым, если каждый характеристический корень Ао является простым корнем характеристического многочлена, т. е. если ла„ = 1. Говорят, что спектр лежит в К, если все характери- характеристические корни лежат в К. Предложение 3. Любой оператор с простым спектром, лежащим в К, диагонализируем. Доказательство. Так как 1 =?^ р^ ^ пх, то при пк = 1 обязательно р% = 1 и, значит, рз, = Пз,- П Это условие диагонализируемости не необходимо, но зато оно очень удобно для практической проверки.
Лекция 17 Операторы со спектром в поле К.— Нильпотентные и циклические операторы. — Корневые подпространства.— Корневое разложение. — Жорданова нормальная форма. Пусть @> — произвольное инвариантное (относитель- (относительно оператора А) подпространство пространства У. Так как (см. замечание 1 лекции 16) характеристический многочлен fe (Я) индуцированного оператора В: У/&-+- -*-У/?Р делит характеристический многочлен /U(А) опе- оператора А, то каждый характеристический корень опера- оператора В является характеристическим корнем оператора А не меньшей алгебраической кратности. В частности, если спектр оператора А лежит в К, то и спектр опера- оператора В лежит в К, и, следовательно, для В существует хотя бы одно собственное значение Аю. Пусть х0 -\- &> —• соответствующий собственный вектор оператора В. Ра- Равенство В (ж0 -+- ?Р) = "ко (xq -f- &) означает, что Axq = = Я0жо + по, где по е &, откуда вытекает, что подпро- подпространство Q, порожденное подпространством 0* и век- вектором Хо (т. е. состоящее из всех векторов вида kxo + a, где k<=K и а^&; заметим, что хо^?Р), инвариантно относительно А. Поскольку dim?? = dim^-f-1» этим доказано следующее предложение: Предложение 1. Если спектр линейного оператора А: У-^-У лежит в К, то любое его инвариантное под- подпространство содержится в инвариантном подпростран- подпространстве на единицу большей размерности. ? Следовательно, начиная с подпространства 5*о == О, мы можем построить возрастающую цепочку инвариант- инвариантных подпространств О = 5*0 <= &i <= ... <= &п = У размерностей 0, 1, ..., п. Ясно, что в соответствующем базисе еи ..., еп пространства У, т. е. в таком базисе, что 9>i — \eu ¦•-, d] для любого i= 1, ..., п, матрица оператора А будет треугольной матрицей о 272
диагональными элементами которой являются собствен- собственные значения оператора А, каждое из которых повто- повторено столько раз, какова его алгебраическая кратность. Этим доказано следующее предложение: Предложение 2. Для любого линейного оператора А: У-*-У со спектром., лежащим в К, в пространстве У, существует базис, в котором матрица оператора тре- треугольна. При К = JCJ это следствие применимо, конечно, к лю- любому линейному оператору. Чтобы получить более точный результат, нам нужно сначала рассмотреть один специальный класс опера- операторов. Определение 1. Оператор А (матрица А) называется нильпотентным(ой), если существует такое натуральное число пг, что А = 0 (соответственно Ат = 0). Наимень- Наименьшее такое т называется степенью нильпотентности опе- оператора (матрицы). Легко видеть, что все собственные значения нильпо- тентного оператора равны нулю. Действительно, если Ах = %х, то Akx = №х для любого k, и, значит, при Ат = 0 и х ф 0 обязательно %т = 0, т. е. Я == 0. Е Поэтому отличный от нуля нильпотентный оператор не может быть диагонализируемым. Примером нильпотентного оператора является опе- оператор, для которого существует такой вектор е ф 0, что векторы составляют базис пространства У, а Апе = 0. В базисе ег = Ап~1е, ..., ?„_! = Ае, еп = е этот оператор имеет матрицу 0 0 0 0 1 0 0 0 0 1 0 0 ... 0 ... 0 ... 1 ... 0 Операторы такого вида называются циклическими. Для любого вектора х = ххв\ -\- ... -{- хпеп и любого т^п мы имеем Атх = xm+lei -)-...+ х"еп-т и, в част- 273
ности, Апх = 0. Таким образом, циклический оператор нильпотентен и его степень нильпотентности равна п. При п = 1 циклический оператор является нулевым. Оказывается, что к циклическим операторам сво- сводится произвольный нильпотентный оператор: Предложение 3. Для любого нильпотентного опера- оператора А: У-^-У существует разложение пространства У в прямую сумму инвариантных подпро- подпространств, на каждом из которых оператор А индуцирует циклический оператор. Доказательство. Пусть &1 = Im A*, i = 0, 1, ..., ш, где m — степень нильпотентности оператора А. Так как А+1 = А'(Аж), то (По определению А0 = Е, и, значит, <ро = у даже при А = 0.) По построению A@?i) = !Pi+i, 0 ^ i < m, откуда, в частности, следует, что ^"m_ic:KerA. Следовательно, для любого базиса A) e\m-l), ..., е(?~% Pm-i = dim&m-x, пространства !?m-\ имеют место соотношения B) Ае\т-{) = 0, ..., Ае{?-±\ = 0. Кроме того, в пространстве ^т_2 существуют такие век- векторы (т-2) е<т~2) что (о\ л Ant-2) Оказывается, D) (m-l) что векторы (m-l) ei j • • • Am-2) пространства 0*m-2 линейно независимы. Действительно, если 274
где р = рт-\, то, применив к этому равенству опера- оператор А, мы, в силу B) и C), получим равенство возможное (так как A)—базис подпространства только при 1\ = 0, ..., 1Р = 0. Но тогда и, значит, по тем же соображениям, k\ = 0, ..., ftp = 0. Поэтому мы можем дополнить векторы D) до неко- некоторого базиса * ' Л(Л»-2) ЛО*-2) ЛС»-2) ei , ...» «Рот-!» » еРт-2' пространства t?m—2, где m-2 — dim ^m_,. При этом, как легко видеть, дополнительные векторы можно выбрать из ядра КегЛ оператора А, т. е. так, чтобы имели место равенства G) МГ-/+1 - 0, ..., АеТ'Ц - 0. Действительно, так как векторы A) составляют базис пространства t?m-i = A (iPm-z), то при произвольном выборе векторов F) и любом i = 1, ,,., pm-2 — Pm-\ будет иметь место равенство вида Ае%12) = x\e\m~l) + ... + xUT~\ где р = рт-,. Поэтому, заменив каждый вектор е(Д72) вектором (m-2) I lm-2) p (m-2) +i — Х{в\ — — Xie » мы удовлетворим условиям G). Поскольку А (?Рт-3) = ?Рт-2, в подпространстве 0*т-ъ существуют такие векторы (8) еГЛ -.., «S3. что (9) АеГ~3) = eim-2>, ..., Aef'^ = e^. 275
Тем же способом, что и для семейства векторов D), показывается, что векторы E) и (8) вместе составляют линейно независимое семейство. Действительно, приме- применив к произвольной линейной комбинации этих векторов оператор А, мы, в силу B), C), G) и (9), получим ли- линейную комбинацию векторов E). Поэтому соответ- соответствующие коэффициенты равны нулю, и, следовательно, от всей комбинации останется лишь комбинация векто- векторов A) и G) из ядра. Поскольку эти векторы линейно независимы, то и оставшиеся коэффициенты равны нулю. Это линейно независимое семейство мы можем до- дополнить до базиса «1 » • • •» ePm-l' (m-2) Jm-2) Jm-2) «1 » •••» epm-i» •••» ePm~2' (m-3) Oim-Z) Jm-Z) Jm-3) «4 » •••» cpm-i» •••> ePm-2' *••' ePm-3* причем рассуждение, примененное для векторов F), аналогичным образом покажет, что дополнительные век- векторы _Сп-3) Jrn-Щ еР+1 к можно выбрать из ядра оператора А, т. е. так, чтобы имели место равенства Продолжая шаг за шагом это построение, мы в кон- конце концов получим в пространстве ^о = У базис, век- векторы которого расположены в ступенчатую таблицу вида (m-l) е{т~1), e(«-2) Jm-2) еКт~Ъ «1 » •••> KPm — V •••'» сРт—2 (т-3) _(л»-3) -(«-3) e<m-3) «1 e е е' J0) -(О) (О) (О) <0) *?1 » •••, еРт-1> •'•' еРт-2' •••» еР/п-3» •"*' eV обладающую тем свойством, что под действием опера- оператора Л векторы каждого столбца подымаются на одну ступень выше, оставаясь в том же столбце (а самые верхние векторы переходят в нуль). Это свойство, по определению, означает, что векторы каждого столбца порождают инвариантное подпростран- 276
ство, причем ограничение оператора А на этом подпро- подпространстве является циклическим оператором (вектором е для этого оператора — см. стр. 273 —служит, оче- очевидно, самый нижний вектор столбца). Поскольку все пространство У является прямой суммой этих инва- инвариантных подпространств, предложение 3 тем самым полностью доказано. СЗ Вернемся теперь к произвольным операторам. Определение 2. Вектор х Ф 0 пространства У назы- называется корневым вектором линейного оператора А: У—*- -*-У, если существуют такой элемент % поля К и такое целое число m ^ 1, что (A — XE)mx = Q. Таким образом, в частности, любой собственный вектор является корневым (с m = 1). Если число пг выбрано наименьшим возможным (та- (таким, что вектор у = (А— "kE)m-lx отличен от нуля), то (А— %Е)у — О, т. е. вектор у?=0 является собственным вектором оператора А, принадлежащим собственному значению Я. Этим доказано, что предусмотренный опре- определением 2 элемент % е К является собственным значе- значением оператора А. Говорят, что корневой вектор х принадлежит соб- собственному значению "к. Пусть 01% — пополненное нулем множество всех кор- корневых векторов оператора А, принадлежащих собствен- собственному значению "к. Предложение 4. Мнооюество &\ является подпрост- подпространством линейного пространства У. Оно инвариантно относительно любого оператора вида А — \хЕ, где цеК (и, значит, в частности, относительно оператора А)» Ограничение (Ю) (A-ixE)yK оператора А — \кЕ на 0t\ при ХФ ц является обратимым, а при % = (х — нильпотентным оператором. Доказательство. Если (А — %Е)тх = 0, то (А — ХЕ)т (kx) = 0 для любого k <= К, а если (А — Ъ,Е)"ъ xi = 0 и (А—ХЕ)т* х2 = 0, то (А — %Е)т {х\ + ж2) =0, где т — наибольшее из чи сел mi и т.2. Это доказывает первое утверждение. 277
Если xe=^, т. е. (Л — ХЕ)т х = 0 и у —(А — \лЕ)х. то (Л — Я?) у = (Л — Я?)ш ((А — ХЕ) х + (Я — ц) ж) = = (Л — ХЕ)т+ ' ж + (А. — ц) (Л — A.J?I" х = 0v т. е. js 52Л. Значит, подпространство 52*, инвариантно относительно Л — jx?\ Если ж ^ Ker [(A — \iE)\%K], т.еле^и^- \iE)x = = 0, то (Л — ХЕ) х = (а — Я) ж, и потому (ц — Х)т х = (Л — Л?)ш ж == 0. Следовательно, если ц =т^ А,, то х = 0. Таким образом, при ц =т^= Я, ядро оператора A0) состоит только из нуля, и потому, согласно предложению 2 лекции 15, этот опе- оператор обратим. Наконец, если е\, ..., ег — базис пространства М% и (Л —A,?)w'ei = O,/=1, ...,г, то (Л — %Е)тх = Q для любого вектора х^ &1\, где m—наибольшее из чи- чисел т\, ..., тг. Это означает, что при X = \х оператор A0) нильпотентен. ? Свойства корневых подпространств во многом анало- аналогичны свойствам собственных подпространств. Напри- Например, для них справедлив аналог предложения 1 лек- лекции 16. Пусть Х\, ..., Хт — различные собственные значения оператора Л и пусть — принадлежащие им корневые подпространства. Предложение 5. Сумма подпространств &1\, .... 52т является прямой, т. е. ра- равенство х, + ... + хт = 0, где х\ ^ 52ь ..., хт ^ 52т, имеет место тогда и только тогда, когда Доказательство (ср. с доказательством предло- предложения 1 лекции 16). При m = 1 предложение очевидно. 278
Пусть оно уже доказано для т— 1 корневых подпро- подпространств. Поскольку хт ^ $km, существует такое число 5, что Поэтому У, + ••• +Ут-1=0, где у, = (Л — %mE)sxl, ..., ym-1=(A — XmE)sxm-l. Так как пространства 52i, ..., 52m-i инвариантны относительно оператора А — ХтЕ, то t/i^Mi, ..., ут-\ ^ ^ 52m-i и, следовательно, по предположению индукции t/i = 0, -.., ym-i = 0. Поскольку, согласно предложению 1, оператор А — %тЕ на подпространствах 52ь ..., &1т-\ обратим, отсюда сле- следует, что х\ = 0, ..., xm-i=0 и, значит, что жт = 0. О Преимущество корневых подпространств по сравне- сравнению с собственными подпространствами проявляется в следующем предложении: Предложение 6. Для любого собственного значениях оператора А размерность корневого подпространства 31% равна алгебраической кратности этого собственного зна- значения: dim шк — пх. Доказательство. Пусть Ах = A U и В — опера- оператор У/&1%-*-У/31%, индуцированный оператором А. Тогда fA = fAlfe- Следовательно, если dim^,<«\, то эле- элемент Я является корнем многочлена fe, т. е. характе- характеристическим корнем оператора В. Значит, поскольку %^К, он будет и собственным значением этого опе- оператора. Пусть хо + 52». — соответствующий собственный век- вектор. Тогда Ах0 = %хй Н- а0, где а0 s 01%. Так как по е &%, то существует такое т» что (А — ХЕ) та0 = 0. Поскольку же а0 = Ах0 — Xxq = (А — КЕ) х0,
отсюда вытекает, что (А — кЕ)т+1х0 = 0, и, значит, лго s ш%, что невозможно. Полученное противоречие по- показывает, что dim Ш% = п%. П Из предложения 6 следует, что если спектр опера- оператора А лежит в К и A-i, .... %т — все его собственные значения (характеристические корни), то dim {ш%х ф . .. ф &кт) = п-кх + ... + «л.т == л» и потому Таким образом, имеет место следующая теорема: Теорема 1. Для любого линейного оператора А: У^*- -+-У, спектр которого лежит в К, пространство У яв- является прямой суммой корневых подпространств этого оператора: <П) У—Яь.®-- Разложение A1) называется корневым разложением пространства У. Сказать, что инвариантное подпространство 01 про- пространства У является корневым подпространством &1%,— это значит сказать, что ограничение оператора А на это подпространство является суммой %Е -\- В скаляр- скалярного оператора ХЕ и некоторого нильпотентного опера- оператора В. Но, согласно предложению 3, для оператора В существует разложение пространства М в прямую сумму инвариантных (относительно В, а потому и относительно А) подпространств, на каждом из которых оператор В индуцирует циклический оператор. Осуществив это раз- разложение для любого корневого подпространства из A1), мы получим разложение пространства У в прямую сумму инвариантных подпространств, на каждом из ко- которых оператор А индуцирует оператор вида где % s К, а С — некоторый циклический оператор. Определение 3. Матрица вида Я 1 0 ... О О Л 1 0 ... О О О X 1 ... О A3) 280 О 0 ... Я 1 о о ..... я
называется жордановой клеткой. Говорят, что матрица А имеет нормальную жорданову форму, если она яв- является прямой суммой жордановых клеток (вообще го- говоря, с разными X). Так как матрица любого циклического оператора имеет в соответствующем базисе вид A3) с X = 0, то матрицей оператора A2) в этом же базисе будет жор- данова клетка A3). Поэтому, объединив все базисы соответствующих подпространств, мы получим базис пространства У, в котором матрица оператора А имеет жорданову форму. Этим доказана следующая теорема: Теорема 2 (о приведении к жордановой форме). Для любого линейного оператора А: У-*-У9 спектр которого лежит в К, существует базис простран- пространства У, в котором его матрица имеет нормальную жор- жорданову форму. О Оказывается, что с точностью до порядка следования клеток жорданова нормальная форма матрицы опера- оператора однозначно определена, т. е. число жордановых клеток, их порядок и соответствующие элементы X — одни и те же для всех базисов, в которых матрица опе- оператора имеет нормальную форму. По отношению к эле- элементам X это очевидно (поскольку они являются соб- собственными значениями оператора), а чтобы доказать независимость от выбора базиса числа dm (X) жорда- жордановых клеток каждого данного порядка пг ^ 1, мы вы- выразим его через числа П (X) = rk (А — ХЕI = rk (Л — ХЕI, заведомо не зависящие от выбора базиса. Ясно, что если А = А\ФА2, то def A = def A\ -f- [-}- def A2 и, значит, def A1 = def A\ + def A\ для любого / ^ 1 (ибо А1 = А\@А?). С другой сто- стороны, если С — циклический оператор в m-мерном про- пространстве, то, как легко видеть, при 0^/^т, при пг^.1. Поэтому, если В — оператор вида ХЕ -J- С, то при 0^/^т, , от при m ^ /. 231 def С1 = {1 йе1{В-ХЕ) = {1
Поскольку при (л ф X оператор В — yJE невырожден, отсюда следует, что если жорданова форма матрицы оператора А содержит dm(X) жордановых клеток по- порядка т, отвечающих собственному значению X, то для любого / ^ 1 def (А — ХЕI = т. е. = dx (X) + 2d2 (X) + . .. + W, (X) + ldl+x (X) + ldl+2 (A,)+ Следовательно, для любого т ~^? 1. D Подчеркнем, что при К = jCJ условие на спектр опе- оператора в теореме 2 выполнено для любых операторов, так что над полем С, каждый линейный оператор при~ водится к жордановой форме.
Лекция 18 Теорема Гамильтона — Кэли. — Комплексификация ли- линейного оператора. — Собственные подпространства, принадлежащие характеристическим корням. — Ком- плексно-диагонализируемые операторы. Пусть — произвольный многочлен над полем К. Тогда для любого оператора А (любой матрицы А) определен опе- оператор апАт + а,Ат~Х+ ... + атЕ (матрица f (A)= а^А + ахАт-1 -\- ... -\-атЕ), назы- называемый многочленом от оператора А (матрицы А). Очевидно, что каждое подпространство ZP<ziT, инва- инвариантное относительно оператора А, будет инвариантно и относительно оператора f(A). При этом (i) В частности, для любого оператора А определен опе- оператор где /^(A,) = det (А — А,?) — характеристический много- многочлен оператора Л. Вычислим этот оператор. Пусть сначала 2) А = ЪаЕ + С, где С — циклический оператор. Тогда fA (X) = (Яо — Я)д и Сп = 0. Поэтому !А (Л) = (ХоЕ - А)* = (- С)я = 0. Пусть теперь оператор А (со спектром в К) произ- произволен и пусть — разложение пространства У° в прямую сумму инва- инвариантных подпространств, на каждом из которых огра- ограничение At = А\#, оператора А имеет вид B). Тогда, по 233
доказанному, C) fAi(At)=0. Но, как мы знаем, каждый многочлен f. делит много- член f A (более того, многочлен fA является, как легко видеть, произведением многочленов fA , ..., f д \ По- Поэтому из C) следует, что Поэтому (см. формулу A)) Таким образом, оператор fA (Л) обладает тем свойством, что для любого i = 1, ..., N его ограничение на подпро- подпространстве 0>i равно нулю. Следовательно, этот оператор равен нулю и на сумме этих подпространств, т. е. на всем пространстве У. Этим доказана следующая теорема: Теорема 1 (теорема Гамильтона — Кэли). Каждый оператор аннулирует свой характеристический многочлен: Мы доказали эту теорему для операторов, спектр которых лежит в К, и тем самым, в частности, для лю- любых операторов над полем jQ. Однако на самом деле она справедлива для любых операторов над произволь- произвольным полем К. Соответствующее доказательство мы из- изложим лишь для случая К = R, хотя оно может быть проведено и над совершенно произвольным полем К (см. ниже замечание 1). Напомним (см. лекцию I. 19), что по любому линей- линейному пространству У° над полем R мы можем построить линейное пространство У°с над полем id, называемое комплексификацией пространства У. Это пространство обладает тем свойством, что каждый его вектор z един- единственным образом представляется в виде г = х + iy, где х е У и у еУ. Поэтому для каждого линейного оператора А: У-^-У формула Лс (х + су) = Ах + 1Ау 284
корректно определяет некоторый оператор Ас : У°с —>Т°. Так как для любого числа а + ib е О и любого век- вектора z = х + iy ^ ^°С (а + #>) (* + *у) = {ах — by) + / (ау + 6л:), то Ас ((а + ») (ж + iy)) = A(ax — by) + IA {ay + bx) = = (аЛл: — 6 Лу) + г (аАу + 6Л*:) = = (а + ib) {Ах + My) = (а + #) ^° (* + т. е. Л (cz) = с A z. Еще проще проверяется, что для любых векторов «i, 2iSF . Следовательно, опера- оператор Лс линеен. Определение 1. Оператор Лс называется комплекси- фикацией оператора А. Заметим, что отображение Аь—*АС является, оче- очевидно, гомоморфизмом алгебры Endy в алгебру End>°c (рассматриваемую как алгебра над R), т. е. и (k А)с для любых операторов Л, Не End У и любого веще- вещественного числа k. Как мы знаем (см. предложение 1 лекции I. 19; на- напомним, что в обозначениях этого предложения (J30) =2^), любой базис е\, ..., еп пространства У яв- является также базисом и пространства Тс. Отсюда сле- следует, что в каждом таком («вещественном») базисе мат- матрица оператора Лс совпадает с матрицей оператора А. В этом смысле матрица оператора не меняется при его комплексификации. Значит, в частности, операторы А и А имеют один и тот же характеристический много- многочлен: D) Ы*) = /ас(Я). 285
Поскольку для каждого многочлена / с веществен- вещественными коэффициентами оператор f(A) является, оче- очевидно, ограничением оператора f(Ac) на У° — ЦеУс> отсюда непосредственно следует, что теорема Гамиль- Гамильтона— Кэли справедлива для любых операторов Л: Т-+Т, т. е. Действительно, так как эта теорема справедлива над полем JQ, то fAc (.А ) = О, и, значит, fAc(Ac)\r = 0. ? Ввиду равенства D) операторы А и А° имеют одни и те же характеристические корни. Все они являются собственными значениями оператора Лс, но только ве- вещественные из них будут собственными значениями опе- оператора А. -><?> Если оператор А нильпотентен, то оператор Ас также нильпотентен (и имеет ту же степень нильпотентности), и потому все его собственные значения равны нулю. Поскольку эти собственные значения исчерпывают все корни многочлена fAc = fAt этим доказано, что /д(^г)==(—I)'1 Хп для любого нильпотентного опера- оператора А. На языке матриц это означает (мы заменяем К на —X), что для любой нильпотентной матрицы А имеет место тождество det (Л + IE) = Хп. Доказать это «чисто матричное» утверждение непо- непосредственным вычислением определителя, по-видимому, очень трудно. В силу теоремы Гамильтона — Кэли отсюда выте- вытекает, что в п-мерном пространстве степень нильпотент- нильпотентности произвольного нильпотентного оператора не пре- превосходит п. Эти красивые утверждения показывают, каким мощ- мощным орудием доказательства теорем является, казалось бы, совершенно тривиальный прием комплекскфика- ции. Замечание 1. Чтобы перенести эти результаты на случай произвольного, поля К, нам в первую очередь нужно знать, что для любого поля К существует 286
содержащее его поле D, обладающее свойством алгеб- алгебраической замкнутости, т. е. такое, что любой много- многочлен положительной степени над полем D имеет в D корень (и потому разлагается на линейные множители). Этот факт доказывается в полных курсах алгебры, и мы примем его без доказательства. Затем нужно перенести на случай поля D конструкцию комплексификации. Это можно сделать следующим образом. Каждое поле D, содержащее поле К, является, ко- конечно, линейным пространством над К (возможно, бес- бесконечномерным). Поэтому для любого линейного пространства У° над К мы можем построить тензорное про- произведение D <S> Т пространств D и У, являющееся ли- линейным пространством над полем К (см. замечание 4 лекции 5). Если пространство У конечномерно и еи ... ..., еп — его базис, то, как легко видеть, любой элемент а произведения D <8> К единственным образом представ- представляется в виде E) а = ct! ® ех + ... + ап Поэтому формула a (aj <g> ex + ... + а« <8> еп) = где osD, корректно определяет в D <S> V умножение на а, и ясно, что по отношению к этому умножению произведение D <S> У является линейным пространством над D. Формулу E) можно теперь переписать в виде F) в = о, A ® «!)+••• +в«A ®«я). означающем, что векторы 1 <8> в\, ..., 1 <8> еп образуют базис пространства D ® Ж над D. Обычно этот базис обозначают через еь ..., еп и F) приобретает вид a = aiej+ ... +апеп. Мы видим, таким образом, что пространство У°® = = D <g) У является обобщением пространства У°с на слу- случай произвольного поля К и произвольного его над- надполя D. При этом ясно, что изложенное выше рассужде- рассуждение с операторами дословно сохраняется и в общем 287
случае. Тем самым теорема Гамильтона — Кэли оказы- оказывается доказанной для операторов над произвельным полем К. Пусть снова У — произвольное вещественное линей- линейное пространство и У —его комплексификация. Очевидно, что для любого подпространства Q про- пространства Ус подмножество Re?j? всех векторов из У, имеющих вид Re г, где ге??, или — что равносильно (ибо 1гаг = Re(—iz))— вид Im г, z ^.Q, является подпространством пространства У (если Х\ — Re z\, %2 = Re22, то Xi -\- x2 = ReBt + г2) и к Re г = Re kz для любого &(= R). Аналогично, для любого подпространства & прост- пространства У множество !?с всех векторов вида х + iy, где х, у ^ &, является подпространством пространства Ус (оно является не чем иным, как линейной оболоч- оболочкой подпространства 3* в пространстве У°с). При этом ясно, что c для любого подпространства ?Р<=У. Заметим, что каждый базис в\, ..., ер подпростран- подпространства SP (над R) будет базисом и подпространства 9^ (над LG) • Пусть теперь Л: У-^У — произвольный линейный оператор на У и Лс : У°-± Ус— его комплексификация. Рассмотрим произвольный характеристический корень Я оператора А. Он является собственным значением опе- оператора Ас, и потому в Ус определено соответствующее собственное подпространство Qx. Пусть сначала корень X веществен. Тогда он будет собственным значением оператора Лив пространстве У будет определено соответствующее собственное подпро- подпространство &х. Если нам дана некоторая система п линейных одно- однородных уравнений от п неизвестных, коэффициенты ко- которых вещественны и составляют матрицу ранга г, то ее решения образуют в R" подпространство fp размерности п — г, так что каждое решение является линейн©й ком- комбинацией некоторых п—-j линейно независимых реше- решений, составляющих базис этого подпространства. Как мы уже говорили, этот базис принято называть фунда- фундаментальной системой решений. 288
Ту же самую систему уравнений мы можем рассмат- рассматривать как систему с комплексными коэффициентами и искать ее решения в Cn = (Rn)c. Тогда каждая фун- фундаментальная система решений останется фундамен- фундаментальной системой решений, но, чтобы получить все ре- решения, придется брать линейные комбинации решений этой системы не с вещественными, а с любыми комп- комплексными коэффициентами. Во введенных выше обозна- обозначениях это означает, что подпространством решений данной системы уравнений в пространстве ?Х" является подпространство SP с. Эти общие соображения применимы, в частности, к подпространству ЗРХ, координаты векторов которого в произвольном базисе в\, ..., еп пространства У удов- удовлетворяют системе однородных линейных уравнений с вещественной матрицей коэффициентов А — А,?. Как мы знаем, те же векторы ех, ..., еп составляют базис пространства У°с и в этом базисе координаты векторов из Q% определяются той же системой уравнений. Это доказывает, что для каждого вещественного характери- характеристического корня А, оператора А имеет место равенство а потому и равенство G) ^ = Re?x. Пусть теперь А, невещественно. В этом случае мы определим подпространство $Р\С=У формулой G). Таким образом, теперь подпространства &х будут у нас определены для любых характеристических кор- корней А, оператора А, причем при А, вещественном это обо- обозначение имеет прежний смысл. Подпространство $Р% = Re?2^ мы будем называть собственным подпространством оператора Л, принадле- принадлежащим характеристическому корню А,. Следует при этом помнить, что его векторы будут собственными векто- векторами оператора А только при А, вещественном. Ясно, что каждое из пространств ?Рх инвариантно от- относительно Л. При А, вещественном ^ = Q%. Чему равно ^? при А, невещественном? Чтобы ответить на этот вопрос, заметим, что, по- поскольку коэффициенты характеристического многочлена Ю М. М. Постников, сем. II 289
/л вещественны, вместе с числом X его корнем будет также и комплексно сопряженное число X. Координаты векторов соответствующего собственного подпростран- подпространства Q^ оператора Лс будут решениями системы ли- линейных уравнений с комплексно сопряженной матрицей А — ХЕ и потому будут получаться из координат векто- векторов подпространства Qx переходом к комплексно со- сопряженным числам. На бескоординатном языке это означает, что если z = x-\-iy^Qx, то z — x — iy^C?^. В условных, но наглядных обозначениях этот факт можно записать формулой Отсюда следует, что Re^ = Re^, т. е. С другой стороны, так как X ф %, то (предложение 1 лекции 16) сумма подпространств QK и Q^ является их прямой суммой Qx © Q^. Если в\, ..., eq — базис подпро- подпространства @х, где q = dimBx, то векторы еи ..., eq, ei, ..., eq будут поэтому составлять базис пространства &к® Qx- ^° тогДа базис этого пространства будут со- составлять и векторы R&e Ime 2/ Векторы Reeb Ime,, ..., Ree,,, lmeq по построению вещественны, т. е. лежат в У. Если 2Р а.У — порожден- порожденное этими векторами 2^-мерное подпространство про- пространства Т, то по определению Но легко видеть, что при соответствии Qy сумма подпространств переходит в сумму, т. е. Re «?i + йг) — Re G\ + Re Q2 i290
для любых подпространств Qx, Q2 cz Tc. Поэтому 0> = Re &° = Re (^ 0 С*) = Этим доказано, что для любого невещественного харак- характеристического корня % оператора А справедливо ра- равенство Пример подпространств QX=^Q> и Q2 = Q% показы- показывает, что при соответствии Qy—>R&Q прямая сумма не обязательно переходит в прямую сумму. Однако легко видеть, что если Qi==0>f и Q2~ 0*^, то (8) Re «3\ Ф Q2) = Re Q, ф Re Q2. Действительно, ясно, что Поэтому, применив Re, получим (8). п Докажем теперь для пространств 0>% аналог пред- предложения 1 лекции 16: Предложение 1. Пусть Х\, ..., Кт — такие характе- характеристические корни оператора А (безразлично, веще- вещественные или нет), что A,j =7^= ^/ « ^1 Ф ^/. i-> /= Ь -.., fn, пр« Ьф\. Тогда сумма 0* подпространств 0>Xl, .... ^х является их прямой суммой: (9) ^ = ^,Ф...ФЛга. Пример подпространств .^х и ^я показывает, что условие Я,,- =т^= Я; здесь существенно. Доказательство. Пусть Хх, ...,ХГ — веществен- вещественные из данных корней, a Xr+i, ..., Xm — невеществен- невещественные. Тогда 1тп — г собственных значений оператора Ас будут все различны, и потому сумма ^ соответствующих собственных подпространств будет их прямой суммой: 10* 291
Применяя Re и учитывая, что мы немедленно получим (9). П В случае, когда оператор Л диагонализируем, из предложения 1 следует, что пространство У разлагается в прямую сумму инвариантных (относительно А) про- пространств ?РХ, где Я пробегает все вещественные корни многочлена fA и все его попарно несопряженные неве- невещественные корни. Ограничение АК = А\^ оператора А на лодпрост- ранстве 9*\ при А, вещественном нам известно — это ска- скалярный оператор "КЕ, имеющий в произвольном базисе диагональную (скалярную) матрицу ХЕ. Рассмотрим теперь оператор Ак = А \^, при X неве- невещественном. Пусть X = а + ф, где а, peR и Р =?^ 0. Выше было показано, что для любого базиса е\, ..., eq подпространства Q^ векторы A0) Ree,, lmeu ..., Ree,,, Ime,, составляют базис пространства 9*-^. Положим для упро- упрощения обозначений е = еь jc = Ree, y=Ime и рас- рассмотрим двумерное подпространство 9* cz 9*х с базисом х, у. Так как e^Q^, то А е —Аа, т. е. Лс (х + /у) = (а + /р) (ж + *у). По определению это означает, что Ах т. е. что = рж + at/. 292
Таким образом, мы видим, что пространство 3* инва- инвариантно относительно оператора А и ограничение опе- оператора А на 9* имеет в базисе х, у матрицу (П) I « Р 1-Р а Поскольку пространство 5*\ является прямой суммой q подпространств вида ?р, мы получаем, что в базисе A0) матрица оператора Ах является блочно-диагональ- ной матрицей -Р. Pi ! 0 -Р2 РП <*2 ] о а„ по диагонали которой расположены q — dimC2\ матриц вида A1). Сопоставляя все доказанное, мы видим, что справед- справедлива следующая теорема: Теорема 2. Пусть для линейного оператора А: У-*-У над полем R оператор Л1" : Т° —> Ус диагонализируем {так будет, в частности, если оператор А имеет простой спектр). Пусть, далее, Х\, .,., kr — все вещественные, a %r+i = <%1 -\- t'Pi, ..., ir+s = OLS + ips — все невеще- невещественные и попарно комплексно несопряженные харак- характеристические корни оператора А, каждый из которых повторен столько раз, какова его кратность {так что п = г + 2s). Тогда в пространстве У существует базис, в котором матрица оператора А является прямой суммой матриц первого порядка \\ХХ\\, . .., Ц Хг || и матриц второго по- порядка -P! Pi > • • " » 293
т. е. имеет вид A2) О Cll Pi I Pi ai ! О a Конечно, аналогичная теорема, но с более сложной матрицей A2) имеет место и когда оператор Ас недиа- гонализируем. Эта теорема нам не понадобится, и по- потому ни доказывать, ни формулировать ее мы не будем.
Лекция 18а з12-модули. — Весовые и примитивные элементы. — Про- Простые з12-модулн. — Теорема разложения н ее следствия. Пусть У — конечномерное линейное пространство над полем К характеристики 0. Определение 1. Коммутатором (или скобкой Ли) двух линейных операторов А, В: У-+-У называется опе- оператор A) [А, В]=*АВ — Аналогично определяется коммутатор [А, В] = АВ — ВА двух матриц А и В. Определение 2. Линейное пространство У, на кото- котором заданы три линейных оператора Н, Х,У'.У->У, называется ^-модулем, если B)' [X,Y] = H, [Н, Х] = 2Х, [Я, У] = -2У. Определение 2 представляется весьма искусственным и непонятно откуда взявшимся. На самом деле оно вполне естественно и вводит объекты очень важные и интересные не только в математике, но и, скажем, в фи- физике. Мы вкратце объясним его происхождение, хотя формально этим объяснением мы впоследствии пользо- пользоваться не будем. Линейное подпространство Q линеала End?'0, замк- замкнутое относительно операции A) (т. е. такое, что [А, В] <= g для любых операторов Л, В е д), называется линейной алгеброй Ли. Относительно операции A) оно является алгеброй (неассоциативной) в общеалгебраи- общеалгебраическом смысле. Аналогично определяются матричные алгебры Ли. Очевидным примером линейной алгебры Ли является пространство End>° всех линейных операторов У-+-У, а матричной алгебры Ли — пространство Matra К всех квадратных матриц данного порядка п над полем К (рассматриваемое как матричная алгебра Ли, оно обык- обыкновенно обозначается символом gin (К) или просто gln). Другим примером может служить подпространство з1„ 295
алгебры glra, состоящее из матриц со следом, равным нулю. (Тот факт, что з!га является алгеброй Ли, непо- непосредственно вытекает из формулы F) лекции 15.) Линейным представлением некоторой алгебры Ли g называется ее произвольный гомоморфизм g—»-End^° в алгебру Ли 'Епб.У. В этом случае пространство У называется модулем над алгеброй д. Одной из простейших и наиболее важных алгебр Ли является алгебра Ли з!2. Но, по определению, алгебра Ли sl2 состоит из матриц вида где JJ , О —1 о о 1 О О 1 о о и потому каждое представление р: sI2-*-Endy° одно- однозначно определяется операторами Н = рН, X — рХ, Y = рУ. При этом легкое вычисление показывает, что [X, У] == Н, [Н, X] = 2Х, [Н, У ] = - 2Y, и, значит, что операторы Н, X, Y удовлетворяют соотно- соотношениям B). Обратно, если заданы три оператора Н, X и У, удовлетворяющие соотношениям B), то линейное отображение р: sI2-^End>°, для которого рН = Н, рХ = X и рУ = У (ясно, что этими условиями отобра- отображение р определяется единственным образом), будет—- как легко видеть — гомоморфизмом алгебр Ли, т. е. представлением. Таким образом, ^-модули в смысле определения 2 — это не что иное, как модули над алгеброй Ли &12. Их теория является простейшим примером и образцом для построения теории линейных представлений более об- общих алгебр Ли. Пусть У—произвольный з!2-модуль. Определение 3. Собственные значения оператора Н называются весами модуля Т, собственные векторы опе- оператора Н—весовыми векторами модуля У, а собствен- собственные подпространства оператора Н — весовыми подпро- подпространствами модуля У°. Предложение 1. Если v — весовой вектор с весом X и если Xv Ф 0 (или Yv ф 0), то вектор Xv (вектор Yv) также будет весовым вектором. Вес вектора Xv равен Я + 2. а вектора Yv равен К — 2. 296
Доказательство. Если Hv = Яг>, то Н (Xv) = [Я, X] v + X (Hv) = 2Хг> + ЯЛГг> = (Я + 2) и аналогично Я (У©) = [Я, У] v + У (Я©) = — 2Yv + ЯУгг = (Я — 2)Yv. ? Следствие 1. Для любого весового вектора v суще- существуют такие числа р ^ 0 и q ^ 0, что Xpv ^=0« Yqv =?= Ф 0, но Xp+1v = 0 « y</+>u = 0. Доказательство. Достаточно заметить, что число различных весов модуля V конечно. П Определение 4. Число р мы будем называть верхним, а число ^ — нижним показателем весового элемента v. Определение 5. Весовой элемент v модуля У назы- называется примитивным, если Xv = 0, т. е. если его верхний показатель р равен нулю. Следствие 2. Для каждого весового вектора v вектор Xpv примитивен. О Предложение 2. Для любого примитивного элемента v веса Я и любого г, 0 ^ г ^ q + 1» имеет место равен- равенство C) XYrv = a(r)Yr~lv, где а(г) = (Я-г+1)г. Доказательство, По условию Xv = 0 и а@) = = 0. Поэтому при г = 0 равенство C) верно. Пусть оно уже доказано для некоторого г ^ 0. Тогда, если Yrv Ф Q (т. е. если r^q), то, согласно предложению 1, XYr+ lv = XY (Yrv) = (УХ + Я) Yrv = = У (ЛСУ©) + (Я — 2г) У© = = [а(г) + Я \)Yrv. Поэтому C) верно для любого г, 0^г^^+1. ? Следствие 1. Вес Я каждого примитивного элемента v равен его нижнему показателю q и, значит, является це~ лым неотрицательным числом. Доказательство. Так как У"+!г> = 0 и Y<*v Ф 0, то а(^+1)=0, т. е. (Я— q) (q + 1) = 0. Следовательно, Я = q (напомним, что по условию char К Ф0). & Следствие 2. Для любого примитивного элемента v и любых показателей s и г, 0 sg: s ^ r sg: <7- имеет место 297
равенство D) где а В E) г,*фО. частности, XrYrv = arv, где аг ф 0. Доказательство. При s = 0 равенство D) оче- очевидно, а при s = 1 оно совпадает с равенством C) (причем ai, r — a(r) = (q— г -\- l)r ф 0 при l^r^^). Пусть равенство D) уже доказано для некоторого s •< г. Тогда - X (as, rr~sv) = = as.ra(r — s)Yr~s~lv, и, значит, D) верно и при s + 1 (с as+\,r = as<ra(r, s) Ф' фО). Тем самым равенство D) полностью доказано, п Следствие 3. Все веса произвольного 5\2-модуля У я.вляются целыми числами. Доказательство. Пусть v — весовой вектор веса "К и пусть р — его верхний показатель. Тогда вектор Xpv примитивен и, согласно следствию 1, его вес X -\- 2р является целым числом. Поэтому целым числом будет и вес А,. П Следствие 4. В каждом $\2-модуле У существует при- примитивный элемент. Доказательство. Пусть D—алгебраическое замыкание поля К (если К == R или ??, то D = C). Рассмотрим линейное пространство У над полем D (см. замечание 1 лекции 18). Ясно, что У® также яв- является зХг-модулем (по отношению к операторам Вр, X® и Y®). Так как поле D алгебраически замк- замкнуто, то для модуля У® существует хотя бы один вес "К. Этот вес является корнем характеристического много- многочлена оператора а , совпадающего, как мы знаем (см. лекцию 18) с характеристическим многочленом оператора Н. Отсюда следует, что число К, являющееся, согласно следствию 3, целым числом и потому принад- принадлежащее полю К, будет собственным значением опе- 298
ратора Н, т. е. весом модуля У. Если v — соответствую- соответствующий весовой вектор, то, согласно следствию 2 предло- предложения 1, вектор Xpv, где р — верхний показатель век- вектора v, будет примитивным элементом модуля У. О Определение 6. Веса примитивных элементов назы- называются старшими весами з1г-модуля У. Таким образом, согласно следствию 4, каждый зЬ- модуль У имеет хотя бы один старший вес. Определение 7. Линейное подпространство з!2-мо- дуля У называется подмодулем, если оно инвариантно относительно операторов Н, X, Y (и потому само яв- является з12-модуле.м). Модуль У называется простым (или неприводимым), если он не имеет подмодулей, от- отличных от нулевого подмодуля 0 и всего У. Теорема 1 (о простых з!2-м о д у л я х). Каждый простой з12-модуль обладает единственным старшим ве- весом (все его примитивные элементы пропорциональны). Два простых з12-модуля тогда и только тогда изоморф- изоморфны, когда их старшие веса совпадают. Любое целое не- неотрицательное число q является старшим весом простого $12-модуля y(q). Размерность модуля y(q) равна q-\-\. Этот модуль обладает таким базисом e~q, e-q+2, •-., eq-2, eq, что F) Her=-rer, (8) Yer = er.2 для любого r, \r\^q {условно считается, что е(,_2 = ) и q+2 ) Весами модуля y(q) является, таким образом, чис- числа —q, —q + 2, ..., q — 2, q. [Заметим, что число ~ .—г целое.] Доказательство. Докажем сначала, что линеал У°\q) с операторами Н, X, Y, определенными формулами F), G) и (8), действительно является з12-модулем (очевидно, простым), т. е. что эти операторы удовлетво- удовлетворяют соотношениям B). Это делается автоматической 299
выкладкой: [X, Y] er = XYer — YXer = — Aer-2 — r - er+2 = Г (q - r + 2) (</ + г) (У — r) (g + г + 2I — L 4 4 J *' = rer = Her, [//, X] er = HXer — XHer = = (г + 2) ^Гег — rXer = [Я, F] er = ЯУег — УЯег = = Her_2 — Угег = = (r-2)er_2-rYer = = (г — 2) Уег - гУег = Пусть теперь Т — пока произвольный з12-модуль, v — его произвольный примитивный элемент, q — ниж- нижний показатель элемента v (являющийся, согласно след- следствию 1 предложения 2, его весом) и пусть (9) e_, = FV e_q+2 = Yq-lv, ..., eq_2=Yv, eq = v. Оказывается, что для векторов (9) справедливы тождества F), G) и (8). Действительно, тождество (8) имеет место по определению, а тождество F) вытекает, в силу предложения 1, из тождества Hv = qv, поскольку для любого г. Что же касается тождества G), то при q — г оно справедливо по определению (ибо eq = v к Xv = 0). Если же око верно для некоторого г ^ q, то Xer_2 = XYer = УХег + [Ж, У] ег == = у _ ег+2 _|- Нег = _ {q — r ~ 2) {q + r) _ 4 300
и, значит, это тождество будет верно и для г— 2. Тем самым по индукции тождество G) доказано для всех г, |г|<?. Поскольку, согласно тождеству F), векторы (9) яв- являются собственными векторами "оператора Н, принад- принадлежащими различным собственным значениям г, и, зна- значит, линейно независимы, отсюда следует, что линейная оболочка векторов (9) является подмодулем модуля У, изоморфным модулю y°(q). Если теперь модуль У является простым модулем, то эта линейная оболочка должна совпадать с У. Этим, во-первых, доказано, что все примитивные элементы мо- модуля У пропорциональны (поскольку этим свойством обладает модуль У(д)), и во-вторых, что с точностью до изоморфизма модуль У однозначно определяется числом q. Это доказывает все утверждения теоремы 1. ? Следствие 1. Элемент простого з>12-модуля тогда и только тогда примитивен, когда он принадлежит ядру Кег X оператора X. ? Вернемся теперь к произвольным не обязательно простым зХг-модулям. Пусть X—вес з!2-модуля У и Ух — соответствующее весовое подпространство. Теорема 2. Если X = m ^ 0, то любой вектор v допускает единственное представление вида (Ю) tF = tF0 + i4FI+ ... а если X — —m < 0, — то вида A1) v = Ymv0 + Ym+lvl+ ... где р — в первом случае верхний показатель элемента v, а во втором — верхний показатель элемента Xmv, и где в обоих случаях A2) v0, Vi, ..., vp — примитивные элементы, имеющие, соответственно, веса гп, пг-\- 2, ..., wi + 2/7 и выражающиеся через элемент v no формулам вида р—г+г A3) vr= Z а!?Л%, г = 0, 1, ...,/>, в которых af>s— рациональные числа, зависящие толь- 301
ко от Х,'г и s (и не зависящие от г>), а е = 0 при X ^ О и е = m при 'к — —m < О. В частности, при и = О все элементы A2) равны нулю. Доказательство. Докажем сначала единствен- единственность элементов A2). Пусть, сначала, X, = m ^ 0. Применив к разложению A0) оператор Xs, 0 ^ s ^ р, мы, в силу тождеств D) и E), получим равенство ... + asvs + a,, s+ Js+, + s, Р где as?=0. Поскольку, ввиду примитивности, Xs» Xs~l»i=0, ..., Xt>s_) = 0, это равенство имеет вид A4) Xsv = asvs-{-as.s+.Xvs+l-\- ... +^рГр"Ч-' где as =т^ 0. Таким образом, = a.^i-t-a1.2Jrt>2+ ••• -\-aUp? A5) • Xpv— apvp, где а\ ф 0, .... ap_, Ф 0, ap =#= 0. Из этих уравнений мы последовательно находим элементы vp, vp_u ..., V\, v0: vp_{ = a;lx (Xp-lv - ap_u „a^ A6) • • • Vx = aTl (Xv — ... — au ра Это доказывает единственность элементов A2) (а также тот факт, что они выражаются по формулам A3) с в = 6). Если же А,— —тп < 0, то, применив к разложению A1) оператор Xm+S, 0 ^ s ^ p, мы снова получим фор- формулы вида A4) с тем лишь отличием, что слева будет фигурировать оператор Xm+S. Поэтому в этом случае для векторов A2) будут иметь место формулы, полу- 302
чающиеся из формул A5) заменой в правых их частях операторов Xs операторами Xm+S. Это снова доказывает единственность векторов A2) (и тот факт, что они вы- выражаются по формулам A3) с е = т). Для доказательства существования разложений A1) и A3) достаточно теперь показать, что для любого ве- весового вектора v формулы A6) (и их вариант при X < 0) доставляют нам примитивные векторы vp, vp-i, ... ..., v0. Здесь удобнее иметь дело непосредственно с уравнением A5). Применив к каждому уравнению A5) (или к его ва- варианту при X < 0) оператор X и вычтя из полученного уравнения предыдущее, мы в обоих случаях получим уравнения вида XvQ + (XY — axE)vx + (XF2 - а,. 2У) v2 ... +(XY"-al.p — a2E) v2 A7) ... +(aLpp ap_2Xvp_2 + (ap_2, p^XY — ap_xE) vp_x -f p (ap_u pXY — apE)vp = 0, apXvp = 0. Поскольку ар =Ф О, из последнего уравнения A7) выте- вытекает, что Xvp = 0, т. е. что элемент vp примитивен. Для доказательности примитивности следующих эле- элементов vp-\, vp-2, ¦ ¦ ¦ мы вспомним, что, согласно про- произведенным при доказательстве следствия 2 предложе- предложения 2 вычислениям, для коэффициентов as,r уравнений A7) имеет место рекуррентное соотношение as+\. г = as. raU r-s с начальным условием а0, г = 1, причем число ai.r-s Для примитивного элемента vr+i веса m ~\-2г равно a{r — s) = {m + r-f s+ l)(r — s). Отсюда следует, что если элемент vr примитивен, то — s) — as+u r) Yr~s~xvr == 0. зоа
Имея это в виду, предположим уже доказанным, что все элементы vp, ..., vp-r+i примитивны. Тогда в урав- уравнениях A7) все члены, в которых участвуют эти эле- элементы, будут равны нулю (напомним, что as = as, s для всех s), а последнее тождественно не удовлетворяю- удовлетворяющееся уравнение примет вид ap_rXvp.r = 0. Поэтому Xvp-r = 0, т. е. элемент vp-r также будет при- примитивен. Тем самым по индукции примитивность всех элемен- элементов vp, Vp—i, ..., v0 полностью доказана. При X ^ 0 на этом—в силу первого уравнения A5) — доказательство кончается. При X = —т < 0 ана- аналог первого уравнения A5) имеет вид Xmv = vQ + Yvi + ... +Ypvp, и, чтобы получить разложение A1), надо применить оператор Ym (и разделить все элементы vs на коэффи- коэффициент Оит^О). ? Замечание 1. Для простого зЬ-модуля T = T{q) теорема 2 очевидна. Поэтому она очевидна и для мо- модуля Ж, являющегося прямой суммой (в понятном смысле) простых модулей. С другой стороны, можно доказать, что любой $12-модуль является прямой сум- суммой простых, что, таким образом, сразу дает теорему 2. Однако это утверждение (известное как теорема Вейля о полной приводимости и справедливое не только для алгебры Ли 0I2, но и для любых так назы^ ваемых полупростых алгебр Ли) выражает очень глу- глубокий факт и его доказательство (нисколько не упро- упрощающееся для специального случая алгебры Ли sl2) полностью лежит вне рамок нашего изложения. Следствие 1. При X = m >» 0 для нижнего показа- показателя q произвольного весового элемента v имеют место неравенства A8) т<<7<^+Р. и в разложении A0) все элементы vq-m+\, ..., vp равны нулю, т. е. это разложение имеет вид A9) v=Vq+YVi+ ... +Y"-mVq_m. Если же X = —т < 0, то B0) q^p, 304
элементы vq+u ..., vp в разложении A1) равны нулю и это разлооюение имеет вид B1) v = YmvQ + Ym+ivl+ ... +Ym+iVq. Доказательство. Так как каждый элемент vr, г = О, ..., р, примитивен, то его нижний показатель равен его весу m -f- 2г, и, значит, Ym+2r+ivr = 0. Тем более Ym+p+r+ivr=0. Поэтому, применив к разложению A0) оператор Ym+P+l, а к разложению A1) — оператор Yp+l, мы в обоих слу- случаях получим нуль. Это доказывает неравенство B0) и правое неравенство A8). Аналогично, применив к разложению A0) оператор у<7+: и учтя, что Yi+r+lvr = 0 при q + г ^ m + 2r, мы получим равенство (при q < m — случай, пока нами не исключенный!—ус- исключенный!—условно предполагается, что q — m + l=0). Это равен- равенство является разложением вида A1) нулевого элемента веса —2q -\-m — 2. Поэтому, в силу единственности этого разложения, все элементы vq_m+x, vq_m+2, ..., vp равны нулю. Следовательно, q ^ m (напомним, что по условию v =т^ 0 и, значит, равенства v0 = О, v\ = 0, ... ..., vp = 0 исключены) и для v имеет место разложе- разложение A9). Наконец, при X = —m < 0 мы, применив к разло- разложению A1) оператор У+1, получим разложение v2q+m+2 , v2q-hm+3 , . vq+m+p+l Л У Vq+1 H- I Vq+2 +•••+* Vp = \) вида A1) нулевого элемента веса —2q — m — 2. По- Поэтому в этом случае v4+i = 0, ..., vp = 0, и для v имеет место разложение B1). ? Следствие 2. Для любого m ^ 0 отображения У- У/* —*- У/* и У- У/" —ь-У/* являются {вообще говоря, не взаимно обратными) изо- изоморфизмами. Доказательство. Из формулы B1) непосред- непосредственно следует, что любой элемент v^T-m имеет вид Ymw, где w = Vo + YVi-\- ... +ft»,?Fm. С другой стороны, равенство Ymv = 0 для отлич* ного от нуля элемента v е Жт означает, что q < т. 305
Поскольку это противоречит левому неравенству A8), равенство Ymv = 0 возможно только при v = 0. Это до- доказывает следствие 2 в отношении отображения Ym. Далее, применив к разложению A0) элемента v e е Ут оператор XmYm, мы, согласно формулам D) и E), получим, что где а0, «ь ..., ар =т^ 0. Поэтому если XmFmt? = 0, то в силу единственности разложения A0) должны иметь место равенства ЧТО ВОЗМОЖНО ТОЛЬКО при Vo = 0, V\ — 0, . . . , Vp = 0, т. е, при v = 0. Следовательно, на F"m отображение XmYm, а потому и отображение Хт, является мономорфизмом. Но, по уже доказанному, линейные пространства Ут и У~т изоморфны и потому имеют одинаковую размер- размерность. Так как мономорфное отображение линейных пространств одной и той же размерности является изо- изоморфизмом, следствие 2 тем самым полностью дока- доказано. П Следствие 3. Весовой элемент v модуля У тогда и только тогда примитивен, когда его вес X неотрица- неотрицателен и Yx+lv = 0. Доказательство. Если элемент v примитивен, то его вес X неотрицателен и равен нижнему показателю q. Поэтому Yx+Xv = Yv+lv = 0. Обратно, если X = w^0 и Ym+lv = 0, то для элемента v имеет место неравен- неравенство q s?Z m, что возможно только при q — m. Поэтому разложение A9) имеет вид v = v0 и, значит, элемент v примитивен. П
Лекция 19 Полулинейные изоморфизмы. — Полулинейные функцио- функционалы.— Обобщенные тензоры.— Полуторалинейные функ- функционалы.— Эрмитовы функционалы.—Эрмитовы мат- матрицы и формы. С этой лекции мы начнем изучение некоторых свойств комплексных линейных пространств, существенно ис- использующих специфику поля комплексных чисел (су- (существование комплексного сопряжения). Пусть FhFi —линейные пространства над полем .С.;. Определение 1. Отображение qp: У~*-У{ называется полулинейным (.или сопряженно линейным), если и ф (сх) = Сф (X) для любых векторов х, у^У и любого комплексного числа с <= С. (где с—а — ib— число, комплексно со- сопряженное с числом с — а -\- ib). Биективное полулинейное отображение называется полу линейным изоморфизмом. Примером полулинейного изоморфизма является отображение г>—>z вещественно-комплексного простран- пространства У на себя. (Напомним — см. определение 1 лек- лекции 1.19,— что любой вектор г вещественно-комплекс- вещественно-комплексного пространства единственным образом представ- представляется в виде суммы х -\- iy, где х и у— вещественные векторы. При этом, если г = x -J- iy, то, по определе- определению, г = х — iy.) Другой пример мы получим, рассмотрев для произ- произвольного комплексного векторного пространства У мно- множество У всевозможных символов вида х, где жеУ. Сложение этих символов и их умножение на числа с^ С мы определим формулами Автоматическая проверка показывает, что по отно- отношению к этим операциям множество У является линей- 307
ным пространством над полем [С] и что отображение Фо: У-*-У, определенное формулой A) Фа (*) = *> является полулинейным изоморфизмом. Пространство У называется пространством, ком- комплексно сопряоюенным с пространством У. Заметим, что любой полулинейный изоморфизм ф: У~*-У\ единственным образом разлагается в компо- композицию Ф = ф' ° Фо полулинейного изоморфизма фо и обычного (линейного) изоморфизма ф': У-*~УХ, действующего по формуле q/ {х) = ф (Х), х<^У- В этом смысле У является «универсальным предста- представителем» всех пространств У\, полулинейно изоморф- изоморфных пространству У. Частным случаем полулинейных отображений яв- являются полулинейные функционалы, т. е. такие отобра- отображения %: У-*-?>, что для любых векторов х, у ^ У и любого числа с ^ .С-. Относительно обычных операций (eg) (х) = сЪ (х), с е= С, х е= У множество всех полулинейных функционалов У°-*-&] является, очевидно, линейным пространством. Мы будем обозначать его символом У*. Свойства полулинейных функционалов вполне ана- аналогичны свойствам линейных функционалов. Например, в любом базисе е\, ..., еп пространства У каждый по- полулинейный функционал \ <= У* выражается формулой \{x} = \iXl, если х = х1ег> 30S
где ?г —?(е?-)', и любой функционал такого вида полу- полулинеен. Соотношения <*'(<?/) = б/, i, /==1, .... п, однозначно характеризуют полулинейные функционалы е , ..., еп<= У*, обладающие тем свойством, что ё — ёг^' для любого %^У, и поэтому составляющие базис пространства У* (назы- (называемый сопряженным базисом). Каждый вектор х^У определяет по формуле полулинейный функционал х на У* и соответствие х>—>х является изоморфизмом пространства У на про- пространство У**. (В дальнейшем мы будем посредством этого изоморфизма отождествлять У и У**.) Все это немедленно доказывается непосредственно, но может быть также выведено из того очевидного факта, что для любого линейного функционала %: У-*- ~*-С] (элемента пространства У) отображение %: У-*-_С.у определенное формулой B) 1(х) = Цх), х^Т, является полулинейным функционалом (принадлежит линеалу У*), и получающееся отображение представляет собой полулинейный изоморфизм. Согласно сказанному выше полулинейный изомор- изоморфизм ф определяет линейный изоморфизм q/: У'->У*У действующий по формуле ф'A;) = 1 (справа в этой фор- формуле символ § обозначает функционал B), а слева — вектор абстрактного пространства У, отвечающий век- вектору | пространства У). В дальнейшем мы будем про- пространства У и У отождествлять посредством этога изоморфизма (и, в частности, не будем различать два значения символа %). Замечание 1. Пространство У =.у следует, во- вообще говоря, отличать от пространства У., элементами которого являются линейные функционалы §: У-^.CL Однако легко видеть, что для любого линейного 309-
функционала §: У—*¦ С отображение '?: У-*-С, опре- определенное формулой является полулинейным функционалом У —»-С и соот- соответствие |i—>'| задает (линейный!) изоморфизм У -*~У*. Поэтому пространства У и У* можно посредством этого изоморфизма отождествлять. Замечание 2. В случаях, когда это не приводит к недоразумениям, в обозначении векторов пространства У можно опускать, черту сверху, т. е. считать векторами этого пространства векторы самого пространства У (но, конечно, с другим законом умножения на комплексные числа). Тогда \ и % будут неотличимы друг от друга, а векторами пространства У* окажутся линейные функционалы \\ У-*-С, произведение которых на числа с Ы_Gi определяется формулой (с1)(*) = 1(с*) = с|(ж), *е= У. Для любого линейного оператора А: У-*-У формула корректно определяет линейный (проверьте!) оператор д*. у**_^у* Подобно оператору А1, этот оператор также называется сопряженным оператором. Фактически то же вычисление, что и для оператора А' (см. лекцию 15), показывает, что если в базисе ei, ..., еп пространства У оператор А имел матрицу Л =||all, то в сопряженном базисе е1, ..., еп простран- пространства У* оператор Л* будет иметь транспонированную и комплексно сопряженную матрицу Лт=||а/||. Отображение Л'—>А* кольца Endy в кольцо Endy* является, очевидно, антигомоморфизмом: (Л + В)" = Л* + В\ {АВУ = В* А*, и (в силу отождествления У = у**) обладает свойством инвол ютивности: (и, значит, является антиизоморфизмом). Однако в от- отличие от отображения А>—=>А' оно не линейно, а полу- полулинейно: {сА)* = сА* для любого А. V -+Y. 310
Таким образом, для каждого комплексного линеала У алгебры ЕпдУ и ЕпйУ* естественно полулинейна изоморфны. Согласно лекции 5 тензоры на линейном простран- пространстве У отождествляются с полилинейными функциона- функционалами, аргументы которых принадлежат либо простран- пространству У (являются векторами), либо сопряженному про- пространству У (являются ковекторами). В случае, когда У представляет собой линейное пространство над полем С, можно более общим образом рассматривать функцио- функционалы (от векторов и ковекторов), линейные только по части аргументов и полулинейные по остальным аргу- аргументам. Такого рода функционалы мы будем называть обобщенными тензорами. (Более выразительный термин, к сожалению, пока еще никем не предложен.) Конечно, в силу отождествления У* = У (см. заме- замечание 1) каждый обобщенный тензор можно рассмат- рассматривать как обычный полилинейный функционал, но уже от аргументов четырех сортов, принадлежащих, соот- соответственно, пространствам У, У, У и У. (Введение в рассмотрение функционалов, аргументы которых при- принадлежат пространству У', не дает, в силу естественного отождествления У* = У\ ничего нового.) Пусть обобщенный тензор Т зависит от р векторных и q ковекторных аргументов и пусть по первым а век- векторным аргументам и по первым Ь ковекторным аргу- аргументам он линеен, а по остальным полулинеен. Тогда для любых индексов ix, . . ., ia, ia+I, ..., ip и ju . .., jbt jb+i, ..., jq в каждом базисе е\, .,., en пространства У будут определены числа C) » t называемые компонентами тензора Т в базисе е\, .... еп- В соответствии с общими принципами тензорных обозначений компоненты C) следовало бы обозначить символами Т!,х '" ',ь!,ь+] "' {ч (что некоторые авторы и де- 'i ••• Va+i ••• lp лают). Однако обычно используется более выразитель- выразительное обозначение , D) т; /г»+- -'j, Sit
в котором явно указано, по каким аргументам тензор Т линеен, а по каким полулинеен. Замечание 3. Чтобы формально оправдать обо- обозначения D), следует трактовать Т как полулинейный функционал от векторов пространств У, У, У и У и для любого базиса еь .... еп пространства У базис в\, ..,, еп пространства У обозначать через ej, ..., е~г а базис е1, ..., еп пространства У—через е~, ..., ел. Тогда компоненты D) будут определяться тензорно лравильной формулой — T (i> р р- р- pf\ р!ь е!ь+\ p'<i\ ч 'l *a a+i p J Значение тензора Т на векторах и ковекторах I =1,е*, .... | =?//' задается полилинейной формой E) Z*- от координат этих векторов и ковекторов и от чисел, им комплексно сопряженных. Впрочем, в соответствии с обо- обозначениями D) обычно полагают х1 — х1, 1^=1^- и запи- записывают форму E) в виде При изменении базиса компоненты D) преобра- преобразуются по обобщенному тензорному закону где c\, = c\, (и, аналогично, Cj = cj.,). 312
Рассмотрим более внимательно функционалы от двух векторных аргументов, линейные по первому аргументу и полулинейные по второму. Определение 2. Функционал А от двух векторных аргументов, линейный по первому аргументу и полули- полулинейный по второму, называется полуторалинейным функционалом. Ясно, что все полуторалинейные функционалы есте- естественным образом составляют линейное пространство (над полем С). Согласно сказанному выше каждый полуторалиней- ный функционал А на пространстве .С; можно рассмат- рассматривать как билинейный функционал от векторов из У и У. В произвольном базисе в\, ..., еп пространства У компоненты аа& = А (еа, е&), а, р = 1, ..., п, полуторалинейного функционала А (при интерпретации А как билинейного функционала от векторов из У и У, записывающиеся формулой аа^ = А (еа, е$)) составляют матрицу II ац ... а\п II F) Л = , II апХ ... апп Ц называемую матрицей функционала А. [Мы пользуемся здесь для обозначения индексов греческими буквами, чтобы избежать возможной колли- коллизии с обозначением i для мнимой единицы л/—1 •] При изменении базиса матрица F) переходит в мат- матрицу Ст АС с элементами c^,,cfyaaly где С = ||с^,|—мат- ||с^,|—матрица перехода, связывающая новый базис со старым. Значение полуторалинейного функционала А на век- векторах х = х^еа и у = у$е$ выражается билинейной формой G) А(х, y) = aafix«yZ от х1, ••-, хп и у1, ..., уп. В матричных обозначениях формула G) имеет вид Л (х, у) = хтАу, где х и у — столбцы координат векторов х и у, а А — матрица F). 313
Это, в частности, показывает, что полуторалинейный функционал однозначно определяется своей матрицей. Каждый полуторалинейный функционал А опреде- определяет по формуле (8) Q (ж) = А (ж, х), х^Т, некоторый функционал Q от одного аргумента х^У*. Функционалы вида (8) являются аналогами квадра- квадратичных функционалов, но, как ни странно, никакого бо- более или менее общепринятого названия они не имеют. В координатах функционал (8) выражается били- билинейной формой (9) Q {х) = аа&хах*~= хгАх от хх, ..., х" и х1, ..., хп. В случае билинейных функционалов отображение Л)—э-Q имеет нетривиальное ядро (состоящее из всех кососимметрических функционалов). Замечательно, что для полуторалинейных функционалов ядро этого отобра- отображения, напротив, тривиально. Предложение 1. Если А (х, х) = 0 для любого вектора х е= ТУ то А = 0. Доказательство. В силу полуторалинейности функционала А для любых векторов х, у^У имеют место равенства А (х + у, х + у) = А (х, х) + А (х, у) + А (у, х) + А (у, у), А(х-{- iy, х + iy) = А {х, х) — г Л (х, у) + iA {у, х) + А {у, у). С другой стороны, по условию, А(х, ж) = 0, А(у,у) = О, Поэтому А{х, А (х, у) —А {у, х) = 0, и, значит, Л (ж, у) = 0. По определению это и означает, что Л = 0. ? В случае, когда пространство У, на котором задан полуторалинейный функционал Л, вещественно-комп- вещественно-комплексно (например, является комплексификацией некото- 314
рого вещественного пространства), формулы В (х, у) = Re А {х, у), x,y<=TR, С (х, у) = 1тА (х, у), х, у< определяют на вещественном подпространстве WR про- пространства У два билинейных функционала В и С, при- принимающих вещественные значения. Функционал В называется вещественной частью функционала А и обозначается символом Re Л, а функ- функционал С — его мнимой частью и обозначается симво- символом 1тЛ. Функционал А легко восстанавливается по функцио- функционалам В и С: А (х -Ь iy, и + iv) = А (х, и) + iA {у, u)—iA (x, v)—A{y, v)= = [В(ж, и) — В{у, v)-C{y, u) + C(x, v)] + + i[C(x, и)-С(у, v) + B(y, u)-B(x, v)], причем — как показывает автоматическое вычисление — для любых двух билинейных функционалов В, С на ли- линеале yR формула А (х + iy, и + iv) = [В (х, и)-В (у, v)—C (у, и) + С (х, v)] + + i [C(x, и)—С (у, v) + B (у, и)-В (х, v)} определяет полутора линейный функционал А, для кото- которого ReЛ = B и Im Л = С. Таким образом, в веще- вещественно-комплексном пространстве У полуторалинейные функционалы А находятся в естественном биективном соответствии с парами (ReЛ, 1тЛ) билинейных функ- функционалов на пространстве У^. Аналог симметрических функционалов вводится для полуторалинейных функционалов следующим определе- определением: Определение 3. Полуторалинейный функционал Л называется эрмитовым (или эрмитово симметрическим), если A0) А(х, у) = А(у, х) для любых векторов х, у ef. Функционал (8), отве- отвечающий эрмитову функционалу А, также называется эрмитовым. 315
Предложение 2. Полуторалинейный функционал А тогда и только тогда эрмитов, когда для любого вектора х <= У число А (х, х) вещественно. Доказательство. При х — у из формулы A0) следует, что для любого эрмитова функционала А число А (х, х) вещественно. Чтобы доказать обратное утверж- утверждение, рассмотрим (очевидно, полуторалинейный) функ- функционал В, задаваемый формулой В (х, у) = А (х, у) — Л (у, х), х, у*=У. Так как число А (х, х) по условию вещественно (и, зна- значит, равно Л (ж, х)}, то В(х, х)= 0 для любого вектора х^Т". Поэтому, согласно предложению 1, функционал В равен нулю, и, значит, функционал Л эрмитов. О Аналогом кососимметрических функционалов яв- являются полуторалинейные косоэрмитоеы функционалы, характеризующиеся соотношением А{х, у) = — А(у, х). Однако эти функционалы тривиально сводятся к эрми- эрмитовым, поскольку, как легко видеть, функционал А тогда и только тогда косоэрмитов, когда функционал iA эр- эрмитов. Любой полуторалинейный функционал Л единствен- единственным образом разлагается в сумму эрмитова и косоэрми- това функционалов Лэрм и Акос' А = ^эрм г •"кос» где л /„ „х А (х, t/) + A (у, х) лэрм \л> У) — 2 И А /> ч А (х, у)—А (у, х) лкос V-*> У) 2 для любых векторов х, у ^У (см. в лекции 5 аналогич- аналогичное утверждение для билинейных рункционалов). Полагая Лэрм = В я Лкос = 'С, мы получаем, таким образом, что любой полутора линейный функционал А единственным образом представляется в виде где В и С — эрмитовы функционалы. Поскольку все эрмитовы функционалы очевидным образом составляют линейное пространство над полем R 316
вещественных чисел, это означает (см. определение 1 лейции 1.19), что линейное пространство всех полутора- линейных функционалов обладает естественной струк- структурой вещественно-комплексного пространства. Роль ве- вещественных векторов этого пространства играют эрми- эрмитовы функционалы. В вещественно-комплексном пространстве У веще- вещественная часть Re А произвольного эрмитова функцио- функционала А очевидно симметрична, а мнимая часть 1тЛ кососимметрична. Обратно, легко видеть, что если для полуторалинейного функционала А функционал Re A симметричен, а функционал 1тЛ кососимметричен, то функционал А эрмитов. Таким образом, справедливо следующее предложение: Предложение 3. Полуторалинейный функционал на вещественно-комплексном пространстве тогда и только тогда эрмитов, когда его вещественная часть симмет- симметрична, а мнимая — кососимметрична. Матрица F) эрмитова функционала А в произволь- произвольном базисе е\, ..., еп удовлетворяет, очевидно, соотно- соотношению <Х^а, О., р = 1, . . ., П, т. е. — в матричных обозначениях — соотношению (И) Л=ЛТ. Такие матрицы называются эрмитовыми. Легкое вычисление показывает (ср. аналогичные вы- вычисления в лекции 5 для симметрического функционала), что полуторалинейный функционал Л тогда и только тогда эрмитов, когда его матрица эрмитова. Записав эрмитову матрицу А в виде В + 1С, где В и С — вещественные матрицы, мы немедленно получим, что условие эрмитовости A1) равносильно тому, что матрица В симметрична, а матрица С кососимметрична: Замечание 4. Задание базиса еи - - -, е„ опреде- определяет в У вещественно-комплексную структуру, по отно- отношению к которой этот базис вещественный (соответ- (соответствующее вещественное подпространство У® состоит из всех вещественных линейных комбинаций векторов е\, ... ..., еп). Рассмотрев вещественную и мнимую части эр- эрмитова функционала Л относительно этой структуры, 317
мы немедленно обнаружим, что матрица В является матрицей (в базисе ех, ..., еп) симметрического функ- функционала Re Л, а матрица С — матрицей кососимметри- ческого функционала Im А. Билинейная форма G), выражающая значения эрми- эрмитова функционала (т. е., иными словами, имеющая эр- эрмитову матрицу), называется эрмитовой формой от хх, ..., хп и у1, ..., уп. (Обратите внимание на терми- терминологическую тонкость: форма G) является билинейной формой от хх, ..., хп и у1, ..., уп и эрмитовой формой от х1, ..., хп и у1, .... уп.) При у1 = х1, ..., у11 = хп форма A2) аа&хах$ == хт Ах называется эрмитовой формой от х'\ ..., хп. Она пред-> ставляет собой билинейную форму от х1, ..,, ха и р! уП л , . . . , л .
Лекция 20 Унитарные пространства. — Пространство, сопряженное унитарному пространству. — Сопряженные операторы.— Самосопряженные операторы. — Положительные опера- операторы. Тот факт, что для каждого эрмитова функционала А и каждого вектора х^У число А (х, х) вещественно, делает возможным следующее определение: Определение 1. Эрмитов функционал А на комплекс- комплексном пространстве У называется положительно опреде- определенным, если А (ж, х) > О для любого отличного от нуля вектора х е У. Определение 2. Линейное пространство У над полем [С. называется унитарным, если в нем задан некоторый положительно определенный эрмитов полуторалинейный функционал. Этот функционал называется скалярным умножением, и его значение на векторах х и у — скаляр- скалярное произведение этих векторов — обозначается симво- символом (ж, у). Примером унитарного пространства является про- пространство С1, в котором скалярное произведение век- векторов х = (хи ..., хп) и y = (yh ..., уп) задано фор- формулой (ж, у) = ххух + .-• Замечание о терминологии. В теории уни- унитарных пространств до сих пор нет устоявшейся терми- терминологии. Например, некоторые авторы называют ска- скалярное произведение в унитарном пространстве эрми- эрмитовой метрикой (и в соответствии с этим унитарные пространства — эрмитовыми пространствами), а произ- произвольные эрмитовы в нашем смысле функционалы (и формы) — псевдоэрмитовыми метриками. Поэтому, когда в какой-нибудь статье или книге используется, скажем, термин «эрмитова форма», нужно обязательно удостовериться, предполагает ли автор эту форму по- положительно определенной или нет. Понятие унитарного пространства является точным комплексным аналогом понятия евклидова простран- 319
ства, и теория унитарных пространств на своих началь- начальных этапах полностью аналогична известной нам теории евклидовых пространств (см. лекции I. 12 и I. 13). Так, например, в унитарном пространстве: а) определена длина \х\~ -\/(х, х) произвольного вектора х; б) справедливо неравенство Коши — Буняковского I (х, у | ^ \х\ • \у\ (а, значит, и неравенство треуголь- треугольника |x + jf|<|x| + |jf|); в) имеет смысл понятие ортогональных векторов, ортонормированных семейств векторов и, в частности, ортонормированных базисов; г) выполняется неравенство Бесселя (предложение 1 лекции I. 13; только вместо xx2t надо, естественно, писать 1*<1Я); д) имеет место аналог предложения 2 лекции 1.13 о свойствах ортонормированных базисов (только, ска- скажем, равенство Парсеваля будет теперь иметь вид (х, у) = ххух + ... + ХпУп); е) применим процесс ортогонализации Грама — Шмидта и т. п. Конечно, одинаково формулируемые теоремы имеют для евклидовых и унитарных пространств, как правило, различный геометрический смысл. Например, факт су- существования ортонормированного базиса означает для евклидовых пространств, что любое n-мерное евклидово пространство изоморфно пространству Rn с умножением (*, У) = xiifi + - • • + хпу„, а для унитарных прост- пространств — что любое n-мерное унитарное пространство изоморфно пространству .С." с умножением ~(х, у) = = Х\У\ + • • • + ХпУп. Доказательства параллельных утверждений для ев- евклидовых и унитарных пространств могут при этом не- несколько различаться. Например, как в евклидовом, так и в унитарном пространствах доказательство неравен- неравенства Коши — Буняковского основывается на рассмотре- рассмотрении функции f @ = (х + ty, х + ty) > 0 (см. лекцию 1.12). Но если в евклидовом пространстве эта функция является квадратным трехчленом l*f + 2/(*, y) + t2\y? 320
без каких-либо оговорок, то в унитарном простран- пространстве ее можно представить в виде квадратного трех- трехчлена только при вещественных t. В евклидовом прост- пространстве свойство неотрицательности трехчлена f(t) (равносильное неотрицательности его дискриминанта \х,уJ— |#|2-|г/|2) сразу дает нам неравенство Коши — Буняковского, а в унитарном оно позволяет получить лишь неравенство |Re(*. y) из которого неравенство Коши — Буняковского нужно еще вывести (что нетрудно: если R = \(х,у)\, и, значит, {х, y) = Relv, то (е~(ч>х, у) = R — Re(?~icp#, у), и, по до- доказанному, R ^ |e-rcPjc| | J/| = |*| \y\)- На унитарный случай переносятся и все свойства ортогональных дополнений (вплоть до разложения у = д> ф ^»х; доказательство которого, изложенное в замечании 3 лекции 5, сохраняется дословно). В дальнейшем, насколько это возможно, мы будем доказывать теоремы о евклидовых и унитарных про- пространствах одновременно. Наиболее резко унитарные пространства отличаются от евклидовых в отношении их поведения в связи с со- сопряженным пространством У. Именно, в то время как для евклидова пространства У—как и для каждого пространства с невырожденным скалярным умножением (см. теорему 1 лекции 5) — сопряженное пространство У" естественно изоморфно пространству У, для унитар- унитарных пространств У это уже не так. Чтобы понять, в чем тут дело, напомним, что для евклидова пространства У изоморфизм У-^>-У" опреде- определяется как отображение, сопоставляющее каждому век- вектору у ^У линейный функционал |у: х ь-> (х, у). Ясно, что соответствие у\—^-|_у является гомоморфиз- гомоморфизмом. Поскольку пространства У и У имеют одну и ту же размерность, для доказательства того, что этот гомо- гомоморфизм является изоморфизмом, достаточно устано- установить, что его ядро равно нулю, т. е. что если у ф О, И М. М. Постников, сем, II 321
то %у Ф 0. Но это очевидно, поскольку, скажем, Ь(У) = (У> У)ФЪ- Все это очевидным образом сохраняется и для уни- унитарного пространства У с тем лишь отличием, что отображение у\—s»|_y будет теперь полулинейным изоморфизмом. Поэтому это отображение определяет изоморфизм пространства У не на пространство У', а на пространство У = У*. Таким образом, мы ви- видим, что унитарное пространство У естественно изо- изоморфно пространству У*. Для единообразия мы будем употреблять символ У* и в случае евклидова пространства У, считая, по опре- определению, что в этом случае У* = У'. Тем самым фор- формальное сходство евклидовых и унитарных пространств будет восстановлено и в отношении сопряженных про- пространств. (При этом — в соответствии с замечанием 3 лекции 18 — можно даже считать, что и для унитарного пространства У сопряженное пространство У* состоит из линейных функционалов %, лишь умножение на комплексные числа ce.G надо будет тогда определять формулой (eg) (х) = Цех) = с|(х),жеУ.) Заметим, что, так же как и для евклидовых про- пространств, базис е\, ..., еп унитарного пространства У тогда и только тогда ортонормирован, когда при отож- отождествлении У = У* он переходит в сопряженный базис «,..., С . Как было подробно объяснено в лекции 5, отожде- отождествление для евклидова пространства векторов и ко- векторов влечет за собой отождествление тензоров всех типов (р, q) с одной и той же суммой р -J- q. Аналогич- Аналогичное утверждение справедливо, конечно, и для обобщен- обобщенных тензоров. Для простоты мы рассмотрим здесь лишь случай р 4- q = 2. Напомним сначала для этого случая — учитывая отождествление смешанных билинейных функционалов (тензоров типа A,1)) с линейными операторами — ре- результаты лекции 5. Пусть в евклидовом пространстве У нам задан тен- тензор типа B,0), т. е. билинейный функционал А: х, у—> \—>А(х,у). Считая его второй аргумент у ковектором, мы получим из него билинейный функционал типа A,1), т. е. линейный оператор A: xt—^Ax. Здесь легко запутаться в отождествлениях. Поэтому будьте внима- внимательны: оператор А вектор х переводит в вектор Ах, 322
который — если его рассматривать как функционал на ковекторах—имеет на каждом ковекторе 1 значение \(Ах) = А(х,у), где у — вектор, отождествленный с ко- вектором %. Но отождествление % — у означает, что \(z) — (z, у) для любого вектора г^У° и, в частности, что %(Ах) — (Ах,у). Таким образом, A) А (х, у) = (Ах, у). Формула A) в явном виде описывает биективное соответствие между линейными операторами А: х>—>Ах и билинейными функционалами А: х, у>—^А(х,у) на ев- евклидовом пространстве У. Безотносительно к общей теории ее можно было бы принять за определение этого соответствия. Тогда, конечно, надо установить, что для любого линейного оператора А определенный формулой A) функционал А билинеен (это сводится к автомати- автоматической проверке), что получающееся соответствие «опе- «оператор» =>- «функционал» является гомоморфизмом соот- соответствующих линеалов (снова автоматическая провер- проверка), что этот гомоморфизм инъективен (положите у = = Ах и воспользуйтесь невырожденностью скалярного умножения) и, наконец, что этот гомоморфизм является изоморфизмом (вытекает из инъективности, поскольку оба линейных пространства имеют одну и ту же размер- размерность /г2). Последний подход годится и для унитарных про- пространств, но только вместо билинейного получится, оче- очевидно, полуторалинейный функционал. Замечание 1. В евклидовом пространстве в орто- нормированном базисе матрицы билинейного функцио- функционала А и линейного оператора А получаются друг из друга транспонированием. (Ср. замечание 1 лек- лекции 6.) Из лекции 5 мы также знаем, что отождествление билинейных функционалов с линейными операторами можно произвести иначе — принимая за ковектор не второй, а первый аргумент функционала. Тогда полу- получится, вообще говоря, другой линейный оператор А*, для которого будет иметь место формула B) А (х, у) = (х, А'у). В унитарном пространстве (для полуторалинейного функционала А) оператор А*, определяемый формулой B), также, как легко видеть, линеен. И* 323
Замечание 2. В евклидовом пространстве в орто- ортонормированном базисе матрица оператора А* совпадает с матрицей функционала А. Согласно формулам A) и B) каждому линейному оператору А: У-*-У, действующему в евклидовом или унитарном пространстве У, мы можем сопоставить би- билинейный функционал А, а этому последнему функцио- функционалу— снова линейный оператор А*. Определение 3. Оператор А* называется сопряжен- сопряженным с оператором А. Он однозначно характеризуется со- соотношением C) (Ах, у) = (х, А*у), которое должно иметь место для любых векторов х,уе=У. Для евклидова пространства У оператор А* являет- является - как показывает непосредственное сравнение опре- определений— не чем иным, как сопряженным оператором Лг: у'-^у^ рассматриваемым, в силу отождествления У — У, как оператор на У. Для унитарного же прост- пространства У он является оператором А* из лекции 19, рассматриваемым, в силу отождествления У* = У, как оператор на У. В произвольном базисе еь ..., еп евклидова про странства У элементы af матрицы оператора А* свя- связаны с элементами аУ матрицы оператора А формулой Для ортонормированного базиса еь ..., еп эта фор- формула приобретает вид af = ai. В унитарном пространстве У соответствующая фор- формула (в ортонормированном базисе) имеет вид Таким образом, оператор А* в евклидовом (унитар- (унитарном) пространстве У тогда и только тогда сопряжен с оператором А, когда в некотором (а потому и в лю- любом) ортонормированном базисе его матрица является транспонированной (соответственно, транспонированной и комплексно сопряженной) матрицей оператора А. Замечание 3. Это утверждение можно доказать без всяких вычислений, если вспомнить, что в веществен- 324
ном пространстве операторы Л и А', а в комплексном пространстве операторы Л и Л* имеют в сопряженных базисах транспонированные (соответственно, транспони- транспонированные и комплексно сопряженные) матрицы (см. лек- лекции 15 и 19), а в евклидовом (унитарном) базис е\, ..., еп ортонормирован тогда и только тогда, когда он совпа- совпадает с сопряженным базисом, рассматриваемым как ба- базис в У. Следующее определение существенно использует тот факт, что операторы Л и Л* действуют в одном и том же пространстве. Определение 4. Оператор Л: У —**У на евклидовом или унитарном пространстве называется самосопряжен- самосопряженным, если А* = А, т. е. если для любых векторов х, у <^У имеет место равенство {Ах, у) = (х, Ау). Самосопряженные операторы в евклидовом простран- пространстве называются также симметрическими (или симмет- симметричными), а в унитарном — эрмитовыми операторами. Ясно, что оператор А в евклидовом {унитарном) про- пространстве тогда и только тогда симметричен {эрмитов), когда соответствующий билинейный {полуторалиней- ный) функционал А симметричен {эрмитов). Например, в унитарном пространстве Л {у, х) = {Ау, х) = {х, Ау) = {Ах, у) = А {х, у). ? Поэтому в евклидовом {унитарном) пространстве оператор тогда и только тогда симметричен {эрмитов), когда в некотором {а потому и в любом) ортонормиро- ванном базисе его матрица симметрична {эрмитова). Сумма самосопряженных операторов и произведение самосопряженного оператора на вещественное число яв- являются, очевидно, самосопряженными операторами. Это означает, что самосопряженные операторы образуют ли- линейное пространство над полем R (в случае евклидова пространства У являющееся подпространством простран- пространства ЕпАУ). Произведение двух самосопряженных операторов мо- может и не быть самосопряженным оператором. Более точно: произведение АВ двух самосопряженных опера- операторов А и В тогда и только тогда является самосопря- самосопряженным оператором, когда операторы А и В переста- перестановочны, т. е. АВ = В А. 325
Действительно, если АВ = В А, то (АВ)* = (ВА)* = = А*В*—АВ. Обратно, если (АВ)* = АВ, то В А = = В*А* = {АВ)* = АВ. ? Определение 5. Оператор А, для которого А* = —А, т. е. такой, что (Ах, для любых векторов х, у е У, называется в евклидовом пространстве кососимметрическим, а в унитарном — ко- соэрмитовым. Оператор А тогда и только тогда кососимметричен (косоэрмитов), когда соответствующий функционал А: х, у\—>(Ах,у) кососимметричен (косоэрмитов). По- Поэтому кососимметрические операторы составляют вполне самостоятельный класс операторов. В каждом ортонор- мированном базисе матрицы этих операторов кососим- метричны и любой линейный оператор единственным образом представляется в виде суммы симметрического и кососимметрического операторов. Напротив, косоэрмитовы операторы тривиальным об- образом сводятся к эрмитовым (оператор А тогда и только тогда косоэрмитов, когда оператор iA эрмитов) и любой оператор А на унитарном пространстве У единственным, образом представляется в виде А = В + 1С, где В и С — эрмитовы операторы. Это означает (см. оп- определение 1 лекции 1.19), что для любого унитарного пространства У линейное пространство End^° несет ес- естественную структуру вещественно-комплексного ли- линеала, причем соответствующим вещественным подпро- подпространством является пространство эрмитовых опера- операторов. Мы видим, таким образом, что в определенном отно- отношении эрмитовы операторы аналогичны вещественным числам. Эта аналогия прослеживается весьма далеко. Например, неотрицательные вещественные числа мо- могут быть охарактеризованы как числа вида б2, где b e е R. По аналогии, мы примем следующее определение: Определение 6. Самосопряженный оператор А (в ев- евклидовом или унитарном пространстве) называется не- неотрицательным, если существует такой самосопряжен- самосопряженный оператор В, что А = В2. В случае, когда оператор В можно выбрать невырожденным, оператор А назы- называется положительным. 326
Поскольку квадрат оператора тогда и только тогда невырожден, когда сам оператор невырожден, неотри- неотрицательный оператор положителен тогда и только тогда, когда он невырожден. Замечание 4. Многие авторы неотрицательные операторы называют положительными, а положитель- положительные операторы — строго положительными. Так как В = В*, то (Ах, х) = (В2х, х) = (Вх, Вх) = \ для любого вектора х е У, причем если оператор В не- невырожден (т. е. оператор А положителен), то (Ах, х) > > 0 при х Ф 0. Оказывается, что обратное утверждение также верно: Предложение 1. Если самосопряженный оператор А обладает тем свойством, что (Ах, х) ^ 0 для каждого вектора х^У, то этот оператор неотрицателен. Если же (Ах, х) > 0 при х ф 0, то оператор А положителен. Доказательство предложения 1 мы пока отложим, поскольку оно основывается на свойствах самосопря- самосопряженных операторов, которые мы еще не доказали. Чтобы быть уверенным в отсутствии порочного круга, можно во всем дальнейшем под неотрицательными (соответ- (соответственно, положительными) операторами пока понимать самосопряженные операторы А, удовлетворяющие усло- условиям предложения 1. Следствие 1. Самосопряженный оператор А тогда и только тогда неотрицателен (положителен), когда су- существует такой (невырожденный) линейный оператор С, что А = С*С. Доказательство. Если А = В2 и В* = В, то А = С*С при С = В. Обратно, пусть А = С*С. Тогда для любого вектора х е У (Ах, х) = (Сх, Сх) > 0, причем, если оператор С невырожден, то при х =#= 0 имеет место строгое неравенство. Поэтому, согласно предложению 1, оператор А неотрицателен (положите- (положителен), п
Лекция 20а Самосопряженные проекторы. — Ортогональные проекторы. Интересные свойства имеют самосопряженные опе- операторы, являющиеся одновременно проекторами (см. лекцию 14). Поскольку для любого подпространства 53 евклидова или унитарного пространства У имеет место разложение мы можем говорить о проекторе Р: У-+У на подпро- подпространство ^=ImP вдоль подпространства Zp1- = Ker Р. Предложение 1. Идемпотентный оператор Р: У ~=>~У тогда и только тогда является проектором на некоторое подпространство <р вдоль его ортогонального дополне- дополнения ?^х, когда этот оператор самосопряжен. Доказательство. Если оператор Р является проектором на 0* вдоль ^х, то для любых векторов х, у^У векторы Рх и Ру принадлежат ?Р, а векторы х — Рх и у—Ру принадлежат ^х. Поэтому (Рх, у — — Ру) = О, (х — Рх, Ру) = 0, и, значит, (Рх, у) = (Рх, Ру) = (х, Ру). Следовательно, проектор Р самосопряжен. Обратно, если идемпотентный оператор Р (являю- (являющийся, как мы знаем; проектором на !P — lmP вдоль Ker P) самосопряжен, то для любых векторов х, у s У будет иметь место равенство (Рх, Ру) = (Р2х, у) = (Рх, у), а потому и равенство (Рх, у — Ру) = (Рх, у) — (Рх, Ру) = 0. Поскольку векторы Рх исчерпывают подпространство <р=\п\Р, а векторы у — Ру — подпространство КегР, это доказывает, что Ker Р = 0}±, т. е. что Р является проектором на &* вдоль &¦*-. п Заметим, что по ходу дела мы фактически также доказали, что проектор Р тогда и только тогда самосо- 328
пряжен, когда для любых векторов х, у е У имеет место равенство (Рх, у) = (Рх, Ру). Действительно, это равенство равносильно соотношению (Рх, у — Ру) = О, обеспечивающему, что Р является про- проектором на <Р = ImP вдоль ^х. П При х = у мы получаем отсюда, что (Рх, х) ^ 0, т. е. что каждый самосопряженный проектор является неот- неотрицательным оператором. Кроме того, так как х = Рх -\- у, где у Л-Рх, то по теореме Пифагора |Px|s^i|x|. Таким образом, каждый самосопряженный проектор не увеличивает длин: | Рх j =s^ | х | для любого вектора х ^. ?Р. Интересно, что, и наоборот, любой идемпотентный оператор Р, не увеличивающий длин, самосопряжен. Действительно, если х<=(КегР)х, то (х, х — Рх) = О (так как х — Рх ^ Ker P), и, значит, | х — Рх |2 == (х — Рх, х — Рх) = — (Рх, х — Рх) — = - (Рх, х) + (Рх, Рх) < - (Рх, х) + (х, х) = = (х — Рх, х) = 0. Поэтому \х — Рх|2 = 0, т. е. х == Рх. Следовательно, (KerP)J-ciImP. Обратно, если х = Рх и х = у -j- 2, где г/ е Ker P и 2е(КегР)х, то л; = Р(у + г) = Рг, а так как, по до- доказанному, ге1тР, то Рг = г. Следовательно, х== = г е= (Кег Р)х, т. е. ImPc (Ker Р)х. Таким образом, ImP = (KerP)х, и, значит, Р пред- представляет собой проектор на & = Im Р вдоль ?^х = = Кег Р. Поэтому этот проектор самосопряжен. П Для операторов отношение «больше или равно» можно вводить несколькими различными способами. Например, можно считать, что А ^ В, если оператор В — А неотрицателен (для самосопряженных операторов А и В это определение, по-видимому, наиболее есте- естественно) или если |Лх|^|Бл;| для любого х е У, или если 1гаЛс1гаВ и т. д. и т. п. Вообще говоря, эти способы приводят к различным результатам но, оказы- оказывается, что для самосопряженных проекторов все они совпадают. Предложение 2. Для самосопряженных проекторов Р и Q следующие утверждения равносильны: 329
1° Оператор Q — Р неотрицателен. 2° Для любого вектора х^У имеет место неравен- неравенство 3° Подпространство Im Р содержится в подпростран- подпространстве Im Q: Im PczImQ. 4° Имеет место равенство PQ = P. 5° Имеет место равенство Доказательство. Мы докажем следующую диа- диаграмму импликаций: Импликация 1° =>- 2°. Так как операторы Р и Q являются самосопряженными проекторами, то (Рх, х) = (Рх, Рх), (Qx, х) = «?*, Qx), и, значит, | Qx р - | Рх |2 = «?ж, <?л) — (Рх, Рх) = (Qx, х) — (Рх, х) = Поэтому, если ((Q — P)x,x)^zO (оператор Q — Р неот- неотрицателен) , то | Рх \ ^ | Qx |. Импликация 2° =*- 3°. Если |Pjtj<jQx| и же elmP, т. е. лс = Рх, то |x|^|Qjc|, чта возможно (по- (поскольку оператор Q, как мы знаем, не увеличивает дли- длины) только при |*|==|Q*i, т. е. при (х, х) = (Qx, Qx) = = (Qx,x). Это означает, что самосопряженный проек- проектор Е — Q обладает тем свойством, что ((Е—Q)x,x)—0. Поэтому Q)x, (E-Q)x)=:((E~-Q)x, x) = Q, и, значит Qx = х, т. е. х е Im Q. Следовательно, если jРх[ <; |Qx| для всех х, то ImPc Im Q. 330
Импликация 3°=^5°. Если Im Р cr Im Q, то Рх <= е ImQ для любого вектора х^У, и, значит Q(Px) = = Рх, т. е. QP = Р. Эквивалентность 4°-<$=>¦ 5°. Если PQ = Р, то QP = Q*P* = (PQ) * = Р* = Р, а если QP = Р, то ана- аналогично PQ = P*Q* = (QP)* = P* = Р. Импликация 5°=^1°. Если QP = Р и, значит, по доказанному, PQ = Р, то QP = PQ, и потому оператор Q(E — Р) самосопряжен и является проектором. Следо- Следовательно, (Q (Я — Р)лс, х) ^ 0, и, значит, ((Q — P)x, x) = ((Q—QP)x, x) = (Q(E-P)x, ж)>0, т. е. оператор Q — Р неотрицателен. О Самосопряженные проекторы Р и Q называются ортогональными, если PQ = 0 (и, значит, QP = Q*P* = = (PQ)* = O). Это название оправдывается тем, что, как легко видеть, проекторы Р и Q тогда и только тогда ортогональны, когда ортогональны подпространства 3> — Im Р и Q = Im Q (т. е. (х, у) = 0 для любого век- вектора х е & и любого вектора у <=Q). Действительно, если проекторы Р и Q ортогональны (и, в частности, самосопряжены) и если х = Р* и у = = Qy, то Р Обратно, если подпространства 0* и Q ортогональны, то и, значит, для любого вектора х^У имеет место ра- равенство PQx = P{Qx) = 0. П Предложение 3. Сумма Р = РХ+ -.. +Рт самосопряженных проекторов Pi, ..., Pm тогда и только тогда является проектором (автоматически самосопря- самосопряженным), когда эти проекторы попарно ортогональны. Доказательство. Если PiPj = 0 при i =^= у, то Обратно, пусть Р2 = Р и пусть xsIraPj, т. е. х = PiX. Так как проектор Р самосопряжён (как сумма самосо- самосопряженных операторов), то = (Px, х) = (Рхх, *)-+... -\-(Ртх, х) = 331
и, следовательно, |л| = |Ря;|2 и |PiA:|2-f ... -f \Ртх\2= — \PiX\2. Это возможно только тогда, когда для любого j =^= i имеет место равенство |Р/ле| = О, т. е. равенство Pjx = 0. Поскольку х = Ptx, тем самым доказано, что Р^Р-.х = 0, т. е. что PiPj == 0: ? Особо интересен случай, когда Р = Е. Если Pi+ ... +Рт=Е, то * = P,* + ... +Ртх для любого вектора х^У, и, значит, У = д>\ -\- ... ... -f &m, где A) ^=1тР„..., ^т Кроме того, если проекторы Рь ..., Рт попарно ортого- ортогональны, то пространства A) также попарно ортого- ортогональны и потому обладают тем свойством, что каждое из них дизъюнктно с суммой всех остальных. Следова- Следовательно (см. лекцию 3), Обратно, пусть У является прямой суммой попарно ортогональных подпространств ?^ь ...., <рт и пусть Pi'— проектор на &i вдоль &i, i— I, ..., m. Тогда для лю- любого вектора х ^ У имеет место равенство где Xi e ZPi, и, значит, Xi = PjXr. Кроме того, так как подпространства <Pi, SPj, а значит, и проекторы Ри Рг ортогональны, то Р,-х/ = PiPfx,- = 0 при i Ф \. Поэтому xi = Pi{x\ -\- ... -\- хт)= Ptx, и, следовательно, х = Р1х+ ... +Ртх = (Р{+ ... +Рт)х, T.e.Pi+...+Pm = E. Тем самым доказана следующая теорема: Теорема 1. Разложения пространства У в прямую сумму попарно ортогональных подпространств находятся в биективном соответствии с разложениями Е = Рг+ ... +Рт тождественного оператора в сумму попарно ортогональ- ортогональных самосопряженных проекторов.
Лекция 21 Спектральные свойства самосопряженных операторов. — Ортогональная диагонализируемость самосопряженных операторов. — Приведение квадратичных и эрмитовых форм к нормальному виду. — Одновременное приведение к нормальному виду Двух квадратичных форм. — Харак- теризация положительных операторов. Следующие предложения справедливы как для ев- евклидовых, так и для унитарных пространств (хотя и тре- требуют, вообще говоря, различных доказательств). Предложение 1 (о вещественности). Все ха- характеристические корни произвольного самосопряжен- самосопряженного оператора вещественны. Доказательство. Пусть А— самосопряженный оператор в евклидовом или унитарном пространстве У и пусть А— его произвольный характеристический ко- корень. Если пространство У унитарно (и, следовательно, оператор А эрмитов), то число К будет собственным значением оператора А, т. е. будет существовать такой вектор х0 =т^ 0, что Ахо = Хх0. Для этого вектора (Ах0, х0) = (Ajc0, Xq) = К (х0, х0), и, значит, Л —-. г— . Для завершения доказательства предложения 1 в этом случае остается заметить, что так как функционал А: х, у\—>(Ах,у) эрмитов, то, согласно предложению 2 лекции 19, правая сторона этой формулы вещественна. Поэтому вещественно и число X. Пусть теперь пространство У евклидово. Рассуждая от противного, предположим, что X = a -f ф, где р Ф 0. Тогда, как было показано в лекции 17а, для оператора А в пространстве У существует двумерное инвариантное подпространство 0> и в нем такой базис х, у, что Ах = аде — $у, Ау == рдс + ау. Поэтому (Л*, у) = (ах — $у, у) = а {х, у) — $ {у, у) 333
я (ж, Ау) = (ж, р* + о.у) = р (ж, ж) + а (ж, у). Поскольку оператор А самосопряжен (симметричен) и, значит, {Ах, у) = (ж, Ау), отсюда следует, что р[(ж, Поскольку последнее равенство невозможно (ибо х, х) > > О, {У, У) > 0 и, по условию, Э=#=0), тем самым до- доказано, что ^eR. E Предложение 2 (об ортогональности). Любые два собственных вектора х и у самосопряженного опе- оператора А, принадлежащие различным собственным чениям "К и [г, ортогональны. Доказательство. Имеем {Ах, у) = (Л,*, у) = "к (х, у), {х, Ау) = (ж, цу) = \i (ж, у) (последнее верно и в унитарном пространстве, так как, согласно предложению 1, число ц вещественно). По- Поэтому, в силу самосопряженности, ^ (*» У) == И (*> У). что при А/ =й= М- возможно только при (ж, у) = 0. П Предложение 3 (об ортогональном допол- дополнении). Для любого самосопряженного оператора А ортогональное дополнение fpx произвольного инвариант- инвариантного подпространства 3* также является инвариантным подпространством. Доказательство. Если же^х, то (ж,у) = 0 для всех у ^fp, и потому {Ах, у) = (ж, Ау) = 0, ибо, по усло- условию, Ау е 0>. Следовательно, Ах е №х. П Предложение 4 (о кратиостях). Геометрическая кратность /?Л произвольного собственного значения Хь салюсопряженного оператора А равна его алгебраиче- алгебраической кратности пх: Доказательство. Пусть ^^— собственное под- подпространство, принадлежащее собственному значению Хо, и пусть вь .... еп — такой ортонормированный базис пространства У, что векторы е\, .... ер, где р = рХо, со- составляют базис подпространства if^ (и, следовательно, 334
векторы ep+i, ..., еп—базис пространства fPiJ. Так как, согласно предложению 3, подпространство д9^ также инвариантно, то матрица оператора А в этом базисе имеет вид i •• |о о в где В — матрица оператора В — А\ .. Следовательно •а(*")—(\—^)Р >в^)» и пот°му, если р% <пк , то fB (Ао)=0, и, значит, Ао является собственным значением опера- оператора В. Соответствующий собственный вектор из ?^i\ будет собственным вектором оператора А, принадлежа- принадлежащим собственному значению Ко, что невозможно, так как все эти векторы лежат в д9'. . Следовательно, р. ^л, , и, значит, Рх0===пх0 (поскольку всегда рк ^л, ; см. лек- лекцию 16). ? Замечание 1. В доказательстве предложения 4 мы пользовались только тем свойством самосопряжен- самосопряженного оператора, что ортогональное дополнение каждого его собственного подпространства является инвариант- инвариантным подпространством (так что в полной мере предло- предложение 3 нам даже не понадобилось). Поэтому предло- предложение 4 справедливо для любого оператора, для кото- которого ортогональное дополнение каждого собственного подпространства инвариантно. Согласно теореме 1 лекции 16 из предложения 4 (для евклидовых пространств — вместе с предложе- предложением 1) вытекает, что произвольный самосопряженный оператор А: У-ь-У' диагонализируем, т. е. что где Ai, ..., Хщ — всевозможные собственные значения оператора А. Выбрав в каждом из подпространств &%t ортонормированный базис, мы, ввиду предложения 2„ получим ортонормированный базис пространства У, в котором оператор А имеет диагональную матрицу. 335
Определение 1. Оператор А в евклидовом или уни- унитарном пространстве У называется ортогонально диаго- нализируемым, если в пространстве У существует орто- нормированный базис, в котором матрица оператора А диагональна (т. е. который состоит из собственных век- векторов этого оператора). Таким образом, нами доказана следующая теорема: Теорема 1. Каждый самосопряженный оператор в ев- евклидовом или унитарном пространствах ортогонально диагонализируем. ? Замечание 2. В евклидовом пространстве каждый ортогонально диагонализируемый оператор, имея в не- некотором ортонормированном базисе диагональную, а следовательно, симметрическую матрицу, симметричен (самосопряжен). Таким образом, линейный оператор в евклидовом пространстве тогда и только тогда орто- ортогонально диагонализируем, когда он самосопряжен. Класс ортогонально диагонализируемых операторов в унитарном пространстве мы охарактеризуем в следую- следующей лекции. Поскольку в прямой сумме A) подпространства 0>%. попарно ортогональны, ей соответствует (см. лекцию 19а) разложение B) ? = Р,+ ... +Рт тождественного оператора Е в сумму попарно ортого- ортогональных проекторов (где Pi, I ^ i ^ m, — проектор на &. вдоль &х^)- При этом, так как для любого вектора 7 вектор Pix принадлежит $?i и, значит, А(Р,:х) = = AtPiX, то APi = "KiPi. Следовательно, умножив B) слева на А, мы получим равенство C) А=*Х^+ ... +ЬтРт. Каждое равенство C) с попарно ортогональными са- самосопряженными (и отличными от нуля) проекторами Pi, удовлетворяющими соотношению B), и различными числами Xi называется спектральным разлооюением опе- оператора А. В силу соотношения B) каждое такое разло- разложение определяет разложение пространства У в прямую сумму подпространств #*,• = Im Pit I ^ / <; m. При этом, ввиду ортогональности проекторов Pi, для любого t == 1, ..., m будет иметь место равенство APi = A.jPi = = hiPi, показывающее, что каждый вектор подпростран- 336
ства 0*i является собственным вектором оператора А, принадлежащим собственному значению Л«. Поэтому Фг — Фъ^ и, значит, оператор А ортогонально диаго- нализируем. Таким образом, операторы, обладающие спектраль- спектральным разложением, — это в точности ортогонально диа- гонализируемые операторы. Кроме того, мы видим, что спектральное разложение оператора (когда оно существует) единственно (с точ- точностью до порядка слагаемых). На языке спектральных разложений теорема 1 утвер- утверждает, таким образом, что любой самосопряженный опе- оператор обладает спектральным разложением. На этом основании теорема 1 называется теоре- теоремой о спектральном разложении. Другую полезную переформулировку теоремы 1 — по крайней мере для случая операторов в евклидовом пространстве — мы получим, приняв во внимание биек- биективное соответствие между симметрическими линейными операторами и симметрическими билинейными (или, что равносильно,— квадратичными) функционалами. Пусть п D) Q(*i, ...,*„)= Z tJtiXiXf i — произвольная квадратичная форма от п переменных х\, ..., хп с вещественными коэффициентами <7«7> *» / == = 1, .... п. Выбрав в n-мерном евклидовом пространстве У ор- тонормированный базис еь ..., еп, мы можем рассмот- рассмотреть в У" квадратичный функционал Q, выражающийся в этом базисе формой Q(xb ..., хп), а, значит, и соответ- соответствующий симметрический линейный оператор Q: У—^У (т. е. такой, что Q (х) = (Qx, x) для любого вектора х^У). Согласно теореме 1 в пространстве У суще- существует ортонормированный базис fi, ..., fn, в котором оператор Q имеет диагональную матрицу с диагональ- диагональными элементами %\, ..., "Кп. Это означает, что для лю- любого вектора х ре У имеет место равенство E) QW = Vi+ •¦• +КуЪ 337
где F) У п.— сп\х\-\- ••• -\-с пп. — координаты вектора х в базисе fi, ..., fn. Поскольку оба базиса еи ... , еп и fi, ..., fn ортонормированы, пре- преобразование F) ортогонально, т. е. матрица С его ко- коэффициентов является ортогональной матрицей (см. лек- лекцию 1.25). Этим доказана следующая теорема: Теорема 2. Любая квадратичная форма D) ортого- ортогональным преобразованием переменных может быть при- приведена к виду G) V?+ ••• +Ку1- Коэффициенты "Ки - • ¦, ^п являются корнями уравнения det(Q A?) 0 и потому определены однозначно (с точностью до по- порядка). О Отличие этой теоремы от (существенно более про- простой) теоремы Лагранжа из лекции 11 состоит фор- формально только в том, что приведение к каноническому виду G) достигается не произвольным, а ортогональным преобразованием переменных. Именно поэтому канони- канонический вид G) оказывается единственным. Теорема 2, являющаяся, конечно, лишь переформу- переформулировкой теоремы 1 (для случая операторов в евклидо- евклидовом пространстве), имеет то преимущество, что она фор- формулируется в чисто алгебраических — не связанных с теорией операторов — терминах и потому может быть применена, например, к квадратичной форме, выражаю- выражающей кинетическую энергию системы материальных то- точек или к тензору инерции твердого тела. В унитарном пространстве роль квадратичных форм играют эрмитовы формы, и аналог теоремы 2 для эрми- эрмитовых форм" утверждает, что каждая эрмитова форма унитарным преобразованием переменных может быть приведена к виду где %it ..., kn — однозначно определенные вещественные числа. Теорема 1 (теорема 2) имеет много разнообразных следствий. 338
Рассмотрим, например, вопрос о приведении двух квадратичных форм Q и А к виду E) одним и тем ж е линейным преобразованием переменных. Произвольное линейное невырожденное преобразо- преобразование F) зависит от п2 параметров сц (подчиненных лишь одному неравенству det \\сц\\ ф 0), а требование ортогональности накладывает на эти параметры —^ независимых соотношений п 2 CijClk = &ik> l> k=l, . . ., П. Поэтому при приведении квадратичной формы Q к виду E) линейным преобразованием мы из п2 параметров используем лишь 2 _ я (я + 1) я (га — 1) п 2 ~ 2 параметров, остальные же параметры Гв числе " 2 ) мы, вообще говоря, можем выбирать как угодно. Поль- Пользуясь этой свободой, можно надеяться распорядиться дополнительными параметрами так, чтобы то же преоб- преобразование приводило к нормальному виду E) и неко- некоторую другую квадратичную форму А (для чего нужно я (я— ) ^ д(я+ ) параметров). Более того, поскольку я (п + 1) я (га — 1) можно, истратив еще не более п параметров, обратить в ±1 все отличные от нуля коэффициенты "К\, ..., Хп в нормальном виде E) формы Q. Однако подобного рода соображения, основанные на подсчете параметров, не имеют, вообще говоря, доказа- доказательной силы и могут служить лишь для эвристических целей и каждый раз должны быть подкреплены строгим доказательством. В частности, несмотря на то что для приведения двух квадратичных форм к нормальному виду одним и тем же линейным преобразованием параметров — как мы подсчитали — хватает, все же это приведение в об- общем случае осуществить нельзя. Пример 1. При п = 2 рассмотрим формы Q (х{, х2) = х\ — х\ и A(xv х 339
Линейное преобразование .„. xl — cnyl-\-cl2y2, (8) v — /. « -и г « х2 — с2\У\ ¦+¦ с22у2, переводит эти формы в формы Q' {Уи Уг) = (сиУ + С\2У2? ~ {°2\У\ + с22у2J = = (С11 - С1х) У\ + 2 (СПС12 ~ С21С22) ^1^2 и ^' (^1. У2) = [(Си — с21) ух + (с12 — с22) у2]2 = = (СП - C2lJ^ + 2 (С11 - С21) (С12 - С22) ^2 тогда и только тогда имеющие вид F), когда С11С12 "~" С21С22 === О' (Си —с21)(с12--с22) = 0, т. е. когда CnCi2 == С21С22 и либо Сц = с2ь либо Ci2 = ^22- Но тогда СцСгг = C\2C2i, что противоречит невырожден- невырожденности преобразования (8). Следовательно, преобразова- преобразования (8), приводящего обе формы Q и А к виду E), существовать не может. Тем не менее справедливо следующее предложение: Предложение 5 (теорема об одновременном приведении двух квадратичных форм к нормальному виду). Если квадратичная форма Q положительно определена, то для любой другой квад- квадратичной формы А существует невырожденное линейное преобразование переменных, приводящее форму Q к виду (9) у\+ ... +У%, а форму А — к виду Доказательство. Согласно теореме Лагранжа существует линейное преобразование переменных, при- приводящее форму Q к виду (9). Это преобразование переведет форму А в некоторую форму А'. Согласно теореме 2 существует ортогональное преобразование пе- переменных, переводящее форму А' в форму A0). По- Поскольку ортогональное преобразование не меняет, оче- очевидно, формы (9), композиция обоих преобразований 340
будет переводить форму А в форму A0), а форму Q — в форму (9). ? С помощью теоремы 1 легко доказывается также предложение 1 лекции 19. Доказательство предложения 1 лек- лекции 19. Пусть А — такой самосопряженный оператор, что {Ах, х)^ 0 для любого вектора х^У, пусть в\, ... ..., еп — базис пространства У, состоящий из собствен- собственных векторов оператора А, и пусть %i, ..., %п — соответ- соответствующие собственные значения. Так как (Aelt et) = kt{et, е то %i Г$г 0, и, значит, в R существуют корни \ i=l, ..., п. Пусть В — оператор, имеющий в базисе ?ь ••-, е„ диагональную матрицу с числами V^i» ••• .. ., V^n по главной диагонали, т. е. такой, что A1) . Ве, = Ул7е„ ..., Ben = ^Ken. Ясно, что оператор В самосопряжен (в евклидовом слу- случае— потому, что диагональная матрица симметрична^ а в унитарном — потому, что диагональная матрица с вещественными элементами эрмитова) и обладает тем свойством, что В2 = А. Следовательно, оператор А не- неотрицателен. Если (Ах, х) > 0 при х ф 0, и, в частности, (Аег, е«) >> > 0, то Xi > 0, и потому оператор В невырожден. Сле- Следовательно, оператор А = В2 положителен. ? Заметим, что по ходу дела мы также доказали, что самосопряженный оператор А тогда и только тогда не- неотрицателен (положителен), когда все его собственные значения неотрицательны (положительны). В частности, отсюда следует, что определенный фор- формулами A1) оператор В неотрицателен (а при А поло- положительном— положителен). Таким образом, для любого неотрицательного (положительного) оператора А суще- существует неотрицательный (соответственно положитель- положительный) оператор В, удовлетворяющий соотношению A2) А = В2, и легко видеть, что этот оператор единствен. Действи- Действительно, пусть В — произвольный неотрицательный опе- оператор, удовлетворяющий соотношению A2), и пусть вь •¦•. еп—базис, состоящий из собственных векторов 341
оператора В, a jxi, ..., jx« — соответствующие собствен- собственные значения (по условию, неотрицательные). Тогда Аег = В (Ве^) = (х?ег для любого i = 1, ..., п, и, значит, векторы е\ еп являются собственными векторами оператора А с собственными значениями \i\, ..., ц?. Поэтому числа \и,\, ..., \i2n совпадают (после возможной перенумерации) с числами \\, ..., Хп, и, значит, щ = = V^7> • • •» 1*л = V^« • Следовательно, оператор В сов- совпадает с оператором A1). п Единственный неотрицательный (положительный) оператор, удовлетворяющий соотношению A2), назы- называется квадратным корнем из оператора А и обозна- обозначается символом V А .
Лекция 21а Гиперквадрики в л-мерном евклидовом пространстве.— Минимаксное свойство собственных значений. — Класси- Классификация эллипсоидов. — Главные направления и завер- завершение классификации евклидовых гиперквадрик. Важные применения теорема 1 (или, точнее, тео- теорема 2) лекции 21 находит также в теории гипер- гиперквадрик. Подобно тому как теорема Лагранжа позволила нам дать классификацию гиперквадрик n-мерного аффинного пространства (см. лекции 13 и 13а), теорема 2 лек- лекции 21 приводит к аналогичной классификации гипер- гиперквадрики n-мерного точечного евклидова (вещественно- комплексного) пространства. Действительно, слово в слово повторяя доказательство теоремы 1 лекции 13а и лишь ссылаясь вместо теоремы Лагранжа на тео- теорему 2 лекции 21, мы получим следующую теорему: Теорема 1 (о приведении уравнений гипер- гиперквадрик n-мерного евклидова простран- пространства к каноническому виду). Для любоИ гиперквадрики п-мерного (п ^ 1) евклидова веще- вещественно-комплексного пространства существует система прямоугольных координат, в которой ее уравнение имеет либо вид (I) v?+ ••• +^=«. где 1<г<пй8 = 0 или 1, либо (что возможно толь- только при я > 1) вид (П). v?+ ••• где l^r^n—1, причем в обоих случаях ?ц =#= О, .... ...Л#0. ? Чтобы однозначно фиксировать коэффициенты %\, ..., Хг (которые, заметим, пропорциональны отличным от нуля корням соответствующего характеристического- многочлена, повторенным столько раз, какова их крат- кратность), следует прежде всего их разумным образом упо- упорядочить (т. е. соответствующим образом переставить координаты xi, ..., хп). Мы потребуем, чтобы сначала перечислялись положительные коэффициенты, а потом 34S
отрицательные. Кроме того, в каждой группе коэффи- коэффициентов мы расположим их по возрастанию абсолютных величин. Таким образом, если р, 0 ^р ^ г, — число по- положительных коэффициентов, то мы будем считать, что 0< A-i<A2< ... <ЛР и В случае (I) при е = 0 умножением на —1 мы мо- можем, кроме того, добиться, чтобы Этого же мы можем достичь и в случае (II), меняя, если нужно, знак координаты хг+\. Поэтому для едино- единообразия мы будем допускать в случае (I) значение е = = —1, достигая за счет этого выполнения условия A). Наконец, в случае (I) при е = 0 мы будем считать, что B) | Я,! | -j- ... +|А,Г|=1. Удовлетворяющие этим условиям уравнения (I) и (II) мы будем называть евклидово каноническими урав- уравнениями гиперквадрик. При п = 2 и п ¦= 3 мы, очевидно, получаем (с точ- точностью до обозначений) канонические уравнения линий второго порядка на плоскости и поверхностей второго порядка в трехмерном пространстве, перечисленные в лекциях 1.22 и 1.23. Приближая обозначения к использованным в первом семестре, мы будем евклидово канонические уравнения (I) записывать в следующем виде: 2 2 2 2 Х1 I | Хр Хр+\ Хг —^ -f ••• -г —г Г7~ ••• 7Г—е' а1 ар Ьх Ьг где а\ ^ ... ^ ар и Ь\^ ... ^ br. Две гиперквадрики евклидова пространства назы- называются евклидово эквивалентными, если существует ор- ортогональное преобразование пространства, переводящее одну из гиперквадрик в другую, или, что, очевидно, рав- равносильно, если существуют две системы прямоугольных координат, в которых гиперквадрики имеют одинаковые уравнения. 344
Ясно, что гиперквадрики с одинаковыми евклидово каноническими уравнениями евклидово эквивалентны. Осуществляя приведение уравнения гиперквадрики к ка- каноническому виду методом, использованным при дока- доказательстве теоремы 1 (т. е. методом лекций 13—13а, в котором вместо теоремы Лагранжа используется тео- теорема 2 лекции 21), мы, несмотря на имеющийся в нем произвол, все время будем, очевидно, получать одно и то же каноническое уравнение. Однако это, конечно, еще не доказывает, что координат, в которых получается другое каноническое уравнение, не существует, т. е. что две гиперквадрики с разными каноническими уравне- уравнениями не могут быть евклидово эквивалентны. Тем не менее это так: Теорема 2 (классификации). Две гиперквадрики п-мерного евклидова вещественно-комплексного прост- пространства тогда и только тогда евклидово эквива- эквивалентны, когда они имеют одинаковые канонические урав- уравнения. Как нужно доказывать эту теорему, мы знаем на при- примере линий второго порядка на плоскости (см. лек- лекцию 1.22). Метод состоит в том, чтобы независимо от координат геометрически охарактеризовать коэффициен- коэффициенты Х\, ..., Кг уравнений (I) и (II). При этом, поскольку аффинно не эквивалентные гиперквадрики никак не мо- могут быть евклидово эквивалентны, это достаточно сде- сделать отдельно для гиперквадрик каждого аффинного класса (эллипсоидов, гиперболоидов, конусов, парабо- параболоидов и цилиндров). Сначала мы рассмотрим аналогичную задачу для квадратичных функционалов или, что равносильно,— для симметрических операторов в евклидовом линейном пространстве. Впрочем, без каких-либо изменений в формулиров- формулировках и доказательствах мы можем считать пространство унитарным, а оператор эрмитовым. Итак, пусть У° — евклидово или унитарное линейное n-мерное пространство и пусть А— самосопряженный оператор Т-*-Т. Как мы знаем (см. предложение 1 лекции 21), все собственные значения (== характеристические корни) оператора А вещественны. Повторив каждое из них столько раз, какова его кратность (и получив их, сле- следовательно, ровно п), мы занумеруем эти собственные 345
значения в порядке убывания: (8) Я,>Л2> ... >-Я,„. Наша цель будет состоять в том, чтобы найти прямое «геометрическое» описание этих чисел. Пусть 0* — произвольное подпространство простран- пространства У и S = S({?) — его подмножество («единичная сфера»), состоящее из всех векторов х е ?Р, для которых (*,*)= 1. Так как для любого вектора x^S число (Аде, х) ве- вещественно (когда У евклидово, это имеет место само собой, а когда У унитарно, обеспечивается предложе- предложением 2 лекции 19), то определено число а (&>) = sup {(Ax, х); х<=&, (х, *)=1} (впрочем, вместо sup можно писать max, ибо сфера S({?) компактна). Предложение 1. Для любого q = 1, ..., п имеет ме- место равенство Xq = inf {a (^»); dim^ = n — q+ 1}, еде inf берется по всем подпространствам 9> cz.T раз- размерности п — q 4- 1 • Доказательство. Согласно теореме 1 лекции 21 в пространстве У существует такой ортонормированный базис е\, ..., еп, что Aeq = Xqeq для любого q—\, ..., п. Пусть !Pq = [e\, • • •, eq\ и пусть 9* — произвольное подпространство размерности п — q-\-\. Так как dim ^% + dim 0> = то, согласно теореме 1 лекции 1, !Pq П 9* ^= 0, т. е. суще- существует отличный от нуля вектор хе^,П^- Без ограни- ограничения общности мы можем считать, что (дс, дс)==1. Так как х е 0*, то а @) ^ (Аде, х), а так как x^&>q и, зна- значит, х = Х\в\ + ... + xqeq, то (Ах, х) = Таким образом, а(^))^Х<? для любого подпространства 0* размерности п — q -\- 1, и, значит, 346
С другой стороны, так как для любого вектора х =¦ = xqeq + • •. + хпеп подпространства ^«^ = [eq, ..,, еп] размерности п — q -\- 1 имеет место неравенство (Ах, ж) = А.а|* то и потому inf {а E*); dim^ = n —9+1ХЯ,. ? Доказанное свойство собственных значений самосо- самосопряженных операторов называется их минимаксным свойством. Пусть теперь е? — точечное евклидово пространство с ассоциированным линеалом У и пусть в ef выбрано начало отсчета О. Тогда для каждого невырожденного симметрического оператора А: У°—>¦ У уравнение D) (Лж,*)=1 будет определять в & невырожденную центральную ги- гиперквадрику с центром О (и уравнение любой невыро- невырожденной центральной гиперквадрики с центром О имеет вид D)). Пусть сначала (Ах, х) >> 0 при х ^ 0, т. е. пусть опе- оператор А положителен (и, значит, гиперквадрика D) яв- является действительным эллипсоидом). Тогда каждая прямая /, проходящая через центр О гиперквадрики D), будет пересекать эту гиперквадрику в двух симметрич- симметричных точках. Обозначив через d(l) половину расстояния между этими точками (т. е. расстояние каждой из них до центра О), мы для любой проходящей через О пло- плоскости П положим d (П) = inf {d (I); 1<=U}, где inf берется по всем прямым /, содержащимся в П. Заметим, что число d(H) определено геометрически инвариантно (без ссылок на какую-либо координатную систему). Если х — орт прямой / (направляющий вектор дли* ны 1), то, как легко видеть, 347
Для числа d(H) отсюда следует, что 1 где (Р — направляющее подпространство плоскости П. Поэтому, записав каноническое уравнение рассмат- рассматриваемого эллипсоида в виде О 2 E) *.+ ...+.?_,. где <6) ах > щ, > ... > ап > О, и учтя, что в силу условий C) и F) числа Xq и aq свя- связаны соотношениями 1 1 мы немедленно получим, что &ля полуосей aq эллипсои- эллипсоида E) имеет место формула G) а, — sup{J(II); dimn = ?-b 1}, где sup берется по всем q + 1-мерным плоскостям П, проходящим через центр эллипсоида. Это доказывает теорему 2 для эллипсоидов, посколь- поскольку для евклидово эквивалентных эллипсоидов правые части формул G) одни и те же. Чтобы доказать теорему 2 для мнимых эллипсоидов 2 2 (ОЛ _fi_ _1_ _1_ _f?L _ 1 (Щ д? + ... 4- ^ - 1, мы рассмотрим преобразование пространства Ж, пере- переводящее точку с радиус-вектором х в точку с радиус- вектором ix. Ясно, что это преобразование переводит эллипсоид (8) в эллипсоид E). Кроме того, оно пере- перестановочно с любым вещественным преобразованием Ж -> <о (записывающимся в вещественной координатной системе вещественной матрицей) и, в частности, с лю- любым ортогональным преобразованием. Поэтому, если два эллипсоида (8) евклидово эквивалентны, то соот- соответствующие эллипсоиды E) также евклидово эквива- эквивалентны. Это доказывает теорему 2 и для мнимых эл- эллипсоидов. 348
По аналогии со случаем п=1 (см. определение 3 лекции 1.20) мы будем называть неасимптотическое на- направление, задаваемое вектором х0 ^= 0, главным (по отношению к гиперквадрике D)), если сопряженная с ним диаметральная гиперплоскость ему перпендикуляр- перпендикулярна (и, значит, задается уравнением (дс0, х) — 0). Ввиду геометрической инвариантности понятия сопряженной диаметральной гиперплоскости (см. лекцию 136) поня- понятие главного направления также геометрически инва- инвариантно. Так как сопряженная диаметральная гиперплоскость задается уравнением (9) (Ах0, *) = 0 (см. формулу A0) лекции 136; в нашем случае а=0 и и — х0), то направление вектора хо?=О тогда и только тогда является главным, когда уравнение (9) равно- равносильно уравнению (хо, х) = 0, что, в силу теоремы един- единственности, для уравнений гиперплоскостей имеет место тогда и только тогда, когда существует такое число К, что Ахо = А,дсо, т. е. когда вектор х0 является собствен- собственным вектором оператора А. Таким образом, главные на- направления гиперквадрики — это в точности направления собственных векторов оператора А (его одномерные ин- инвариантные подпространства). - Отсюда следует, что если уравнения (Ах, дс) = 1 и (Зх, х) = 1 задают евклидово эквивалентные гиперквад- гиперквадрики, то собственные подпространства операторов А и В одни и те оке. Более того, так как главное направление, отвечаю- отвечающее собственному вектору х0, тогда и только тогда пере- пересекает гиперквадрику D) в вещественной точке, когда соответствующее собственное значение Я, положительно, то сумма всех собственных подпространств с положи- положительными собственными значениями также одна и та же для операторов А и В. Обозначив эту сумму симво- символом ^(+), а ее ортогональное дополнение символом ^(-\ мы, таким образом, получим, что разложение пространства У в прямую сумму пространств ^(+> и ^)(~) геометрически инвариантно. Поэтому геометрически инвариантны плоскости П(+) и Ш пространства &", проходящие через центр гипер- гиперквадрики D) параллельно подпространствам ^+) и {?<--\ 349
а значит, и пересечения этих плоскостей с гиперквадри- гиперквадрикой. В канонической системе координат (в которой ги- гиперквадрика D) имеет уравнение 2 2 2 2 ХР Хр+\ Х *1 I | ХР Хр+\ ХП « 2 Г" • • • 1 о" ~~ . 2 ' * * .2 ' «1 ар Ь\ Ьп-р где ai ^г ... Г$г ар и 6i Г$г ... ^ 6Я_Р) плоскость П(+) задается уравнениями xp+i = 0, ..., хп = 0, а пло- плоскость П<-) — уравнениями jci == 0, ..., хР = 0. Следова- Следовательно, пересечение гиперквадрики с плоскостью П<+> является эллипсоидом а 4 4++4 аХ ар а пересечение с плоскостью Ш-* — мнимым эллипсоидом °1 "п-р Поскольку для евклидово эквивалентных гиперквадрик D) эллипсоиды A0) и A1)—в силу геометрической инвариантности их конструкции — также евклидово эквивалентны, из справедливости уже доказанной тео- теоремы 2 для эллипсоидов теперь вытекает, что эта тео- теорема справедлива и для гиперболоидов. Каждый конус A2) (Ах, *) = 0 является асимптотическим конусом каждой гиперквад- гиперквадрики вида A3) (Ах, х) = с, где с е R, и, обратно, каждая гиперквадрика с асимптотическим конусом A2) имеет вид A3). Поэтому, если конус A2) евклидово эквивалентен конусу A4) (Вх, *) = 0, то гиперквадрика A3) евклидово эквивалентна квадри- квадрике вида (Вх, х) = с, (где, вообще говоря, с\фс). Поэтому, в силу уже до- доказанного, канонические уравнения конусов A2) и A3) 350
должны быть пропорциональны и, значит, — в силу нор- нормировки"^)—должны совпадать. Тем самым теорема 2 доказана для всех централь- центральных гиперквадрик. Поскольку цилиндры (одной и той же кратности k) тогда и только тогда евклидово эквивалентны, когда евклидово эквивалентны их сечения плоскостью, пер- перпендикулярной оси, отсюда следует, что теорема 2 спра- справедлива и для цилиндров над центральными гиперквад- гиперквадриками, т. е. для всех гиперквадрик типа (I). По аналогичным соображениям теорему 2 для ги- гиперквадрик типа (II) достаточно доказать только для параболоидов (т. е. при г—п—1). Но если два пара- параболоида A5) V?+ ... +Vi*iUie2*. и A6) ^f+ ... + «*„_,*?-,-2х„ евклидово эквивалентны, то евклидово эквивалентны и их асимптотические (обобщенные) конусы и Следовательно, по уже доказанному существует та- такое число с =ФО, что Но ортогональное преобразование, переводящее пара- параболоид A5) в параболоид A6), должно переводить ось Охп асимптотических конусов в себя и, значит, не долж- должно менять координаты х„. Поэтому с '= 1. Тем самым теорема 2 полностью доказана. ?
Лекция 22 Изометрические операторы. — Унитарные матрицы. — Теорема о полярном разложении. — Нормальные опера- операторы в унитарном пространстве. — Ортогональная диа- гонализируемость унитарных операторов. — Связность групп GL(n; С) и U(n). Положительные операторы являются аналогами по- положительных вещественных чисел. . Рассмотрим теперь операторы, являющиеся аналогами комплексных чисел, модуль которых равен единице. Предложение 1. Следующие свойства линейного опе- оператора А в евклидовом или унитарном пространстве У равносильны: а) Для любых двух векторов х, у ^У имеет место равенство (Ах, Ау) = (х, у). б) Для любого вектора х^У имеет место равенство в) Для любого пронормированного базиса е\, ... ..., еп пространства У векторы Аеи ..., Аеп также со- составляют ортонормированный базис этого пространства. г) Для элементов а\ матрицы оператора А в произ- произвольном ортонормированием базисе еи...,еп про- пространства У имеют место соотношения A) если пространство У евклидово, и соотношения п B) Y* а\Щ — Ъ ц, i, 7=1, .... п, если пространство У унитарно. д) Имеет место равенство е) Оператор А обратим, и 352
ж) Имеет место равенство з) Для элементов а{ матрицы оператора А в извольном ортонормированном базисе eit ,.., еп про* странства У имеют место соотношения п C) если пространство У евклидово, и соотношения п D) }]а;[а[ = б(/, /, j = 1, ..., п, ft^* 1 если пространство У унитарно. Доказательство. Мы докажем, что имеют ме- место следующие импликации: Импликация а)=>-б). Достаточно положить у = х. Импликация а)=>-в). Так как (Aeit Ле/) = (ег, е,), то (Аег-, Aei)==6ij, если (ег, et) = 6tJ. Импликация б)=>-д). Если | Лле | = | х |, то ((Л*Л — Е) х, х) = (А*Аж, ж) — (ж, ж) = (Ах, Ах) — (х, х) = — | Ах р — | х |2 = 0, и, следовательно, А*Л = Е (в евкли- евклидовом пространстве У — потому, что оператор А*А — Е симметричен, а в унитарном пространстве У — по пред- предложению 1 лекции 19). Эквивалентность в)^=^г). По определению Aet — a[er Поэтому (Лв., Ae,)= в евклидовом пространстве и (Аег, 2 в унитарном пространстве. Следовательно, в) => г) и г)»*-в). 12 М. М. Постников, сем, II -~ 353
Эквивалентность а)-*=Ф-д). По определению (А*Ах, у) = (Ах, Ау). Поэтому а)=>д) и д)=>а) (ибо для некоторого оператора С и любых векторов х и у тогда и только тогда имеет место равенство (Сх, у) = = (х,у), когда С = Е). Эквивалентности г)-<=>-д) и ж)-ф=>з). Опера- Оператор А* имеет в базисе е\, ..., е„ матрицу |а{|. Следо- Следовательно, элементами матрицы оператора АА* являются суммы ]?а1кй{, а элементами матрицы оператора А*А — k суммы ^а\Щ. Поэтому г)-*=>-д) и ж)-*=>-з). Импликации д) => е) и ж) => е). См. импликации 1° => 5° и 3° =>- 5° предложения 2 лекции 15. Импликации е)=Ф-д) ие)=»-ж). Имеют место по определению. П Операторы, обладающие свойством а), а потому и всеми свойствами а)—з), называются изометрическими. В евклидовом пространстве У изометрические операторы называются также ортогональными, а в унитарном — унитарными. (Для евклидова пространства У эта тер- терминология нам уже знакома; см. лекцию 15.) Вещественные матрицы, обладающие свойствами A) или C), — это в точности ортогональные матрицы. По аналогии матрицы с комплексными коэффициентами, обладающие свойствами B) и D), называются унитар- ными -матрицами. Для них имеет место следующий ана- аналог предложения 3 лекции I. 13 (символом Лт мы обо- обозначаем транспонированную матрицу, все элементы ко- которой заменены комплексно сопряженными числами): Предложение 2. Матрица А = | а\ | порядка п с комп~ лексными коэффициентами тогда и только тогда уни- унитарна, когда она обладает, одним (а потому и каждым) из следующих равносильных свойств: а) матрица А является матрицей перехода, связи' вающей два о ртонор миро ванных базиса п-мерного уни- унитарного пространства; б) столбцы матрицы А составляют ортонормирован* ное семейство векторов унитарного пространства С"; в) имеет место равенство V А = Е; г) матрица А обратима, и 354
д) имеет место равенство АА1 =Е; е) строки матрицы А составляют ортоноржирован* ное семейство векторов унитарного пространства Сп. Доказательство. Введем в рассмотрение линей- линейный оператор А, имеющий в некотором ортонормирован- ном базисе матрицу А. Тогда свойства а)—е) перейдут в свойства в)—з) оператора А из предложения 1. ? Так как det Лт —det Л, то из свойств в) и д) сле- следует, что [ det А | = 1 для любой унитарной матрицы А. Очевидно, что все унитарные матрицы порядка п образуют группу. Эта группа называется унитарной группой и обозначается символом U(n). Ее подгруппа, состоящая из унимодулярных (det/l = l) матриц, обо- обозначается символом SU(n). Предложение 3. Любой обратимый оператор А в ев' клидовом или унитарном пространстве единственным образом разлагается в производстве изометрического оператора U и положительного оператора 3: E) А = UB. Доказательство. Так как оператор А*А поло- положителен, то существует положительный квадратный ко- корень Пусть U = AB~\ Тогда 1Г = C*)~1 А' = 3'Ат (ибо опе- оператор 3 самосопряжен), и потому U*U — 3~]А*АЗ~1 = = 3~]32B~l — E. Таким образом, A—U3, где опера- оператор U изометричен, а оператор 3 положителен. Если UB=VC, где U, V — изометрические опера- операторы, а 3 и С — положительные, то 3U* = CV*, и потому в2 = ви'из = cvvc = с2. Следовательно (положительный квадратный корень из- извлекается однозначно), 3 = С, и, значит, U=V. Этим доказано, что разложение G) единственно. П 12* 355
Разложение E) называется полярным разложением оператора А. Оно аналогично разложению ге"Р = = г {cos ф + i sin ф) произвольного комплексного числа в произведение его модуля г и числа е"Р, равного по модулю единице. Для матриц над полем R предложение 3 утверждает, что любая невырожденная матрица А может быть разложена в произведение UB, где V — ортогональная матрица, а В — матрица (в ортонормированном базисе) некоторого положительного и, значит, ортогонально диа- гонализируемого оператора В. С другой стороны, утвер- утверждение, что оператор В ортогонально диагон-ализируем, означает, что B=VDV~l, где V — ортогональная мат- матрица, a D — диагональная матрица с положительны- положительными— ввиду положительности оператора В — диагональ- диагональными элементами. При этом легко видеть, что матрицу V мы всегда можем выбрать собственной (переставив, если нужно, диагональные элементы матрицы D). Та- Таким образом, мы видим, что любая невырожденная ее* щественная матрица А допускает разложение вида F) A=UVDV~\ где U и V — ортогональные матрицы {причем det V = 1), a D — диагональная матрица с положительными диаго- диагональными элементами. С точностью до обозначений — это лемма 2 из лек- лекции 126. Конечно, разложения вида F) — с заменой ортого- ортогональных матриц на унитарные — имеют место и для матриц над полем С. В унитарном пространстве — в отличие от евклидова пространства — самосопряженные (эрмитовы) операто- операторы составляют только часть всех ортогонально диагона- лизируемых операторов, поскольку у эрмитовой матрицы все диагональные элементы должны быть вещественны. Поэтому оператор, имеющий в некотором ортонормиро- ортонормированном базисе диагональную матрицу, хотя бы один элемент которой невеществен, ортогонально диагонали- зируем, но не эрмитов. Определение 1. Оператор А в унитарном (или евкли- евклидовом) пространстве называется нормальным, если он перестановочен с сопряженным оператором А*. Напомним (см. лекцию 20), что в унитарном про- 356
странстве любой оператор А однозначно представляется в виде А = В + iC, где В и С — эрмитовы операторы. Предложение 4. Оператор А = В -{- iC в унитарном пространстве тогда и только тогда нормален, когда опе- операторы В и С перестановочны (ВС = СВ). Доказательство. Так как А* = В' + (iC)* = В* — iC* = В — iC, то АА* = (В + /С) (В — 1С) = В2 + С2 + «' (СВ — ВС) и AVL = (В — *С) (В + iC) = B2+C2—i (CB — ВС). Следовательно, АА* = А*А тогда и только тогда, когда С В — ВС = 0. D Заметим, что для нормального оператора А опера- оператор АА* = А*А выражается формулой аналогичной формуле для квадрата модуля комплексно- комплексного числа. Если оператор А в некотором ортонормированием базисе имеет диагональную матрицу А, то сопряженный оператор в том же базисе будет иметь комплексно со- сопряженную и транспонированную, а потому также диа- диагональную, матрицу. Поскольку любые две диагональные матрицы коммутируют, операторы А и А* также ком- коммутируют. Этим доказано, что в унитарном пространстве любой ортогонально диагонализируемый оператор нор' жален. Наша ближайшая цель будет состоять в доказатель- доказательстве обратного утверждения. Для этого мы попробуем перенести на случай нормальных операторов предложе- предложения 1—4 лекции 21. Предложение 1 лекции 21 на нормальные операторы непосредственно, конечно, не обобщается, поскольку собственные значения (= характеристические корни) нормального оператора могут быть любыми комплекс- комплексными числами. Его аналогом для нормальных операто- операторов является следующее предложение, из которого, кста- кстати сказать, предложение 1 лекции 21 для унитарных пространств непосредственно вытекает: 357
Предложение 5. Любой собственный вектор нормаль* ного оператора А, принадлежащий собственному значе- нию "К, будет собственным вектором сопряженного опе- оператора А*, принадлежащим собственному значению А.. Доказательство. Если оператор А нормален, то для любого вектора х (Ах, Ах) = (А'Ах, х) = (АА'х, х) = (А*х, А*х), т. е. Поскольку вместе с оператором А нормален и каждый оператор вида А — ХЕ, отсюда следует (так как (А — %Е) * = А* — %Е), что для любого К | (А — КЕ) х | = | (А* — ХЕ) х |. Поэтому, если (А — М?)ж = 0, то (А* — КЕ) х = 0. О Предложение 2 лекции 21 сохраняется для нормаль- нормальных операторов полностью: Предложение 6. Любые два собственных вектора х и у нормального оператора А, принадлежащие различ* ным собственным значениям % и ц, ортогональны. Доказательство. Если Ах = Хх, то (Ах,у) = — А, (ж, у). Аналогично, если Ay = \iy и, значит, согласно предложению 5, А"у = \iy, то \х, А*у) = (х, \iy) — р. (де, у). Следовательно, %{х, у) = (Ах, у) = (х, A'y) = \i(x, у), и потому {х, у) = 0 (ибо, по условию, Я Ф ц). О Напротив, предложение 3 лекции 21 для нормальных операторов, вообще говоря, неверно: существуют нор- нормальные операторы, имеющие инвариантные подпро- подпространства с неинвариантным ортогональным дополне- дополнением (постройте пример!). Однако для собственных подпространств оно оказывается верным: Предложение 7. Ортогональное дополнение !?% про- произвольного собственного подпространства SP^ нормаль- нормального оператора А инвариантно относительно А. Доказательство. Если х е !??, то (х, у) — 0 для любого вектора у е $РК. Поэтому (Ах, у) — (х, А*у) = = {х, Ху) — Х(х, у) = 0, ибо, согласно предложению 5, А*у — ку. Следовательно, Аже^ь п Как уже было замечено в лекции 21, только это свой- свойство оператора Л необходимо в доказательстве предло- предложения 4 лекции 21. Поэтому это предложение сохраняет силу для любого нормального оператора, что, ввиду 358
предложения 7 обеспечивает его ортогональную диаго- нализируемость. Тем самым нами доказана следующая теорема: Теорема 1. Линейный оператор в унитарном про- пространстве тогда и только тогда ортогонально диагона- лизируем, когда он нормален. ? Эта теорема позволяет редуцировать свойства нор- нормального оператора к свойствам его спектра. Напри- Например, теперь очевидно, что нормальный оператор А в уни- унитарном пространстве тогда и только тогда а) эрмитов, б) обратим, в) идемпотентен, когда его собственные значения соответственно а') вещественны, б ) отличны от нуля, в') равны нулю или единице. Заметим, что импликации а)=^а'), б) =^б') и в) =>в') имеют место для любых линейных операторов. Однако обратные — самые интересные — импликации имеют место только для нормальных операторов (по- (постройте соответствующие примеры!). Конечно, аналогичные утверждения о равносильно- равносильности свойств имеют место и для симметрических опера- операторов в евклидовом пространстве. Поскольку каждый унитарный оператор, очевидно, нормален (так как U*U = E и UU*=E, то U*U = = UU*), из теоремы 2, в частности, следует, что ка- каждый унитарный оператор U ортогонально диагонали- зируем. При этом легко видеть, что спектр произвольного унитарного оператора U расположен в плоскости ком- комплексного переменного на единичной окружности, т. е. модуль любого характеристического корня Я унитаоного оператора равен единице: |Я.| = 1. Действительно, над полем С каждый характеристи- характеристический корень Я оператора U является собственным зна- значением, т. е. существует такой вектор х0 ^ф О, что Uxq ==• = Кхр. Поэтому (*о, *о) = (Uxo, Ux0) = (Хх0, Яж0) = = Мь{хо, Xq), и, значит, ХЯ = 1. ? Поскольку |Я]=1 тогда и только тогда, когда К = тем самым доказана следующая теорема: 35»
Теорема 2. Для каждого унитарного оператора V су* ществует ортоноржированный базис, в котором матрица этого оператора является диагональной матрицей вида ** О G) О Для унитарных матриц это означает, что каждая унитарная матрица U допускает представление вида U V~lDV, где V—унитарная матрица, a D рица вида G). ¦диагональная мат- Применив этот результат к матрице U из. разложе- разложения F), написанного для невырожденной комплексной матрицы С, и обозначив матрицы D и V из этого раз- разложения символами В и U, мы немедленно получим, что каждая невырожденная комплексная матрица С допу- допускает представление вида (8) C=V~lDVUBU~\ где U и V — унитарные матрицы, D — диагональная матрица G), а В — диагональная матрица О о с положительными элементами Ь\, ..., Ьп. Отсюда следует, что в отличие от аналогичной груп- группы над полем R группа GL(n;C) комплексных невы- невырожденных матриц связна. Действительно, для любой матрицы (8) формула (9) C(t) = V~lD(t)VUB(t)U~\ где B(t) и D(t)—диагональные матрицы с диагональ- диагональными элементами A — Q + A — 0 + 360
соответственно, определяет в группе GL(n;C) путь tt-^C(t), О <: t ^ 1, соединяющий матрицу Е с матри- матрицей С. О Если матрица С унитарна (и потому В = Е), то все матрицы (9) также унитарны. Следовательно, группа U (л) также связна. Связными группами являются и группы унимодуляр- ных матриц SL(n;C) и SU(n). (Для доказательства до- достаточно разделить каждую матрицу (9) на ее опреде- определитель.) Связность групп GL(n;C) и U (л) объясняет, по- почему над полем .СХ нет понятия ориентации.
Лекция 23 Комплексификация евклидова пространства. — Нормаль- Нормальные операторы в евклидовом пространстве. — Приведе- Приведение к нормальному виду ортогональных операторов. — Аффинные и ортогональные преобразования. — Парал- Параллельные переносы и центроаффинные преобразования. — Вращения и несобственные вращения. Для исследования нормальных операторов в евкли* довом пространстве мы применим прием комплексифи- кации. Пусть У—евклидово пространство и Ус — его ком- комплексификация (как линейного пространства над R). По определению Ус является линейным пространством над .С., состоящим из векторов вида z = x + iy, где х, у*~У. В частности, Ж ci Ус (как подпространство над R). Предложение 1. На пространстве Ус существует единственное скалярное умножение, продолжающее ска- скалярное умножение на У (т. е. совпадающее с ним на векторах из У). Это предложение означает, что комплексификация Ус евклидова пространства У естественным образом является унитарным пространством. Подчеркнем, что в то время как скалярное умноже- умножение на У билинейно и симметрично, продолжающее его скалярное умножение на Ус полуторалинейно и эрми- эрмитово. Доказательство предложения 1. Если ска- скалярное умножение на У° продолжает скалярное умно- умножение на У, то для любых векторов с = а + ib и г = = х + iy пространства Ус будет иметь место равенства (с, г) = (а-+ ». х + iy) = = {а, х) + (ib, x) + (a, iy) + (ib, iy) = = (а, х) + i (b, x) - i (а, г,) + ф, у)г т. е. равенство A) (с, г) = [(а, х) + (Ъ, у)] + * [(Ь, х) — (а, у)). Это доказывает единственность скалярного умножения на TG. 362
Чтобы доказать его существование, мы примем фор- формулу A) за определение произведения (с, г). Тогда в первую очередь нужно проверить, что тем самым мы действительно получаем на Ус скалярное умножение, т. е. что функционал А: с, zt—^(c,z) полуторалинеен, эр- эрмитов и положительно определен. Но в отношении сло- сложения и умножения на вещественные числа линейность функционала А сомнений не вызывает. С другой сто- стороны, так как ic = —Ь -f- ia и iz = —у -f- ix, то (ic, z) = [(- b, x) + {a, y)] + / [(a, x) - (- b, y)] = = - Kb, x) - (a, y)\ + i [(a, x) + F, y)] = i(c, г) и (с, iz) = [(a, —y)-\- (b, x)] + i [(Ь, -у)- {a, x)] = = [(b, x) - (a, y)] - i [(a, x) + (b, y)] = - i(c, z). Следовательно, функционал А полуторалинеен. Кроме того, так как (г, с) = [(х, а) + (У, Ь)] + i [(у, а) - (х, Ъ)\ = = [(а, х) + (Ь, у)] - i [(b, x) - (а, у)] = (с, z) тл (с, c) = (a, a) + (&, 6) = |ар + |&|2, то функционал А эрмитов и положительно определен. Наконец, так как (с, z) = (а, х) при 6 = 0 и у = 0^ то скалярное умножение A) продолжает скалярное умножение, заданное на У. П Из формулы A) следует, что для любого линейнога оператора А-.У-^-У3 операторы А° (х + iy) = Ах + iAy и А*° (х + iy) = А*х + iA'y удовлетворяют соотношению (ЛСС, *) = [{Аа, х) + (АЬ, у)] + / [(АЬ, х) - (Аа, у)} = = [(a, A*x) + (b, A*y)] + i [(Ь, А*х) — (а, А*у)] = = (с, A*cz), показывающему, что {А^У = {AT.
Поэтому, если оператор А нормален, то оператор А° также нормален: СУ Лс = (А')с Ас = (А* Л)с = Поскольку, согласно теореме 1 лекции 22, нормаль- нормальные операторы в унитарном пространстве ортогонально диагонализируемы, отсюда следует, что каждый нормаль- нормальный оператор А: У-*-У удовлетворяет условиям теоре- теоремы 2 лекции 18. Следовательно, согласно этой теоре- теореме, в пространстве У существует, базис е\, ..., еп,в ко- котором матрица оператора А является прямой суммой матриц первого порядка \\Xi\\ и матриц второго порядка I а/ Ч 1-р/ «/Г где kt—вещественные характеристические корни опера- оператора А, а а/ и Р/ — вещественные и мнимые части его невещественных характеристических корней. Согласно описанной в лекции 18 конструкции базис е\, ¦¦•¦> еп пространства У получается из такого базиса ее, ..., е^ пространства Ус, что а) каждый вектор е^ является собственным векто- вектором оператора Ас, б) если %\, ..., Кг — все вещественные, а — все невещественные и попарно комплексно несопря- несопряженные характеристические корни оператора А (соб- (собственные значения оператора Ас), каждый из которых повторен столько раз, какова его кратность (так что г + 2s = п), то 1) при 1 ^ q ^ r вектор е^ веществен и принадле- принадлежит собственному значению %q; 2) при r+ls^gs^r-f-s вектор е^ невеществен и принадлежит собственному значению Хд; 3) при r-\-s-\-l^.q^n вектор е^ комплексно со- сопряжен с вектором e~_s и принадлежит собственному значению Я<7_5. При этом ^, если </= 1, .... г; B) «, = {Ree?+m, если ? = r + ( Im e^+m, если q == г + 2m, где m= 1, • • •» s. 364
Поскольку же оператор АР диагонализируем ортси- гонально, мы, кроме того, можем считать, что базис. ., е% ортонормирован: „с '1 U если p = q, ), если рФя, откуда в силу формул A) и B) вытекает, что (ер> вд) —0 при рфд и , ер) = 1, если р=1, ..., г, 1 > = г+ 1, ..., п ~2 , если (проделайте аккуратно соответствующее вычисление!). Следовательно, умножив все векторы er+i, ..., еп на -\/2 » мы получим ортонормированныи базис. Так как матрица оператора А при этой операции, как легко ви- видеть, не меняется, то тем самым нами доказана сле- следующая теорема: Теорема 1. Для любого нормального оператора А в п-мерном евклидовом пространстве У существует орто- ортонормированныи базис, в котором матрица этого опера- оператора имеет вид C) О pi а, 1 О \ Ря | ! — ря а, • е<Эе г + 2s = п. П Эта теорема, в частности, применима к произволь- произвольному ортогональному оператору А (ясно, что каждый ортонормальный оператор нормален). При этом, так как для ортогонального оператора А оператор Ас, очевидно, унитарен: {АСУ Ас = (А*)с Ас = {А*А)С = ЕС = Е, 365»
то все характеристические корни Я, ортогонального опе- оператора А (являющиеся одновременно собственными значениями унитарного оператора Ас) расположены в комплексной плоскости на единичной окружности I А, 1= 1. Для матрицы C) отсюда следует, что все числа К\, ... ..., Кг равны ±1, а числа aq, $q обладают тем свой- свойством, что а^ + Р^=1» и, значит, могут быть пред- представлены в виде где 0 < ф„ < я. Поскольку матрицы 1 0 || 11—1 О .0 1|| И I 0-1 также имеют вид /д\ I C0S Ф S'n Ф \ ' (I — sin ф cos ф (при Ф = 0 и ф = я соответственно), мы получаем, сле- следовательно, что для ортогонального оператора матрицу C) можно считать прямой суммой матриц второго по- порядка вида D) с 0^ф<я и при п нечетном матрицы первого порядка dzl, а при п четном и detA=-—1 — матрицы 1 0 || о —1 г Этим доказана следующая теорема: Теорема 2. Для любого ортогонального оператора А в п-мерном евклидовом пространстве У существует ор- тонормированный базис, в котором его матрица при п = 2m -f- 1 имеет вид 8 COS ф! 31П ф! ¦•-г • [ COS ф2 Sin ф2 { 1 — sin фг cos фг j Sin ф1 COS ф1 f Q E) 0 cos фт sin Sin фт cos 366
е = ± 1, а при п = 1т — либо вид О j cos Ф1 sin ф1 ! — sin ф1 cos ф2 sin ф2 s — sin фг cos ф2 i F) О ' ! cos фт sin фт | ] — sin фт cos фт | I cos ф1 sin ф! I | — Sin ф1 COS ф! I либо вид i Ф1 sin Ф1 I | COS фт-1 Sin фт-1 ] л = — sin фпг-i СО5фт_1| ! !i 61 •о -и G) Определитель матрицы E) равен е, определитель матрицы F) положителен (равен 1), а определитель матрицы G) отрицателен (равен —1). Заметим, что для псевдоортогональных операторов аналогичная теорема имеет существенно более слож- сложный вид (клеток размера 2X2 уже недостаточно, и нужны клетки размера 4X4). Напомним (см. лекцию 1.25), что аффинным преоб- преобразованием аффинного пространства si- называется его произвольный автоморфизм, т. е. преобразование, дей- действующее по равенству координат в двух аффинных ко- координатных системах. Если в пространстве s&> выбрана начальная точка О, то произвольное аффинное преобра- преобразование точку с радиус-вектором х будет переводить а точку с радиус-вектором вида (8) у = Ах-УЬ, где А — некоторый обратимый линейный оператор на ас- ассоциированном линеале У, а Ь — фиксированный вектор (это лишь иная запись формулы B) лекции 1.25). 367
Аналогично, ортогональным преобразованием точеч- точечного евклидова пространства & называется его преобра- преобразование, действующее по равенству координат в двух евклидовых (прямоугольных) координатных системах. Оно записывается той же формулой (8), но уже с орто- ортогональным оператором А. Аффинные пространства над полем С, в ассоцииро- ассоциированный линеал которых введена структура унитарного линейного пространства, называются унитарными то- точечными пространствами. Автоморфизмами таких про- пространств являются унитарные преобразования, за- записывающиеся формулой (8) с унитарным операто- оператором А. Поскольку любое евклидово (или унитарное) точеч- точечное пространство является одновременно аффинным, имеет смысл говорить о его аффинных преобразованиях (8). Полярному разложению A=UB оператора А будет отвечать при этом разложении аффинного преобразова- преобразования (8) в композицию аффинного преобразования (9) у и ортогонального (или унитарного) преобразования В прямоугольных координатах, выбранных соответ- соответствующим образом, преобразование (9) записывается формулами У п. ==^'пхп> где %i > О, ..., An > О, и представляет собой компози- композицию п сжатий к п взаимно перпендикулярным ги- гиперплоскостям. Этим доказано следующее предложе- предложение: Предложение 2. Каждое аффинное преобразование п-мерного евклидова {унитарного) точечного простран' ства является композицией ортогонального (унитарно' го) преобразования и п сжатий к п взаимно перпенди- перпендикулярным гиперплоскостям. ? При п = 2 это утверждение составляет содержание предложения 1 лекции 1.25 368
При А = Е преобразование (8) имеет вид и называется параллельным переносом на вектор Ъ. При 6 = 0 преобразование (8) имеет вид и называется центроаффинным преобразованием. Оно оставляет на месте точку О, которая называется его центром. Любое аффинное преобразование является ком- композицией параллельного переноса и некоторого центро- аффинного преобразования. Подчеркнем, что преобразование (8) с 6#0 вполне может быть центроаффинным преобразованием (с цент- центром, отличным от О). Для этого необходимо и достаточ- достаточно, чтобы существовал вектор х0 (радиус-вектор цент- центра) , удовлетворяющий соотношению хо = Ахо + Ь, т. е. такой, что (А — Е)хо = Ь. В частности, так обяза- обязательно будет, если оператор А — Е обратим, т. е. если число 1 не является собственным значением операто- оператора А. Ортогональное преобразование (8) называется соб- собственным, если матрица оператора Л (в некотором, а потому и в любом) ортонормированием базисе имеет положительный определитель (и, следовательно, унимо- дулярна). Собственные ортогональные преобразования называются также движениями. Движение, оставляющее на месте точку О (т. е. являющееся центроаффинным преобразованием), называется вращением. Каждое вращение Q оставляет на месте все точки некоторой плоскости, проходящей через точку О. Наи- Наибольшая такая плоскость (имеющая максимальную раз- размерность) называется осью вращения. Размерность оси — для нетождественного вращения — может прини- принимать любое значение от нуля до п — 2 (осью размерно- размерности 0 является точка О, а случай оси размерности п — I невозможен). Плоскость П, перпендикулярную оси, вращение Q переводит в себя и индуцирует в ней снова вращение. Допуская вольность, принято говорить, что Q яв- является вращением в плоскости П. 13 М. М. Постников, сем, II 369
В частности, если dim П = 2 и евклидова коорди- координатная система Ое\въ ... е„ выбрана так, что векторы в\ и е2 параллельны плоскости П (а значит, осталь- остальные векторы ез, ..., еп параллельны оси вращения Q), то вращение Q будет задаваться матрицей вида | cos ф — sin ф { | sin ф cos ф [ 1 Отсюда следует, что теорема 2 — применительно к вращениям — сводится к утверждению, что каждое вра- вращение точечного евклидова пространства является ком- композицией вращений в попарно ортогональных двумерных плоскостях. Если число этих плоскостей равно т, то размерность оси вращения равна п—2/я, где п — размерность про- пространства. Поэтому в нечетномерном пространстве лю- любое вращение обладает осью положительной размер- размерности. Что касается несобственных ортогональных преоб- преобразований, оставляющих на месте точку О (такие пре- преобразования называются иногда несобственными ера- щениями), то о них теорема 2 утверждает, что каждое такое преобразование является композицией вращения, обладающего осью положительной размерности, и сим- симметрии относительно гиперплоскости, перпендикулярной прямой, содержащейся в оси. Это описание вращений и несобственных вращений позволяет перенести на случай пространств произволь- произвольной размерности практически все результаты, получен- полученные в первом семестре для ортогональных преобразова- преобразований плоскости и трехмерного пространства. Например, так как вращение, имеющее нульмерную ось (точнее, соответствующий ортогональный оператор ассоциированного линеала), не имеет собственных зна- значений, равных 1, то его композиция с произвольным па- параллельным переносом снова является вращением (но с другим центром). Для вращения с осью положитель- положительной размерности отсюда следует, что его композиция с 370
параллельным переносом будет вращением, если вектор переноса ортогонален оси вращения. Называя винтовым движением композицию некоторого вращения и парал- параллельного переноса на вектор, параллельный оси вра- вращения, ' мы тем самым немедленно получаем, что ка- каждое движение евклидова пространства является вин- винтовым (при п =2 — это предложение 2 лекции Т.25, а при п = 3 — предложение 3 лекции 1.26). Дальнейшие результаты в этом направлении мы оставим инициативе читателя. 13*
Лекция 24 Спиноры и спинтензоры. — Спинорная модель геометрии Минковского. — Гомоморфизм SL B; С) -> О? (I, 3). — Спинорная модель трехмерной геометрии Евклида. — Кватернионы. — Гомоморфизм SU B) -+¦ SO C). — Дока- Доказательство предложения I.— Гомоморфизм SLB;R)->- ->О*A, 2). Прием комплексификации не является единственным способом применять комплексные числа к изучению ве- вещественных объектов. Другой очень важный и интерес- интересный метод мы рассмотрим в этой лекции на конкретном примере так называемых спиноров, введенных в науку первоначально физиками и до сих пор играющих в ряде вопросов математической физики основополагающую роль. За недостатком места и времени мы ограничимся изложением спинорной техники лишь на простейших примерах пространства Минковского и трехмерного про- пространства Евклида. Пусть Ж— линейное пространство Минковского (псевдоевклидово пространство типа A, 3)). Выбрав в Ж произвольный псевдоортонормированный базис е0, е\, е2, е3, мы сопоставим каждому вектору х = х°а0 -f- xxev + х2е2 -f- пространства Ж эрмитову матрицу В соответствии с обшей системой обозначений, вве- введенной в лекции 18, элементы этой матрицы не будем обозначать символами жаР, где а, р =0, 1 и *00 = х0 + дЗ ^10 в х\ _ 1х2г 42) ' л01 = xl+ ix2, хп =х° — х3. Числа B) называются спинорными компонентами вектора х. 372
Замечание 1. В физической литературе спинорные компоненты обозначаются обычно символами вида хлв, хлв' или хАВ. На инвариантном бескоординатном языке переход к спинорным компонентам означает, что векторы про- пространства Ж мы отождествляем с эрмитовыми функцио- функционалами на некотором вспомогательном двумерном ком- комплексном пространстве Ж. Векторы пространства Ж называются спинорами, а тензоры (обобщенные) на нем — спинтензорами. Отождествление векторов пространства Ж (тензоров вида х1) со спинтензорами вида ха& (подчиненными условию эрмитовости) распространяется по мультипли- мультипликативности на любые тензоры (например, тензоры Ь11 отождествляются с некоторыми спинтензорами вида /)*5, тензоры вида а)— с некоторыми спинтензорами вида аа? и т. п.). Это вложение пространства тензоров в пространство спинтензоров увеличивает силу и гиб- гибкость тензорного исчисления, позволяя использовать для исследования тензоров произвольные спинтензоры, не являющиеся, вообще говоря, образами тензоров про- пространства Ж. Конечно, чтобы эта процедура имела смысл, необ- необходимо, чтобы она не зависела от выбора базисов, т. е. была согласована с правилами преобразований тензоров и спинтензоров. Мы проверим эту согласованность — ко- которая, кстати сказать, имеет место отнюдь не в пол- полном объеме, — заново начав все построение с простран- пространства Ж. Итак, пусть Ж— произвольное двумерное линейное пространство над полем С комплексных чисел и пусть Ж {Ж)—множество всех эрмитовых функционалов на пространстве Ж. В отличие от предыдущих лекций мы будем использовать для обозначения элементов про- пространства Ж {Ж) строчные греческие буквы. Так как в произвольном базисе е0, е\ пространства Ж каждый функционал | из Ж {Ж) задается эрмитовой матрицей A) и так как для любой такой матрицы имеет место равенство X = х°о0 + ххах + х2а2 -+- х3о3, 373
где C) -,=1? J| I || __ || 0 — / II | 1 О ¦—так называемые матрицы Паули (они были введены известным немецким физиком Паули в его теории спина электрона), то а) множество Ж(Ж) всех эрмитовых функционалов на пространстве Ж является четырехмерным линейным пространством над полем R вещественных чисел; б) каждый базис е0, в\ пространства Ж определяет базис D) о0, О\, &г> °з пространства Ж (Ж), состоящий из функционалов, имею- имеющих в базисе е0, е\ матрицы C). Мы будем называть базис D) базисом Паули про- пространства Ж {Ж), отвечающим данному базису е0, в\ пространства Ж. Поскольку определитель det X матрицы A) выра- выражается, как легко видеть, формулой НА+ У V2 ТГ~ У2 Y2 мы видим, что, приняв за скалярный квадрат ]с]2 = — A>Ю вектора %^Ж{Ж) определитель detX его матрицы в базисе е0, «\ пространства Ж, мы введем в Ж {Ж) структуру пространства Минковского. [Легко ви- видеть, что соответствующее скалярное умножение задает- задается формулой E) (|, ц) = -i- (Tr X Tr Y — Tr XY), где X и У—матрицы функционалов Ъ, и ц. Действитель- Действительно, ясно, что умножение E) билинейно и симметрично. Поэтому нужно лишь показать, что для любого вектора \^.Ж(Ж) имеет место равенство (%, "E,)=deiX, т. е. для любой эрмитовой матрицы A) —равенство Проверка последнего равенства без труда осуществ- осуществляется непосредственным вычислением, которого, впро- впрочем, можно и избежать, введя в рассмотрение характе- характеристические корни Аир, матрицы X. Так как характе- 374
ристическими корнями матрицы X2 служат числа "К2 и \х2 (почему?), то Тг X2 — X2 + р2. Поскольку же Тг X = = к + ц и det X = Я}1, соотношение F) сводится тем самым к очевидному тождеству В построении скалярного умножения E) уча- участвует— хотя и неявно — некоторый базис простран- пространства &в, и потому возникает вопрос, в какой мере умно- умножение E) зависит от выбора этого базиса. В каждом другом базисе е<у, е\> пространства об функционал % имеет матрицу Xе —Ст ХС, где С — мат- матрица перехода от базиса е0, а1 к базису гу, «к, и, значит, В частности, если det С = 1 (или хотя бы |detCj—1), то det X'= det X, и, значит, в базисах е0, е, и ее г\> мы получаем на Ж {об) одно и то же скалярное умно- умножение. Имея это в виду, мы будем считать, что в простран- пространство спиноров Ж введена дополнительная структура, со- состоящая в фиксации некоторого бивектора а0 =? 0, и бу- будем рассматривать лишь базисы е0, в\, допустимые от- относительно этой структуры, т. е. такие, что е0 Д е\ = по. Так как для матриц перехода, связывающих допусти- допустимые базисы, условие det С = 1 заведомо выполнено, то в силу этого соглашения структура пространства Мин- ковского на линеале Ж{об) определена корректно {не зависит от выбора базиса). Ясно, что каждый базис Паули D) пространства Ж {Ж) псевдоортонормирован. Через тензорные произведения векторов во, е\ эле- элементы базиса Паули D) выражаются, очевидно, фор- формулами ff0 = ей О еъ + ех ® ег, ох = е0 ® ег + е2 О е^, ff2 = /е0 ® ег — /е, ® е-, а3 = е0 <g» е- — е, ® е-. Поэтому любая деформация базиса е0, ei вызывает де- деформацию базиса со, аи 02, Сз, состоящую из базисов Паули (и, значит, псевдоортонормированную). Посколь- Поскольку любые два допустимых базиса пространства Ж де- деформируемы друг в друга (группа SLB;C) связна), отсюда непосредственно следует, что все базисы Паули 375
определяют одну и ту же ориентацию псевдоевклидова пространства Ж (Ж). Это означает, что пространство Ж {об) естественный образом ориентировано. Теперь мы можем вернуться к' произвольному про- пространству Минковского Ж. Описанная в начале лекции спинорная интерпретация векторов этого пространства означает в инвариантных терминах, что мы отожде- отождествляем пространство Ж с пространством Ж(аё) по- посредством некоторого (раз навсегда фиксированного) изоморфизма. Поскольку пространство Ж {Ж), как толь- только что было сказано, естественно ориентировано, про- пространство Ж оказывается, тем самым, также ориенти- ориентированным. Таким образом, введение в рассмотрение спи- спиноров предполагает, что пространство Ж ориентировано. В силу отождествления Ж(Ж) = Ж каждый базис Паули будет базисом пространства Ж, задающим дан- данную его ориентацию (такие базисы мы будем называть положительно ориентированными). Поэтому для любой матрицы CeSLB;jQ), интер- интерпретируемой как матрица перехода между двумя бази- базисами пространства 36, матрица s(C), связывающая от- отвечающие этим базисам базисы Паули пространства Ж, будет принадлежать группе Лоренца О+ A, 3)^ Полу- Получающееся отображение G) s:SLB; С)-^О^A, 3) является, очевидно, гомоморфизмом. Предложение 1. Отображение G) является эпимор- эпиморфизмом с ядром {Е, —Е). Помимо того, что это предложение дает вполне удов- удовлетворительное описание алгебраического строения группы О+A, 3), оно доказывает также, что любой по- положительно ориентированный псевдоортонормированный базис пространства Ж является базисом Паули, отве- отвечающим некоторому базису пространства спиноров <Ж. Это означает, что спинорный подход к геометрии Мин- Минковского обладает свойством адекватности. Предложение 1 мы докажем позже. Замечание 2. Отображение s можно без особого труда задать явными формулами. Рассмотрим для лю- любой матрицы CeSLB;.C,) и любого i = 0, 1, 2, 3 мат- матрицу CrOiC Эта матрица эрмитова и потому является 376
линейной комбинацией матриц Паули, т. е. существуют такие вещественные числа аК, ir — О, 1, 2, 3, что CyGiC = mat'. Матрица Л = faff является не чем иным, как матрицей линейного оператора (8) Xt-+CT действующего в пространстве всех эрмитовых матриц A), вычисленной в базисе, состоящем из матриц Паули. [[Ее явное вычисление через матрицу С не требует ни- ничего, кроме внимательности и терпения.] Так как опе- оператор (8), очевидно, обратим (обратный оператор за- задается обратной матрицей С-1), то матрица А невырож- невырождена, и значит, обладает обратной матрицей Л~1=||аМ|. Оказывается, что матрицей s(C) и служит матрица А~1: Действительно, если С — матрица перехода от базиса е0, гх к базису ео„ еу и если X — матрица функционала %<=Ж в базисе е0, е\, то, как мы знаем, матрицей Xf этого функционала в базисе ей', е\> будет матрица СГХС. Поэтому, если X = х1а1, то X' = СТХС = х1 (СТ(Г?С) = aiVa*/. По определению это означает, что координаты х1' век- вектора \ ^ Ж в базисе Паули а^, 0 ^ i ^ 3, отвечающем базису е0', е\>, связаны с его координатами х1 в базисе Паули а, 0 ^ / ^ 3, отвечающем базису е0, е\, форму- формулами Следовательно, сами базисы связаны контрагредиент- ным преобразованием (см. лекцию 1.6), т. е. матрицей перехода s(C), связы- связывающей эти базисы, является, как и утверждалось, мат- матрица А'1 =\\аЦ. ? Перейдем теперь к трехмерной геометрии Евклида. Чтобы получить спинорную интерпретацию этой гео- геометрии, мы, выбрав в пространстве Минковского Ж {06) некоторый базис Паули at, 0 ^ i ^ 3, рассмотрим ор- 377
тогопальное дополнение ofr его первого вектора <г0. Со- Согласно общей теории псевдоевклидовых пространств (см. лекцию 12а), это ортогональное дополнение является актиевклидовым (а, значит, после смены знаков у всех скалярных произведений — и евклидовым) простран- пространством с ортонормированным базисом ел, а2, <Уз- Ограничение подпространством о^ означает, что мы теперь допускаем к рассмотрению лишь базисы Паули с одним и тем же вектором а0 и, значит, — лишь базисы пространства Ж, связанные матрицами перехода С, удовлетворяющими соотношению Стсг0С ^сг0, т. е. (на- (напомним, что его = Б) являющимися унитарными матри- матрицами. Поскольку выбор в линейном пространстве над полем .С. класса базисов, связанных унитарными мат- матрицами перехода, равносилен заданию в этом простран- пространстве структуры унитарного пространства (по отношению к которой данные базисы ортонормированы), мы видим, следовательно, что пространство Ж мы должны теперь считать унитарным. С другой стороны, поскольку |detC|=l для любой унитарной матрицы'С, фиксиро- фиксировать бивектор йо =7^= 0 (т. е. ограничиваться унимодуляр- ными матрицами С) нам теперь не нужно. Далее, унитарность пространства Ж позволяет нам вместо эрмитовых функционалов рассматривать соответ- соответствующие эрмитовы операторы \: Ж-+Ж. При этом включение 1 е а?~ (равносильное равенству хо = 0) бу- будет означать, что Тг % = 0. Резюмируя, мы видим, что за спинорную модель трехмерного евклидова пространства мы можем принять пространство <§{Ж) всех эрмитовых операторов |: Ж—> -^>-&в двумерного унитарного пространства Ж, след Тг % которых равен нулю (в физической литературе такие операторы называются бесследовыми). В каждом ортонормированном базисе е0, е\ простран- пространства аё операторы \^&>{&в) задаются бесследовыми эрмитовыми матрицами вида X3 X1 — IX2 откуда следует, что операторы ел, (Уг, <Гз, имеющие в ба- базисе. е0, в\ соответственно матрицы (jj, Стг, <т3, составляют базис пространства &>{&в). Мы будем называть базис <Л, О2, (Уз базисом Паули пространства <? (Ж), отвечаю- отвечающим ортонормированному базису е0, в\ пространства Ж. 378
Таблица умножения элементов базиса Паули имеет вид (Ю) or2 .. -/<T3 — /or. .. —ia2 »¦ где со — тождественный оператор. [Верность этой таб- таблицы проверяется непосредственным вычислением.] Tax как ортонормированные базисы пространства 36 деформируемы друг в друга в классе ортонормирован- ных базисов (группа Ь'B) связна), то любые два ба- базиса Паули также деформируемы друг в друга (опре- (определяют одну и ту же ориентацию пространства *?(*#)). Это означает, что пространство & {Ж) обладает есте- естественной ориентацией (в которой его базисы Паули по- положительно ориентированы). Скалярное умножение в пространстве & {Ж} опре- определяется формулой (ср. формулу E) для скалярного умножения в Ж (Ж)). Билинейность этого умножения очевидна, симметрич- симметричность обеспечивается формулой F) лекции 15, а поло- положительная определенность проверяется непосредствен- непосредственным вычислением (которого можно и избежать, если за- заметить, что собственные значения оператора % ^ф 0 имеют вид doK где А, =^= 0, и, значит, след оператора I2 равен 2Я2 > 0). Заметим, что для любого оператора %<=.?>'{Ж) опе- оператор |2 скалярен (равен К2Е). Кроме того, так как Тг^2 —2л2 и det§ = A.(—К) — = —X2, то длина вектора %<=.&> (Ж) равна его положи- положительному собственному значению "К, а квадрат его длины равен его определителю с обратным знаком: Ш = Я, !§|2=-det|. В частности, |^]= 1 тогда и только тогда, когда §2=и. 379
По теореме Пифагора (§, ц) = О тогда и только тогда, когда |1 + г1|2 = |1!2 + |т1|2>т. е. когда С другой стороны, так как оператор (Цл) 1—Ч2 — Ц2 скалярен (как линейная комбинация скаляр- скалярных операторов), то его след равен нулю тогда и только тогда, когда сам оператор равен нулю. Поскольку (% + т]J — |2 — т]2 = ^т] + тI, этим доказано, что (^7 ц) = 0 тогда и только тогда, когда ^т] + т]1=О- В частности, мы видим, что базис ^ь |2, Ъ простран- пространства & (аё) тогда и только тогда ортонормирован, когда Щ = Е и 1.^ + 1^ = 0 для любых i, / = 1,2,3. Из таблицы A0) немедленно следует, что эти соот- соотношения выполнены, в частности, для элементов в\, 02, аз произвольного базиса Паули. Таким образом, каж- каждый базис Паули ортонормирован (и, по определению, положительно ориентирован). Поэтому, если A1) 1 = х1а1 + х2в2 + а^03 и ч = у1а1+у2а2 + у3о3, то A2) (|, л) = *У + х2у2 + х3у\ Легко видеть, что для любых эрмитовых операторов А и В их коммутатор является косоэрмитовым оператором (если А* = А п В = В\ то С* = (АВУ — (ВАУ = В*А* — А'В* = — С) и значит, оператор iC — эрмитовым (см. лекцию 19). При этом, в силу формулы F) лекции 15, след оператора iC равен нулю. Применительно к операторам из &'(Ж) этим дока- доказано, что для любых операторов 1, ц^&"C@) оператор A3) 1Хт) = 4-^-^> также принадлежит & {об). Непосредственное вычисление (использующее таб- таблицу A0)) показывает при этом, что Сравнив эти формулы с формулами для векторных произведений векторов положительно ориентированного 380
ортонормированного базиса (см. формулы A) лекции 1.15), мы немедленно получим, что умножение A3) является не чем иным, как векторным умножением в трехмерном ориентированном евклидовом простран- пространстве & {Ж). Из таблицы A0) следует также, что произведение Ijij операторов A1) выражается формулой — *V) а, — — i (х V — ж3*/1) or2 + i (х V — *У) ог3, т. е. формулой A4) Поэтому умножение операторов, вообще говоря, выво- выводит нас из пространства & = &(Ж) (пропадает как эр- митовость, так и равенство нулю следа). Однако из формулы A4) следует, что %х\ принадле- принадлежит четырехмерному (над полем R) линейному про- пространству Н = Rg0 ф i<?, состоящему из всех операторов вида Яоо + »1» где ^eR,|el? (напомним, что по опре- определению ао = Е), Более того, легко видеть, что про- пространство Н замкнуто относительно умножения опера- операторов, т. е. является алгеброй над полем R. Абстрактно Н можно описать как четырехмерную алгебру с базисом 1, i, /, k, где 1 — единица алгебры, а таблица умножения элементов i, /, ft имеет вид i i k 1 J —k i > k — l —i k —i i -1 (в нашем представлении 1 = a0, i = —ioi, / = —ioz, k = —iaz). Эта алгебра называется алгеброй кватернио- кватернионов, а ее элементы — кватернионами. Таким образом, мы фактически описали представле- представление алгебры кватернионов операторами в пространстве спиноров Ж (или, что, конечно, равносильно, комплекс- комплексными матрицами второго порядка). В этом представле- представлении кватерниону а -\-bi-\- cj + dk отвечает матрица а — id — b — ic II b + ic a + id | * 381
и, значит, пространство кватернионов Н отождеств- отождествляется тем самым с линейным пространством всех мат- матриц вида (Ш Iе М Ui>) И $ о где а, р — произвольные комплексные числа. Зафиксировав в Ж ортонормированный базис во, е\, рассмотрим произвольную унитарную матрицу второго порядка С (элемент группы UB)) и ортонормирован- ортонормированный базис во', еу, связанный с базисом во, е\ матрицей перехода С. Пусть ах, а2, а3 и ау, о?, а у — базисы Пау- Паули пространства &(Ж), отвечающие соответственно ба- базисам е0, е{ и ее, еу, и пусть s{C)—матрица перехода от базиса а„ а2, oz к базису ay, g2', ay. Поскольку последние базисы ортонормированы и одноименны, матрица s(C) третьего порядка является собственной ортогональной матрицей (принадлежит группе SO C)). Таким образом, соответствие d—>s(C) представляет собой отображение A6) s: U B) -> SO C) группы U B) в группу SO{3). Ясно, что это отображение является гомоморфизмом. Замечание 3. Поскольку в пространстве df (Ж) выбран базис аи <*2, <?3, матрицы из SOC) мы можем отождествить с ортогональными операторами в <?{Ж)* В частности, для любого вектора \^??{Ж) мы можем говорить о векторе s(C)|. С другой стороны, матрице перехода С мы можем сопоставить унитарный оператор С: Ж-^-cfe, имеющий в базисе во, в\ матрицу С. Тогда непосредственное сравнение определений показывает, что s(C)i = C1C~!. При желании эту формулу можно принять за определение гомоморфизма A6). Предложение 2. Отображение A6) является эпимор- эпиморфизмом. Ядро этого эпиморфизма состоит из всех ска- скалярных матриц ХЕ, где |Я| = 1. Доказательство. Утверждение об эпиморфно- сти отображения A6) означает, что любой положи- положительно ориентированный ортонормированный базис §ь §2, 1з пространства & {Ж) является базисом Паули, от- отвечающим некоторому ортонормированному базису во, е\ 382
пространства Зё. В этой форме мы его и будем дока- доказывать. Так как Ц=.Е, то собственными значениями опера- оператора ?з являются числа ± 1. Поскольку же след опера- оператора ?з равен нулю, то одно из этих собственных зна- значений равно + 1, а другое — 1. Следовательно, в Зё су- существует такой ортонормироваиный базис е0, в\, что 1зео = ?о и |3^1 =—#ь т. е. такой, что матрицей опера- оператора |з в этом базисе является матрица Паули о-3- Пусть теперь k = 1 или 2. Так как, по условию, %ъ%к = —%k%z, то и, значит, вектор ?fee0 является собственным вектором оператора ^3. принадлежащим собственному значению — 1 (или равен нулю). Поэтому существует такое а*, что %ке0 — аке\. По аналогичным соображениям существует такое Рй, что \k&\ = P^eo. Это означает, что в базисе е0, е\ оператор \и имеет матрицу Поэтому, во-первых, pfe = аи (так как оператор \ь эр- эрмитов) и во-вторых, афк = 1 (так как || = Е, а квад- квадрат матрицы A7) равен афкЕ). Следовательно, |ай[ = 1 (откуда, в частности, следует, что |^е0 =ф 0). Заменим теперь векторы е0 и е\ векторами а.\ей и а.\е\ (в силу равенства |ai|= 1 также составляющими ортонормированный базис). Ясно, что в базисе сиво, ai0i оператор \ь будет по-прежнему иметь матрицу ст3, а матрицей оператора \\ станет матрица аи Что же ка- касается матрицы оператора ^2, то она будет иметь вид II 0 а II а 0 с a = ai(X2. При этом, в силу условия ортогональности I1I2 + 1г§1 = 0, должно иметь место равенство 0 1 НПО 5| , 110 а | 10 1 В | | I ^ || II | 1 и> 1 0 | | a 0 I ^ || a 0 II | 1 0 1 выполняющееся, как легко видеть, тогда и только тогда, когда a-f- a = 0. Так как | ос j = 1, это возможно только при а. = i или a = —i, т.е. когда матрицей оператора %2 служит матрица ±О2. Таким образом, если в\, #2, аз — базис Паули, отвечающий базису aie0, ы\е\ пространства 383
Ж, то \\ = ai, 12 = ±02, 1з = 0з. Но так как по условию оба базиса |ь |2, 1з и 0Ь 02, аз одноименны, то равен- равенство 1г = —О2 невозможно. Поэтому базис §i, %2, %г яв- является базисом Паули а\, аг, аз- Вычислим теперь ядро гомоморфизма A6). Ясно, что если С = %Е (где в силу унитарности |А,|=1), то s(C) = E (ибо С%С~1 =\ для любого оператора |е <^ё?(Ж)). Обратно, пусть s(C) = E, т. е. пусть базисы Паули »ь а2, о3 и ©г, а2', 0з', отвечающие базисам в0, в[ и ео', ей пространства Ж, связанным матрицей С, совпадают. Но еслиа3' = <уз> то векторы е& и еу долж- должны быть собственными векторами оператора аз, отвечаю- отвечающими собственным значениям 1 и —1 соответственно, и потому должны быть пропорциональны векторам во и е\. Этим доказано, что существуют такие числа А, и \х, что еО'==Кео, е\>—\х,ех. При этом, так как векторы е0, и е\' являются ортами, то |Я|=1и||л|=1,а так как <Ук = о'1 и в\ей = е\, G\'e& = в\', то еу = О\г е§> = Хауе0 = = /W1e0 = Яе^и, значит, (х = А,. Таким образом, еО' = А.ео, вг = Хеи т. е. С = А,?, где | Я | = 1. ? Следствие 1. Ограничение A8) s:SUB)-*SOC) гомоморфизма A6) на подгруппе SUB) унимодуляр- ных унитарных матриц второго порядка является эпи- эпиморфизмом с ядром {Е, —Е}. Доказательство. Достаточно заметить, что для любой унитарной матрицы С второго порядка число А, = ^/detC обладает тем свойством, что A.CeSUB) и |Я.|= Г(и, значит, s(A,C) = s(С)). ° Эпиморфизм A8) другим — существенно менее эле- элегантным способом — был построен и изучен в первом семестре (см. лекции 1.26, 1.27). Теперь, идя «обрат- «обратным ходом», можно заново доказать все полученные там результаты (например, ввести углы Эйлера). Мы остав- оставляем все это читателю для самостоятельного продумы- продумывания. Докажем теперь предложение 1. Доказательство предложения 1. Пусть %о, 1ь 1г, 1з — произвольный положительно ориентирован- ориентированный псевдоортонормированный базис пространства Ж (Ж). По определению ^0 представляет собой такой эрмитов функционал на двумерном комплексном про- пространстве Ж_ (который унитарным пока не предпола- 384
гается), что Цо|2 > 0, т. е. такой, что для его матрицы X в некотором (допустимом) базисе е0, в\ пространства Ж имеет место неравенство det X > 0. Поскольку д.е\.Х = %\х, где Я и ц — характеристические корни мат- матрицы X, то либо матрица X, либо матрица —X имеет положительные характеристические корни, и, значит, со- соответствующий функционал §о положительно определен. Мы введем в 3@ структуру унитарного пространства, приняв этот функционал за скалярное умножение. Тогда в произвольном ортонормированном базисе е0, е\ про- пространства Ж функционал ±1о будет иметь матрицу Е = Сто, т. е. будет вектором а0 соответствующего базиса Паули ©о, о\, в2, аз- Более того, поскольку базисы §0, Ь, Ъ, 1з и а0, аи аг, оз определяют по условию одну и ту же ориентацию псевдоевклидова пространства Ж (Ж) типа A, 3), ра- равенство 1о = —во невозможно, и, значит, fjo = оо- Что же касается функционалов |i, %2, %г, то они (или, точнее, — соответствующие эрмитовы операторы Ж-*-Ж) будут, подобно функционалам о\, аг, <Уз, составлять ор- тонормированный и положительно ориентированный ба- базис евклидова пространства ©о" = &> {Ж), и, значит, со- согласно предложению 2 мы можем базисом е0, е\ рас- распорядиться так, чтобы имели место равенства Таким образом, любой положительно ориентированный псевдоортонормированный базис пространства Ж {Ж) является базисом Паули, отвечающим некоторому (очевидно, допустимому) базису во, е\ пространства Ж. Следовательно, отображение G) эпиморфно. Его ядро состоит из таких матриц CeSLB;C), что CTGiC = CT/ для любого г=0, 1, 2, 3. Но при г = 0 это дает, что матрица С унитарна (и, значит, принадлежит группе SUB)), а при i = \, 2, 3 — что матрица С при- принадлежит ядру гомоморфизма A8). Следовательно, С== == ±Е. п Рассмотрим теперь группу О+A,2). Так как для любого базиса Паули <у0, «Я, &2, аз пространства Ж{Ж~) ортогональное дополнение oi вектора оэ является, оче- очевидно, псевдоевклидовым пространством типа A, 2) (с псевдоортонормированным базисом а0, О\, аз) и так 385
как функционалы % из а^ характеризуются тем, что их матрицы (в базисе е0, е\ пространства Зё, которому от- отвечает базис Паули оо, о\, 02, оз) являются веществен- вещественными симметрическими матрицами вида A9) * = |*° + *8 xOxlx>\, то эту группу мы можем отождествить с подгруппой группы О+A, 3), состоящей из таких матриц s(C), Се е SLB; С), что для любой матрицы A9) матрица СТХС также вещественна (и симметрична). Поскольку последнее условие заведомо выполнено для веществен- вещественных матриц С, этим доказано, что гомоморфизм G) ин- индуцирует гомоморфизм B0) s: SLB; R)->O^A, 2) группы SLB;R) унимодулярных вещественных матриц второго порядка в группу О+A, 2). Предложение 3. Гомоморфизм B0) является эпимор- эпиморфизмом с ядром {Е, —?}. Доказательство. Достаточно, очевидно, дока- доказать, что если матрица CeSLB;C) обладает тем свой- свойством, что для любой матрицы A9) матрица СТХС ве- вещественна, то существует такое комплексное число а, |<х|=1, что матрица аС (для которой заведомо s(aC) = s(C)) вещественна. Но если матрица Cr XC ве- вещественна, то (ввиду вещественности матрицы X) СТХС = СТХС, и, значит, B1) и Ли — Л, где D = СС~1. При X == сто из B1) следует, что матрица D унитарна и потому имеет вид „г .. , где |aj2-f-|&r=l и | Я | = 1. АО — ha !| Поэтому при X = аз из B1) следует, что аа — %%ЬЪ = 1 и, значит, |а|=1 и 6=0, а при X = ст2 — что —Ха2= 1, и, значит, —%а = а. Таким образом, D = аЕ, где |aj = = 1, и потому С = аС. Следовательно, если а2 = а-', то аС = аС == аа2С = = а.С, т. е, матрица аС вещественна. ? 386
Лекция 25 Овеществления и комплексные структуры. — Ориентация овеществленного пространства. — Овеществление унитар- унитарного пространства. — Операторы L и Л. — Теорема Леф- шеца. Если в линейном пространстве У над полем С; ком- комплексных чисел ограничиться умножением лишь на ве- вещественные числа, то получится линейное пространство над полем R, которое называется овеществлением линей- линейного пространства У и обозначается символом Y$>. . Операция умножения на i является, очевидно, линей- линейным оператором У%-ъ-У°%. Мы будем этот оператор обо- обозначать символом / (или — когда это нужно — симво- символом J;). Таким образом, по определению, 1х = 1х, где справа х—произвольный вектор пространства У, а слева —он же, но рассматриваемый как вектор из У&. Ясно, что /2 = —Е. Обратно, пусть Ж— вещественное линейное про- пространство, в котором задан такой линейный оператор /: Ж-+Ж, что /2 = — Е. Тогда формула (а + ib) х = ах-\- Ых, а, Ъ = R, x e= W, определяет на W умножение на числа из jCj и — как показывает автоматическая проверка — относительно этого умножения W будет комплексным линейным про- пространством. Обозначив это пространство через У, мы при этом получим, что W = У а и I — lv. Таким образом, линейные пространства У над по- полем С находятся з естественном биективном соответ- соответствии с линейными пространствами У« над полем R, в которых задан такой линейный оператор I, что Р = = — Е', На этом основании операторы /: Ж-^-Ж, для кото- которых I2 = —Е, называются комплексными структурами на W. Для любого базиса в\, ..., еп пространства У век- векторы (]) еи ..., еп, 1еи ..., 1еп 38?
будут, очевидно, составлять базис пространства Ун. Та- Таким образом, при переходе от У к У'r размерность удваивается: B) (Слева, конечно, имеется в виду размерность Ун как линеала над полем R, а справа — размерность линеа- линеала У над полем С!. Чтобы подчеркнуть это, формулу B) часто записывают в виде й1У 2 di^) З И ) Замечание 1. Из формулы B) следует, что опе- операторы /, обладающие свойством I2 = —Е, могут суще- существовать лишь в четномерных вещественных простран- пространствах W. Впрочем, этот факт легко усматривается и не- непосредственно: в нечетномерном пространстве любой оператор — и, значит, в частности, оператор / — имеет вещественный характеристический корень Яо, который, ввиду равенства I2 = —Е, должен удовлетворять соот- соотношению Aj5=—1, невозможному для вещественных чисел. В базисе A) оператор / имеет матрицу о — Е Е о где, как всегда, Е -г— единичная матрица порядка п. Пусть ei, ..., е„ и е^, ..., еП'—два базиса про* странства У и пусть Если cl> = cik' + ibk>, то в пространстве Уц будут иметь место равенства k k . fofe . k j На матричном языке это означает, что если С = — A-j-iB — матрица перехода, связывающая базисы еи ..., еп и ev, ..., еп' пространства У, то матрица перехода, связывающая базисы еи .... еп, 1еи ..., 1еп и еу, • •., еП'у ley, ..., len> пространства Уц, имеет вид 1-2* А 388
Так как E 0 — A iE | E Г + iB - В П 1 A A — B 0 — IB B\ AY II fl HI E 0 С — В iE E 0 С то, переходя к определителям, мы получим, что II А в II 1 с ° S II — В A i = 1 — В С 1 ~ ' et C ' > °* Этим доказано, что все базисы пространства Yr вида A) одноимгнны и, значит, определяют одну и ту же ориентацию этого пространства. Эта ориентация назы- называется естественной ориентацией пространства Yr. Таким образом, овеществление произвольного ком- комплексного пространства (или — что то же самое — про- произвольное вещественное пространство с комплексной структурой) естественным образом ориентировано. В случае, когда пространство У унитарно, формулы S (х, у) = Re (х, у), Q (х, у) = Im (x, у), х, , определяют на Yr два, очевидно билинейных, функ- функционала S и Q, причем функционал S симметричен и положительно определен, а функционал Q кососиммет- ричен и невырожден (почему?). Таким образом, для унитарного пространства У пространство Tr является евклидовым пространством (со скалярным умноже- умножением S) и одновременно симплектическим простран- пространством (со скалярным умножением Q). Это определяет богатство геометрической структуры пространства Yr, отражающееся, в частности, как мы увидим, на свой- свойствах кососимметрических тензоров в этом пространстве." Замечание 2. Функционалы S и Q отнюдь ке яв- являются вещественной и мнимой частями скалярного- умножения в У в смысле лекции 19 (хотя бы потому, что последние имеют смысл лишь в вещественно-ком- вещественно-комплексном пространстве). Легко видеть, что для любого ортонормированного базиса е\, ..., еп пространства Т базис еи ..., еПу 1в\, ..., 1еп пространства У°& также ортонормирован (по отношению к скалярному умножению S). 389
Действительно, для любых k, /=1, ..., п S{.ek, e,) = Re(efe, et) = Re6fe/ = 6fe/, S(ek, J«z) = Re(efc. ie{) = — Ha i6fe/ = 0, S(/efc, /ez) = Re (tefc, «/) = Re6fcl = 6fcZ. a Конечно, ортонормированным будет и базис <3) 1е1г ..., /е„, 01, ..., еп. При этом базис C) будет также и симплектичен (по отношению к симплектическому умножению Q). Дей- Действительно, для любых k, I = 1, ..., п Q{ek, ei)~lm(ek, et) ==¦ Im 6kl = 0, Q (Iek, et) = Im (iek, et) = Im zfeJ == &kt, Q(Iek, Iei)—lm(iek, iet)~ Im 6fe/ = 0. a (Исходный базис е\, ..., en, lei, ¦ ¦ ¦, len будет сим-* плектичен по отношению к умножению —Q.) Симплектичиость базиса C) означает, что функцио- нал Q, рассматриваемый в силу естественного отож- отождествления y'f, — У'R как функционал от ковекторов, вы- выражается через базис C) (совпадающий в силу его ор- тонормированности с сопряженным базисом) по фор- формуле п D) ?> - Z Iek Aek. k-i Оператор комплексной структуры / имеет в базисе C) матрицу II ° Е 1-Е 0 совпадающую с матрицей функционала Q. В силу орто- иормированности базиса C) это означает (см. замеча- замечание 2 лекции 20), что в евклидовом пространстве Уц функционал Q отождествляется с сопряженным опера- оператором /* = —/, т. е. что для любых векторов х, у е Уц имеет место равенство Q(x, y) = (x, 1у), где справа имеется в виду, конечно, скалярное умноже- умножение S. 390
[Другое доказательство: S(x,Iy) = = Re(x, iy)=Re[—i(x, y)] = Re[Q(x, y)—iS(x, y)] = = Q(x,y).] Изучим более внимательно свойства косоеимметриче- ских тензоров на пространстве Уц. По традиции мы будем обозначать эти тензоры строчными латинскими буквами v, w, ... и т. д. Так как пространство У& евклидово и ориентирова- ориентировано, то для пространств /\гУъ определен оператор Ход- Ходжа * (см. лекцию 96), а так как dim^°R = 2/z, то E) •: ЛгГ*~>Л2п~ГГк и F) *mV = (—l)rv для любого тензора v е /\гУц (см. формулу A7) лек- лекции 96). Пусть G) еи ..., еп — произвольный ортонормированный базис простран- пространства У и (8) еи ..., еп, 1еи ..., 1еп — соответствующий базис (как мы знаем, также.орто- также.ортонормированный) пространства Ж&. \ Для упрощения формул мы для любого мультиин- декса а = (а1( U2, ..., as), где 1 ^а, < а2 < ... < as ^.п, положим во. = еах А ¦ • ¦ Л &as И 1ва = /гЦ Л • • • Л 1ва3. Число s мы будем называть длиной мультииндек- са а и будем его обозначать символом |а|. Тогда поливекторы вида (9) еа А /«&, где | а | + | р | = г, будут составлять базис пространства /\^Tr, и, согласно общей формуле A) лекции 96, действие оператора * на поливекторе (9) будет задаваться формулой A0) *[гаЛ/гр] = (- 391
где of и р'— мультииндексы, дополняющие соответ- соответственно мультииндексы а и р до всего отрезка [1, ... ..., п] натурального ряда, а р и q — числа инверсий в перестановках а<хг и рр' этого отрезка (слагаемое |а'|-|р| в показателе возникает из-за транспозиции множителей еа' и leg,). Для того чтобы воспользоваться не только евклидо- евклидовой, но и симплектической структурой пространства У мы определим (очевидно, линейные) операторы положив Lv = Q Л "о и Av=*~1L*v для любого тензора v е /\.гУц, где Q — тензор D). Во избежание излишних оговорок мы условимся об- обращаться с мультииндексами, как будто они являются множествами. Например, для мультииндекса а = = (ai, ..., as) запись /еа будет означать, что l==at для некоторого /= 1, ..., s, а запись tea'—что k=fccti ни для одного i=l, ... s. Аналогично, для любых мультииндексов а и Р символом a U р (символом а П Р) мы будем обозначать мультииндекс, состоящий из всех индексов, входящих хотя бы в один из мультииндексов а или р (в оба мультииндекса а и Р). Крометого,длякаждогомультииндексаа=(а1, ..., as) и любого k e а/ мы будем обозначать символом a(k) мультиикдекс, получающийся из мультииндекса а до- добавлением индекса k, причем если ai <C k < ai+u то число (— 1)' мы будем обозначать символом e(a,k). Наконец,для любого мультииндекса a=(ai, ..., as) и любого /еа мы будем обозначать символом а[1] мультииндекс, получающийся из мультииндекса а уда- удалением /. 1Конечно, более последовательно было бы обозначать <х[1] через а\{/} (или хотя бы через аХ/), a a(k)—через aU{&} (или a{]k), но это приведет к -слишком сложным индексам.] Заметим, что a{k)f = a'[k] и a[l]' = a/(I). В введенных обозначениях действие оператора L на поливектор v вида (9) задается — в силу косокоммута- тивности внешнего умножения — формулой (И) ?t, = (_l)lal+! 2 в (а, Л)е(р, ft) е« I*) Л 392
Поэтому (см. формулу A0)) L*v = () ^ e(a't/)e(p/f /je ЛЛ геа П Р и, значит, Аг> = *~lL * v = (—1)г * L * t? = / , чг+p+g+l a'I-| 3 l+l a' | + l+( | a 1-1) 11 P' — v— i; X ? (~l)P/+^e(a', /)e(p', leaO P где p/ и ^ — числа инверсий в перестановках a'(l)<x[i\\ и Р'@Р1Л отрезка [1, ..., п] натурального ряда. Чтобы сосчитать число pi, мы перейдем от переста- перестановки а' (I) а [I] к перестановке a [l]a'(l) (произведя тем самым \а/{1) \ • |ос [/] | = (|а'|+ 1) (|а|— 1) транспози- транспозиций). Если / является /-м членом а/ мультииндекса а, то в а? индексу / предшествует ровно а/ — j = I — j чле- членов. Поэтому, чтобы переставить в <х[/]<х'(/) индекс / на свое «законное» место (и получить тем самым пере- перестановку eta' с числом инверсий р), нам нужно сначала сделать / — j, а потом |<х| — / (и, значит, всего / + |аЦ- + 2/) транспозиций. Этим доказано, что | mod2. По аналогичным соображениям I mod2. Подставив эти выражения для pi и qt в формулу для Av (и учтя, что r = |aJ + |P|), мы после очевидных, вычислений получим, что A2) Аг> = (— l)a E e(a', /<=а П Р Из формул A1) и A2) немедленно следует, что A3) ALV = 2j 2 Sfe/0a (&) [/] Л &^(TU Р/ ((П Р)(А) Д fes(aUP)' где 8Ы=е(а, Л)е(р, А:) 8 (а'[А:], /)е(р[Л], /), 393-
и, аналогично, A4) LAv = Л /ер ш ( где Но легко видеть, что при а,- < k < ar+i и / 8 (a, &) = (—1)', | (.— и . если 8 (a [k], l) — i i-i-i {. (— 1) , если / > I, f (— l)'~l, если /</, С (— 1)*, если / > i. Следовательно, в обоих случаях 8 (a, k)e{a'[k\, I) = — г {a', l)e(a[l], k), и, аналогично, Поэтому eAi = efci Д-ля любых ^ е (aU р)' и /еа("||5- Поскольку этим доказано, что двойные суммы з формулах A3) и A4) состоят из одних и тех же слагаемых и потому равны. Следовательно, IA, L] v = ALv — LAv — ,еккеа Л /?,} — 2 8nSa П ^р = = Г V U V (y &Й V1 ' "ч i eon P 8"J 394
Но в (a, k)e(a'[k], k) = (-1)''.(— if'1 = (— if (где, как и выше, i — такой индекс, что at <C k -< а,+1)и, аналогично, е(р, Л)е(р'[Л], А:) = (-1)&. Поэтому Sfefe = e(a, k)e(a'[k], k)s($, fe)e(p'[*l. *)=1 для любого ' и по симметрии для любого / ^ а П р. Следовательно, и, значит, [Л, L] v = (п - | а )v = (п — г) да. Поскольку здесь г» — произвольный базисный поливек- поливектор (9), тем самым доказано следующее предложение: Предложение 1. Для любого г, 0 ^ г ^ 2п отобра- отображение [А, ?]: 2 является умножением на п г. Чтобы записать утверждение предложения 1 в виде соотношения между операторами, мы введем в рассмот- рассмотрение прямую сумму ДTR = AorR ® ... 0 ЛГПг ® ... ® Л2пГк пространств Дг^1?. Каждое пространство /%ГУ(> мож- можно, как мы знаем, считать подпространством простран- пространства Д^°е- Элементы подпространства A^r назы- называются при этом однородными элементами степени г пространства /\*У°а- Каждый элемент v пространства /\Жи является суммой некоторых однозначно опреде- определенных однородных элементов vr, которые называются его однородными компонентами. 395
Операторы Л и ? по линейности распространяются до операторов A5) A, L. 2/1 действующих по правилу: если v = ^ vr, где vr Г=0 то Пои этом и потому, 2п Av = Е Avr [A, L) v и Lv = 2п = е [а, согласно предложению 1 [A, L]v = 2/г = Е(я- 2/г = Е ^> ?]t»r, г=0 Это означает, что A6) [А, Ц=Н, где Я: — линейный оператор, определенный формулой Hv = Y, (п — г) vr. С другой стороны, так как [Н, A]vr = HAvr — AHvr = = (п — г + 2) At»r — (я — г) Аг>г = и, аналогично, [Н, L] vr == = (п — г — 2) ?г>г — (« — г) ?t?r = то на пространстве [Н, А] = 2Л, [Я, ?] = — 2?. 396
Эти формулы, вместе с формулой A6)', показывают (см. лекцию 18а), что по отношению к операторам Н, X = А и Y = L линейное пространство АУк является 012-модулем. Совершенно неожиданный результат! Весовыми элементами модуля A#"r являются его однородные элементы и только они, а весовыми про- пространствами— пространства \гУи- Вес элементов про- пространства Лг^"к равен при этом п — г. Примитивные элементы модуля /\Уи — это одно- однородные элементы v, для которых Аи = 0, т. е. кососим- метрические тензоры v, обладающие тем свойством, что В силу результатов лекции 18а мы видим теперь, что справедлива следующая теорема: Теорема 1 (теорема Лефшеца). Каждый косо- симметрический тензор v степени г ^ О на простран- пространстве У& допускает единственное представление вида vQ + Lvx + • • • + Lsvs, если CK^rsS^n, x -{-...+ L vs, если п ^ г <; 2n, где Vo, ..., vs — примитивные тензоры степеней г, г—2, ..., г — 2s, если О^г^п, п, п — 2, ..., п — 2s, если п^.г ^.2п, соответственно, as — такое число, что Ls+n~r~lv Ф 0, но Ls+a'rv = O при 0<г</г, Ls~lv Ф 0, но Lsv = 0 при ns^Lr г^2/г. Для любого г, O^r^/г, оператор Ln~r осущест- осуществляет изоморфизм пространства /\гУц на пространство /\2п~гУи, а оператор Ап~г—изоморфизм пространства 2 Д на пространство ?\ Тензор г>^ ДгУк тогда и только тогда примитивен, когда 0<г<п и An~r+lv = 0. a
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абсолют 187 Алгебра Грассмана 115 — Ли линейная 295 матричная 295 — тензорная 64 Аннулятор множества 40 Базис 9 — Паули 374, 378 — положительно ориентированный 376 — псевдоортонормированный 155 — симплектическнй 129 — сопряженный 309 — Q-ортогоНальный 140 Базисы взаимные 52 — деформируемые 166 ¦— одноименные 166 — соприженаые 35 Вектор асимптотического направле- направления 230 — ассоциированный с тензором 104 — корневой 277 — собственный 264 т-вектор 73 — базисный 76 Векторы изотропные 48 — одного характера 154 — одноименные 157 — ортогональные 47 — сравнимые по модулю 4Р 28 — G-ортогональные 47 — Q-ортогоиальные 140 Вершина конуса 205 Веса модуля 29S — Й1 2-модуля старшие 299 Вращение 369 — б плоскости П 369 — несобственное 370 Геометрия Галилея 49 — гиперболическая 178 — евклидова сопутствующая 156 — Лобачевского 178 — собственно псевдоевклидова 156 Гиперквадрика аффинная 209 нецентральная 211 центральная 211 невырожденная 213 — проективная 195 невырожденная 195 индекса р 202 ¦ s-планариая 202 Гиперплоскость 89 — диаметральная 236 — касательная 231 Гиперповерхность второго порядка 195, 209 398 Гомоморфизм 30 — индуцированный 31 Группа Лоренца общая 155 полная 175 — симметрическая 72 — типа (р, о) псевдоортогональная 155 Движение 369 Дефект оператора 246 Деформация базисои 246 Длина вектора 154 — кривой 182 — мультииндекса 392 — отрезка 154 Дополнение ортогональное 48 Закон преобразования тензорный 60 Значение оператора собственное 264 Идемпотёнт 246 Изометрия 130 Изоморфизм 48 — полулинейный 307 — симплектический 130 Индексы инерции 149 — пространства 153 Интервал времениподобный 154 — простраиствениоподобиый 154 — светоподобный 154 Касательная к гиперквадрике 230 Кватернионы 381 Классы векторов смежные 28 Клетка жорданова 281 Ковектор, ассоциированный с функ- функционалом 46 Коммутатор линейных операторов 295 Комплексификация оператора 285 — пространства 284 Компонента группы 165 Компоненты вектора спииориые 372 — тензора 311 Конус 197. 205 — асимптотический 235 — второго порядка 2Ц — изотропный 154 — мнимый 219 Конусы обобщенные 205 Координаты бельтрамиеиы 184 — вейерштрасеовы 184 — вектора ковариантиые 69, 1Б5 коитравариантиые 69 — плюккеровы 86 Корень квадратный из оператора 342 Корни оператора характеристические 265 Коядро гомоморфизма 30
Кратность собственного значения ал- алгебраическая 264 — — — геометрическая 264 Матрица билинейного функционала 45 — блочно-днагональная 263 — блочно-треугольная 263 — квадратичной формы 139 — оператора 250 — положительно определенная 150 — типа (р, q) псевдоортогональная 155 — треугольная 144 — унитарная 354 — унитреугольная 144 — функционала 313 — эрмитова 317 — С-орюгснальная 259 Матрицы Паули 374 Метрика 38 — псевдоэрмитова 313 — эрмитова 313 Минор главный порядка k 144 — матрицы обобщенный 74 — порядка р 17 Многообразие ГрасСмана 98 — линейное 90 Многочлен оператора характеристи- характеристический 265 — от оператора 283 Множества векторов линейно экви- эквивалентные 12 Модель Бельграми 184 — Бельтрамн — Клейна 184 — в круге 184 1— в шаре 184 — Пуанкаре 185 на верхней полуплоскости 188 Модуль простой 299 $12-модуль 295 Мономорфизм 30 Морфиз'м 30 Направление неасимптотическое глав- главное 349 Направления неособые 236 Нульпространство функционала 46 Оболочка линейная 11 Образ гомоморфизма 30 — оператора 245 — пространства 30 Образующая гиперповерхности 204 Овеществление линейного простран- пространства 388 Ограничение оператора 261 Окружность на псевдсевклидовой плоскости 157 Оператор диагоиализнруемый 270 — коссснмметрический 326 — косоэрмитов 326 — линейный 243 идемпотентный 246 — нильпотентный 273 — нормальный 350 — нулевой 243 — обратимый 256 — обратный 256 — ортогонально диагонализируемый 336 — ортогональный 260 — самосопряженный 325 — — неотрицательный 326 Оператор самосопряженный положи- положительный 326 — — симметрический (симметричный) 325 — — эрмитов 325 — скалярный 245 — сопряженный 310 — тождественный 245 — унитарный 354 — Ходжа 120 Операторы изометрические 354 — сопряженные 324 Определитель оператора 265 Ориентация псевдоевклидова про- пространства 166 Отображение линейное 30 —¦ полулинейное 307 — сопряженно линейное 307 Параболоид 216 — гиперболический индекса р 220 — эллиптический 220 Перенес параллельный 369 Перестановки типа (р, q) 112 Плоскость центров 211 — гп-мериая 89, 179 Подматрица главная порядка k 144 Подмножество векторов максималь- максимальное 15 — связное 165 Подмодуль 299 Подпространства дизъюнктные 10 — дополнительные 27 — изотропные максимальные 133 — модуля весовые 296 Подпространство 9 — инвариантное 261 — невырожденное 163 — нулевое 10 — порожденное множеством 11 — тривиальное 10 Подъем индекса 69 Показатель весового элемента верх- верхний 297 нижний 297 Поливектор степени т 73 Поливекторы простые 80 — разложимые 80 Полуплоскость Пуанкаре 188 Представление линейное 296 Преобразование аффинное 367 — Галилея 49 — когредиентнее 40 — контргредиентное 40 — ортогональное 368 собственное 369 центроаффинное 369 — унитарное 368 Произведение векторов внешнее 73 — — тензорное 55 — линейного оператора на число 243 — линейных пространств тензорное 55 — скалярное 47, 319 — функционалов тензорное 53 Пространства двойственные 36 — комплексно сопряженные 308 — эрмитовы 319 Пространство антневклндово 153 — линейное 9 — — конечномерное 9 — — снмплектическое 129 — псевдоевклидово 153 *=¦> — невырожденное 153 3S9
Пространство со скалярным умноже- умножением 47 — унитарное 319 — m-мерное гиперболическое 179 Прим а я 89 Прямые в пространстве параллель- параллельные 189 Путь в группе 165 Пфаффнаи 128 Радиус кривизны 179 Разложеине оператора полярное 356 спектральное 336 Размерность линейного многообразия 90 Ранг матрицы 17 — множества векторов 15 — оператора 246 — тензора 106 — функционала билинейного 46 • квадратичного 137 Расстояние гиперболическое 179 — Лобачевского 179 Свертка тензора 65 Семейства векторов уиимодулярио эквивалентные 76 Символ Кронекера 38 Сииус гиперболический 170 Система линейных уравнений сои- местиаи 22 — решений фундаментальная 42, 288 Скобка Ли линейных операторов 295 След линейного оператора 244 — функционала 66 Соотношения Плюккера 107 — тривиальные 107 Спаривание оператора 271 Спектр оператора 271 Спиноры 373 Спиитензоры 373 Спуск индекса 69 Степень кососямметрического тензо- тензора 80 — нильпотентности 273 Структуры комплексные 388 Сумма лииейиых операторов 243 — подпространств прямая 25 — пространств прямаи 32 внешняя 32 — семейства подпространств 12 Сфера 178 Тангенс гиперболический 160 Тензор кососимметрнческий 80 — метрический 68 ¦— типа (р, д) 60 Тензоры обобщенные 311 Тип пространства 153 Точка гиперквадрики особая 231 Точки прямой бесконечно удаленные 193 Транспозиция 72 Умножение линейных операторов 244 — симплектяческое 129 ~- скалярное 319 Уравнение параметрическое вектор- векторное 89 координатное 90 Уравнения линейного многообразия 91 — плоскости 91 Факторпространство 29 Форма билинейная 45 — квадратичная 138 положительно определенная 150 — функционала полилинейная 59 — эрмитова 59 Формы эквивалентные 139 Функционал билинейный 44 кососимметрический 48 невырожденный 47 симметрический 48 — квадратичный 136 положительно определенный 150 — косоэрмитов 316 — линейный 33 — полилинейный кососнмметрический 80 — полулинейный 308 — полуторалинейный 313 эрмитов 3!5 положительно определенный — типа (р, д)полилинейный 58 — эрмитово симметрический 315 Функционалы смешанные 55 Центр центроаффинного преобразоиа» ния 369 Цилиндр кратности О 204 Цилиндры 203, 204 Часть функционала вещественная 315 мнимая 315 Элемент.весовой примитивный 297 Элементы степени г однородные 396 Эллипсоид действительный 219 — мнимый 219 Эндоморфизмы линейного простран» ства 243 Эпиморфизм 30 Ядро гомоморфизма 30 — оператора 245 — функционала 46
СПИСОК ОПЕЧАТОК Страница 70 115 124 161 Строка 12 СВ. 14 св. 20 сн. 3 св. Напечатано Ьц, Ы1, d{ дег (А А В) ац ... а\п (a, 6) = |a6|ch6 Следует читать Ьц, bi>, bil deg (АЛВ) аи ... аХи (а, Ь) = a |6|ch6