Текст
                    ЛЕКЦИИ
ПО ГЕОМЕТРИИ
Семестр II
м. м. постников
ЛИНЕЙНАЯ АЛГЕБРА
И ДИФФЕРЕНЦИАЛЬНАЯ
ГЕОМЕТРИЯ
Допущено Министерством высшего
и среднего специального образования ССОР
в качестве учебного пвяОбия
для студентов вузов, обучающихся
по специальности «Математика»
PI
га
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЙ
ФИЗИКО-МАТ^тТОТВЭДОИ ЛИТЕР/А1УРЫ
19 Гд


22.143 П63 УДК 612,8 Михаил Михайлович Постников Лекции по геометрии. Се м ест р II. ЛИНЕЙНАЯ АЛГЕБРА И ДИФФЕРЕНЦИАЛЬНАЯ ГЕОМЕТРИЯ М., 1979 г., 312 стр. с илл. Редактор В. Л. Попов Техн. редактор Л. В. Лихачева. Корректор И. Д. Дорохова ИБ № 11405 Сдано в набор 13.11.78. Подписано к печати 14.06.79. Бумага 84Х1'087и. тип. № 1. Литературная гарнитура. Высокая печать. Усл. печ. л. 16,38. Уч.-иэд. л. 14,84. Тираж 36 000 экз. Заказ № 1372. Цена книги 80 коп. Издательство «Наука> Главная редакция физико-математической литературы* 117071, Москва, В-71, Ленинский проспект, 15 Ордена Трудового Красного Знамени Ленинградская типография № 2 имени Евгении Соколовой «Союзполктрафпрома> при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 198052, Ленинград, Л-52, Измайловский проспект, 29 ©Главная редакция п 20203—109 to _л ,„Алл.лллл физикр-матемНической П n*Q/no\ 7Q' J 3-79 1702040000 1итер%туры vooyvzj-iv издательства «Наука», 1979
Содержание Предисловие . , в ЛЕКЦИЯ 1 7 Линейные пространства. — Подпространства. — Пересечение подпространств. — Линейные оболочки. — Сумма подпространств. — Размерность подпространства. — Размерность суммы подпространств. — Размерность линейной оболочки. ЛЕКЦИЯ 2 . * 15 Теорема о ранге матрицы. — Ранг произведения матриц. — Теорема Кронекера — Капелли. — Решение систем линейных уравнений. ЛЕКЦИЯ 3 23 Прямые суммы подпространств. — Разложение пространства в прямую сумму подпространств. — Факторпространства. — Гомоморфизмы линейных пространств. — Прямые суммы пространств. ЛЕКЦИЯ 4 31 Сопряженное пространство. — Двойственные пространства. — Второе сопряженное пространство. — Преобразование сопряженного базиса и координат ковекторов. —• Аннуляторы. — Пространство решений системы однородных линейных уравнений. ЛЕКЦИЯ 5 41 Аннулятор аннулятора и аннуляторы прямых слагаемых. — Билинейные функционалы и билинейные формы. — Билинейные функционалы в сопряженном пространстве. — Смешанные билинейные функционалы. — Тензоры. ЛЕКЦИЯ 6 51 Умножение тензоров. — Базис пространства тензоров. — Свертка тензоров. — Ранговое пространство полилинейного функционала. ЛЕКЦИЯ 7 \ 57 Ранг полилинейного функционала. — Функционалы и подстановки. — Альтернирование. ЛЕКЦИЯ 8 64 Кососимметрическое полилинейные функционалы. —» Внешнее умножение. — Алгебра Грассмана. — Внешние произведения ковекторов. — Разложение кососимметрических функционалов по внешним произведениям ковекторов базиса. ЛЕКЦИЯ 9 74 Базис пространства кососимметрических функционалов. — Формулы преобразования базиса этого пространства. — Поливекторы. — Внешний ранг кососим метрического функционала. — Теорема о ранге поливектора.—Условия равенства поливекторов. ЛЕКЦИЯ 10 , 84 Теорема Карта на о делимости. — Соотношения Плюккера. — Плюкке- ровы координаты подпространств. — Плоскости в аффинном пространстве. — Плоскости в проективном пространствен их координаты. 1* а
ЛЕКЦИЯ И < к i ««• * -•••-•*•.--.«......; i 99 Симметрические и кососимметрические билинейные функционалы. — Матрица симметрического билинейного функционала. — Ранг билинейного функционала. — Квадратичные функционалы и квадратичные формы. — Теорема Лагранжа. ЛЕКЦИЯ 12 . . . » . . . . я • * . i 1 * • i 109 Теорема Якоби. — Квадратичные формы над полями комплексных и вещественных чисел. — Закон инерции. — Положительно определенные квадратичные функционалы и формы. ЛЕКЦИЯ 13 , ..,.,. 5 ... v * 118 Гиперповерхности второго порядка /г-мерного проективного пространства. — Гиперповерхности второго порядка комплексного и вещественно-комплексного проективного пространства. — Гиперповерхности второго порядка л-мерного аффинного простратеетнв; — Гиперповерхности второго порядка комплексного и вещественно-комплексного аффинного пространства. ЛЕКЦИЯ И , „ , я , ,. х ,,....> Ш Алгебра линейных операторов. — Операторы и смешанные билинейные функционалы. — Линейные операторы и матрицы. — Обратимые операторы. —- Сопряженный оператор. — Альтернатива Фредгольма. — Инвариантные подпространства и индуцированные операторы. ЛЕКЦИЯ 15 .'*..<«. * ..,.,,.. * . 3 «!,. . , -< , 143 Собственные значения. — Характеристические корни. — Диагонализи- руемые операторы, — Операторы с простым» опаедюм» — Существование базиса, в- котором матрица оператора* треугольна. — Нильпотент- ные операторы. ЛЕКЦИЯ* 1&. . . , » . х . . . . . ч . v , f ¦<; » , я , , г v . .' 153 Разложение нилвиотентнюго оператора в прямую сумму циклических операторов. —¦ Корневые ггодггростражггва-. — Жорданова нормальная форма. — Теорема Гамильтона — Кэли. ЛЕКЦИЯ 17 ..... , ».,.»..,-,,.,..., 163 Комплексификация линейного оператора'. — Собственные подпространства, принадлежащие- характеристическим* корням. — Операторы, ком- плексификация которых диагонали5нруема\ ЛЕКЦИЯ 18 .*..«,.,.....-..,,,. s * ..... 172 Евклидовы и унитарные пространства. — Ортогональные дополнения. — Отождествление векторов и ковекторов. — Аннуляторы и ортогональные дополнения. — Килинейные функционалы и линейные операторы. — Устранение произвола в отождествлении тензоров различных типов. — Метрический тензор. — Спуск и подъем индексов» ЛЕКЦИЯ 19 185 Сопряженные операторы. — Самосопряженные операторы. — Кососимметрические и косоэрмитовы операторы. — Аналогия между эрмитовыми операторами и» вещественными чвсламаь — Спектральные свой** ства самосопряженных операторов. — Ортогональная диагонализируе- мость самосопряженных операторов. ЛЕКЦИЯ 20. v . . у *.».... . , , ,-.- ,• v ,.,...* . 194 Приведение квадратичных форм к каноническому виду ортогональным преобразованием переменннх. — Гдагерноверхности второго порядка в евклидовом точечном пространстве; —Минимаксное свойство собственных значений самосопряженных операторов. — Ортогонально диагонализируемые операторы. ЛЕКЦИЯ" 2Г , ..,,..,.,.»,,....* 204 Положительные операторы. — Изометрические операторы. — Унитарные матрицы. — Полярное разложение обратимых операторов. — Геометрическая интерпретация полярного разложения. — Параллельные переносы и цвнтроаффинньш. преобразования..— Приведение унитарного оператора, к диагональному. виду>т— Разложение вращения п-ме#- ного. евклидова пространства в композицию вращениЖ в двумерных плоскостях. 4
ЛЕКЦИЯ 22 . , ....... i . 217 Гладкие функции. — Гладкие гиперповерхности. — Градиент. — Производные по вектору. — Векторные поля. — Особые точки векторного поля. — Модуль векторных полей. — Потенциальные и безвихревые векторные поля. — Вихрь векторного поля. — Расходимость векторного поля. — Векторный анализ. — Символический вектор Гамильтона. — Формулы для произведений. — Композиции операторов. ЛЕКЦИЯ 23 238 Непрерывные, гладкие и регулярные кривые. — Эквивалентные кривые. — Регулярные кривые на плоскости и графики функций. — Касательная гиперплоскость гиперповерхности. — Длина кривой, — Кривые на плоскости. — Кривые в трехмерном пространстве. СЕКЦИЯ 24 ........ ..•>«..< 256 Проекции кривой на координатные плоскости сопровождающего репера. — Формулы Френе для кривой в «-мерном пространстве. — Задание кривой ее кривизнами. — Регулярные поверхности. — Примеры поверхностей. ЛЕКЦИЯ 25 ..< * ..*„,., ?.. * ,,*.,„.„< 270 Первая квадратичная форма поверхности. — Индуцированные квадратичные формы. — Изометричные поверхности. — Поверхности с идентичными первыми квадратичными формами.— Примеры первых квадратичных форм поверхностей — Развертывающиеся поверхности. ЛЕКЦИЯ 26 ..... „ .,..,.. -. .... 284 Касательные векторы. — Первая квадратичная форма как метрическая форма линеала касательных векторов. — Касательная пло- i скость и вектор нормали. — Кривизна нормального сечения. — Вторая квадратичная форма поверхности. — Индикатриса Дюпена. — Главные кривизны. — Вторая квадратичная форма графика. — Линейчатые поверхности нулевой кривизны. — Поверхности вращения. ЛЕКЦИЯ 27 . »-.,<.-...-.* Г ........ v ... 303 Деривационные формулы Вейнгартена. — Коэффициенты связности. — Теорема Гауса. — Необходимые и достаточные условия изометрич- ности. Предметный указатель . » 304
Предисловие Эта книга является непосредственным продолжением предыдущей книги *) автора и, подобно ей, является почти точной записью лекций, которые автор читал во втором семестре на первом курсе механико-математического факультета МГУ им. М. В. Ломоносова для студентов- математиков (курс «Линейная алгебра и аналитическая геометрия»). В отборе материала и порядка изложения автор, естественно, руководствовался теми же соображениями, что и в первом семестре (см. предисловие в I). Число лекций в книге определилось тем, что хотя по учебному плану на курс отводится 32 лекции, но фактически больше 27 лекций прочесть не удается. Курс «Линейная алгебра и аналитическая геометрия» является лишь частью единого двухлетнего курса геометрии, и многое в этой книге в отношении отбора материала и его акцентировки объясняется ориентацией на второй год, посвященный дифференциальной геометрии многообразий. Оказалось, в частности, возможным (хотя это и не предусмотрено учебным планом) часть пропедевтического материала третьего семестра (элементарную дифференциальную геометрию кривых и поверхностей трехмерного пространства) перенести в курс второго семестра, и это существенно облегчило (не только лектору, но, что, конечно, важнее, и студентам) курс третьего семестра. Вместе с тем, как показал опыт, студенты с интересом воспринимают этот материал и уже во втором семестре в целом хорошо его усваивают. 27 октября 1977 г. Af. M. Постников ') Постников М. М. Лекции по геометрии: Семестр I. Аналитическая геометрия. — М.: Наука, 1979. В дальнейшем эта книга цитируется как I.
Лекция 1 ЛИНЕЙНЫЕ ПРОСТРАНСТВА. — ПОДПРОСТРАНСТВА. — ПЕРЕСЕЧЕНИЕ ПОДПРОСТРАНСТВ. — ЛИНЕЙНЫЕ ОБОЛОЧКИ. — СУММА ПОДПРОСТРАНСТВ. — РАЗМЕРНОСТЬ ПОДПРОСТРАНСТВА. — РАЗМЕРНОСТЬ СУММЫ ПОДПРОСТРАНСТВ.—РАЗМЕРНОСТЬ ЛИНЕЙНОЙ ОБОЛОЧКИ. В этом семестре мы перенесем результаты семестра I на случай любого п. В основном мы будем следовать прежнему плану изложения. Напомним (см. определение 1 в лекции 1.1), что линейным пространством (или линеалом) над полем !К называется множество У, элементы которого называются векторами и в котором определены операция сложения *,gt-^x + y и для любого числа AgK операция x*—>kx умножения на это число. При этом требуется, чтобы относительно сложения У было абелевой группой и чтобы для умножения на числа из К были выполнены четыре естественные аксиомы. В таком пространстве имеют смысл понятия линейной комбинации векторов и линейно зависимых или независимых семейств и множеств векторов. Пространство У называется конечномерным, если в нем существует конечный базис, т. е. семейство векторов, через которые единственным образом линейно выражается любой вектор из У. Число векторов во всех базисах одно и то же. Оно называется размерностью линеала У и обозначается символом dimy. Пусть У — произвольное конечномерное линейное пространство. 7
¦^ Определение 1. Подмножество & пространства У на* зывается его подпространством, если каждая линейная комбинация k\X\ + ... + kmxm любых векторов Х\, ... ..., xm e 9> принадлежит flP. Очевидно, что 9* тогда и только тогда является подпространством, когда х-{- у ^ <? и kx e 3* для любых векторов х, у е 9> и любого числа & ^ К. Иначе говоря, тот факт, что 9* является подпространством, означает, что соответствия х,у\-^х + у и х |—> kx, где #, у е ^ и & е К, определяют в 9 некоторые операции. Ясно, что относительно этих операций под- пространство 3> является линейным пространством, ? Примеры подпространств. 1. В любом линеале У одноэлементное подмноже* ство {0} и все множество У являются подпространства* ми. Подпространство {0} (обыкновенно обозначаемое просто 0) называется нулевым, а подпространство У — тривиальным. 2. В линеале Кп для любого пг^п совокупность всех векторов вида (х1, ,.., хт, 0, ..., 0), у которых равны нулю последние п — т координат, является подпространством. Это подпространство естественным образом изоморфно пространству Кт. 3. В линейном пространстве многочленов (или, более общо, любых функций, удовлетворяющих тем или иным условиям) подпространством будет множество всех многочленов (функций), равных нулю в одной или несколь* ких фиксированных точках. 4. Подпространством будет множество всех многочленов, коэффициенты которых при данных фиксированных степенях равны нулю, а также множество всех четных или всех нечетных многочленов. Предложение 1. Пересечение а произвольного семейства подпространств {р^аУ является подпространством. Доказательство. Если х, у ^ ^, то х, у ^ &а для любого а, и потому х + у е &>а, kx e Ф>а, и, значит (так как а произвольно),л: + уе^ЬеЛ ? Заметим, что пересечение подпространств не может быть пустым, поскольку любое подпространство содержит нулевой вектор 0. 8
Если ^f)?? = 0, то подпространства #-и Q назы* ваются дизъюнктными. Несмотря на свою простоту, предложение 1 влечет важные следствия* Пусть S — произвольное подмножество лянеая» У.. Определение 2. Подпространство {РаУ* кавывается линейной оболочкой множества S, если S с& и; 9* является наименьшим подпространством, обладающим этим свойством, т. е. если каждое подпроетршстта Q, для которого &cQ9 содержит &\ Линейная? оболочка множества 5 обозначается символом [S]i. Опав называется также подпространством, порожденным множеством S. Предложение 2. Линейная оболочка [3} существует для любого множества S а У*. Ею является пересечение всех подпространств, содержащих 5. Доказательство. Так как в этом пересечении (являющемся, согласно предложению 1, подеростраест- вом) участвует каждое подпространство #=?&, та оно содержится в Q. С другой стороны, оно; очевидно, со* держит 5. ? В связи с этим доказательством возникает вопрос: имеем ли мы вообще право говорить об пересечении подпространств, содержащих 5? Почему, собственно, та* кие подпространства существуют? Формальный ответ со*- стоит в том, что, в соответствии с общими принципами теории множеств, пересечение семейства подмножеств произвольного множества Т определено даже тогда, когда семейство пусто, и является в этом случае, как ни парадоксально, всем Т. В нашей же конкретной ситуации дело еще проще, потому что рассматриваемое семей* ство никогда не пусто. Действительно, одним из подпространств, содержащих S, заведомо является все прост* ранство Т. Более наглядное описание линейной обошзчки [S] дает следующее предложение: Предложение 3. Линейная оболочка [S] множества S состоит из всевозможным; линейных комбинаций A) k\X\ + . . . + kmXmy XU ... >*т ^ 5> *Ь • • м &т е К, векторов из S. Доказательств о. Если & — подпространство, со* держащее S, то оно, очевидао, содержит все векторы 9
вида A). С другой стороны, ясно, что совокупность всех векторов A) является подпространством, содержащим S. ? Из этого предложения следует, что множество векторов пространства Т тогда и только тогда полно, когда оно порождает все Т. О Напомним (см. лекцию 1.12), что два множества векторов называются линейно эквивалентными, если каждый вектор любого из множеств линейно выражается через векторы другого множества. Ясно, что это равносильно тому, что вектор тогда и только тогда представляет собой линейную комбинацию векторов одного множества, когда он является линейной комбинацией векторов другого множества, т. е., согласно предложению 3, — тому, что линейные оболочки обоих множеств совпадают (оба множества порождают одно и то же подпространство). В отличие от пересечения, объединение подпространств, вообще говоря, подпространством не является. Чтобы получить подпространство, надо от объединения перейти к его линейной оболочке. Определение 3. Суммой J] &*а произвольного семей- а ства подпространств ^aciT называется линейная оболочка их объединения: a L a J Для двух подпространств SP и Q <? + С2 = [<Р(L]. Ясно, что любая линейная комбинация векторов из 5* (J Q имеет вид х + у, где х е ^\ у е Q. Этим доказано следующее предложение: Предложение 4. Сумма & + Q подпространств & и Q состоит из всевозможных векторов вида х -f- у, где х е Аналогичное предложение имеет место, конечно, и для суммы любого семейства подпространств. До сих пор мы никак не использовали предположение о конечномерности линеала Т. Рассмотрим теперь вопросы, где это предположение существенно. ю
Пусть п = dim У. Предложение 5. Для размерности dim^ произвол** ного подпространства 3>czy° справедливо неравенство dim^<n. От студентов можно услышать и в некоторых учебниках прочитать следующее рассуждение, якобы доказывающее предложение 5: любые п -f- 1 векторов подпространства ^, являясь векторами л-мерного пространства Т, линейно зависимы; поэтому подпространство 9> не может содержать более чем п линейно независимых векторов и, следовательно, dim 9* ^ п. Недостаточность этого рассуждения состоит в том, что в нем предполагается конечномерность подпространства 9, никак непосредственно не вытекающая из конечномерности пространства У3. Фактически оно доказывает лишь, что если в 9 существует базис, то этот базис содержит не более п элементов. Поэтому доказывать предложение 5 приходится другим, более сложным рассуждением. Доказательство предложения 5. Если ^= = 0, доказывать нечего. Если 9 ф О, то существует отличный от нуля вектор е\ е ^\ Если 9* = [ei], то ех будет, очевидно, базисом в #*, и потому dim^ = l. Если & ^ i*iL то в ^ существует вектор е2у линейно не выражающийся через е\9 т. е. такой, что векторы еи с2 линейно независимы. Бели 9* = [в\, е2], то е\9 е2 будет базисом в ^, и, значит, dim 9> = 2. Если же 9> ф [еи е2], то в & существует вектор е3, линейно не выражающийся через векторы ей е2, и т. д. Так как dim T = я, то этот процесс должен закончиться не позже того, как появится вектор еп. Следовательно, подпространство 3* конечномерно и AxmSP^n. ?¦ Если dim^ = /z, то любой базис в 9, являясь линейно независимым семейством, состоящим из п векторов, будет базисом и в Т. Поэтому <P = Y. Если же д\т&< < л, то базис в 9>, имея менее п векторов, не может быть полным семейством в Т и, значит, не порождает Т. Поэтому 5* ф F. Таким образом, подпространство tPczY тогда и только тогда совпадает с Т, когда dim 5*= dim У*. ? Теорема 1 (о размерности суммы подпространств). Для любых двух подпространств $Р и Q .11
справедлива формула dim E* + 0 = dim 9 + dim Q — dim (^ Л О* Доказательство. Пусть dim 5s = p, dim # = q, dim (^ П Q) = >"• Рассмотрим в jP"fl-<? произвольный базис еь .,., ег. Добавляя к этому базису вектор за вектором, мы в конце концов получим некоторый базис B) е.и • • •> *r> /ь • • -> fp-r подпространства &zd<P[\Q. Аналогично, и в подпреет* ранстве Q мы можем построить базис вида C) ех,.¦, еп gu ..., gq-r- Теорема 1 будет, очевидно, доказана, если мы покажем, что р ^ q — г векторов \V &U < • • i &п fU ¦ • • > fp—n gu • ¦ • > ffg-r составляют базис подпространства 9* + ??. Линейная независимость. Пусть *i*i + • *. + krer + l\fi +¦•••+ lp-rfp-r + + mxgx + .. • +-»<-т**-г = 0. Полагая e «s ^jej + . ¦. + &rer, f «= /i/i + . • . + lp-rfp-r> g = mtf i + •.. +mq„rgq_n мы получим такие векторы ее^Пб, fe^ и g&Q, что е + f +; g = 0. Тогда е + f — ^, и тготому g = = —(e+f)&&>. Значит, ge^n^, и, следовательно, вектор g линейно выражается через векторы еи .¦,, ег. Но, по условию, вектор g линейно выражается через векторы gu ..., gp-r. Поскольку два различных выражения через базис C) одного и того же вектора существовать не могут, этим доказано, что оба выражения имеют равные нулю коэффициенты. Таким образом, mi =0, ... •\ ., ntq-r = 0, <и, значит, g = 0. Но тогда е + f =a 0, и, следовательно ^поскольку :B) — базис) fei=0, ,.., АГ = 0, /i=0, ..., Vr=^0. Этим доказано, что векторы D) линейно независимы. Полнота. Любой вектор из tP^ + Q имеет, как мы знаем, вид х^-_ у} где х щ &t уш@. Сложив разложение \2
вектора х по базису B) с разложением вектора у ио базису C), мы, очевидно, получим представление вектора х -\-у в виде линейной комбинации векторов D). Следовательно, семейство D) векторов подпространства iP-H? полно. Являясь линейно независимым и полным, семейство D) представляет собой базис. ? Следствие 1. Если 0> + Q = y, то dim@>fpCf)=a = р + q — п. Следствие 2. Если р + q > я, то <Р[\B ФО. Как вычислять размерность подпространства? Ответ на этот вопрос зависит, конечно, от того, каким способом подпространство задано. Поэтому каждый раз, ког* да нам встретится новый способ задания подпространств, мы будем к этому вопросу возвращаться. Пока же нам известен, по существу, один способ эффективного задания подпространств, а именно как линейной оболочки некоторого конечного множества векторов. Поэтому наш общий вопрос конкретизируется в задачу о вычислении размерности dim[S] линейной оболочки произвольного (конечного) множества векторов S. Этой задачей мы сейчас и займемся. Пусть S — произвольное конечное множество векторов. Без ограничения общности мы можем считать, что оно содержит отличные от нуля векторы и, следовательно, обладает линейно независимыми подмножествами. В силу конечности числа векторов в S, среди этих подмножеств есть максимальные, т. е. такие, что от приеое-< динения к ним любого другого вектора из 5 они превращаются в линейно зависимые множества. Поскольку это возможно только тогда, когда присоединяемый вектор линейно выражается через векторы подмножества, мы получаем, что любое максимальное линейно независимое подмножество So множества S линейно эквивалентно всему множеству 5, т. е. (см. выше) порождает то же подпространство [5]. Это означает, что множество So полно в [S], а так как оно, кроме того, и линейно независимо, то, следовательно, после произвольного зануме- рования, оно становится базисом в [S]. Итак, каждое максимальное линейно независимое подсемейство множества S является базисом линейной оболочки [S]\ множества S, ¦ 13
-' Поскольку все базисы любого пространства состоят из одного и того же числа векторов, отсюда, в частности, следует, что все максимальные линейно независимые подмножества множества S состоят из одного и того же числа векторов. Определение 4. Число векторов максимального линейно независимого подмножества множества S называется рангом множества S. Согласно только что сказанному это определение корректно. Кроме того, мы видим, что справедливо следующее предложение: Предложение 6, Размерность dim [5] линейной обо* лочки множества векторов S равна рангу этого множества. ? На первый взгляд это предложение представляется малосодержательной тавтологией. На самом деле его содержание весьма глубоко, поскольку оно отождествляет интересующее нас число dim [5] с неким числом (рангом), для которого существует, хотя бы принципиальная, возможность вычисления в конечное, заранее оцениваемое, число шагов, т. е. которое, как говорят, эффективно вычислимо. Действительно, чтобы вычислить ранг, можно, например, последовательно перебирать все подмножества множества 5 (а их конечное число!) и для каждого подмножества определять, не будет ли оно линейно независимо (что также осуществляется в конечное число шагов). Таким образом, значение предложения 6 состоит в том, что оно указывает конечную процедуру вычисления размерности подпространств (в случае — подчеркнем, — когда подпространства заданы как линейные оболочки конечных — для эффективности это обязательно! — множеств векторов). Конечно, за счет разумной организации вычислений объем необходимых вычислений можно существенно уменьшить. Соответствующую методику мы рассмотрим в следующей лекции.
Лекция 2 ТЕОРЕМА О РАНГЕ МАТРИЦЫ. - РАНГ ПРОИЗВЕДЕНИЯ МАТРИЦ. — ТЕОРЕМА КРОНЕКЕРА — КАПЕЛ- ЛИ.— РЕШЕНИЕ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ. Ответ на поставленный в конце предыдущей лекции вопрос-о рациональном методе вычисления ранга множества векторов зависит, естественно, от способа задания этих векторов. Мы рассмотрим лишь один, но зато самый важный вариант, когда векторы задаются их коор^ динатами в некотором базисе. Это все равно, что счи- тать наши векторы принадлежащими пространству векторов-строк К". Итак, пусть нам даны т векторов «1 = (^1Ь •••, Clin)9 ат — (атЪ • • •» Ятя) пространства Кя. Расположив компоненты этих векторов в виде прямоугольной матрицы (ап ... а\п а>т\ • • • о>тп мы можем переформулировать интересующую нас задачу в следующем окончательном виде: Дана прямоугольная матрица B). Чему равен ранг множества ее строк? В этой формулировке мы и будем ее решать. Пусть 1^/7^ min(m, n). Выбрав в матрице А произвольным образом р строк и р столбцов и рассмотрев элементы, находящиеся на их пересечении, мы получим квадратную «подматрицу», имеющую р строк и р • 15
столбцов. Определители таких подматриц называются минорами порядка р матрицы А. Определение 1. Наивысший порядок отличных от нуля миноров, т. е. такое число р, что в матрице А нет отличного от нуля минора порядка р+ 1, но есть такой минор порядка р, называется рангом матрицы А. Заметим, что если все миноры порядка р+ 1 равны нулю, то все миноры порядка р + 2 также равны нулю, поскольку по формуле разложения определителей любой такой минор является линейной комбинацией миноров порядка р+ 1. Равны нулю, конечно, и все миноры большего порядка. Ясно, что ранг р матрицы B) удовлетворяет нера* венствам 0</?<min(m, п), причем р = 0 тогда и только тогда, когда все элементы матрицы равны нулю. Перебирая один за другим миноры все больших и больших порядков, мы в конечное число шагов всегда можем вычислить ранг произвольной матрицы. Поэтому ответ на поставленный выше вопрос дает следующая теорема: Теорема 1 (о ранге матрицы). Ранг произвольной матрицы равен рангу множества ее строк. Доказательство. Заметим прежде всего, что при любой перестановке строк или столбцов матрицы А множество всех ее миноров каждого порядка биективно отображается на множество миноров того же порядка преобразованной матрицы, причем отличные от нуля миноры переходят в отличные от нуля миноры. Следовательно, при каждой такой перестановке ранг р матрицы А не меняется. Что происходит с рангом строк? Ясно, что при пере* становке строк он не меняется. Перестановка же столбцов сводится к одновременному переобозначению компонент всех векторов A), от чего все имеющиеся между етими векторами (или между частью их) линейные зависимости очевидным образом не меняются. Поэтому ранг множества строк матрицы А при любой перестановке столбцов также остается прежним. Поскольку перестановкой строк и столбцов мы можем добиться того, чтобы отличный от нуля минор по* рядка р матрицы А оказался в левом верхнем углу, от- 16
сюда следует, тао при доказательстве равенства р = г мы можем без ограничения общности предполагать, что Д = «и'... а\р; 9*0. I ар\ ... аРр\ Если бы теперь первые р строк матрицы А были ли« нейно зависимы, то строки определителя А также, оче« видно, оказались *бы линейно зависимы « потому опреде« литель был бы равен нулю. Это доказывает, что строки й\у ..., ар матрицы А линейно независимы, и, следова* тельно, р ^ г. Поэтому для доказательства равенства р = г достаточно установить, что любая строка аь с i > p линейно выражается через строки аь ..., ар. С этой целью мы рассмотрим следующий определи* тель порядка р'+Ч: C) в-11 а,2\ а\р a\j dip a2j «pi an мрр ^ip ац где 1 ^ / ^ п. Бели 1 ^ / ^.pt то овредедижель C) имеет два оди«а«®вых столбца и петому равен нулю. Если же р + 1 <: ] ^ л, то шреде&и-вель C) дредстав- ляет собой мин®р матрицы А порядка р + 1 (волучаю- щий выбором первых ф строк и столбцов м, лфоме того, "tf-rd столбца и i-й строки) и потому также равен нулю. Следовательно, р&здшжаш этот олределшгель по зья&емен- там последнего езшьбца, мы при лщбом j = 1, ... л п получим равенство вида D) Ахаи + А2а2} + ... + Apapi + АаИ = 0, где Ль Л2, ..., APt А — ддяебрашеские дапшшеяия элементов этого столбца. Эти алгебраические дополнения зависят только от элементов, находящихся в первых р столбцах определителя C), и, в частности, одни и яге же для всех /. Поэтому в векторной записи п равенств D), равносильны одному равенству вида AiUi + А2а2 + ... + Арар + Ащ — 0. 17
Поскольку, по условию, А Ф О, это доказывает, что век-* тор Hi, р + 1 ^ i ^ п, линейно выражается через векторы аи ..., ар. Следовательно, г = р. ? Изложенное доказательство показывает, в частности, что если в матрице А имеется отличный от нуля минор порядка ру обладающий тем свойством, что все ^.окаймляющие» его миноры порядка р + 1 равны нулю, то ранг матрицы равен р. ? Это замечание существенно упрощает, конечно, вычисление ранга. В частном случае, когда матрица А квадратная, а ее ранг равен ее порядку, мы получаем Следствие. Определитель тогда и только тогда отличен от нуля, когда его строки линейно независимы. ? Ясно, что при транспонировании матрицы А ранг р не меняется. Вместе с тем ранг строк транспонированной матрицы равен рангу столбцов исходной матрицы. Это доказывает, что ранг множества строк произвольной матрицы равен рангу множества ее столбцов. D Удивительный результат, связывающий ранги семейств векторов двух линейных пространств, имеющих, вообще говоря, даже различные размерности! Что происходит с рангом при умножении матриц? Пусть А — матрица, имеющая (как и выше) п столбцов и m строк, а В— матрица, имеющая п строк и s столбцов. Тогда определена матрица ЛВ, имеющая m строк и s столбцов. Если г (А) — ранг матрицы А и г (В) —ранг матрицы В, то что можно сказать о ранге г(АВ) матрицы АВ? Оказывается, что в общем случае можно лишь утверждать, что ранг г(АВ) не превосходит наименьшего из рангов г (Л) и г (В): Предложение 1. Имеют место неравенства r(AB)^r(A), r(AB)^r(B). Доказательство. Пусть (ЙЦ...ЯМ\ /ЪП...Ь18\ /*lf...0l*\ ...... ), В = ( . . . . ), АВ = ( • ). По определению умножения матриц п /=1 18
Введем в рассмотрение векторы-строки матриц В и С: Ь{ = (Ьц9 ..., bis), С1 = (сп, .;., ds), bn = {bnu ..., bns), cm = (cmb ..., cms). Тогда формулы для cm можно будет переписать в следующем виде: п означающем, что векторы С\, ..., ст линейно выражаются через векторы Ь\, ..., Ьп. Следовательно, [сь • ••> ст] cz[bit ..., 6rt], и потому dim [c{9 ... cm] < dim [bif ..., ftn], т. е., по теореме о ранге матрицы, r(AB)^. r(В). Неравенство г(АВ)^г(А) доказывается аналогично Г(следует только вместо строк рассмотреть столбцы). Впрочем, его можно вывести из уже доказанного неравенства, если воспользоваться тем, что при транспонировании ранг не меняется и (АВ)Т = ВТАТ. Действительно, г (АВ) = г ((ЛВ)Т) = г (ВГАТ) < г (Лт) = г (А), а В случае, когда одна из матриц А или В является квадратной и невырожденной, можно доказать более точный результат: Предложение 2. Если В — квадратная (я=$) и невырожденная (det В Ф 0) матрица, то для любой матрицы А г(АВ) = г(А). Аналогично, если А — квадратная (п = т) и невырожденная (det А Ф 0) матрица, то для любой матрицы В г(АВ)=г(В). Короче, при умножении на невырожденную матрицу ранг матрицы не меняется. Доказательство. Для невырожденной матрицы В существует обратная матрица В и А = (АВ)В~К Поэтому, согласно предложению 1, r{A) = r({AB)B~l)^r(AB). 19
Следовательно, r(A) = r(AB). Равенство г(В)=* = г(АВ) для невырожденной матрицы А доказывается аналогично. ? Теорема о ранге матрицы позволяет не только эффективно вычислять ранги и находить максимальные линейно независимые подмножества, но с ее помощью можно, например, устанавливать, выражается ли данный вектор Ъ через данные векторы а\, ..., ат, без того,'чтобы в явном виде находить коэффициенты линейной зависимости. Действительно, очевидно, что вектор Ь тогда и только тогда линейно выражается через векторы й\, ..., am, когда каждое максимальное линейно независимое подмножество множества аи ..., ат является максималь* ным линейно независимым подмножеством и расширенного множества аи ..., ат, Ъ и, значит, когда ранг мно« жества аи ..., ат равен рангу множества а\, ..., вт, Ь. ? Полезно этот факт переформулировать на языке теории линейных уравнений. Если «i = (au, ..., ain), Ь = (Ьи ..., Ьп), то векторное равенство E) х\ах+ ... + хтат = Ь равносильно п числовым равенствам &llX\ + ..-.+ йт\Хт = &!,. F) <*\пХ\ + • • • + атпХт — Ьп. Соотношения F) представляют собой систему п неоднородных линейных уравнений от т неизвестных. Эта система совместна, т. е. обладает хотя бы одним решением хи f.-> xm, тогда и только тогда, когда имеет место равенство E), т. е. когда вектор Ь линейно выражается через векторы ai, *,., aOT, 20
С другой стороны, iiro теореме i ранг множества векторов й\, • ••> <*т равен .рангу матрицы коэффициентов (Яп ... вцц\ • • ¦ " • J ащ ... атл/ G) системы *(&), а ранг множества векторов Hi, >.., ат> равен рангу расширенной матрицы коэффициентов , . .... 4>г (8) (•«и ••• «mi Ь\ Л получающейся из матрицы G) добавлением столбца свободных членов. Этим доказана следующая теорема: \Георема 2 (теорема Кронекера— Ка'пел-* л и). Система линейных уравнений F) тогда и только рогда совместна, когда ранг матрицы ее коэффициентов G) равен рангу расширенной матрицы (8). Пусть система F) совместна. Как найти все ее ре-* шения? Пусть г—ранг матрицы G). Переставив уравнения и переименовав (если нужно) неизвестные, мы без ограничения общности можем считать, что (9) А = an ... flri фо. \air ... а} Так как система *{6) по условию совместна, то по теоре* ме Кронекера — Капелли ранг матрицы (8) также равен г. Это *таначает '(ввиду условия (9)), что первые г строк тягатрюцы (8) -(т. е. первые г уравнений F)) линейно тезависимы и любая другая строка матрицы (8) (любое другое уравнение (б*)) является их линейной комбинацией. Поэтому система F) равносильна системе anxi + ... + а 1 кГ + ... + amlxm == bu (Ю) airXi + . • • + Mr + ... + amrxm = bn состоящей из ее первых г уравнений, т. е. любое решение системы F) будет решением системы A0) и, цаоборот, любое решение системы A0) будет решением системы [F). Таким образом, все свелось к решению системы |l0), состоящей из линейно независимых уравнений. 21
Чтобы решить эту систему, мы перепишем ее в виде апх\ + ... + arXxr = Ьх — ar+u ,*r+1 — ... — атХхш aXrxx + ... + arrxT = br — ar+Urxr+\ — ... — amrxm. Если мы дадим неизвестным хг+ь ..., xm произвольные значения, то система A1) превратится в систему г уравнений от г неизвестных xh ..., хг с отличным от нуля (в силу (9)) определителем А. Поэтому по известным из курса алгебры формулам Крамера мы можем единственным образом найти неизвестные Х\, ..., хг* Ясно, что этот прием даст нам все решения системы A0) (т.. е. системы F)). На практике, конечно, нет нужды в предварительной перестановке уравнений и в переименовании неизвестных. Процедура решения произвольной системы линейных уравнений F) состоит поэтому в следующем: Этап 1. Вычисляя миноры матрицы коэффициентов G), находим ее ранг г, одновременно обнаруживая хотя бы один отличный от нуля минор А порядка г. Этап 2. Окаймляя найденный минор в матрице (8), убеждаемся, что ранг этой матрицы также равен г. (Если он больше г, т. е. равен г+ 1, то система F) несовместна.) На этом этапе достаточно, очевидно, вычислить только п — г миноров порядка г + 1. Этап 3. В минор А входят коэффициенты при г неизвестных в г уравнениях. Оставляя только эти уравнения, придавая остальным п — г неизвестным произвольные значения и, следовательно, получая систему г уравнений от г неизвестных с отличным от нуля определителем, решаем эту систему по формулам Крамера. Тем самым мы найдем значения и остальных г неизвестных. Полученные на этапе 3 значения неизвестных я\9 ..< .*., хт являются решениями системы F), и любое решение этой системы может быть так получено.
Лекция 3 ПРЯМЫЕ СУММЫ ПОДПРОСТРАНСТВ. — РАЗЛОЖЕНИЕ ПРОСТРАНСТВА В ПРЯМУЮ СУММУ ПОДПРОСТРАНСТВ. — ФАКТОРПРОСТРАНСТВА. — ГОМОМОРФИЗМЫ ЛИНЕЙНЫХ ПРОСТРАНСТВ. — ПРЯМЫЕ СУММЫ ПРОСТРАНСТВ. Пусть 9* и Q — подпространства линейного пространства Т. Напомним, что их сумма 9* + Q состоит из всех векторов вида х + у, где х е 9>у у е Q. Определение 1. Подпространство 8*-\-Q называется прямой суммой подпространств 9* и Q, если каждый его вектор единственным образом представляется в виде х + у, х е= 9>у у е= Q. В этом случае вместо 9* + Q пишут 9> @Q или 9>-\-Q. Предложение 1. Подпространство 9> + Q тогда и только тогда является прямой суммой подпространств 9* и Q, когда эти подпространства дизъюнктны, т. е. Доказательство. Если имеет место равенство х + у = х{ + уи где ж, *i €= 5* и у, yiG$, to вектоо х — хх = ух — у лежит в 9* Л Q- Поэтому, если 9> f| Q = О, то х = Xi и у = уи т. е. представление каждого вектора из 9> + Q в виде х + у, х е ^*, у е Q, единственно. Обратно, если &()Q ФО н aetPflQ, афО, то для любых векторов xs^ye^ будет иметь место равенство х + У = (х + а) + (у — а), где х-{- а^9* и у — ве^. показывающее, что представление векторов из 9* + Q в виде х + у, х е 9>у у е Q, не единственно. П Имеет смысл, конечно, говорить и о прямой сумме произвольного числа подпространств. Например, сумма 9* + B + 91 трех подпространств называется прямой, 23
если представление каждого вектора из $Р + Q + $ в виде х + у + г, где ж е ^, у е(?, гей?, единственно. По аналогии с предложением 1 хочется думать, что для этого необходима и достаточна попарная дизъюнктность пространств &, Q и 3?. Зго неверно. Например, для лю- бых двух неколлинеариых векторов а и Ь подпространства 9* = [а], ?? = [Ь], 5Z = [а + 6] попарно дизъюнктны, но тем не менее их сумма & + ^ + 9t = [a, 6] прямой не является. >; Правильное условие того, что сумма SP + Q + 5Z яв- ляется прямой суммой, дается следующим предложением: Предложение 2. Сумма 3> + ($-{-& трех, подпро* странств тогда и только тогда является их. прямой суммой, когда каждое из них дизъюнктно с суммой двух других: О) ^п(?+$) = о, $п(р + т = о, ;%п(^ + ?) = о. Доказательство. Если имеет место равенство * + У + z = хх + ух + 2Ь где х, *i е= 5*, у, yi ge Q, г, Zi €=52,to ж —*i =(yi — y) + Bi — 2)e5z,n(^ + ^). Поэтому, если х\Фху то &(](?$ + &)ф0. Аналогично, если У\ФУ, то QП(^ + 52)#0, а если *i#2, то Ш()(& + Q)ф< Ф0. Таким образом, если сумма 0* -\-Q-\-ffl, не прямая, то не все условия A) выполнены. Обратно, если, например, &(){С! + Я)фО и ае^П№ + ^), *Ф0, то для любых векторов jre^, y&Q, z&ffl имеет место равенство х + у + г = (х-а) + (у + Ь) + (г + с), где JgC се 52— такие векторы, что е = *--{-с, и потому сумма &'¦+$'+Я не является прямой. ? Конечно, аналогичное предложение справедливо и для сумм любого числа подпространств. Особо важное значение имеет случай, когда & ©# — = Т. В этом случае говорят, что пространство Т разложено в прямую сумму подпространств 9> и Q. Рассмотрим следующие свойства подпространств # и#: 1° Любой вектор из Т имеет вид х -+- у, где х е д*г уе=@,т.е.Т=&> + & 29 Подпроетра«ства & и> # даеадошдага, т. е. ^Пб== 24
Зр Сумма размерностей подпространств ^ »С равна размерности пространства Т\ dim &+ dim U = ЛтГ. Предложение 3. Любые два из свойств 1°, 2°, 3° еле* кут третье. Доказательство. Если имеют место свойства Г и 2°, то по теореме о размерности суммы (см. теорему 1 лекции 1) dimF==dim(^ + ?) = = dim & + dim Q + dim (@ П Q) = = dim ^ + dim #. Если имеют место свойства 1° и 3°, то по той же теореме dim (&> (\ф = dim (9 + 0 — dim^ — dim Q = = dim Г ~ dim ^— dim С = О, значит, ^n# = &. Если имеют место свойства 2° и 3°, то снова по той же теореме dim (^ + 0) = dim 9 + dim Q = dim Г, и, значит, ^ + С = У. ? Согласно предложению 1 свойства Г и 2° означают» что Т = & (&Q. Тем самым доказано Следствие. Равенство У° =<Р@(? имеет место тогда и только тогда, когда выполнены любые два из свойств Г, 2°, 3° (а значит, и третье свойство). Определение 2. Если Т = ^ ф С то подпространства № ylQ называются дополнительными. Предложение 4. Если подпространства ^йб допол~ нительны, то для любого базиса е\, ..., вр подпростран* ства 9* и любого базиса ер+ь ..., еп подпространства Q векторы 6\9 . . . ,?р, ?p + i, • • • >0д будут составлять базис пространства Т. Обратно^ если произвольный базис ей •.., е« про* странства У разбить на два подсемейства ей ..., ер и ер+и ..., ел, то подпространства ^ = [еь . ¦., ep] u Q= [ep+i, ..., е„] будут дополнительны. Доказательство. В первом утверждении векторы еи ..., ер, ер+\у ..., еп составляют полное семейство^ 25
состоящее из п = р + Я векторов. Поэтому оно является базисом. Во втором утверждении подпространства 3> и Q обладают указанными выше свойствами 1° и 3°. Поэтому Г = 0>@в. D Следствие. Для любого подпространства &* czT существует дополнительное подпространство Q. Доказательство. Пусть еи ..., ^ — произвольный базис подпространства 3*. Дополним этот базис какими-то векторами ер+ь ..., еп до базиса всего пространства F. Тогда подпространство в = [ер+и • ••» еп] будет дополнительным к ^\ П Видно, что дополнительное пространство Q строится с большим произволом. Оказывается, что существует конструкция, позволяющая этот произвол обойти (хотя бы и частично). Пусть 5*— произвольное подпространство линейного пространства Т. Определение 3. Векторы х, у е Т называются сравни- мыми по модулю 9>у если х — у^&. В этом случае пишут #==ymod^. Отношение сравнимости является, очевидно, отношением эквивалентности. Соответствующие классы сравнимых по модулю 3> векторов называются смежными классами пространства Y по подпространству ^. Ясно, что класс, содержащий вектор х, состоит из всех векторов вида дс + а, as^, Мы будем его обозначать символом х + &. Другое распространенное обозначение: xmod^. Легко видеть, что сравнения можно складывать и умножать на числа, т. е. если xz~ymod!? и *i гз у{ mod ^, то * + *i = У + У i mod & и kx == ky mod ^ для любого числа fteK, Действительно, если х — уе9> и хх — У\*=к&> то (x + xi) — (У + У\) = (х — у) + ,+ (*i —Vv) <= ^, и, аналогично, kx — ky — k{x — у) ^ &>. Для смежных классов это означает, что формулы B) (* + П+(? + ^) = (* + ») + ^ 26
й C) k(x + 0>) = kx + 0> корректно определяют их сумму и произведение на число. Непосредственная проверка показывает, что эти операции удовлетворяют аксиомам линейного пространства. Таким образом, по отношению к операциям B) и C) множество всех смежных классов Y по 9* является линейным пространством. ? Определение 4. Это пространство называется фактор- пространством пространства Y по подпространству 5?. Обозначается оно символом YI&. В первом семестре в курсе алгебры аналогичная конструкция была подробно изучена для случая групп и колец. Предложение 5. Каждое подпространство (?, дополнительное к подпространству !Р> изоморфно факторпро- странству Y/&. Доказательство. Рассмотрим отображение ср: Q -> YI&, определенное формулой Ф (х) = х + &, где х е= Q. Если <p(*) = <P(*i), T- e- * + ^ = *1 + ^» то х — х\&?Ру и, значит, х — х\. С другой стороны,любой вектор ге?° имеет вид х + у, где x^Q, je^, и потому z -Ь & = = х + &>. Этим доказано, что отображение ф биективно. Поскольку отображение ф, очевидно, сохраняет суммы и произведения на числа, оно является, следовательно, изоморфизмом. ? Геометрический факт, лежащий в основе предложения 5, состоит в том, что каждый смежный класс по 3* имеет с Q ровно один общий вектор. Предложение 5 означает, что вместо дополнений Q мы можем рассматривать факторпространство Y/&, конструкция которого никакого произвола не содержит. Из предложения 5 вытекает, что D) dim YI& = dim Y — dim ^. Действительно, dim Y/& = dim U == dim Y — dim &. П Пусть Y, и Wl — два линейных пространства. 27
Определение 5. Отображение <р: Г-+Ж называется линейным отображением или гомоморфизм мом (а также просто морфизмом) линейных пространств, если оно сохраняет линейные операции, т. е. если Ф<* + У)= фН+<Р<») и f {kx) = ky{x$ для любых векторов х, у е У и любого числа k e К. Таким образом, отличие гомоморфизмов от изоморфизмов состоит только в том, что гомоморфизм не обязан быть биективным отображением. Определение 6. Совокупность всех векторов х&У9 переходящих при гомоморфизме ср в нуль пространства Ж, называется ядром гомоморфизма ср и обозначается символом Кег ф. Таким образом, Кег ф = {х е= Г; ф (х) = 0}. Определение 7. Совокупность всех векторов из Ж, имеющих вид ф(*), *^У, называется образом гомоморфизма ф и обозначается символом 1тф: 1тф = {уе=7/*;у = Ф(*)}. Иногда 1т ф обозначают также символом (р{Т) и называют образом пространства У при гомоморфизме ф. Очевидно, что множества Кег ф и 1тф являются под- пространствами (пространств У и Ж соответственно). Факторпространство Ж/lm ф обозначается символом Coker ф и называется коядром гомоморфизма ф. Гомоморфизм ф называется мономорфизмом, если он является инъективным отображением, т. е. если q>(x) = = ф(*1) при хфхх. Гомоморфизм ф называется эпиморфизмом, если он отображает У на Ж, т. е. если для любого вектора у<^Ж найдется такой вектор х^У, что у = у{х). Таким образом, гомоморфизм ф тогда и только тогда представляет собой изоморфизм, когда он является одновременно мономорфизмом и эпиморфизмом. По определению гомоморфизм ф тогда и только тогда является эпиморфизмом, когда Im ф = Ж, т% е% когда Coker ф = 0. ? 28
Аналогично, легко видеть, что гомоморфизм ф тогда и только тогда является мономорфизмом, когда Кег ф = = 0. Действительно,если ф(ж)= ф(*1),то ф(* — *i)=0,; и потому х — *i е Кег ф. Следовательно, если Кег ф = 0, то х = Хь Обратно, если из <р(х) = ф(х1) следует, что х = х\, то, в частности, ф(х)>=0 тогда и только тогда, когда х = 0. Следовательно, Кег ф = 0. ? Если Кег ф = 0, то ф, очевидно, представляет собой изоморфизм пространства Т на подпространство Im ф с <zz Ж. Поэтому dim Im ф = dimF. Отсюда следует, что если Кег ф = 0м dim Т =¦ dim Ж, то гомоморфизм ф лв- ляется изоморфизмом. Действительно, тогда dim Im ф = sr= dim Ж, и, значит, Im ф = Ж. П При КеГф=/=0 целесообразно ввести в рассмотрение факторпространство Г/Кегф, , которое называется иногда кообразом гомоморфизма ф. Очевидно, что формула Ф'(* + #) = ф(*>. *е=У, корректно определяет некоторый гомоморфизм ф': У/Кегф->ЗР, называемый индуцированным гомоморфизмом, и, как нетрудно видеть, гомоморфизм ф' является изоморфизмом факторпространства F/Кегф на подпространство 1тф. В частности, мы видим, что для любого эпиморфизма ф: Т-*Ж пространство Ж изоморфно факторпростран- ству^/КеГф. П Кроме того, так как dimF/Kertp = dimT — dim Кегф, то для любого гомоморфизма ф: Т-+Ж имеет место формула E) dim Кег ф + dim Im ф = dim У. Все эти утверждения, за исключением формулы E), имеют весьма общий характер и справедливы, как мы знаем из курса алгебры первого семестра, для любых групп и колец. Вернемся теперь к прямым суммам. Пусть 9> и Q — произвольные линейные пространства (над одним и тем же полем К). Рассмотрим множество У всех пар вида (#, у), где x^SPyy ^Q. Полагая (*> У) + (*ь Уд = (* + *и У + У\) 29
и k (*, у) = (kx, ky), мы, очевидно, превратим У в линейное пространство* Определение 8. Построенное пространство У называется прямой суммой пространств & и Q (иногда — внешней прямой суммой, чтобы отличить ее от рассмотренной выше «внутренней» прямой суммы, когда пространство У было задано заранее, а 9* и Q были его подпространствами). Эта терминология оправдывается тем, что векторы из У вида (х, 0), же^\ составляют подпространство &% ивоморфное пространству &у а векторы вида @, y)t #е Q,— подпространство Q> изоморфное пространству Q. Кроме того, подпространства Ф и Q дизъюнктны (имеют общим только нулевой вектор @, 0)) и в сумме составляют все У (ибо (*, у) = (х, 0) +@, у)). Таким образом, Обычно Ф отождествляют с^, а # — с # и пишут у ±= <р 0 Q или F = & 4- #¦ К недоразумениям это не приводит. Конструкция внешней прямой суммы также встречалась в курсе алгебры первого семестра применительно к случаю групп. По существу, ею же мы пользовались в первом семестре при построении комплексификаций. В следующей лекции мы рассмотрим конструкции, более специфичные для теории линейных пространств.
Лекция 4 СОПРЯЖЕННОЕ ПРОСТРАНСТВО.— ДВОЙСТВЕННЫЕ ПРОСТРАНСТВА. — ВТОРОЕ СОПРЯЖЕННОЕ ПРОСТРАНСТВО. — ПРЕОБРАЗОВАНИЕ СОПРЯЖЕННОГО БАЗИСА И КООРДИНАТ КОВЕКТОРОВ. — АННУЛЯТО- РЫ.-ПРОСТРАНСТВО РЕШЕНИЙ СИСТЕМЫ ОДНОРОДНЫХ ЛИНЕЙНЫХ УРАВНЕНИЙ. Пусть У— произвольное линейное пространство над полем К. Определение 1. Функция ?: У-> К называется линей- ным функционалом, если она является гомоморфизмом линейных пространств, т. е. если ¦6(* + l0-6(*) + 6W для любых векторов х, у eF и любого числа k e К. Линейные функционалы называются также ковекторами пространства У. Непосредственная проверка показывает, что сумма I + ц двух линейных функционалов ? и ц (определяемая формулой (| + т]) (*;)= l(x) + i)(x)) и произведение Щ линейного функционала \ на произвольное число k (определяемое формулой (k%) (x) = kl(x)) являются линейными функционалами. Это означает, что множество всех линейных функционалов представляет собой подпространство пространства всех функций на У и, значит, само является линейным пространством. Это линейное пространство обозначается символом Ti (У) или У\ Определение 2. Линейное пространство У' называет-» ся пространством, сопряженным к пространству У* 31
г- Пусть еи .",., ел — произвольный базис пространства Т. Предложение 1. Значение g(#) произвольного линей* ного функционала g на векторе * = *1ei+ м, ^-хпеп выражается формулой A) Ux) = hxl+...+tnXn, где B) Si=?(*i), ...,&. = 6(О. Для любых чисел gi, ..., ^еК формула A) однознач* но задает некоторый линейный функционал g e JP'f для которого имеет место B). Доказательство. Формула A) непосредственно вытекает из свойства линейности m>=Ux1el+...+xnen) = = xlUex) +..Л+х»Ъ (еп) =Ьх1 +...+ \пхп* Обратно, если функционал g задан формулой A), то Ux + V) = h(xl+yl)+-..+ln(xn + yn) = =>hxl + ... + tnxn + hyl + ... + g„*/ft = g(*) +%(y) и Ukx) = h(kxl)+...+ln(kxr) = = k(hXl+...+tnXn) = kl(x) для любых векторов jt,yef и любого числа feeK. Кроме того, g(e*)=grO+ ... + grl + ... +g«-0 = g;. Q У1з предложения 1 вытекает, что формула t ( 0, если г ф /, . , ' ( 1, если i = ], однозначно определяет п линейных функционалов C) е\ ...,е\ Ясно, что для любого вектора х^Т е*(х) = х1, * = 1, ...» п. Предложение 2. Функционалы C) составляют базис пространства Т\ Координатами произвольного функционала g в этом базисе являются коэффициенты B) его представления A): D) ' l=liel+...+tne\ 32
Доказательство. Для любого вектора х = =zxl€i+ .,, + хпея я любых чисел &, ,.., |«еК мы имеем &el + ...+%nen)(x) = hel(x) + ...+lnen(x) = Следовательно, если &, ..., |„ — коэффициенты <2) функционала g, то (g^1 + ... -f |Ле*| <ж) = ?(х) для любого вектора х&Т. Это доказывает формулу (Ц я полноту семейства е1, ..., еп в У% С другой стороны, если то для Любого i = 1, ..¦ у п ^• = (^+...+^еЛ)<^)=0. Следовательно, семейство е1, ..., еп линейно независимо и, значит, является базисом. D Следствие. dim Г'= dim Г. Базис е19 ,.., еп называется сопряженным к базису ей .., еп. В обозначениях Эйнштейна формула A) имеет вид Ш=Ьх\ а формула D) — вид Пусть Т и 5F—два линейных пространства над ао* лем К. Предположим, что любым двум векторам хеУ, # е W сопоставлено такое число <Ж у) е К, что выдод* нены следующие условия: а) для любого фиксированного у ^W функция х ь-> (ху у) является линейным функционалом на У\ т. е. <*1 + *2> У) = <*1> У> + <*2i У), (kxty) = k(xty) для любых векторов *i, *2, х е У и любого числа k e К; б) для любого фиксированного xeF функция V ь-> <х, у> является линейным функционалом на Жщ т. е. {x9ky) = k{xyy} Для любых векторов у4, $г, у^Жп любого числа fee К? 2 М. М. Постников, семестр II , 33
в) для любого вектора хеУ, существует такой вектор д^Ж, что <ж,у>?=0, и, наоборот, для любого вектора у ^Ж существует такой вектор х ^ У, что <*,У>?=0. Условия а) и б) называются условиями билинейности, а условие в) — условием невырожденное с ти. Определение 3. Функция ж, у ь-> <ж, у>, удовлетворяющая условиям а), б) ив), называется спариванием между пространствами f и F, Пространства F'hF, для которых существует хотя бы одно спаривание, называются двойственными. Обозначение: У\Ж. Заметим, что отношение двойственности, очевидно, симметрично, т. е. если У\Ж, тоЖ\У. Предложение 3. Любое линейное пространство УА двойственно сопряженному пространству У, т. е. У\У. Доказательство. Для любых х е У и ? е У положим <«f© = 6(«). Очевидно, что условия билинейности а) и б) выполнены (например, <ж, \х + ?2> = (h + Ы (*) = h (*) + h {x) = = <дс, %иУ + <*, ?2»- Неравенство ?=т^0 означает, что существует такой вектор х^Уу что ?(*)=т*=0. Следовательно, <х, ?>=#= 0. Аналогично, неравенство х Ф 0 означает, что **• «5^= 0 хотя бы для одного /о, и поэтому при \ = е'о имеем <*, |>= Ъ(х) = х'°=5^ 0. Таким образом, условие в) также выполнено. ? Обратное утверждение верно в следующей формулировке: Предложение 4. Если пространства У и Ж двойственны, то каждое из них изоморфно пространству, сопряженному с другим: У&Ж', ЖъУ\ Доказательство. В силу симметричности отно* шения двойственности достаточно доказать только первый из этих изоморфизмов. Пусть х&У. Согласно условию б) функция у ь-><*, у} является -линейным функционалом на Ж, т. ё. вектором пространства Ж!%. 34
Обозначая этот линейный функционал символом ф(х), мы, следовательно, получим некоторое отображение <р: Т->Ж\ Таким образом, по определению Ф (*)(*) = <*.*>• Поэтому, в силу условия а), Ф (хг + х2)(у) = (хх + хъ у) = = (*i. У) + <*2, У) = Ф (*i) (У) + Ф (*2) (у)> т. е. ф(*1 + *2) = ф(*1) + ф(*2). Аналогично, Ф (kx) (у) = (kx, y) = k (*, у) = ky (х) (у), т. е. ф(?лг) = &ф(лс). Этим доказано, что отображение ф является гомоморфизмом. Если ф(х) = 0, то <*, у} = 0 для всех у е Ж\ и, значит (условие в)), х = 0. Таким образом, Кегф = 0. Поэтому Im ф « Y, и, значит, dimT = dim Im ф < dim Ж. Но в силу симметричности отношения двойственности, если имеет место неравенство dim^^dimJP, то должно иметь место и неравенство йхшЖ ^ dim У9. Следовательно, dim3^ = dim3f, и потому, в частности, dim Im ф — dim Ж, т. е. Im ф = Ж, Это доказывает, что гомоморфизм ф является изоморфизмом. ? Поскольку Т\ТГ (предложение 3), то Y'\Y (симметричность), и, значит, Y &(Т')' (предложение 4). Этот результат настолько важен, что заслуживает звания теоремы: Теорема U Пространство (Y')', сопряженное к сопряженному, изоморфно исходному пространству: . В явном виде изоморфизм F->(F')' задается соответствием, сопоставляющем вектору хеУ функционал х на Y'9 определенный формулой *(?) = ?(*)• 2* 35
Как правило, функционал ж отождествляется с некто-' ром х и потому, в частности, обозначается просто через #. На первый взгляд теорема 1 представляется тривиальным следствием того факта, что пространства Т и (Т')' имеют одинаковую размерность. На самом же деле ее фактическое содержание состоит в том, что между пространствами Т и (У)' имеется «естественный» изоморфизм, У->(Т'У, строящийся без какого бы то ни было произвола. Именно этот факт и позволяет отождествлять х с х (и, значит, (V)' с У). Пространства Т и У также имеют одну и ту же раз-^ мерность, но никакого естественного изоморфизма между ними в общем случае установить нельзя. В нашем распоряжении пока нет необходимых для доказательства этого утверждения понятий (например, у нас нет аккуратного определения, что такое «естественный» изоморфизм), и потому мы вынуждены ограничиться доказательством того, что самая, казалось бы,, простая и естественная попытка построить такой изоморфизм к цели не приводит. Пусть е\, ..., еп — произвольный базис пространства Ту а е1, ..., е* — сопряженный базис пространства У. Можно пытаться рассмотреть изоморфизм Y->Yrr действующий по равенству координат в этих двух базисах (этот изоморфизм каждому вектору х = ххе\ + ... ... + хпеп сопоставляет ковектор ? = x*el -f ... +хпеп, имеющий в базисе е\ ..,, еп те же координаты, что и вектор х в базисе еи ..., еп)„ в надежде, что он окажется не зависящим от базиса еи *....* еп (и потому «естественным»}. Однако эта надежда не оправдывается. Чтобы показать это, необходимо рассмотреть в об* щем виде вопрос о преобразовании координат ковекто* ров при замене базиса е\, ..., еп. Мы проведем соответствующие вычисления в обозна* чениях Эйнштейна. Для этого целесообразно ввести так называемый символ Кронекера &{* определяемый фор* мулой &/= Г 0, если 1Фи \ 1, если * = /. 86
Основное свойство этого символа выражается форму* лами аЩ = а*, bf6f? = bi (действительно, в левых суммах все члены равны нулю, кроме, соответственно, членов а'-1 = а> и brl = Ы). С помощью символа Кронекера определяющее свойство сопряженного базиса записывается единой формулой: Аналогично, тот факт, что матрицы (?[!') и {б\^ взаимно обратны, может быть записан в двух равносильных видах: С. Су U.9 fcj Ь., Uj,. Имея все это в виду, рассмотрим, наряду с базисом еи ..., еП1 другой базис е{„ ..., en,t для которого где С = (су) — матрица перехода, а С = (с/) — обратная матрица. Тогда, как мы знаем (см. лекцию 1.11), для координат #? и х1' векторов будут иметь место формулы А* ' %s If At , At К* г A/ • Пусть теперь е1', ..., еп' — базис, сопряженный с базисом eyi ..., ел,. Тогда, по определению, Следовательно, Но, согласно предложению 2, для любого щшакгора 4jE^« Поэтому, в частности, и, значит, е1 = с|ег (последнюю формулу можно написать либо по симметрии, либо получить выкладкой: с\,е1' = с*,с*'е* = 6je/ = е\). 37
Аналогично, для координат & •= ¦? (е,) и %у =? (е,) произвольного ковектора ? имеем |(е,) = <!(«,), т. е. и—по симметрии (или той же выкладкой) — Мы видим, что ковекторы сопряженного базиса преобразуются как координаты векторов и, соответственно, координаты ковекторов — как векторы базиса. Принято называть преобразование базиса когредиен- тным, а преобразование координат векторов (т. е. преобразование с обратной и транспонированной матрицей) контрагредиентным. Таким образом, сопряженные базисы преобразуются контрагредиентно, а координаты ковекторов — когредиентно. О Поэтому, если в одном каком-нибудь базисе (и ему сопряженном) вектор х и ковектор g имели одинаковые координаты, то в другом базисе — из-за того, что координаты векторов и ковекторов преобразуются по разным формулам, — вектор х и ковектор | будут иметь различные координаты. Следовательно, отображение по равенству координат в сопряженных базисах зависит от базиса и никакой естественностью не обладает. Пусть SczT — произвольное подмножество линейного пространства Т. Определение 4. Совокупность всех линейных функционалов | е Y*, равных нулю на любом векторе х ^ S, называется аннулятором множества S и обозначается символом Ann S или 5°. Таким образом, AnnS = {gG=F'; ?¦(*) = 0-для любого *<= 5}. Очевидно, что S° является подпространством пространства У. При этом, если S cz Г, то S° zd T°. ? Предложение 5. Аннулятор произвольного множества S czT совпадает с аннулятором его линейной оболочках Ann 5 = Ann [S]. Доказательство. Так как S е= [5], то 5° гэ [5]°, Обратно, пусть fce'S0, Тогда для любого вектора 38
k\X{ 4- ... + kmXm из [S], где xu ...,*m e S, будет иметь место равенство Б(Ал+...+А„*^ = *1Б(*1)+...+*«?(*«)== О, так как ?(*i) = 0, ..., g(*m) = 0. Следовательно, .ge e[S]°fT. е. S°c:[S]0. D Согласно этому предложению при рассмотрении ан- нуляторов можно ограничиваться подпространствами. Ясно, что Ann 0 = У и, наоборот, если Ann S = Уч то S=={0} (ибо если ?(*)=0 для всех ^еГ, то ж = 0).П Аналогично, Ann У = 0 и если Ann S = 0, то [S] = T. Действительно, если [8]фТ и если в\9 ¦ .. ..., еп — такой базис пространства У> что [S] == = [*ь ..., е«], га < л, то en e [S]°, и потому S°^= 0. ? Предложение 6. Для любого подпространства 9>cF шиеег место равенство dim^° = tt— dim^. Доказательство. Пусть dim <Р = р, и пусть *i, • • •, fy, ..., е* — такой базис пространства F, что ^ == [*ь .,-., ер]. Рассмотрим сопряженный базис е1 ер еп Если ( ^ р и / > р, то заведомо i Ф /, и потому е' (ее) = 0. Следовательно, ер+1, ..., еп е [еь ..., ер]° = ^°. С другой стороны, если g е ^°, то |(^i) = 0, ..., ?(ер) = 0, и, значит, g = 6P+i6lH-1+ ... +6«ея. Этим доказано, что ковекторы ep+l, ..., е* образуют базис подпространства 9>°. Следовательно, dim 0** =» = я — р. П Поскольку (теорема I) У = (У)\ во всем сказанном выше Т можно заменить на У, а У — на F. В частности, для любого множества S с: У будет определено подпространство Ann ScF, состоящее из" таких векторов «Gf, что х{\) = 0 (т. е. ?(х) = 0) для любого ковектора ?eS, и размерность этого подпространства будет равна п — г, где г — размерность подпространства [S], т. е. ранг множества S. Таким образом, во-первых, подпространства пространства Y можно задавать не только как линейные оболочки, но и.«двойственным» образом, как аннуляторы 39
множеств ковектороа S — {|ь • • •» &»}г т. е. уравнениями вида E) h(x) = 0, ...,-Ы*)-0. Во-вторых, мы имеем эффективный способ вычисления размерности заданного таким способом подпространства: она равна п — г, где г — ранг множества {5ь • • • » Em}' Целесообразно переформулировать все это в терминах координат. Ковекторы ?ь • • • > Em в координатах записываются (предложение 1) линейными формами от х1\ ..., хп. Поэтому уравнения E) приобретают в координатах вид: апх{+ ....., + а1я** = 0„ F) Дт^Ч- ... +атпхп = 0, т. е. представляют собой обыкновенные линейные однородные уравнения. Мы получаем, таким образом, следующую теорему: Теорема 2. Множество всех решений (х\ ..., хп) си- стемы F) однородных линейных уравнений является подпространством пространства Кп размерности п — г, где г — ранг матрицы коэффициентов- / ап ... аы \ ат\ ... атп Чтобы найти базис этого подпространства, т. е. п — г линейно независимых решений (которые называются обычно фундаментальной системой решений), нужно, решая систему F) способом, указанным в лекции 2, придавать п—г «свободным» неизвестным п — г наборов значений, следя за тем, чтобы получались линейно независимые решения. Для этого достаточно указанные наборы выбрать так, чтобы, расположенные в квадратную матрицу порядка п — г,, они составляли бы невырожденную матрицу (проще всего, их выбрать так, чтобы получилась единичная матрица). >°
Лекция & АННУЛЯТОР АННУЛЯТОРА И АННУЛЯТОРЫ ПРЯМЫХ СЛАГАЕМЫХ. — БИЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И БИЛИНЕЙНЫЕ ФОРМЫ:— БОТШНЕИНЫЕ ФУНКЦИОНАЛЫ В СОТ1РЯЖЕННОМ ПРОСТРАНСТВЕ. — СМЕШАННЫЕ БИЛИНЕЙНЫЕ ФУНКЦИОНА- ЛЫ. — ТЕНЗОРЫ. Тот факт, что аннуляторы определены и для подмножеств пространства У',' позволяет говорлть об аннуля- торе аннулятора АппАш8 = 300 произвольного подмножества S с У°. Предложение 1. Для любого подпрострхшатв® ^<nzTA имеет место равенство (р?° — д> Доказательство. Если xg^, то \(х) = 0 для любого |е^р, т: е. #Ш = 0. Это означает* что *е^С(\ Таким образом, ^°°gz^, и, з»ачи*т,, <р00.= &>, ибо dim &°° = п — dim 5*° = п — (п — dim Р) = dim ^. П Если же S—произвольное? множество, то; очевидно, S°° = [S]. Предложение 2. Если Т = 0> ф С то V = ^° ©. <Т* При этом № ъ d' и СГ ж&'. Доказательство. Пусть dim <Р — р и dim^f = qe: Тогда р + ^ == /г и @[\ С$ = 0; Поэтому dim^°+dim:^ ==='• = (/г — р) 4- (ft —#) =¦ я. Кроме того^если ?„& ^? П Я°> то ?(дс) = 0 для любого х^Ф> и gKg)да 0-для любого-:#.& ^С?. Поэтому \{х + #)>= 0, и* значит* &(«).-=-0 для лю* бого ze=F. Следовательно, | = 0, т. е. &?(]& = О.Этим 41 i
доказано (см.' следствие из предложения 3 лекции 3), чтоГ'^^ФЗ0. Отнесем теперь каждому линейному функционалу |е^° его ограничение на подпространстве Q. Тем самым мы получим некоторое отображение % \-^ ?' пространства 9** в пространство Q\ очевидно линейное (являющееся гомоморфизмом). Его ядро состоит из всех функционалов g e 3**> для которых |U*=0, т. е. таких, что ^С°- Но, по доказанному, ^°f|^°=sO. Следовательно, отображение ?>—>?' является мономорфизмом. Пусть ц е Q'. Определим на Т функционал ?, полагая для любого вектора вида х + у, где хе^, уе$, 1(х + у) = ц(у). Ясно, что функционал g корректно определен, линеен, принадлежит ^° и ?' = л- Этим доказано, что отображение ?ь->?' является изоморфизмом. Изоморфизм Q° « &* доказывается аналогично. ? Заметим, что изоморфизмы предложения 2 «есте-. ственны». Определение 1. Функция В: х,у-+ В(х,у)<=К двух векторных аргументов ж, у^Т называется билинейным функционалом на Т, если при каждом фиксированном значении одного аргумента она является линейным функционалом от другого, т. е. В (х{ + *2> у) = В{хи у) + В (*2, у), B(kx,y) = kB(x,y) И В (х, у{ +у2) = В (х, ух) + В (ж, у2), В(х, ky) = kB(x, у) для любых векторов хи х2, ж, уи у2\ у еУ и любого числа k <= К. Примером билинейного функционала является скалярное произведение (х, у) (см. лекцию 1.13). Введенные в лекции 4 спаривания также билинейны, но их аргументы принадлежат, вообще говоря, разным пространствам. Обобщение излагаемой ниже теории на этот 42
случай принципиальных трудностей не вызывает, но, в достаточной мере громоздко. Поэтому заниматься им мы не .будем. Пусть ей • •., еп — произвольный базис пространства Т. Полагая A) *„ = Д(вь еу), мы получим для любых двух векторов х = xlei и у = yjej равенство В\х, у) = В (ei9 eft х{у] = Ъих{уК Этим доказано, что п п B) "'"i + fci*V + ... +ь2пх2уп + + bnlxny>+ ... +bnnxnyn. Как мы знаем (см. лекцию 1.14), стоящее справа алгебраическое выражение называется билинейной формой от х\ ..., хп и у\ ..., #*. Таким образом, любой билинейный функционал выражается в координатах билинейной формой с коэффициентами A) (которые для сокращения формулировок называются коэффициентами функционала В). Обратно, легко видеть, что любая билинейная форма задает (по формуле B)) некоторый билинейный функционал. Следовательно, между билинейными функционалами и билинейными формами имеется (при заданном базисе!) биективное соответствие. Коэффициенты A) билинейного функционала В составляют матрицу / Ьп ... Ь\п \ \ Ьп\ ... Ьпп J которая называется матрицей билинейного функционала В (в данном базисе). Ясно, что сумма двух билинейных функционалов и произведение билинейного функционала на число являются билинейными функционалами. Это означает, что совокупность Т2 \Т) всех билинейных функционалов на пространстве Т является линейным пространством. ? 43
При сложении билинейных функционалов их матрицы складываются, а при умножении билинейного функционала на число его матрица умножается на то же число. Это означает, что соответствие, сопоставляющее билинейному функционалу его матрицу, представляет собой изоморфизм линейного пространства Т2{Т) на линейное пространство квадратных матриц порядка п. ? С помощью матрицы В формула B) записывается в виде В(х, у)=хт, By, где, как всегда, х = X1 ' • . хп; > У*= Vх 1 • >J Ср. с лекцией 1.14, где аналогичные формулы были получены для скалярного цроиаведения. Пусть I, г\^ТЛ(Т) — два линейных функционала. Ясно, что формула Ж®ч)(х,у)=Шч(у) определяет некоторый билинейный функционал ?®Л- Определение 2. Функционал ? ® ц называется тензор- ним произведением функционалов ¦.? и т). Рассмотрим, в частности, тензорные произведения е1г®*е* ковекторов сопряжеяжого базиса. Так как е1 {х) =. i«= xl и eb{y) = yf, то (е(®е!)(х, у) = х1у!. Поэтому для функционала В'-=*Ь.ц(?*фе1) имеет место формула C) В' (х, у) - Ьц {е1 ® «О (*> У) = МУ > В частности, J3'(e/, е/)= Ьц, откуда следует, что билиней* ные функционалы е1%е*,Л, •/¦— 1, ..., п, линейно независимы (если -В/ = 0, то Ъц = 0). Кроме того, если мы возьмем произвольный функционал В = Т2C^) й ио его коэффициентам &*•/ доставим функционал -В', т>, согласно формуле (в), будет иметь место равенство'-?'-.=¦-¦?. Этим .'доказано следующее предложение: Предложение 3. Тензорные произведения 44
векторов сопряженного базиса составляют базис линей* ного пространства Т2(Т). Координатами произвольного билинейного функционала Be T2(>°) в этом базисе яв«, ляются его коэффициенты Ьц\ В частности, мы видим, что dimT2(F) = n2. Перейдем теперь к другому базису: е., = с\,ег Тогда brr = В (е.,, е;/) = с\гс\,В (е., е;) = с\гс^Ьи. Таким образом, коэффициенты билинейного функционала В в новом базисе выражаются формулой В матричной записи эта формула имеет вид В' = СТВСУ где B = (btJ), ВГ = (Ь.,Г) и С = {с\,). Ср. с лекцией 1.14. Совершенно аналогично определяются и изучаются билинейные функционалы В: ?, г|ь->В(?, ц) от ковекто- ров g, r\ e У. Единственное изменение состоит в положении индексов. Значения каждого такого функционала выражаются формулой B(l,r\) = b%T\h где bij — В{е\ &), а ?,• = \(ei) и щ = ц(ej) — координаты козекторев ? и т|. Для другого базиса, ег =с\,е1% имеем Ь"' = с\'с\'ь11. Билинейные функционалы от ковекторов составляют линейное пространство Т2(Л = Т2(П размерности п2. Тензорным произведением х(&у векто* ров х и у называется функционал из Т2 (у), определяемый формулой (х®у)(Ъ Ц) = 1(х)ц(у). 45
Тензорные произведения вида et®eh i, j— 1, ..., п9 составляют базис пространства Т2(ЗН» причем В = Ьцеь ® ef для любого функционала В<= T2{T). Более интересен случай билинейных функционалов В: х, 1>->В(х, g), один аргумент которых является вектором xgF, а другой— ковектором \^У. Такие функционалы мы будем называть смешанными. Они также образуют м2-мерное линейное пространство. Мы будем обозначать это пространство символом Т| (F). В координатах значения смешанного функционала В выражаются формулой В (*. 9 = *,'*%> где Ц = В(ег е'), а'х' = е'(х) и |; = |(е/) —координаты вектора х и ковектора ? (в сопряженных базисах е\ епи е1 еп). Определив тензорное произведение т] (g) у ковектора х\ и вектора у формулой (Л®У)(*, 1) = Л(*)Ш), мы немедленно получим, что тензорные произведения вида el (g) ej составляют базис пространстваТ\ (Т)} причем В = Це{ ® ei для любого В&Т\(У).-П В базисе et'~ci'ei коэффициенты Ь[* функционала BeTj (F) выражаются формулой D) Ы;, = с\,сЩ. Это совсем другой тип преобразования, чем для коэффициентов билинейных функционалов из Т2(Т) или T2(F). Чтобы придать ему наглядную форму, запишем 46
его в матричных обозначениях (и одновременно заново выведем). Пусть В = V»? ... *2/ > ? — Eь • • • > In)- Тогда, как легко видеть, В(х,1) = 1Вх. Пусть, далее, 1' *.»'.' (Ъ\. ... ^ В'= и, соответственно, *' = и потому Как мы знаем, и В(*, Q = ?'J3V. 6' = ЕС т. е. | = ГС-1 (координаты ковекторов преобразуются когредиентно). Поэтому \Bx = l'C~xBCx' = 1'В'х', т. е. в'=с~1вс. Это и есть формула D) в матричной записи. Вместо транспонированной матрицы С\ здесь появилась обратная матрица С. 47
Все это допускает напрашивающееся обобщение. Определение 5. Тензором типа (/?, q) на пространстве Уу где р, <7 ^ 0, называется произвольная функция Т: #i, •.., xpj ? , ..., & i—>-Г(#1, .,¦, хРу |, ..., |) р векторных аргументов *ь ..., хр и 4 ковекторных аргументов g1, ..., ?*, линейная по каждому аргументу (при фиксированных значениях других), т. е., как говорят, полилинейная. Таким образом, билинейные функционалы от векторов — это тензоры типа B, 0), билинейные функционалы от ковекторов — тензоры типа @,2) и смешанные билинейные функционалы — тензоры типа A,1). Аналогично, ковекторы — это тензоры типа A,0), а векторы, в силу отождествления У = (У)', — тензоры типа @,1). В соответствии с общими соглашениями о функциях тензоры типа @,0), вообще не имеющие аргументов, отождествляются с элементами поля К. Множество всех тензоров типа (р, q) обозначается символом Tqp (Y), причем индекс, равный нулю, опускается. Это находится в согласии с введенными выше обозначениями Т2{У), T2(T) и Т{ (У) для пространств билинейных функционалов, а также с обозначением Т\{У) для сопряженного пространства У. Согласно сказанному выше Т1(У) = Уи Tg {У) = К. Ясно, что каждое из множеств Tqv {У) является линейным пространством (относительно обычных линейных операций над функциями). Пусть еь ..., еп — произвольный базис пространства У, а е\ ..., еп — сопряженный базис пространства У\ Пусть, далее, 6!-Б}Л..м Г = Б?/<- Jl 'Я Тогда, в силу полилинейности, E) т(х{, ...,*р, g1, ...,iO=rv::^ii ••• ^^...Б/. где F) ^:::^ = r(ev..., еуеЧ...,е^} 48
Числа Т.1 ' я называются коэффициентами тензора Г. м ••• 1р Их число равно np+q. Для сокращения формул удобно ввести сложные ин~ дексы « = Pi, •.. > iP) и р = (Л, ..., /«). Полагая 7^ Wi ^<7 мы можем формулу E) записать в следующем сокращенном виде: G) r(*lf ..., xpf l\ ..., tq) = Tlx%. Эта формула означает, что в координатах любой тензор выражается полилинейной формой вида Га*а|&. Обратно, каждая полилинейная форма Т^х%$ = — т[1'.'.'. Iя х\1 ••• *рр?/ ••• ?/ задает по формуле G) некоторый функционал 1 I Х[у . . ., Хр, g , . . ., s I > 1 \Х\, • • •, Жр, 5 , • • • > ъ h очевидно полилинейный, т. е. являющийся тензором. Таким образом, при заданном базисе е1, ..., еп про- странства Т тензоры типа (/?, q) находятся в биективном соответствии с полилинейными формами вида Т^ха1^ т. е. с наборами (г?) = (Tf.1 \" М элементов поля К. П Перейдем от базиса *i, .. •, еп к новому базису е{% .¦, •.., е^. Пусть Тогда, в силу полилинейности, для коэффициентов т}"^ ==?{% •/.Л..., •'•) 1 р v 1 р * тензора Г в базисе еХ', .,., убудут иметь место формулы (8) rj'"?-*!!... с// . с}тУ"[«. 49
Это так называемый тензорный закон преобразова- нмл.Условно можно сказать, что в формуле (8) каждый индекс преобразуется независимо от других, причем нижние индексы преобразуются когредиентно, а верхние — контрагредиентно. В сокращенных обозначениях формула (8) имеет вид a' —Ca'Cft lay где положено а _ *i %p *'_ ;i '* I P 1 <7 Теорема L Предположим, что каждому базису ей ... ..., еп пространства Т сопоставлено np+q чисел т[х'" \ч , причем числа, сопоставленные различным базисам, связаны друг с другом тензорным законом преобразования (8). Тогда на пространстве Т существует единственный тензор типа (p^q), коэффициентами которого в каждом базисе еи ..., еп служат данные числа Т\1 \"\\я. Доказательство. Как выше уже было сказано, задание чисел 7У . ^==Г? в данном базисе еи ..., еп определяет по формуле Г (*„,.., хр,%>, ..., ?*) = — чх... rpxi • • • Vw, • • • % « *e некоторый тензор Г типа (р, #). Поэтому для доказательства теоремы 1 достаточно проверить, что этот тензор имеет в любом другом базисе е{>, ..., enf данные коэффициенты. Но это очевидно, ибо, согласно доказанному выше, коэффициентами тензора Т в базисе еу, . ¦., еы являются числа c\>c% Т\у а по условию эти числа как раз И раВНЫ Га'. ? Согласно этой теореме тензоры можно отождествлять с наборами чисел (Т^1]]] \q\ связанными формулами F). Именно в таком виде тензоры обычно появляются в физике. В этой интерпретации числа Т1.*'"!.<! обычно называются не коэффициентами, а компонентами тензора.
Лекция 6 УМНОЖЕНИЕ ТЕНЗОРОВ. — БАЗИС ПРОСТРАНСТВА ТЕНЗОРОВ, — СВЕРТКА ТЕНЗОРОВ. — РАНГОВОЕ ПРОСТРАНСТВО ПОЛИЛИНЕЙНОГО ФУНКЦИОНАЛА. Как уже было замечено в предыдущей лекции, тензоры одного и того же типа можно складывать. Ясно, что при этом их коэффициенты (компоненты) также складываются: о*+s)!;:::f;-r;;;;;;j+s!;:;:!;.;. При интерпретации тензоров как наборов чисел т[{\'\^ эта формула принимается за определение их суммы. Однако кроме операции сложения для тензоров определена также операция умножения, которая обозначается символом ®. Перемножать можно тензоры любых типов (р, q) и (г,5), и в результате получается тензор типа (р+ r, q-\-s). На компонентах умножение определяется формулой 11"-1р+г li~tlp 'p+i ••* lp+r (таким образом, каждая компонента тензора Т умножается на каждую компоненту тензора S), а при интерпретации тензоров как полилинейных функций — формулой . .. <r®S)(«lf .... *,+r,"g\.... lq+s) = ^^ ч*ь • • •! хр> 5 » • • •>?. ) S\Xp+xf ..., Xp+rt ? »•••>! /• 51
Очевидно, что умножение ® дистрибутивно относительно сложения: (r + s)®#=r®/? + s®/?, #®(r + s)=/?®r + /?®s, и ассоциативно: G®S)®# = r®(S®i?). Однако, вообще говоря, оно некоммутативно: T®S=?S®T. Если один (или оба) из сомножителей является тензором типа @,0), т. е. числом k, то тензорное произведение совпадает с обычным: Относительно операций + и ® все линейные пространства Т%(Т) составляют алгебраический объект, являющийся примером так называемой дважды градуированной алгебры. Эта алгебра обозначается символом Т (У) и называется тензорной алгеброй линейного пространства У. Пусть, как всегда, еи ..., еп — произвольный базис пространства У, а е\ ..., еп — сопряженный базис пространства У. Для любых сложных индексов а = (/ь ..., ip) и Р— (/b ..., jq) МЫ ПОЛОЖИМ е = е ® • •. ® е р, е$ = е} ® ... ® е[ . Тогда ea(xv ..., хр) = х[* ... xlpp = xa и, аналогично, ..ft1,..., i") = i\...ririe для любых векторов х\у ..¦, хр и 'любых ковекторов ?\ <,., g*. Поэтому для любых чисел Г« имеет место равенство (Фв®«»)(*р • ••> v *'. • ••>tO-^V Этим доказано следующее предложение: 52
Предложение /• Всевозможные тензорные произведения вида е ® ел == е 1 ® ... ® е р ® е, ® ... ® е, составляют базис пространства Tqp (У). Координатами тензора Т в этом базисе являются его коэффициенты: Т = Т[1;;; {?*'» ® ... ® ег𠮈/ ® ... ® *7 = 7^еа ® eft. П Для случая билинейных функционалов это предложение нам уже известно из предыдущей лекции. В частности, мы видим, что dimT*(F)=/ip+', так что размерность пространства тензоров типа (р, q) равна, как и следовало ожидать, числу их компонент. Пусть Т—произвольный тензор типа (р, q), где р > О и q > 0, и пусть 1 ^ k ^ р, Л ^ I ^ q. Подставив в тензор Т вместо &-го векторного аргумента вектор базиса ei, а вместо 1-го ковекторного аргумента ковектор е1 и произведя суммирование по i (от 1 до п), мы получим некоторый новый тензор S типа (р—1, q—1). Таким образом, S\xXf ..., xp_i, |, ..., lq ) = = T(xi, ..., x^it eif xk> ..., xp^u •b f •'• • i о > ^ > b > • • • > b /> где справа, в соответствии с соглашением Эйнштейна, подразумевается суммирование по I. «Компоненты тензора 5 выражаются, очевидно, формулой Определение Л. Построенный тензор S называется сверткой тензора Т по к-му нижнему м 1-му верхнему индексам. Нужно проверить, что это определение корректно, т. е. что тензор S не зависит -от выб®ра базиса ей ..., еп. Но это легко. Действительно, если ег, ..., ert, — любой другой базис и ei'~ Ci'ei> 63
то, заменив «не свертываемые» аргументы многоточиями, мы получим, что Примеры сверток. 1. Свернув смешанный билинейный функционал В (х, I) = Ь[х%} по единственному нижнему и единственному верхнему индексам, мы получим тензор типа @,0), т. е. число В(е^е1). Это число называется следом функционала и обозначается символом trB. Таким образом, по определению \гВ = Ь\ = Ь\-\- ... +Ы откуда видно, что след функционала равен следу его матрицы, т. е. сумме ее диагональных элементов. 2. В частности, для любого вектора х и ковектора ? tr (Е® ж) = 1,jc' = Б,х! + ... +1пх\ 3. Пусть Т — произвольный тензор и (/?, q) — его тип. Взяв р векторов Хи • • •, хр и q ковекторовg1, ..., ?*, мы можем построить тензор JTj® ... «ЖрфГ®!1® ... ®|* типа (р + q, р + q). Свернув этот тензор р + q раз по нижним и верхним индексам с одинаковыми номерами, мы, очевидно, получим число т. е. значение тензора Т на векторах х\, ..., хр и ковек- торах I1, ..., |*. 54
Особый интерес представляют собой тензоры типа (р, 0), которые называются также полилинейными функционалами на линейном пространстве Т. Число р аргументов называется степенью функционала. При выбранном базисе ей •¦•¦ ея пространства Т каждый полилинейный функционал Л степени р однозначно определяется его коэффициентами At =A(ef , ..., е. ) по любой из двух равносильных формул: Л(*?. .... *p)^ , ^ ... *J> и Л = 4, . е'1® ... ®еЧ Если в функционале Л зафиксировать все аргументы, кроме одного, то получится функционал степени 1, т. е. ковектор. Определение 2. Каждый такой ковектор называется ковектором, ассоциированным с полилинейным функционалом Л. Чтобы получить произвольный ассоциированный ковектор |, надо задать р— 1 вектор аи •.-., йр-\ и номер L Ковектор ? будет тогда задаваться формулой l(x) = A(a[t ..., а,_ь *, a<, ..., ap_i). Определение 3. Подпространство пространства У9', порожденное всеми ковекторами, ассоциированными с полилинейным функционалом Л, называется ранговым пространством этого функционала. Определение 4. Говорят, что полилинейный функционал Л степени р тензорно выражается через ковекторы ?1, ..., ?г, если он является линейной комбинацией тензорных произведений вида? 1® ... ®? р, где 1 </i, ... ..., /р<г. Предложение 2. Любой полилинейный функционал А твнзорно выражается через каждый базис его рангового пространства. Доказательство. Пусть 31 — ранговое пространство функционала Л и е!, ..., ег — произвольный его базис. Дополним этот базис до базиса в1 ег еп 55
всего пространства F' и рассмотрим сопряженный базис в\9 ..., вг> ..., ert пространства Т = (F7)'. Как мы знаем (см; лекцию 4), векторы &++Ъ • • • у &п составляют базис аннулятора 52° подпространства 52, и, значит, Е'(*/) = 0 при />г для любого ковектора ?^52. Но среди ковекторов из 52 содержатся, а частности, все ковекторы вида Поэтому для любых индексов /г, ..., ip и любого индекса i\ > г имеет место равенство *(*vV--"%)-°' т. е. равенство At i i = О- Аналогичным образом доказывается, что это равенство имеет место не только при и > г, но и при ^ >¦ Л и, вообще, когда ik > г хотя бы для одного k= 1, 2, ..., р. Но тогда мы можем считать, что в разложении А=А. . еч® ... фе1р h — 'р суммирование по всем индексам происходит только от 1 до г, а это и означает, что функционал А тензорно выражается через базис е1, ...., er. D
Лекция 7 РАНГ ПОЛИЛИНЕЙНОГО ФУНКЦИОНАЛА. — ФУНКЦИОНАЛЫ И ПОДСТАНОВКИ.—АЛЬТЕРНИРОВАНИЕ, Продолжим изучение рангового пространства полилинейного функционала. Пусть А — полилинейный функционал и М — его ранговое пространство. Пусть, далее, g1, ..., |г — произвольное семейство ковекторов, через которые тензорно выра-, жается функционал А. ' Предложение 1. Подпространство 31 содержится в линейной оболочке ковекторов g1, . .¦, ?г: йс=[|', ...,П Доказательство. По условию имеет место равенство A = b. .i4® ... <8>|Ч 1\ ••• *р где Ь. , — некоторые числа, а суммирование по 1 •;• р ¦ " . iu ..., ip происходит от 1 до г. Произвольный ковектор 1(х) = А{аи ..., a5_h дс, а5, ..., ap_i), ассоциированный с функционалом Л, выражается поэто-, му формулой где Следовательно, i^ti1, • • • »¦ Е*Ь и, значит, 52 с: Ц1, ..* 5?
Определение L Размерность рангового пространства 91 называется рангом полилинейного функционала А. Теорема 1. Ранг полилинейного функционала А равен наименьшему числу ковекторов, через которые может быть тензор но выражен функционал А, т. е. а) если функционал А тензорно ^выражается через ко- векторы I1, ..., |г, то его ранг не превосходит г; б) если г — ранг функционала Ау то существует г ко- векторов i\ ..., gr, через которые тензорно выражается функционал А, При этом семейство ковекторов g1, ..., |г тогда и только тогда обладает свойством, указанным в б), когда оно является базисом рангового пространства 31. Доказательство. Согласно предложению 2 предыдущей лекции функционал А тензорно выражается через базис пространства 31. Это, в частности, доказывает утверждение б). Если же функционал А тензорно выражается через ковекторы g1, ..., gr и потому, согласно предложению 1, имеет место включение 3tzz\%\ ...XI то dim^<dim[gI, ...,lr\<r. Это доказывает утверждение а). Кроме того, мы видим, что при г = dim 3t необходимо должно иметь место равенство показывающее, что семейство ковекторов |!, ..., \г (очевидно, линейно независимое) является базисом пространства 31. Этим все утверждения теоремы 1 полностью доказаны. ? Само собой разумеется, что все это сохраняется (с очевидными изменениями) и для функционалов от ковекторов (тензоров типа @, р)). Следует только иметь в виду, что с такими функционалами ассоциированы векторы, так что ранговое пространство оказывается под-1 пространством пространства Т. Напомним, что подстановкой степени р называется произвольное биективное отображение множества {1, ... 53
..., р) на себя. Любая такая подстановка а обычноизо- бражается двустрочной таблицей ( 1 2 ... р Л U(l) 0B) ... о(р))' хотя, вообще говоря, вполне было бы достаточно нижней строчки. Все подстановки степени р образуют группу (относительно композиции), которая называется симметрической группой и обозначается символом Sp. Подстановки делятся на четные и нечетные в зависимости от того, четно или нечетно число пар (а(/),"а(у)), для которых i < /, но а (/) > а(/). Мы будем называть знаком подстановки число +1, если подстановка четная, и число —1, если подстановка нечетная. Обозначать знак подстановки о мы будем символом еа. Известно, что для любых двух подстановок а и т, откуда, в частности, следует, что все четные подстановки составляют подгруппу группы Sp. Пусть А — полилинейный функционал степени р. Определение 2. Для любой подстановки а е Sp символом оА обозначается функционал, задаваемый формулой (аА)(хи ...,хр) = А(ха(о, ...,х'о(Р)). Ясно, что (oA)tx... ip = Ai0{l) ...ia{py Таким образом, чтобы получить коэффициенты функционала аЛ, нужно над индексами коэффициентов функционала А проделать подстановку о. Пример. Если п = 5, р = 3 и /1 2 з\ or=U 1 *У то( М),<5 = ЛБ14, МM53 = Лзвб. Очевидно, что отображение А*->оА 69
является для любой подстановки а линейным отображением (гомоморфизмом) линейного пространства Тр (F) на себя. Кроме того, как легко видеть, (опт) Л == а (тЛ) для любых подстановок а, теSp> откуда, в частности, следует, что отображение А н-> а А является изоморфизмом, D С этого места будем предполагать, что основное поле К имеет характеристику 0, т. е. что в нем возможно деление на любое натуральное число (и, в частности, на факториал /?!). Определение Я. Для любого функционала А^Тр(Т) символом Alt А обозначается функционал, определенный формулой MtA=jr E е°(°А)- o&Sp Ясно, что отображение Лн-^АПЛ линейно (является гомоморфизмом). Оно называется альтернированием. Поскольку Alt: ТР(Г)^ТР(Г) и а: ТР(Т)-*ТР(Т), определены составные отображения а о Alt и Alt о а. Предложение 2. Для любой подстановки ае Sp имеют место соотношения Alt о а = еа Alt, <у о Alt = еа Alt. Доказательство.- Для каждого функционала А^ТР(У°) имеем Alt M) = i ? ет(таЛ) = x^sp = 8*7Г Е M**)"VA1M, ибо та одновременно с т пробегает всю группу Sp* €0
Диалогично, 0АИЛ = ^г ? ет((УтЛ) = еа~г "? *ат(атЛ) = = 8аАПЛ. П Поскольку Alt: Тр (F)-> Тр (F), определена итерация Alt о Alt: Тр(Л->Тр(Г). Предложение 3. Имеет место равенство AltoAlt = Alt. Доказательство. В силу линейности альтернирования и предложения 2 Alt (Alt Л) = Alt Л1- J eaM)W = 7Г Z еоАП(сА) = ± ? (еаJА1Ы = АКЛ. D a g sp a e 5p Как выражаются коэффициенты (Alt Л). , функ- ционала Л It Л через коэффициенты Л/ ... * функционала Л? Для компактной записи этих формул целесообразно ввести соответствующее обозначение, полезное и для других целей. Пусть задано пР чисел Л^ ...# занумерованных ин- дексами fr, ..., ip, меняющимися от 1 до п. Сопоставим им другие пр чисел Bi i , аналогичным образом занумерованные и задаваемые формулой Bh - ^ = 7Г Е 8°Л pi La *o*4a(lf"tatpr o<=Sp Допуская определенную неправильность в формулах, числа В* ... * обычно обозначают через A{it:.ipy Таким образом, по определению A[h ••• *р] = 7Г 2j 8°Л/а@ •" '*</>>• Конечно, в этих обозначениях положение индексов снизу не играет никакой роли. Если в обозначении %1
данных пР чисел использованы верхние индексы: Ali ~:1р% то, соответственно, полагают ...,.-. ^1*1 — h\ _ J_ у1 е д'а{1) — {*(р)ф Предложение 4. Для коэффициентов функционала Alt А имеет место формула ;CAlt4<i;.,,-V..y. . ¦ mi Доказательство. По определению (AltЛ). ti = А1М(е, ,-..., еЛ = = 7Г Z '.И(«A %) = osSp ^ТГ L eHje(!)...ieW==i4[i,...y D ае5. Значение введенных выше обозначений этой формулой не исчерпывается. Например, с их помощью можно удобно записывать определители. Лемма L Имеет место тождество =рЦ1 .-..^=р!4 •••*&• Доказательство. По определению се5 Р Р\Х\{ . . . Х>, = Е *А{1) • ¦ • *а <*e«s« eW В обоих случаях выражение справа равно определителю \х[\ (один раз разложенному «по строкам», а второй — «по столбцам»), D 62
Предложение 5. Длялюбых векторов хи . •., *Р имеюъ место формулы (Alt А) (х{, ...,*,) = А[ч _ д*|» ... х'р = = А х*1 = А х р = 'i-V1 х\**;.,Х*А Доказательство. Первая формула является лишь иной записью утверждения предложения 4. Вторая формула доказывается выкладкой: (Alt А) (*,, ;... хр) = -±- ? «И (*аA), ..., ха{р)) = *eSp ^ 7Г Z-. 8 И/, ... *р*а<1> • • • ХоР(Р) = 0е5р ^^'i ••• 'Л рг ^ ea'v°1(i) *#' *°р(р))в Третья формула следует из второй в силу леммы 1. ? '• Следствие. Имеет место формула (AlM)(«lf .... *,) = -# \...t где, как всегда, no iu ...» ip производится суммирование от 1 до п. Пример. При р = 2 *:¦ * *!' ... • •« 41 * *1 4/( 1 - х1у! — *V ^ )-
Лекция S КОСОСИММЕТРИЧЕСКИЕ ПОЛИЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ. — ВНЕШНЕЕ УМНОЖЕНИЕ. — АЛГЕБРА ГРАССМАНА. — ВНЕШНИЕ ПРОИЗВЕДЕНИЯ КОВЕК- ТОРОВ. — РАЗЛОЖЕНИЕ КОСОСИММЕТРИЧЕСКИХ ФУНКЦИОНАЛОВ ПО ВНЕШНИМ ПРОИЗВЕДЕНИЯМ КОВЕКТОРОВ БАЗИСА. Пусть нам даны два набора пр чисел xl _ t и у1\ •'• *р, занумерованных р индексами i\, ..., iPt независимо пробегающими значения от 1 до п. Умножив каждое из чисел xt t{ на соответствующее число у1\*р и сложив все произведения, мы получим число *i ••¦ 1р Лемма 1. Для любой подстановки a gSp имеет место тождество v ' П ••• h *оA) ••• Мр) Доказательство. Обе стороны соотношения A) являются суммами одних и тех же слагаемых, но расно* ложенных в различном порядке. ? Пусть нам даны п2 чисел х]у где i, /= 1, ..,, п. Рассмотрим всевозможные произведения вида Л/ • • • X г" • Лемма 2. Для любой подстановки а е Sp имеет место тождество B) ^К..х^===хI(и...х)р. где т = О! 64
Доказательство. Обе стороны соотношения B) являются произведениями одних и тех же множителей; но расположенных в различном порядке. Например, если р = 4 и л_A 2 3 4W tr_(l 2 3 4\ a"~V2 4 3 \)9 Т— U 1 3 2J' то xbxbxbx1,1 = х\ххЬх\*х\*. П Определение 1. Полилинейный функционал А называется кососимметрическиМу если для любой подстановки а е S/?. Предложение 1. Функционал А тогда и только тогда косвсимметричен, когда C) А, , =еаА, . для любых индексов и, ..., % и любой подстановки а & 5Р. Доказательство. Если функционал А кососим* метричен, то Обратно, если соотношение C) выполнено, то для любых векторов #1, ... ,*п имеет место равенство (аА) (*lf ..., хр) = А (ха{1), .,., ха{р)) = р Но согласно леммам 1 и 2 и условию C) V ¦../рЛсгA) Следовательно, 3 м. <уА М. Постников, х*р ,= = «е %аА. семестр II Ahw- \ю- г А. а м... ¦B0A(Xi а Jam дг'1 У1 л:1 > • • •» ЯСрЛ .ж; хр '=3 К?) — 65
Предложение 2. Полилинейный функционал А тогда и только тогда кососимметричен, когда он не меняется при альтернировании, т. е. когда Alt A = А. Доказательство. Если о А = е0А для любой подстановки а е Sp, то в сумме Z еа(аЛ) o*=Sp все слагаемые равны Л, и потому эта сумма равна р\А. Следовательно, Alt А = Л. Обратно, если АИЛ = Л, то, согласно предложению 2 предыдущей лекции, <тЛ = аАиЛ==8аАйЛ = еаЛ. ? Следствие. Полилинейный функционал А тогда и только тогда кососимметричен, когда для его коэффициентов имеют место равенства Формально несколько более общее условие кососимметричности функционала дает следующее предложение: Предложение 3. Полилинейный функционал А тогда и только тогда кососимметричен, когда существует такой полилинейный функционал В, что D) Л = Alt В. Доказательство. Если функционал Л кососимметричен, то D) имеет место при В = Л (предложение 2). Обратно, если выполнено D), то, согласно предло* жению 3 предыдущей лекции, Alt Л = Alt (Alt В) = Alt В = Л, и, значит (предложение 2), функционал Л кососимметричен. ? Тензорное произведение Л <g) В двух кососимметриче- ских функционалов, вообще говоря, не будет кососиммет- рическим функционалом. Чтобы превратить это произве- 66
дение в кососимметрический функционал, его необходимо проальтернировать. Определение 2. Внешним произведением А А В косо- симметрических полилинейных функционалов А и В называется функционал AAB = Alt(A®B). Его степень равна р+ q, где р и q — степени функционалов А и Bt а его коэффициенты выражаются формулой (А А В), , =АГ. .В. , ,. Предложение 4. Внешнее умножение кососимметриче- ских функционалов ассоциативно, т. е. (АЛВ)АС = АЛ(ВЛС) для любых трех кососимметрических функционалов Л, В и а В силу этого предложения во внешних произведениях нескольких функционалов можно не писать скобок. Доказательству предложения 4 мы предпошлем несколько замечаний, имеющих и самостоятельный интерес. Для любых р и q симметрическую группу Sp мы можем отобразить в симметрическую группу Sp+q, сопоставляя произвольной подстановке а е Sp подстановку а' е Sp+qt действующую на числах 1, ..., р так же, как а, и оставляющую числа р+ 1, ..., q на месте: '«-к a(i)f если 1 </<р, если р + 1 ^/ ^.р + q. Ясно, что соответствие <тн-> о' является мономорфизмом (инъективным гомоморфизмом), сохраняющим знак, т. е« таким, что е / == е о' о для любой подстановки а. Используя подстановки вида а е Sp, мы можем произвольный полилинейный функционал А степени р -\- q «проальтернировать только по первым р аргументам», т. е. построить функционал aeSp 3* 67
Лемма 3. Имеет место равенство Alt (alt Л) = Alt Л. Доказательство этой леммы, по существу, полностью повторяет доказательство предложения 3 предыдущей лекции: Alt (alt Л)-Alt ji ?еа(а'Л> = 7Г Е «W Alt Л = Alt Л. П Теперь мы можем перейти непосредственно к доказательству предложения 4. Доказательство предложения 4. Пусть р, q и г— степени функционалов Л, В и С. По определению (ААВ)ЛС = Alt ((ЛАВ) ®С). Но ясно»., что (Л Л В)® С = alt (Л ® В ® С), где alt означает альтернирование по первым р + 9 индексам. Поэтому, согласно лемме 3, (ЛЛВ)ЛС = АП(Л®В®е). Аналогично доказывается, что ЛЛ(ЯЛС) = Alt (Л ® В ® С). Следовательно, (ЛЛЙ)ЛС = ЛЛ^ЛС). ? Мы видим, в частности, что А Д В Л С = Alt (Л 0 В ® С). Ясно, что аналогичная формула имеет место для любого числа множителей. В отличие от тензорного умножения, внешнее умножение коммутативно, хотя и с точностью до знака. Предложение 5. Для любых двух кососимметрических полилинейных функционалов А и В степеней р и q имеет, место равенство ВЛЛ = (-1)^ЛЛВ. 63 -
Это свойство внешнего умножения называется его косокоммутативностью. Доказатель с т в о. По определению (В ® А) {хь ..., xp+q) = В (хь ...,xq)A {xq+u • • ¦, Яр-ц) =» = A\Xq+\* • • • > ^p+flr) В \Х{9 . . •, #<j) = = (А ®*В) (Ж^+Ь . • ., Xp+q, Хи ...» Xq)~— = ((ТоD ®В))(хи ...9 xp+q)9 где _/ 1, ..., Р, Р +1, .¦., p + q\ a°_U+l, ..., Р + <7, 1, ..., q )' т. е. Поэтому ВАА = Alt (В® А) = 8ffo Alt (А ® В) = е^ (А Л В). Для завершения доказательства остается заметить, что e„g = (—iy. П Ясно, что множество f\p{T) всех кососимметрических функционалов степени р является подпространством пространства ТР(Т) и, следовательно, само представляет собой линейное пространство. При этом операция внешнего умножения кососимметрических функционалов, оче* видно, дистрибутивна относительно сложения: (А + В)ЛС = АЛС + ВЛС Это означает, что по отношению к операциям + и А линейные пространства Ao.(n,Ai(n...,Ap(y). ... составляют алгебраический объект, являющийся примером так называемой градуированной алгебры. Эта алгебра обозначается символом Л (У9) и называется внешней алгеброй пространства Т (или его алгеброй Грассмана). Заметим, что при р = 1 условие кососимметричности никаких ограничений не накладывает. Следовательно, Л1(Л = Т1(Г) = Г. По аналогичным соображениям Ло(Л = То(П = К. 69
Из кососимметричности очевидным образом вытекает, что А(х\, ..., хр)= О, если хотя бы два вектора Хи -.. > Хр совпадают (вспомните соответствующее рассуждение для определителей). Отсюда, в силу полилинейности, следует, что А(хи ..., хр)= О, если один из векторов Х\, ..., хр линейно выражается через остальные. Поскольку при р > п это всегда так, мы, таким образом, получаем, что ЛР0П = 0 при р>п. Особый интерес представляют внешние произведения функционалов степени 1, т. е. ковекторов. Согласно сделанному выше замечанию !!Л... ЛЕр = АИа,®...в?р) для любых ковекторов ?', ..., |р. Это означает, что для любых векторов х\9 ..., хр имеет место равенство #Л... Л 6Р) (*ь..., *р)- =jr Ее^ (^(i)) • • • &р <**<р>)» т. е. равенство ae=Sp E) (б1 Л ...Л!р)(*ь ...,*,)=•?- ip(x{i.\.V(xp) Это — очень важное!—тождество можно (см. лемму 1 предыдущей лекции) переписать в следующем равносильном виде: (^Л ... Л!p)(*i, ...,«P) = S!(*[i)... lp(xp]), а также в виде F) &Л.-.Л&(*и-.-,*Р) = 11Чх1)...1'Цх1Ь. 70
Введем теперь в рассмотрение функционал <re=Sp Значение этого функционала на векторах х\, ..., хр вы» ражается формулой G) (^<8>..<®^)(*ь ...,*,) = =тг Е е^°A) <*>> • • • 6е w w=б11 <**> • • • srt ы- asSp Сравнивая формулы F) и G), мы получаем следующее предложение: Предложение 6. Для любых ковекторов I1, ..., 1Р имеет место равенство Б1 Л ... Л?Р«=6П® ...®SPJ. ? Следствие. Функционал I1 A ... Л |р тензорно выражается через ковекторы \\ ..., ?р. ? Докажем теперь простое, но важное предложение. Предложение 7. Равенство 1!Л..- Мр = 0 имеет место тогда и только тогда, когда ковекторы 6!, ..., ?р линейно зависимы. Доказательство. В силу косокоммутативности внешнего умножения произведение I1 Л ... Л %р меняет знак при перестановке любых двух множителей. Известным уже рассуждением отсюда выводится, что I1 А ... ...AgP = 0, если ковекторы I1, ..., %Р линейно зависимы. Пусть ковекторы I1, ..., |р линейно независимы. Тогда их можно дополнить до базиса В = &>•••> В ^ § , В ,..., В всего пространства У. Пусть еь ...» еп 71
— сопряженный базис пространства F. Тогда, согласно формуле E), ($1Л ... Л1Р)(еи..., *Р, >-ъ 1 = 7i |;lr(*i)... I1 («„) 16* («i)... ?*(•„) 1 0 • 0 ' 1 МРФ0. U НФ0 Следовательно, ?*Л . Пусть е1, .. ., еп — произвольный базис пространства У". Тогда каждый полилиненый функционал А допускает, как мы знаем, представление вида A = Ail ...* е*1® ... ®еЧ Если функционал кососимметричен (и потому А =»' = Alt Л), то после альтернирования мы получим отсюда формулу вида (8) А = Аи_,рен^ ... ДеЧ Однако в этой формуле много нулевых и одинаковых слагаемых. Поэтому в ней следует «привести подобные члены». Согласно предложению 7 в сумме (8) нулю равны все слагаемые, для которых среди индексов i\, • • •, ip есть одинаковые. Поэтому (9) A=E^j..w е^Л ... ЛеЧ где суммирование распространено на все р-членные наборы й, /г, ..., ip целых чисел от 1 до л, состоящие из различи ы х чисел. Зафиксировав один такой набор, рассмотрим в сумме (9) слагаемые, отличающиеся лишь иным порядком индексов. Всего таких слагаемых будет р!, и каждое из них будет иметь вид At t Лшд дЛ(р) *о A) - г<У(рУ I A0) , (без суммирования) где or — произвольная подстановка степени р. Но, как непосредственно вытекает из косокоммутативности внеш- 72
него умножения, е'аA)Л ...Лв/G^==еаег»Л ... Л*'". С другой стороны, согласно предложению 1 Так как eGea—l9 то, значит, все слагаемые A0) равны <Л;...*е'1Л ... Л*''. I • I (без суммирования) Этим доказано, что А = р\ ? Л, ./У'Л ... ЛеЧ где суммирование распространено на все сочетания (i'i, ..., /р) индексов в сумме (9). Поскольку для каждого сочетания существует единственный набор м, ..., ip> для которого k < /г < ... < *V тем самым доказано следующее предложение: Предложение 8. Для любого кососимметрического функционала А имеет место равенство Л=р! Z А*...1***Л ... Л«Ч П «i< •••<', р Таким образом, функционалы вида е*1Л ... Л*Ч l<*'i< ... <ip<n, составляют полное в /\Р(Т) семейство.
Лекция 9 БАЗИС ПРОСТРАНСТВА КОСОСИММЕТРИЧЕСКИХ ФУНКЦИОНАЛОВ, — ФОРМУЛЫ ПРЕОБРАЗОВАНИЯ БАЗИСА ЭТОГО ПРОСТРАНСТВА.— ПОЛИВЕКТОРЫ. — ВНЕШНИЙ РАНГ КОСОСИММЕТРИЧЕСКОГО ФУНКЦИОНАЛА.—ТЕОРЕМА О РАНГЕ ПОЛИВЕКТОРА.— УСЛОВИЯ РАВЕНСТВА ПОЛИВЕКТОРОВ. Из предложения 1 предыдущей лекции следует, что для коэффициентов Л^... * кососимметрического функционала Л имеют место равенства (О, если среди чисел /ь ..., /ресть одинаковые, 8<^'<j(i)...W> B противном случае, где а — такая подстановка степени р, что 'a(i) < • • • <h(ph Отсюда следует, что для полного восстановления функционала А достаточно знать лишь те его коэффициенты Ai{... i , для которых i\ < ... < ip. Определение 1. Коэффициенты Л^...* , для которых ii <С ... < ip» называются существенными коэффициентами кососимметрического функционала Л. Предложение 1. Для любых () чисел B) Aix ... v занумерованных индексами i\ < ... '< iPt существует единственный кососимметрический функционал Л, существенными коэффициентами которого эти числа являются. 74
Доказательство. Единственность функционала Л была только что установлена. Поэтому следует доказать лишь его существование. Определив пР чисел Л^ ... i для всех iu ...-, iP посредством формул A), рассмотрим полилинейный функционал C) A = Aiim..t е**® ... ®е*р. Ясно, что если этот функционал кососимметричен, то его существенными коэффициентами будут как раз числа B). Таким образом, все будет доказано, если мы покажем, что функционал C) кососимметричен. Согласно предложению 1 предыдущей лекции для этого достаточно доказать, что для коэффициентов At... i функционала C) имеют место соотношения D) Аь A).../а(р) = еаЛ/1.../р, где а — произвольная подстановка степени р. При этом без ограничения общности можно, очевидно, предполагать, что все индексы iu ..., ¦ h различны (так как в противном случае обе стороны формулы D) равны нулю). Но если индексы iu ..., ip различны, то, по определению, Л*,... ip — ^Aix{l)m9.ix(p)f где т — такая подстановка, что ix(i) < ... < *т(р)- Аналогично, где р — такая подстановка, что ip(o(\)) <....<. ip«j(p))- Но, числа /t(i), ..., iX(p) и /p(a(i», ..., /р(а(р)) — это одни и те же числа, поскольку и те и другие представляют собой индексы iu •. •, ip, расположенные в порядке возрастания. Следовательно, тA) = р(<тA)), ..., т(/>) = р (а (/>)), т. е. т = per. Поэтому et = ер8а, и, значит, Л/j... tp — *aAta{l)...ja{p). П Теорема 1.. Внешние произведения E) е**Л ... Л*Ч Kh< ... <ip<n, составляют базис пространства /\р{Т). 75
Доказательство. Ввиду предложения 8 предыдущей лекции достаточно доказать, что функционалы E) линейно независимы. Пусть где Aix ... i , i\ < ... < ip,— некоторые числа. Согласно предложению 1 существует кососимметрический функционал А, существенными коэффициентами которого являются числа Л^ ... f . Согласно предложению 8 предыдущей лекции этот функционал выражается формулой As=jf Е ^...i/'A ... Л*1' *1< - «р и, следовательно, по условию равен нулю. Но тогда Л<1-<р = ЛК>—> %)последовательно, функционалы E) линейно независимы. ? Следствие 1. Представление кососимметрического функционала А в виде единственно. П Следствие 2. Размерность пространства Ар (У) равна (*): F) dimApOO-g). П В частности, мы снова видим, что Лр(Л*=*0 при р>п. Перейдем от базиса е\ ..., еп к другому базису: е1', ..., еп\ Если, как всегда, то е'*® ... ®в'р —с? ... <#е'1® ... ®еЧ 76
Поэтому (см. предложение 4 лекции 7) е*'[Л ... Ae^ = Alt(e'»e ... ®е^)== = сих ••• А*'1® ••• ®*'Р' и, значит, а'* Л ...Лв^ = р! 2 4 ••• ^/'Л ... ЛеЧ Число pic Л ... с]р, равно (см. лемму 1 предыдущей лекции) минору СП[ ... i'pX V/i ... iP) матрицы перехода С = (с}'), находящемуся на пересечении столбцов с номерами ix< ... < ip и строк с номерами i[ < ... < ip. Поэтому полученную формулу преобразования базисов пространства /\Р(Т) мы можем переписать в следующем окончательном виде: (т)/л... л/*-- е сС::::Э^л-лвч где Й < ... < /р. Все полученные результаты естественным образом переносятся на тензоры типа @, р), т. е. на полилинейные функционалы Л: ?1, ..., |*н-^Л(|1, ..., ??) степени р от ковекторов. Единственное отличие состоит в том, что там, где индексы были внизу, они окажутся вверху, и наоборот. В частности, коэффициенты функционала А типа @, р) будут иметь вид Л'1 '" *р базис пространства №(У) «= Лр(У) всех кососимметрических функционалов типа @, р) будет состоять из внешних произведений etlA ... Aeip — A\t(eil^ ... Ф«*р), где ^< ... </р, а разложение произвольного кососимметрического функционала по этому базису будет даваться формулой А = р\ ? Л1'"' Ч.Л •-. Л%. <i<-<*P l p 77
Определение 2. Внешние произведения *iA Ахр, Хь Г, р векторов называются поливекторами степени р или, короче, р-векторами. При р = О поливекторами являются числа (элементы поля К), а при р = 1 —векторы. Множество всех р-век- торов пространства Т мы будем обозначать символом /\Р(У). Вообще говоря, оно линейным пространством ке является (поскольку сумма двух р-векторов может не быть р-вектором). Для внешних произведений х\ Л'... Л хр справедливы те же формулы, что и для внешних произведений g1 Л... ... Л?? ковекторов (которые по аналогии можно было бы называть «поликовекторами»). В частности, (8) и (9) *iA Л хР — хц ® ® Хр] (*Л л*р)«!,.... гг)=ъх(хц) -6ri(*i) ... spl(*,)= |6'(*i) ... lpM rw- \V(xp) ... lHxp)\ для любых ковекторов g1, ..., %p. При этом (ср. с предложением 7 предыдущей лекции) равенство х{А ... Л хр = О имеет место тогда и только тогда, когда векторы хи ... ..., хп линейно зависимы. ? Полезно также отметить, что для любых п векторов 4fj = X^B^ -j- ... ш\-ХуВп% *п = х1е\ + •.. + х"еЛ П Л 1 ' 'ЛЯ имеет место равенство A0) *!Л ... Л*л = (е{А ... Аеп). Действительно, если векторы Хи ...-., Хп линейно зависим 78
мы, то это равенство очевидно (и слева и справа стоят нулевые л-векторы). Если же векторы х\9 ..., хп линейно независимы (и потому составляют базис пространства У), то равенство A0) лишь обозначениями отличается от «векторного» аналога формулы G) для случая р = п. При /г = 3 формула A0) с точностью до обозначений идентична формуле C) лекции I. 13. Естественно поэтому ожидать, что р-векторы в смысле определения 2 будут, по существу, совпадать с р-векторами, введенными в лекции 1.12 (т. е. с классами эквивалентных семейств векторов), иначе говоря, что равенство *iA Л хр = ух Л Аур будет иметь место тогда и только тогда, когда семейства Х\, ..., хр и у\9 . ¦., ур унимодулярно эквивалентны (ср. с предложением 2 лекции 1.12). Оказывается, что это на самом деле так. При этом, поскольку для линейно зависимых семейств векторов это непосредственно следует из сказанного выше, мы, без ограничения общности, можем рассматривать лишь линейно независимые семейства векторов. Теорема 2. Для линейно независимых семейств векторов *ь ..., хр и уи . ¦., Ур равенство *, Л ... Лхр = у{Л А, имеет место тогда и только тогда, когда эти семейства унимодулярно эквивалентны, т. е. когда \Ч) где A2) Ур = ср*1 с\. 4' + ... +с?*р, .. cf .. ср = 1. В одну сторону теорема 2 непосредственно вытекает из формулы A0). Действительно, если выполнены соотношения A1), то оба семейства являются базисами одного и того же р-мерного подпространства. Поэтому, 79
согласно формуле A0), A3) У! Л ••• Лур**А(х{А ... Лхр), где А — определитель A2). Остается заметить, что по условию А == 1. ? Обратное утверждение существенно деликатнее. Мы предпошлем его доказательству несколько предварительных замечаний. Как и для произвольных полилинейных функционалов, для кососимметрических функционалов определены понятия ранга и рангового пространства. Но, конечно, для таких функционалов значительно естественнее аналоги этих понятий, использующие вместо тензорного умножения внешнее умножение. Пусть А — произвольный кососимметрический функционал степени р (для определенности — от ковекторов). Определение 5. Говорят, что функционал А внешним образом выражается через векторы хи ..., хг, если он является линейной комбинацией внешних произведений видад^ Л •-. Л*/ где 1 ^/i, ..., iP^r. Ср. с определением 4 лекции 6. Число г называется внешним рангом кососимметриче- ского функционала Л, если оно удовлетворяет следующим условиям: 1) существует семейство векторов, состоящее из г векторов, через которое функционал А внешним образом выражается; 2) в случае, когда функционал А внешним образом выражается через некоторое семейство векторов, число векторов этого семейства не меньше г. Однако замечательным образом оказывается, что эти определения фактически излишни, поскольку на самом деле кососимметрический функционал А тогда и только тогда внешним образом выражается через векторы х\, ... ..., хг, когда он выражается через них тензорно (так что на самом деле внешний ранг функционала А совпа* дает с его рангом). Действительно, если Л = а'1'"*р#*1® ... ®*у то, альтернируя это равенство, мы получим, что A4) A = aii-iPXilA ... AXip. 80
Обратно, если имеет место последнее равенство, то, согласно формуле (8), A = ail"'iPx[ti® ... ®**р]- п Тем не менее понятие внешнего ранга не бесполезно. Действительно, ясно, что внешний ранг отличного от нуля кососимметрического функционала не может быть меньше его степени (ибо в противном случае в каждом члене суммы A4) оказались бы повторяющиеся множители). Поэтому то же самое утверждение верно и для его papira: Предложение 2. Ранг г отличного от нуля кососимметрического функционала А^/^Р(Т) не меньше его степени: р<г. ? Этим важным свойством мы будем в дальнейшем много раз пользоваться. В качестве первого приложения мы докажем следующее утверждение, характеризующее поливекторы в классе всех кососимметрических функционалов: Предложение 3. Кососимметрический функционал А еЕ [\Р{Т) тогда и только тогда является поливектором, когда его ранг г равен его степени: р = г. Доказательство. Если А = х\ Л ... Л хр, то, очевидно, г <; р. Поэтому, ввиду предложения 2, должно иметь место равенство г = р. Обратно, если г = р, то функционал А имеет вид Л^а'^-'^Л ... Л**р, где хи • • • i хр — базис его рангового пространства. Но тогда, как показывает уже неоднократно употребленное нами выше рассуждение, функционал А будет выражаться формулой Л = ап-р,(*!Л ... Л*Р) и, значит, формулой А = у1л'... /\уР, где у{=а^-Р^хи у8в-*з» •••> VP^xp. ? 81
Следствие. Ранговым пространством поливектора Х\ Л ... Л хр ф О является линейная оболочка \х\, .. . ..., хр] векторов хи ..., хр. Теперь мы можем найти условия равенства двух поливекторов. Предложение 4. Для отличных от нуля р-векторов х{ Л ... Л Хр и ух Л . •. Л Ур следующие четыре утверждения равносильны: а) данные р-векторы пропорциональны, т. е. существует такое число k ф О, что У\Л ... AyP = k(xxA ... Л *Р)\ б) линейные оболочки векторов хи ..., хр и у и ..., уР совпадают: т [УU •••» Ур\ — \Хъ •••» Xph в) семейства Х\9 ..., хр и у\9 ...9 ур линейно эквивалентны, т. е. имеют место равенства вида у1 = с\х1+ ... + с\хр9 ч,в^1+ ••• + СРРХР> ФО; г) ранговые пространства р-векторов Х\ Л ... Л хр и Ух Л ... Л ур совпадают. Доказательство. Пусть У\/\ ... Ayp = kxxA ... Ахр. Так как функционалы у\/$.. .Лур и kx\/\.../\xp равны, то их ранговые пространства одни и те же. Поэтому, согласно следствию из предложения 3, \Уь .••> yP] — lkxu х2> •••, Хр]. Но ясно, что [«#1, #2> • * • > #pj = [#Ь • • • э Хр] и, значит, по тому же следствию, ранговые простран- 82 где
ства функционалов kx\ А х» А ... А хр, и . жгЛ ... Л хр одинаковы. Этим доказано, что а)=^б) и а)фг). Равносильность условий б) и в) очевидна (и уже отмечалась нами в лекции 1). Если выполнено в), то поливекторы х{А...Ахрп Ух А . ../\ур связаны соотношением A3), и, значит, имеет место а). Наконец, так как базис рангового пространства функционала Х\ А ... 'Л хр состоит из векторов лсь ..., хРу то из г) вытекает в). Следовательно, все условия а), б), в) и г) равносильны. ? Следствие. Между классами пропорциональных, отличных от нуля р-векторов и р-мерными подпространствами пространства У имеется естественное биективное соответствие. В этом соответствии каждому подпространству &> отвечает внешнее произведение х{ Л ... Л хр векторов произвольного его базиса х\, ..., хр, а каждому р-вектору х\ А... А Хр —подпространство [xit ... Теперь теорема 2 доказывается уже без труда. Доказательство теоремы 2. Мы уже дока» зал и, что если имеют место соотношения (И) вместе с равенством A2), то ух А ... Аур = х\ Л... Ах„. Обратно, если ух А ... Л ур = хх А... Л *р, то, согласно предложению 4, будут иметь место соотношения A1) и значит, — равенство A3) с А = 1. ?
Лекция 10 ТЕОРЕМА КАРТАНА О ДЕЛИМОСТИ. — СООТНОШЕНИЯ ПЛЮККЕРА. — ПЛЮККЕРОВЫ КООРДИНАТЫ ПОДПРОСТРАНСТВ. —ПЛОСКОСТИ В АФФИННОМ ПРОСТРАНСТВЕ. —ПЛОСКОСТИ В ПРОЕКТИВНОМ ПРОСТРАНСТВЕ И ИХ КООРДИНАТЫ. Установленный предложением 3 предыдущей лекции критерий того, что кососимметрический функционал является поливектором, на практике малоэффективен. Чтобы получить более удобный критерий, необходимо предварительно доказать следующее предложение, известное как теорема 3. Кар тан а о делимости (подразумевается — кососимметрического функционала на поливектор): Предложение 1. Пусть Х\ А... хг ф 0. Для косо- симметрического функционала А степени р ^ г тогда и только тогда существует такой кососимметрический функционал В степени р — г, что А = ВАХ\Л ... Лхг> когда A) ЛЛ*1 = 0, ..., АЛхГ = 0. Доказательство. Если А = В Л Х\ Л ... Л хг% то для любого 5 = 1, ..., г внешнее произведение ААх3 = ВАххА ... Л*гЛ*5 содержит два одинаковых множителя xs и потому равно нулю. Обратно, пусть выполнены соотношения A). Поскольку векторы х\9 ..., хг, по условию, линейно независимы, 84
то их можно дополнить до некоторого базиса В\ =: Х\у • • •> €г = Хг, ?/•-{* 1» • • • > &п пространства Т. Пусть B) А = р\ ? Л^-'ре^Л ... Ле< — разложение функционала А по соответствующему базису пространства /\Р{Т) (см. теорему 1 предыдущей лекции). Тогда для любого 5 = 1, ..., г A/\xs = p\ Ц Л'1-W Л ... /\ein/\es. Если 5 равно одному из чисел и, ..., /р, то е% Л ... ... Ля* Ле5 = 0. Поэтому в сумме для A?\xs можно ограничиться лишь членами, для которых все индексы iu • • •, ip отличны от s: C) AAxs = p\ ? ^М,Ч.Л ... Л^ Ле5. ч '/>** Но при м, ..., ip, не равных 5, все поливекторы вида eivA ... AetpAes, l</i< ... <ip<in, как мы знаем, линейно независимы. Поэтому, если А Л xs = 0, то все коэффициенты А*1 "* 1р в формуле C) равны нулю. Этим доказано, что при выполнении условий A) могут быть отличны от нуля лишь те из коэффициентов А*1'"*р разложения B), для которых среди индексов /i<C...<;/p присутствует каждый индекс s«l, .-.., г, т. е. такие, что i\ = 1, ..., ir = r. Поэтому A = BA*iA ... Аеп где B=(-l)rip-f)pi ? Л1 - "r+i - 'peir+lA. • • Л%. П r<ir+l<...<tp '+l р Предложение 2. Кососимметрический функционал A&APW) тогда и только тогда является поливектором, когда лд*=о для любого ассоциированного вектора х. 85
Доказательство. Если А = х\ А ... Л хРу то, поскольку векторы хи ..,, хр порождают ранговое пространство, вектор х через них линейно выражается, и потому Л Л * = *i Л ... Л*рЛ* = 0. Обратно, если А Л х = 0 для любого ассоциированного вектора х, то А Л х = О и для любого вектора ж из рангового пространства. В частности, если хи ,.., Хг —* базис рангового пространства, то ЛД*1 = 0, ..., ЛЛ*г = 0. Следовательно, по предложению 1 существует такой функционал В степени р— г, что Л = ВЛ*1Л ... Л*г- Конечно, это возможно только при р ^ г. Поскольку всегда р ^ г (предложение 2 лекции 9), этим доказано, что р = г, т. е. (предложение 3 лекции 9) что функционал А представляет собой поливектор. ? В силу кососимметричности любой вектор, ассоциированный с функционалом Л, задается (как элемент пространства {У')') формулой х: 1^>АA, р2, .... р"), где р2, ..., р* — некоторые фиксированные ковекторы, и потому имеет координаты *'=л"»•••'*# ... fl. Следовательно, координаты (коэффициенты) функционала А Л х = Alt (A <g) x) будут выражаться формулой " = Л1'1 — ^'p+il'» - ^ ... р?р. Эти выражения тогда и только тогда равны нулю для всех Р/2, ..., fip> когда Л^-'рЛ'р+Л'г •••>, = О для всех /ь ..., ipt /р+ь /2, • .., jp (если, например, Л^-'рЛ'р+О^-^^о, то (А Л я)'1"'1р,р+| •?* О при 86
$ =6у2, ..., Р/ =*/0)- Обозначая для симметрии индекс /р+1 через /ь мы видим, что нами доказано следующее предложение: Предложение 3. Кососимметрический функционал А ^ /\Р{Т) тогда и только тогда является поливектором, когда его коэффициенты удовлетворяют соотношениям D) Л^-'рЛ'^-Л^О для всех iu ..., ip, /ь /2, ..., /V ? Соотношения D) известны как соотношения Плюккера. Пример. При р = 2 соотношения D) имеют вил. AUlUAtlUt = 0, Т. е. вид Aixi*Aix*% + AitflAil^ + А^*1А*^Х AiiixAixil — — AhuAixh — AiihAilU = ^ В силу кососимметричности первый член равен четвертому, второй — пятому и третий — шестому. Поэтому, приводя подобные члены и сокращая на 2, мы получим соотношение E) AixUAhh + AuhAixh + AflilAhIi = 0. Если i\ == /2, то первый член равен нулю, а два других отличаются знаком. Поэтому в этом случае соотношения E) выполнены автоматически (в силу кососимметричности). Аналогично дело обстоит, когда равны друг другу, любые два из индексов iu i2, /1, /2- Поэтому соотношения E) существенны только тогда, когда все эти четыре индекса различны. Поскольку при п = 3 это невозможно, отсюда следует, что при п = 3 (и р = 2) все соотношения Плюккера тривиальны, т. е. в трехмерном пространстве любой кососимметрический функционал является бивектором. Это объясняет, почему при п — 3 нам удалось в I превратить множество бивекторов в линейное пространство. При /2 = 4 имеется только одно нетривиальное соотношение Плюккера: Д12Д34 + Л23Д!4 + Л13Л42 = Q# 87
Поэтому в этом случае бивекторы линейного простран* ства не составляют (сумма двух бивекторов не будет, вообще говоря, бивектором). Для любого п аналогичным образом показывается, что при р = п — 1 все соотношения Плюккера тривиальны, т. е. что любой кососимметрический функционал степени п — 1 является п — l-вектором. Существенные коэффициенты А*1"'1"-1, 1 ^/i < ... < t/i-i *^п, этого функционала имеют, очевидно, вид Л1 •¦•' ••• п, где знак ^ над индексом означает, что этот индекс должен быть опущен. Удобно указанный коэффициент обозначать символом (—1)'В*. Замечание. Поскольку числа Bi можно интерпретировать как координаты некоторого ковектора, мы видим, что имеется биективное соответствие между п— 1-векторами и ковекторами (т. е. 1-ковекторами). Оказывается, что для любого р аналогичное соответствие имеется между р-векторами и п — р-ковекторами. Оно, вообще говоря, зависит от выбора базиса е\9 ..., еп, но эта зависимость довольно слабая. Именно, это соответствие оказывается одним и тем же для всех унимодулярно эквивалентных базисов, т. е. определяющих один и тот же п-вектор: Яо = *i Л ... Л еп. В этом соответствии каждому п — р-ковектору В = = Р1l Л .. .!Л рл_р отвечает р-вектор А, определенный как кососимметрический функционал формулой Л(|!, ...,Г)=?о(Р1,..., F-p,l\ ..-, I"). Независимо от n-вектора ?0 это соответствие определено только с точностью до пропорциональности, т. е. между классами пропорциональных р-векторов и п — р-ко- векторов. При отождествлении этих классов с подпространствами пространств УиГ (см. следствие предложения 4 предыдущей лекции) получается соответствие, сопоставляющее ее каждому подпространству & аТ его аннулятор ^°. Как мы в своем месте покажем, в евклидовом пространстве ковекторы можно отождествить с векторами и, следовательно, п — р-ковекторы с п — р-векторами. Отсюда следует, что в ориентированном евклидовом пространстве имеется биективное соответствие между р-век- 83
торами и л — р-векторами. При п = 3 и р = 2 это соответствие совпадает с соответствием, введенным определением 4 лекции I. 15. К сожалению, у нас нет возможности глубже вникнуть в этот интереснейший круг вопросов. Само собой разумеется, что при р = п соотношения Плюккера также тривиальны. Это, впрочем, непосредст* венно следует также и из того, что, согласно теореме 1 лекции 9 (или, точнее, ее «векторному» аналогу), пространство АпФ°) одномерно и порождается любым л- вектором е\ А ... Л еп Ф 0. Поэтому каждый коеосим- метрический функционал степени п является п-вектором вида аех Л ... У\ еЛ. Таким образом; Ап-г(Т) = лп~1(Г) и Ап(П=Ап(Г). Кроме того, конечно, А°(Л = АЧП=К и А,(^) = ЛЧЛ = ^. Применим теперь полученные результаты к геометрии пространства. Определение /.Отличный от нуля р-вектор А называется направляющим р-вектором р-мерного подпространства & czT, если 9> является его ранговым подпространством. О векторах х &^ говорят также, что они параллельны р-вектору А (обозначение: х || А). Согласно следствию предложения 4 предыдущей лекции каждый направляющий р-вектор представляет собой внешнее произведение х\ Л ... Л хр векторов некоторого базиса подпространства &> и потому с точностью до пропорциональности определен подпространством SP однозначно (и, конечно, однозначно его определяет). Определение 2. Координаты Л'1"'V произвольного направляющего р-вектора р-мерного подпространства {РаУ* называются плюккеровыми координатами этого подпространства. Они определены (при фиксированном базисе пространства F) с точностью до пропорциональности, т. е. являются однородными координатами. Через произвольный базис хи •.., хр подпространства ^ его плюккеровы координаты выражаются формулами pA'i-Wj^t ... *JpI 89
или-—что равносильно—формулами pAfi-fP = Х{ ... Xf х*1 х*Р лр • • • лр где р — произвольный множитель пропорциональности. Чтобы набор чисел А'1 '"%р был набором плюккеро- вых координат некоторого р-мерного подпространства ^, необходимо и достаточно, чтобы 1) числа А*1'"*р кососимметрично зависели от индексов, т. е. чтобы для любой подстановки а е Sp имело место равенство 2) для любых индексов /i, ..., iPt j\t ..., jp было выполнено соотношение Плюккера Это утверждение является лишь очевидной переформулировкой уже известных нам результатов. Пусть зФ — аффинное я-мерное пространство (см. в лекции 1.5) и Т — ассоциированный линеал. В полной аналогии с определением прямой и плоскости (см. лекции 1.5 и 1.6) мы введем следующее определение: Определение 3. Для любой точки М0е^и произвольного отличного от нуля р-вектора Дб f^p (T) множество всех точек Afe«s#, для которых MqM\\A, называется р-мерной плоскостью, проходящей через точку М0 параллельно р-вектору А. Этот р-вектор называется также направляющим р-вектором плоскости. При р = 1 плоскость называется прямой (ср. определение 7 лекции 1.5), а прир = п— 1 —гиперплоскостью. При р = 0 плоскости являются точками пространства s4>. Если А = а\ Л ... Аар и в пространстве s4> выбрана —>¦ точка 0, то условие М0М||Л равносильно равенству F) х = Хо + ?ах+ ... +tpap, где xq = ОМ0 и х = ОМ — радиус-векторы точек М0 и Af, a t\ ,..,/"-произвольные числа. Равенство F) назы- 90
вается векторным параметрическим уравнением плоско- • сти. В произвольной аффинной координатной системе Оех ... еп векторное уравнение F) равносильно п числовым уравнениям xx=xl + tla\+ ... +fa\9 G) хп = хЪ + №+ ... + Л& которые называются (координатными) параметрическими уравнениями плоскости. Для задания плоскости вместо направляющего р-век- тора А можно испльзовать соответствующее подпространство ^cF, состоящее из векторов, параллельных р-вектору А (т. е. являющееся его ранговым пространством). О векторах из & говорят, что они параллельны рассматриваемой плоскости. Равенство F) означает, что точка М с радиус-вектором х тогда и только тогда принадлежит плоскости, когда х — ж0е^, т. е. когда вектор х принадлежит смежному классу Хо +!? пространства Т по подпространству 53. Это мотивирует следующее определение: Определение 4. Подмножество Q линейного пространства У* называется линейным многообразием, если существует (очевидно, единственное) подпространство & с: F, смежным классом по которому является Q. Размерность 9 называется размерностью линейного многообразия Q. Мы можем, таким образом, сказать, что р-мерные плоскости аффинного пространства si> — это в точности те его подмножества, которые переходят в р-мерные линейные многообразия пространства Т при биективном отображении М*->х=ОМ. Другими словами, выбор точки Og^ позволяет отождествить плоскости аффинного пространства $t> с линейными многообразиями линейного пространства Т. Мы знаем (см. лекцию 4), что подпространства & с: Т можно задавать как аннуляторы семейств ковекторсз Ъ1, ..., lm e Т\ т. е. условиями вида |!(*) = 0, ..., |т(ж) = 0. 91
Отсюда следует, что вектор х е Т тогда и только тогда принадлежит линейному многообразию х0 + ^, когда (8) ll{x)^bi^_ilm{x)z=bmf где Ь1 = бЧ^о), ..., Ьт = |т(дсо). Это означает, что равенства (8) характеризуют радиус-векторы х точек соответствующей плоскости пространства «я?. В координатах эти равенства имеют вид ¦б!*!+ ... +Цхп=ь\ 6SV+ ••• +1п*п=ьт, т. е. представляют собой систему неоднородных линейных уравнений. Этим доказана следующая теорема: Теорема 1. Для любой системы линейных уравнений (9) точки пространства s& (векторы пространства Т), координаты х1, ...., хп которых удовлетворяют этой системе, составляют — когда они существуют — некоторую плоскость (линейное многообразие), причем любая плоскость (любое линейное многообразие) может быть получена таким образом. О Уравнения (9) называются, в соответствии с этим, уравнениями плоскости (линейного многообразия). Размерность этой плоскости равна п — г, где г — ранг матрицы коэффициентов системы (9) (см. теорему 2 лекции 4). Переход от уравнений плоскости (9) к ее параметрическим уравнениям G) означает на языке алгебры нахождение общего решения системы (9) (которое осуществляется известным нам методом; см. лекцию 2), а обратный переход от уравнений G) к уравнениям (9)^- составление уравнений, общее решение которых имеет вид G). Так как векторы аи ..., аР, по условию, линейно независимы, то в матрице а\ ... а\\ а? ... а"р) их координат найдется отличный от нуля минор порядка р. Рассматривая соответствующие равенства G) как уравнения относительно tlt ..•', tpt мы можем по форму* 92
лам Крамера выразить Z1, . >., tp через хг9 ...... хп. Подставив затем найденные выражения в остальные п — р уравнений G), мы и получим для х\ ..., хп уравнения вида (9) (cm = n — p). Все это означает, что «геометрическая» теория плоскостей в аффинном л-мерном пространстве полностью равносильна «алгебраической» теории систем неоднородных линейных уравнений от п неизвестных. Обе теории говорят об одном и том же, но на разных языках. Необходимо уметь без затруднений переходить от одного языка к другому. Пример. Тот факт, что система уравнений (9) имеет единственное решение, означает, что соответствующая плоскость имеет размерность 0 и является точкой пространства $&. Отвечающее ей подпространство SPczW состоит в этом случае только из нулевого вектора 0. Сле* довательно, система однородных уравнений 1\х1+ ... +51*-А (Ю) ЦЪЧ ... -Н>*=0 имеет только тривиальное (нулевое) решение @, ..., 0). Обратно, если система A0) имеет только тривиальное решение, то определяемое ею подпространство 3> состоит только из вектора 0. Поэтому каждый смежный класс х-\~<р состоит только из вектора дс, и, значит, уравнения (9) имеют единственное решение. Таким образом, мы видим, что (совместная) система (9) неоднородных линейных уравнений тогда и только тогда имеет единственное решение, когда система A0) однородных линейных уравнений имеет только тривиальное решение. Геометрический факт, равносильный этому алгебраическому утверждению, состоит просто в том, что если 3* = 0, то *o + & = *о для любого х0 е Т, и обратно. Аналогично, вектор х тогда и только тогда принадлежит, по определению, смежному классу х0 + ^, когда он имеет вид хо + а, где аеЛ На «алгебраическом языке» это означает, во-первых, что сумма некоторого фиксированного решения системы (9) с произвольным решением системы A0) будет решением системы (9), и, во-вторых, что любое решение системы (9) может быть так получено. 93
Разнообразные ситуации во взаимном расположении плоскостей пространства $& могут быть алгебраически охарактеризованы, скажем, условиями на ранги некоторых матриц и их подматриц. Мы не будем этим заниматься, поскольку все это достаточно скучно и вместе с тем в высшей степени громоздко. Громоздкость теории плоскостей аффинного пространства объясняется (хотя бы частично) существованием параллельных плоскостей. Естественно поэтому, что в проект ив ном пространстве эта теория несколько облегчается (хотя и остается достаточно сложной). Общее определение n-мерного проективного пространства над произвольным полем К было дано в лекции 1.26. Согласно этому определению одной из моделей этого пространства является множество всех одномерных подпространств п+ 1-мерного линейного пространства Кп+1. Конечно, вместо Kn+l мы можем взять любое /г+ 1-мерное линейное пространство Уп+1 и, значит, любое п + 1- мерное аффинное пространство s4> = s4>n+x с отмеченной в нем точкой О. В последнем варианте точками получающейся модели проективного пространства будут прямые пространства si, проходящие через точку О, т. е. это будет уже известная нам для случая п = 2 модель «в связке» (см. лекцию 1.25). Для определенности мы будем рассматривать модель Рп(Т), точками которой являются одномерные подпространства п + 1-мерного линейного пространства У. Определение 5. Плоскостью размерности г проективного пространства Рп(У) называется множество всех его точек, являющихся одномерными подпространствами некоторого г+ 1-мерного подпространства Ж а У. Таким образом, каждая г-мерная плоскость является, по определению, г-мерным проективным пространством Р'(Я). Допуская определенную неточность (но зато достигая краткости речи), обыкновенно говорят, что плоскостями пространства Рп(Т) являются подпространства пространства У (на единицу большей размерности). Так, например, еще в лекции 1.25 прямые модели &*о мы отождествляли с плоскостями аффинного пространства «я?, проходящими через точку О (т. е. с двумерными подпространствами ассоциированного линеала)* 94
Как было подробно объяснено (для случая п — 2) в лекции 1.25, проективные координаты х°:хг:... :хп точек пространства Рп(У) задаются произвольным базисом е0, еи ..., еп пространства Т. Для каждой точки М пространства Рп{Т) они представляют собой координаты в этом базисе произвольного вектора л;еУ3, порождающего эту точку как одномерное подпространство пространства Т. Это означает, что координаты х°: х{: ... :хп являются плюккеровыми координатами этого одномерного подпространства. Более общим образом, мы можем определить (при заданной проективной координатной системе) проективные координаты произвольной плоскости Pr(&)cz Pn(T) как плюккеровы координаты подпространства 91. Таким образом, эти координаты имеют вид рх°*1"'Ч где *о, *ь .... ir = 0, 1, ..., п, и подчинены следующим условиям: 1) для любой подстановки о е Sr+\ имеет место равенство pJoW — W) —^p'o-'-'r (предполагается, что а действует на числах 0, 1, ..., г); из этого условия вытекает, что существенных среди координат р*о~-1г имеется только (*t|); ими будут, например, координаты pVi-'r при /0</i< ... <in 2) для любых индексов /0, iu ¦.., *V, /о, }и •••» U выполнено соотношение Плюккера A1) p[Vi-'rp'e]/i-/f = o. Можно показать, что независимых соотношений A1) ровно A2) Nn,r = (nr + \)-(r+l)(n-r)-L Прямое доказательство этого факта требует довольно изощренной комбинаторики. В следующем семестре мы разовьем общую технику вычисления подобного рода констант, с помощью которой число A2) вычисляется тривиально. Можно развивать геометрию, основными элементами («точками») которой являются r-мерные плоскости 95
n-мерного проективного пространства (или, что равносильно, г + 1-мерные подпространства п + 1-мерного линейного пространства). Аналитически это делается на основе координат p'o'i-'-'r, т е> друшми словами, посредством отождествления r-мерных плоскостей я-мер- ного проективного пространства с имеющими координаты р1°'1'" lfy i0 < i\ < ... < iri точками N-мерного проективного пространства, где ^==\^T1J — 1- Пусть, например, г = п — 1 (случай гиперплоскостей). Тогда, как было замечено выше, существенными координатами будут п + 1 координат ро...Г...я==(_1)'^ / = 0,1, ..., п. С другой стороны, гиперплоскости задаются, очевидно, одним линейным уравнением для координат я0: х{:... ... : хп. При этом, как можно без труда проверить (сделайте это!), числа <7о, Чи ..., Цп являются как раз коэффициентами этого уравнения. В первом семестре (см. лекции I. 24 и I. 26) для прямых на плоскости (случай п = 2, г = 1) и плоскостей в пространстве (случай п = 3, г = |= 2) мы принимали за координаты коэффициенты их уравнений. Мы видим, таким образом, что плюккеровы координаты pVi---'/t являются прямым обобщением этих координат. Тот факт, что при г = п—1 координаты р'о*"** не подчинены никаким нетривиальным соотношениям Плюк- кера A1), означает, что при изображении гиперплоскостей точками ((П )— 1J -мерного проективного пространства получается все это пространство. Поскольку I J — 1 ===== лг, мы получаем, следовательно, что геометрия гиперплоскостей эквивалентна геометрии точек и, во всяком случае, не сложнее последней. Иначе дело обстоит уже для прямых в трехмерном пространстве (случай п = 3 и г==1). Здесь имеется Г 2 ) = 6 существенных координат р**\ 0 <л0 < i\ ^ 3, которые, таким образом, определяют (ввиду однородности) точку пятимерного пространства КР5. Кроме того, эти шесть координат должны удовлетворять еще соотношению /70,р23 + Р!2Р03 + Р02р3,=0 96
(см. выше; индексы уменьшены на 1, потому что теперь они принимают значения от 0 до 3), которое определяет в КР* «гиперповерхность второго порядка». Таким образом, мы видим, что геометрия прямых в пространстве эквивалентна геометрии точек некоторой «кривой» гиперповерхности пятимерного пространства. Неудивительно поэтому, что геометрия прямых в пространстве существенно сложнее, скажем, геометрии плоскостей. Именно в этом причина, почему эту геометрию мы в первом семестре, по существу, полностью игнорировали. Конечно, еще сложнее ситуация для любых г и п. Многообразие г-мерных плоскостей n-мерного пространства изображается точками (( nTt ) "~ 11-мерного пространства, принадлежащими пересечению Nn,r гиперповерхностей второго порядка. Это пересечение называется многообразием Грассмана и много лет подвергалось и до еих пор подвергается интенсивному изучению. Однако полного представления о его геометрии мы все еще не Имеем.
Лекция 11 СИММЕТРИЧЕСКИЕ И КОСОСИММЕТРИЧЕСКИВ БИЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ.-МАТРИЦА СИММЕТРИЧЕСКОГО БИЛИНЕЙНОГО ФУНКЦИОНАЛА. — РАНГ БИЛИНЕЙНОГО ФУНКЦИОНАЛА. — КВАДРАТИЧНЫЕ ФУНКЦИОНАЛЫ И КВАДРАТИЧНЫЕ ФОРМЫ.—ТЕОРЕМА ЛАГРАНЖА. По аналогии с кососимметрическими функционалами симметрические полилинейные функционалы определяются как такие функционалы В из 1Р(Т) (или из ТР(У)), что оВ = В для любой подстановки а е Sp. Однако теория таких функционалов оказывается очень сложной и в общем случае о них до сих пор мало что известно. Исключением является лишь случай /7 = 2, т. е. случай билинейных функционалов. Этими функционалами мы и займемся. Для определенности мы будем рассматривать функционалы от векторов (т. е. из Т2(У°)). Поскольку группа S2 состоит только из двух элемент тов: тождественной подстановки и транспозиции A2), билинейный функционал В тогда и только тогда симметричен, ^ ( В(х, у) = В{у, х), кососимметричену ) \ В (х, у) = — В (у, х) для любых векторов х, уеГ Подобно тому как кососимметрические функционалы составляют подпространство Л 2 ОН пространства ТгОН» множество S2W вс^х симметрических билинейных функционалов также является подпространством пространства Тг(У)- 98
Если характеристика основного поля К равна двум, то Л2 (y°) = S2(y/7)» Если же характеристика поля К отлична от двух, то подпространства ^(У) и 82 (^) будут, очевидно, дизъюнктны: Л2(ЛП82(Л = 0. В дальнейшем мы всегда будем предполагать это выполненным. Предложение 1. Пространство 72 (У) является пря* мой суммой пространств Дг (У) и S2 (#*), т. е. любой би« линейный функционал В единственным образом пред* ставляется в виде суммы симметрического функционала #сим и кососимметрического функционала Вкос: A) 5 = 5сИМ + Вк0с. Доказательство. Единственность разложения A) обеспечивается дизъюнктностью пространств Л 2 ОН и S2 (У°)> а чтобы найти хотя бы одно такое разложение, достаточно положить R _ В + аВ р _ В — аВ где а — транспозиция A2). D Заметим, что ВКос есть не что иное, как Alt В. Как мы знаем (см. лекцию 5), в данном базисе еь'..., еп пространства Т функционал В однозначно определяется своей матрицей —.. ). элементы Ьц которой задаются формулой Ъц = В (eif ef), /, / = 1, ..., /г. Значение В(х,у) функционала В на произвольных векторах х, у&Т является билинейной формой от их координат: В(Х, у) = ЬцХ1у!, с коэффициентами Ьц. Отсюда легко вытекает, что функционал В тогда и только тогда симметричен, когда его матрица симметрична, т. е. Ьц = Ьн для любых /, / = 1, ..., п. 4* 99
Действительно, если функционал В симметричен, тог в частности, В(е,-, */) = ?(е/,*,-), т. е. Ьц = Ьц. Наоборот, если bif = bju то для любых векторов ж, у будет иметь место равенство В (у, х) = Ьцу*х! = bnyfxf — 6,/^У = В (*, у) и, следовательно, функционал В симметричен. Как и для любых полилинейных функционалов, для билинейных функционалов определено понятие ранга, т. е. (см. лекцию 7) наименьшего числа ковекторов, через которые функционал тензорно выражается. С другой стороны, специально для билинейного функционала можно говорить о ранге его матрицы B). Хотелось бы думать, что эти два понятия ранга совпадают. Однако, во* обще говоря, это неверно. Прим ер. Пусть п = 2 и В = el <g> e2. Матрица этого функционала имеет вид /О 14 vo о)9 и, следовательно, ее ранг равен единице. Функционал же В тензорно выражается через два ковектора и не может быть выражен через один (хотя бы потому, что любой билинейный функционал ранга 1 симметричен). Определение 1. Ранг матрицы B) называется матричным рангом билинейного функционала В. Как мы знаем (см. лекцию 5), при переходе к другому базису матрица функционала В умножается слева и справа на матрицы Ст и С, где С — матрица перехода. Поскольку при умножении на невырожденную матрицу ранг матрицы не меняется (предложение 2 лекции 2),это показывает, что определение 1 корректно. Предложение 2. Матричный ранг гшт билинейного функционала В не превосходит его ранга п ''мат ^ ?• Доказательство. Пусть I1, ,.., gr — базис рангового пространства функционала В. Тогда В= t Ъ/б'®*', i. /-1 100
где bif9 iy / = 1, ..., г, — некоторые чиела. Если мы теперь дополним базис f-1, ¦..,' %г до базиса *>_{«, .... / = f, «г+1, .... en пространства У, то в соответствующем базисе е1®е!9 U /~ 1, .-¦, #. цростралства J^iT) (см. предложение 1 лекции 5) будет иметь место формула г 5= ? ЬИе1®еК Это означает, что в базисе еь ..., еп матрица функционала имеет вид [Ьп . | 0 . 1 0 . .. 6ir .. *rr 0 0 ... 0] ... 0 . . 0 . . 0 J Поэтому ее ранг не превосходит г. ? Для симметрических билинейных функционалов ситуация значительно удовлетворительнее. Предложение 3. Матричный ранг симметрического би~ линейного функционала В совпадает с его рангом: ''мат == '*• Доказательство. В силу симметричности любой ассоциированный ковектор имеет вид C) х^В{х, а), где а — произвольный вектор. Поскольку все такие ко- векторн линейно выражаются, очевидно, через ковекторы D) *н-> В (*, е(), * = 1, ..., я, этим доказано, что ранговое пространство 91 функционала В порождается ковекторами D). Следовательно, ранг г 5= dim 52 равен рангу семейства ковекторов D). Но ясно, что координатами (в базисе е1, ..., еп) ковек- торов D) являются столбцы матрицы B). Поэтому ранг г равен рангу этой матрицы. ? Заметим, что это доказательство сохраняется, очевидно, и для кососимметрических билинейных функционалов, так что и для них гмат — л 101
Кроме того, в обоих случаях ковекторы вида C) образуют, очевидно, подпространство. Следовательно для (косо) симметрических билинейных функционалов ранговое подпространство состоит из ассоциированных ковек- торов (а не только лишь ими порождается). Определение 2. Функционал Q: x*-*>Q(x)&K называется квадратичным, если существует такой билинейный функционал В, что E) Q(*) = B(*. ж) для любого вектора х^Т. Раскладывая В по формуле A) и учитывая, что ВКос(*, х) = 0, мы получим, что без ограничения общности функционал В в формуле E) можно считать симметрическим. Легко видеть, что тогда функционал В однозначно восстанавливается по функционалу Q, т. е., другими ело- вами, соответствие B^Q является биективным соответствием между линейным пространством S2OO симметрических билинейных функционалов и множеством всех квадратичных функционалов на У* (мы по-прежнему считаем, что характеристика основного поля К отлична от двух). Действительно, ясно, что если Q(x) = B(xtx) и функционал В симметричен, то Q(« + t)-Q(«)-QW..B(jgty) для любых векторов ж, у е Т. ? Поэтому в принципе совершенно безразлично, рассматривать симметрические билинейные или квадратичные функционалы: любое утверждение о квадратичных функционалах можно переформулировать как утверждение о симметрических билинейных функционалах, и наоборот. В качестве основных мы выберем квадратичные функционалы, переформулировку же утверждений о них на язык симметрических билинейных функционалов мы будем оставлять читателю. Для упрощения обозначений симметрический билинейный функционал, соответствующий квадратичному функционалу Q, мы будем обозначать тем же симво- 102
лом Q. Его ранг мы будем называть рангом квадратичного функционала Q. В каждом базисе ей ..., еп пространства У квадратичный функционал Q задается его матрицей /я и ... Яш \ F) ( ¦). хЯт ... Яппу элементы которой определяются формулой <7i/ = Qfo, */)> h i—h >.., п. Матрица F) является квадратной симметрической матрицей порядка я, и соответствие «функционал» ь->«его матрица» представляет собой биективное соответствие между множеством всех квадратичных функционалов па У и множеством всех симметрических матриц порядка п с элементами из поля К. Это соответствие зависит от выбора базиса: в другом базисе матрица F) умножится слева и справа на матрицы Ст и С, где С — матрица перехода. Считая базис фиксированным, мы, чтобы не вводить новых букв, будем обозначать матрицу F) тем же символом Q, что и квадратичный функционал. Ранг матрицы F) равен рангу функционала Q (предложение 3). Для любого вектора х = xlei пространства У имеет место равенство Q(*) = ?//*'*' = = qnWJ + 2qi2Xlx2+ ... + 2qlnxlxn + + Я22(х2J+ ... +2q2nx2xn + + Япп(хп)\ или, в матричных обозначениях, — равенство Q(x) = xTQXt где, как всегда, ( *' ) х=\ • |, I хп ) a Q — матрица F). 103
Определение 3. Многочлен Q{xl, ..., хп) от перемен^ ных х1, ..., хп называется квадратичной формой, если он однороден (все его члены имеют одну и ту же степень) и имеет степень 2. Ср. с лекцией 1.14. Любая квадратичная форма имеет вид Q(xl, ..., xn) = qiixlx1 = = qn(xlJ + 2ql2xlx2+ ... + 2qlnxlxn + + q22(x2J+ ... +2q2nx2xn + + <7nn(*T и потому однозначно определяется матрицей (Яп Я\% ... Я\п\ )' Яп\ Яп2 ... Япп' которая называется матрицей этой формы. Таким образом, мы видим, что значение Q(x) произвольного квадратичного функционала Qна векторе х&Тл выражается квадратичной формой Q(x)^Q{x\ ..., хп) от координат хх, ..., хп этого вектора. Это устанавливает (зависящее от выбора базиса) биективное соответствие между квадратичными функционалами и квадратичными формами. Определение 4. Две квадратичные формы назыбаются эквивалентными, если они соответствуют одному и тому же квадратичному функционалу в различных базисах. Можно также сказать, что две квадратичные формы эквивалентны, если для их матриц Qi и Q2 имеет место равенство вида Q2 = CTQiC> где С — некоторая невырожденная матрица. Если же ввести в рассмотрение однородные линейные преобразования у1 = с\х1 + ..¦ +с\хп, уп — спх1 _|_ ш # # ^_ cnxti 104
с невырожденными матрицами И ¦ к ... •- • ... «*' • «zi ф$ то можно будет сказать, что форма Q{(xl, ,¦ ., хп) эквивалентна форме Q$(x*, ..., д?л)^, если' существует такое преобразование G), что, обозначив- переменные формы Qi символами уК ..., уп и подставив вместо них выражения G), мы получим форму Qb Введенное в лекции I. Ш скалярное умножение является частным случаем симметрического билинейного функционала, характеризуемым аксиомой положительности 15°. Если отбросить эту аксиому, то вместо евклидовых пространств у нас получатся просто пространства У, в которых задан некоторый симметрический билиней* ный (или, что равносильно, квадратичный) функционал Q, Такие пространства обычно называются псевдоевкли- довыми пространствами? (доогдаг тальке* в* случае, когда iK = R). Следуя аналогии с евклидовым случаем, мы будем называть векторы х, у еУ ортогональными относительно Q или, короче, Q-ортогональными, если Q. (*>>»>'=<>. Возникает вопрос: существует ли для псевдоевклидовых пространств аналог процесса ортогоиализации Гра- ма— Шмидта (см: лекцию 1.14*)? Поскольку понятие ортонормированного семейства nw псевдоевклидовы про- странствии' перенести нельзя* {тщ спрашивается,, пронормировать вектор* х Ф Oi для которого, Q(x)<= 0?)/, естественно при этом ставить вопрос о преобразовании произвольного базиса лишь в Q-ортогональныйбазис еи ... ..., еп, т. е. такой, что Q{et> */)==*Q' при 1ф\к Ответ на этот вопрос оказывается утвердительным.: Теорема 1 (теорема Лагранжа). Для любого квадратичного* функционала Q на У существует такой базис ей ..., еп пространства'У, что- (8) Q(eiy ej) = 0 при 1ф\* 105
Доказательство. Мы не только докажем эту теорему, но и укажем практический алгоритм, позволяющий произвольный базис пространства У преобразовать в базис, обладающий свойством ($). Этот алгоритм называется алгоритмом Л а г р а н - ж а. Он состоит в последовательном применении трех элементарных преобразований, одно из которых мы назовем основным, а два остальных — вспомогательными. Основное преобразованиеЛагранжа. Это преобразование применяется к базису еь • • •» епУ если <7n = Q(«i)*=0. Оно переводит этот базис в базис (9) 2 ?" l 2 п qn 1 » п Полученный базис обладает тем свойством, что его первый вектор Q-ортогонален всем остальным: Q(e[, еЭ = 0 при *>1. Действительно, Если теперь q22 = Q (erv e2) ф О, то применяя к векторам e2i ,.., е'п (т. е., точнее, к ограничению функционала Q на подпространстве [е2, ..., в^]) то же преобразование, мы получим базис е", е", ..., е", первые два вектора которого е" и е" будут Q-ортогональны друг другу и остальным векторам, и т. д. В случае, когда это построение до самого конца не останавливается, т. е. каждый раз (пока мы не исчерпаем базис или не получится нулевой функционал) основное преобразование применимо, теорема 1 окажется тем самым доказанной. Этот случай называется регулярным. Если же на некотором этапе основное преобразование (9) оказывается неприменимым, то следует сделать вспомогательные преобразования, в результате которых полу- 106
чается базис, к которому преобразование (9) уже применимо. Первое вспомогательное преобразовав п и е. Это преобразование применяется в случае, когда <7п = 0, но существует такой индекс /0, что q.. ф 0. Оно состоит в перестановке /о-го вектора базиса на первое место: efi = ei9 если 1ф\, /0. Очевидно, что в новом базисе q\x ф 0. Второе вспомогательное преобразование. Это преобразование применяется в случае, когда qu= 0 для всех i = 1, ...¦, ft, но функционал Q не нулевой и потому существуют такие индексы i"o и /о, что qkh Ф 0. Если, например, q\2 ф 0 (это предположение общности, конечно, не ограничивает), то рассматриваемое преобразование задается формулами е'. = ер если 1^2. Тогда Яп = Q {<) = Q («1 + «2> «1 + О = 2С>12 *> 0 и можно применять основное преобразование. Ни одно из этих преобразований не применимо только тогда, когда все коэффициенты цц равны нулю, т. е. когда Q = 0. Но в этом случае любой базис, очевидно, Q-ортогонален, и потому делать с ним ничего не надо. Следовательно, применяя в нужной последовательности наши преобразования, мы рано или поздно получим Q-ортогональный базис. ? В Q-ортогональном базисе матрица формы Q, очевидно, диагональна, т. е. имеет вид о (Ю) и, значит, Q(*)=M**J+ ... +М**J 107
для любого вектора *. Поэтому на языке квадратичных форм теорема Лагранжа утверждает, что любая квадра* тинная форма Q(x\ ..., хп) эквивалентна форме вида A1) M*'J + .... +М*Т. О форме *A1) говорят, что она имеет портальный вид. Таким образом, мы видим, что любая квадратичная фор* ма Q(xl9 ..., хп) невырожденным линейным преобразо* ванием G) может быть приведена к нормальному виду (и). Последнее утверждение, также известное как теорема Лагранжа, полностью относится к алгебре, и в нем исчезли все следы <его геометрического пронохожде* ния. Поэтому оно применимо «к квадратичным формам, возникающим в любых вопросах (скажем, в механике), априори никак не связанных с теометриеи квадратичных функционалов. На практике приведение квадратичной формы Q{xl9 ..., хп) к нормальному виду следует проводить, последовательно «выделяя квадраты», т. е. пользуясь тождеством Q(х\ ..., хп) = ~{qnxl + • • • +WJ + Q'(*2> • • • > **)> Ч1L где форма Q' уже не содержит, как легко видеть, переменной хх. Это тождество соответствует ^основному преобразованию Лагранжа. В нерегулярном случае, кроме того., цриходится перенумеровывать переменные и ноль* зоваться преобразованиями вида #! — *!—#2, 4/i =*i> если /!>2. Част*ь .коэффициентов Ль ..., кп (или все они) формы A1) может быть равна нулю. Ясно, что число /-отличных от нуля этих коэффициентов равно рангу матрицы F) и, следовательно, ранту функционала Q. Переставляя, если нужно, элементы базиса, мы всегда можем добиться того, чтобы были ^отличны от нуля первые коэффициенты Ль ..., Лг. Поскольку членов с коэффициентами, равными нулю, писать не нужно, мы окончательно получаем, что нормальным видом квадратичной формы ранга г является форма М*'J+ ••• +М*Т. где Л!#0, ..., К?=0.
Лекция 12 ТЕОРЕМА ЯКОБИ. — КВАДРАТИЧНЫЕ ФОРМЫ НАД ПОЛЯМИ КОМПЛЕКСНЫХ И ВЕЩЕСТВЕННЫХ ЧИСЕЛ.—ЗАКОН ИНЕРЦИИ.—ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННЫЕ КВАДРАТИЧНЫЕ ФУНКЦИОНАЛЫ И ФОРМЫ. Напомним, что квадратная матрица называется треугольной (точнее, верхнетреугольной), если все ее элементы, расположенные ниже главной диагонали, равны нулю. Определитель такой матрицы равен, очевидно, произведению ее диагональных элементов. Поэтому треугольная матрица тогда и только тогда невырождена, когда все ее диагональные элементы отличны от нуля. Особо важное значение имеют треугольные матрицы, все диагональные элементы которых равны единице. Такие матрицы мы будем называть унитреугольными матрицами. Непосредственное вычисление показывает, что произ* ведение двух (уни)треугольных матриц и матрица, обратная (уни) треугольной матрице, также являются (уни) треугольными матрицами. Поскольку матрица основного преобразования базисов в алгоритме Лагранжа является унитреугольной матрицей [ 1 <7l2 Я\П \ Яп *" <7и О 1 ... О 10 1 J мы видим, следовательно, что в регулярном случае переход к Q-ортогональному базису осуществляется унитреугольной матрицей. 109
Пусть А— произвольная квадратная матрица поряди ка п и 1 ^ k <; я. Вычеркнув из матрицы А последние п — k строк и п — k столбцов, мы получим квадратную матрицу порядка k. Определение 1. Эта матрица называется главной под- матрицей порядка k матрицы Л, а ее определитель — главным минором порядка k матрицы А. Пусть Q и Q' — матрицы квадратичного функционала Q в двух базисах ev ..., еп и е[, ..., е'п> связанных унитреугольной матрицей перехода С. Тогда имеют место следующие очевидные утверждения: а) Главная подматрица Ck порядка k матрицы С является матрицей перехода, связывающей базисы ek и et> ., e'k подпространства ^k=^[ev ..¦, вй]=== б) Ограничение Q |^ функционала Q на подпространстве &*k является квадратичным функционалом, матрицей которого в базисе еи ..., ek является главная подматрица Qk порядка k матрицы Q, а в базисе е', . главная подматрица Q? порядка k матрицы Q'. Отсюда следует, что Q'k=CjQkCk еь- для любого ft=»l,..., n. Переходя к определителям и учитывая, что detCj ==detCft = 1, мы получаем, следовательно, что (О detQfc = detQfe для любого k =¦ 1, ..., п. В частности, если Q' = то О det Qk = Я, О для любого k = 1, ..., п. 110
Этим доказано (мы переходим на язык квадратичных форм), что если для квадратичной формы Q(x\ ..., хп) имеет место регулярный случай, то коэффициенты %i, ..., %п ее нормального вида удовлетворяют соотношениям B) Я, ... A* = Dfe, ?=1, ..., п, где Dk — главные миноры ее матрицы. ? Заметим теперь, что, производя основное преобразование алгоритма Лагранжа, мы каждый раз получаем отличный от нуля коэффициент Я (например, при самом первом преобразовании получается коэффициент %\ = *=qu?*0). В регулярном случае процесс останавливается, когда после некоторого (скажем, r-го) шага мы получаем тождественный нуль (так что все остальные коэффициенты %г+\, .¦., %п оказываются равными нулю). Отсюда и из соотношений B), во-первых, вытекает, что в регулярном случае C) ОгФ09... , ЭГФ0, где г — ранг формы (функционала), и, во-вторых, — что A1 = ZI, ^2 —~?^> ¦••> К — d • Обратно, предположим, что для матрицы квадратичной формы имеют место неравенства C), где г —ее ранг. Тогда, поскольку qu = ?>i =9^0, к форме применимо основное преобразование алгоритма Лагранжа. Согласно формулам A) главные миноры полученной после преобразования матрицы Q' будут совпадать с главными минорами матрицы Q, и потому эта матрица по-прежнему будет обладать свойствами C). Но главный минор Дг матрицы О' равен, очевидно, произведению q'nq22 (где <7jj = <7n ==Я1), и значит, q22 Ф 0. Следовательно, к ограничению функционала Q на подпространстве^, ..., е'^\ снова применимо основное преобразование Лагранжа и т. д. После г шагов мы получим матрицу вида - С ¦ • •¦'} V 0 Го/ где %\ Ф 0, ..., Кг Ф 0 и G — некоторая матрица. Но так ill
как матрицы функционала во всех базисах имеют один и тот же ранг г, то матрица D) также имеет ранг г, что, очевидно, возможно только тогда, когда все элементы матрицы G равны нулю. Таким образом, матрица D) является матрицей квад« ратичной формы в нормальном виде, а поскольку мы получили ее лишь основными преобразованиями алгоритма Лагранжа, то, следовательно, для исходной формы имеет место регулярный случай. — Тем самым нами доказана следующая теорема: Теорема 1 (теорема Я ко б и). Для квадратичной формы ранга г тогда и только тогда имеет место регулярный случай, когда первые г главных миноров ее матри* цы отличны от нуля: Алгоритмом Лагранжа такая форма приводится к виду 0i(*IJH"g-<*s)8 + ... +-^(хЪ ? Эта теорема часто бывает очень полезна. Дальнейшее упрощение нормального вида E) М*'J+ «.. +К(хгJ квадратичной формы зависит от арифметических свойств поля К. Самый простой случай возникает при К = Q. В этом случае преобразованием вида ^1 = Л/Я1 х\ Уг = л/Кхг, yr+l=xr+l> уп=*хп мы можем привести форму E) к виду (мы опускаем штрихи в обозначении координат) F) (*'J+ ... +W Этим доказано следующее предложение: Предложение 1. Любую квадратичную форму над полем С (т. е. с коэффициентами из С) линейным невырожденным преобразованием переменных {тоже с коэф- 112
фициентами из ?>) можно привести к виду F), где г — ранг формы. ? Иначе говоря, любая квадратичная форма Q(xly ... >.., хп) ранга г над полем tG имеет вид щ{хJ + ... +<|)r(xJ, где <jpi(#), ..., ($г(х) — линейно независимые линейные формы от я1, ..., хп. Следствие (теорема классификации к в а д « ратичных форм над полем JC). Две квадратич* ные формы над полем [С\ тогда и только тогда эквивалентны, когда их ранги одинаковы. ? Над полем R вещественных чисел мы можем сделать преобразование у1 «Vim*1, yr+l=xr+l9 Уп~хп, приводящее форму E) (после, быть может, дополнитель-» ной перестановки координат) к виду (мы снова опускаем штрихи у координат) G) (х1J + ... + (х*>J - (хР+Ч2 - ... - (х')\ где г — ранг формы, а р — некоторое число (удовлетворяющее неравенствам 0 ^ р ^ г). Этим доказано следующее предложение: Предложение 2. Любую квадратичную форму над полем R линейным невырожденным преобразованием переменных можно привести к виду G), где г — ранг формы, а 0<р<г. ? В связи с предложением 2 немедленно возникает вопрос, нельзя ли данную квадратичную форму привести к двум формам вида G) с различными р. Оказывается, что ответ на этот вопрос отрицателен: Предложение 3 (закон инерции квадратичных форм). Если две формы §) (х1J + ... + (хрJ — (АГР+1J - '.. • - (*г? из
и 9) (y]f + ... + (у"J-(y"+iJ - ... - (/)» эквивалентны (над полем R), то р = q. Доказательство. Эквивалентность форм (8) и (9) означает, что они являются выражениями в двух различных базисах еи ..., еп и /ь ..., fn одного и того же квадратичного функционала Q, заданного в я-мерном линейном пространстве У. Пусть & — подпространство про* странства У, порожденное векторами вь ..., ер, а С — подпространство пространства У> порожденное векторами /д+ь ...,/«: Поскольку в базисе еи ..., еп функционал Q выражается формой (8), для любого отличного от нуля вектора «g^1 имеет место соотношение Q(x) = (xlf+ ... +(*рJ>0. Аналогично, для любого вектора уе^мы имеем Q(y) = -(yq+l?~ ... -(угJ<о. Поэтому & П Q = О, т. е. подпространства & и Q дизъюнктны, и, значит (следствие 2 теоремы 1 лекции 1), для их размерностей справедливо неравенство dim^+dim#<n, т. е. неравенство р + (п — <?)< п, равносильное неравенству Аналогично доказывается, что q ^ р. Следовательно, p = q. ? Предложение 3 обеспечивает корректность следующего определения: Определение 2. Число р «положительных квадратов» в приведенной форме G) называется положительным индексом инерции данной квадратичной формы (квадратичного функционала), а число г — р«отрицательных квадратов»— ее (его) отрицательным индексом инерции. Кроме того, из предложения 3 немедленно вытекает следующее следствие: 114
Следствие (теорема классификации квад* ратичных форм над полем R). Две квадратичные формы над полем R тогда и только тогда эквивалентны, когда совпадают их ранги и индексы инерции. Особо важное значение в линейных пространствах над полем R имеют квадратичные функционалы Q, обладающие тем свойством, что Q(x)>0 при х ф 0. Их значение определяется тем, что соответствующие симметрические билинейные функционалы — это в точности всевозможные скалярные умножения на Т (см. определение 2 лекции 1.13). Определение 3. Квадратичный функционал Q на вещественном линейном пространстве Т называется положительно определенным, если Q(x)>0 для любого вектора хфО. Квадратичная форма Q(xl, ..., хп) называется поло- жительно определенной, если она является выражением положительно определенного функционала в некотором базисе, т. е., иными словами, если Q(xl, ..., хп)>0 при (х\ .... х»)Ф@, ..., 0). Матрица Q называется положительно определенной, если она является матрицей положительно определенного квадратичного функционала (квадратичной формы), т. е., иными словами, является матрицей метрических коэффициентов некоторого базиса евклидова пространства (см. лекцию 1.14). Предложение 4. Квадратичный функционал (квадратичная форма) тогда и только тогда положительно определен (определена), когда его (ее) ранг и положительный индекс инерции равны п: r — п, р = п. Доказательство. Если р = г = п, то в некотором базисе функционал Q выражается формой и, значит, Q(x) — 0 тогда и только тогда, когда хх =» = 0, ..., хп — 0, т. е. когда х = 0. Обратно, если р <п или г < п, то в некотором базисе ей .¦•> вп функционал Q выражается формой вида Q'(x1,..., х»-*) + е(х«У, 115
где Q'(xl, ..., х"-1) —квадратичная форма от координат х\ ..., х"-19 а 8^0. Тогда Q(en)= г^О, и, следовательно, функционал Q не положительно определен. ? Это предложение требует предварительного приведем ния формы к нормальному виду и потому на практике, как правило, бесполезно. Более интересно следующее предложение, дающее необходимые и достаточные условия положительной определенности квадратичной формы непосредственно по ее матрице: Предложение 5 (критерий Сильвестра). Afar- рица Q тогда и только тогда положительно определена, когда все ее главные миноры положительны: Чп > 0, #11 #12 #21 #22 |>0, #11 #21 #31 #12 #22 #32 #и #23 #33 • ;х • у #11 #Л1 #1/1 Япп >о. Доказательство. Если все главные миноры матрицы Q положительны (и, следовательно, отличны от нуля), то по теореме 1 для квадратичной формы с матрицей Q имеет место регулярный случай и эта форма приводится к виду где D\ > 0, Z>2 > 0, ..., Dn > 0. Таким образом, р = = г ==» п, и потому форма (а значит, и матрица) положительно определена. Обратно, если форма с матрицей Q положительно определена, то она приводится к сумме п квадратов, т. е. к форме с единичной матрицей Е. Поэтому (ср. с лекцией 1.14) матрица Q имеет вид Q = CTC, где С — некоторая невырожденная матрица. Следовательно, detQ = (detCJ>0. Этим доказано, что определитель положительно опреде* ленной матрицы положителен. Q другой стороны, положив в квадратичной форме Q(*x, •«., хп) от п переменных п — k последних переменив
ных x*+1, ..., хп равными нулю, мы получим квадратичную форму Qk(xl, ..., *fi) = Q(xl, ..., х\ 0, ..., 0) от k переменных х\ ..., xk, для которой будут, очевид* но, справедливы следующие утверждения: а) Если форма Q{xl, ..., хп) положительно определена, то форма Qk(xly ..., xk) также положительно определена. б) Матрицей формы Qk(xl9 ..., xk) служит главная подматрица Dk порядка k матрицы формы Q(x', ..., хп). Следовательно, в силу сделанного выше замечания все главные миноры ?),*, k = 1, ..., п, положительно определенной -матрицы положительны. П Предложение 5 'отвечает, в частности, на постав л еи- еый в .лекции 1.14 вапрос о необходимых и достаточных условиях, которым далжна удовлетворять квадратная матрица для того, чт$бы она 13ншдаа матрицей коэффициентов некоторого ябааноа *е»клидова пространства.
Лекция 13 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА л-МЕРНО* ГО ПРОЕКТИВНОГО ПРОСТРАНСТВА.- ГИПЙРПО* ВЕРХНОСТИ ВТОРОГО ПОРЯДКА КОМПЛЕКСНОГО И ВЕЩЕСТВЕННО-КОМПЛЕКСНОГО ПРОЕКТИВНОГО ПРОСТРАНСТВА.— ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА /г-МЕРНОГО АФФИННОГО ПРОСТРАНСТВА.— ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА КОМПЛЕКСНОГО И ВЕЩЕСТВЕННО-КОМПЛЕКСНОГО АФФИННОГО ПРОСТРАНСТВА. Применим полученные в предыдущих лекциях результаты о квадратичных формах к исследованию гиперповерхностей второго порядка в проективном /г-мерном пространстве. Определение 1 (ср. с определением 2 лекции 1.25). Гиперповерхностью второго порядка n-мерного проективного пространства (над произвольным полем К характеристики, отличной от двух) называется множество точек, проективные координаты х0: Х\: ... : хп которых удовлетворяют уравнению вида Q (xq, х\, ..., хп) = О, где Q(x0,xu ¦.., Хп) — некоторая квадратичная форма от координат #о, хи ..., хп. (Сейчас нам удобно писать индексы у координат снизу.) Из теоремы Лагранжа непосредственно вытекает следующая теорема: Теорема 1 (о приведении к нормальному виду уравнений гиперповерхностей второго порядка «-мерного проективного пространства над произвольным полем К). Для любой гиперповерхности второго порядка п-мерного 118
проективного пространства над полем К характеристики, отличной от двух, существует система проективных координат Хо: Х\: ...: хП} в которой уравнение этой гиперповерхности имеет вид A) АоХо + А,1*?+ ...+urAV = 0, где О < г < п и К{ Ф О, ..., \ ф О. ? При г = п гиперповерхность A) называется овальной гиперповерхностью второго порядка. Очевидно, что для любой k— 1-мерной плоскости По проективного пространства и любой его точки МфП0 существует единственная й-мерная плоскость МПо, содержащая М и П0. Определение 2. Гиперповерхность n-мерного проективного пространства (над произвольным полем К) называется k-кратным цилиндром (или k-кратным конусом — в проективном пространстве понятия цилиндра и конуса совпадают), если существует такая k—1-мерная плоскость П0 {осевая плоскость цилиндра), что для любой точки М гиперповерхности, не принадлежащей плоскости П0, плоскость МПо целиком принадлежит гиперповерхности. Каждая п — ^-мерная плоскость П, не имеющая общих точек с плоскостью По, пересекает цилиндр по гиперповерхности в П, которая называется основанием цилиндра, О цилиндре говорят также, что он есть цилиндр над своим основанием. Очевидно, что каждый цилиндр является объединением всех ^-мерных плоскостей вида МПо, где М — произвольная точка его основания. В этом смысле геометрия цилиндра полностью сводится к геометрии его основания. Имея все это в виду, рассмотрим гиперповерхность A) при г < п. Пусть П — плоскость размерности г, определяемая п — г уравнениями хг+\ = О, ..., хп = 0, В этой плоскости числа Хо, *ь ..., хг являются проективными координатами, и в этих координатах уравнение A) определяет некоторую овальную гиперповерхность второго порядка. Пусть, кроме того, По — плоскость размерности п — г— 1, определяемая г+ 1 уравнениями х0 = 0, #1 = 0, ..., хг = 0. Тот факт, что вместе с некоторой точкой (jc00) : xf]: ... : х^) гиперповерхность A) содержит и все точки вида (*00): *{0): ... : xf: *r+l: ... : хп), где хг+ь ..., хп — 119
произвольные числа, означает, очевидно, что эта гипер* поверхность является п — r-кратным цилиндром с осевой плоскостью П0. Основанием этого цилиндра^ служит гиперповерхность, определяемая в плоскости П уравнением A). Этим доказана следующая теорема: Теорема 2 (о перечне л е н и и г и пер по в ер х н о -¦ стей второго порядка п-мерного проективного пространства над произвольным полем К). Каждая гиперповерхность второго порядка n-мерного проективного пространства над полем К характеристики, отличной от двух, является либо овальной гиперповерхностью, либо k-кратным (J <.*# ^п) цилиндром над овальной гиперповерхностью п — k-мерного проективного пространства. ? Одномерным проективным пространством является прямая, а овальной «гиперповерхностью» в ней-—пара различных точек (или пустое множества),. Поэтому соответствующий п— 1 -кратный цилиндр представляет собой пару различных гиперплоскостей. При k = п дело обстоит хитрее. Нульмерным проективным пространством является точкам а овальной' гиперповерхностью в нем—пустое множество. Вместе с тем уравнение х\ = 0 определяет в я^мернвм* {п > 0) проективном пространстве «двойную» гиперплоскость Хо = 0. Поэтому; чтобы, подвести этот случай под общую терминологию, приходится считать, что п*щъттм цилиндром над пустым множеством является5 гиперплоскость n-мерного пространства и что в-нульмерном- проективном пространстве овальной гиперповерхностью второго порядка является «дважды шятое»- пустое множество. Удобно также ввести понятие 0-кргатного цилиндра над данной гиперповерхностью, понимая под ним саму эту гиперповерхность. Тогда любая гиперповерхность второго порядка n-мерного проективного пространства будет А-кратным @ ^Г6 ^ п) цилиндром'' нед некоторой овальной гиперповерхностью п — ^мерного пространства. В случае К = Ш все коэффициенты* А,ц. ..., V уравнения A) мы можем считать равными единице. Поэтому для любого г, О^г^п, будет иметься только одна ги- 120
перповерхность A), и в силу инвариантности раш?а эти гиперповерхности при различных г будут проектавно не эквивалентны. Этим доказана следующая теорема: Теорема 3 (о классификации гиперповерхностей второго порядка п-мерного проективного пространства над но л ем LC). В комплексном n-мерном проективном пространстве имеется только п + 1 проективно неэквивалентных гиперповерхностей второго порядка: одна овальная гиперповерхность и для любого г, 0 ^ г ^ п— 1,. цилиндр* кратности п — г над овальной гиперповерхностью r-мерного про- странства. ? В случае К ¦= R, как мы знаем из I, геометрическая ситуация не адекватна алгебраический и приходится вводить вещественно-комплексные пространства (т. е. переходить в ситуацию (С1, R); ср. с лекц«е& 1.20). Подчеркнем, что алгебраическая ситуация вр<и этом не меняется: все преобразования, координат по-прежнему будут преобразованиями над R, и все уравнения будут иметь вещественные коэффициенты.. Гиперповерхность второго порядка вещеетвенно-комп- лесного проективного (или аффинного; см. ниже) пространства мы будем называть s-планарнбй (s^—1), если гиперповерхность не содержит ни одной s-f 1-мерной плоскости, но через любую ее вещественную точку проходит хотя бы одна (вещественная) 5-мерная плоскость, целиком содержащаяся в гиперповерхности. Например, в трехмерном пространстве двуполостный гиперболоид О-нланарен, а однополостный— 1-плаларен. Гиперповерхность —4-планарна тогда и только тогда, когда она не содержит вещественных точек. В ситуации (.С, R) уравнение A) мы можем привести к виду B) х\+ ... +^~4+i_ ... -*2 = 0, 0<г</г, причем за счет умножения ур*авйёни# на —1 мы може&, без ограничения общности, считать, что где Гг"Г • I — целая часть числа Цр (если [Цр^** = m, то r==2m или r = 2m — I J. 121
При г = п гиперповерхность B) называется невырож* денной гиперповерхностью второго порядка. Можно показать (сделайте это!), что невырожденная гиперповерхность B) /7-планарна. Таким образом, в частности, при р = —1 невырожденная гиперповерхность B) не имеет вещественных точек. Она называется мнимой овальной гиперповерхностью второго порядка. При р = О невырожденная гиперповерхность B) называется действительной овальной гиперповерхностью второго порядка. При р>\ и г = п гиперповерхность B) называют, не мудрствуя лукаво, невырожденной р-планарной гиперповерхностью второго порядка. Поскольку р-плаиарность является, очевидно, проек- тивно инвариантным свойством, все невырожденные гиперповерхности B) проективно не эквивалентны. При г < п гиперповерхность B) является п — /--кратным цилиндром над невырожденной гиперповерхностью r-мерного пространства, задаваемой тем же уравнением B). Поэтому все гиперповерхности B) также проективно не эквивалентны. Этим доказана следующая теорема: Теорема 4 (о классификации гиперповерхностей второго порядка вещественно- комплексного n-мерного проективного пространства). В вещественно-комплексном п-мер- ном (п > 0) проективном пространстве имеется только I П а 1"^" * проективно неэквивалентных, невырожденных и не являющихся цилиндрами гиперповерхностей второго порядка: две овальные гиперповерхности (мнимая и действительная) и (при п>2) для каждого р = «= 1, ..., ['2 J "~ ' °^на Р'планаРная гиперповерхность. Все остальные гиперповерхности второго порядка являются k-кратными (l^k^n) цилиндрами над невырожденными гиперповерхностями п — k-мерного пространства (при k = n — двойными гиперплоскостями). ? Аналогичные теоремы имеют место, конечно, и в аф- финно-проективном пространстве, получающемся из проективного пространства выбором некоторой гиперплоскости в качестве несобственной гиперплоскости. В дополнение ко всему прежнему гиперповерхности второго порядка будут в таком пространстве различаться 122
еще и их расположением относительно несобственной гиперплоскости. Например, вместо единых цилиндров-конусов возникнут два класса гиперповерхностей: цилиндры, если осевая плоскость П0 целиком содержится в несобственной гиперплоскости, и цилиндры на единицу меньшей кратности над конусами, если плоскость По имеет собственные точки (в случае, когда По является собственной точкой, получаются просто конусы). Поэтому классификация гиперповерхностей второго порядка даже в комплексном аффинно-проективном пространстве хотя и тривиальна, но довольно громоздка. Соответствующих теорем мы по этой причине не будем даже формулировать. Удалив из аффинно-проективного пространства несобственную гиперплоскость, мы получим аффинное пространство. Поэтому классификацию гиперповерхностей второго порядка в комплексном аффинном пространстве можно получить из их классификации в аффинно-проективном пространстве, причем число классов только уменьшится. Однако для большей геометрической ясности мы предпочтем получить эту классификацию непосредственно. Пусть $Ф — аффинное n-мерное пространство (над пока произвольным полем К характеристики, отличной от двух) и Т — ассоциированный линеал. Определение 3. Гиперповерхностью второго порядка аффинного пространства s& называется его подмножество, состоящее из точек, аффинные координаты Х\, ... ..., хп которых удовлетворяют уравнению вида F{xb ..., x„)==0, где F(xu ..., хп)—некоторый многочлен второй степени от лсь ..., хп. Ср. с определением 2 лекции 1.18. Введя вектор х = х\в\ + -.. + хпеп (т. е. радиус-вектор точки М{х\, ..., хп))у мы можем уравнение F(x\, ... ».., xn) — Q записать в следующей «векторной» форме: C) Л(*) + 2а(*) + аоо = 0, где А — некоторый квадратичный функционал: п 123
а — некоторый линейный функционал: п i = l и а0о — некоторое число. (В соответствии с принятым в нервом семестре обозначениями вместо индекса 0 надо было бы гшеать индекс п+ 1, но из чисто типографских соображений мы предпочтем сменить обозначения.) Переместив начало координат О в точку О', мы для каждой точки Mei получим новый радиус-вектор я'гзгО'М, связанный с прежним радиус-вектором х=ОМ соотношением х = х' + х0, где х0 = О(У. Поэтому уравнение C) заменится уравнением А .(*' + *о) + 2а (х' + х'о) + а0о = О, т. е. (мы убираем штрих в обозначении вектора х') уравнением Л'(*) + 2а'(*) + о?>==0, где А' = А, D) «' -«а0 + а, <4 = Л (#0) + 2а (*о) + а<ю. (Здесь символом ао обозначен ассоциированный ковек* тор х *->А{х, х0).) Определение 4. Точка с радиус-вектором xQ = xf]e{ + + ... + л^е^ называется центром гиперповерхности C)f если а0 + а = 0, т. е, если п E) ? aaxf + ai0 = 0, /=1, .... л. Соотношения E) представляют собой систему п уравнений от п неизвестных xf\ ... , х®К Если эта система имеет единственное решение, т. е. если существует единственный центр, то гиперповерхность C) называется центральной, а в противном случае — нецентральной. 124
/ Определителем системы E) является определитель F) б= | ап\ . • • апп | матрицы функционала А, Поэтому, если 6 ф О, то по правилу Крамера система E) имеет единственное реше* ние. Если же 6 = 0, то ранг г матрицы системы E) меньше п, и потому (теорема Кронекера — Капелли)^ система E) либо несовместна (центров нет), что имеет место, когда ранг матрицы /у\ /AfO #U '•* &Ы \ ^апо ап1 . •. апп ' равен г + 1, либо определяет в пространстве М плоскость {плоскость центров) размерности п — г, когда ранг матрицы G) равен г. Таким образом, гиперповерхность C) тогда и только тогда центральна, когда б ф 0. ? Если гиперповерхность C) имеет хотя бы один центр, то, поместив начало координат в центр, мы получим для нее уравнение вида Л(ж) + аоо = 0. При этом, если аоо Ф 0> то мы можем, не теряя общности, разделить это уравнение на аоо. Кроме того, согласно теореме Лагранжа мы можем выбрать базис координатной системы так, чтобы имело место равенство (8) А(х) = Ххх*+ ... +КгХ% где КхфОу »* ¦, %г Ф 0. Этим доказано, что для гиперповерхности второго порядка, имеющей центр, существует система аффинных координат х\, ..., хп, в которой ее уравнение имеет вид где Xi ф О, ..., Кг Ф 0, а е = 0, 1. П При г = п эта гиперповерхность центральна, а при г < п является п — r-кратным цилиндром над центральной гиперповерхностью r-мерного пространства. Предположим теперь, что гиперповерхность C) центра не имеет (что, заметим, возможно только при п> 1). Это означает, что в сопряженном пространстве 125
Tf ковектор а не имеет вида — осо, т. е. не является ко- вектором, ассоциированным с билинейным функционалом Л, и, значит, не лежит в ранговом пространстве 91 функ-* ционала Л. Приведем квадратичный функционал А к виду (8). Это означает, что в ранговом пространстве 91 соответствующего билинейного функционала А мы найдем такой базис е\ ..., е\ что Л = Я1е1®е1+ ... + Ягег <8> ег. (Чтобы получить базис еи ..., еп пространства Т, в котором значения квадратичного функционала А выражаются формулой (8), следует произвольно дополнить этот базис до базиса е\ ..., еп пространства Y* и перейти к сопряженному базису.) Поскольку афЁЯ, ясно, что базис е\ ..., еп мы можем выбрать так, чтобы имело место равенство er+!= = —а, т. е. чтобы а (х) =—#r+i для любого вектора х<==Т. В таком базисе при любой начальной точке О уравнение вида C) приобретает вид (9) Xix\+ ... +Кх2г-2хг+1 + аоо = 0. Сдвинув начало координат О в точку с координатами (о и -221 0 й\ V. * * *» * о ' * * *' ) 9 г раз мы, очевидно (см. последнюю из формул D)), получим уравнение вида (9) с аоо = 0. Этим доказана следующая теорема: Теорема 5 (о приведении к нормальному виду уравнений гиперповерхностей второго порядка n-мерного аффинного пространства над произвольным полем К). Для любой гиперповерхности второго порядка п-мерного аффинного пространства над полем К, характеристики, отличной от двух, существует система аффинных координат, в которой ее уравнение имеет либо вид (I) A,i*?+ ... +Ягл> = е, где 1 ^г ^п и е = 0 или 1, либо (что возможно толь- ко при п > 1) вид (И) hx\+ .,. + Кх* = 2лгг+ь 126
где l^r^M— 1, причем в обоих случаях %\фО, ... ..., К ф 0. ? При г = п и е = 1 гиперповерхность (I) называется овальной гиперповерхностью второго порядка. При г = п и е = 0 она называется конусом второго порядка и представляет собой конус над овальной гиперповерхностью п— 1-мерного пространства. При г <п гиперповерхность (I) представляет собой п—г кратный цилиндр, основанием которого является либо овальная гиперповерхность (при е = 1), либо конус второго порядка (при е = 0) r-мерного пространства. Гиперповерхность (II) при г = п— 1 называется параболоидом. При г < п — 1 она представляет собой л — г—1-кратный цилиндр над параболоидом г +1-мерного пространства. Таким образом, имеет место следующая теорема: Теорема 6 (о перечислении гиперповерхностей второго порядка я-мерного аффинного пространства над произвольным полем К). Каждая гиперповерхность второго порядка n-мерного аффинного пространства над полем К характеристики, отличной от двух, является либо а) овальной гиперповерхностью, либо б) конусом, либо в) параболоидом (при п > 1), либо г) цилиндром кратности k, l^k^n— 1, над одной из гиперповерхностей типов а), б), в) п — k-мерного аффинного пространства. При этом гиперповерхности различных типов аффин- но не эквивалентны. Последнее утверждение вытекает из того, что 1) гиперповерхности типа б) обладают вершиной (точкой, для которой прямая, соединяющая ее с произвольной точкой гиперповерхности, целиком лежит на этой гиперповерхности), а типа а) —нет; 2) гиперповерхности типов а) и б) имеют центр симметрии, а типа в) — нет; 3) гиперповерхности типа г) являются цилиндрами, а типов а), б), в) — нет. ? При К = С в каждом из классов а), б) и в) имеется, с точностью до аффинной эквивалентности, лишь одна гиперповерхность второго порядка. Это означает, что справедлива следующая теорема: 127
Теорема 7 (о классификации гиперповерхностей второго порядка п-и ер ного а ффин- ного пространства над полем С). В комплексном n-мерном аффинном пространстве при п = 1 имеется только две аффинно неэквивалентные гиперповерхности второго порядка: овальная гиперповерхность, состоящая из двух различных точек, и конус второго по- рядка, представляющий собой две совпадающие точки, а при п > 1 — три такие гиперповерхности, не являющиеся цилиндрами: овальная гиперповерхность, конус второго порядка и параболоид. Остальные гиперповерхности второго порядка n-мерного (п > 1) аффинного пространства являются k-кратными A ^ k ^ п — 1) цилиндрами над указанными тремя (при k = п — 1 двумя) гиперповерхностями п — k-мерного аффинного пространства. ? При K = R (в ситуации (С, R)) уравнение (I) можно привести к виду (Г) х\+ ... +*»_*»+1- ... -*» = е, где е = —1, 0 или 1 и 1<г^п, а уравнение (II) — к виду (И') х\+ ... +4-4+1- ... -*?=»2*г+1, где 1 ^ г ^ п — 1, причем за счет умножения на —1 (и изменения знака у координаты xr+i) можно без ограничения общности в обоих случаях считать, что О^р ^ <-¦ Га в случае (Г) при /> = у и, значит, при п четном — еще, кроме того, что е ф —1). При г=п гиперповерхность (Г) называется невырожденной гиперповерхностью второго порядка. При г ф О и р = 0 невырожденная гиперповерхность называется эллипсоидом, — мнимым, если е > 0, и действительным, если е < 0. При п = 2 это мнимый и действительный эллипсы, а при п = 1 — пары мнимых или действительных точек. При е — 0 невырожденная гиперповерхность второго порядка называется конусом второго порядка. При р,= 0 конус второго порядка содержит только одну вещественную точку и на этом основании он обычно называется мнимым конусом второго порядка. 128
При в^ОиКр.^1' невырожденная гиперповерхность второго порядка называется е-гиперболоидом. При п = 2 существует только один гиперболоид — гипербола и два конуса — пары мнимых и действительных пересекающихся прямых. При п = 1 гиперболоидов нет, а конус существует только один — пара совпадающих точек. Так же как и в проективном пространстве, гиперповерхность второго порядка вещественно-комплексного аффинного пространства называется s-планарной, если через любую ее вещественную точку проходит хотя бы одна 5-мерная плоскость, целиком принадлежащая гиперповерхности, но никакая s + 1-мерная плоскость не содержится в гиперповерхности. Можно показать (сделайте это!), что каждый е-гя- перболоид 5-планарен, где s = р— 1, если е = 1, и s —р, если 6 = —1, а каждый конус второго порядка р-дланарен. При г <.п гиперповерхности (Г) являются п<-^г- кратными цилиндрами над невырожденными гиперповерхностями г-мерного пространства. При г = я—1 гиперповерхность (II') называется па- раболоидом,— эллиптическим, если р = 0 (при п = 2 это парабола), и гиперболическим, если 1 *^р <-j. ^ож- но показать (сделайте это!), что каждый параболоид р-планарен. При г < п — 1 гиперповерхность AГ) представляет собой п — г—1-кратный цилиндр над параболоидом г-мерного пространства. Так же, как и в случае К = С, доказывается, что эллипсоиды вместе с гиперболоидами, конусы, параболоиды и цилиндры аффинно не эквивалентны. Параболоиды между собой аффинно не эквивалентны, ибо они р-планарны при разных р. По этой же причине не эквивалентны между собой конусы, а также е-гиперболоиды с одним и тем же е. Действительный и мнимый эллипсоиды очевидным образом аффинно не эквивалентны и не эквивалентны ни одному е-гиперболоиду, за возможным исключением 1-гиперболоида при р = 1 (т. е. Опланарного). Но среди сечений последнего гиперболоида двумерными плоскостями имеются гиперболы, что Неверно для эллипсоида. Поэтому эллипсоид и 0-пла- 5 М. М. Постников, семестр II 129
парный 1-гиперболоид также аффинно не эквивалентны. Наконец, при s > 1 для 5-планарного 1-гиперболоида (отвечающего значению р = 5+1) максимальная раз* мерность плоскостей, пересекающих его по мнимому эллипсоиду (т. е. в вещественной области с ним не пересекающихся), равна (докажите!) л — 5—1 = п — р, а для 5-планарного— 1-гиперболоида (для которого р = s) аналогичная размерность равна (докажите!) s = р. Поскольку в этой ситуации равенство р = п — р невозможно (ибо при п = 2р случай е = —1 по условию исключен), мы видим, что 5-планарные ±1-гиперболоиды также аффинно не эквивалентны. Тем самым доказана следующая теорема: Теорема 8 (о классификации гиперповерхностей второго порядка л-мерногоаффин- ного пространства в ситуации (С, R)). В вещественно-комплексном n-мерном аффинном пространстве имеются только следующие аффинно неэквивалентные гиперповерхности второго порядка, не являющиеся цилиндрами: а) два эллипсоида (мнимый и действительный); б) один s-планарный 1-гиперболоид для любого f=o, 1,..., [-J]— 1; в) один s-планарный — l-гиперболоид для любого 5=1, ..., т, где m^-g — 1, если п четно, и m = ^-jp-, если п нечетно; г) один р-планарный конус второго порядка для любого р = 0, 1, ..., [у] (при р = 0 это мнимый конус); д) один р-планарный параболоид для любого р = 0, ••• |у] (пРи Р = 0 это эллиптический параболоид, а при р=1, •.., Иг|—- гиперболические параболоиды). Все остальные гиперповерхности второго порядка являются k-кратными цилиндрами A ^ k ^ п — 1) над перечисленными гиперповерхностями п — k-мерного аффинного пространства. ?
Лекция 14 АЛГЕБРА ЛИНЕЙНЫХ ОПЕРАТОРОВ. — ОПЕРАТОРЫ И СМЕШАННЫЕ БИЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ.— ЛИНЕЙНЫЕ ОПЕРАТОРЫ И МАТРИЦЫ. — ОБРАТИМЫЕ ОПЕРАТОРЫ.-СОПРЯЖЕННЫЙ ОПЕРАТОР.— АЛЬТЕРНАТИВА ФРЕДГОЛЬМА. — ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА И ИНДУЦИРОВАННЫЕ ОПЕРАТОРЫ. Возвратимся теперь к теории линейных пространств и рассмотрим последний еще нами не изученный тип билинейных функционалов — смешанные функционалы В: х9 ?*->?(*, g), где же Г, \<=У (см. лекцию 5). Оказывается, что эти функционалы тесно связаны с гомоморфизмами (см. определение 5 лекции 3), для которых УГ — Т. Определение I. Гомоморфизмы из У9 в У0 называются линейными операторами на Т. Таким образом, отображение (I) А: Т->Г является линейным оператором, если A(x'+tf)=*Ax+Af и A{kx) = kAx для любых векторов х, у&У и любого числа JeK. Сумма А + В линейных операторов Л и В и произведение kA линейного оператора А на число k& К определяются обычным образом: (А + В)х = Ах + Вх, \kA)x = k(Ax)t 5* 131
И являются, очевидно, линейными операторами. Непо* следственно проверяется, что относительно этих опер^г ций множество Ор(У) всех линейных операторов на У> является линейным пространством. Нулем этого пространства служит нулевой оператор О, действующий по формуле О(*) = 0. Кроме сложения, для операторов определено и уц* поженив Д, В ь-> АВ, где, как обычно для отображений, произведением АВ операторов считается их композиция Л «В. Таким образом, {АВ}х=А{Вх) для любого вектора *еУ. Оператор АВ, очевидно, линеен. Тривиальная выкладка показывает, что умножение операторов ассоциативно: {АВ)С — А{ВС) (так что в произведении любого числа операторов мояс- но не писать скобки), и дистрибутивно относительно ело*» жения: А(В + С) = АВ + АС. Это означает, что множество Ор (У) является также и кольцом. Это кольцо обладает единицей, которой является .годе дественный оператор Е; Т-+У*, оставляющий каждый вектор х .е У на месте: Ех = х. Вообще говоря АВ Ф* ВА, так что кольцо Ор (У) некоммутативно (при п > 1), Умножение операторов связано с их умножением на числа ftsK формулой B) (kA) В = A{kB) = k (АВ), доказательство которой сводится к тривиальной выкладке. Кольца, которые одновременно являются линеалами и в которых выполнено соотношение B), называются ал- гебрами. Таким образом, подытоживая все сказанное 132
выше, мы видим, что множество Ор (Ж) является алгеброй. D Из соотношения B), в частности, вытекает, что (kE)A^A(kE) для любого оператора А. Таким образом, операторы вида kE— они называются скалярными операторами — перестановочны со всеми операторами. Оказывается (попробуйте показать это самостоятельно), что это свойство характеризует скалярные операторы, т. е. любой оператор, перестановочный с каждым оператором из Ор(З^), скалярен. Можно сказать, таким образом, что алгебра Ор(Т) некоммутативна в максимальной степени (насколько это допускает структура алгебры). Каждый оператор А определяет по формуле А(х, |) = 1й*) некоторый смешанный билинейный функционал A s Т\(У). Обратно, ддя любого смешанного билинейного функционала Л соответствие, сопоставляющее произвольному вектору xef ассоциированный ковектор Ах:1*-*А(х9 1) пространства У (т. е., в силу отождествления (Т'У = == ТЛ вектор пространства Т), является линейным ойе- ратором АеОр{Г). Поскольку построенные отображения Ау—> А и А ь-> Д, очевидно, взаимно оОратны, каждое из них биективно. Поскольку эти отображения, очевидно, сумму переводят в сумму и произведение на число в произведение на то же число, оба они представляют собой изоморфизмы. Тем самым доказано, что линейные пространства Op(F) и Т} (Т) естественно изоморфны. О Как правило, мы будем отождествлять оператор с соответствующим билинейным функционалом. Пусть в пространстве Т выбран некоторый базис ф, ,.., еп. Тогда для любого вектора х=х1в\ + ... +хпеп оудет иметь место равенство (з) А*=*ч+ ..; +*ч>, где щ = Аеи . •., ап == Ле„. Обратно, для любого семейства векторов йи .,.,, ап формула C) однозначно 133
определяет некоторый линейный оператор А, для которого а\ = Леи • • •, &п = Аеп. Таким образом, при фиксиро-^ ванном базисе еи , еп операторы AeOp(F) находятся в биективном соответствии с п-членными семействами векторов аи ...., Ил. П Каждому такому семейству отвечает квадратная матрица, столбцы которой состоят из координат векторов аи .. ¦, йп (в том же базисе ей » еп): D) А = \ • . Поскольку это, очевидно, устанавливает биективное соответствие между матрицами и семействами аи ..., я* векторов, мы получаем, тем самым, биективное соответствие между операторами и квадратными матрицами порядка п. Автоматическим вычислением проверяется, что это соответствие является изоморфизмом (сумму пере-* водит в сумму и произведение на число — в произведение на то же число). Тем самым нами доказано следующее предложение: Предложение 1. Выбор базиса еи ..., еп линейного n-мерного пространства У* над полем К устанавливает изоморфизм между алгеброй операторов Ор (У) и алгеброй квадратных матриц порядка п над К. ? При этом изоморфизме оператору А отвечает матрица А, столбцы которой состоят из координат векторов Ави ..., Аеп в базисе ei, ..., е«. Определение 2. Матрица А называется матрицей оператора А в базисе еи ..., еп. Так как a/ = e/(Aet), то А является также и матрицей смешанного билинейного функционала А. Отсюда следует (см. лекцию 5), что матрица A' = (а*') оператора А в любом другом базисе е\'9 ..., еп' выражается формулой. E) А' = С~ХАС, где С = (с\') — матрица перехода. Впрочем, формула E) без труда устанавливается и непосредственным вычислением: так как е%, = c\st и €j = cfej,, то afar = Aev = с\,Ае^ — с\,а\е1 = с\л\с^€у% 134
а это равносильно E). Конечно, это вычисление фактически является повторением выкладки из лекций 5, Чтобы провести то же вычисление в матричных обозначениях, введем в рассмотрение векторные матрицы- строки е = (ei, ..., еп), e'~ (ег, ..., еп)> Ае — (Аеи ..., Аеп), Ae' = (Aei',...f Aen>). Тогда (ср, с формулой A4) лекции 1.10) Ае = еА, Ае' = е'А'. С другой стороны, в силу линейности Ае' = А(еС) = {Ае)С. Следовательно, е'А' = Ае' = (Ае)С = еАС = е'С-{АС9 и, значит, А' = С~1АС. О Оператор А называется невырожденным, если det А Ф 0 (и, соответственно, вырожденным, если deti4 = 0). Из формулы E) непосредственно вытекает, что это определение корректно. Особый интерес представляют обратимые операторы, т. е. такие, для которых существует обратный оператор А"*1, удовлетворяющий соотношениям AA~l = A~lA = E. Оператор А называется обратимым слева, если существует такой оператор В, что ВА = Е, и обратимым справа, если существует такой оператор С, что АС^Е. В произвольных кольцах (или алгебрах) существуют обратимые элементы, которые обратимы только справа или только слева. Для линейных операторов же дело обстоит совсем по-другому: оператор обратим, если он обратим хотя бы слева или справа. Это тесно связано с тем (поистине удивительным) фактом, что линейный оператор биективен, если он всего лишь инъективен или 135
еюръективен. (Заметим кстати, что хотя обратимый оне- ратор, очевидно, биективен, но утверждение, что любой биективный линейный оператор обратим, г. е. что обратный оператор линеен, требует доказательства.) Предложение 2. Для любого линейного оператора А; У-+У следующие утверждения равносильны: 1° Оператор А обратим слева. \ 2° Оператор А инъективен, т. е. Кег А = 0. 3° Оператор А обратим справа, 4° Оператор А сюръективен, т. е. Im A = У. 5° Оператор А обратим, 6° Оператор А биективен. 7° Оператор А невырожден. 8° Для любого базиса ей ...» еп пространства У векторы Аеи ..., Аеп также составляют базис. Доказательство. Равносильность утверждений 7° и 8° немедленно следует из теоремы о ранге матрицы. Поэтому нам надо доказать лишь равносильность утверждений Г —6° и 8°. Мы сделаем это, доказав следующую диаграмму импликаций: • г=>яг % V5* Импликация 5°?М0. Если А — обратный оператор, то А~~1А = Е. Импликация Г=>-2°. Если ВА = Е и А* = 0, то x = Ex = BAx = BQ = Q: Импликация 2°=ф-8°. Если векторы Аеи ... Аеп, линейно зависимы, т. е. k\Ае\ + .. • + k&Aen = 0, где (Ль ..., kn) Ф @, ..., 0), то для вектора е = ktfi + + ..* +knen Ф 0 будет иметь место равенство Ае = 0. Следовательно, если Кег А = 0, то векторы Ае\, ..., Аея линейно независимы и потому составляют базис. Импликация 5° =>• 3°. Если А — обратный оператор, то АА~Х=Е. Импликация 3°=>4°. Если АС = Е, то Ау = х для любого вектора xef, где у = Сх. Импликация 4°=ф-8°. Если для любого вектора *еУ существует такой вектор jfef, что Ау = х9 то х = у1Авх + •.. + упАеп. Это доказывает, что семейство Леи • • - > АеПУ состоящее из п векторов, полно. Следовательно, оно является базисом. 136
Импликация 8°=^5°. В базисе е\ = Aev\.V,е'п = = Аеп семейство векторов Ь\ — еи ... > К — еп определяет оператор 2?, для которого Ве^ — Ъи ..., Ве'п = Ьп и, значит (ВЛ) *!=*!, •.•, (ВА)еп = еп, т. е. ВА = Е. Для этого же оператора (ЛВ) е^ = е\у .,., (ЛВ) е^ = efn и, значит, АВ = Е. Следовательно, оператор Л обратим (и В = -А)- ? Векторное уравнение Лж = 6 записывается в координатах системой из п линейных уравнений от п неизвестных. Поэтому на языке уравнений равносильность утверждений 2° и 4° означает, что система из п неоднородных линейных уравнений от п неизвестных тогда и только тогда совместна при любых свободных членах, когда соответствующая система однородных линейных уравнений имеет только тривиальное решение. Непосредственное обобщение этого красивого утверждения на случай, когда число уравнений не равно числу неизвестных, как показывают простейшие примеры, неверно. Чтобы получить такое обобщение, нужно это утверждение предварительно соответствующим образом переформулировать. Пусть Л е Ор (У). Произвольному ковектору ? е У' мы сопоставим функционал А% на У> положив F) (A'$)(x)~l(Ax), 1.6У.- Автоматическая проверка показывает, что а) функционал Л'? линеен, т. е. является ковекто* ром из У'\ б) возникающее отображение А'\ у'-+У линейно, т. е. А' представляет собой линейный оператор. Определение 3. Оператор А' называется оператором, сопряженным с оператором Л. Если ввести естественное спаривание <*, ?>»: = '?(*) между пространствами У и У9 (см. лекцию 4), то формула F), определяющая сопряженный оператор Л7, приобретет вид . ¦ ¦ - <*, Л'|)-<Л*, ?>. 137
Из симметричности этой формулы немедленно вытекает, что отображение А н-> А' пространства Ор (У) в пространство Ор (У) и н в о л ю т и в н о, т. е. А" = А. В частности, отсюда следует, что отображение At—>А' биективно. Более того, ясно, что (А + BY = А' + В' и (к А)'¦— kA'. Это означает, что отображение А н-> А' является изоморфизмом линеала Ор(З^) «а линеал Ор(У)* П Таким образом, между линеалами Т и У нет естественного изоморфизма, а между линеалами Ор(У) и Op(F') такой изоморфизм есть! В отношении умножения отображение А *—* А' изоморфизмом не является, поскольку порядок сомножи- телей оно меняет: (АВ)' = В'А\ Действительно, (х, (АВ)' g> = (АВх, g) = (Вх, A'?> = = (*, JTA'g). Обладающий этим свойством линейный изоморфизм алгебр называется обычно антиизоморфизмом. Формула а[ — е!(Ае^ для элементов матрицы оператора А в базисе еь ..., еп означает, что а[ = (Аег е>). Поэтому для элементов a'J матрицы сопряженного оператора А' в сопряженном базисе е1, ..., еп мы имеем a'' = {ei,A'ei) = {Aei,ef), и потому аУ = а[, т. е. Ае* = а{е1. Однако это не означает, что матрицы операторов А и А' совпадают. Действительно, по определению столбцами матрицы оператора являются координаты векторов, получающихся применением оператора к векторам базиса. Для оператора А это означает (в силу формулы Aei=a{e/), что *"-й столбец его матрицы состоит из чисел а\> ..., апг Что же касается оператора А', то формула Ael — a[el означает, что /-й столбец его матрицы состоит из чисел а[9 ..., afn, т. е. из тех же чисел, что и /-я строка 138
матрицы оператора А. Таким образом»--матрицей сопря- женного оператора А' в сопряженном базисе е\ ..., еп является матрица Лт, получающаяся транспонированием матрицы А оператора А в базисе еь ..., епу ^Предложение 3. Имеют место равенства KerA' = (ImA)°, 1т А' = (Кег АH, Ker A = (Im A'H, Im A = (Кег А7H. *. ¦ Доказательство. Включение g s Кег А' равносильно тому, что для любого вектора х?У имеет место равенство (А'?)(*) = 0, т. е. равенство |(А*) = 0, характеризующее ковекторы из AтЛ)°. Следовательно» Кег А' = (Im Л')°. Заменяя здесь А на А', получаем, что Кег А = Aпт А')9, а переходя к аннуляторам (и пользуясь предложением 5 лекции 4) — что (Кег А'H = Im А и (KerA)° = ImA'. D В частности, мы видим, что Im A = У тогда и только тогда, когда КегА' = 0. На языке координат это означает (для случая m = n)f что система неоднородных линейных уравнений a\xt+ ... +я**А=А, G) • • • аш*\+ ••• +amXn^bm тогда и только тогда совместна при любых свободных членах Ьи ..., 6т, когда система однородных уравнений а\хг + ... + axmxm = О, (8) *•*,+ ... +а»*т-0 с транспонированной матрицей имеет только тривиальное решение, ? Но легко видеть, что это утверждение (называемое обычно альтернативой Фредгольма) справедливо и при любых тип. Действительно, система (8) имеет лишь тривиальное решение тогда и только тогда, когда ранг г матрицы ее коэффициентов равен m. G другой стороны, по теореме Кронекера — Капелли система G) тогда и только тогда совместна, когда ранг г матрицы ее коэффициентов не меняется от прибавления столбца 139
Ь свободных членов, что при любом столбце Ь имеет место, очевидно, тогда и только тогда, когда г = т. О Чтобы альтернативу Фредгольма сформулировать в «операторных» терминах и при т Ф п, следует обобщить цонятие сопряженного оператора на случай производного гомоморфизма ср: У -*¦ Ж, где W ф У. Это делается без всякого труда, лишь с незначительным усложнением обозначений и формулировок. Аналог предложения 3 при этом сохраняется, что и дает альтернативу Фредгольма в общем виде. Определение 4. Подпространство 9 пространства У называется инвариантным относительно оператора А: Г ->У, если Ах&&* для любого вектора *s#V В этом случае определен оператор А|^^Ор(П действующий по формуле (А \д»\ х = Ах, хе&>, где справа вектор Ах рассматривается как элемент подпространства 0*. Оператор А [^называется ограничением оператора А на инвариантном подпространстве Л Говорят также, 4то он индуцирован оператором А. Поскольку dim & < dim У, оператор А\<р поддается изучению легче оператора А, Вместе с тем, изучив его, мы часто можем получить достаточно много информации и о самом операторе А. Особенно удовлетворительно дело обстоит в случае (к сожалению, имеющем место не всегда), когда существует второе инвариантное подпространство <?, дополн^- *ельное к подпространству 9>> т. е. когда пространство У является прямой суммой У ™ ЯР ® Q инвариантных подпространств 9* и ц. В этом случае оператор А полностью восстанавливается по операторам А\д> и A\q. Действительно, для любого вектора г*= х + у пространства У, где х е &-, y^Q, мы, очевидно, имеем te = (A\p)x+{A\Q)y. 140
Полная сводимость оператора А к операторам А \<р и A U наглядно видна на матрице А = (а0 оператора А в таком базисе еи ..., еп пространства У> что ^ = — [«if •••> «Л -и 3? = [еР+ь •¦••• **1* Действительно, так как Ае. = а|е;е^ при 1</^р, то а? = 0, если 1<Г<р й р-И</<я* Аналогично, так как Ае, е Q при р+ 1 ^ i^ л, то а{ = 0, если р+1</<« и 1^/<Р* Это означает, что матрица А в базисе е^ . •., еп имеет блочно-диагональный вид: где Aj —матрица оператора А|<^ в базисе еь ..., ер, а А2 —матрица оператора А\@ в базисе ер+и ..., еЛ. О матрице А вида (9) иногда говорят, что она разложена в прямую сумму матриц Ax и л2 (и пишут А .и, ==Ai©A2). Таким образом, каждое разложение пространства Т в прямую сумму инвариантных подпространств определяет разложение матрицы оператора в прямую сумму матриц индуцированных операторов. В случае, когда инвариантное подпространство & инвариантного дополнения Q не имеет (или мы его не знаем), мы можем представить матрицу А (выбрав базис еи ..., еп так, чтобы ^ = [еи -. •, ер]) в блочно- треугольном виде: (Ю) А-(* Св), где А\ — матрица оператора А \д>. Из того, что подпространство 9* инвариантно относительно оператора А, непосредственно вытекает, что формула В{х + 0>) = Ах + & 141
корректно определяет на факторпространстве У/9*. некоторый (очевидно, линейный) оператор В: Г/?^Г/? Об операторе В также говорят, что он индуцирован оператором А. Если базис ей ...» еп пространства У выбран так, что & = [еи ..., ер], то смежные классы ер+\ +&, ¦.. ...» *л;-1~^ будет составлять, очевидно, базис фактор- пространства У/?Р и в этом базисе матрицей оператора В будет матрица В из A0).
Лекция 15 СОБСТВЕННЫЕ ЗНАЧЕНИЯ. — ХАРАКТЕРИСТИЧЕСКИЕ КОРНИ. — ДИАГОНАЛИЗИРУЕМЫЕ ОПЕРАТОРЫ—ОПЕРАТОРЫ С ПРОСТЫМ СПЕКТРОМ — СУ- ШЕСТВОВАНИЕ БАЗИСА, В КОТОРОМ МАТРИЦА ОПЕРАТОРА ТРЕУГОЛЬНА. — НИЛ ЬПОТЕНТНЫЕ ОПЕРАТОРЫ. Простейшими инвариантными подпространствами являются одномерные подпространства. Определение 1. Вектор х Ф О называется собственным, вектором оператора А, если он порождает одномерное инвариантное подпространство. Ясно, что это имеет место тогда и только тогда, когда существует такое число ^еК, что A) Л* = А*. Каждое число % е К, для которого существует вектор * Ф 0, удовлетворяющий соотношению A) (и, значит, являющийся собственным вектором оператора А), называется собственным значением оператора А. О собственном векторе ж, для которого — при данном Я — имеет место A), говорят, что он принадлежит собственному значению Л. •Удобно считать, что каждому собственному значению Я принадлежит также и нулевой вектор 0 (не являющийся, по определению, собственным вектором). Тогда для любого собственного значения X множество 9>\ всех принадлежащих ему векторов хеУ будет, очевидно, подпространством. Оно называется собственным подпространством, принадлежащим собственному значению К. Его размерность рх = dim ^x называется геометрической кратностью собственного значения Л. По определению 1 ^ рх ^ п- 143
Для любого собственного вектора х Ф 0, принадлежащего собственному значению Я, одномерное инвариантное подпространство [#], им порожденное, целиком лежит в &\. Обратно, каждое одномерное подпространство пространства 9Р^ инвариантно, и потому, в частности, пространство &>ь разлагается в прямую сумму одномерных инвариантных подпространств. Чтобы получить такое разложение, достаточно выбрать в iPx произвольный базис. Геометрически подпространство &>х можно охарактеризовать как максимаьное инвариантное подпространство, на котором оператор А (точнее, его ограничение А\<р ) является скалярным оператором %Е. Можно также сказать, что 3*^ представляет собой ядро оператора А —ХЕ: ^ = Кег(А-ЛЯ). Действительно, равенство (А — ХЕ)х — 0 в точности равносильно равенству A). ? Мы видим, таким образом, что число кщК тогда и только тогда является собственным значением оператора А, когда оператор А — КЕ имеет ненулевое ядро, т. е. необратим (вырожден); см. предложение 2 предыдущей лекции. Иными словами, % тогда и только тогда является собственным значением, когда <1е1(Д~Л?) = 0, где А — матрица оператора А в* произвольном базисе еи ..., ея. Определитель det(A-X?)« а] -А, ... а} п является, как легко видеть, многочленом степени п от Я. Этот многочлен не зависит от выбора базиса в\у ..., ert. Действительно, в любом другом базисе матрица оператора А будет иметь вид С*1 АС (см. формулу E) предыдущей лекции), а С1 АС - %Е = С~1 (А - Щ С, 144
и потому det {С1 AC - ХЕ) = (det С) det (Л - ХЕ) {det С) —¦ = det (Л — ХЕ). П Определение 2. Многочлен fA(X) = fet{A-XE) называется характеристическим многочленом оператора Л, а его корни (в соответствующем расширении поля ;К) — характеристическими корнями оператора Л. Согласно сказанному выше любое собственное значение оператора А является его характеристическим корнем и, обратно, любой характеристический корень, принадлежащий полю К, является собственным значением. Q Практический способ нахождения собственных пространств основывается на этом утверждении (и на том, что &х = Кег (Л — ХЕ)). Сначала, решая уравнение fA (X) = 0, мы находим все его корни, лежащие в К, а затем для каждого такого корня Xi находим подпространство 0*ь решая систему однородных линейных уравнений с матрицей А — XiE. Кратность собственного значения Хо как корня характеристического многочлена, т. е. такое число n^f что многочлен fA(X) делится на (Х?—Хо)пх*, но не делится на (X — Я0)ПЯо , называется алгебраической кратностью собственного значения Хо. Легко видеть, что алгебраическая кратность собственного значения не меньше его геометрической кратности: Действительно, пусть р=ри и пусть е{9 ..., еЛ — такой базис пространства У, что ^=[ер ..., *р]. В этом базисе матрица оператора А имеет вид и потому fA (Я) = det (А - ХЕ) = det (Ах - ХЕ). det (В - ХЕ). Но At является матрицей оператора А |^э = Х^Е^ 145
и потому det (Ах — %Е) = (Яо —¦ Я)р. Этим доказано, что многочлен fA (Я) делится на (Я — к0)р9 и, значит, p<«v D Замечание. Оператор А имеет матрицу вида B) в любом базисе, для которого подпространство & = = [ей —• еР] инвариантно. При этом'А\ будет матрицей оператора А \<р а В — матрицей индуцированного оператора В: Т\У ->Т/&. Это доказывает, что для любого инвариантного подпространства &аУ имеет место разложение Пусть Яь ..., Яда — р а з л и ч н ы е собственные значения оператора А, и пусть — принадлежащие им собственные подпространства. Предложение I. Сумма f = ?t+ ... +?m подпространств &и .. .* &m является прямой, г. ё. равенство C) ж,+. .,. + *т = 0, где Х\е&и ..., xm e ^т, шиеег jwecro тогда и только тогда, когда *i = 0, ..., *т = 0. Доказательство. Проведем индукцию по т. При т = 1 утверждение очевидно (и бессодержательно). Пусть уже доказано, что сумма т—\ пространств ^ь ...» &т-\ является прямой. Применив к равенству C) оператор А, мы получим соотношение D) Я,ж,+ ... + Am*m = 0. Умножив C) на Ят и вычтя из D), мы, далее, получим, что (Я1~Ят)ж1+ ... +(^т-1 — Лт)жт-1 = 0. По предположению индукции отсюда следует, что (Кх — Ят) *j = О,' . •., (Ят_! — Яда) *т_1 ==0 146.
и, значит (поскольку по условию fa — кп Ф О, ... ..., Ят-1 — %т ФО), ЧТО Но тогда, согласно C), и ж™ = 0. П Пусть существуют такие (различные) собственные значения E) Я|/ ..., лт, что (в) Л§© .¦¦., ФЛт-г и, значит, G) Р^+'-'+Р^-»- Легко видеть, что числа E) исчерпывают все собственные значения оператора А. Действительно, для любого другого собственного значения fa подпространство &*кй будет, согласно предложению 1, образовывать с Т прямую сумму, что невозможно. ? Выбрав в каждом из пространств 0\?» • • • 9 &кт по базису, мы получим базис пространства У, состоящий из собственных векторов. Матрица оператора А в этом ба- знсе диагональна: (о'-°} и ее диагональными элементами являются собственные значения E), причем каждое fa повторенорк раз. Обратно, пусть в пространстве Т существует базис, в котором матрица А оператора А диагональна. Тогда векторы этого базиса будут собственными векторами, а диагональные элементы матрицы А — собственными значениями оператора А. Пусть Хи ..., кт — все различные диагональные элементы матрицы А, и пусть элемент fa, i== 1, ..., m, повторен qi раз. Пусть, далее, (?/, i = = 1, ..., m, — подпространство пространства У, порожденное векторами базиса, принадлежащими собственному значению fa. JorjxdL dim Qt — qit 147
n-CtfCZ&Xf Поэтому, в частности, (9) qx+ ...+Ят = п и q^p^..., qm<p^ Но, согласно предложению 1, сумма ^1+-«-+^от подпространств &%х% ...» 0*% является их прямой суммой и потому имеет размерность рк + .. • + рЛ . Значит, р. + .*• +рк *^/г, откуда, в силу соотноше- ний (9), вытекает, что т. е. что Следовательно, для подпространств ^э . •., iP* имеет место разложение F). Поскольку существование базиса, в котором матрица оператора А диагональнау равносильно тому, что пространство У3 разлагается в прямую сумму одномерных инвариантных подпространств, этим доказано следующее предложение: Предложение 2. Для любого линейного оператора А: Т-> Т следующие утверждения равносильны: Г Существуют такие собственные значения Яь • »* ..., Ят, что Л1©."ФЛтвУ- 2° Пространство У является прямой суммой одномер* ных подпространств,, инвариантных относительно опера-* тора Л. 3° jB пространстве У* существует базис, состоящий из собственных векторов, т. е. базис, в кагорам матрица оператора А диагонально. О При этом фигурирующие в 1° (и неявно в 2°) собственные значения Х%, ..., Jw исчерпывают все собственные значения оператора А. Каждый базис, в котором матрица оператора А диагональна, получается объединением базисов пространств 9%х% ..., &%ш*так что для любого собственного значения А* в этом базисе имеется точно р% векторов, принадлежащих %i. Определение 3. Оператор А называется джгонализы-* руемым, если для него имеют место утверждения Г* — 3° предложения 2. 148
Вычисляя характеристический многочлен диагонали- зируемого оператора А в базисе, состоящем из собствен* ных векторов, мы немедленно получим, что /л(Л)«(Я-А/1... (i-UPw* где Ки ¦ •. $ hm — собственные значения оператора А, а Pi~P-k » •••¦» Рт — Рх ""их геометрические кратности. Это доказывает, что для диагонализируемого оператора любой его характеристический корень Я0 лежит в поле Kt (и, значит, является собственным значением) и его алгебраическая кратность пк совпадает с его геометрической кратностью р% • ? Оказываеэеся, это необходимое условие диагонализи* руемости также и достаточно, так что имеет место следующая теорема: Теорема L Линейный оператор А тогда и только тогда диагонализируем, когда любой его характеристический корень Я0 лежит в поле К и %в = ^* Д о к а з а те л ь с т в о. Нам нужно доказать только достаточность этого условия. Пусть Ль ..., %т — все характеристические корни оператора А. По условию они лежат в К и потому являются также собственными значениями. Следовательно, определены подпространства &%е • ,.., ^те, размерность суммы которых (как мы знаем, прямой) равна />*,+ ••• +р^т^\+ #" + |\»вЛ {сумма кратностей всех корней многочлена равна его степени). Значит, Л^.нфЛ^У. ? Определение 4. Множество всех характеристических корней оператора А называется его спектром. Спектр называется простым, если каждый характеристический корень Ко является простым корнем характеристического многочлена, т.е. если л^= 1. Говорят, что спектр лежит в К, если все характеристические корни лежат в К. Предложение 3. Любой оператор с простым спектром, лежащим в К, диагонализируем. Д о к а з а те ль с т в о. Так как 1 ^ р*. ^ п^ то при Пь = 1 обязательно рх = 1 (и, значит, ph *** п%). Q 149
Это условие диагонализируемости не необходимо, но зато оно очень удобно для практической проверки. Пусть & — произвольное инвариантное (относительно оператора А) подпространство пространства Т. Так как (см. замечание выше) характеристический многочлен fB (А,) индуцированного оператора В: F/& -> У/& делит характеристический многочлен /д{^) оператора А, то каждый характеристический корень оператора В является характеристическим корнем оператора А не меньшей алгебраической кратности. В частности, если спектр оператора А лежит в К, то и спектр оператора В лежит в К, и, следовательно, для В существует хотя бы одно собственное значение %о. Пусть х0 + Ф — соответствующий собственный вектор оператора В. Равенство В(х0 + &) = к0(х0 + 5*) означает, что Ах0 = Хо*0 + а0, где а0 е Ф, откуда вытекает, что подпространство Q, порожденное подпространством 3* и вектором хо (т. е. состоящее из всех векторов вида kx0 + а, где к е К и а е <р\ заметим, что хоф&>), инвариантно относительно А. Поскольку dim$ = dim^+ 1, этим доказано следующее предложение: Предложение 4. Если спектр линейного оператора A:Y-+T лежит в К, то любое его инвариантное подпространство содержится в инвариантном, подпространстве на единицу большей размерности. ? Следовательно, начиная с подпространства ^о = О, мы можем построить возрастающую цепочку инвариантных подпространств * 0 = ^0c:$*, a ... czFn = T размерностей 0, 1, ...* п. Ясно, что в соответствующем базисе ей «•., вп пространства Т, т. е. в таком базисе, что 3>i = [е\9 ..., ei\ для любого i — 1, ..., л, матрица оператора А будет треугольной матрицей (¦о, Г' .* ). диагональными элементами которой являются собствен* ные значения оператора А, каждое из которых повторе- 150
. но столько раз, какова его алгебраическая кратность. Этим доказано следующее предложение: Предложение 5. Для любого линейного оператора A: V-+T со спектром, лежащим в К, в пространстве У* существует базис, в котором матрица оператора треугольна. При К = С это следствие применимо, конечно, к любому линейному оператору. Более точный результат мы получим сначала для операторов одного специального класса. Определение 5. Оператор А (матрица Л) называется нильпотентным(ой), если существует такое натуральное число т, что Ат = 0 (соответственно Ат = 0). Наименьшее такое т называется степенью нильпотентности оператора (матрицы). Легко видеть, что все собственные значения нильпо- тентного оператора равны нулю. Действительно, если Ах = Хх, то Akx = №х для любого ky и, значит, при Ат = 0 и х Ф 0 обязательно %т = 0, т. е. К — 0. П Поэтому отличный от нуля нильпотентный оператор не может быть диагонализируемым. Примером нильпотентного оператора является оператор, для которого существует такой вектор е = 0, что векторы е, Ае, . • •, Ап~ е составляют базис пространства Т, а Апе = 0. В базисе е{ = Ап~1е, ..., е„м = Ае, <?„ = е этот оператор имеет матрицу 00 Операторы такого вида называются циклическими. Для любого вектора х = х1е\ + ... + хпеп и любого m <; п мы имеем Атх = хт+хе\ 4- •.. + хпеп-т и, в частности, Апх = 0. Таким образом, циклический оператор нильпогентен и его степень нильпотентности равна п. Q 151
При п = 1 циклический оператор является нулевым. Оказывается, что к циклическим операторам сводится произвольный нильнотентный оператор: Предложение 6. Для любого нильпотентнога оператора А: Т-+Т_ существует разложение пространства У в прямую сумму инвариантных подпространств, на каждом из которых оператор А индуцирует циклический оператор. Мы докажем это предложение в следующей лекции.
Лекция 16 РАЗЛОЖЕНИЕ НИЛЫТОТЕНТНОГО ОПЕРАТОРА В ПРЯМУЮ СУММУ ЦИКЛИЧЕСКИХ ОПЕРАТОРОВ.— КОРНЕВЫЕ ПОДПРОСТРАНСТВА. —ЖОР ДАНОВА НОРМАЛЬНАЯ ФОРМА.— ТЕОРЕМА ГАМИЛЬТОНА — КЭЛИ. Пусть A: Y-+Y ~ произвольный нильпотентный оператор, и пусть ^V = ImA', i*= 0*. 1у ...... т9 где т — степень нильпотентности оператора Л. Так как Ашх = А'(Ах), то 0 = ^,mcz^m_1cz ... cz&i+tcz&icz ... cz&xcz&o^y*. (По определению А° = Ef и, значит, ^0 = У даже при А = 0.) По построению Л(^) = ^+ь 0<*<т, откуда, в частности, следует, что ^„^сКегА. Следовательно, для любого базиса A) «j»-»f ..., е<?Л р^ = dim 9>т_х, пространства ^m_i имеют место соотношения B) Ае^-» = 0, ..., Ае^У= О, Кроме того, в пространстве &т-2 существуют такие векторы ЧТО C) Ае<р-У = *<»-», ..., Ае<?-2> = ¦*<«- ». 153
Оказывается, что векторы ri » •• •» *>т_/ D) m * v*' *(m-2) e(m-2) пространства ^m_2 линейно независимы. Действительно, если где p = pm_i, то, применив к этому равенству оператор Л, мы, в силу B) и C), получим равенство 9 возможное (так как A) — базис подпространства &т„\) только при /i = 0, ..., /р = 0. Но тогда k{ef-»+ ... +ViT!) = 0' и потому, по тем же соображениям, kx = 0,. •., kp = 0. П Поэтому мы можем дополнить векторы D) до некоторого базиса е(т-1) Мт-1) рт—\ (&\ е{т-2) е{т-2) е(т-2) Рт-2 = dim &т„2 — dim 9m„u пространства ^т_2- При этом, как легко видеть, дополнительные векторы <6> «>•••••« можно выбрать из ядра Кег А оператора А, т. е.- так чтобы имели место равенства G) Мт~2)+, = 0, ..., А<т) = 0. Действительно, так как векторы A) составляют базис пространства &т-\ = А(9>т_2)> то при произвольной выборе векторов F) и любом /= 1, ..., pm_2 —Pm-i будет иметь место равенство вида Aef~? = #-"+...+xref-i\ где Р = Рт„{. 154
Поэтому, заменив векторы е(™^2) векторами л(т-2) у\л{т-2) уРр<т-2) гр+* ЛП • •¦• xi*p * мы удовлетворим условиям G). ? 0t Поскольку А (^m_3) = ^т-2> в подпространстве ^ш1* существуют такие векторы ЧТО Л ! 1 > > Рт_2 рт^2 Тем же способом, что и для семейства векторов D), показывается, что векторы E) и (8) вместе составляют линейно независимое семейство. Действительно, применив к произвольной линейной комбинации этих векторов оператор Л, мы, в силу B), C), G) и (9), получим линейную комбинацию векторов E). Поэтому соответствующие коэффициенты равны нулю, и, следовательно, от всей комбинации останется лишь комбинация векторов A) и G) из ядра. Поскольку эти векторы линейно независимы, то и оставшиеся коэффициенты равны нулю. ? Это линейно независимое семейство мы можем дополнить до базиса e(m-2) e{m-2) e(m-2) 1 pm-i pm-9 e(m-3) *<m-3) e(m-3) *(m-3) причем рассуждение, примененное для векторов F), аналогичным образом покажет, что дополнительные векторы е(т-Ъ) е(т-3) Рт-2+1 рт-г можно выбрать из ядра оператора А, т. е. так, чтобы имели место равенства Ае<т-з) е о, ..., А№-*> = 0. pm-2+1 рт-з Продолжая шаг за шагом это построение, мы в конце концов получим в пространстве ^о ==f У! базис, векторы 155
которого расположены в ступенчатую таблицу вида р(т-1) в(т-1) 1 pm—i в(т-2) *(т-2) в(т-2) р(ю-З) р(т-З) в(т-3) л(/п-3) 1 pm-i рт-2 рт-г «#•••¦ е@) е@) е@) е@) МО) <|0?рддющую тем свойством, что под действием оператора А векторы каждого столбца подымаются на одну ступень выше, оставаясь в том же столбце (а самые верхние векторы переходят в нуль). Это свойство, по определению, означает, что векторы каждого столбца порождают инвариантное подпространство, причем ограничение оператора А на этом подпространстве является циклическим оператором (вектором е для этого оператора — см. предыдущую лекцию — служит, очевидно, самый нижний вектор столбца). Поскольку все пространство У0 является прямой суммой этих инвариантных подпространств, предложение 6 предыдущей лекции тем самым полностью доказано. П Вернемся теперь к произвольным операторам. •Собственное подпространство &% можно определить как максимальное подпространство пространства Y> на котором оператор А.— %Е равен нулю. По аналогии мы введем следующее определение: Определение 1. Максимальное инвариантное подпространство М\ пространства Y, на котором оператор A—-JJB нильпотентен, называется корневым подпрост- ранёгвом оператора А, принадлежащим собственному значению Я. Разъясним это определение. (Вектор х ф 0 пространства Т называется корневым вектором, принадлежащим собственному значению К если существует такое целое число m ^s 0, что (А — ЛЕ)т* = 0. Ясно, что для любогр k щК вектор kx также будет кор* невым вектором, принадлежащим X (или нулем). Легко видеть также, что аналогичное утверждение верно и для суммы корневых векторов, принадлежащих одному и 166
тому л*е собственному значению, ибоесли(А — %ЩШх Ж|—О и(Л-Л?)т2ж2 = 0, то (A-A?)m(*i + *2) = 0, где т = = max(mi,m2). Это означает, что пополненное нулевым вектором множество всех корневых векторов, принадлежащих данному собственному значению Я, является подпространством пространства Т. Это-то подпространство и является подпространством 31%, описанным в определении 1, поскольку оно, очевидно, инвариантно относительно оператора А — AU, а значит, и относительно оператора А. Ясно, что любое инвариантное относительно операто* ра А подпространство 91 пространства У инвариантно и относительно каждого оператора вида А — |х?, \i e 1Ю« В частности, подпространство 91% инвариантно относи* тельно любого оператора вида A—jiE, \ie К, и, значит, определен оператор (Ю) «A-|iB).|^ Предложение 1\ При \ьф% оператор A0) обратим. Доказательство. Если (Л-цЯ)* = 0, где х е &ъ то Ах = р* и потому {А — %Е) х = (jx — Я) х. Следовательно, либо вектор х равел нулю, либо число |г — Я является собственным значением нильпотентного оператора {А-КЕ)\^ Но, как мы знаем, все собственные значения произвел*** ного шшыютентного оператора равны нулю. Так как, по услощш* рФ К то, следовательно, х = 0. Этим доказав но* что ядро оператора A0) содержит только нулевой1 вектора Поэтому (предложение 2 лекции- 14) оператор A0) обратим. D Теперь мы мажем доказать для корневых пространств аналог предложения 1 предыдущей лекции. Пусть к\, ..., %т — различные собственные значения оператора А, и пусть Ш\ = Я%{9 ..., Мщ = 9t\m *—принадлежащие им .-корневые подпространства Предложение 2. Сумма Я#+ ... + #/* 157
подпространств &{f ...> 9lm является прямой, т. е. равенство где х{ е Sti9 ..., xm e 9tm, имеет место тогда и только тогда, когда А Доказательство (ср. с доказательством предложения 1 предыдущей лекции). При m = 1 предложение очевидно. Пусть оно уже доказано для m — 1 корневых подпространств. Поскольку xm s #m, существует такое число s, что (A-XmF)'* = 0. Поэтому 9\ + ¦••• +»m+i = 0, где *, —(А —ХтЯ)**ь • •> Ут-1 —(Д-^тЕ)**-»-!. Так как пространства Л|,-.. ¦, &т-\ инвариантны относительно оператора А — ХтЕ, то j^ е Ж\У .. . • "••» Ут-1е5?т-1 и» следовательно, по предположению индукции fi —0; ...,-irm_i —0. Поскольку, согласно предложению 1, оператор А — ХтЕ на подпространствах М{, .. ¦, Мт-\ обратим, отсюда следует, что *1 = 0, ..., *т-1=Р и, значит; жт — 0, П Преимущество корневых подпространств по сравнению с собственными подпространствами проявляется в следующем предложении: Предложение 3. Для любого собственного значения X оператора А размерность корневого подпространства Ях равна алгебраической кратности этого собственного значения: dim^ = nx. Доказательство. Пусть А{ = А|^ и В — опера* тор У/Ях-+У/Мк> индуцированный оператором А, Тогда fА = fAfв. Следовательно, если dim&lk<nv то число А является корнем многочлена fB. Значит, поскольку ЯеК, оно будет и собственным значением оператора В# 158
Пусть х0 + Мк — соответствующий собственный, вектор. Тогда А#о = Лхо + <Кь где щ е 5?А, щ — (А — Я?) х0. Следовательно, существует такое /п, что (А — ЯЯ)Ш tfo = 0. Но тогда (А~Л?)т+,*о=-0, и, значит, Хо^01к, что невозможно. Полученное противоречие показывает, что dim^ = %. П Из предложения 3 следует, что если спектр оператора А лежит в К и ки ..,, кт-~ все его собственные значения (характеристические корни), то dim(#ve... e«xj=*Xi+..... +*bm=«. и потому Таким образом, имеет место следующая теорема: Теорема L Для любого линейного оператора A: Y-+Y, спектр которого лежит в К, пространство Т. является прямой суммой корневых подпространств этого оператора: си) т=&к@... e$vп Сказать, что инвариантное подпространство 91 пространства Т является корневым подпространством 52х, — это значит сказать, что ограничение оператора А на это подпространство является суммой %Е + В скалярного оператора КЕ и некоторого нильпотентного оператора В. Но, согласно предложению 5 предыдущей лекции, для оператора В существует разложение пространства Я в прямую сумму инвариантных (относительно В, а потому и относительно А) подпространств, на каждом из которых оператор В индуцирует циклический оператор. Осуществив это разложение для любого корневого подпространства из A1), мы получим разложение пространства У° в прямую сумму инвариантных подпространств, на каждом из которых оператор А индуцирует оператор вида A2) ЯВ + С, где % е К, а С — некоторый циклический оператор. 159
Определение 2. Матрица вида ( Я 1 0 1 0 0 0 0 [0 0 0 . . # 0] 1 0 ... 0 Я 1 ... 0 . ¦ . .я ll ...... л J называется жордановой клеткой. Говорят, что матрица А имеет нормальную жорданову форму, если она является прямой суммой жордановых клеток (вообще говоря, с разными Я). Так как матрица любого циклического оператора имеет в соответствующем базисе вид A1) из предыдущей лекции, то матрицей оператора A2) в этом же базисе будет жорданова клетка A3). Поэтому, объединив все базисы соответствующих подпространств, мы получим базис пространства F, в котором матрица оператора А имеет жорданову форму. Этим доказана следующая теорема: Теорема 2 (о п р и в е д е н и и к жордановой форме). Для любого линейного оператора A: Y-+T, спектр которого лежит в К, существует базис пространства У, в котором его матрица имеет нормальную жорданову форму. ? Оказывается, что с точностью до порядка следования клеток жорданова нормальная форма матрицы оператора однозначно определена, т. е. число жордановых клеток, их размер и соответствующие числа Я —одни и те же для всех базисов, в которых матрица оператора имеет нормальную форму. По отношению к числам Я это очевидно (поскольку они являются собственными значениями оператора). Утверждение же, относящееся к числу и размерам жордановых клеток, мы доказывать не будем. Замечание. Единственность жордановой нормальной формы матрицы непосредственно вытекает из того, что число жордановых клеток порядка k, соответствующих собственному значению Я, выражается формулой г (Л - ЯД)* - 2г (А - Щк + r(A- AjB)**1, где г С — ранг матрицы С. Мы оставляем доказательство этой формул*! читателю в качестве полезного упражнения. 160
Подчеркнем, что при К = С условие на спектр оператора А в теореме 2 выполнено для любых операторов, так что над полем ?)} каждый линейный оператор приводится к жордановой форме. ? Укажем один пример применения полученных результатов. Пусть f(x) = a0xm + aixm-l+ ... +am —- произвольный многочлен над полем К. Тогда для любого оператора А (любой матрицы А) определен оператор f(A) = a0Am + alAnt-{+ ... +amE (матрица f(A) = aoAm + a\Am-x + ... +amE), называемый многочленом от оператора А (матрицы А). Очевидно, что любое подпространство &>czT, инвариантное относительно оператора А, будет* инвариантно и относительно каждого оператора f(A). При этом A4) f(A)\p = f(A\py В частности, для любого оператора А определен оператор fA и), где fA (Я) = det (А — Я?) — характеристический многочлен оператора А. Вычислим этот оператор. Пусть сначала A5) А = ЬоВ + С, где С — циклический оператор. Тогда fA (Я) = (Я0 — Я)* и Cft = 0. Поэтому /л(А) = (Я0?--Л)« = (-С)* = 0. Пусть теперь оператор А (со спектром в К) произволен и пусть — разложение пространства Т в прямую сумму инвариантных подпространств, на каждом из которых ограничение Ai = A\g>. оператора А имеет вид A5). Тогда, по доказанному, Об) М4)-о. 6 М. М. Постников, семестр II 161
Но, как мы знаем, каждый многочлен fA делит многочлен fA (более того, многочлен fA является, как легко видеть, произведением многочленов /., •••>/*„)• Поэтому из A6) следует, что Поэтому (см. формулу A4)) Таким образом, оператор fA(A) обладает тем свойством, что для любого i = 1, ..., N его ограничение на подпространстве &t равно нулю. Следовательно, этот оператор равен нулю и на сумме этих подпространств, т. е. на всем пространстве У* Этим доказана следующая теорема: Теорема 3 (теорема Гамильтона — Кэли). Каждый оператор аннулирует свой характеристический многочлен: t fA(A) = 0. ? Мы доказали эту теорему для операторов, спектр которых лежит в К, и тем самым, в частности, .для любых операторов над полем О. В следующей лекции мы докажем ее (над полем R) для операторов с произвольным спектром.
Лекция 17 КОМПЛЕКСИФИКАЦИЯ ЛИНЕЙНОГО ОПЕРАТОРА.— СОБСТВЕННЫЕ ПОДПРОСТРАНСТВА, ПРИНАДЛЕЖАЩИЕ ХАРАКТЕРИСТИЧЕСКИМ КОРНЯМ. — ОПЕРАТОРЫ, КОМПЛЕКСИФИКАЦИЯ КОТОРЫХ ДИАГОНАЛИ- ЗИРУЕМА. Результаты предыдущей лекции были получены в предположении, что спектр оператора А лежит в основном поле К. Это условие автоматически выполнено, когда [К = !С', но уже при К = R оно существенно ограничивает применимость этих результатов. В настоящей лекции мы выясним, что получается для операторов, не удовлетворяющих этому условию. Для простоты мы рассмотрим только геометрически интересный случай К = = IR, хотя с небольшими и не принципиальными усложнениями все может быть перенесено и на случай совершенно произвольного поля К. Напомним (см. лекцию 1.19), что по любому линейному пространству У над полем R мы можем построить линейное пространство У" над полем С, называемое комплексификацией пространства У. Это пространство обладает тем свойством, что каждый его вектор z единственным образом представляется в виде z = x + iy, где х^У и уеГ Поэтому для каждого линейного оператора А:У->У формула 6* Ас (х + iy) = Ах + iAy 163
корректно определяет некоторый оператор А° : ТС^>У°С* Так как для любого числа а + ib e С и любого вектора z = x + iy <=YC (а + ib) (х + iy) = (ax — by) + / (ay + bx), то Ac((a + /6)(^ + /y)) = A(ajt-6y) + /A(ay + ^) = = (aAx — ЬАу) +'/ (a Ay + 6 Аде) =* = (a+tt) (A*+M*) = (a+/ft) Ac (ж+fc), так что Ac (cz) = сАсг. Еще проще проверяется, что Ас(гг + г2) = А% + А% для любых векторов ги гх е Т°. Следовательно, one- ратор А линеен. П Определение 1. Оператор Ас называется комплекса- фикацией оператора А. Как мы знаем (см. предложение 1 лекции 1.19; напомним, что в обозначениях этого предложения {Т ) =F), любой базис ей • ••> еп пространства Т является также базисом и пространства Т°. Отсюда следует, что в каждом таком («вещественном») базисе матрица оператора А° совпадает с матрицей оператора А. В этом смысле матрица оператора не меняется при его комплексифи- кации. Значит, в частности, операторы А и А имеют один и тот же характеристический многочлен: A) fAM = fAcW- Отсюда, между прочим, сразу же следует, что теоре* ма Гамильтона — Кэли (теорема 3 предыдущей лекции) справедлива для любых операторов А: У->Т. Действительно, по доказанному в предыдущей лекции она справедлива для оператора Ас, а оператор fA(A) является» очевидно, ограничением оператора /л (Ас) = /дс(Ас) на Т = ЯеТс. Поэтому, так как /лС(Ас) = 0, то /Л(А) = = 0. ? Ввиду равенства A) операторы А и А имеют одни н те же характеристические корни. Все они являются собственными значениями оператора Асг но только веще- 164
ственные из них будут собственными значениями оператора А. Если оператор А нильпотентен, то оператор Ас также нщьпотентён (и имеет ту же степень нильпотентности) и йотому все его собственные значения равны нулю. Поскольку эти собственные значения исчерпывают все корни многочлена fAc = fA% этим доказано, что fA (Я) = = (—1)пКп для любого нильпотентного оператора А, На я|||ке матриц это означает (мы заменяем Я на —Я), что для любой нильпотентной матрицы А имеет место тождество det (Л+ *?)=*/*. П Доказать это «чисто матричное» утверждение непосредственным вычислением определителя, по-видимому, очень трудно. В силу теоремы Гамильтона — Кэли отсюда выте- щщу что в n-мерном пространстве степень нильпотентности произвольного нильпотентного оператора не пре« восходит п. О Эти красивые утверждения показывают, каким мощ- щш орудием доказательства теорем является, казалось бы, совершенно тривиальный прием комплексификации. Применим теперь его к исследованию характеристических корней. Очевидно, что для любого подпространства Q про* стра'нства Тс подмножество Re Q всех векторов из Ту имеющих вид Re 2, где z^Q, или —что равносильно (ибо Im* = Re(— iz)) — вид Imz, где ze^, является подпространством пространства У (если *i-=Re2'i, j^=*Re22, то Xi + x2 = Re(zi+z2) и kRez = Rekz для л*обрго ftsR). Аналогично, для любого подпространства & пространства У множество 3^ всех векторов вида x + iy9 гДе *, !f?^, является подпространством пространства У0 (оно является не чем иным, как линейной оболочкой подпространства !? в пространстве У ), При этом ясно, что Re^c = ^ для любого подпространства & сУ% 165
Заметим, что любой базис еь ..., ер подпространства <Р (над R) будем базисом и подпространства 9^ (над С). Пусть теперь А: У'—>У' — произвольный линейный оператор на У и 4е : Ус~+Ус — его комплексификация. Рассмотрим произвольный характеристический корень X оператора Л. Он является собственным значением оператора Ас, и потому в У° определено соответствующее собственное подпространство #я. Пусть сначала корень X веществен. Тогда он будет собственным значением оператора Лив пространстве У°, будет определено соответствующее собственное подпространство 3>ъ Если нам дана некоторая система п линейных одно* родных уравнений от п неизвестных, коэффициенты которых вещественны и составляют матрицу ранга г, то ее решения образуют в Rn подпространство & размерности п — г, так что каждое решение является линейной комбинацией некоторых п — г линейно независимых решений, составляющих базис этого подпространства. Как мы уже говорили, этот базис принято называть фундаментальной системой решений. Ту же самую систему уравнений мы можем рассматривать как систему с комплексными коэффициентами и искать ее решения в Сп = (R")c. Тогда каждая фунда-* ментальная система решений останется фундаментальной системой решений, но, чтобы получить все решения, придется брать линейные комбинации решений этой системы не с вещественными, а с любыми комплексными коэффициентами. Во введенных выше обозначениях это означает, что подпространством решений данной системы уравнений в пространстве „С/1 является подпространство ^с. Эти общие соображения применимы, в частности, к подпространству &%у координаты векторов которого в произвольном базисе еи ..., еп пространства У удовлетворяют системе однородных линейных уравнений с вещественной матрицей коэффициентов А — ХЕ. Как мы знаем, те же векторы еи ..., еп составляют базис пространства У и в этом базисе координаты векторов из Q^ определяются той же системой уравнений. Это доказы- 166
вает, что для каждого вещественного характеристического корня X оператора А имеет место равенство а потому и равенство B) ^=Re#„. Пусть теперь X невещественно. В этом случае мы о п - р е д е л и м подпространство Ф%сиТ формулой B). Таким образом, теперь подпространства Фк будут у нас определены для любых характеристических корней X оператора А, причем при X вещественном это обозначение имеет прежний смысл. Подпространство !?х = Re??x мы будем называть собственным подпространством оператора А, принадлежащим характеристическому корню X. Следует при этом помнить, что его векторы будут собственными векторами оператора А только при X вещественном. Ясно, что каждое из пространств ф^ инвариантно относительно А. При X вещественном Ф% = Qk. Чему равно &к при X невещественном? Чтобы ответить на этот вопрос, заметим, что, поскольку коэффициенты характеристического многочлена fA вещественны, вместе с числом X его корнем будет также и комплексно сопряженнре число X. Координаты векторов соответствующего собственного подпространства Q^ оператора Ас будут решениями системы линейных уравнений с комплексно сопряженной матрицей А—ХЕ и потому будут получаться из координат векторов подпространства Q% переходом к комплексно сопряженным числам. На бескоординатном языке это означает, что если z = x + iy& ??А, то г = х — ly e Qj. В условных, но наглядных обозначениях этот факт можно записать формулой ' Отсюда следует, что Re#j = Re#x, т. е. что 167
С другой стороны, так как X ф X, то (предложение 1 лекции 14) сумма подпространств Q,% и <2^ является их прямой суммой Ся©<2д. Если ev ..., eq — базис подпространства Qfo где ? === dim??ъ то векторы еи . ¦. е^, *ь ,.., eq будут поэтому составлять базис пространства * @к®@%- Но тогда базис этого пространства будут составлять и векторы г* *i + ?i т ei — ег Re *i = g , Ime1= *2. , Ree^ = —g—> lm^ = —^—• 1 Векторы Reei, Imei, ..., Ree^, lmeq no построению вещественны, т. е. лежат в Т. Если 9><иУ> — порожденное этими векторами 2<7-мерное подпространство пространства У, то по определению Но легко видеть, что при соответствии Q *—> Re ?? сумма подпространств переходит в сумму, т. е. Re(Ci + ?2) = Re?i + Re?2 для любых подпространств Q\, Q2<^T°. Поэтому ^=Re^c=Re(^8^) = Re^+Re^=^ + ^=^. Этим доказано, что для любого невещественного характеристического корня X оператора А справедливо равенство Пример подпространств Q\ = Q% и Q2=Q% показывает, что при соответствии ^н-^Re^ прямая сумма не обязательно переходит в прямую сумму. Однако легко видеть, что если ^ = ^f и (?ч = 0%> то C) Re(^1©^2) = Re^10Re^2. Действительно, ясно, что Поэтому, применив Re, получим C). ? 168
Докажем теперь для пространств &х аналог предложения 1 лекции 14. Предложение 1. Пусть Яь ..., Хт —такие характеристические корни оператора А (безразлично, вещественные или нет), что Я/ =5^= Я/ U Хьф%1, I, ./= 1, .. ., ГП, при 1ф\. Тогда сумма & подпространств &Kv ..., @%m является их прямой суммой: D) 0 = ^® ... ©Пт- Пример подпространств 3>% и &% показывает, что условие %i Ф Я/ здесь существенно. Доказательство. Пусть Яь ..., Яг — вещественные из данных корней, а Яг+Ь ¦.., Ят — невещественные. Тогда 2m —r собственных значений Яь . •¦, Яг," Яг+1, Яг+), . ¦., Ят, Ят оператора А будут все различны, и потому сумма Q соответствующих собственных подпространств будет их прямой суммой: а -<гч ф ... Ф?Яг ф(^г+ е^г+1)е.. • © (<?*„©?* j. Применяя Re и учитывая, что Ow, © <&г+1=rtr+l,..., &m © ^=^.. мы немедленно получим равенство D). ? В случае, когда оператор Ас диагонализируем, из предложения 1 следует, что пространство У3 разлагается в прямую сумму инвариантных (относительно А) пространств Ф^ где Я пробегает все вещественные корни многочлена /л и все его попарно несопряженные невещественные корни. Ограничение Ак = А \& оператора А на подпростран- л стве ^а, при Я вещественном нам известно — это скаляр* ный оператор Я??, имеющий в произвольном базисе диагональную (скалярную) матрицу %Е< 169
Рассмотрим теперь оператор Лх = А\<р при А, невещественном. Пусть Я = а + *р, где а, peR и р^О. Выше было показано, что для любого базиса eit ...>eq подпространства Q^ векторы E) Reeb Imeb ¦.., Reeqi Im^ составляют базис пространства ^. Положим для упрощения обозначений e = elf * = Ree, y = lme и рассмотрим двумерное подпространство ^cz^K с базисом Так как еЕ^, то Лсе = Ле, т. е. A°(x + iy)^(a + m(x + iy). По определению это означает, что Ах + /Л# = (ах — ру) + / фх + ау)у т. е, что Ах = аде — Ру, Лу = р* + ау. Таким образом, мы видим, что пространство 9* инвариантно относительно оператора А и ограничение оператора А ни &> имеет в базисе х, у матрицу F) (-; »¦ Поскольку пространство 3>% является прямой суммой q подпространств вида ^, мы получаем, что в базисе E) матрица оператора Лх является блочно-диагональной матрицей О «1 -Pi Pi! <*2 Рг! — Рг а-2\ О Щ fa -P. по диагонали которой расположены q = climax матриц вида F). 170
Сопоставляя все доказанное, мы видим, что справедлива следующая теорема: Теорема 1. Пусть для линейного оператора А: У°-*У над полем R оператор Ас :ТС -> У°° диагонализируем (так будет, в частности, если оператор А имеет простой спектр). Пусть, далее, %\, ..., К— все вещественные, а %г+\ = ai + фь . ¦., km = am-r + i$m-r — все невеще- ственные и попарно комплексно несопряженные характеристические корни оператора А, каждый из которых повторен столько раз, какова его кратность (так что m = = 2л — г). Тогда в пространстве Т существует базис, в котором матрица оператора А является прямой суммой некоторого, числа матриц первого порядка %\ ... %г и матриц, второго порядка («1 РЛ / а*п-г Рт-Л -Pi aj' ••" V-Рш-г am-J' г. е. имеет вид \%х } О v I ai am—r Рт—г I — Рт-г ®т-г' Конечно, аналогичная теорема, но с более сложной матрицей G) имеет место и когда оператор Лс недиаго- нализируем. Эта теорема нам не понадобится, и потому ни доказывать, ни формулировать ее мы не будем. G) <Zi -Р. О
Лекция 18 ЕВКЛИДОВЫ И'УНИТАРНЫЕ ПРОСТРАНСТВА.—ОРТОГОНАЛЬНЫЕ ДОПОЛНЕНИЯ. — ОТОЖДЕСТВЛЕНИЕ ВЕКТОРОВ И КОВЕКТОРОВ. — АННУЛЯТОРЫ И ОРТОГОНАЛЬНЫЕ ДОПОЛНЕНИЯ. — БИЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ. — УСТРАНЕНИЕ ПРОИЗВОЛА В ОТОЖДЕСТВЛЕНИИ ТЕНЗОРОВ РАЗЛИЧНЫХ ТИПОВ. — МЕТРИЧЕСКИЙ ТЕНЗОР.-СПУСК И ПОДЪЕМ ИНДЕКСОВ. Согласно определениям 2 и 3 лекции 1.13 линейное пространство Т над полем R называется евклидовым, если в нем задан некоторый положительно определенный симметрический билинейный функционал. Этот функционал называется скалярным умножением, и его значение на векторах х и у— скалярное произведение этих векторов—обозначается символом ху или (ж, у). Непосредственный перенос этих концепций на случай основного поля jCi невозможен, поскольку в С нет поня« Тия положительности. Приходится поступать хитрее. Определение 1. Функционал х, у*—*»В(х,у)у заданный ца комплексном линейном пространстве Т, называется полуторалитйным, если по первому аргументу он линеен, т. е. В (*i + *2> У) = В (хи У) + В {х2, у) В(сх9 у) = сВ{х, у) для любых векторов хи х2, х, у&У и любого числа с&С» а по второму — полулинеену т. е. В (*, Ух +"Л) = В (х, у{) + В (х9 уг) 172
и B(xr су) = сВ(х, у) для любых векторов х> у и У2> У е У и любого числа се С. Полуторалинейный функционал В называется эрмитовым, если В(у,х) = Б(х,у) для любых векторов х, у^Т. Для эрмитова функционала число В(х, х) вещественно при любом векторе х^Т. Поэтому вопрос о его знаке осмыслен. Эрмитов функционал В называется положительно on-* ределенным, если , В(х, *)>0 для любого отличного от нуля вектора х пространства Т. Линейное пространство Т над полем JCJ называется унитарным (а также — эрмитовым), если в нем задан некоторый положительно определенный эрмитов полутора* линейный функционал. Этот функционал называется ска* лярным умножением, и его значение на векторах х и у — скалярное произведение этих векторов — обозначается символом ху или (х,у). Примером унитарного пространства является про* странство ,СД в котором скалярное произведение задано формулой Теория унитарных пространств на своих начальных этапах полностью аналогична известной нам Теории ев* клидовых пространств (см. лекции 1.13 и 1.14)^ Так, например, в унитарном пространстве определена длищ \х\ — л/(х, х) любого вектора х, справедливо неравен) ство Коши — Буняковского, имеет смысл понятие ортоеф нальных векторов ((х, у) = 0) и ортонормированных сф мейств векторов и, в частности, ортонормированных ба$. зисов, выполняется неравенство Бесселя (предложение & лекции 1.14; только вместо xj надо, естественно, писать |jt*|2), имеет место аналог предложения 3 лекции 1.14 о свойствах ортонормированных базисов (только, скажем» равенство Парсеваля будет теперь иметь вид (х, у)=4\ *=*х\У1+ ,м +Уп)> применим процесс ортогон^лизации •Грама— Шмидта и т. п. Конечно, одинаково формулируемые теоремы имеют для .евклидовых Ц ^Янтарных 173
пространств, как правило, различный геометрический смысл. Например/факт существования ортонормировай* ного базиса означает для евклидовых пространств, что любое л-мерное евклидово пространство изоморфно пространству Rn с умножением (я,у) = Х\у\ + ... + хпуп, а для унитарных пространств — что любое л-мерное уни« тарное пространство изоморфно пространству С с умно-» жением (ж,у) = xrfi + '... + Xnjjn. В дальнейшем, насколько это возможно мы будем доказывать теоремы об евклидовых и унитарных пространствах одновременно. В отличие от I, мы теперь будем предпочитать для обозначения скалярного произведения символ (х,у). Пусть S — произвольное подмножество евклидова или унитарного пространства Т. Определение 2. Ортогональным дополнением 5х подмножества 5 называется множество всех векторов из Т, ортогональных каждому вектору из S: S1 = {ye=T; (х, 9) = 0, *€=&}. Свойства ортогональных дополнений аналогичны свойствам аннуляторов (см. лекцию 4). Например, ясно, что ортогональное дополнение любого множества является подпространством и S1 =э Г-1, если SczT. Имеет место и аналог предложения 3 лекции 4: Предложение 1. Ортогональное дополнение произвольного множества S совпадает с ортогональным дополнением его линейной оболочки: 5X = [S]X. Доказательство. Так как S a [S], то S1 =э [S]1. Обратно, если j/eS1 и х = k{Xi + ... + kmxmt где *,, ..., ^gS, to (х, y) = k{(xu у)+ ... +km(xm, ff) = 0, и, значит, je[S]x. ? Поэтому без ограничения общности мы можем рассматривать только ортогональные дополнения подпространств. Аналог предложения 4 лекции 4 о размерности анну- лятора также имеет место для ортогональных дополнений. Однако для последних справедливо и более сильное 174
утверждение, оказывающееся возможным потому, что для каждого подпространства ^<=У° его ортогональное дополнение является подпространством того же пространства Y. Предложение 2. Для любого подпространства fPczY, пространство Т является прямой суммой подпространства & и его ортогонального дополнения: Т = Ф®ФХ. Доказательство. Пусть еи .¦., ер — ортонорми- рованный базис подпространства @> и пусть х е Т. Обозначив коэффициенты Фурье вектора х относительно ортонормированного семейства векторов е\9 ..., *р через х\, ..., хр, составим вектор х' = Х\е\+ ... -\-хрер. Тогда, согласно предложению 2 лекции 1.14, вектор ж — х' будет ортогонален всем векторам е\, ..., ер и потому (предложение 1) будет принадлежать подпространству Ф1. Таким образом, # = #' + (# — *'), где дс'е^ и х—х' е ^ч Это доказывает, что У=Ф+ФХ. Осталось доказать, что ^П^Х = 0. Но это очевидно, так как если х е 9 П &х и, значит, (*, j) = О для любого уе^, то, в частности, (х, х) = 0, и, следовательно, ж = 0. П Теперь не должен вызывать удивления и тот факт, что аналог предложения 5 лекции 4 также имеет место: Предложение 3. Для любого подпространства Ф аТ, имеет место равенство Доказательство. Если х^Фу то (х, у) == 0 для любого уе^1, и потому (ж, у) — 0\ это и означает, что х е ^х. Следовательно, Ф с= ^1J\ Обратно, пусть х е ^>X"L. Используя предложение 2, положим *==*'+я'7, где *' <= ^, ж" е ^,±, и потому (*', х") = 0. Так как х^Ф±х, то (х, х") = 0, и, значит, (*", х") = (х- х', х") = (ж, х") - (*', ж") = 0. Следовательно, х" = 0, и потому х = ж' cz 0>. Таким образом, g> = g>LS-. и 175'
Подчеркнем, что все это имеет место как для евклидб* вых, так и для унитарных пространств. Этот параллелизм между евклидовыми и унитарными пространствами нарушается для сопряженных про-» странств. Поэтому сопряженное пространство У прихо- дится для евклидова и унитарного пространств Т рассматривать отдельно. Пусть сначала пространство Т евклидово. Предложение 4. Для любого евклидова пространства Т имеет место естественный изоморфизм ТъТ. Доказательство. Согласно предложению 2 лекции 4 достаточно доказать, что пространство Т само себе двойственно: Г\Г, т. е. что существует естественное спаривание Т с Т. Но такое спаривание действительно существует — им является скалярное умножение (в силу положительности — очевидным образом невырожденное). ? В явном виде изоморфизм Y-+Y' определяется как отображение, сопоставляющее каждому вектору уеУ! линейный функционал Ъу:х*->(х, у). Ясно, что соответствие у *~->Ъу является гомоморфизмом. Поскольку пространства Т и У" имеют одну и ту же размерность, для доказательства того, что этот гомоморфизм является изоморфизмом, достаточно установить, что его ядро равно нулю, т. е. что если у Ф О, то %у ф 0. Но это очевидно, поскольку, скажем, \у (у) = (у, у) Ф 0. Мы фактически повторили здесь доказательство предложения 2 лекции 5 для случая спаривания дг, у *-*> (х, у). На первый взгляд кажется, что это доказательство сохраняется и для случая унитарных пространств. Но более внимательное рассмотрение показывает, что для унитарного пространства Т отображение уь-^g не будет гомоморфизмом. Именно, хотя оно и будет, очевидно, переводить сумму в сумму: 6»+л = Е* + Б*' Vv У2^г> 176
но произведение на число оно будет переводить в произведение на комплексно сопряженное число, т. е. для любого вектора yeF и любого числа cejQ будет иметь место равенство Отображения линейных пространств над полем С*, обладающие этими свойствами, называются полулинейными. Легко видеть, что, подобно линейному отображению, полулинейное отображение линейных пространств одной и той же размерности, имеющее нулевое ядро, биективно (является, как говорят, полулинейным изоморфизмом). Поэтому все рассуждения в доказательстве предложения 4 полностью сохраняются, и мы получаем, что пространство Т\ сопряженное унитарному пространству Y, ему полулинейно изоморфно. Это нас, конечно, мало устраивает, поскольку основное значение предложения 4 состоит в том, что оно позволяет каждое евклидово пространство У отождестви т ь с его сопряженным пространством У" (и, в частности, не различать — даже в обозначениях! — вектор у и ковектор 1у), а наличие в унитарном случае лишь полулинейного изоморфизма позволяет осуществить подобного рода отождествление лишь с оговорками. Все можно исправить, понимая под ковекторами из У не линейные, а полулинейные функционалы \\ У->.С т. е. такие отображения, что t(x + y) = t(x) + m 1(сх) = сЦх) для любых векторов *, у е У и любого числа с е [С По- видимому, постепенно дело к этому идет, но пока эта замена отнюдь не общепринята. Другой способ состоит в том, чтобы определить в пространстве У\ векторами которого по-прежнему считаются линейные функционалы |: F н»?>, новую операцию умножения I *—^ cl функционалов | на числа с ^ „С, полагая Ш(х) = 1(сх) = сШ) для любого функционала ?еУ, любого числа c^.Q и любого вектора х^У. Конечно, этим самым мы лишь переносим «паразитное» комплексное сопряжение в другие — хотя, возможно, 177
и менее бросающиеся в глаза — места. Поскольку об.а варианта имеют свои плюсы и минусы и ни один из них еще не получил преимущественного распространения, а каждый из них требует пересмотра всего предыдущего материала (скажем, теории тензоров), мы откажемся от обоих, останемся на прежней точке зрения и не будем стремиться к формальному совершенству. Что же касается отождествления векторов и ковекто- ров, то мы разрешим себе его делать и в унитарном случае, памятуя все время о возможности появления надоедливого комплексного сопряжения. Фактическое совпадение в евклидовых и унитарных пространствах векторов и ковекторов позволяет отождествлять объекты, принципиально различные в произвольных линейных пространствах. Например, легко видеть, что при отождествлении ковекторов с векторами аннулятор 5° произвольного множества ScF совпадет с его ортогональным дополнением S1, Действительно, включение ?eS° означает, что 1(х)=0 для любого xeS. Поэтому, если мы отождествим ковектор g с вектором ^еУ, удовлетворяющим для любого вектора х^Т соотношению ?(*) = (*>У)*т0> в частности, для любого вектора x^S будет иметь место равенство (ж, #) = 0, означающее, что xeS1. ? Это объясняет отмеченный выше параллелизм между аннуляторами и ортогональными дополнениями. Совпадение в евклидовом пространстве векторов и ковекторов вызывает наибольшие упрощения в теории тензоров, позволяя отождествлять тензоры разных типов (р, q) с одной и той же суммой p-\-q, поскольку каждый аргумент тензора мы по желанию можем объявить вектором или ковектором. Рассмотрим, например, тензор типа B,0), т. е. билинейный функционал А: х, у*-~* А(х,у). Считая его второй аргумент у ковектором, мы получим из него билинейный функционал типа A, 1), т. е. линейный оператор А: х*-^> v->Ax. Здесь легко запутаться в отождествлениях. Поэтому будьте внимательны: оператор А вектор х переводит в такой вектор Ах, который — если его рассматривать как функционал на ковекторах — имеет на ковек- торе I значение I(Ах) = А(х,у), где у— вектор, отождествленный с ковектором ?. Но отождествление ? = у 178
бзначает, что ?(z)==Bf у) для любого вектора ге7и, й частности, что i(Ax) — (Ax,y): Таким образом, A) А(х,у) = (Ах,у). Формула A) в явном виде описывает биективное соответствие между линейными операторами А: хь—*Ах и билинейными функционалами А: ж, у н^ А(*, у) на евклидовом пространстве 3^. Безотносительно к общей теории ее можно было бы принять за определение этого соответствия. Тогда, конечно, надо установить, что для любого линейного оператора А определенный формулой A) функционал А билинеен (это сводится к автоматической проверке), что получающееся соответствие «оператор»=^ ^«функционал» является гомоморфизмом соответствующих линеалов (снова автоматическая проверка), что этот гомоморфизм инъективен (положите у = Ах и воспользуйтесь невырожденностью скалярного умножения) и, наконец, что этот гомоморфизм является изоморфизмом (вытекает из инъективности, поскольку оба линейных пространства имеют одну и ту же размерность п2). Последний подход годится и для унитарных пространств, но только вместо билинейных функционалов получатся, очевидно, полуторалинейные функционалы. Во избежание такого рода оговорок мы ограничимся (до конца этой лекции) лишь евклидовыми пространствами; все изменения, которые требуются при переходе к унитарным пространствам, читатель может, без сомнения, сделать теперь самостоятельно. Внимательный читатель, надо думать, уже заметил, Что в описанном отождествлении билинейных функционалов с линейными операторами имеется определенный элемент произвола. Действительно, за ковектор мы принимаем второй аргумент билинейного функционала А (*, у), но с тем же правом (в евклидовом пространстве) мы могли бы считать ковектором его первый аргумент. Тогда получится, вообще говоря, другой линейный оператор А*, для которого будет иметь место формула B) А(х,у) = (х,А*у). Аналогично — и только хуже — дело обстоит и для тензоров других типов. Рассмотрим, например, тензор Т(хи х2, jc3; l\) типа C, 1). Объявив вектор *3 ковектором 179
(и обозначив его, скажем, через |2), мы отождествим этот тензор с тензором Т(х\уХ2\ ?г, Ы типа B,2). Но мы можем считать новый ковекторный аргумент ?2 не пер-* вым, а вторым аргументом, а тогда получится, вообще говоря, другой тензор типа B, 2). Более того, считая ко- вектором не вектор *3, а вектор #2, мы можем получить еще один тензор того же типа B,2), отличный от первых двух. Мы можем, объявив, например, аргумент Х\ ковек- тором, одновременно объявить аргумент |i вектором! Тогда получится тензор прежнего типа C, 1), отличный от исходного, и т. д., и т. п. Чтобы добиться определенности, следует ввести единую нумерацию (или хотя бы единое упорядочение) векторных и ковекторных аргументов и записывать их в этом порядке вперемежку. Так, например, обозначение jT(#i,*2, h> ха) для тензора типа C,1) означает, что при объявлении ковектора g3 вектором получается тензор типа D,0), у которого новый векторный аргумент является третьим, а при объявлении вектора х2 (вектора #4) ковектором получается тензор типа B,2), у которого новый ковекторный аргумент является — среди ковекторных аргументов — первым (вторым). Во избежание недоразумений подчеркнем, что, скажем, символы Т(х\, *2, *з, h) и Т(х\уХ2, ?з,*4) оба обозначают тензор типа C, 1) с тремя векторными и одним ко- векторным аргументами. Эти тензоры отличаются только их происхождением — первый из них получен из некоторого тензора Т(х\,Х2,Хз,Х4) типа D,0) присвоением звания ковектора аргументу х4, а второй — аргументу хг. В произвольных линейных пространствах различение тензоров вида T(xi,x2, |з, *4) и вида Т(хи х2у х$, |4) смысла не имеет. Пусть еи ..., еп — произвольный базис евклидова пространства Т. Тогда, в силу отождествления Т = Т', сопряженный базис е1, .¦., еп также будет базисом пространства У, но, вообще говоря, отличным от базиса еи ..., еп. С базисом еи .¦., еп он связан соотно* шениями (е,, е7) = 6ь /, /—1, ..., п. Если 180
— формулы перехода от базиса е\ ..., еп к базису ей *•¦> еп> то (eit ej) = gik (efc, e/) =giktf = ?*/» и мы видим, что числа gy— это знакомые нам метрические коэффициенты базиса еи . ¦,, еп (см. лекцию 1.14). Они составляют невырожденную матрицу, обратной к которой является матрица с элементами Если мы перейдем к базису то метрические коэффициенты gifjf нового базиса будут выражаться формулами т% е. будут преобразовываться по тензорному закону. Это означает, что числа Цц являются коэффициентами некоторого тензора G «= gae1 ® e1 = gi!et ® eh называемого метрическим тензором евклидова пространства Т. Его значением G(x,у) на векторах х, утУ является как раз скалярное произведение этих векторов: 0(х, у) = ёих1у! = {х, у). Таким образом, термин «метрический тензор» означает в Личности то же самое, что и термин «скалярное умножение»! Пусть теперь х — произвольный вектор пространства Т% По определению его тензорное произведение х 0 G с метрическим тензором G представляет собой тензор типа B,1). Этот тензор мы можем свернуть (см. лекцию 6) по единственному верхнему и одному — скажем, для определенности, второму (хотя в данном случае это не играет никакой роли) — нижнему индексу, В результате получится некоторый тензор типа A,0), т. е. ковектор |. Значение %(у) этого ковектора на произвольном векторе у равно свертке tr(g0y) тензорного произведения ?(g) Jf и, значит, результату полного свертывания тензора *(g> (§Р G ® ущ т. е. (см. примеры сверток в лекции 6), значению G(x, y)-= (х, у) тензора G на векторах хну. Поскольку равенство Ъ(у)ж.{х9у)9 по определению, озна- 181
чает, что ковектор g отождествляется с вектором х, тем самым доказано, что вектор х, рассматриваемый как ковектор, представляет собой свертку тензора х ® G, или, как чаще говорят, является сверткой вектора х с тензором G. ? В базисе еь ..., еп тензор *<g)G имеет координаты gijXk, а его свертка — координаты xi — ёах • Числа хи ..., хп называются коварйантными координатами вектора х в базисе еи ..., е„. По определению они представляют собой координаты соответствующего ко- вектора ? в сопряженном базисе е1, ..., еЛ или — что равносильно — координаты вектора х в базисе е\ ..., еп9 элементы которого отождествлены с векторами пространства Т. «Настоящие» координаты х\ ..., хп вектора х в базисе еи ..., еп называются —для отличия от кова- риантных координат — его контравариантными координатами. Операция перехода от координат х1 к координатам xt называется иногда спуском индекса i, а обратная операция — подъемом этого индекса. В соответствии с единым упорядочением аргументов произвольного тензора (см. выше) верхние и нижние индексы его координат (компонент) также должны быть упорядочены. Поэтому, если индексы имеются и сверху и снизу, то вверху надо оставлять пробелы для мест, занимаемых нижними индексами, и, наоборот, внизу — пробелы для мест, занимаемых верхними индексами. Для наглядности в пробелах иногда пишут точки. Таким образом, например, координаты тензора Т(хи *2> *з, Ы обозначаются символом 7' • • /i пп h iiiih • — L UUU * а координаты тензора ^(jici, дс2, 1ь *з) — символом Ги • /i* т /э В частности, для координат линейного оператора возникают два обозначения: а} и а! — первое, когда оператор получен из билинейного функционала с координатами ац объявлением ковектором второго аргумента (формула A)), а второе — объявлением ковектором первого 182
аргумента (формула B)): Так как ац = A(eif е/), 'сц1 = (Aeit <?'). ah = (eit A*e!)f то имеют место формулы C) ati = giiflkis=sgkiatk> а также формулы D) a/ = gfeW ail = gikaki. Числа ац9 аД alj (а также числа ali = gtkgilaki) можно рассматривать как различного рода координаты одного и того же математического объекта, который — подобно частице в квантовой механике — имеет два лица —«функциональное» и «операторное». Координаты ац называют его координатами, ковариантными по обоим индексам, координаты atl — координатами, ковариантными по первому индексу и контравариантными по второму, и т. д. Как показывают формулы C) и D), все эти координаты получаются друг из друга тензорным умножением на «взаимно обратные» тензоры ga и giJ\ сопровождаемым свертками по соответствующим индексам. Аналогичным образом спуск и подъем индексов осуществляется и для других тензоров. Например, 1 ixi2 —Biikfi L iA * Если базис е\, ..., en ортонормирован, то сопряженный базис е1, ..., еп с ним совпадает и все формулы спуска и подъема индексов превращаются просто в равенства соответствующих (имеющих одни и те же индексы независимо от их положения) координат. Например, E) an^a^Ji для билинейных функционалов и xt = хг для векторов. Именно поэтому мы еще в первом семестре употребляли для координат векторов в ортонормирован- ном базисе обозначения с индексами внизу. Заметим, что, согласно первой из формул E), билинейный функционал А и соответствующий ему по фор- 183
муле (I) линейный оператор А имеют в каждом ортонормированном базисе одну и ту же матрицу. Что же касается оператора А*, определенного формулой B), то его матрицей (в ортонормированном базисе) служит транспонированная матрица оператора А. В дальнейшем мы всегда будем осуществлять отождествление билинейных функционалов и линейных операторов по формуле A), и в связи с этим подробное обозначение а1} элементов матрицы линейного оператора нам будет не нужно. Поэтому эти элементы мы будем обозначать прежним символом а1.
Лекция 19 СОПРЯЖЕННЫЕ ОПЕРАТОРЫ. — САМОСОПРЯЖЕН-* НЫЕ ОПЕРАТОРЫ. —КОСОСИММЕТРИЧЕСКИЕ И КО- СОЭРМИТОВЫ ОПЕРАТОРЫ. —АНАЛОГИЯ МЕЖДУ ЭРМИТОВЫМИ ОПЕРАТОРАМИ И ВЕЩЕСТВЕННЫМИ ЧИСЛАМИ. —СПЕКТРАЛЬНЫЕ СВОЙСТВА САМОСОПРЯЖЕННЫХ ОПЕРАТОРОВ. — ОРТОГОНАЛЬНАЯ ДИАГОНАЛИЗИРУЕМОСТЬ САМОСОПРЯЖЕННЫХ ОПЕРАТОРОВ. Согласно формулам A) и B) предыдущей лекции мы каждому линейному оператору А: У^>У% действующему в евклидовом или унитарном пространстве Т, можем сопоставить билинейный функционал А, а этому последнему функционалу — снова линейный оператор А*. Определение L Оператор А* называется сопряженным с оператором А. Он однозначно характеризуется соотношением 0) (Ах, у) = (х9 А*у), которое должно иметь место для любых векторов х, Это определение имеет смысл и для унитарного пространства У, но если для евклидова пространства У onei ратор А* является не чем иным, как сопряженным оператором А': У*' ->У> рассматриваемым, в силу отождествления У = У\ как оператор на У, то для унитарного пространства У оператор А* даже после отождестви ления векторов с ковекторами будет отличаться от оператора А' комплексным сопряжением. В произвольном базисе еи ..., еп евклидова пространства У элементы ау матрицы оператора А* свя* Щ
заны с элементами а\ матрицы оператора А формулой a** = gikgHalk. Для ортонормированного базиса e\f ..., еп эта формула приобретает вид a*ij = a\. В унитарном пространстве У соответствующая формула (в ортонормированном базисе) имеет вид а*) = а[. Таким образом, оператор А* на евклидовом (унитарном) пространстве У тогда и только тогда сопряжен с оператором А, когда в некотором (а потому и в любом) ортонормированном базисе его матрица является транспонированной (соответственно транспонированной и комплексно сопряженной) матрицей оператора А. ? Для случая евклидова 'пространства это утверждение можно доказать без всяких вычислений, если вспомнить, что операторы А и А' имеют в сопряженных базисах транспонированные матрицы (см. лекцию 13), а базис е\, ..-., еп ортонормирован тогда и только тогда, когда он совпадает с сопряженным базисом е\ ..., еп, рассматриваемым как базис в У. Свойства сопряженного оператора А*, естественно, вполне аналогичны свойствам сопряженного оператора А'. Например, А** = А и (АВ) * == В*А*. Единственное существенное отличие возникает, как всегда, в унитарных пространствах в связи с умножением на числа. Именно, если в евклидовом пространстве (сА)* = сА*у то в унитарном снова появляется «паразитная» комплексная сопряженность: (сА) * = сА*. Следующее определение существенно используе'т тот факт, что операторы А и А* действуют в одном и том же пространстве (и потому для оператора А7 смысла не имеет): Определение 2. Оператор А: У->У на евклидовом или унитарном пространстве называется самосопряженным, если А* = А, т. е. если для любых векторов х, у е У1 имеет место равенство (Ах, у) = (х, Ау). 186
- Самосопряженные операторы в евклидовом пространстве называются также симметрическими (или симметричными), а в унитарном — эрмитовыми операторами. Ясно, что оператор А на евклидовом (унитарном) пространстве тогда и только тогда симметричен (эрмитов), когда соответствующий билинейный (полуторали- нейный) функционал А симметричен (эрмитов). Например, в унитарном пространстве А (у, х) = (Ау, х) = (х, Ау) = (Ах, у) = А (х, у). Q Сумма самосопряженных операторов и произведение самосопряженного оператора на вещественное число являются, очевидно, самосопряженными операторами. Это означает, что самосопряженные операторы образуют линейное пространство над полем R (в случае евклидова пространства Т являющееся подпространством пространства Ор(Г)). Заметим, что произведение двух самосопряженных операторов может и не быть самосопряженным оператором. Более точно: произведение АВ двух самосопряженных операторов А и В тогда и только тогда является самосопряженным оператором, когда операторы А и В коммутируют, г. е. АВ = ВА. Действительно, если АВ = ВА, то (АВ)*= (В 4;* = =A*B* = АВ. Обратно, если (АВ)* = АВ, то ВА = В*А*= = (ЛВ)* = АВ. U Квадратная матрица А = (at), состоящая из комплексных чисел, называется эрмитовой, если после транспонирования она совпадает с комплексно сопряженной матрицей, т. е. если а\ = Щ для любых i, /= 1, ..., п. Ясно, что в евклидовом (унитарном) пространстве оператор А тогда и только тогда симметричен (эрмитов), когда в некотором (а потому и в любом) ортонормиро- ванном базисе его матрица симметрична (эрмитова). ? Определение 3. Оператор А на евклидовом пространстве Т называется кососимметрическим, если А* .= —А, т. е. если (Ах, У) + (х,Ау) = 0 для любых векторов х, у^Т. 187
Аналогично, оператор А на унитарном пространстве У называется косоэрмитовым, если А* = — А. Кососимметррческие операторы составляют вполне самостоятельный класс линейных операторов. Им соответствуют кососимметрические билинейные функционалы, а в координатах они характеризуются тем, что их матрицы в каждом ортонормированном базисе кососим- мётричны. В пространстве Ор(У*) они образуют подпрр- с|ранство, причем (ср. с предложением 1 лекции 11) пространство Ор(У°) всех линейных операторов раз л &- гнется в прямую сумму подпространств симметричных и крсосимметричных операторов, т. е. любой линейный оператор А единственным образом представляется в виде суммы W А =г Асим + AKQC (щмметрического оператора АСйм и кососимметрического оператора Акос. При этом - _А + А* А __А~А* Лсим — 2 ' ¦'¦'Кос — 2 Для эрмитовых операторов ситуация оказывается <$рсем иной, поскольку косоэрмитовы операторы тривиальным образом сводятся к эрмитовым (обстоятельство, ййкаких аналогов в евклидовом пространстве не имеющее). Именно, из соотношения (/А)* = /Д* =— /А* немедленно вытекает, что оператор тогда и только тогда щсоэрмитов, когда он имеет вид iAf где А — эрмитов Оператор, D Вместе с тем аналог разложения B) для операторов щ унитарном пространстве, очевидно, сохраняется. Следовательно, любой оператор А на унитарном пространстве У единственным образом представляется в виде A = B + iC, где В и С — эрмитовы операторы. Это означает (см. определение 1 лекции 1.19), что для любого унитарного пространства У3 линейное пространство Ор (У) несет естественную Структуру вещественно-комплексного линеала, причем соответствующим вещественным подпространством является пространство эрмитовых операторов. П Мы видим, таким образом, что в определенном отношении эрмитовы операторы аналогичны вещественным J88
числам. Эта аналогия прослеживается и в других вопросах. Согласно определению 1 лекции 11 и установленной выше для евклидовых пространств связи между симмет- рическими билинейными функционалами и симметрическими линейными операторами, каждый квадратичный функционал на евклидовом пространстве единственным образом представляется в виде (Ах, х), где А — некоторый симметрический линейный оператор. При этом функционалы такого вида для несимметрических линейных операторов не дают ничего нового, поскольку (Аде,#) = 0 для всех xeF, если (и только если) one-* ратор А кососимметричен. Для унитарных пространств ситуация оказывается в корне, отличной. Впрочем, это и не удивительно, поскольку в унитарном пространстве ни один функционал вида (Ах, х) при А Ф О не является квадратичным функционалом в смысле определения 1 лекции И, и потому нет никаких причин, чтобы свойства таких функциона* лов были похожи на свойства квадратичных функционалов. В евклидовом пространстве функционал (Ах, х) мог быть тождественно равен нулю и без того, чтобы оператор А был нулевым. В унитарном пространстве этого быть не может: Предложение 1. Если линейный оператор А\У->У на унитарном пространстве У обладает тем свойством, что C) (Ах, *) = 0 для любого вектора х е У, то А = 0. Доказательство. Поскольку для любых векто* ров х, у^У имеют место равенства (А (х + у), х + у) = (Ах, х) + (Ах, у) + (Ау, х) + (Ау, у), (A(x + iy), x + iy) = = (Ах, х) + (Ах, iy) + (iAy, x) + (iAy, iy) и (Ах, iy) = — i (Ах, у), (iAy, x) = i (Ax, у), то, ввиду условия C), (Ах, у) + (Ау, х) = 0, (Ах, у)-(Ау9 х) = 0, и, значит, (Ах, у) = 0. Полагая здесь у = Ах, мы №
получаем, что (Ах, Ах) = 0. Следовательно, Ах = 0 %къ любого «ef. П Предложение 2 (критерий эрмитов ост и). Ли- нейный оператор А на унитарном пространстве V тогда и только тогда эрмитов, когда для любого вектора х&Т число (Ах,х) вещественно. Доказательство. Если оператор А эрмитов, то для любого вектора xsf • (Ах, х) = (х, Ах) = (Ах, х), и, значит, число (Ах, х) вещественно. Обратно, если (Ах, х) = (Ах, х), то ((А - А*) х, х) = (Ах, х) - (А*х, х) = = (Аде, х) — (х, Ах) = = (Аде, х) — (Аде, дс) === О, и потому, согласно предложению 1, А — А* = 0. D Следующие предложения справедливы как для евклидовых, так и для унитарных пространств (хотя и требуют, вообще говоря, различных доказательств). Предложение 3 (о вещественности). Все характеристические корни произвольного самосопряженного оператора вещественны. Доказательство. Пусть А — самосопряженный оператор в евклидовом или унитарном пространстве У9, и пусть К — его произвольный характеристический корень. Если пространство Т унитарно (и, следовательно, оператор А эрмитов), то число % будет собственным значением оператора А, т. е. будет существовать такой вектор *о Ф 0, что Ахо = %х0. Для этого вектора (Аж0, *о) = = (Кхо, х0) = %(хо, Хо), и, значит, д _ (Ахр, х0) (*<ъ х0) Для завершения доказательства предложения 3 в этом случае остается заметить, что, согласно предложению 2, правая сторона этой формулы вещественна. Поэтому вещественно и число X. Пусть теперь пространство Т евклидово. Рассуждая от противного, предположим, что К = а + ф, где ($ Ф 0. 1*
Тогда, как было показано в лекции 16, для оператора А в пространстве Т существует двумерное инвариантное подпространство ^ив нем такой базис х, у, что Ах = ах — Ру, Ау = Р* + ау. Поэтому {Ах, у) = (ах - ру, у) = а (х, у) - Р(у, у) и (*, Лу) = (*, р* + ау) = р(*, *)+а(ж, у). Поскольку оператор А самосопряжен (симметричен) и, значит, (Ах, у) = (х, Ау), отсюда следует, что Р К*. *) + <*. У)] = 0. Поскольку последнее равенство невозможно (ибо (#, ж) > > О» (У» 9) > 0 и, по условию, р Ф 0), тем самым доказано, что ieR. D Предложение 4 (об ортогональности). Любые два собственных вектора х и у самосопряженного оператора А, принадлежащие различным собственным значениям X и \х, ортогональны. Доказательство. Имеем (Ах9у)=*(Кх,у) = К(х9у), (х, Ay) = (x, [iy) = \i (*, у) (последнее верно и в унитарном пространстве, так как, согласно предложению 3, число \i вещественно). Поэтому, в силу самосопряженности, К(х, y) = \i(x, у), что при % ф \i возможно только при (х7 у) = 0. ? Предложение 5 (об ортогональном дополнении). Для любого самосопряженного оператора А ортогональное дополнение ZPL произвольного инвариантного подпространства 9> также является инвариантным подпространством. Доказательство. Если хе ^х, то (х, у) — 0 для всех у <s ^, и потому (Аде, у) = (х, Ац) = 0, ибо, по условию, Ay^tP. Следовательно, Ах^Фх. П Предложение 6 (о кратностях). Геометрическая кратность р^ произвольного собственного значения Л0 191
самосопряженного оператора А равна его алгебраической кратности п%\ Доказательство. Пусть ^\0 — собственное подпространство, принадлежащее собственному значению Я0, и пусть еи ..., еп — такой ортонормированный базис Л («> е„]), гдер = рАо, пространства г, что &^ = [е{> довательно, такой, что ^ = [ер+1, . Так как, согласно предложению 5, то матрица оператора А в этом базисе имеет вид , Яо сле- Яо О О в где Б —матрица оператора В = А\^х. Следовательно, fA (ЛН(*0—Я)' k (*)>и потомУ»если Ри < пм т0 /д(Ао)=0* и, значит, Я0 будет собственным значением оператора В. Соответствующий собственный вектор из ^ будет собственным вектором оператора А, принадлежащим собственному значению Я0, что невозможно, так как все эти векторы лежат в ^.Следовательно, р^^п^ и, значит, р =яя^ (поскольку всегда РЛо<^%; см. лекцию 14). ? Замечание. В доказательстве предложения 6 мы пользовались только тем свойством самосопряженного оператора, что ортогональное дополнение каждого его собственного подпространства является инвариантным подпространством (так что в полной мере предло^ жение 5 нам даже не понадобилось). Поэтому предложение 6 справедливо для любого оператора, для которого ортогональное дополнение каждого собственного подпространства инвариантно. ? Согласно теореме 1 лекции 16, из предложения 6 (для евклидовых пространств — вместе с предложением 3) вытекает, что оператор А диагонализируем, т, е.. 192
где Хь ... Дт — всевозможные собственные значения этого оператора. Выбрав в каждом из подпространств &м ортонормированный базис, мы, ввиду предложения 4, получим ортонормированный базис пространства Y, в котором оператор А имеет диагональную матрицу. Определение 4. Оператор А в евклидовом или унитар- ном пространстве У* называется ортогонально диагона* лизируемым, если в пространстве Т существует ортонормированный базис, в котором матрица оператора А диагональна (т. е. который состоит из собственных векторов этого оператора). Мы видим, таким образом, что нами доказана следующая теорема: Теорема L Любой самосопряженный оператор в ев* клидовом или унитарном пространстве ортогонально диагонализируем. ?
Лекция 20 ПРИВЕДЕНИЕ КВАДРАТИЧНЫХ ФОРМ К КАНОНА ЧЕСКОМУ ВИДУ ОРТОГОНАЛЬНЫМ ПРЕОБРАЗОВАНИЕМ ПЕРЕМЕННЫХ.—ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА В ЕВКЛИДОВОМ ТОЧЕЧНОМ ПРОСТРАНСТВЕ. — МИНИМАКСНОЕ СВОЙСТВО СОБСТВЕННЫХ ЗНАЧЕНИЙ САМОСОПРЯЖЕННЫХ ОПЕ-. РАТОРОВ. — ОРТОГОНАЛЬНО ДИАГОНАЛИЗИРУЕ- МЫЕ ОПЕРАТОРЫ. Теорема 1 предыдущей лекции утверждает, что в каждом евклидовом пространстве любой самосопряженный оператор ортогонально диагонализируем. Переформулируем эту теорему на языке симметрических билинейных (или, что равносильно, квадратичных) форм. Пусть п — произвольная квадратичная форма от п переменных х\9 •••> *п с вещественными коэффициентами qiU i,j = — 1, .,., п. Выбрав в n-мерном евклидовом пространстве Т орто-< нормированный базис ей .¦., еп, мы можем рассмотреть в Т квадратичный функционал Q, выражающийся в этом базисе формой Q{x\, ..., хп), а потому и соответствующий симметрический линейный оператор Q: У—>Т (т.е. такой, что Q(x) = (Qx, x) для любого вектора jugF). Согласно теореме 1 предыдущей лекции в пространстве Т существует ортонормированный базис ft, ..., fn, в котором оператор Q имеет диагональную матрицу с диагональными элементами Xi, ,,,, Кп. Это означает, что 194
для любого вектора х^Т имеет место равенство Q(*)=Vf+ ••• +КуЪ где yi=cnxi+ ... +cinxn, B) • j_ #л — ?«1#1 "Г • • • Т" сппхп — координаты вектора х в базисе fu ..., fn. Поскольку оба базиса еь ..., еп и /ь ..., fn ортонормированы, преобразование B) ортогонально, т. е. матрица С его коэффициентов является ортогональной матрицей (см. лекцию 1.14). Этим доказана следующая теорема: Теорема 1. Любая квадратичная форма A) ортогональным преобразованием переменных может быть приведена к виду C) Ку\+ ... +Ку1- При этом коэффициенты %и ***, Кп являются корнями уравнения det(Q-A?) = 0 и потому определены однозначно (с точностью до по- рядка). О Отличие этой теоремы от (существенно более простой) теоремы Лагранжа из лекции 11 состоит формально только в том, что приведение к каноническому виду C) достигается не произвольным, а ортогональным преобразованием переменных B). Именно поэтому канонический вид C) оказывается единственным. Подобно тому, как теорема Лагранжа позволила нам дать классификацию гиперповерхностей второго порядка n-мерного аффинного пространства (см. лекцию 12), теорема 1 приводит к аналогичной классификации гиперповерхностей второго порядка я-мерного точечного евклидова (вещественно-комплексного) пространства. Действительно, слово в слово повторяя доказательство теоремы 5 лекции 13 и лишь ссылаясь вместо теоремы Лагранжа на теорему 1, мы немедленно получим следующую теорему: Теорема 2 (о приведении уравнений гиперповерхностей второго порядка я-мер- ного евклидова пространства к канони- 7* 195
ческому виду). Для любой гиперповерхности второго порядка n-мерного (п^ 1) евклидова вещественно* комплексного пространства существует система прямо* угольных координат х\9 »,., хп, в которой ее уравнение имеет либо вид (I) Vr+ ••• +Vr = 8> где l<r^/t«s = 0 или 1, либо (что возможно только при п > 1) вид (И) %хх\+ ... +Л,д?=2гг+1, где 1 ^.г ^п — 1, причем в обоих случаях Jli Ф О, ,,, . . . , ЯГ ф 0. ? Чтобы однозначно фиксировать коэффициенты Я|, ... ..., Кг (которые, заметим, пропорциональны отличным от нуля корням соответствующего характеристического многочлена, повторенным столько раз, какова их кратность), следует прежде всего их разумным образом упорядочить (т. е. соответствующим образом переставить координаты х1, ..¦, хп). Мы потребуем, чтобы сначала перечислялись положительные коэффициенты, а потом отрицательные. Кроме того, в каждой группе коэффициентов мы расположим их по возрастанию абсолютных величин. Таким образом, если р, О^р^г, — число по-* ложительных коэффициентов, то мы будем считать, что 0<Я!<Я2< ... <ЯР и 0<|ЯР+1|<!ЯР+2К ... <1М. В случае (I) при г = 0 умножением на —1 мы мо* жем, кроме того, добиться, чтобы D) 0<р<Щ. Этого же мы можем достичь и в случае (II), меняя, если нужно, знак координаты хг+\. Поэтому для единообра* зия мы будем допускать в случае (I) значение е = —1, достигая за счет этого выполнения условия D). Наконец, в случае (I) при е = 0 мы будем считать, что l*il+ .-• +|Аг1=1. 196
"" Удовлетворяющие этим условиям уравнения (I) и [(II) мы будем называть евклидово каноническими уравнениями гиперповерхностей второго порядка. При п = 2 и п = 3 мы, очевидно, получаем (с точностью до обозначений) канонические уравнения линий второго порядка на плоскости и поверхностей второго порядка в трехмерном пространстве, перечисленные в лекциях 1.22 и 1.23. вд^бч! Осуществляя приведение уравнения гиперповерхности к каноническому виду методом, использованным при доказательстве теоремы 2 (т. е. методом лекции 13, в котором вместо теоремы Лагранжа используется теорема 1), мы, как легко видеть, будем все время получать одно и то же каноническое уравнение (хотя, возможно, и в разных системах координат). Хотя это, конечно, еще не доказывает, что координат, в которых получается другое каноническое уравнение, не существует, но тем не менее это так: Теорема 3 (о классификации гиперповерх* ноетей второго порядка n-мерного е в к л и -» дова вещественно - комплексного пространства). Две гиперповерхности второго порядка n-мерного евклидова вещественно-комплексного пространства тогда и только тогда евклидово эквивалентны, когда они имеют одинаковые канонические уравнения. Как нужно доказывать эту теорему, мы знаем на примере линий второго порядка на плоскости (см. лекцию 1.22). Метод состоит в том, чтобы независимо от координат геометрически охарактеризовать коэффициенты %и • • •, V. Чтобы пояснить идею общего метода, рассмотрим на плоскости эллипс х2 .у2 « ^"^ ь2 — *' где а^бГв этом случае ^i = -^2-, Я2 = -^г^. Левая часть -^г + "fr представляет собой квадратичную форму от координат х, у точек плоскости. Если мы рассмотрим эту квадратичную форму только при х2-\-у2= 1 (на «единичной окружности»), то, как легко видеть, ее наибольшее значение будет равно Л>2 = ~?г* а наименьшее — АА = -^. 197
В случае эллипсоида ¦? + -? + -?--1. а>Ь>с, коэффициент—у будет, аналогичным образом, равен наи« большему значению квадратичной формы -^г + ^т + ^т на «единичной сфере» дс2 + #2 + г2 = 1, а коэффициент —$ наименьшему. Труднее охарактеризовать «средний» коэффициент-тт. Для этого рассмотрим всевозмож* ные сечения эллипсоида плоскостями, проходящими через его центр. Эти сечения будут эллипсами, и для них будут определены соответствующие коэффициенты Яь ?v2 ^ Яь Эти коэффициенты зависят, конечно, от выбора плоскости, и, как легко видеть, наименьшее возможное значение наибольшего коэффициента Яг как раз и будет 1 равно -ту. Оказывается, что аналогичная геометрическая харак- теризация коэффициентов Яь ..., Яг возможна и в общем случае. Ключом к этому является соответствующее утверждение о собственных значениях операторов, доказательством которого мы и ограничимся. Переход к коэффициентам уравнений гиперповерхностей вполне тривиален, но у нас на него нет времени. Итак, мы снова возвращаемся к евклидову линейному пространству Т и заданному на нем симметрическому оператору А. Впрочем, без каких-либо изменений в формулировках и доказательствах мы можем считать пространство Т унитарным, а оператор А эрмитовым. В обоих случаях (см. предложение 3 предыдущей лекции) все собственные значения (= характеристические корни) оператора А вещественны. Повторив каждое из них столько раз, какова его кратность (и получив их, следовательно, ровно п), мы занумеруем эти соб* ственпые значения в порядке убывания: А\ ^^ Л2 ^^ • • • ^^ Ял. Наша цель будет состоять в том, чтобы найти прямое «геометрическое» описание этих чисел* 198
Пусть 3* — произвольное подпространство пространства Т и S = S (&*) — его подмножество («единичная сфера»), состоящее из всех векторов #е^, для которых (*, х) = 1. Так как для любого вектора *<=S число (Ах, х) вещественно (когда Т евклидово, это имеет место само собой, а когда Т унитарно, обеспечивается предложением 2 предыдущей лекции), то определено число а (&) = sup {(Axt х)\ х е= &, (х, х) = 1} (впрочем, вместо sup можно писать max, ибо сфера Э(Ф) компактна). Предложение 1. Для любого q=l, ..., п имеет место равенство Kq = inf {a (@)\ dim & = п — q + 1}, где inf берется по всем подпространствам !?czT размерности п — <7 + 1. Доказательство. Согласно теореме 1 предыдущей лекции в пространстве Т существует такой ортонор- мированный базис ей ..., еп> что Аея == Xqeq для любого q = 1, ..., п. Пусть ^ = [е1, ..., eq], и пусть ^—.произвольное подпространство размерности п — q+l. Так как dim^ + dim^ = q + (n — q + l) = n+l>n, то, согласно теореме 1 лекции 1, 5%Л^ Ф О, т. е. существует отличный от нуля вектор x^!Pq[\{p. Без ограничения общности мы можем считать, что (х, х) = 1. Так как х е ^, то а (&) > (Ах, х), a так как хе?я и, значит, х = jtiei + ... + xqeq, то (Л*, Дс) = (Я1л:1е1+ ... + hqxqeq, xxe{+ ... 4-*^) = -Л||х!р+ ... +4l*«P>MI*iP+ ••• + I*J2) = Таким образом, а(^)^А^ для любого подпространства ^ размерности n — q+l, и, значит, inf{a(^); dim& = n — q+l}>kr 199
С другой стороны, так как для любого вектора х = xqeq + ... + хпеп подпространства &^ = [eq, ..., еп] размерности я-— q+ 1 имеет место неравенство (Ах, x) = bq\xq\2 + ... +К\*п?< <*>q(\xg\2+ ... + \xn?) = Xq(x,x)^Xqf то и потому inf{ct(^); dim^ = n —flf+l}<V П Доказанное свойство собственных значений самосопряженных операторов называется их м и н и м а гс с * ным свойством. Доказательство теоремы 3 теперь очевидно. Подробное проведение его мы оставим читателю. В евклидовом пространстве каждый ортогонально диагонализируемый оператор, имея в некотором орто- нормированном базисе диагональную, а следовательно, и симметрическую матрицу, симметричен (самосопря- жен). Этим доказана следующая теорема: Теорема 4. Линейный оператор в евклидовом пространстве тогда и только тогда ортогонально диагонали- зируем, когда он симметричен, ? В унитарном же пространстве самосопряженные (эр< митовы) операторы составляют только часть всех ортогонально диагонализируемых операторов, поскольку у эрмитовой матрицы все диагональные элементы должны быть вещественны. Поэтому оператор, имеющий в некотором ортонормированном базисе диагональную матрицу, хотя бы один элемент которой невеществен, ортогонально диагонализируем, но не эрмитов. Определение 1. Оператор А в унитарном (или евклидовом) пространстве называется нормальным, если он перестановочен с сопряженным оператором А*. Напомним (см. предыдущую лекцию), что в унитарном пространстве любой оператор А однозначно представляется в виде A = B + iC, где В и С — эрмитовы операторы, | 200
Предложение 2. Оператор А = В -f iC в унитарном пространстве тогда и только тогда нормален, когда one* раторы В и С перестановочны (ВС = СВ). Доказательство. Так как A* = B* + (iC)*=:B*-iC* = B-iCf то AA*=*(B + iC)(B-iC) = B2 + C2 + i(CB-BC) и А*А = (В - /С) (В + 1С) «а В2 + С2 - / (СВ - ВС). Следовательно, АА* = А*А тогда и только тогда, когда СВ —ВС = 0. ? Заметим, что для нормального оператора А оператор АА* = А*А выражается формулой АА* = В2 + С\ аналогичной формуле для квадрата модуля комплексно* го числа. Если оператор А в некотором ортонормированном базисе имеет диагональную матрицу Л, то сопряженный оператор в том же базисе будет иметь комплексно сопряженную и транспонированную, а потому также диаго* нальную матрицу. Поскольку любые две диагональные матрицы коммутируют, операторы А и А* также комму* тируют. Этим доказано, что в унитарном пространстве любой ортогонально диагонализируемый оператор нор* мален. П Наша ближайшая цель будет состоять в доказатель* стве обратного утверждения. Для этого мы попробуем перенести на случай нормальных операторов предложен ния 3—5 предыдущей лекции. Предложение 3 лекции 19 на нормальные операторы непосредственно, конечно, не обобщается, поскольку соб* ственные значения (= характеристические корни) нормального оператора могут быть любыми комплексными числами. Его аналогом для нормальных операторов яв« ляется следующее предложение, из которого, кстати ска-» зать, предложение 3 лекции 19 для унитарных про-» странств непосредственно вытекает: Предложение 3. Любой собственный вектор нормаль* ного оператора Л, принадлежащий собственному значе* 201
нию X, будет собственным вектором сопряженного "dfie- ратора А*, принадлежащим собственному значению Х- Доказательство. Если оператор А нормален, то для любого вектора х (Ах, Ах) = (А* Ах, *) = (АА**, х) = {А*х, А*х), т. е. \Ах\ = \А*х\. Поскольку вместе с оператором А нормален и каждый оператор вида А — ХЕ, отсюда следует (так как (А — — ХЕ) * = А* — ХЕ), что для любого X | (А — ЯВ)ж|»1 (А* — ЛЯ) х\. Поэтому, если (А — Щх = 0, то {А* — ХЕ) x = 0. ? Предложение 4 лекции 19 сохраняется для нормальных операторов полностью: Предложение 4. Любые два собственных вектора х и у нормального оператора А, принадлежащие различным собственным значениям X и ji, ортогональны. Доказательство. Если Ах — Хх, то (Axt y) = = Л (дс, у). Аналогично, если Ау = \ху и, значит, согласно предложению 3, А*у = fry, то {х, А*у) = (дс, \ху) = ц (дс, у). Следовательно, X (дс, у) = (Ах, у) = (дс, А*у) = \i (дс, у), и потому (дс, у) = 0 (ибо, по условию, X Ф \i). О Напротив, предложение 5 лекции 19 для нормальных операторов, вообще говоря, неверно: существуют нормальные операторы, имеющие инвариантные подпро* странства с неинвариантным ортогональным дополнением (постройте пример!). Однако для собственных под-* пространств оно оказывается верным: Предложение 5. Ортогональное дополнение 9>\ произвольного собственного подпространства SP% нормального оператора А инвариантно относительно А. Доказательство. Если хе&?9 то (дс, у) = 0 для любого вектора у е 5\. Поэтому (Аде, у) = (дс, А*у) = = (дс, Ху) = X (дс, у) = 0, ибо, согласно предложению 3, А*у = Ху. Следовательно, Адсе^. ? Как уже было замечено в предыдущей лекции, только это свойство оператора А необходимо в доказательстве предложения 6. Поэтому это предложение сохраняет силу для любого нормального оператора, что, ввиду 202
предложения 4, обеспечивает ортогональную диагонали-» зируемость оператора. Тем самым нами доказана следующая теорема: Теорема 5. Линейный оператор в унитарном про* странстве тогда и только тогда ортогонально диагонали* зируем, когда он нормален. О Эта теорема позволяет редуцировать свойства нор* мального оператора к свойствам его спектра. Например, теперь очевидно, что нормальный оператор А в унитар* ном пространстве тогда и только тогда а) эрмитов, б) обратим, в) идемпотентен (т. е. А2 = А), когда его собственные значения соответственно а') вещественны, б ) отличны от нуля, в') равны нулю или единице. Заметим, что импликации а) =фа')> б) =^б') и в) =ф =ф>в') имеют место для любых линейных операторов. Однако обратные — самые интересные — импликации имеют место только для нормальных операторов (постройте соответствующие примеры!). Конечно, аналогичные утверждения о равносильности свойств имеют место и для симметрических операторов в евклидовом пространстве,
Лекция 21 ПОЛОЖИТЕЛЬНЫЕ ОПЕРАТОРЫ. - ИЗОМЕТРИЧЕСКИЕ ОПЕРАТОРЫ. —УНИТАРНЫЕ МАТРИЦЫ. —ПОЛЯРНОЕ РАЗЛОЖЕНИЕ ОБРАТИМЫХ ОПЕРАТОРОВ,— ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ ПОЛЯРНОГО РАЗЛОЖЕНИЯ.— ПАРАЛЛЕЛЬНЫЕ ПЕРЕНОСЫ И ЦЕНТРОАФФИННЫЕ ПРЕОБРАЗОВАНИЯ.— ПРИВЕДЕНИЕ УНИТАРНОГО ОПЕРАТОРА К ДИАГОНАЛЬНОМУ ВИДУ.-РАЗЛОЖЕНИЕ ВРАЩЕНИЯ «-МЕРНОГО ЕВКЛИДОВА ПРОСТРАНСТВА В КОМПОЗИЦИЮ ВРАЩЕНИИ В ДВУМЕРНЫХ ПЛОСКОСТЯХ. Предложение L Следующие свойства линейного опера- тора А в евклидовом или унитарном пространстве Т, равносильны: а) Существует такой самосопряженный оператор В, что А = В2. б) Существует такой линейный оператор С, что А = С*С. в) Оператор А самосопряжен и (Ах, х)^0 для лю~ бого вектора х^Т. г) Оператор А самосопряжен, и все его собственные значения неотрицательны. Равносильны также и усиленные варианты этих свойств, получающиеся, когда в г) и б) мы потребуем, чтобы операторы В и С были обратимы, ев) — чтобы (Ах, *) > 0 при хфО, а в г)—чтобы все собственные значения были положительными. Доказательство. Импликация а) =$> б), Достаточно доложить С = В, 204
Импликация б)=>в). Если А = С*С, то (Ах,х) — = (Ся, Сх) = \Сх\2^0. При этом, если оператор С обратим и, значит, СхфО при х Ф О, то (Ах, х)>0 при хФ&. Импликация в)=^г). Если Ах = Хх, то (Ах,*)== = Л(#, ж), и потому, если (Лж, х) неотрицательно (положительно), то X неотрицательно (положительно). Импликация г)=>а). Пусть еи ..., еп — базис, состоящий из собственных векторов оператора Л, и пусть Ки •••> кп — соответствующие собственные значения. Так как, по условию, к\ ^ 0^..., К 5* 0, то существуют (в R) корни Уях, • ••> лАп* ^1ы определим оператор В формулами A) Вех = дАГ *ь • • • > Веп = V^T *«• Ясно, что В2 = Л. ? Определение 1. Оператор Л называется неотрицательным, если он обладает свойствами а) —г). Если оператор Л обладает усиленными свойствами а)—г), то он называется положительным. Каждый самосопряженный оператор В, удовлетворяющий соотношению В2 = Л, называется квадратным корнем из оператора Л. Неотрицательный (положительный) квадратичный корень обозначается символом Vл. Формула A) показывает, что оператора/А суще-' ствует и однозначно определен для любого неотрицательного (положительного) оператора Л. ? Очевидно, что неотрицательный оператор тогда и только тогда положителен, когда он обратим. ? В евклидовом пространстве самосопряженный оператор Л тогда и только тогда положителен, когда квадратичный функционал (Ах, х) положительно определен. Заметим, что в ряде учебников и монографий неотрицательные операторы называются положительными, а положительные — с т р о г о положительным и. Положительные операторы являются аналогами положительных вещественных чисел. Рассмотрим теперь операторы, являющиеся аналогами комплексных чисел, модуль которых равен единице. 205
Предложение 2. Следующие свойства линейного one* ратора А в евклидовом или унитарном пространстве Т, равносильны', а) Для любых двух векторов ж, у е Т имеет место равенство (Ах, Ау) = (ж, у). б) Для любого вектора х^Т имеет место равенство |А*1 = 1*|. в) Для любого ортонормированного базиса е{, ..., еа пространства Т векторы Аеи ..., Аеп также составляют ортонормированный базис этого пространства. г) Для элементов а[ матрицы оператора А в произвольном ортонормированном базисе еи •.., еп пространства Т имеют место соотношения п B) ?я^ = 6„, /, /=1, ..., л, если пространство Т евклидово, и соотношения п C) Ев*й*"=*«. /. /=i,.... «. если пространство Т унитарно. д) Имеет место равенство А*А = Е. е) Оператор А обратим, и ж) Имеет место равенство АА* = Е. з) Для элементов а[ матрицы оператора А в произвольном ортонормированном базисе еи ..., еп пространства Т имеют место соотношения п D) ? аЫ = б.,, i, j = 1. ..., п, 206
если ^пространство У евклидово, и соотношения п E) 2^ = *,/! /, /=1, .... л, если пространство У унитарно. Доказательство» Мы докажем, что имеют место следующие импликации: а)<=>д)<^>е)<=>ж)<=>з) f4 Импликация а) =>б). Достаточно положить у = дг. Импликация а)=>в). Так как (Aeh Aej) = (eit е,), то (Леь Ле;) = 6/;, если (eh e}) = 6/;. Импликация б)=^д). Если |Л*| = |*|, то ({А*А—Е) х, х) = (А*Ах, х) — (ж, ж) = (Лж, Лж) - (ж, ж) = = | Лж|2 —|ж|2 = 0, и, следовательно, Л*Л = 2? (в евклидовом пространстве У — потому, что оператор А*А — Е симметричен, а в унитарном пространстве У — по предложению 1 лекции 18). Импликации в) ФФ г). По определению Аеь = а\е{* Поэтому п (Ае., Ae) = ?a*aJ в евклидовом пространстве и {Aeit Aet) = Za№ в унитарном пространстве. Следовательно, в)=ф*г) я г)=>в). Импликации а) ФФ д). По определению (Л*Лдс, у) = = (Лж, Л#). Поэтому а)=>-д) и д)==^а) (ибо для некоторого оператора С и любых векторов хну тогда я только тогда имеет место равенство (Сх, у) = (ж, #), когда С = Е). И м п л и к а ц и и г) О д) и ж) ФФ з). Оператор Л* имеет в базисе еь ..., ert матрицу (aj). Следовательно, элементами матрицы оператора ААН являются суммы 207
Еа[а{, а элементами матрицы оператора А* А — суммы k 2л*й}- Поэтому г) #Ф д) и ж) #Ф з). Импликации д)=^е) и ж)=^е). См. импликации 1°=^5° и 3°=^5° предложения 2 лекции 14. Импликации еLд) ие)^ж). Имеют место по определению. ? Определение 2. Линейный оператор А на евклидовом или унитарном пространстве Т называется изометриче* ским, если он обладает свойствами а) — з). В евклидовом пространстве Т изометрические операторы назы- ваются также ортогональными, а в унитарном пространстве Т — унитарными. Свойство а) означает, что оператор А сохраняет скалярные произведения (а потому, в частности, — и углы), т. е. является гомоморфизмом (на самом деле, в силу е), — даже изоморфизмом) пространства Т на себя. Заметим, что любой изометрический оператор нормален (А*А=АА*). ? Как мы знаем (предложение 4 лекции 1.14), веще- ствеиные матрицы, обладающие свойствами B) или D), — это в точности ортогональные матрицы. По ана^ логии матрицы с комплексными коэффициентами, обла^ дающие свойствами C) и E), называются унитарными матрицами. Для них имеет место следующий аналог предложения 4 лекции 1.14 (символом Ат мы обозначаем транспонированную матрицу, все элементы которой заменены комплексно сопряженными числами): Предложение 3. Матрица А = (а|) порядка п с комплексными коэффициентами тогда и только тогда унитарна, когда она обладает одним (а потому и каждым) из следующих равносильных свойств: а) Матрица А является матрицей перехода, связывающей два ортонормированных базиса n-мерного унитарного пространства. б) Столбцы матрицы А составляют ортонормирован- ное семейство векторов унитарного пространства Сп. в) Имеет место равенство ЛТЛ = ?. г) Матрица А обратима, и А~Х = АТ. 208
.-. д) Имеет место равенство ААТ=Е. е) Строки матрицы А составляют ортонормирован- нов семейство векторов унитарного пространства Сп. Доказательство. Введем в рассмотрение линейный оператор Л, имеющий в некотором ортонормирован- ном базисе матрицу Л. Тогда свойства а) —е) перейдут в свойства в) —з) оператора А из предложения 2. П Так как det Лт = ciet Л, то из свойств в) и д) следует, что I det Л |=1 для любой унитарной матрицы А. Очевидно, что все унитарные матрицы порядка п образуют группу. Эта группа называется унитарной группой и обозначается символом U(n). Ее подгруппа, состоящая из унимодулярных (det Л = 1) матриц, обозначается символом SU(n). Предложение 4. Любой обратимый оператор А в евклидовом (унитарном) пространстве единственным об- разом разлагается в произведение изометрического one* ратора U и положительного оператора Р: F) A = PU. Доказательство. Согласно предложению 1 оператор Л*Л положителен, и потому существует положительный квадратный корень Р = ^Ш. Пусть U = AP~\ Тогда ?/* = (Р*)~1 А* = Р~1А* (ибо оператор Р самосопряжен), и потому U*U = P~ A*AP~ = _p-ip2p-i = j? Таким образом, A —UP, где оператор V изометричен, а оператор Р положителен. Если UP = VQ, где ?/, V — изометрические операторы, а Р и Q — положительные, то PU* = QV*> и потому р2 = PU*UP = QV TQ = Q2. Следовательно (положительный квадратный корень извлекается однозначно), Р = Q, и, значит, U = V. Этим доказано, что разложение F) единственно, ? 209
Разложение F) обычно называется полярным разложением оператора А. Оно аналогично разложению reiy _ r (cos ф -|- / sin ф) произвольного комплексного числа в произведение его модуля г и числа е^9 равного по модулю единице. Напомним, что (см. лекцию 1.26), что аффинным преобразованием аффинного пространства $$> называет* ся его произвольный автоморфизм, т. е. преобразование, действующее по равенству координат в двух аффинных координатных системах. Если в пространстве s4> выбрана начальная точка О, то произвольное аффинное преобра* зование точку с радиус-вектором х будет переводить в точку с радиус-вектором вида G) у = Ах + Ь, где А — некоторый обратимый линейный оператор, aft—» фиксированный вектор (это лишь иная запись формулы B) лекции 1.27). Аналогично, ортогональным преобразованием точечного евклидова пространства & называется его преобразование, действующее по равенству координат в двух евклидовых (прямоугольных) координатных системах. Оно записывается той же формулой G), но уже с ортогональным оператором Л. По аналогии можно ввести унитарные точечные пространства <S как аффинные пространства, в ассоциированный линеал которых введена структура унитарного линейного пространства. Автоморфизмами таких пространств являются унитарные преобразования, записывающиеся формулой G) с унитарным оператором А. Поскольку любое евклидово (или унитарное) точечное пространство является одновременно аффинным, имеет смысл говорить о его аффинных преобразованиях G). Полярному разложению А — UP оператора А будет отвечать при этом разложение аффинного преобразования G) в композицию аффинного преобразования (8) у = Рх и ортогонального (или унитарного) преобразования y = Ux + b. 210
В прямоугольных координатах, выбранных соответствующим образом, преобразование (8) записывается формулами Ух =к{хи Уп — лпхп, где Х\ > 0, ..., %п > 0, и потому представляет собой композицию п сжатий к п взаимно перпендикулярным гиперплоскостям. Этим доказано, что любое аффинное преобразование n-мерного евклидова (унитарного) точечного пространства является композицией ортогонального (унитарного) преобразования и п сжатий к п взаимно перпендикулярным гиперплоскостям. ? При п = 2 это утверждение составляет содержание предложения 1 лекции L 27. При А = Е преобразование G) имеет вид у = Х + Ь и называется параллельным переносом на вектор Ь. При Ъ = О преобразование G) имеет вид и называется центроаффинньщ преобразованием. Оно оставляет на месте точку О, которая называется его центром. Любое аффинное преобразование является композицией параллельного переноса и некоторого центро- аффинного преобразования. Подчеркнем, что преобразование G) с Ь Ф О вполне может быть центроаффинным преобразованием (с центром, отличным от О). Для этого необходимо и достаточно, чтобы существовал вектор #0 (радиус-вектор центра), удовлетворяющий соотношению *0 = Ахд + Ь, т. е. такой, что (А — Е)хо = Ь. В частности, так обязательно будет, если оператор А — Е обратим, т. е. если *шсло 1 не является собственным значением оператора А. Ортогональное преобразование, являющееся центроаффинным, называется обобщенным вращением. Оно называется просто вращением, если ортогональный оператор А унимодулярен (сохраняет ориентацию). 211
Чтобы получить хотя бы первоначальное представле* яие о вращениях, мы должны более детально изучить ортогональные операторы. Для этого оказывается удоб« ным предварительно рассмотреть унитарные операторы* Предложение 5. Спектр произвольного унитарного оператора А расположен в плоскости комплексного пе« ременного на единичной окружности, г. е. модуль лю« бого характеристического корня X унитарного оператора равен единице: 1*1=1. Доказательство. Над полем [О любой характе* ристический корень X является собственным значением, т. е. существует такой вектор х0 Ф 0, что Ахо = Хх0ч Тогда (*о, #о) = (А*о, Ах0) = (Хх0, Хх0) = XX (х0у х0), и, значит, XX = 1. ? Теорема 1. Для любого унитарного оператора А су« ществует ортонормированный базис, в котором матрица оператора А имеет вид С',:) Доказательство. Унитарный оператор нормален и потому ортогонально диагонализируем. Вместе с пред* ложением 5 это доказывает теорему. ? Пусть теперь А — ортогональный оператор в (вещественном) евклидовом пространстве У. Введем в рассмотрение его комплексификацию Ас (х + ig) = Ах + iAy, являющуюся (см. лекцию 17) линейным оператором на комплексификации ус _ у + iy пространства Т. Для любых векторов 212
мы положим (г, *i) = [(*, хх) + (у9 уд] — /[(*, уд - fa, ^)]. Шаблонная проверка показывает, что функционал z,z\h-*-(z9Zi) полуторалинеен, эрмитов и положительно определен, т. е. может быть принят за скалярное умножение на комплексном линейном пространстве Yz. По отношению к этому умножению пространство Fc является, таким образом, унитарным пространством. Далее, поскольку (ЛЪ, Ac*i) = = [(Ах, Ахх) + (Ад, Ауд] - I [(Ах, Ауд — (Ахи Ад)] = = [(х, Xi) + (у9 уд] — i [(х, у{) — (хи у)] = (г, гх)9 комплексификация А° ортогонального оператора А яв- ляется унитарным оператором. Поэтому, в частности, оператор Ас диагонализируем. Отсюда вытекает (см. теорему 1 лекции 17), что в пространстве Т существует базис, в котором матрица оператора А является прямой суммой матриц первого порядка вида X и матриц второго порядка вида ( а *) V-P а)' При этом вещественные числа X являются характеристическими корнями оператора А°, и потому |Я| — 1, т. е. X = ±1. Что же касается чисел а, р, то они являются вещественной частью и коэффициентом при мнимой части невещественного характеристического корня X = е1* оператора А", и потому а = cos ф и C = sin ф, где —я <С i< Ф ^ я и ф Ф 0. Поскольку матрицы (J!) * (-; _j) также имеют вид /дч ( соэф sin<p\ * ' V — sin ф cos ф / (при ф = 0 и ф = я соответственно), мы получаем, следовательно, что в некотором базисе еи ..., еп пространства Т матрица ортогонального оператора является в случае п = 2т-\- 1 прямой суммой т матриц вида (9) (с —я<ф^я) и одной матрицы первого порядка 213
(±1), а в случае п = 2т — либо прямой суммой щ<ццт* риц вида (9), либо прямой суммой m — 1 таких матриц и матрицы вида A -?)• ° Согласно описанной в лекции 17 конструкции базис е\,ш..9еп пространства У получается из некоторого базиса ef, ..., е% пространства Ус, обладающего следующими двумя свойствами: а) каждый вектор е^ является собственным вектором унитарного оператора Лс; б) если собственное значение Kg = ei4>il, которому принадлежит собственный вектор е?, вещественно (т. е. Ф =0, я), то вектор е^ также веществен, а если 0< < Ф^ < я, то вектор е^+1 комплексно сопряжен с вектором е^у принадлежащим комплексно сопряженному собственному значению kq = e~l4>(?. При этом {eQ9 если ф<7 = 0, я, eq + ieq+u если 0 < q^ < я, eq„x — ieqf если — я < q^ < 0. Кроме того, в дополнение к свойствам а) и б) мы можем предполагать базис ef, .¦., е? ортонормирован- ным (поскольку оператор Ас диагонализируем ортогонально). Поскольку е% при Ф^ = 0, я, ец-\~ец при — я < q>q < 0, 2/ то будут иметь место равенства (еР> ед) = 0> если р Ф q, если фр = 0, я, *р>^ = ) 9 если фр=^=0, я. (ер, ер) « ¦{* Следовательно, если все векторы ер с <рр ф 0, я умно* жить на V2» то получится ортонормированный базис. 214
Поскольку матрица оператора Л при этой операции, как легко видеть, не меняется, тем самым нами доказана следующая теорема: Теорема 2. Для любого ортогонального оператора А в n-мерном евклидовом пространстве У существует орто- нормированный базис, в котором его матрица при п — ,= 2пг + 1 имеет вид (Ю) COS ф1 Sin ф{ • sin ф! cosq>i COS фг Sin фг ' sin фг cos фг о о \, cos фт sm фт | • sin фт COS фт I где е = ± 1, а при п = 2т — либо вид A1) либо A2) \ СОЭф! Этф!? 1 —вШф! СОЭф!5; 0 вид \ cos ф1 sin ф1 \ 1 — ЭШф! СОЭф! j 0 о cos фг sin фг j — Sin фг COS фг ! • \ COS фт | — sin фю n • СОЗфт-! 8Шфт.1| — зтфт-1 соэфт-ii и 1°. sin фт j COS фт \ 01 1 . Г а 213
Заметим, что определитель матрицы A0) равен е, определитель матрицы A1) положителен (равен 1), а определитель матрицы A2) отрицателен (равен — 1). На языке ортогональных преобразований точечных пространств теорема 2 означает, что любое вращение n-мерного евклидова пространства является композицией вращений в m=f~J взаимно перпендикулярных двумерных плоскостях, а любое обобщенное вращение, меняю* щее ориентацию, — композицией некоторого вращения, обладающего осью (т. е. прямой, все точки которой остаются неподвижными), и симметрии в гиперплоскости, перпендикулярной этой оси. При п = 2т + 1 любое вращение обладает осью, тогда как при п = 2пг существуют вращения без осей (ими будут вращенияA1), для которых фр Ф 0, я при любом р = 1, ..., /л). Поскольку вращение без осей (точнее, соответствую-» щий ортогональный оператор в ассоциированном линеа- ле) не имеет собственных значений, равных 1, его композиция с любым параллельным переносом снова является вращением, но с другим центром. Аналогичное утверждение для вращений, обладающих осями, справедливо только тогда, когда вектор параллельного переноса не параллелен ни одной (их может быть много) оси вращения. Отсюда следует, что любое движение евклидова пространства является винтовым движением, т. е. композицией вращения и параллельного переноса на вектор, параллельный некоторой оси вращения.
Лекция 22 ГЛАДКИЕ ФУНКЦИИ. - ГЛАДКИЕ ГИПЕРПОВЕРХНОСТИ. — ГРАДИЕНТ. — ПРОИЗВОДНЫЕ ПО ВЕКТОРУ.—ВЕКТОРНЫЕ ПОЛЯ. — ОСОБЫЕ ТОЧКИ ВЕКТОРНОГО ПОЛЯ. —МОДУЛЬ ВЕКТОРНЫХ ПОЛЕЙ.— ПОТЕНЦИАЛЬНЫЕ И БЕЗВИХРЕВЫЕ ВЕКТОРНЫЕ ПОЛЯ. — ВИХРЬ ВЕКТОРНОГО ПОЛЯ. — РАСХОДИМОСТЬ ВЕКТОРНОГО ПОЛЯ.— ВЕКТОРНЫЙ АНАЛИЗ. — СИМВОЛИЧЕСКИЙ ВЕКТОР ГАМИЛЬТОНА.— ФОРМУЛЫ ДЛЯ ПРОИЗВЕДЕНИЙ. — КОМПОЗИЦИИ ОПЕРАТОРОВ. Пространство Rn векторов-строк является не только числовой моделью n-мерных аффинных или евклидовых пространств, но также и областью определения функций f{xu •••> *п) от п переменных. Здесь геометрия теснейшим образом переплетается с математическим анализом (теорией функций) и становится практически с ним неразличимой. Неудивительно поэтому, что одно из самых первых — и вместе с тем одно из самых важных — строгих определений — или, как говорят, экспликаций—• интуитивного понятия линии на плоскости, поверхности в трехмерном пространстве и, вообще, гиперповерхности в n-мерном пространстве было дано в анализе. Это определение исходит из представления о гиперповерхности (при л = 2 — линии) как «геометрическом месте» точек, координаты которых удовлетворяют некоторому условию вида A) F(xlt ..., *л) = 0. Поскольку мы хотим эксплицировать представление о «гладкой» линии или поверхности, не имеющей изломов, естественно предполагать функцию F дифференци- 217
руемой функцией класса С°°, т. е. имеющей (автоматически непрерывные) частные производные всех порядков. Однако на практике (и в доказательстве теорем) обычно используются производные первого-второго и редко большего порядков. Поэтому, чтобы не нарушить общематематический принцип — не вводить неиспользуемых предположений, — мы будем считать функцию F имеющей непрерывные частные производные лишь до некоторого порядка k^l включительно. Вместе с тем, чтобы избавить себя от надоедливой заботы следить, не использованы ли где-то производные больших порядков, мы не будем порядок k уточнять, т. е. будем попросту требовать, чтобы все функции имели непрерывные частные производные всех тех порядков, которые нам понадобятся. Для краткости такого рода функции мы будем называть гладкими функциями. Условие гладкости имеет локальный характер и в отдельных точках может не выполняться. Чтобы учесть это, мы будем рассматривать уравнения вида A) не во всем R", а в некотором открытом множестве UczRn (например, в открытом шаре). Множество всех функций x*-^>F(x), определенных и гладких во всех точках х = (хи ..., xn)^U, мы будем обозначать символом !F(U). Оно очевидным образом является кольцом и (бесконечномерным) линейным пространством над полем R. Для простейших гладких функций (например, многочленов) множества, определяемые условием A), как правило, вполне отвечают интуитивному представлению о поверхностях, хотя часто не во всем пространстве Rrt, а лишь в некотором его открытом множестве. Поэтому долгое время господствовало мнение, что множества, определяемые условиями вида A) с гладкой функцией F9 более или менее способны претендовать на роль гиперповерхностей (при я = 2 — линий). Тем большим сюрпризом явилась доказанная лет сорок тому назад американским математиком Уитни теорема, утверждающая, что для любого замкнутого множества CczRn су* ществует на Rn такая гладкая (класса С°°) функция /\ что F(x) = 0 тогда и только тогда, когда *еС. (Легко видеть, что для существования функции F замкнутость множества С необходима; неожиданностью является то, что она и достаточна.) Мы докажем эту тео- 213
рему в третьем семестре, а сейчас ограничимся лишь тем, что приведем пример. Пример. Функция F, определенная формулой 10, если |ж|<1; _L_ е»*1*-1, если |*|>1, где \x\ — y\Jx2{+ ... +х2п, принадлежит на всем R* классу С00. Вместе с тем множество всех точек дсеК*, для которых F (х) = 0, является шаром (при п = 2 — кругом) |х|< 1. Теорема Уитни объясняет, почему к условию гладкости функции F приходится добавлять дополнительные условия. Известное из курса анализа условие регулярности состоит в том, чтобы в любой точке гипер-* поверхности A) был отличен от нуля вектор gradF=(-l?-'—' •?) (так называемый градиент функции F), т. е. чтобы была отлична от нуля хотя бы одна частная производная B) — — Таким образом, мы приходим к следующему определению: Определение 1. Множество S/ё всех точек х = (хи .,. ..., хп) открытого множества UczRn, удовлетворяющих уравнению C) F(x) = 0, где F — гладкая на U функция, называется гладкой (или регулярной) гиперповерхностью в (/, если в каждой точке х е Ж хотя бы одна частная производная B) отлична от нуля. 219
Точки пространства R* мы будем обозначать символами вида: х, у, ... и т. д. При этом для любой точки x — (xiy ..., xrt_i, xn)^Rn символом х мы будем обозначать точку (хи ..., ^.JeR". Соответственно этому для любого множества СczRn символом С мы будем обозначать множество всех точек х е Rn~ , где Ж€=С. Вместо х = {хи ..., хп-и хп) мы будем также писать # = (#, хп). Напомним, что графиком гладкой функции хп = ср(х), заданной на открытом множестве Vcz Rn~ , называется множество всех точек вида (х9 ф (х)) <= Rn. Ясно, что любой график является гладкой гиперповерхностью, для которой U —VXR^Rn и F (х) = ф (*) — хп, ибо ар -_— (*) = — 1 для любой точки х е U. ? Обратное, конечно, неверно. Например, окружность х2-\-у2= 1 на плоскости не является графиком никакой функции. Вместе с тем в окрест^ ности каждой своей точки она графиком все же будет (в окрестности, скажем, точки @,1) — графиком функции y = -\/l—x2f в окрестности точки @, —1) — графиком функцииу=— л/l—x2, а в окрестности точки A, 0) — графиком функции х = л/1 —у2; в последнем случае роль координаты хп играет не координата у, а координата х). Оказывается, что аналогичное График гладкой функции, утверждение справедливо для каждой гиперповерхности <3#, т. е. с точностью до перестановки координат любая гиперповерхность C) в окрестности каждой своей точки являет* ся графиком некоторой гладкой функции. Это утверждение составляет геометрическое содержание следующей известной из курса анализа теоремы: Теорема о неявной функции. Пусть Uс czRn — открытое множество, х0 = (xf\ ..., xf) eU- некоторая его точка и F: U.-+.R — такая гладкая функ- 220
ция на U (т. е. из ?"{?/)}, что F(xo) = Q и -§-(х0)фО. Тогда в пространстве Rn существует такая окрестность Uо a U точки х0и такая функция xn = q>(x), определенная и гладкая в окрестности UqCzR*1 точки лг0=(аг10>, ..., *?Li), что б) (Я <р(*)) ^^о для любой точки х s &0; в) если х = (ху хп) е С/0, то F(x) Ф 0 тогда и только тогда, когда хп = <р(х). П р(?, Поскольку графики гладких функций одной и двух переменных, по-видимому, вполне соответствуют наглядно-интуитивному представлению о гладких линиях и по* верхностях, теорема о неявной функции показывает, что экспликация понятия гиперповерхности, даваемая опре* делением 1, во всяком случае не расходится с интуицией. Вместе с тем класс гладких гиперповерхностей достаточно широк, чтобы его выделение было оправдано. Конечно, ограничение пространством Rn здесь несущественно: посредством координатного изоморфизма «$?*-»¦ R" понятие гладкой гиперповерхности переносится в произвольное м-мерное аффинное (или евклидово) пространство s&n. При этом ясно, что требование кор-< ректности (независимости от выбора координатного изо-* морфизма) здесь соблюдено. 221
Иначе дело обстоит с понятием градиента. Что&ы его определение (перенесенное в пространство зФп) было корректно, необходимо (и достаточно), чтобы при любой замене координат *i =сцух+ ... +cniynf D) Хп = С\пУ\+ •'• +СппУп частные производные B) преобразовывались по векторному закону (как компоненты вектора). Однако легко видеть, что это не так. Действительно, при преобразовании D) функция F(x\9 ,,., хп) переходит в функцию G(yu -., #*) = = F (спУх + ... + спХуп, ..., с[пух + ... + сппуп) и, по правилу дифференцирования сложной функции, dG _y OF ду, ~ Lj Cil дх§ ' Эта формула означает (см. лекцию 4), что при замене координат D) частные производные B) преобразуются как координаты ковектора. Таким образом, с этой точки зрения мы должны считать градиент grad F ковектором. В курсе же анализа пространство R" молчаливо предполагается евклидовым, со стандартным скалярным умножением (х, у) = Х\У\ + ... + хпуп, а потому ковек- торы отождествляются с векторами. Все же забывать, что «на самом деле» градиент представляет собой ко- вектор, нельзя, так как это может привести (и фактически приводит) к ошибкам. Частные производные являются специальным случаем так называемых производных по вектору, которые для любого вектора fceRn определяются формулой dl т. е. формулой — (*) = Hm- dk w~ dt l^oe Если k — {kb ..., ftrt), то, по правилу дифференцирова- 222
ния сложной функции, if. _ ь j_ dk ~ Rl дхх "Т" * • • "*" Ля а*л ' т. е. E) ^ = (k9gradF). Впрочем, обычно рассматривают лишь случай, когда |fe.| = .1, т.е. когда вектор k является ортом (единичным вектором). В этом случае производную -^г- называют также производной функции F по направлению вектора k. В этой терминологии частные производные представляют собой не что иное, как производные по направлению координатных осей. Согласно формуле E) число -*=- достигает наибольшего значения (при | /fe J ===== 1), когда вектор k является ортом вектора gradF. Поэтому говорят, что вектор grad/7 имеет направление наибыстрейшего возрастания функции F. Заметим, что формула E) — хотя в ней и участвует скалярное умножение — на самом деле не предполагает евклидовости. Действительно, ее правая часть является, очевидно, не чем иным, как значением градиента grad F9 рассматриваемого как ковектор, на векторе ft. Что же касается производной -г-г-, то ее определение вообще не предполагает евклидовости. Конечно, вектор gradF, вообще говоря, меняется от точки к точке, т. е. является векторзначнои функцией на U. Такого рода функции называются «векторными полями». Дадим общее определение. Определение 2, Каждое семейство X, состоящее из п функций **->.*,(*), /= 1, ..., п, где х = (х\, • ••» xn)^U, называется векторным полем на U. Векторное поле называется гладким, если все функции Xi гладкие. Формально векторное поле на U есть не что иное, как гладкое отображение U->Rn. Мы сформулировали определение векторного поля «в аналитическом духе», т, е, в пространстве Rn с фикси- 223
рованными координатами х\, ..., хп. В аналогичном определении для произвольного аффинного (или евклидова) пространства s& следовало бы потребовать, чтобы в каждой точке значения функций Xi преобразовывались при замене координат по векторному закону. Мы, однако, не будем рассматривать такого рода векторные поля в s&, поскольку они обладают (пока от нас скрытым) концептуальным дефектом и их «правильное» определение (которым мы займемся в третьем семестре) на самом деле несколько иное. Мы все же позволим себе для наглядности писать F) ЛГ-*Л+ ... +Хпеа9 понимая под ей ..., ея стандартный базис A,0, ,*, .,,, 0), ..., @, ..., 0, 1) пространства R". В частности, в этих обозначениях gra.&F = 1r~7el + dxi "l ^ '' • п дхя *n* Определение З. Точка xQ^U называется особой точкой (гладкого) векторного поля X, если Xi(xq) = Q для любого i = 1, ..., я, т. е. если Х(х0) = 0. Подчеркнем, что в особой точке поле остается гладким. Таким образом, мы можем сказать, что множество точек хе[/, для которых F(x)—0, где F — некоторая гладкая функция является гладкой гиперповерхностью, если оно не содержит ни одной особой точки поля grad/7. ? Впрочем, это множество называют гиперповерхностью и тогда, когда оно содержит особые точки, если только этих точек «не слишком много» (в противном случае, в силу теоремы Уитни, мы можем получить произвольное замкнутое множество). Обычно предполагается, что эти особые точки (они, кстати сказать, называются особыми точками гиперповерхности /7 = 0) изолированы или, в худшем случае, заполняют одну или несколько «поверхностей меньшей размерности». Пример. Градиент квадратичной формы F(*) = Vi+ ••• + hxl> \^09 ..., Хаф0, выражается формулой gradF = B^1Arlj ..., 2Хпхп) 224
и имеет особую точку только в нуле (О, «м> 0). Поэтому невырожденная гиперповерхность второго порядка \х\+ ... +VJ-1 (эллипсоид или гиперболоид) особых точек не имеет у т.. е. является гладкой гиперповерхностью в смысле определения 1. Напротив, конус второго порядка VJ+...+Vi-о имеет единственную «особую точку — вершину @, ..., 0), Цилиндр над конусом VJ+ ... +Vr = 0' ЬхФ09 ..., Кгф0, имеет п — /--мерную плоскость х\ = 0, ..., хг = 0 особых точек. Векторные поля можно складывать: (X + Y)i(x) = Xi(x) + Yi(x)> /—1 п, и умножать на функции: (fX)i(x) = f(x)Xi(x)J /=1, ..., п. Автоматическая проверка показывает, что относительно этих операций множество SB(U) всех гладких векторных полей на U является модулем над кольцом $T(U). П Здесь уместно ввести одно общеалгебраическое опре« деление. Пусть Л — произвольное кольцо и 9Й — некоторый модуль над кольцом Л. Семейство mi, ..., mn элементов модуля 28 называется его базисом, если для любого элемента теЗИ существуют такие однозначно определенные элементы %\, ..., 1яеА, что m = %\mx + ... + Kttnn- В отличие от линейных пространств (модулей над полем), не любой модуль над кольцом Л обладает базисом. Модули, для которых базис существует, называются свободными. Если все базисы свободного модуля 2И состоят из одного и того же числа п элементов, то гово* рят, что модуль 271 обладает рангом и что этот ранг равен п. Вообще говоря, существуют кольца, над которыми имеются свободные модули, не обладающие рангом, 8 М. М. Постников, семестр II 225-
но такого рода кольца обязательно некоммутативны (попробуйте это доказать!). Поэтому,в частности, над коль* цом F(U) любой свободный модуль обладает рангом. ? В формуле F) каждый вектор et можно интерпретировать как векторное поле, все компоненты которого равны тождественно нулю, кроме i-й, которая тождественно равна единице. Тогда эта формула будет озна-* чать, что поля еи -..., еп составляют базис модуля 8t?(U)< Этим доказано, что для любого открытого множества UczRn модуль S6(V) векторных полей на U является свободным модулем ранга п над кольцом ST(U). ? Вместе с тем модуль 86A1) является, очевидно, по-* добно кольцу ST(U), линейным пространством над по-» лем R (бесконечной размерности). Отображение Fn-^grad/7 кольца F(U) в модуль SP(U) переводит, как легко видеть, сумму в сумму и произведение на число в произведение на число, т. е. является линейным отображением (гомоморфизмом) линейного пространства &~(U) в линейное пространство 8?(U). По отношению к умножению функций оно действует, как непосредственно вытекает из формулы дифференцирования произведения, по формуле G) grad: (FG) = F grad G + G grad F. Очевидно, что ядро линейного отображения f grad: F*->gradF состоит из локально постоянных функций, т. е. функций, постоянных на каждой связной компоненте множества U. Образ отображения grad, вообще говоря, не совпадает с as(U). Определение 4. Векторное поле вида grad JF называет* ся градиентными или потенциальным. Если Х.= gradF, то функция F называется потенциалом поля X. Потенциал (когда он существует) определен однозначно с точностью до локально постоянной Функции. Векторное поле F) называется безвихревым, если для любых /, / = 1, ..., п всюду в U. Легко видеть, что каждое потенциальное поле является безвихревым. Дей- 226
dF dXi dJF dX, ствительно, если Xt^ — t то — ~„- и -gJ— = ^ ^ , но по известному свойству смешанных част- d2F d2F _ ных производных __=—_. п В анализе вместо векторного поля F) часто предпочитают рассматривать дифференциальное выражение X\dx\ + ... + Xndxn, и тогда условия (8) будут необходимы для того, чтобы это выражение было полным дифференциалом dF некоторой функции F. Мы вернемся к этому в третьем семестре. Вообще говоря, необходимые условия (8) недостаточны, т.е. не любое безвихревое поле будет потенциальным. Это так только для простейших областей U типа внутренности шара или куба. Для произвольных же областей UczRn размерность факторпространства (линеал безвихревых полей)/(линеал потенциальных полей) может служить мерой их сложности. Это замечание мы также подробно разовьем в третьем семестре. При п = 3 безвихревые поля можно описать более удобным образом. Начиная с этого места (и до конца лекции), мы будем предполагать, что п = 3. По традиции векторные поля в R3 будем обозначать символами a, vt ... и т. п. Компоненты поля а мы обозначим (также по традиции) символами Р, Q,/?, координаты Х\, *2,#з в R3 — символами х> у, г, координатные орты ей е2, ?з — символами i, /, k, а вектор xl-\-yj-{-zk — символом г. Символом U мы по-прежнему будем обозначать открытое множество U с R3, в котором определены (и глад* ки) все наши поля и функции. Заметим, что в этих обозначениях (9) grad/^?, + |L/ + ?ft. Определение 5. Вихрем rota векторного поля u = Pi + Qj + Rk называется векторное поле rota = от =(§-«)<+(?-?)'+(?-!?)*• 8* 227
Раньше вместо rota часто писали curia, но ныне это обозначение вышло из употребления. Ясно, что отображение rot: 8em-+8B{U) является гомоморфизмом (линейным оператором). Его ядро состоит в точности из безвихревых полей, а утвер* ждение, что любое потенциальное поле является безвих* ревым, означает, что (II) rotgradF = Q для любой функции F^!F(U)* Пример 1. Поле вида * = f(r)r, где г = |г|', a f— произвольная гладкая (при г>0) функция, называется центральным полем. Оно опреде* лено и гладко всюду, кроме точки @,0, 0)« Для этого поля P = f(r)x, Q = f(r)y, R = f(r)z. С другой стороны, дифференцируя формулу г = = V*2 + У2 + я* >. мы немедленно получим, что дг х dr* у dr z дх г ' Следовательно, dy $Г=//(г)т- + /(г), dQ _ f, м ху Тх ' V'T* A2) dR f/ / \ xz Ъх~—1 V)—' Поэтому, в частности, dR _ dQ dy dz ' 228 dP dz'' ~ r ' dz ~ г ' dP _ f, (A xy %-rto*-. |f = f(r)-f + /(r), d% _ f (r\ У* ¦g—r(r)-f+ /(r). __ dR dQ _ dP dx * dx dy 9
т. е. rota = в. Таким образом, каждое центральное поле является безвихревым полем. Более того, оказывается, что каждое центральное поле потенциально. Действие тельно, положив г F{r)=\rf{r)dr, 1 мы немедленно получим, что a = gradF. ? Если, в частности, / (г) — -j и, значит, I »I = ^у (гравитационное поле материальной точки), то (с точностью до константы) F (г)= (ньютоновский потенциал). Пример 2. Пусть (поле скоростей плоского вращения). Тогда rota = 2*. Поле скоростей плоского вращения В отношении умножения на функции для оператора rot имеет место формула A3) rot (Fu) = F rot a + grad F X и, которая проверяется непосредственно выкладкой. Здесь под векторным произведением двух полей по-» нимается, естественно, поле, получающееся, когда мы в 229
каждой точке векторно перемножим значения этих по* лей. Поле, являющееся вихрем, т.е. имеющее вид rot», называется соленоидальным (в переводе: трубчатым). Если v = rot и, то поле и называется векторным потенциалом поля v. Оно определено однозначно с точностью до слагаемого, являющегося безвихревым полем, т. е. имеющего — в простейших областях U — вид grad/7. Определение б. Расходимостью div и векторного поля u = Pi + Q) + Rk называется функция /1А 1. 6P.dQ.dR A4) dlve = _ + _*+_. Поле и называется полем без источников, если функция div и тождественно равна нулю. Пример 3. Для центрального поля и — f(r)r имеем (см. формулы A2)) A5) div« = 3/(r) + r/'(r). При /(г) = —это выражение равно нулю. Таким образом, поле сил ньютоновского потенциала не имеет источников. Автоматическая выкладка показывает, что div rot и = О для любого поля u^$&(U). Таким образом, каждое со~ леноидальное поле является полем без источников. П Обратное снова верно только для достаточно «простых» областей, и опять размерность факторпространства (линеал полей без источииков)/(линеал соленоидальных полей) может служить мерой сложности области U. Отображение div: №(U)-*T(U), очевидно, линейно, и, как показывает непосредственная проверка, A6) div (Fu) = F div и + и grad F для любой функции ^еУ((/)и любого поля u^SP(U). 230
Таким образом, у нас определены три линейных отображения: т (с/) & sev^m (U) - т (и), обладающие свойствами G), A3) и A6) и такие, что композиции rotograd и divorot равны нулю. Теория этих линейных отображений известна как векторный анализ. Она играет особо важную роль в физике в теории электромагнетизма. Каждое электромагнитное поле (например, свет) в каждой точке среды задается двумя векторами — век* тором напряженности электрического поля Ё и вектором напряженности магнитного поля Н. Эти векторы зависят не только от точки, но и от времени t и полностью определены, если известна плотность электрических зарядов р и векторное поле / плотности тока. Уравнения, связьн вающие ЕиЯсри/, имеют (в соответствующей системе единиц) вид divU==4jtp, div# = 0, где с — скорость света. Эти уравнения, называемые уравнениями Максвелла, лежат в основе всей теории электромагнетизма и, в частности, оптики и радиотехники. Фактически векторный анализ и был впер* вые разработан как аппарат для исследования этих уравнений. Однако он с успехом применяется также, скажем, в механике сплошной среды, ну, и, конечно, имеет немаловажное чисто математическое значение. Наиболее интересные главы векторного анализа свя^ заны с так называемыми интегральными формулами, которыми мы займемся в третьем семестре. Пока же мы ограничимся рассмотрением простейших формул векторного анализа, не использующих интегралов. Для вывода этих формул целесообразно ввести так называемое символическое векторное поле Гамильтона дх 1 ду ' ' дг 231
Считая, что произведением, скажем, символа ¦^— на функцию Р является частная производная -^-, мы можем правую часть формулы A4), определяющей функцию diva, рассматривать как скалярное произведение поля V на поле и. Таким образом, diva = Va. Аналогичным образом, поле rot и мы можем представить в виде векторного произведения F0t» = VX«, что* кстати сказать, позволяет написать для rot и краев* вое выражение в виде определителя: i i к д д д дх ду дг Р Q R rot« = Наконец, разрешив писать числовой множитель справа от вектора, мы можем и поле gradF представить в виде произведения V на F: grad F = VF: Пусть теперь а и Ь — либо функции, либо векторные поля. Тогда их можно перемножить многими различными способами (например, если а и Ь — векторные по* ля, то скалярно или векторно), Пусть * и * — два таких умножения, что определено выражение V* (а*Ь). 1^2' Обычное правило дифференцирования произведения может быть сформулировано следующим образом: мы дифференцируем произведение дважды, каждый раз подвергая дифференцированию только один множитель и затем складывая оба результата. Довольно ясно, что то же самое правило применимо и к операции воздействия оператором V. Поэтому A7) V * (а*Ь) = V* (а • Ь) + V* (а* Ь), где вертикальная стрелка отмечает множитель, подвергающийся воздействию оператора V. Пусть, например, а и Ь являются функциями F и G (и, следовательно, умножение *—умножением функций, 232
а умножение * — умножением векторного поля на функцию). Тогда V(FG) = V(FG) + V(FG). Но ясно, что V (FG)=F (VG) и, аналогично, V (FG)=G (S7F). Следовательно, V(FG) = F(VG) + G(VF). Это — известная нам формула G). Если а —функция F, a Ь —поле и, то формула A7) дает две формулы: V{Fu) = V(Fu) + V(Fu) и VX(Fu) = VX(Fu) + VX(Fu). В первой формуле V(Fu) = F(Vu) и V(Fu) = {VF)u, так что V(Fa) = F(Va) + (VF)a. Это —формула A6). Аналогично, во второй формуле VX (^я) = ^ (V X и) и V X (^«) = (V-F) X «» и потому WX(Fu) = F(VXu) + VFXu. Это —формула A3). Наконец, если а и Ь — поля и и v, то получаются три новые формулы: A7а) V («v) = V (uv) + V (w), A76) V(aXtO = V(axi) + V(ix*), A7в) VX(aX^) = VX(ttxi + VX(«X^). Проще всего расшифровывается формула A76). Действительно, пользуясь свойствами смешанного произведения, мы немедленно получаем, что V (и X v) = Vuv = — uVv = — uVv = — u(VXv) и V {и X v) = V« v = v Va = v Va = v (V X и). 233
Следовательно, формула A76) равносильна формуле A8) div (и X v) = (rot u)v — и rot v. Конечно, это «следовательно» в высшей степени ус* ловно, поскольку законность применения свойств смешанного умножения к произведениям, содержащим символическое поле V, никак нами не обоснована. Подобное обоснование увело бы нас слишком далеко в сторону и, кроме того, нуждалось бы в дополнении его более подробным обоснованием исходной формулы A7), которая, строго говоря, была выше принята нами фактически без доказательства. Поэтому все сказанное выше мы имеем право рассматривать лишь как мнемонические или, в лучшем случае, эвристические соображения, объединяющие в единой формуле A7) ранее никак не связанные друг с другом формулы G), A6), A3) и A8). Что же касается формального доказательства последних формул (и, в частности, новой для нас формулы A8)), то нам ничего не остается, как независимо проверять каждую из них прямой выкладкой. Возможности формулы A7) перечисленными четырьмя формулами не исчерпаны: у нас еще остались нерасшифрованными две символические формулы A7а) и A7в). Для их преобразования нам понадобится следующая лемма: Лемма. Для любых хрех векторов а, Ь, с справедлива формула A9) с X (а X Ь) = (сЬ) а - (ас) Ь. Доказательство. Выберем такой ортонормиро- ванный базис i, /, ft, чтобы вектор а был коллинеарен вектору i, а вектор Ь компланарен векторам i и /\ Тогда а = ах1, b = b{i + b2j9 c = c{i + c2j + c3ft, и потому а X * = (ахЬ2) ft, с X (а X Ь) == (ахЬ2с2) i — (аф2с{) /• С другой стороны, cb = Cib\-\- c2b2t ac = a\Ci9 234
и потому (cb) а — (ас) Ь = (сфх + c2b2) axi — axcx (bxi + b2j) — ^(c2b2ax)i — (axCib^'j. Следовательно, с X (в X b) = (cb) a — (ас) ft. П Мы будем применять эту лемму к случаю, когда один из множителей является векторным полем V, т. е. снова лишь в чисто мнемонически-эвристических целях. Кроме того, чтобы получить правильные формулы, нам при этом придется придать новый смысл выражению aV, где a = Ai + Bj-\-Ck — некоторое векторное поле, отличный от напрашивающегося Va = diva, т. е. отказаться для символического векторного поля V от комму-* тативности скалярного умножения. Именно, мы будем считать выражение aV оператором, действующим на векторное поле и = Pi + Qj + Rk по формуле ,aV,„_< + Bf+Cif. Принимая это соглашение, мы, ввиду формулы A9), получим, что VX(aX«) = (Vv) и — (uV) v = (divv)u — (aV) v, V X (a X v) = (i>V) и — (Va) v = (vV) и — (div u) v, и тем самым формула A7в) даст нам формулу B0) rot (и X v) = (t>V) и — (aV) г> + (div v) и — (div a) z>. Чтобы аналогичным образом преобразовать формулу A7а), мы применим формулу A9), переписав ее в следующем виде: сХ(аХЬ) = а(сЬ)-(са)Ь. Тогда мы получим, что и X (V X v) = V(uv) - (uS)v и vX(VXu) = V(uv)-(vV)u и, следовательно, что V(uv) + V(uv) = = uX(VXv) + vX(VXu) + (vV)u + (uV)v. 235
Тем самым формула A7а) дает нам формулу B1) grad (uv) = и X rot v + v X rot и + (vV) и + (aV) v. Конечно, формальное доказательство формул B0) и B1) должно, как и раньше, состоять в прямой выкладке. Интересные соотношения имеют место и для композиций операторов grad, rot и div. Как мы уже знаем, rot о grad = 0, div © rot = 0. Заметим, что оператор V сводит эти формулы к утверждению, что векторное произведение двух одинаковых векторов равно нулю: rot(grad^) = VX(VF) = (VXV)F = 0 и div(rota) = V(VXtt) = (VXV)« = 0. Особый интерес представляет оператор А = div о grad, который можно рассматривать как скалярный квадрат V2 оператора Гамильтона V. Этот оператор называется оператором Лапласа. Он является оператором из ЗГ\и) в 3T(U) и действует по формуле л р _ d*F . d2F , d2F аГ ~ дх* + ду* "•" дг2 ' С его помощью записываются важнейшие уравнения ма« тематической физики, которым по учебному плану университетов посвящен отдельный курс. Функция F называется гармонической, если AF = 0. Примером гармонической функции является ньютонов потенциал F = (см. выше). Как будет показано в курсе уравнений математической физики, любая гармоническая функция является потенциалом гравитационно- го поля некоторой массы. Это одно показывает, какую важную роль должны играть в физике (а значит, и в математике) гармонические функции. 236
Оператор А можно применять и к векторным полям, воздействуя им на каждую компоненту в отдельности: если и = Pi + Q/ + Rk, то Aa = (AP)* + (AQ)/ + (A*)ft. Тогда будет иметь место формула rot © rot = grad о div — А. Действительно, согласно лемме rot(rot«) = VX(VXtt) = V(Vtt)-(VV)«. ? Можно составлять и другие дифференциальные вы« ражения. Например, для любых двух функций F и G определено скалярное произведение их градиентов: a /г п\ л ту л п dF dG . dF dG , OF dG А (Л G) = gradFgradG = ^^ + ^^ + ^-^-. Оно называется смешанным дифференциальным параметром Бельтрами функций F и G. В частности, при F = G мы получаем скалярный квадрат градиента: A,, = ,gra^=(§)'+(JfJ+(!f)!. Он называется первым дифференциальным параметром Бельтрами функции F. Смешанное произведение градиентов трех функций называется дифференциальным параметром Дарбу. Впрочем, этот термин ныне почти совсем не употребляет* ся, поскольку это смешанное произведение является не чем иным, как якобианом преобразования, задаваемого данными тремя функциями,
Лекция 23 НЕПРЕРЫВНЫЕ, ГЛАДКИЕ И РЕГУЛЯРНЫЕ КРИВЫЕ. — ЭКВИВАЛЕНТНЫЕ КРИВЫЕ. — РЕГУЛЯРНЫЕ КРИВЫЕ НА ПЛОСКОСТИ И ГРАФИКИ ФУНКЦИИ. — КАСАТЕЛЬНАЯ ГИПЕРПЛОСКОСТЬ ГИПЕРПОВЕРХНОСТИ.-ДЛИНА КРИВОЙ.-КРИВЫЕ НА ПЛОСКОСТИ.—КРИВЫЕ В ТРЕХМЕРНОМ ПРОСТРАНСТВЕ. Эксплицируя представление о линии как траектории движущейся точки, мы получаем следующее определение: Определение 1. Непрерывной кривой в /г-мерном евклидовом (или аффинном) пространстве & называется непрерывное отображение A) х: t*->x{t) некоторого отрезка [а,Ь\, а < 6, оси t в пространство 8 (имеется в виду, что точки пространства <$ характеризуются их радиус-векторами относительно фиксированной точки О). Говорить о непрерывности отображений вида A) смысл имеет, так как евклидово пространство 8 является ме-гпмческим пространством. Легко можно показать (сделайте это!), что непрерывность отображения A) равносильна непрерывности п числовых функций B) xgi tb-*Xi(t)f i=l, ...., п9 где x\(f), ..., xn(t) — координаты вектора x(t) в произвольном базисе. Поскольку этот базис априори никак не связан с метрикой (не ортонормирован), мы видим, что отображение A), непрерывное в одной метрике, будет непрерывно и в любой другой. Это означает, что свой- 238
ство непрерывности отображения A) не зависит от метрики и, следовательно, является аффинным свойством* Другими словами, имеет смысл говорить о непрерывных отображениях вида A) и в случае, когда пространство $* аффинно (и потому метрическим пространством не является). Ср. с определением 1 лекции 1.12. Определение 1 (применительно к пространству Rn) читателю должно быть уже известно из курса ана- лиза. Подчеркнем, что согласно этому определению непрерывная кривая является не множеством точек, а отображением. Тем не менее в отношении кривых используется такая терминология, как будто они являются множествами. Так, говорят, что кривая A) проходит через точку х0, если существует (вообще говоря, не одно) значение tQ параметра t такое, что x(to) = Xo. Точка х(а) называется началом кривой A), а точка х(Ь) — ее концом. Говорят также, что кривая A) соединяет точку х (а) с точкой х(Ь), и т. д. Множество всех точек кривой A), т. е. образ отрезка [а, Ь] при отображении A), иногда называется носителем кривой A). Определение 1 предложил еще в прошлом веке французский математик Жордан, который был уверен (и эту уверенность разделяли с ним все математики), что оно достаточно хорошо отражает интуитивное представление о линии. Но вскоре весь математический мир был потрясен известием, что итальянский математик Пеано построил непрерывную кривую, которая проходит (вообще говоря, несколько раз) через каждую (!) точку квадрата. Стало ясно, что одного условия непрерывности мало и нужны еще другие, дополнительные требования. В предыдущей лекции мы ввели понятие функции F, гладкой на некотором открытом множестве U cz Rn. Рассмотрим теперь произвольное множество С czRn n некоторую функцию /, заданную на С. Мы скажем, что функ* ция / является гладкой на С функцией, если существует такое открытое множество U cz Rn и такая гладкая на U функция F, что С с: U и В частности, функцию t*-~>x(t), заданную на отрезке [а, Ь], мы будем называть гладкой, если на некотором открытом интервале, содержащем отрезок [а, Ь], 239
существует гладкая функция, совпадающая на [а, Ь] с функцией x(t). Определение 2. Отображение A) называется гладкой кривой в &, если координатные функции B) являются гладкими на [а, Ь] функциями. Очевидно, что это определение корректно (не зависит от выбора координатной системы). Для любой гладкой кривой A) и любого t е [а,Ь] существует предел C) x'(t)=lim «е + А<)-«(Ц. Этот предел называется касательным вектором (к) кривой A) в точке t (или в точке #(/)). Его координатами являются, очевидно, производные D) *Н0, ...,*?(О координат B) вектора x(t). Вектор C) обозначается dx(t) также символом ^ . Эта конструкция, очевидно, может быть итерирована любое число раз, что даст векторы *"(*)> *'"(')• и т. д., координатами которых служат соответствующие производные координатных функций B). Легко видеть, что если для некоторой непрерывной кривой A) предел C) существует, то производные D) также существуют. Таким образом, условие гладкости кривой A) есть условие существования любых (нужных нам) производных x'(t), x"{t), ... Это еще раз показывает, что условие гладкости не зависит от выбора координатной системы. Гладкие кривые (точнее, их носители), в общем и целом, уже отвечают интуитивному представлению о линии. Во всяком случае, как мы покажем в третьем семестре, гладкая кривая не может проходить через все точки квадрата (и, более того, множество всех ее точек,—т. е. ее носитель — является так называемым «множеством меры нуль»). Однако она может иметь совсем не «гладкий» характер и обладать — подобно, скажем, кривой х = t2, y = ts на плоскости — точками «заострения». Чтобы избежать такого рода патологий, мы введем следующее определение: Определение 3. Гладкая кривая A) называется регулярно^ если x'{t) Ф_ 0 для всех t е [а, Ь]. 240
Регулярная кривая уже вполне отвечает интуитивному представлению о «гладкой» линии. Однако, преж-< де чем обсуждать это, нам нужно рассмотреть еще один важный вопрос. С наглядно-геометрической, интуитивной точки зрения основной недостаток определений 1—3 состоит в том, что вводимые ими «кривые» не являются множествами. Определение же кривой просто как образа отрезка [а, Ъ] при его непрерывном (гладком или регулярном) отображении в пространство <? оказывается по многим причинам совершенно неудовлетворительным. Чтобы хотя бы частично приблизиться к интуитивно- геометрическому представлению о линии и вместе с тем получить его работоспособную экспликацию, обычно вводят следующее определение: Определение 4. Две кривые х: tr->x(t), хг: *i »->-*i (*i), где соответственно a^t^.b и ax^ti^. b\y называются эквивалентными, если существует такая функция E) ЧМ»-*Ф@. что ф(а) = аь <р(Ь) = Ь\ и x(t) = xi(y(t)) для всех t&{afb]. Говорят, что функция E) осуществляет замену параметра /. Ясно, что эквивалентные кривые имеют одни и те же носители. Классы эквивалентных кривых называются непара- метризованными кривыми. Многие авторы (в основном более традиционного направления) называют их просто кривыми, а кривые в смысле определений 1—3 — параметризованными кривыми или путями. Наглядно переход к эквивалентной кривой означает, что, не меняя траектории движения точки, мы изменяем скорость, с которой она пробегает эту траекторию. Ясно, что эта замена скорости не может быть любой. Например, если мы рассматриваем непрерывные кривые, то в принципе надо требовать, чтобы функция ф осуществляла гомеоморф- ное (взаимно однозначное и взаимно непрерывное) отображение отрезка [а, Ь] на отрезок [а<ь &i], т. е. чтобы она была непрерывной и строго монотонной функцией (тогда обратная функция будет существовать и тоже будет непрерывной). Иначе вводимое определением 4 241
отношение между кривыми не будет, вообще говоря, от« ношением эквивалентности на множестве всех кривых и потому нельзя будет ввести классы эквивалентных кривых. Однако можно допустить и не строго монотонные функции E) и, значит, разрывные обратные функции, лишь бы кривая t *—^^1 (ф(^)) для разрывной функции ср оставалась непрерывной. Это означает, что при движении по траектории мы разрешаем точке на некоторое время остановиться и, наоборот, если точка стояла на месте, мы разрешаем в эквивалентном движении проскочить этот пункт без остановки. Более того, за счет некоторого усложнения определения 4 можно допустить и любые немонотонные функции E) (разрешая тем самым точке возвратное движение по траектории). Обычно все эти вопросы подробно рассматриваются в курсе анализа. Мы же, в соответствии с нашей общей установкой, ограничимся лишь регулярными заменами параметра, т. е. такими функциями E), которые, во-первых, гладки и, во-вторых, обладают тем свойством, что <р' (/) > 0 для любого / е [а, Ь]. Это обеспечит нам сохранение свойства регулярности при заменах параметра. Не следует преувеличивать значимость понятия не- параметризованной кривой, поскольку, во-первых, оно на порядок («на лишнюю эквивалентность») сложнее понятия параметризованной кривой, а во-вторых, даже несмотря на это, оно все же не полностью согласуется с интуитивным понятием линии как множества точек (кривые могут иметь общий носитель, но не быть эквивалентными) . В начале нашего века из двух понятий кривой основным считалось понятие непараметризован- ной кривой, как якобы более близкое к геометрической наглядности. Однако в последние годы все чаще выдвигаются на первый план параметризованные кривые, не только потому, что они концептуально более просты, но главным образом потому, что, как правило, именно они появляются в реальных математических конструкциях. Этим, в частности, и объясняется, почему просто «кривыми» раньше назывались ^параметризованные кривые, а теперь все чаще — параметризованные кривые. Немалую роль играет, конечно, и то обстоятельство, что многие естественные и удобные понятия и конструкции не сохраняются при эквивалентности и потому не 242
могут быть определены для непараметризованных кривых. Так обстоит дело, например, с понятием касательного вектора, который при переходе к эквивалентной кривой умножается на <p'(t). Из-за этого даже горячие сторонники приоритета непараметризованных кривых переходят на практике к параметризованным кривым, из* виняя свое грехопадение «натуральностью» (см. ниже)^ вводимого ими параметра. По всем этим причинам основным предметом нашего изучения будут параметрические кривые, а переходить к эквивалентным кривым мы будем лишь эпизодически и не по существу. Теперь мы уже можем обсудить вопрос, в какой мере понятие регулярной кривой отвечает интуитивному представлению о линии. Для простоты мы ограничимся случаем плоскости. Как всегда, координаты на плоскости мы будем обозначать через х и у. График произвольной гладкой функции у = у{х) яв- ляется носителем регулярной кривой x = t, y = y{t)9 которую мы будем — допуская естественную вольность речи—также называть графиком функции у(х). Какие кривые на плоскости удовлетворяют нашему интуитивному представлению о «гладкой линии»? Можно, по-видимому, потребовать выполнения следующих условий: а) график любой гладкой функции (при произвольном расположении осей координат) является «гладкой линией»; б) кривая, (регулярно) эквивалентная «гладкой линии», является «гладкой линией»; в) кривая тогда и только тогда является «гладкой линией», когда она является «гладкой линией» локально, т. е. в окрестности любой своей точки. Наименьший класс кривых, удовлетворяющий этим условиям, состоит из кривых, локально эквивалентных (т. е. эквивалентных в окрестности каждой точки) графикам гладких функций (меняющихся от точки к точке). Ясно, что все такие кривые регулярны. Оказывается (это и оправдывает с интуитивной точки зрения выделение класса регулярных кривых), что обратное также 243
верно: любая регулярная кривая на плоскости локально эквивалентна графику гладкой функции. Действительно, если кривая F) x = x(t)9 y = y(t), a</<6, регулярна, то для любой точки t0^[a,b] либо х'(и)Ф ФО, либо у'{и)Ф0. Пусть для определенности х'(и)Ф ф 0. Тогда, по теореме о неявной функции (применен* ной к функции F(x9t) = x — x(t)), функция t v->х(t) локально обратима, т. е. существует такая окрестность U0 точки t0 и такая окрестность Vq точки Xo = x(to)9 что функция /ь->x(t) задает биективное отображение f/o-^Vo, причем обратная функция x+->t(x) является гладкой. При этом ?{х)Ф$ для всех x^Vo и, значит, если t'(x)>0 на Уо, то функция x*->t(x) будет осу-* ществлять регулярную замену параметра для кривой F) в окрестности U0. Эта замена переведет кривую F) (в окрестности U0) в эквивалентную кривую, являющуюся (на Vo) графиком гладкой функции у = y(t(x)). Если же t'(x)<.0 на Уо, то за новый параметр надо принять не х, а —х (т. е. изменить направление оси абсцисс), а если #/(f0) = 0, то новым параметром будет у (или—у). ? Заметим, что в этом утверждении «локальность» понимается «относительно параметра», т. е. рассматривается ограничение кривой на некоторую окрестность точки /os[fl,6]. Для окрестности точки (*(/о), У (to)) на плоскости аналогичное утверждение не имеет даже смысла. Пример. Кривая _ 3/A—/)» _ З/2 A - t) х ~ з/2 - з/ +1 • У ы2 — ы +1 ' называемая декартовым листом, проходит через точку @, 0) дважды —при / = 0и /=1. В окрестности точки / = 0 она эквивалентна графику некоторой функции у = у(х), а в окрестности точки t = 1 — графику функции х — х(у). На плоскости же в окрестности точки @,0) эта кривая (точнее, ее носитель) является объединением этих двух графиков. Точка @,0) для декартова листа является так назы« ваемой точкой самопересечения. Графики же, на кото* рые декартов лист распадается в окрестности точки @,0), называются его ветвями. Мы не будем оетанав* 244
ливаться на феноменах такого рода, поскольку в даль* нейшем мы ограничимся лишь локальным изучением кривых на достаточно малых интервалах оси t (т. е7 следовательно, когда они эквивалентны графикам), и заметим только, что именно из-за наличия самопересечений регулярные кривые (точнее, их носители) не будут регулярными гиперповерхностями на плоскости в смысле определения 1 предыдущей лекции. Впрочем, то, что носитель каждой кривой на плоскости, не имеющей самопересечений, является регулярной гиперповерхностью и, наоборот, что любая регулярная гиперповерх-» ность на плоскости является носителем регулярной кривой (автоматически без самопересечения), мы, конечно, без соответствующего анализа утверждать (вне рамок локального рассмотрения) пока все равно не можем. В третьем семестре мы исследуем такого рода вопросы в их естественной общности и потому сейчас пока оставим их без обсуждения. В духе всей остальной терминологии, связанной с кривыми, мы будем говорить, что кривая jl) лежит на гиперповерхности G) F(x) = 0 пространства <Sy если F(x(t)) = 0 для любого <е[а, Ь], т. е. если гиперповерхности G) принадлежит носитель этой кривой. Определение 5. Вектор а называется касательным вектором (к) гиперповерхности G) в ее точке Хо, если на гиперповерхности G) лежит такая кривая tv->x(t), проходящая через точку х0 при t = to, что а является касательным вектором этой кривой в точке to, т. е. если a = xr(t0). Пусть У— линеал, ассоциированный с рассматриваемым точечным (для определенности — евклидовым) про-* странством &, и пусть Шх*—множество всех векторов, касательных к гиперповерхности G) (предполагаемой регулярной) в ее точке х0. Предложение 1. Множество <Ж*г0 является п—\-мерным подпространством пространства У, состоящим из всех Декартов лист. 245
векторов, ортогональных вектору gr&&F{x^: ЖХй = {ае=Т; agrauF(xQ) = 0}. Доказательство. Если aе 2$х0> то в Т существует такая кривая /»->*(/), а^/^fe, что (8) F (х (/)) = 0 для всех t e= [a, b] и (9) *о = *('о), * = x'(h). Но известная из анализа формула для производнри Касательный вектор. СЛОЖНОЙ функции Fix(t)) = F(Xi(t)> может быть записана в виде dF(x(t)) ., xn(t)) dt x'{t)grb&F{x{t)) (мы, естественно, предполагаем координаты хи • •¦> хя прямоугольными). Поэтому, дифференцируя соотношение (8) и полагая t = to> мы, в силу равенств (9), получим, что A0) agrad/4*o) = 0. Обратно, пусть выполнено соотношение A0). Не ограничивая общности, мы можем выбрать координатную систему так, чтобы вектор gradF(xo) был параллелен оси Охп. Тогда будут иметь место соотношения 3F <») *?г(*о) = 0, .. дхх ••TG^rW-o.^W^o. 246
а условие A0) приобретет вид ап = 0. Так как-н—fao)^ =?0, то в окрестности точки х0 гиперповерхность G) будет графиком некоторой гладкой функции *п = ф(*). Это означает, что где xf\ .. ¦, х*® — координаты точки ж0, и Г(?, <р(*)) = 0 для всех точек 5==(jci, ..., *rt_l)eR11', принадлежащих некоторой окрестности 00 точки *0eRn~'1. Дифференцируя последнее тождество по хи ..., *„_i и полагая * = Хо, мы в силу соотношения A1) получим, что Пусть теперь б > 0 — настолько малое положительное число, что при 1/|^б точка x0 + at, где, как всегда, а — {а\, •.., aft_i), лежит в 00. Тогда формулы x{t) = x0 + at, xn(t) = (f>{xo + at) будут определять в ^некоторую кривую fv->*(/), \t\^ ^ б, лежащую на гиперповерхности G) и проходящую при t = 0 через точку х0. При этом х'@) = а и <@)-*(*+а>|,_а- = ^(io)aI+.,.+^(*o)a„-1=0, т.е. л?@) = аЛ. Следовательно, *'@) = а, и, значит, Определение б. Гиперплоскость пространства 8, про-» ходящая через точку х0 параллельно подпространству Жх„ называется касательной гиперплоскостью (к) ги- гиперповерхности G) в точке #0. 247
Согласно предложению 7 касательная гиперпло* скость имеет уравнение (* — Xo)gradF(x0) = Q9 т. е. уравнение Вектор grad/r(x0) ей ортогонален. При п = 2 мы получаем известное из курса анализа утверждение, что на плоскости касательная к произ* вольной линии F(xty)=0 в ее регулярной точке (хо, уо) имеет уравнение (?),<*-* o) + (fH(i/-i/o) = 0. Как известно из курса анализа, длиной непрерывной кривой A) называется предел (если он существует) длин ломаных, вписанных в эту кривую (мы предпола* гаем пространство <§ евклидовым). Для гладкой кривой A) этот предел всегда существует (кривая, как говорит* ся, спрямляема) и выражается интегралом ъ A2) $1*401 #. а Фактически определение длины как предела длин впи" санных ломаных никогда не вспоминается (по крайней мере для гладких кривых) и используется только фор-< мула A2). Поэтому проще всего принять интеграл A2) за определение длины гладкой кривой и рассматривать рассуждение с ломаными лишь как его эвристиче-* скую мотивировку. Так мы и будем поступать в третьем семестре в аналогичных, но более сложных ситуациях (например, при определении площади поверхности). Пусть t A3) s(t)=\\x'(t)\dt а — длина отрезка кривой A) от а до /. Если кривая A) регулярна, то 5'@ = |*'@1>0, и потому возможна замена параметра t\-*>s(t)[. Таким 248
образом, любая регулярная кривая эквивалентна кривой, для которой параметром служит длина дуги. О последних кривых обычно говорят* что они отнесены к на* туральному параметру s. В дальнейшем мы, как правило,, всегда будем, пред-» полагать, что все рассматриваемые кривые отнесены к натуральному параметру. Никакого принципиального значения это, конечно, не имеет, но существенна упро^ щает выкладки. Дифференцирование по s мы будем обозначать точ-* кой: •, ч dx (s) •• , ч fi% (s) Согласно формуле A3), если t = s, то V | х (s) | ds = s a (и a = 0), откуда следует, что !#(s)|=l для всех $. Обратно, если \x'{t) | = 1 и а = 0, то t = s. Лемма 1. Пусть s*—>u(s)—такая векторзначная гладкая функция, что \u(s) |= 1 для всех s. Тогда A4) a(s)#(s) = Q для всех s. Доказательство. Достаточно заметить, что для скалярного (впрочем, как и векторного) произведения векторзначных функций справедливо обычное правило дифференцирования произведения функций, принимающих числовые значения (поскольку обычное доказательство полностью сохраняется и для этого случая). Поэтому, дифференцируя равенство ii(sJ = 1 (и сокращая на 2), мы получим A4). ? В частности, мы видим, что х (s) х (s) = 0 для всех 5. Этой важной формулой мы будем неоднократно пользоваться. Рассмотрим частный случай кривых на плоскости. Как всегда, координаты (прямоугольные) на плоскости мы будем обозначать через х и у, а радиус-вектор 249
с этими координатами — символом г (вместо символа *, используемого в общем случае). Кроме того, для любой кривой r = r(s) на плоскости (отнесенной к натуральному параметру s) мы будем символом t(s) обозначать ее касательный вектор в точке r(s): t(s) = r(s). Согласно сказанному выше этот вектор является ортом и t (s) i (s) = 0 для любых s. Определение 7. Длина вектора t(s) обозначается символом k(s) и называется кривизной кривой r = r(s) в точке 5. Таким образом, k(s)=\i(s)\ = ^x*(s) + y4s). Кривизной кривой, отнесенной к произвольному параметру /, называется кривизна эквивалентной кривой, отнесенной к натуральному параметру. Формула для этой кривизны (которую можно получить простыми, но довольно громоздкими вычислениями, не пользуясь ничем, кроме формул дифференцирования функций) имеет Довольно сложный вид: Наглядно число k{s) является мгновенной скоростью поворота единичного вектора t(s). Ясно, что эта скорость тем больше, чем кривая «искривлённее». Отсюда и термин — «кривизна». Иногда рассматривают (на ориентированной плоскости) так называемую относительную кривизну АОТн, равную кривизне А, если (при k ф 0) векторы tut составляют положительно ориентированный базис плоскости, и равную —k в противном случае. Нам эта кривизна понадобится в лекции 25. Пример 1. Если x(s) = Xo + sl, y(s) = y0 + sm, где l2 + tn2=lf т. е. если рассматриваемая кривая является прямой, то x(s) = 0 и #(s) = 0. Поэтому k(s) = 0 для всех s, т. е., как и следовало ожидать, кривизна прямой тождественно равна нулю. ? 250
Поскольку линейные функции являются, как легко видеть, единственными функциями, вторая производная которых тождественно равна нулю, верно и обратное, т.е. кривая, кривизна которой тождественно равна нулю, является прямой (или ее отрезком) ? Точка r0 = r(so) кривой r = r(s) называется точкой распрямления, если &(s0) = 0. Пример 2. Параметрические уравнения окружное сти радиуса R в натуральном параметре s имеют, очевидно, вид x = Rcos-~, y = Rsin-jj-. Так как 1 _ S .. 1.5 то ?($) = -?¦ Таким образом, кривизна окружности постоянна и равна величине, обратной ее радиусу. ? Верно и обратное: кривая с постоянной кривизной является окружностью (или дугой окружности). D Это вытекает из общей теоремы, утверждающей, что для любой функции k = k(s) (определенной и гладкой на отрезке |s|^s0) существует (если число s0 достаточно мало) кривая r = r(s), |s|<s0, кривизна которой равна k(s), причем с точностью до конгруэнтности эта кривая единственна. Мы не будем сейчас доказывать эту теорему, поскольку в следующей лекции мы докажем ее аналог для любого п. Если ?(s)=t^ 0, то определено число R (s) —¦уТвТ' на" зываемое радиусом кривизны кривой в точке s. Кривая r = r(s) называется кривой общего типа, если на ней нет точек распрямления, т. е. если k(s)=?0 для всех s. В каждой точке такой кривой определен единичный вектор n<5) = T(sT' направленный по нормали к кривой (т. е. по прямой, проходящей через точку касания перпендикулярно касательной) , 251
Для любого s векторы t{s)' и n{sy образуют ортонор* мированный базис, который называется сопровождаю* щим базисом Френе данной кривой. По определению i(s) = k(s)n(s). Найдем аналогичную формулу для вектора л{&). Пусть h(s)=a(s)t(s) + $(s)n(s) — разложение этого вектора по векторам базиса t(s), n(s). Так как t(s)n(s) = 0, то i(s)n(s) + t(s)n(s) = 0, и потому a(s) = t(s)n(s)=—t(s)n(s) = = — k (s). С другой стороны, согласно лемме 1 P(s) = = п (s) n (s) — 0. Этим доказано, что для любой кривой общего типа имеют место формулы Базис Френе плоской кри- t (s) = k (s) n (s), вой. A5) it{s)--*(s)*(s), описывающие мгновенный поворот сопровождающего базиса при изменении s. D Формулы A5) называются формулами Френе для плоской кривой. Рассмотрим теперь кривые в трехмерном простран-» стве (с координатами х, уу z и радиус-вектором точек г). Для любой кривой г = r(s) (отнесенной к натуральному параметру) ее касательный вектор r(s) мы по-прежнему обозначим через t(s). Длина \t(s)\ вектора i(s) для пространственных кривых также называется кривизной и обозначается прежним символом k(s). Таким образом, k(s) = <s/x(sr + y(sf + z(s)K Кривая г — r(s) называется, как и в случае п = 2, кри- вой общего типа, если k(s)^=0 при всех s. Для такой кривой определен единичный вектор называемый вектором главной нормали кривой. 252
Но теперь мы можем (предполагая пространство ориентированным) ввести в рассмотрение еще третий вектор 6(s), составляющий вместе с векторами t(s) и n(s) положительно ориентированный ортонормирован-» ный базис t(s), n(s), b(s). Этот вектор называется вектором бинормали, а базис t(s), n(s), b(s) —сопровождающим базисом Френе данной кривой общего типа. По построению (для упрощения формул мы опу< екаем аргумент s) i = kn. Кроме того, так как Ь = t X я, то 6=*Хл + *Х* = 'Хй, откуда следует, что Ы = 0. Поскольку, согласно лемме 1, 66 = 0, этим доказано, что вектор* b коллинеарен вектору л, т. е. существует такое число tt = x(s), что \ Это число называется кручением данной кривой в точке s. Оно является скоростью поворота вектора бинормали. Дифференцируя теперь равен- сгва *-0 в *»-0, мы немед- Базисств^екрГоГ"" ленно получим, что nt = — nt = = — k и nb = — п6= к. Поскольку, кроме того, л = 0 (лемма 1), тем самым доказано, что я = — kt + xb. Таким образом, для любой кривой общего типа имеют место формулы i= kn, A6) л = — kt + кЬ, Ь = — ил. П Эти формулы называются формулами Френе для пространственной кривой. Пример 1. Если кривая r — r(s) расположена в плоскости П, то векторы г (s) и г (s) параллельны этой 253
плоскости (ибо это так для приращений г (s + As) — г (s) и г (s + As) — г (s) векторов r(s) иг (s)). Поэтому t (s), n(s)||n, и, значит, b(s) J_ IL Это доказывает, что b(s) = = const, и потому k(s) = 0 для всех s. Обратно, пусть х (s) = 0 для всех s и, значит, Ь (s)=&0=const. Тогда (r(s)bo)' = t(s)b0 = 0 для всех s, и потому r(s)bo — = const. Это означает, что кривая r — r(s) расположена в плоскости г60 = const. Таким образом, кривая в пространстве тогда и только тогда является плоской кривой, когда ее кручение тождественно равно нулю. ? Пример 2. Винтовой линией называется траектория точки, движущейся с постоянной скоростью по образующей прямого кругового цилиндра, равномерно вращающегося вокруг своей оси. Уравнения этой линии имеют вид я = a cos/, y = asintt z = bt. Имеем xr = — a sin t> у' = а cos t, z = b, откуда Винтовая линия. s' = V(*'J + (уУ + («Т = л/<*2 + Ь2. Таким образом, s = ct, где с = л/а2 + Ь2, и, следовательно, * = acosy, j/ = asin~, z=js. Так как а . s Х= — — Sin — a s й — — COS—, * с с z =• ТО * = -?cos-^-, y = "~|-sinf' *=0' & = ^x2 + y2 + zz = -J- == const s . s . Il= —COS—* — Sin—/, 254
6= s= t X« = f a . s sm — с с s — COS — с I a s — cos — с с — sin — с k b_ с 0 Поэтому и, следовательно, — Sin — I COS — J -\ ft. с с с с * ' с b . s . b Sin-r/ = —-з-Л, x = -s- = const. Таким образом, кривизна и кручение винтовой линии постоянны. ? Согласно общей теореме, которую мы докажем в следующей лекции, и обратно, каждая кривая, кривизна и кручение которой постоянны, является винтовой линией (или ее дугой).
Лекция 24 ПРОЕКЦИИ КРИВОЙ НА КООРДИНАТНЫЕ ПЛОСКОСТИ СОПРОВОЖДАЮЩЕГО РЕПЕРА. — ФОРМУЛЫ ФРЕНЕ ДЛЯ КРИВОЙ В Я-МЕРНОМ ПРОСТРАНСТВЕ. — ЗАДАНИЕ КРИВОЙ ЕЕ КРИВИЗНАМИ.—РЕГУЛЯРНЫЕ ПОВЕРХНОСТИ. — ПРИМЕРЫ ПОВЕРХНОСТЕЙ. Чтобы исследовать поведение произвольной пространственной кривой г = r(s) вблизи некоторой ее точки, мы выберем начало координат О в этой точке, за векторы базиса i, /, k выберем векторы t0, щ, Ь0 сопро* вождающего репера в точке О и будем натуральный па-* раметр 5 отсчитывать от О. Тогда . r@) = 0, r{Q) = t0 = i, r@) = kon0 = k0jy г @) = (kH щ + 60iio = — kli + (kH j + k0%0k, где ko, (fe)o и щ — значения функций ky k и х при s = 0. Следовательно, по формуле Тейлора r(s) = r@) + sr@) + ^r@)+^r@)+ ...= Это означает, что вблизи точки О наша кривая задается параметрическими уравнениями x = s+ ..., ^0 9 1 25S
Если ko фО, щФ 0, то проекция кривой на плоскость Oij = Ot0n0 (кстати сказать, эта плоскость называется соприкасающейся плоскостью кривой в точке О) приближенно совпадает с параболой x = s, У— 2 s , ее проекция на плоскость Ojk = Оп0Ь0 (которая называется нормальной плоскостью кривой в точке О) — Проекция на соприкасающуюся плоскость Проекция на нормальную плоскость с полукубической параболой kpHp Проекция на спрямляющую плоскость 5°, и, наконец, ее проекция на плоскость Oik — Ot0bo (которая называется спрямляющей плоскостью кривой в точке О) —с кубической параболой ¦s, Это дает достаточно отчетливое представление об устройстве пространственной кривой вблизи любой ее точки (в которой отличны от нуля кривизна и кручение). Перенесем теперь полученные в предыдущей лекции результаты на случай произвольного п. Пусть х = х (s), | s | <; s0, — произвольная (отнесенная к натуральному параметру) кривая в л-мерном ориентированном евклидовом пространстве #\ Предполагая, что для любого s векторы (п-\) х (s), ..., х (s) линейно независимы (такие кривые называются кривыми общего типа), и применяя к этим векторам процесс ортогонализации Грама — Шмидта, мы получим 7з9 ма ма Постникову семестр II 267
ортонормированное семейство векторов t\ (s),..., tn-\ (s). Пусть tn(s)—вектор (однозначно определенный), дополняющий это семейство до положительно ориентированного ортонормированного базиса (О М*), ..., *n-l<*), tn(s). Определение 1. Базис A) называется сопровождающим базисом Френе кривой # = #(s) общего типа в точке s. Пусть п ** = Е<**/*/ /= 1,..., п (для упрощения формул мы опускаем аргумент $). Так как, по построению, вектор ti9 / = 1, ..., п— 1, линейно выражается через векторы дс, ..., лс, то век- U + D тор ft линейно выражается через векторы х, ..., л;. Поскольку последние векторы линейно выражаются через векторы t\, ..., ti+u этим доказано, что ац = О при / > i + 1. С другой стороны, так как tf*f/ = 6/y, то titj + titj — = 0, т. е. «i/ + а/, = 0. Потому ан = 0 и а^ = 0 при j <i— l. Таким образом, могут быть отличны от нуля лишь коэффициенты а*,/+1 = — а;+1, t. Полагая &l=<Xi2> &2 = а23> •••> &Л-1 =а/г-1,и> мы видим, следовательно, что имеют место формулы t{ = k{t2, t2 = ¦— Mi + Мз> B) *n-l = &л-2*/г-2 "T kn-l*m Эти формулы называются формулами Френе для кривой в n-мерном пространстве. Функции k\= k\{s), ..., йл_1 = йя-i E) называются кривизнами кривой. Подчеркнем, что они определены только для кривой общего типа. 258
Ё формулах (!) C) ** = Рп* + ... +$цх, t=i, ...,n-l, получающихся применением процесса ортогонализации Грама — Шмидта, последние коэффициенты р,х- положительны. Поэтому в обратных формулах (О D) * = Yn*i + ¦.. +YiA коэффициенты Yu* = P«1 также положительны. Дифференцируя формулы C), мы получим, что */ = Pn* + (Pi2 + Pn)* + ••• (О tt+D ...+(P« + P*,f-.i)* + P/i л: , /=1 п— 1. Заменив здесь (при /<я—1) векторы х, ..., * их выражениями D), мы должны получить формулы B). Это показывает, что ?* = P«Y*+i,/+i Для любого /=1, ..., л —2. Тем самым доказано, что для любой кривой общего типа кривизны положительны. Кривизна же kn-\ (аналог кручения) может иметь любой знак. Покажем теперь, что любые п — 1 функций E) kx (s) > О, ..., kn„2 (s) > 0, kn_i (s) могут служить кривизнами некоторой кривой и что эти кривизны однозначно (с точностью до конгруэнтности) определяют кривую. Теорема 1. Пусть на произвольном отрезке \s\^.so заданы п— 1 гладких функций E), которые все положительны, кроме, быть может, последней. Тогда для любой начальной точки О е ^Р и любого положительно ориентированного ортонормированного базиса ii, ..., in существует одна и только одна регулярная кривая x — x(s)t | s | ^ So, общего типа, обладающая следующими двумя свойствами: 1) кривизнами этой кривой являются данные функции E); 729* 259
Й) при 5 = 0 имеют место равенства *@) = 0, *i@) = *i, ..., *я@)=*я. Доказательство. Мы проведем доказательство по этапам. Этап 1. На этом этапе мы воспользуемся следующей общей теоремой, известной как теорема существования п единственности решений (СЕР) линейных дифференциальных уравнений и которая будет доказана в курсе теории дифференциальных уравнений в третьем семестре: Теорема СЕР. Пусть на произвольном отрезке \s\^. ^ So заданы ш2 гладких функций Aij(s), i, j = 1, ..., m, и пусть х\°\ ..., х{® — произвольные числа. Тогда су- ществует одно и только одно семейство гладких функций Xi(s), ..., Xm(s), |s|^50, обладающих следующими двумя свойствами: 1) тождественно по s, |s|^So> имеют место соотношения *1 = Лц*!+ ... +AlmXm, F) ш - хт — Ат\Х{ -+-.••+ Аттхт* 2) при s = 0 имеют место равенства Xl@) = xf\..., xm@) = *%. D Мы применим эту теорему к соотношениям B), которые при данных функциях k\, ..., kn-\ являются уравнениями вида F) для m = п2 координат векторов t\> ... ..., tn. Таким образом, согласно теореме СЕР, на отрезке | s | ^ s0 существует одно и только одно семейство таких векторзначных функций t\ = t\ (s), ..., tn = = tn-\ (S) , ЧТО 1) при любом 5 имеют место соотношения B); 2) при 5 = 0 имеют место равенства G) МО)-*,,..., М0) = *Л. Этап 2. Рассмотрим скалярные произведения *,//, if /==1, ...,n. Согласно соотношениям B) для этих произведений имеют место равенства (* А)* = *А + Ut i = (- */-A-i + *A+i) tf + + '<(-*/-A-i + *A+0 260
(мы условно полагаем, что f0 = 0 и f„+l = 0), т. е. равенства (8) (htif = - kt„x (tMtt) + kt (tMt,) - которые мы можем рассматривать как уравнения вида п (п -4- \\ F) для т= 2—- функций titj. Поэтому, согласно теореме СЕР, существует только единственный набор этих функций, обладающих тем свойством, что при 5 = 0 они равны б*/ = id; (т. е. равны нулю, если i ф \% и единице, если / = /). С другой стороны, непосредственная проверка показывает, что уравнениям (8) удовлетворяют функции titj, тождественно равные Ьц. (Действительно, при 1Ф [Ф /— 1, / + 1 все слагаемые суммы —fe_i6*_i, / +! ,+ kfii+i, / — kf-iSt, /_i + kj8i, /+i равны нулю, а при i =*\ = j—1, i+ 1 в этой сумме имеются только два отличных от нуля, но взаимно сокращающихся слагаемых.) Следовательно, в силу теоремы СЕР, для всех s имеют место равенства Щ = б,-/, if /=1, ..., п, означающие, что векторы tu ¦ .., tn для любого s, |s|^s0, составляют ортонормированный базис. Поскольку при s = 0 этот базис совпадает с положительно ориентированным базисом *ь ...» **, то и для любого s базис tu • • •» tn положительно ориентирован. Этап 3. Составим последовательные производные вектора t\i <n-l) (9) tu tu tu • • •> tu и применим к ним процесс ортогоиализации Грама—• Шмидта. Так как вектор U является ортом, то на первом шаге этого процесса мы ничего делать не должны. Поскольку вектор i\ ортогонален вектору t\ (по лемме 1 предыдущей лекции), на втором шаге мы должны его только нормировать. Так как по доказанному вектор t% является ортом, a k\ > 0 по условию, то, согласно первому из соотношений B), |fi| = &i. Поэтому на втором шаге мы получим вектор t — iL 9 №. М, Постников, семестр II 261
На третьем шаге нам следует рассмотреть вектор % t\ = (&1*2)' = klU + k\t2 — — k\t\ + «1*2 + ?l&2*3> вычесть из него линейную комбинацию векторов U и t% так, чтобы получился вектор, ортогональный этим век-» торам, и пронормировать этот вектор. Но так как век* торы t\, *2, h составляют по доказанному ортонормиро* ванное семейство, а по условию k\k2 > 0, то в результате этой процедуры получится, очевидно, вектор <з. Ясно, что это рассуждение имеет общий характер, так что на каждом шаге процесса ортогонализации мы получим соответствующий вектор *,, /==1, ..., п—1- Этим доказано, что семейство векторов t\9 *2, .... tn-\ однозначно характеризуется как ортонормированное семейство векторов, получающееся из семейства (9) применением процесса ортогонализации Грама — Шмидта* Этап 4. Пусть S A0) *(*)-$ tX(s)dsf |5|<So. О Тогда дс@) ===== 0 и x{s) — ti(s), т. е. кривая x = x(s)\ |s|^5o, начинается в точке О и имеет в точке x(s) касательный вектор t\ (s). Но для каждой кривой первые п— 1 векторов сопровождающего базиса представляют собой векторы, получающиеся из первых п—1 производных касательного вектора процессом ортогонализации Грама — Шмидта. Поэтому, согласно доказанному выше, эти векторы совпадают с векторами t\, ..., tn-\* Что же касается последнего вектора сопровождающего базиса, то он однозначно характеризуется как единичный вектор, составляющий с петтвыми п—1 векторами положительно ориентированный базис. Поскольку базис *ь ..., tn-\,tn, как мы видели, положительно ориентирован, этим вектором должен быть вектор tn- Итак, доказано, что для любого s векторы t\(s), ... ..¦, tn(s) составляют сопровождающий базис кривой x = x(s). Поскольку для этих векторов имеют место формулы Френе B), участвующие в этих формулах функции kii(s), i= 1, ..., п—1, должны быть криввд^ нами кривой дс = х (s). Тем самым существование кривой * = x(s), обладающей свойствами 1) и 2), полностью доказано. 262
Ее единственность вытекает из того, что, согласно теореме СЕР, сопровождающий базис ti(s), ..., tn(s) однозначно определен уравнениями B) и начальными условиями G), а радиус-вектор x(s) однозначно определен (по формуле A0)) соотношением x{s)—ti(s) и начальным условием х@) = 0. ? По аналогии с определениями 1—3 лекции 22 для любого ky 0 < k <C п, может быть дано «параметрическое» определение ^-мерной поверхности в д-мерном пространстве. Для простоты мы ограничимся случаем, когда k = 2 и п = 3. Пусть W—произвольное открытое множество в двумерном пространстве R2, точками которого являются пары (и, v) вещественных чисел. Произвольное отображение W -><g этого множества в трехмерное евклидово пространство <§ задается (если в & выбрано начало О) или векторзначной функцией r = r(uy v), определенной в W, или (если в В введены прямоугольные координаты х, У> г) тремя числовыми функциями A1) х = х(и, v) y = y(u,v), z = z(utv). Как и раньше, мы будем рассматривать лишь гладкие отображения (и, v)\—>r(u, v), т. е. такие, что функции A1) гладки в W. Поэтому будут определены частные производные A2) га = xui + у J + z A r0 = xvi + yvj + zvk (для простоты мы опускаем аргументы и, v). Определение 2. Отображение (и, i>)w->r(u, v) называется регулярной поверхностью, если для любой точки (и, v)& W векторы A2) линейно независимы. Множество всех точек из &у радиус-векторы которых имеют вид г (и, v)y (и, v)g Wf называется носителем поверхности г = г (и, v). Напомним из курса анализа, что биективное отображение W-+Wi открытого множества WczR2 на открьь тое множество Wi с: R2 называется диффеоморфизмом, если функции A3) щ = щ (и, v), vt = v{ (и, v) и (И) и = и {их v{), v = v («!, v{), 9* 268
ди\ ди dvi ди ди\ dv dvx dv задающие отображение W-+-W\ и обратное отображение W\ -> W, являются гладкими функциями. Для того чтобы биективное отображение, задаваемое гладкими функ- циями A3), было диффеоморфизмом, необходимо и достаточно, чтобы его якобиан лк\ 0(«i,Pi) _ W d(utv) — был всюду в области W отличен от нуля. Если же якобиан A5) функций A3) (которые априори не предполагаются задающими биективное отображение) всюду в W отличен от нуля, то задаваемое ими отображение является локальным диффеоморфизмом, т. е. для любой точки (ио, v0)& W существует окрестность U с: W, на ко-* торой это отображение является ее диффеоморфизмом на некоторую окрестность U\ с W\ точки (u\(uo, v0), v\(uo,vo)) (это — так называемая теорема об обратном отображении). Пусть теперь нам даны две поверхности: A6) r = r(u,v), (u,v)<=W9 и A7) г = /-!(«!, о,), (uu vx)&Wu Определение 3. Поверхности A6) и A7) называются эквивалентными, если существует такой диффеоморфизм «1 — Щ (и, v), vi = vy (и, v) открытого множества W на открытое множество ИР^что г («, v) = гх (щ (и, v), vx (uy v)) для любой точки (и, v) е W. Ясно, что эквивалентные поверхности имеют один и тот же носитель. Любая гладкая функция z = z{xf у) двух перемен* ных, определенная в области W, задает по формуле г (и, v) — ui + vj + z (и, v) k регулярную поверхность, называемую графиком этой функции. Оказывается, что при соответствующем выборе координатных осей любая регулярная поверхность локальна 264
эквивалентна графику некоторой гладкой функции. Дей* ствительно, так как векторы ги и rv линейно независимы, то в любой точке (но, v0) e W ранг матрицы (хи Н zu\ \xv У9 zvJ равен двум, т. е. хотя бы один из ее миноров дорого по* рядка отличен от нуля. Пусть, для определенности, Тогда, по теореме об обратном отображении (применен* ной к функциям х = х(и, v) и y=zy(u,v))> будет существовать такая окрестность Uq<zW точки (uotVo) и та* кая окрестность VoCzR2 точки (*0,#o)eR2, где х0 = = х(и0у vo), yo = y(uo,v0), что функции х = х(и, v) и у = у(и, v) осуществляют диффеоморфизм окрестности Uq на окрестность Vo. Тогда, если и = и(х, у), v = v(x9 у) •— функции, осуществляющие обратный диффеоморфизм, то на окрестности t/0 поверхность r = r(u,v) будет эквивалентна графику функции z = z(u{xyy), v(x9y)). ? Хотя поверхность и не является множеством, но в терминологическом аспекте ее часто отождествляют с ее носителем. Так, например, точки носителя называют точ« ками поверхности и т. д. Вообще говоря, регулярная поверхность может пред* ставлять собой неинъективное отображение в <$ (она может иметь точки, линии и даже целые участки «са* мопересечения»), но мы в этом семестре будем интере* соваться только достаточно малыми ее частями, в кото* рых поверхность эквивалентна графику и потому яв« ляется инъективным отображением. Если точка М поверхности имеет радиус-вектор r(u, v), то числа и и v называются координатами этой точки на поверхности. В силу инъективности отображения (и, a)i—>г(и, и) это определение корректно. Любая кривая A8) u = u(t), о — о(/) в области УР, определяет кривую A9) "' r = r(u(t),v{t)) 265
в пространстве <?Р, о которой говорят, что она лежит на поверхности г = r(u,v). Уравнения A8) называютсй уравнениями кривой A9) в координатах и, v на поверхности. В частности, на поверхности определены кривые и = const и v = const. Они называются координатными кривыми, а их совокупность — координатной сетью на поверхности. Примеры поверхностей. 1. Носителем поверхности B0) х = R cos и, y = Rsinu, z = v является прямой круговой цилиндр радиуса /?, В соответствии с этим поверхность B0) также называется цилиндром (круговым). Круговой цилиндр. Поверхность вращения. При — со < и < + оо каждая точка цилиндра беско* нечное (счетное) число раз покрывается точками пло* скости {и, v). Чтобы достичь инъективности, следует считать, что 0 < и < 2л, но тогда получится цилиндр «с прорезью». В дальнейшем, в соответствии с нашей общей установкой на локальное рассмотрение, мы такого рода обстоятельства будем игнорировать. :.? Координатная сеть на цилиндре состоит из «вертикальных» прямых и = const и «горизонтальных» окружностей v = const, Ж
2. Пусть x = x(v), z — z(v)— произвольная регулярная кривая на плоскости Oxz, не пересекающая оси Oz* Поверхность B1) x = x(v)cosu, y = x(v)sinu, z = z(v) называется поверхностью вращения, а кривая x = x(v), z = z(v) называется ее профилем. Наглядно, поверхность B1) получается вращением ее профиля вокруг оси Oz, Регулярность поверхности B1), т. е. линейная независимость векторов ги = (— х (v) sin и, х (v) cos и, 0), rv = (х' (v) cos и, х' (v) sin u> z' (v)), обеспечивается регулярностью профиля (т. е. условием х'(vJ-{• z'(vJ Ф0) и тем, что профиль не пересекает оси вращения Oz (т. е. тем, что Координатная сеть на поверхности B1) состоит из кривых, являющихся поворотами профиля вокруг оси Oz (они называются меридианами), и перпендикулярных им окружностей (параллелей) . Цилиндр представляет собой поверхность вращения, профилем которой является прямая x = R, z = v. Поверхностью вращения с профилем х = R cos v, z = = R sin v (окружностью) является сфера x = R cos v cos «, у = R cos v sin u, z = R sin v радиуса R с центром в точке О. Координаты и и v представляют собой общеизвестные «географические координаты»— долготу и широту, а координатными кривыми являются географические меридианы и параллели. Заметим, что, строго говоря, мы должны рассматривать только часть окружности х = R cos v, z — R sin v9 не пересекающую ось Oz, и, значит, лишь соответствую* щую часть сферы («сферу, проколотую в полюсах»)* Это находит свое отражение в том, что координаты ми v теряют смысл в полюсах. Однако выше мы уже условились все подобного рода феномены игнорировать. ш
3. Поверхность r = r{u,v) называется линейчатой, если B2) r(u9v) = piu) + va(u), где р(и) и а (и) — произвольные векторзначные функции, обладающие тем свойством (обеспечивающим регуляр* Линейчатая поверхность. ность), что векторы р'(и) + va'(u) и а (и) при всех рас* сматриваемых и и v линейно независимы (так что, в частности, а(и)Ф0 для всех и)% Координатной кривой Конус. Цилиндр. и = «о = const является прямая с направляющим вектором а («о), проходящая через точку с радиус-вектором р(мо). Таким образом, наглядно линейчатая поверхность зачерчивается движущейся в пространстве прямой, Ср, с определением 1 лекции 1.23, 268
Ясно, что без ограничения общности мы можем счи« тать вектор а{и) единичным: а2 (и) = 1 для всех и. Если р'(и) = 0 для всех и, т. е. р (и) = const, то — после переноса начала координат — мы получим вместо B2) уравнение вида B3) г = va (и). Это — конус, направляющей которого является регулярная пространственная кривая а = а(и). Если а'(ы) —О для всех и, т. е. а(и) = const, то поверхность B2) представляет собой цилиндр с (вообще говоря, пространственной) направляющей р = р(а). Если вектор р' не равен тождественно нулю, то — перейдя, если нужно, к меньшей области в R2 — мы мо« жем считать, что р'(и)?=0 для всех и. Тогда р = р(и) будет регулярной кривой в пространстве, и мы можем считать, что и является на этой кривой натуральным параметром (длиной дуги). Конус B3) также можно задать уравнением вида B2) с р'(и)=й= 0. Для этого достаточно в B2) положить р(ц) = а(и) (если, конечно, *'(и)Ф0). Если а (и) является касательным вектором х(и) кри-< вой р==р(и), то поверхность B2) называется поверхностью касательных. Аналогично определяются поверх* ность главных нормалей и поверхность бинормалей. Если кривая р = р(ы) плоская, то ее поверхность бинормалей представляет собой цилиндр над этой кривой,
Лекция 25 ПЕРВАЯ КВАДРАТИЧНАЯ ФОРМА ПОВЕРХНОСТИ.— ИНДУЦИРОВАННЫЕ КВАДРАТИЧНЫЕ ФОРМЫ. — ИЗОМЕТРИЧНЫЕ ПОВЕРХНОСТИ. — ПОВЕРХНОСТИ С ИДЕНТИЧНЫМИ ПЕРВЫМИ КВАДРАТИЧНЫМИ ФОРМАМИ. —ПРИМЕРЫ ПЕРВЫХ КВАДРАТИЧНЫХ ФОРМ ПОВЕРХНОСТЕЙ. ~ РАЗВЕРТЫВАЮЩИЕСЯ ПОВЕРХНОСТИ. Пусть г = г (О, где r(t) = r(u(t),v(t)), a</<6, -гпроизвольная кривая на поверхности r — r(u, v)9 (и, t))ercR2, Так как г'@ = «'@г* + *'@г,, то Iг'@ |= ^(u'{t)ru + v'{tOJ= ^ = Ф\и' (tf + 2 (r„r„) и' it) v' (t) + rW iff. Введем на W функции E — E(u, v), F = F (и, v) и G — G(u, v), положив A) E = rl, F = rurv, G = r%. Тогда | r' {t) | = л/? @«' iff + 2^ (/)«' @ v' (/) + G (t)v' iff, где E(t) =E(u(t), v{t)) и, аналогично, F(t) =F(u(t), v(t)), G(t) = G(u(t), v(t)). Поэтому для длины s кривой г — r{t) мы получаем формулу s = J т/Е @«' (О2 + 2F(t) и' (/) v' @ +-0ДО о' (О2Л, a 270
которую можно переписать в следующем удобном для запоминания условном виде: B) 5=5 Y? du2 + 2Fdudv + G dv\ L где символ L обозначает кривую г — r(t). Определение 1. Дифференциальное выражение Edu2 + 2Fdudv + Gdv2 называется первой квадратичной формой поверхности (подразумевается — от дифференциалов du, dv). Эта форма обозначается либо символом ds2 (когда имеют в виду напомнить формулу B)), либо символом /. Вводя формальный дифференциал dr = rudu + rvdv, форму / можно обозначить также символом dr2 (наибо* лее, по-видимому, выразительным). Углом ф между двумя пересекающимися при данном значении t пространственными кривыми r = r(t) и г =» «=:/!(<) называется угол между их касательными векторами r'\t) и r{ (t). Таким образом, cosqp Если эти кривые лежат на поверхности r = r(a, v), т.е. если r(t) = r (и @, v (/)), г, (/) = г (щ (/), vx (/)), то г' = rji' + г у, r[ = rji\ + rvv[, и, значит, согласно A), Ей и{ + F\ti vx + v ux) + Gv ux COS ф " 75 Ей +2Fuv +Gv yEu[ +2Fuivi + Gv\ Полагая du = u'(t)dt, dv = v'(t)dtt bu = ui (/) dt9 bv = v'i @ dt, 271
эту формулу можно записать в следующем условной виде: cos<p = Edubti +F {du 6v + Ьи dv) + G dv 6v _ aJe du2 + 2Fdudv + G dv2 ^E bu2 + 2Fbu bv + G bv2 * или, короче, drbr cos <p = - У5г*Убг2# Иногда эту формулу записывают в следующем мнемо* ническом виде: / (dy 6) COS<p = - y/(rf)V/(*r В частности, для косинуса угла между координат*, ными линиями и = const и v = const мы получаем фор*. мулу F COS ф = —,— t— . Следовательно, координатные линии и = const и v =а = const тогда и только тогда ортогональны, когда F = 0. ? Займемся теперь немножко дифференциальным ис« числением. Пусть Wt W\ — два открытых множества простран* ства R2, и пусть C) и = и(ии v{) v^viuuVi) — гладкие функции, задающие диффеоморфизм множе* ства W\ на множество W. Пусть, далее, на W. задана дифференциальная квадратичная форма I = E(u, v)du2 + 2F{u, v)dudv + G(u, v)dv\ Подставляя в форму / вместо и, v функции C), а вместо du и dv их известные из анализа выражения - ди * , ди . ^ А <5у А I в* А dv=s-dTxdu^-d^dv^ 11%
мы получим на W\ некоторую квадратичную форму 1Х = Ех (их, vx) du\ + 2FX (ux, vx) dux dvx + Gx (uv vx) dv\ от дифференциалов du\y dv\. Автоматическое вычислен ние показывает, что коэффициенты этой формы выра« жаются формулами /р.ч р р ди ди _| р( ди dv * ди dv \ . р dv dv W tl~^ dux dot + \dui dvx "*" dvx dux)^U дих dvv> где, конечно, Е — Е(и(йи t>i), о(иь i>i))> F = F{u(uu v{)9 v(u{, vx))9 G — G(u{uu vx)9 v(uu V,)). О форме Ix мы будем говорить, что она индуцирована диффеоморфизмом C) из формы /, а также что диффеоморфизм C) переводит форму / в форму Л. Пусть теперь Lx — произвольная кривая ux = ux{t)\ vi — v\(t) в W\. Тогда в W будет определена кривая* и = и(щ (О, Щ @), v = v{ux @, t>i @), о которой говорят, что она является образом кривой Li при диффеоморфизме C). Основное свойство индуцированной квадратичной формы 1\ выражается следующей леммой: Лемма 1. Для любой кривой L\ в W\ имеет место ра* венство F) $ ^Е du2 + 2F dudv + G dv2 = L = jj *sjEx du\ + 2FX dux dvx + Gx dv\t Li где L —образ кривой L\ при диффеоморфизме C), Обратно, если I = E du2 + 2F dudv + G dv2 и Ix = Ex du2 + 2FX dux dvx + Gx dv2 273
'—такие квадратичные формы на W и W\ соответственно, что для любой кривой L\ в W\ имеет место равенство F), то форма 1\ индуцирована диффеоморфизмом C) из формы /. Доказательство. Первое утверждение непосредственно вытекает из правила замены переменных в определенном интеграле. Для доказательства обратного утверждения мы, выбрав в W\ произвольную точку {uf\ i/i<°>), рассмотрим линию L\ с уравнениями u{ = uM + at, vt=>vW + bt9 где а и Ь — произвольные числа. Тогда для любого (достаточно малого) / будет иметь место тождество t л/Е (t) и' (О2 + 2F (t) и' @ v'(t) + G (/) v' (tJdt =*. о t - J V?i W «l W2 + 2Fi W u'i W v'i'W + G\ W °i №2"•' о где E®—E(u(Q,v№ Edt) = E{{ux{t),vdt))> F{t) = F (u @, о @), Z7! @ = Л'(«I @, fi (/))• О @ = О (и (/), у (/)), Gt (/) »Gi4«i (t), vx @) и «(/) = и(af + a/, if > + Ы), u{(/) = */f¦+ a/, о @ = у (af) + a/, if +' W), t;t (t) = t;<°> + W. Дифференцируя это тождество по t и возводя в квадрат, мы пблучим тождество Е @ и7 (О2 + 2F @ а" @ v' @ + G @ v' (О2 = =?t (о и[ (О2 + 2F1 (о и[ (/) *; (о + ах (о < (О2. Полагая здесь < = 0 и учитывая, что (знаком 0 мы отмечаем производные, вычисленные в точке (ы<0), if*)), мы получим тождество G) ?<%2 + 2Я%6 + G@)&2 = Е^а\ + 2/f a6 + GfЪ2, 274
где (мы полагаем n<» = o(uf», of»), a« = c(iif», »•»)) ?•-?(«». г") (-яг))+ ?<°> = ?, (и<°>, t><°>), Я/» = F, (и<°), if), G^ = Gx(uf\ if>). Но из того, что равенство G) имеет место для произвольных а и Ь9 непосредственно вытекает, что EM = Ef\ F® = Ff\ G<°> = G<°>. Для завершения доказательства остается заметить, что, заменив в этих соотношениях '(uf\ tf) на (uv v\ мы в точности получим соотношения E). П Применим эти аналитические результаты к геометрической ситуации. Пусть (8) r = r(u,v), (и, v)ezW, и (9) гх = г, (щ, vx)9 (щ, v{) е= Wu — две регулярные поверхности в #, а I = E du2 + 2F dudv + G dv2 Ix = ?t rfwj + 2FX dux dvx + G{ dv2 — их первые квадратичные формы, 275
В соответствии с нашей общей установкой, диффео- морфизмом поверхности (9) на поверхность (8) мы будем называть произвольный диффеоморфизм W\ -»• W. Если поверхности (8) и (9) являются инъективными отображениями (что, как мы знаем, всегда верно локально, т. е. при достаточно малых W и Wi), то любой диффеоморфизм A0) и = и (иь v{), v = v (ии v{) поверхности (9) на поверхность (8) будет определять биективное (и взаимно непрерывное) отображение их носителей. Однако без обращения к W и W\ охарактеризовать класс получающихся отображений подмножеств пространства <%, по-видимому, нельзя. Это и является основной причиной, почему приходится поверхности определять как отображения, а не как подмножества. Определение 2. Диффеоморфизм A0) поверхности (9) на поверхность (8) называется изометриейу если из формы / он индуцирует форму /ь Поверхности называются изометричными, если существует хотя бы одна изометрия одной из них на другую. Согласно лемме 1 диффеоморфизм A0) тогда и только тогда является изометриещ когда он сохраняет длины кривых, т. е. для любой кривой L\ на поверхности (9) ее образ L на поверхности (8) имеет ту же длину. ? Представив поверхность выполненной из гибкого, но нерастяжимого материала и произвольно изгибая ее, мы не изменим длин лежащих на ней кривых и, следовательно, получим изометричную поверхность. Основываясь на этом наглядном представлении, основатели теории поверхностей в XIX веке называли изометрии изгибаниями. Эта терминология отчасти сохранилась и до настоящего времени, но ныне обычно изгибания поцк-* мают в более узком смысле — как изометрии, которые можно связать с тождественным преобразованием непрерывным семейством изометрии. Долгое время все математики были уверены, что в локальной ситуации, т. е. в достаточно малой окрестности произвольной точки, любая изометрия является изгибанием в этом смысле. Однако сравнительно недавно профессор МГУ Николай Владимирович Ефимов показал, что это неверно, построив соответствующий контрпример. 276
Подчеркнем, что нетождественный диффеоморфизм A0) вполне может определять тождественное отображение носителей поверхностей (8) и (9). Это будет тогда и только тогда, когда г\{иъ v{) = r(u(uu Vi), v(uu Vi)) для всех точек (щ, й)е^ь т. е. когда диффеоморфизм A0) является эквивалентностью. Таким образом, мы видим, что эквивалентные поверхности диффеоморф* ны. Более того, в этом случае дгх дг ди . дг dv дг\ дг ди . дг dv ди\ ди ди\ ""¦" dv дих * dvx ди dvx * dv dvx ' (здесь и в аналогичных ситуациях в дальнейшем мы разрешим себе, — чтобы не удаляться от сложившихся для числовых функций традиций, — писать числовые множи* тели справа от векторов) и, следовательно, *(*i. *.>-(¦&)'- (И) с» / \ дг\ dri с,/ v ди ди ди dv . ди dv \ , ~ / \ dv dv Это означает (см. формулы E)), что эквивалентность A0) переводит форму / в форму 1и т. е. является изо- метрией. Тем самым доказано, что эквивалентные поверхности изометричны (факт, который можно было бы предугадать, поскольку переход к эквивалентной поверхности влечет лишь перепараметризацию всех кривых на поверхности, что не меняет их длин). ? С наглядно-геометрической точки зрения эквивалентности представляют собой тождественные изометрии. Произведенная выкладка имеет и другое важное применение. Пусть A0) — произвольная изометрия поверхности (9) на поверхность (8), Тогда мы можем 277
ввести в рассмотрение поверхности A2) r*(uv v{) = r(u(uv v{), v(uv v{))> эквивалентную поверхности (9). Коэффициенты Е*(и\, V\), F*(u\, V\), G*{uu v\) первой квадратичной формы поверхности A2) выражаются формулами A1), в которых E\f F\ и G\ заменены на ?*, F* и G*. Но так как A0)—изометрия, то коэффициенты Е\, F\, G\ первой квадратичной формы поверхности (9) выражаются формулами E), идентичными с формулами A1). Следовательно, Е* (иь vi) = Ех (ии vi), F* (иь Vi) = Л (ии vx), Q*(Uu vl) = G1(uu v{) для всех (ии V\)g Wu т. е. первые квадратичные формы поверхностей (9) и A2) совпадают. Таким образом, если две поверхности изометричны, то, перейдя к эквивалентным поверхностям (т. е., попросту говоря, к другим координатам на них), мы получим поверхности с идентичными первыми квадратичными формами. Поскольку обратное утверждение (поверхности, эквивалентные поверхностям с идентичными первыми квадратичными формами, изометричны) очевидным образом справедливо, тем самым доказано следующее предложение: Предложение 1. Две поверхности тогда и только тогда изометричны, когда заменой координат их первые квадратичные формы можно сделать идентичными. D Конечно, этот критерий изометричности совсем неэффективен (как догадаться, что одну квадратичную форму можно некоторым диффеоморфизмом перевести в другую?). Поэтому наша ближайшая цель будет состоять в его эффективизации. Мы займемся этим в следующей лекции, а пока рассмотрим ряд примеров на вычисление первой квадратичной формы поверхностей. Пример 1. Плоскость Оху в координатах и = х и v = у имеет параметрическое уравнение г = их + v]. Поэтому ru = *, rv = ]\ и, значит, ?=1, ^ = 0, G=l, т. е. для плоскости A3) I = du2 + dv2. (Результат, который легко предугадать без всяких вычислений.) 278
Пример 2. Для кругового цилиндра г = R cos и • i + R sin и • / + и • к мы имеем ru=— R sin и • *+# cos и • / и rv = k. Поэтому E = r\ = R\ F = rurv = Q, G = r2 = l, т, е. для цилиндра I = R2du2 + dv2. Вводя новую координату и\ = Ru (и обозначая ил снова через и), мы преобразуем эту форму к виду A3). Следовательно, цилиндр изометричен плоскости. Наглядно, этот факт очевиден: чтобы изогнуть цилиндр на плоскость (точнее, на часть плоскости), достаточно разрезать его по образующей. Пример 3. Для поверхности вращения г = х (v) cos и • i + x (v) sin и • / + z (v) k мы имеем ru = — x (v) sin и • i + x (v) cos и • /, *"t> = x'(v) cosu- i + x'(v) sin и • / + a/(a)ft. Следовательно, ? = x (vJ sin2 a + x (vJ cos2 a = x (vJ> F = —- x (v) sin m • *' (y) cos u + x {v) cos и • x' (v) sin и = О, G = x' (vJ cos2 u + x' (vJ sin2 u + zr (vJ = л:' (иJ + z' (v)\ так что для поверхности вращения / = х @J ^2 + (*' (t;J + zr {vJ) dv2. Наглядно очевидно, что меридианы и параллели любой поверхности вращения ортогональны. Поэтому равенство F = О мы могли бы предугадать и без вычислений. В случае, когда профиль л; = л:(и), z = z(v) поверхности вращения отнесен к натуральному параметру v = s (и потому х'(vJ + z'(vJ = 1), форма / приобретает особенно простой вид: I = x(vJdu2 + dv2. В частности, мы получаем, что первая квадратичная форма сферы (радиуса 1) имеет вид A4) 1 = cos2 vdu2 + dv\ 279
Опыт картографов показывает, что никакую, даже малую, часть сферы нельзя изогнуть на плоскость. Это означает, что никаким преобразованием координат форму A4) нельзя превратить в форму A3). Но как это доказать? Ответ мы дадим на последней лекции. Пример 4. Линия провеса тяжелой однородной нити называется цепной линией, а поверхность вращения, профилем которой служит цепная линия, — катеноидом. В механике (статике) показывается, что цепная линия является графиком гиперболического косинуса. Та- Катеноид. Геликоид. ким образом, для катеноида x(u)=chu, z(v)=v и, значит, x(vJ = ch2v и x'(vJ + z'(vJ = $h2v+l=ch2v. Таким образом, для катеноида A5) / = ch2 v(du2 + dv2). Пример 5. Пусть прямая, перпендикулярная оси Oz, равномерно вращается около нее, оставаясь ей перпендикулярной и одновременно поднимаясь винтовым движением (на высоту, пропорциональную углу поворота). Линейчатая поверхность, заметаемая этой прямой, называется геликоидом. Она имеет вид винтового пандуса для въезда автомашин. Если v — параметр на прямой, а и — угол поворота, то геликоид будет иметь уравнение г = v cos и • i + v sin и • / + uk. 280
Поэтому ru = >— v sin и • i + v cos и • / + k, rv — coswi+ sin a • /, и, значит, ?=l + t>2, F = 0, 0=1. Таким образом, для геликоида I = {l+v2)du2 + dv2> Преобразуем эту форму, введя новые координате и*. Уь связанные с координатами и, v формулами и =щ, a==sht>1. Тогда du = duu dv = ch v{ dvu и потому (мы опускаем индексы у новых координат) I = ctfv(du2+dv% что совпадает с формой A5). Этим доказано, что катеноид и геликоид изометричны (конечно, только локально), причем существует изомет- рия, переводящая меридианы катеноида в прямолинейные образующие геликоида. Удивительный результат! Пример 6. Для произвольной линейчатой поверх* ности A6) r = p{u) + va(u)9 где (см. предыдущую лекцию) р = р(и)~— регулярная кривая, отнесенная к натуральному параметру, а а {и) — такая вектор-функция, что |а(«)|=1 для всех и, мы, обозначая дифференцирование по и точкой, будем иметь Гц = Р + va, rv = a. Так как р2=1, а aa = 0 и а2==1, то Е = 1 + 2vpa + v2a\ F = pa, G=l. Если, в частности, a==p (поверхность касательных), то pa = a2=l (т.е. F=l), а ра = 0 и a2 = k2, где JO MA M. Постников, семестр II 281
k —кривизна кривой р = р (и) (т. е. Е.— A.+ k2v2)). Таким образом, для поверхности касательных A7) / = A + k2v2) du2 + 2dudv + dv2. Если же а (и) есть вектор бинормали кривой р«р(и), то ра = 0, ра*=0 и а2 = х2, где х —кручение кривой р = р(а). Следовательно, для поверхности бинормалей I^(\+n2v2)du2 + dv2. . Мы видим, таким образом, что первая квадратичная форма поверхности касательных зависит только от кривизны данной кривой, а первая квадратичная форма поверхности бинормалей —только от ее кручения. В отношении поверхности касательных отсюда вытекает, что каждая поверхность касательных изометрична плоскости (локально). Действительно, рассмотрим плоскую кривую с той же самой кривизной k = k(u) (такая кривая существует в силу общей теоремы 1 лекции 24), Первая квадратичная форма поверхности касательных этой кривой будет той же формой A7). Но, с другой стороны, ясно, что поверхность касательных плоской кривой является (локально) плоскостью. Поэтому существует замена координат, переводящая первую квадратичную форму dx2 + dy2 плоскости в форму A7). (Эта замена координат имеет вид х = х(и) + х (u)v, y-=y(u) + y'(u)v, где х(и) и и (и) — такие функции, что х'(иJ + у'(иJ s?± I Kx"{uJ+'y"(uJ = k(u)*) О '""^ Эту изометрию можцю осуществить непрерывным из* гибанием, постепенно деформируя кривую р = р(а) в плоскую кривую. На этом основании поверхности касательных назы- ваются развертывающимися поверхностями (подразумевается — на плоскость). В случае, когда а(и) = р(и), поверхность A6) является конусом с вершиной в начале координат (а кривая р= q(u) представляет собой его пересечение с единичной сферой |р| = 1). В этом случае имеют место равенства ра = р2=1, а2=1, ра = 0, 282
так что форма / приобретает вид I = (l + vJdu2 + dv2. Здесь напрашивается замена координат (и, v)*-& н->(а, 1 + v), переводящая эту форму в чуть более про* стую форму A8) I^tfdut + dv2. Введем теперь новые координаты х = v cos и, у = v sin и. Тогда dx = — v sin и du + cos и dv, dy = v cos и du + sin и dv, и потому dx2+dy2 = v2du2 + dv2. Этим доказано, что любой конус изометричен плоскости. По этой причине конусы также причисляются к развертывающимся поверхностям. Заметим, что форма A8) есть не что иное, как первая квадратичная форма плоскости, отнесенной к полярным координатам г = v и <р = и. Наконец, если вектор а(и) постоянен (и потому а = 0), то поверхность A6) является цилиндром. Без ограничения общности можно считать, что его направляющая р = р(и) является плоской кривой, плоскость которой ортогональна вектору а (и, значит, ра = 0 и ра = 0). Поэтому, как и для кругового цилиндра (пример 2), I = du2 + dv\ На этом основании к развертывающимся поверхностям причисляются также и все цилиндры. В следующей лекции мы покажем, что среди линейчатых поверхностей только развертывающиеся поверхности (т. е. цилиндры, конусы и поверхности касательных) изометричны плоскости. Более того, оказывается, что развертывающиеся поверхности исчерпывают вообще все поверхности, изометричные плоскости. Мы этот факт оставим без доказательства. 10*
Лекция 26 КАСАТЕЛЬНЫЕ ВЕКТОРЫ. — ПЕРВАЯ КВАДРАТИЧНАЯ ФОРМА КАК МЕТРИЧЕСКАЯ ФОРМА ЛИНЕАЛА КАСАТЕЛЬНЫХ ВЕКТОРОВ. — КАСАТЕЛЬНАЯ ПЛОСКОСТЬ И ВЕКТОР НОРМАЛИ. — КРИВИЗНА НОРМАЛЬНОГО СЕЧЕНИЯ. — ВТОРАЯ КВАДРАТИЧНАЯ ФОРМА ПОВЕРХНОСТИ. — ИНДИКАТРИСА ДЮПЕНА. — ГЛАВНЫЕ КРИВИЗНЫ. — ВТОРАЯ КВАДРАТИЧНАЯ ФОРМА ГРАФИКА.— ЛИНЕЙЧАТЫЕ ПОВЕРХНОСТИ НУЛЕВОЙ КРИВИЗНЫ. — ПОВЕРХНОСТИ ВРАЩЕНИЯ. По аналогии с определением 5 лекции 22 касательным вектором (к) поверхности A) r = r(u,v) в точке (ио, vo) называется касательный вектор некого-* рой кривой и = u(t), v = v(t) на поверхности, проходя* щей через точку (но, ^о). Поскольку поверхность локально является графиком гладкой функции, это определение фактически совпадает с определением 5 лекции 22 (т. е. дает те же самые векторы). Поэтому, согласно предложению 1 лекции 23, совокупность всех касательных векторов поверхности в данной точке («о, Vq) является двумерным линеалом. Впрочем, этот факт легко доказывается и непосредственно. Действительно, любая кривая на поверхности A), проходящая при f = tQ через точку (wq, vq), задается как кривая в & вектор-функцией вида r(t) = r (и (/), v (/)), где и (t0) = щ, v (t0) = i>0. Поэтому r'(to) = (ru)Qti'(to) + (rv)Qv'{t0). 284
Таким образом, любой касательный вектор в точке (щ, vq) является линейной комбинацией (по условию — неколлинеарных) векторов (ru)Q я (г^H. Обратно, если с = а(г«H + Ь(г0)о, где а и Ъ — произвольные числа, то c = r'(t0)t где r{t) — r(tiQ + att v0 + bt). Этим все доказано, поскольку векторы вида с составляют двумерный линеал. ? Обозначая (u0,v0) через (н, v)y мы получаем, кроме того, что векторы r„, rv составляют базис линеала касательных векторов поверхности A) в точке (a, v). О По заимствованной из анализа традиции координаты касательных векторов в базисе ru, rv обозначаются символами duy dv, а вектор с этими координатами — символом dr. Таким образом, dr = rudu + rvdv, точь-в-точь как для числовых функций. В этих обозначениях символ dr2 для первой квадратичной формы / приобретает содержательный смысл (а не просто является выразительным и удобным обозначением) и сама эта форма оказывается не чем иным, как метрической формой линеала касательных векторов в базисе ги, г*. Поэтому, в частности, для любой точки (u,v)^ W форма I положительно определена. ? Символ ds оказывается при этом обозначении длиной \dr\ вектора dr. При замене щ = щ(и9 v)\ v\ = v\(u, v) координат на поверхности (т. е. при переходе к эквивалентной поверхности линеал касательных векторов не меняется, но в нем возникает новый базис #УГ, rv\y связанный с базисом rUi rv формулами . и полученные в предыдущей лекции формулы преобра* зования формы / оказываются не чем иным, как знакомыми нам формулами преобразования метрической формы при изменении базиса, {При этом Е — gn, F_ = g\% H0=.g22.). 285
Тот факт, что первая квадратичная форма поверхности является не чем иным, как метрической формой линеала касательных векторов в базисе rM, rv послужит нам в следующем году основой далеко идущих обобщений. Плоскость пространства S, проходящая через точку с радиус-вектором г (и, v) и имеющая направляющий бивектор ги Л rv, называется (ср. с определением 6 лекции 22) касательной плоскостью (к) поверхности A) в точке (и, v). Она имеет уравнение X - х (и, v) хи (и, v) Y - у (и, v) У и (". *>) Уь (", *>) Z — г («, v) zu (и, v) zv (и, v) = 0. Пусть пространство & ориентировано. Тогда для любой точки (u,v) поверхности определен единичный вектор п = n(ufv)f перпендикулярный касательной плоскости и составляющий вместе с векторами ги и rv положительно ориентированный базис B) гш rv, n пространства & (точнее, его ассоциированного линеала У). Этот вектор называется вектором нормали к поверхности A) в точке (u,v). Базис B) называется сопровождающим базисом поверхности в точке (u, v). Подчеркнем, что, вообще говоря, сопровождающий базис не ортонормирован. Вектор п коллинеарен, конечно, вектору ги X г*. Следовательно, я = \ruXrv\ 286
Лемма 1. Для любых двух векторов а, Ь евклидова трехмерного ориентированного линеала Т. имеет место равенство i«x»Hisi. Доказательство. Пусть i, /, k — такой положительно ориентированный ортонормированный базис линеала Т, что a = ai, b = b'i + bl. Тогда а X b = abk и а2 = а\ ab = ab', Ь2 = Ь'2 + Ь2. Поэтому \а Х^|2 = a2b2 и Замечание. В любом евклидовом пространстве можно развить теорию объемов вполне аналогично элементарной теории площадей и объемов в трехмерном пространстве. Тогда лемма 1 окажется частным случаем общего предложения, утверждающего, что для любых векторов аи ..., ат произвольного евклидова линеала Т квадрат m-мерного объема параллелепипеда, по- строенного на этих векторах, равен определителю I а\ аха2 ... ахат\ а2а{ а\ ... а2ат \ата\ ата2 ••• ali I Этот определитель называется определителем Грама векторов аи ..., ат. Он равен нулю тогда и только тогда, когда эти векторы линейно зависимы. Если т = ==dimy и векторы а\, ..., ат линейно независимы (составляют базис), элементы определителя Грама являются не чем иным, как метрическими коэффициентами этого базиса. в2 аЬ\ 287
Применив лемму 1 к векторам ги и rVi мы немедленно получим, что \ruXrv\2 = и, значит, что ru rurv\ Е F F 6 = EG-F\ п = ruXrv aJeg - я По этой формуле вектор п обычно и вычисляется* Пусть *о — произвольный единичный вектор, являющийся касательным вектором поверхности A) в точке (ыо, Vo). Рассмотрим плоскость, проходящую через точку с радиус-вектором r(u0fvo) и имеющую направляющий бивектор ^о^\;л0, где п0 = п(и0, у,о). Наглядно очевидно, что эта плоскость пересекает поверхность по некоторой кривой, имеющей в точке (uq, vo) касательный вектор U (и, следовательно, регулярный). Эта кривая называется нормальным сечением поверхности A), определенным касательным вектором to. Пусть прямоугольные ко* ординаты ху у> г в пространстве <S выбраны так, что поверхность A) в окрестности точки (u0l vo) является графиком гладкой функции г = z{xfy), причем вектор По является координатным ортом k. Тогда, если *о = — ai + bj, то нормальное сечение, определенное вектором to, будет (как кривая на поверхности) иметь, очевидно, уравнения и = и0 + at% v = vQ+bt (в пространстве эта кривая имеет уравнения х я «о+ ottt У = v0 + bt9 z = z(u0 + atf vo+bt)). Это не только доставляет нам способ писать уравнения нормального сечения, но и позволяет дать его формальное определение (не опирающееся на наглядность), 288 Нормальное сечение.
как кривой на поверхности, имеющей уравнения и =» = wo+a/, v = Vo + bt (при условии, конечно, что поверхность A) представлена как график гладкой функции z = z(х, у)) 4 ¦ Здесь, разумеется, требуется проверить корректность этого определения, и это в принципе нетрудно. Однако мы этим заниматься не будем, поскольку понятие нормального сечения будет играть у нас лишь вспомогательную, в основном эвристическую, роль. Пусть u = u(s), v = v{s)—уравнения (на поверхности) нормального сечения поверхности A) в точке ,(ыо, Уо), определенного касательным вектором t0. Предположим, что s — натуральный параметр пространственной кривой r — r(s), где r(s) = r(u(s), v(s))9 причем и@) = щ, v(Q)=v0. Тогда для касательного вектора t = t'(s)t нормального сечения будет иметь место равенство t = r — rji 4- rvv, причем *@) = *о- Следовательно, i = гий + гий + r0v + rvv = = (гиий + ruvv) й + (rvuu + rvvv) v + ruu + rvv = = ruu (uJ + 2ruv (uv) + rvv (vJ + ruu + rvv. Полагая здесь s = 0 и умножая на я0> мы получим, что C) /@)п0 = ((ги„)оПо)й@J + + 2 ((ruv)Q по) й @) v @) + ((rvvH no) v (ОJ, ибо (г„Hл0 = 0 и (^^ = 0, Заметим теперь, что, по определению, нормальное сечение является плоской кривой. В ее плоскости век* торы to, По определяют некоторую ориентацию, и по отношению к этой ориентации нормальное сечение в каждой своей точке будет иметь относительную кривизну. Лотн (см. лекцию 22). В точке s = 0 эта кривизна равна, очевидно, только что вычисленному скалярному произведению *@)ло и потому выражается формулой C). Для упрощения формул опустим теперь всюду индекс нуль, т. е. вектор t0 обозначим через tf, точку (и<>, *>о) — через (и, v) и т. д. Относительную кривизну (в точке 5 = 0) нормального сечения в точке (а, и), определенного вектором t, мы обозначим через k(t): Кроме того, 289
мы положим L = гиип — —- гипа, D) M = ruvn = — runv = — rvnut N = rvvn = — rvttv (так как гмл = 0, то гиип + гипи — 0 и гиол + гил0 = 0, а так как гоя==0, то rDIIii + rvnu = 0 и rot>n + ro«o=0). В этих обозначениях формула C) примет вид E) k(t) = Lu2 + 2Muv + Nv\ где и и й-координаты вектора t в базисе rU9 rv: t = ruu + rvv. Формулу E) мы можем теперь принять за формальное определение функции fi_~>?(*)> a все сказанное выше рассматривать лишь как его неформальную мотивировку. Построенную теперь функцию t*—>k(t) удобно распространить на всевозможные отличные от нуля касательные векторы dr = rudu + rvdv, считая, по определению, что (напомним, что ds = \dr\; см. выше). Так как координа- dr • du dv тами единичного вектора -jj являются числа -^- и -gj-, то, согласно формуле E), *«г)-1(а)'+1м?-?+«ч4)'- _ L du2 + 2М dudv + N dv2 ~ ds2 Поскольку ds2 = E du2 + 2F dudv + G dv2, мы, следовательно, получаем, что (~ , ,, v _ L rf«2 + Ш du dv + N do2 W Л ^Г' — ? dw2 + 2F d« dv + G dv2 ' Определение 1. Квадратичная форма Ldu2 + 2Mdudv + Ndv2 называется второй квадратичной формой поверхности О). Обозначается она символом //. 290
Вводя вектор G) dn — nudu + nvdv, форму // можно (в силу формул D)) отождествить со скалярным произведением—dr dn. Формулу F) мы можем теперь записать в следую* щем удобном для запоминания виде: или, воспользовавшись вектором G), в виде dr dn * = dr2 В литературе для обозначения коэффициентов L,М, N формы // используются также символы Z), D', D". Для наглядного представления функции tt~>k(t) французский математик Дюпен предложил рассматривать на касательной плоскости кривую (она называется ныне индикатрисой Дюпена), которая получается, если для любого единичного вектора t отложить от точки касания (принимаемой за начало координат О на касательной плоскости) в направлении этого вектора отрезок длины \k{t)\-xi\ Обозначим через х и у координаты (в координатной системе Orurv) концевой точки этого отрезка; тогда его длина выражается (в понятных обозначениях) формулой \xru + yrv\ = V/(*> У) • Поскольку кривизна k(t) выражается формулой F), которая в теперешних обозначениях имеет вид k(t\= /7<*'У> *W— I(Xty) . мы получаем для индикатрисы Дюпена уравнение т. е. уравнение \П(х,у)\=1. Этим доказано, что индикатриса Дюпена является 291
кривой с уравнением \Lx2 + 2Mxy + Ny2\=l. При LN — М2 > О эта кривая (точнее, множество ее вещественных точек, которым мы только и интересуемся) представляет собой эллипс с уравнением (8) Lx2 + 2Mxy + Ny2 = e, где е = +1» если L > 0, и е = —1, если L < 0. В соот* ветствии с этим точка поверхности A), в которой LN — М2 > 0, называется эллиптической. В эллиптической точке все кривизны k(t) имеют один и тот же знак (совпадающий со знаком L). Среди них есть одна наибольшая k\ и одна наименьшая &2 (если только все они не совпадают, т. е. если индикатриса Дюпена не является окружностью), отвечающие направлениям малой и большой осей эллипса (8). ? щцпшчестй ? гипйрЦ^чШЬа В шрадоличеснод Ш&чке гпо^не точке Индикатриса Дюпена. При LN — М2 < 0 индикатриса Дюпена состоит из двух гипербол (9) Lx2 + 2Mxy + Ntf=±l с общими асимптотами, и потому точка поверхности A), в которой LN — М2 < 0, называется гиперболической. В направлении действительной оси одной из гипербол (J9) кривизна k(t) достигает своего наибольшего значения k\ > 0. При вращении вектора / она сначала уменьшается до нуля, когда вектор t приобретает асимптотик ческое направление, а затем по-прежнему уменьшаясь, достигает своего наименьшего значения &2 < 0, когда направление вектора t совпадает с направлением действительной оси другой гиперболы (т. е. с направлением мнимой оси первой гиперболы). При LN — М2 = 0 точка поверхности A) называется параболической, В такой точке индикатриса Дюпена 292
имеет уравнение A0) W\T\x + ^\W\yf=l и потому представляет собой пару параллельных пря* мых (если только ЬФО или #=й=0). В направлении этих прямых кривизна k(t) равна нулю, в перпендикулярном направлении достигает наибольшего (по абсолютной) величине значения, сохраняя все время один и тот же знак. Если же L = 0, N = 0 (и потому М = 0), то кривизна k(t) тождественно по t равна нулю (а индикатриса Дюпена не определена). Заметим, что в эллиптических и параболических точках индикатриса Дюпена является кривой второго порядка, а в гиперболических точках — четвертого порядка. В каждом из трех случаев функция k(t) дважды достигает своего наибольшего значения k\ и наименьшего значения А2 (если только она не равна тождественно нулю). Определение 2. Числа k\ и fe называются главными кривизнами поверхности A) в рассматриваемой точке. Их произведение К — k\k2 называется полной (или гауссовой) кривизной, а их полусумма # = —5— — средней кривизной. Согласно сказанному выше в эллиптической точке /С> 0, в гиперболической точке К < 0 и в параболической точке К = 0. Чтобы найти главные кривизны, можно было бы искать главные направления кривых второго порядка (8) и (9) (для кривой A0) проблемы нет) и затем найти их канонические уравнения. К сожалению, этот путь приводит к длинным выкладкам из-за того, что координаты х и у не прямоугольны. Поэтому мы поступим по-иному, обратившись непосредственно к основной формуле F). Согласно этой формуле кривизна &я является наименьшим значением функции II (*, Щ _ Lx* + 2Мху + Ny2 l{xty) Ex2 + 2Fxy + Gy2 293
двух переменных л; и у при (хгу)Ф@;0)9 Поэтому II(*» у) -^ * для всех (лг, у) Ф (О,0), причем хотя бы в одной точке (х, у) равенство достигается. Поскольку 1(х, у)>0 при {х, у) ф @,0), это неравенство равносильно неравенству II(xf y)-k2I(x, у)>0, означающему, что квадратичная форма Il — krf с матрицей ( L — k2E М — k2F\ \M-k2F N-ktG) во всех точках (х, у)Ф @,0) неотрицательна и хотя бы в одной из этих точек равна нулю. Аналогичным образом, число k\ характеризуется тем, что квадратичная форма // — k\I всюду неположительна и хотя бы в одной точке (х, у) Ф @,0) равна нулю. Но легко видеть (непосредственно или на основе общей теории квадратичных форм над полем R; см. лекцию 12), что квадратичная форма от двух переменных тогда и только тогда всюду неположительна или неотрицательна и хотя бы в одной точке (х, у) Ф @,0) равна нулю, когда ее ранг меньше двух, т. е. когда определитель ее матрицы равен нулю. ? Этим доказано, что главные кривизны ku &2 являются корнями уравнения \L-kE М - kF I _ 0 I М - kF N — kG J — U' г. е. уравнения (EG - Я) k2 - (EN + GL - 2FM) k + (LN - M*) = 0. В частности, отсюда (в силу формул Вьета) следует, что Д ~ EG — Я • 2 EG — F2 Первая из этих формул получит важное применение в следующей лекции. Предположим, что координаты x,yyz в пространстве S выбраны так, что рассматриваемая поверхность яв« 294
ляется графиком функции г = z(x, у)у причем 2@,0) = 0 и вектором нормали в точке @,0) является единичный вектор к оси Oz. Как легко видеть, последнее предположение равносильно тому, что (~р-) =0 и (-gp-J = 0» Следовательно, разложение функции z(xyy) в ряд Тейлора начинается с членов второй степени: z=*rx2 + 2sxy + iy2 + ..,, где Так как в этом случае г = ai + vf-\-z{u> v)k, то ги = Следовательно, в точке @, 0) будут иметь место равенства L = r, M = s, # = /, т. е. в рассматриваемом случае вторая квадратичная форма совпадает с суммой *Ax>y) членов второй степени в ряде Тейлора функции г(хуу). U Поскольку вблизи точки @,0) поверхность г = = г(#, у) мало отличается от поверхности г = г2(*, у) и поскольку при rt— s2 > 0 последняя поверхность является эллиптическим параболоидом, а при rt— s2 < 0 — гиперболическим параболоидом, тем самым доказано, что вблизи эллиптической точки произвольная поверхность мало отличается от эллиптического параболоида, а вблизи гиперболической точки — от гиперболического параболоида. ? Это дает вполне удовлетворительное представление о поведении поверхности вблизи непараболических точек. Об устройстве поверхности вблизи параболической точки ничего определенного сказать нельзя; вообще говоря, оно может быть очень сложным. Для линейчатой поверхности (И) r = p(u) + va(u), как мы уже знаем, E=l + 2vpa + v2a2, F = pa, G=l (как всегда, мы предполагаем, что параметр и на кривой 295
Ф = р(и) натурален, а вектор «(и), единичен), Далее^ ra = P + va, rv = a, ruXrv = QXa+v(aX*), r |__ (p + oa)(pXfl + p(flXa)) ^ _ Pflg N = 0 aJE(F^7* ' ^EG - Я ' zjv-m2=—^^ и потому к — L. fr**>2 <r n Таким образом, полная кривизна произвольной линейна* той поверхности неположительна, г. е. линейчатая по* верхность не имеет эллиптических точек. О В случае, когда поверхность является цилиндром '(а = 0), конусом (а = р, и потому а = р) или поверхностью касательных (а = р), из полученной формулы следует, что К = 0. Таким образом, полная кривизна каждой развертывающейся поверхности равна нулю. Обратно, если К = 0, то раа = 0, т. е. векторы р, а, а компланарны. Если вектор а(и) не равен тождественно нулю, т. е. если поверхность A1) не является цилиндром, то — перейдя, если нужно, к меньшей окрестности — мы можем считать, что а(и)Ф0 для всех и. Поэтому век* торы а я а линейно независимы (они отличны от нуля и ортогональны), и, следовательно, вектор р через них линейно выражается: р = Ка + \ха> где Х = Х(и), \i=\i(u)—некоторые функции от и. Пусть щ = и, vx = v + \i(u). Поскольку якобиан этого преобразования равен 1, числа и\ и v\ также являются — после, возможно, перехода к меньшей окрестности — координатами на поверхности 296
(И), т.-е., точнее, определяют эквивалентную поверхность. Уравнение этой поверхности имеет вид '" = Pi(^i) + t»1a(tt1), где Pi(u) = p(u) — |i(a)a(«), и потому Pi = р — \ia — \ла *= (к — ji) a. Если pi = 0 тождественно (т. е. X = |л), то уравнение поверхности A1) имеет вид г = const + v{a(Ui)9 и потому эта поверхность будет конусом. В противном случае мы можем считать, — опять уменьшая, если нужно, окрестность, — что pi{u)^0 для всех и. Переходя тогда к натуральному параметру (и меняя, если нужно, знак у v\)y мы получим, что pi = а, т. е. что рассматриваемая поверхность является поверхностью касательных. Тем самым доказано следующее предложение: Предложение 1. Линейчатая поверхность тогда и только тогда имеет нулевую полную кривизну: К = 0, когда она является развертывающейся поверхностью. ? Одновременно мы установили, что развертывающиеся поверхности характеризуются условием раа = О, которое, как легко видеть, равносильно коллинеарности векторов р X л и a X а. Но коллинеарность этих векторов равносильна тому, что вектор ruXrv = QXa+v{aXa) с точностью до пропорциональности не зависит от v, т. е. не зависит от v соответствующий единичный вектор п. Этим доказано, что развертывающиеся поверхности выделяются среди всех линейчатых поверхностей тем свойством, что во всех точках каждой прямолинейной 297
образующей такой поверхности касательная плоскость, одна и та же. П Развертывающаяся поверхность касательных. Для произвольной поверхности вращения г = х (v) cos и • i + x (v) sin и • / + z (v) k мы имеем ru =¦» — x (v) sin и • i + * (t>) cos « • /, r0 «я x' (v) cos и • t + *' (i>) sin u< j + z' (v) ft и, значит, E =** x(vJ, F «=0, G = l (мы предполагаем, что x'(vJ + 2'(uJ «в 1; см. лекцию 25). Поэтому r«Xr0 = = х (t>) z' (у) cos а • i + лс (t>) г' (у) sin и • / — х (v) x' (v)k, n = zr (v) cos и • * + г' (у) sin и* j — xf (v) ft; rMM = — * (и) cos и • i — л: (о) sin и • /, гй0 = — x' (о) sin u*i + x' (v) cos и • /, г™ — *" (w) cos а • i + *" (v) sin и • / + г'7 (о) ft; L = ruun = — x(v) z' (v), M = ruvn = 0, N = xriv)S(v)-2r(v)xr(v) = -\*W z^[ LN-M2 _ z' (v) | x' (v) z'{v) EG-F* ~ x (v) I x" (v) z" (v) 298
Этим доказано, что для поверхности вращения А~ ifc) |*"(cf) *" (О) Г Пример 1. Для сферы радиуса R мы имеем jc (v) = /?¦ cos -jp 2 (о) = /? sin -jp и потому x(v) = — sm-g\ z (tO = cos-?-, х ~rcost* ^(») =—xSln^f• Л — х (v) I *" (о) г" (о) I — R2 " Таким образом, полная кривизна сферы радиуса R постоянна и равна -^7 • ? Результат наглядно очевиден. Псевдосфера. Следующий пример более интересен. Пример 2. Поверхность вращения с профилем х (v) = R sin v, z (v) = R (in tg i + cos v) , 0 < у < -J (это — так называемая трактриса) называется псевдо* 299
сферой. Для этой поверхности х'(v) = Rcos v, z'(v) = -?--R sin v = R-C0S*v sin v sin v и, значит, x'(vJ + z'(vJ = R2ctg>v. Так как x'(uJ + 2'(i;J# 1, то полученная выше общая формула непосредственно непригодна и необходимо предварительно перейти к натуральному параметру профиля. Имеем V s = —• R \ ctg v dv = — R In sin v 2 и, значит, - — / -2 — sin v=e H, cos n = A/ i — p *. 5D = Vl Таким образом, в натуральном параметре (который мы снова обозначим через v) трактриса будет задаваться функциями x(v) = Re *, z(v) = R\n\e«-/\/e«- l) + *V* 2" 1 ~ е " * Вычисляем: x'(v) = -e-Jk, z'@) = -Vl-e^, «L ."Т x"{v) = ~e~^, z"(f) = О I*'(о) z'(»)| *" z'(v) \x'(v) z'(v)\ 1_ *(») I x« (v) 2"{v)\~ R2' 300
Таким образом, так что полная кривизна псевдосферы постоянна и рае* н<* —ЦТ- П Мы видим, что в отношении полной кривизны псевдосфера отличается от сферы только знаком кривизны. Этим и объясняется термин «псевдосфера»* Пример 3. Для катеноида х (v) = ch v, z(v) = v, х' (v) = shv, z'(v)=lt x'(vJ + z'(vJ = ch2v, и потому мы опять должны перейти к натуральному параметру s = \ ch v dv = sh v. Обозначая этот параметр снова через vy мы получим функции x{v) = ^\ + v\ z{v) = \n{v + ^/T+!F). Поэтому A + v2)°h * ' A + v*)'1' \x'(v) z'(v)\ 1__ I x" (о) z" (о) | 1 + e2 ' и, значит, Интересно сравнить кривизну катеноида с кривизной изометричного ему геликоида. Для геликоида мы имеем уравнение A1) с р {и) = uk, а («) = cos и; i + sin и • /• 301
Поэтому р = ft, a = — sin и • i + cos и • /, ?= 1 + 2vpd + v2a2= 1 + i>2, /•==ра = 0, G=l, ?G-f2=H:i>2, раа = о oi cos« sin и 1 — sin и cos а О = 1, и, значит, /С = 1 A + и2J • Мы получили тот же самый результат, что и для катеноида! Это означает, что при изгибании катеноида на геликоид полные кривизны в соответственных точках совпадают. О Что происходит со средней кривизной? Для катеноида E=l + v2, F = 0, G = 1. Кроме того, r_ \X'{V) 2'(f)|_, 1 N* и потому т. е. \x"(v) z"(v)\~ 1 + w2 EN + GL-2FM = 0, # = 0. Таким образом, средняя кривизна катеноида равна нулю. D Для геликоида же • # р X 0 = sin и • i — cos и • /, а X л = — ft, р = 0, а = —- cos и • i — sin и • /, (р+аа)(рХа + 1>(аХа)) = 0 и, кроме того, как мы уже видели, ?=l + i>2, т? = о, G=l, ?G-F2=l + y2, paa=l. 302
Поэтому ?-0,- М= /г4-г* ^°' и, значит, EN + LG-2FM = Q, т. е, # = 0. Таким образом, средняя кривизна геликоида также равна нулю. ? Пример катеноида и геликоида наводит на мысль, что при изгибании (изометрии) сохраняются полные и средние кривизны. Оказывается, что в отношении полной кривизны эта гипотеза справедлива (и мы покажем это в следующей лекции), тогда как в отношении средней кривизны она ложна. Действительно, для плоскости средняя кривизна равна нулю, а для изгибающегося на плоскость кругового цилиндра радиуса R она, равна, очевидно, -щ. Причины же того, почему у катеноида и геликоида оказались равные средние кривизны, очень глубоки и интересны, но мы лишены возможности их здесь обсуждать.
Лекция 27 ДЕРИВАЦИОННЫЕ ФОРМУЛЫ ВЕЙНГАРТЕНА, - КОЭФФИЦИЕНТЫ СВЯЗНОСТИ.— ТЕОРЕМА ГАУССА.— НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ ИЗО- МЕТРИЧНОСТИ, Для сопровождающего базиса ru, rv, n произвольной по« верхности A) r = r(u, v) могут быть написаны формулы, аналогичные формулам Френе для кривых. Эти формулы дают разложение производных Тип* fuv> Tvv> ^ш Я"о векторов сопровождающего базиса по этому же базису. Поскольку п2 = 1 и, следовательно, ппи = 0 и nnv = О, векторы пи и nv разлагаются только по векторам ги и rv> так что nv = alru + $lrv. Умножая первую из этих формул на ги и rVi мы получим два соотношения: — L = гипи = аг2и + рг„г0 = аЕ + pF, -M = rvnu = arurv + $rl = aF + №9 из которых следует, что FM — GL д _ FL — EM Аналогично вычисляются коэффициенты и второй фор* мулы; _FN—_GM ft _ FM — EN а1— ?G — Я ¦ Р1 — EG — FZ * 304
Далее, так как согласно определению ruun = Lt ruvn = M, rvvn = N и так как по условию rutt = 0, rva = 0, то коэффициенты при п в разложениях векторов rUU9 ruvy rvv по базису rU7 ?v> п равны соответственно L, М, N. Таким образом, мы имеем rvv = n2ru + Tl2rv + Nn, _ FM-GL . FL—EM Ми— ?Q рг ?и i EG — F2 ^v* __ FN-GM . FM-Ett Ло ?q pz *"« i ?Q mmmpz fv> B) где Г?/, /, /, &=1,2, — некоторые функции от и и а* Эти функции раньше обозначались символами ш и назывались скобками Кристоффелж Теперь же их обычно называют коэффициентами евяэп&сти. Формулы B) называются деривационными формулами Вейнгартена. Для вычисления коэффициентов связности Г*| мы в первую очередь найдем шесть произведений векторов ruc, rUvy rvv на векторы га и г». Так как г2и = Е, то 2гииги=Еи и 2ruvru = Ev, т.е. —Lf — Lf Аналогично, так как rl = G9 то fuvfv === "J" ^*и И ^vv^v ==* "rj" ^о • Кроме того» так как rur9 = Fr то rtajrv-\rruruu = Fu и *V»'V + ',«*W = ^i;> откуда следует, что ГиигУ:== *и 2" ° ** ГьуГи== * v """ *2i ^«* ЭОЗ
Умножая теперь первые три формулы B) на ги и rV9 мы получим шесть соотношений: Г ?r!i + /T?! { rt + or?! (//тЬ + ог?, ( FY& + СГ22 из которых легко находятся коэффициенты Г?/. (Уравнения однозначно разрешимы, поскольку определитель EG — F2 каждой пары уравнений отличен от нуля.) Мы видим, что коэффициенты связности Г?/ выражаются через коэффициенты первой квадратичной формы и их производные. Следовательно, они не меняются при изгибаниях (изометриях) поверхности, О Явные выражения коэффициентов Г*/ через коэффициенты первой квадратичной формы нам не понадобятся, и мы их выписывать не будем. Коэффициенты деривационных формул связаны тремя соотношениями, которые возникают при вычислении с помощью этих формул двумя разными способами частных производных rUUVt ruvv и nuv- Одно из этих соотношений было найдено Гауссом, а остальные два — Пе- терсоном, Майнарди и Кодацци. Мы рассмотрим только соотношение Гаусса, которое получим, вычисляя коэффициент при rv в разложении частной производной rUUv по векторам ru> rv и п. В этом вычислении мы будем следить только за коэффициентом при rv и только за теми его слагаемыми, которые зависят от коэффициентов второй квадратичной формы. Все же остальные слагаемые мы будем заменять многоточием. = F0 — -g Gu, = j00, 306
Имеем = •.. +r|i (.'..)+ ... +.Г?, (...) + ... ... -+- Л- ^. . . "Г ?Q — f2 ГЬ}~~~ _f, FM-EN , \ , ~4 EG-F2 "*"" '••Jr*T ••• Аналогично, '«¦о=(a=ov«+iv.+щи= __(M FL — EM . \ . \ jE"G F2 • • • J ft» "Г ••• Следовательно, j FM-EN _M FL-EM. . где многоточие обозначает члены, зависящие только от коэффициентов первой квадратичной формы. Но м FL - ЕМ т FM-EN _ р LN - М2 _ рк EG — F2 L EG — F2 ~ EG — F2 ~ Д# Поскольку ЕфО (форма / положительно определена), этим доказано, что полная кривизна К поверхности вы- ражается через коэффициенты первой квадратичной формы (и их производные). Отсюда следует, что кривизна К при изгибаниях не меняется. Этот результат заслуживает выделения в качестве теоремы: Теорема 1 (теорема Гаусса). Полная (гауссо* ва) кривизна поверхности не меняется при изгибаниях (изометриях), т. е. изометричные поверхности в соответ* ствующих друг другу точках имеют одинаковую кри* визну. П Эта теорема настолько восхитила Гаусса, что он назвал ее theorema egregium — по-латыни «блистательная теорема». Из теоремы 1 следует, в частности, что никакую сколь угодно малую часть сферы нельзя изо» 307
гнуть на плоскость. Поэтому никакая карта земной поверхности не дает абсолютно точного ее изображения. Явное выражение кривизны К через коэффициенты Et F и G первой квадратичной формы имеет вид C) К = 1 4 (EG - ЯJ Е Еа Ev F Fu Fv G Gu Gv 1 ¦я Uv^-^A w^-яЛГ 2^/EG' Другие два соотношения, получающиеся при дифференцировании деривационных формул (и называемые обычно формулами Петерсона — Кодацци), имеют вид D) 2(EG-F2)(LV-Ma)~ - (EN + GL- 2FM) (Ev - Fu) + 2(EG-F2)(MV-NU)- - (EN + GL- 2FM) (Fv - Gu) + E F G E F G Fa Ga Eo F0 Gv = 0, = 0. Доказательство этих формул не требует ничего, кро-* ме терпения и аккуратности. Теорема Гаусса утверждает, что равенство полных кривизн является необходимым условием изометрично- сти двух поверхностей. Вместе с тем, хотя это условие отнюдь не достаточно, оно настолько сильно, что с его помощью можно без труда получить и достаточные условия. Мы не будем подробно обсуждать этот вопрос и рассмотрим лишь важнейший частный случай соответствующей теоремы* Пусть EK2v-2FKuKv + GKl А1Д EG-F* * (Это есть первый дифференциальный параметр Бельтра^ ми функции /С, вычисленный в «криволинейных» коор* динатах и и v,) Если две функции К и AiK от и и v 308
функционально независимы, т, е. их якобиан I Ж UL I дм да дкхК dhxK \ ди dv | отличен от нуля, то их можно принять за новые локаль* ные координаты на поверхности A). Назовем эти коор-» динаты гауссовыми. Как показывает непосредственное вычисление, любой диффеоморфизм поверхности, сохраняющий функцию К (в частности, любая изометрия), оставляет инвариантной и функцию А\К. Поэтому, в частности, каждая изометрия является отображением по равенству гауссовых координат. Это означает, что справедлива следующая теорема: Теорема 2. Две поверхности, на которых определены гауссовы координаты, тогда и только тогда изометричны, когда в этих координатах их первые квадратичные формы совпадают. ? Таким образом, чтобы определить, изометричны или нет две поверхности, надо ввести на них (если это воз^ можно) гауссовы координаты и вычислить в этих коор* динатах их первые квадратичные формы. Если эти формы совпадают, то поверхности изометричны, а если эти формы различны, то поверхности не изометричны. Теорема 2 не дает ответа, когда К и А\К функционально зависимы, например, когда А\К = 0 (что имеет место, как легко сообразить, если и только если К = const). Впрочем, в этом крайнем случае можно показать, что условие теоремы 1 оказывается достаточным, т. е. две поверхности постоянной полной кривизны тогда и только тогда изометричны, когда они имеют одну и ту же кривизну. Другими словами, любая поверхность постоянной полной кривизны К изометрична сфере радиуса /?= . , если К>0, плоскости, если /С = 0, и псевдосфере с параметром R = —==-, если V— к К < 0. Доказательство состоит в явном построении координат и, v, в которых первая квадратичная форма совпадает с первой квадратичной формой соответственно сферы, плоскости и псевдосферы. К сожалению, на это у нас нет времени»
Предметный указатель Алгебра Грассмана 69 — тензорная линеала 52 Алгоритм Лагранжа 106 Альтернатива Фредгольма 139 Альтернирование 60 Аннулятор множества 38 Антиизоморфизм алгебр 138 Базис 7 —» сопряженный с базисом 33 *- Френе сопровождающий 252, 253, 258 Вектор бинормали 253 — главной нормали кривой 252 — поверхности 286 *- касательный 240, 245 — коричневой 156 — собственный 143 Векторы, сравниваемые по модулю подпространства 26 Вид нормальной квадратичной формы 108 Вихрь векторного поля 227 Вращение 211 — обобщенное 21 Геликоид 280 Гиперплоскость 90 — касательная 247 Гиперповерхность, второго порядка аффинного пространства 123 _ — нецентральная 124 —• • центральная 124 »— проективного пространства 118 _ — — — ~ овальная 119 — гладкая (регулярная) 219 Гомоморфизм линейных пространств 28 Градиент функции 219 График функции 220 Группа симметрическая 59 *— унитарная 209 Закон инерции квадратичных форм ИЗ — преобразования тензорный 50 Значение собственное 143 Изометрия поверхностей 276 Индекс инерции отрицательный 114 положительный 114 Индикатриса Дюпена 290 Катеноид 280 Клетка жорданова 160 Ковектор 31 —, ассоциированный с полилинейным функционалом 55 Комплексификация линейного опера-* тора 164 пространства 163 Конус At-кратный 119 Кообраз гомоморфизма линейных пространств 29 Координаты ковариантные 132 *— контравариантные 182 — плюккеровы 89 Коэффициенты связности 304 — существенные кососимметрического функционала 74 — тензора 49 Кратность собственного значения алгебраическая 145 — — — геометрическая 143 Кривая в евклидовом (аффинном) пространстве 238 — — —. — гладкая 240 <— — регулярная 240 — общего типа 251, 252, 257 Кривизна кривой 250, 252 — —¦ относительная 250 — поверхности полная 292 средняя 292 Кривизны кривой 258 — поверхности главные 292 Кривые непара метризованные 241 ¦— эквивалентные 241 Критерий Сильвестра 116 Кручение 253 Линеал 7 Линеалы двойственные 34 Линия винтовая 254 — цепная 280 Диффеоморфизм 263 Длина непрерывной кривой 243 Дополнение ортогональное 174 310
Матрица билинейного функционала — коэффициентов 21 • расширенная 21 — линейного оператора 134 — положительно определенная 115 — унитреугольная 109 Минор 16 — главный НО Многообразие Грассмана 97 — линейное 91 Многочлен от оператора 161 ~- характеристический 145 Мономорфизм линейных пространств 28 Морфизм линейных пространств 28 Носитель поверхности 263 Оболочка линейная множества 9 Образ гомоморфизма линейных пространств 28 Ограничение линейного оператора 140 Оператор Лапласа 236 — линейный 131 — — вырожденный 135 *— — диатонализируемый 148 изометрический 208 « кососим метрический 187 —• — косоэрмитов 188 *- — невырожденный 135 — — неотрицательный 205 — — нильпотентный 151 — — нормальный 200 ¦ нулевой 132 *— — обратимый 135 •- — ортогонально диагонализируе- мый 193 *— — ортогональный 208 — .— положительный 205 •—• — самосопряженный 186 — — симметрический 187 — — скалярный 133 •— — сопряженный 185 ~ — тождественный 132 *!• — унитарный 208 ¦ Циклический 151 • эрмитов 187 Отображение линейное 28 Параболоид гиперболический 129 — эллиптический 129 Параметр дифференциальный Дарбу 237 •— — первый Бельтрами 237 Перенос параллельный 211 Плоскость нормальная 257 — соприкасающаяся 257 •— спрямляющая 257 •— р-мерная 90 *- r-мерная проективного пространства 94 Поверхности изометричные 276 •— развертывающиеся 282 Поверхность бинормалей 269 —* главных нормалей 269 — касательных 269 — линейчатая 268 *- регулярная 263 Подматрица главная ПО Подпространства дополнительные 25 Подпространство 8 ~~ инвариантное 140 — корневое 156 —, направляющий р- вектор 89 — нулевое 8 —, принадлежащее собственному значению 143 — тривиальное 8 Подстановка 58 т нечетная 69 — четная 69 Подъем индекса 182 Поле векторное 223 •*- ~ безвихревое 226 градиентное 226 потенциальное 226 — — символическое Гамильтона 231 — — соленоида'льное 230 центральное 228 оливектор степени Р 78 отенциал векторный 230 Преобразование аффинное 210 — ортогональное 210 — унитарное 210 — центроаффииное 211 Произведение внешнее 67 — тензорное векторов 45 — — линейных функционалов 44 Пространство псевдоевклидово 105 — ранговое функционала 55 *—, сопряженное линеалу 31 Прямая 90 Псевдосфера 298 Радиус кривизны 251 Ранг внешний 80 — матрицы 16 — матричный билинейного функционала 100 — множества 14 — полилинейного функционала 58 Расходимость векторного поля 230 Свертка тензора 53 Свойство минимаксное собственных значений 200 Сеть координатная 266 Символ Кронекера 36 Система решений фундаментальная 40 Скобки Кристоффеля 304 След 54 Соотношения Плюккера 87 Спаривание 34 Спектр линейного оператора 149 , простой 149 Спуск индекса 182 Степень нильпотентности оператора (матрицы) 151 — полилинейного функционала 55 Сумма подпространств 10 прямая 23 *— пространств прямая 30 Тензор типа (р, q) 48 Теорема Гамильтона — Кэли 162 — Гаусса 306 ~ Кронекера — Капелли 21 — Лагранжа 105 ~ Якоби 112 311
Точка особая векторного поля 224 ь- гиперповерхности 224 — поверхности гиперболическая 291 параболическая 291 — — эллиптическая 291 — самопересечения 244 Трактриса 298 Уравнение векторное параметрическое плоскости 91 Факторпространство линеала ио подпространству 27 Фдрма билинейная 43 — жорданова нормальная 160 — квадратичная 104 — — поверхности вторая 289 — — — первая 271 • — — положительно определенная ]к> Формулы деривационные Вейнгартена 304 »* Пётерсона — Кодацци 307 Формулы Френе 252, 253, 268 Функционал билинейный 42 смешанный 46 •— квадратичный 102 tr- — положительно определенный 115 *-• линейный 31 *- полилинейный 55 0 — кососимметрический 66 ц* —• симметрический 98 — полуторалинейный 172 функция гармоническая 236 Цилиндр 266 — 6-кратный 119 Эпиморфизм линейных простраисти 28 Ядро гомоморфизма л,ине#нш пр странств 2$ . - ¦'