Текст
                    Н.В.Ефимов, Э.Р.Розендорн
ЛИНЕЙНАЯ АЛГЕБРА И МНОГОМЕРНАЯ ГЕОМЕТРИЯ
Предметом книги является объединенный курс линейной алгебры и многомерной
аналитической геометрии. Главное место в ней занимают основы теории
конечномерных линейных пространств и линейных преобразований. В книге
изложена тензорная алгебра и на соответствующих примерах показаны ее
приложения. На примере групп преобразований читатель познакомится с
элементами теории групп. В последней главе дается введение в проективную
геометрию. Книга рассчитана на студентов механико-математических
факультетов университетов. Она может быть полезна студентам втузов,
инженерам и научным работникам разных специальностей, изучающим или
использующим методы линейной алгебры и многомерной геометрии.
ОГЛАВЛЕНИЕ
Предисловие	7	преобразования переменных.	
Введение	9	Преобразования координат	
Глава I. Линейные пространства	12	§ 1. Сокращенная запись	57
§ 1. Аксиомы линейного	12	суммирования	
пространства		§ 2. Линейное преобразование	60
§ 2. Примеры линейных пространств	15	переменных. Произведение линейных преобразований	
§ 3. Простейшие следствия из аксиом линейного пространства	22	переменных и произведение матриц	
§ 4. Линейная комбинация. Линейная зависимость	24	§ 3. Квадратные матрицы и невырожденные преобразования	64
§ 5. Лемма о базисном миноре	27	§ 4. Ранг произведения матриц	70
§ 6. Основная лемма о двух системах векторов	30	§ 5. Преобразование координат при изменении базиса	72
§ 7. Ранг матрицы	32	Глава III. Системы линейных	76
§ 8. Конечномерные и бесконечномерные пространства.	34	уравнений. Плоскости в аффнииом пространстве	
Базис		§ 1. Аффинное пространство	76
§ 9. Линейные операции в	37	§ 2. Аффинные координаты	78
координатах		§ 3. Плоскости	80
§ 10. Изоморфизм линейных пространств	39	§ 4. Системы уравнений Первой степени	84
§11. Соответствие между	42	§ 5. Однородные системы	89
комплексными и		§ 6. Неоднородные системы	96
действительными пространствами		§ 7. Взаимное расположение	100
§ 12. Линейное подпространство	44	плоскостей	
§ 13. Линейная оболочка	47	§ 8. Системы линейных	108
§ 14. Сумма подпространств. Прямая сумма	51	неравенств и выпуклые многогранники	
Глава II. Линейные	57	Глава IV. Линейные, билинейные	119

и квадратичные формы § 1. Линейные формы 119 § 2. Билинейные формы 124 § 3. Матрица билинейной формы 128 § 4. Квадратичные формы 131 § 5. Приведение квадратичной 134 формы к каноническому виду методом Лагранжа § 6. Нормальный вид 137 квадратичной формы § 7. Закон инерции квадратичных 138 форм § 8. Приведение квадратичной 140 формы к каноническому виду методом Якоби § 9. Положительно определенные 143 и отрицательно определенные квадратичные формы § 10. Определитель Грама. 146 Неравенство Коши—Буняковского § 11. Нулевое подпространство 149 билинейной и квадратичной формы § 12. Нулевой конус квадратичной 152 формы § 13. Простейшие примеры 153 нулевых конусов квадратичных форм Глава V. Тензорная алгебра 157 § 1. Взаимные базисы. 157 Контравариантные и ковариантные векторы § 2. Тензорное произведение 166 линейных пространств § 3. Базис в тензорном 170 произведении. Координаты тензора § 4. Тензоры билинейных форм 176 § 5. Многовалентные тензоры. 180 Произведение тензоров § 6. Координаты многовалентных 184 тензоров § 7. Полилинейные формы и их 186 теиз оры § 8. Симметрирование и 188 альтернирование. Косые формы § 9. Второй вариант изложения 192 понятия тензорного произведения двух линейных пространств Глава VI. Понятие группы и 199 некоторые его приложения § 1. Группы и подгруппы. 199 Распределение базисов на классы по данной подгруппе матриц. Ориентация § 2. Группы преобразований. 206 Изоморфизм и гомоморфизм групп § 3. Инварианты. Осевые 212 инварианты. Псевдоинварианты § 4. Т еиз орные в еличины 219 § 5. Ориентированный объем 224 параллелепипеда. Дискриминантный тензор Глава VII. Линейные 230 преобразования линейных пространств § 1. Общие сведения 230 § 2. Линейное преобразование как 233 тензор § 3. Геометрический смысл ранга 237 и определителя линейного преобразования. Группа невырожденных линейных преобразований § 4. Инвариантные 240 подпространства § 5; Примеры линейных 242 преобразований § 6. Собственные векторы и 249 характеристический многочлен преобразования § 7. Основные теоремы о 252 характеристическом многочлене и собственных векторах § 8. Нильпотентные 255
преобразования. Общая структура вырожденных преобразований § 9. Канонический базис 259 нильпотентного преобразования § 10. Приведение матрицы 270 преобразования к жордановой нормальной форме § 11. Преобразования простой 276 структуры § 12. Эквивалентность матриц 278 § 13. Формула Гамильтона—Кэли 281 Глаза VIII. Пространства с 283 квадратичной метрикой § 1. Скалярное произведение 283 § 2. Норма вектора 285 § 3. Ортонормиров энные базисы 287 § 4. Ортогональная проекция. 289 Ортогонализация § 5. Метрический изоморфизм 295 § 6. k-ортогональные матрицы и к- 297 ортогональные группы § 7. Группа евклидовых поворотов 301 § 8. Группа гиперболических 310 поворотов § 9. Тензорная алгебра в 320 пространствах с квадратичной метрикой § 10. Уравнение гиперплоскости в 328 пространстве с квадратичной метрикой § 11. Евклидово пространство. 331 Ортогональные матрицы. Ортогональная группа § 12. Нормальное уравнение 337 гиперплоскости в евклидовом пространстве § 13. Объем параллелепипеда в 339 евклидовом пространстве. Дискриминантный тензор. Векторное произведение Глава IX. Линейные 344 преобразования евклидова пространства § 1. Сопряженное преобразование 344 § 2. Лемма о характеристических 347 корнях симметричной матрицы § 3. Самосопряженные 348 преобразования § 4. Приведение квадратичной 355 формы к каноническому виду в ортонормированием базисе § 5. Совместное приведение к 357 каноническому виду двух квадратичных форм § 6. Кососопряженные 361 преобразования § 7. Изометричные 364 преобразования § 8. Канонический вид 369 изометричного преобразования § 9. Движение твердого тела с 375 одной неподвижной точкой § 10. Кривизна и кручеине 377 пространственной кривой § 11. Разложение произвольного 380 линейного преобразования в произведение самосопряженного и изометричного преобразований § 12. Приложения к теории 383 упругости. Тензор деформацийи тензор напряжений Глава X. Поливекторы и внешние 387 формы § 1. Альтернация 387 § 2. Поливекторы. Внешнее 393 произведение § 3. Бивекторы 399 § 4. Простые поливекторы 410 § 5. Векторное произведение 414 § 6. Внешние формы и действия 421 над ними § 7. Внешние формы и 425 ковариантные поливекторы § 8. Внешние формы в трехмерном 433 евклидовом пространстве Глава XI. Гиперповерхности 438
второго порядка § 1. Общее уравнение гиперповерхности второго порядка § 2. Изменение левой части уравнения при переносе начала координат § 3. Изменение левой части уравнения при изменении ортонормированиого базиса § 4. Центр гиперповерхности второго порядка § 5. Приведение к каноническому виду общего уравнения гиперповерхности второго порядка в евклидовом пространстве § 6. Классификация гиперповерхностей второго порядка в евклидовом пространстве § 7. Аффинные преобразования § 8. Аффнииая классификация гиперповерхностей второго порядка § 9. Пересечение прямой с гиперповерхностью второго 438 порядка. Асимптотические направления § 10. Сопряженные направления 468 439 Глава XII. Проективное 472 пространство § 1. Однородные координаты в 472 442 аффнииом пространстве. Бесконечно удаленные точки § 2. Понятие проективного 476 445 пространства § 3. Связка плоскостей в 487 447 аффнииом пространстве § 4. Центральное проектирование 496 § 5. Проективная эквивалентность 500 фигур § 6. Проективная классификация 507 451 гиперповерхностей второго порядка § 7. Пересечение 514 гиперповерхности второго 459 порядка и прямой. Поляры 464 Приложение. Доказательство 524 теоремы о классификации линейных величин 465 Литература 528
ПРЕДИСЛОВИЕ Настоящая книга задумана как учебник по объединенному курсу линейной алгебры и аналитической геометрии. Замысел книги возник в связи с лекциями Н. В. Ефимова, которые читались для студентов механико-математического факультета МГУ в 1964—1966 годах. Однако материал этих лекций подвергнут авторами полной переработке и значительно расширен. Указанный лекционный курс проводился каждый раз во втором семестре (как и теперь проводится в МГУ) при четы- рех часах лекций и четырех часах практических занятий в неделю. В настоящей книге ему приблизительно соответству- ют главы I — VI, §§ 1 — 7 главы VII и главы VIII, IX, XI. При этом §§ 8—13 главы VII, глава X и глава XII могут рассматриваться в виде трех независимых дополнений к отме- ченным "выше основным разделам. В МГУ этот материал не входит в объединенный курс второго семестра и сообщается с большей или меньшей степенью общности в других кур- сах. Например, тематика параграфов 8—13 гл. VII (приве- дение матриц к жордановой форме) входит в курс алгебры на третьем семестре. С точки зрения авторов основная часть книги и дополне- ния различаются весьма условно. Книга имеет свою структу- ру, достаточно определенную внутренними связями между всеми ее разделами, независимо от распределения их по кафедрам и лекционным курсам (объединенным или раз- дельным, обязательным или факультативным). Что же касается выбора вошедших в книгу разделов, то авторы старались делать его с учетом потребностей других математических дисциплин, а также механики и физики. Мы надеемся, что весь материал- книги окажется полезным. Материал этот к тому же вполне доступен. Во всяком случае, вся предварительная
8 ПРЕДИСЛОВИЕ подготовка, которую мы предполагаем, может быть дана в первом семестре в курсах аналитической геомерии и алгеб- ры, как бы просто они ни читались. Нужно лишь твердое знание элементарного материала по этим дисциплинам. В частности, для гл. XII желательно предварительное зна- комство с проективными преобразованиями и проективными свойствами фигур на плоскости. Заметим еще, что в гл. X читатель ради упрощения дела может пропустить пункты 13 — 23 § 3, весь § 5 и п. 10 § 7. После этих сокращений материал гл. X может служить минимальной алгебраической основой для теории многомерного интегрирования. В заключение отметим, что уже первые пять глав настоя- щей книги содержат материал, находящий широкие прило- жения в математике, механике, физике. Эти главы, допол- ненные отдельными вопросами из последующих глав, могу г быть использованы при изучении математики в высших технических учебных заведениях с повышенной математичес- кой программой. 30 августа 1969 года Н. В. Ефимов Э. Р. Розендорн
ВВЕДЕНИЕ В математике и в ее приложениях часто приходится рас- сматривать некоторые множества объектов, для которых установлены так называемые линейные операции: сложение и умножение на число. Например, в механике рассматривают всевозможные силы, приложенные к данному твердому телу. Две силы, приложенные к одной точке, можно сложить, т. е. заменить одной силой, приложенной к той же точке. Силу можно умножить на число а, т. е. увеличить в а раз, сохра- нив линию действия. В механике рассматривают также сло- жение скоростей и умножение скорости на число; рассматри- вают сложение ускорений и умножение ускорения на число. Силы, скорости и ускорения различны по своей физической” природе. Однако линейные операции, которые производятся над ними, единообразны с геометрической точки зрения. Поэтому в механике принят общий способ изображения этих объектов в виде направленных отрезков. Тем самым все они обслуживаются общими правилами сложения и умножения на число геометрических векторов. Но это обобщение идет гораздо дальше. Рассмотрим, например, множество всех функций, непрерывных на число- вой оси, или множество всех периодических функций с дан- ным периодом, или множество всех алгебраических много- членов. В каждом из этих множеств мы можем естественным образом рассматривать линейные операции (понимая сумму функций и произведение функции на число, как принято в анализе). Объекты, о которых мы сейчас говорим, не по- хожи на силы, скорости и ускорения или на геометрические векторы. Линейные операции над ними также, не похожи на линейные операции над векторными величинами механики или над геометрическими векторами.
10 ВВЕДЕНИЕ Однако здесь есть и нечто общее, позволяющее изучать линейные операции абстрактно, отвлекаясь от конкретной природы объектов. Прежде всего, в любом нашем примере дело обстоит так, что линейные операции над элементами данного множества (то есть над объектами, из которых оно состоит) дают в ре- зультате элементы того же множества. Именно, складывая геометрические векторы или умножая их на число, мы полу- чаем геометрические векторы; складывая непрерывные функ- ции или умножая их на число, мы получаем непрерывные функции. То же самое можно повторить про периодические функции с данным периодом или про алгебраические много- члены. Кроме того, линейные операции, различные для разных множеств, имеют ряд общих свойств (рассмотренных ниже, в первой главе). Наличие общих свойств позволяет изучать линейные операции вообще. Изучая множества с данными в них линейными операци- ями, их объединяют понятием линейного пространства. Теория линейных пространств находит чрезвычайно широкие приме- нения в современной математике и соседних с ней науках. Определение линейного пространства будет сформулиро- вано в ближайшем параграфе. Оно не будет содержать каких- либо описаний элементов рассматриваемых множеств или производимых линейных операций. Будут потребованы только некоторые свойства линейных операций, общие для всех частных случаев. Эти требования выражаются аксиомами ли- нейного пространства. Следует заметить, что требования, ко- торые выражены в аксиомах, весьма немногочисленны, и оста- ется возможность добавлять к ним новые предположения. Поэтому в общем понятии линейного пространства возникает некоторая классификация, так что все-таки приходится иметь дело не с единым линейным пространством, а с различными классами линейных пространств, и теория, основанная на аксиомах линейного пространства, разветвляется. Прежде всего, все линейные пространства разделяются на конечномерные и бесконечномерные. Конечномерные про- странства (одномерные, двумерные, трехмерные и т. д.) изу- чаются в линейной алгебре, которая является предметом этой книги. Бесконечномерные пространства рассматриваются в раз- личных разделах функционального анализа; у нас они будут
ВВЕДЕНИЕ 11 встречаться лишь эпизодически, для иллюстрации некоторых общих выводов. К числу конечномерных пространств принадлежит трех- мерное пространство геометрических (свободных) векторов. Это пространство содержит в себе бесконечно много дву- мерных и одномерных пространств, называемых подпростран- ствами (каждое двумерное подпространство состоит из векто- ров, лежащих в одной плоскости, каждое одномерное подпространство состоит из векторов, лежащих на одной прямой). Таким образом, для одномерных, двумерных и трех- мерных линейных пространств мы имеем геометрические модели, с которыми естественно связаны наши наглядные представления о векторах. При переходе к многомерным про- странствам наглядность частично теряется, но теория этих пространств сохраняет геометрический характер. Дело в том, что ее основные понятия строятся путем заимствования у трехмерного случая и надлежащего обобщения на много- мерный. Не последнюю роль здесь играет сохранение геомет- рической терминологии; например, говоря о разнообразных множествах, мы называем их пространствами. Заметим кстати, что элементы всяких линейных пространств принято называть векторами. Вместе с тем линейные пространства называют также векторными пространствами. Геометричность термино- логии и основных понятий линейной алгебры помогает ее контактам с геометрией. Мы имеем в виду здесь аналити- ческую геометрию, причем многомерную, т. е. многомерный аналог обычной (трехмерной) аналитической геометрии. Более того, линейная алгебра и аналитическая геометрия настолько тесно связаны, что между ними трудно провести четкую грань. Мы и не будем к этому стремиться. Выше мы назвали в качестве предмета нашей книги линейную алгебру. С та- ким же основанием можно сказать, что ее предметом явля- ется многомерная аналитическая геометрия.
ГЛАВА 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА § 1. Аксиомы линейного пространства 1. Пусть имеется множество L, состоящее из каких угод- но элементов. Для обозначения элементов этого множества мы будем употреблять малые буквы латинского алфавита а, Ь,..., х, у,... Только в одном случае мы употребим даль- ше аналогичным образом греческую букву 0. Вместе с эле- ментами множества L будут рассматриваться числа или любые действительные, или любые комплексные. Для обозна- чения чисел мы воспользуемся малыми греческими буквами а, р, ... (исключая 6). 2. Мы предполагаем, что в множестве L-определено поня- тие равенства элементов. Это значит, что все элементы мно- жества L некоторым образом распределены по классам (под- множествам L) так, что разные классы не имеют общих эле- ментов. При этом два элемента а, b считаются равными (а — = Ь), если они принадлежат одному классу. Не исключается, что каждый класс- состоит только из одного элемента; в таком случае равенство а = Ь означает, что через а и b обоз- начен один и тот же элемент множества L. В дальнейшем мы будем иногда говорить, что соверша- ется допустимая замена некоторого элемента множества L, если вместо этого элемента берется любой другой элемент одного с ним класса, иначе говоря, любой другой равный ему элемент. 3. В ряде случаев вместо заранее данного разбиения мно- жества L на классы равных элементов будут непосредствен- но указываться условия допустимых замен (т. е. условия, при которых элементы считаются равными). Тогда для произволь- ного элемента а из L будет определен класс аЛТ состоящий из всех элементов L, равных элементу а. Однако, чтобы полу- чить требуемое распределение множества L по таким клас- сам, нужно обеспечить следующие три обстоятельства:
АКСИОМЫ 13 § Il 1) Сам элемент а должен войти в класс е#, то есть усло- вия равенства должны быть такими, чтобы элемент а считал- ся равным самому себе: а = а (иначе говоря, замена эле- мента самим собой должна быть допустимой), 2) Если а — Ь, то должно быть Ь — а. 3) Если а = Ь и Ь — с, то должно быть а —с. При соблюдении этих трех обстоятельств (и только в этом случае) любые два элемента, входящие в класс &£, равны между собой; кроме того, класс включает все элементы множества L, равные какому-нибудь элементу этого класса. Иллюстрация сказанного дается на примерах § 2. 4. Будем говорить, что в множестве L определены дейст- вия сложения и умножения на число, если: 1) каждым двум элементам а, Ь из множества L сопо- ставлен некоторый элемент того же множества L, называемый их суммой; сумма элементов а, b обозначается через а -|- Ь; 2) каждому числу а и каждому элементу а из множества L сопоставлен некоторый элемент того же множества L, называемый произведением а на а или а на а; произведение а на а обозначается через аа или аа. Предполагается, что действия сложения и умножения на число инвариантны относительно допустимых замен элемен- тов множества L: ест а —а', b — b', то а-\-Ь = а’ -\-17 и аа = аа'. Предполагается также, что соблюдены требования следу- ющих восьми аксиом: 1) Для любых а, b из L а-]-b — b-{-а. Это свойство сложения называется перестановочным или комму- тативным. 2) Для любых а, Ь, с из L (а + Ь)-]-с — а 4-с). Это свойство называется сочетательным или ассоциативным. Оно позволяет писать сумму без скобок, считая а 4~ b 4~ с — = (а 4-6) 4~ с ~ а (.Ь 4- с). Вследствие первой аксиомы без- различен также и порядок записи слагаемых. 3) В множестве L существует элемент 0 такой, что а-}-® — а для любого а из L. Элемент 6 называется нулевым.
14 ЛИНЕЙНЫЕ ПРОСТРАНСТВА ГГЛ. I 4) Для любого элемента х из L существует элемент у из L такой, что х-]~у=8. Элемент у называется противоположным для х и обозна- чается через —х. 5) 1 • а = а. 6) а (Ва) = (аб) а. 7) (а р) а — аа -|- ^а. 8) а (а Ь) = аа ab. В последних четырех аксиомах а и b означают произ- вольные элементы из L; а и р — произвольные числа. Отметим, что свойство, выраженное седьмой аксиомой, называется распределительным или дистрибутивным для со- множителя из L (эта аксиома разрешает распределять сомно- житель из L по составляющим числового сомножителя). Вось- мая аксиома выражает распределительное свойство для чис- лового сомножителя. 5. Основное определение. Множество L, рассмат- риваемое вместе с заданными в нем действиями сложения и умножения на число, называется линейным пространством. Подчеркнем, что в этом определении подразумевается, что сложение и умножение удовлетворяют всем свойствам, пере- численным в п. 4. Восемь аксиом, сформулированных в п. 4, называют аксиомами линейного пространства. Как мы уже говорили во введении, элементы линейного пространства принято называть также векторами, а само линейное пространство можно называть векторным простран- ством. Впрочем, очень часто множество L мы будем назы- вать пространством, не употребляя никаких прилагательных, но считая, что речь идет о векторном пространстве. 6. Если для векторов пространства L определено умно- жение только на действительные числа, то L называется действительным векторным пространством. Если определено умножение векторов из L также и на комплексные числа, то пространство L называется комплексным. Всюду в дальнейшем, употребляя термин «произвольное число», мы будем иметь в виду любое действительное число, если речь идет о действительном пространстве, и любое ком- плексное число, если речь идет о комплексном пространстве.
ПРИМЕРЫ 15 § 2] Значительная часть фактов, изложенных в ближайших главах, относится и к действительным, и к комплексным пространствам. В тех случаях, когда какое-либо свой- ство справедливо -только для действительного или только для комплексного пространства, это будет особо оговари- ваться. 7. Иногда вместо умножения на числа рассматривается умножение элементов из L на элементы произвольного алгеб- раического поля U (с соблюдением тех же восьми аксиом линейного пространства). В этом случае множество с задан- ными линейными операциями называется линейным (пли век- торным) пространством над полем U. § 2. Примеры линейных пространств Предварительное замечание. Если относительно какого-либо конкретного множества с заданными в нем ли- нейными операциями утверждается, что оно есть линейное пространство, то для доказательства этого утверждения нужно проверить, что заданные операции в самом деле являются линейными, то есть удовлетворяют требованиям восьми известных нам аксиом. 1. Пространство геометрических векторов. Рассмотрим в трехмерном евклидовом пространстве множество всех геометрических векторов. Заметим, что два элемента этого множества, т. е. два вектора, считаются равными в том случае (и только в том случае), когда они коллинеарны, имеют равные длины и направлены в одну сторону. Таким образом, речь идет о свободных векторах, точка приложения которых может выбираться произвольно. Допустимые замены вектора заключаются в его парал- лельных перенесениях к новым точкам приложения. Соблю- дение трех условий п. 3 § 1 при этом очевидно. Линейные операции над геометрическими векторами производятся хорошо известным образом: сложение—по правилу параллелограмма, умножение на действительное число а есть растяжение век- тора в а раз. Обе операции инвариантны относительно допу- стимых замен. В самом деле, если а —а’, b = b', то парал- лелограмм, построенный на векторах а', Ь', получается парал- лельным перенесением параллелограмма, который построен на а, Ь; тем самым, вектор а' -\-tf получается параллельным
]6 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. I перенесением вектора а Ь, то есть а b — а' Ь'. Столь же просто усматривается равенство аа — аа'. Геометрические векторы с указанным определением ли- нейных операций образуют действительное линейное прост- ранство. Нулевым элементом здесь является вектор нулевой длины. Если х—любой вектор, то в качестве противополож- ного ему вектора у =— х следует понимать вектор той же длины и противоположного направления. Требования аксиом 1)—8) п. 4 § 1 при этом соблюдены, в чем легко убедиться при помощи простых геометрических рассуждений. Разу- меется, в этом нет чего-либо случайного. Дело в том, что геометрические векторы послужили исходной моделью для общего понятия линейного пространства, т. е. в аксиомах 1) — 8) высказаны некоторые свойства линейных операций над геометрическими векторами, хорошо известные в элемен- тарной векторной алгебре. Можно было бы спросить, почему в аксиомах 1) — 8) не потребованы другие, столь же простые и важные свойства геометрических векторов, которыми постоянно пользуются в векторных выкладках? Например, что умножение любого век- тора на число нуль дает нулевой вектор или что при умно- жении любого вектора х на число —1 получается противо- положный вектор —х. Оказывается, в этом нет надобности, поскольку такие свойства можно уже доказать, т. е. вывести из аксиом, что и будет сделано в § 3. 2. Нулевое пространство. Пусть L — множество, состоящее только из одного элемента. Что представляет со- бой этот элемент, нам безразлично. Обозначим его буквой 6. Определим в множестве L линейные операции, полагая, что 6 в сумме с самим собой дает 0 и что при умножении 0 на любое действительное число мы получаем также 0. Легко убедиться, что в этом случае требования аксиом 1) — 8) соб- людены. Таким образом, данное множество L является дейст- вительным линейным пространством, состоящим из единствен- ного, очевидно, нулевого элемента. Ясно, что с тем же успе- хом множество L можно определить как комплексное прост- ранство. Замечание. Все другие (действительные или комплекс- ные) линейные пространства обязательно имеют бесконечное количество элементов. Именно, в п. 2 § 3 показано, что если линейное пространство содержит хотя бы один элемент а,
ПРИМЕРЫ 17 § 2] отличный от нулевого, то для различных чисел аир эле- менты аа и За также различны. 3. Координатное пространство. Пусть теперь L означает множество, элементами которого служат всевозмож- ные упорядоченные наборы действительных чисел, по п чисел в каждом (п — зафиксированное натуральное число). Называя какой-нибудь набор из п чисел упорядоченным, мы считаем, что составляющие его числа занумерованы. (При этом они не обязаны быть различными.) Имея в виду, что элемент х из L есть набор чисел хь х2,..., х„, будем писать х — = {х1; х2....хп]. Считая х произвольным, рассмотрим еще один, также произвольный элемент _у4,..., Эле- менты х.и у будем полагать равными в том и только в том случае, когда Xi=_yt, Ха —у*..., хп = уп. Определим линейные операции в L соотношениями х-}-у= {%! x-t Ч-Уъ • • • > (О ах = {ахь ах2,..., ах„}. (2) Тогда требования первых двух аксиом линейного простран- ства соблюдены, поскольку сложение действительных чисел обладает перестановочным и сочетательным свойствами. Для проверки аксиом 3), 4) достаточно указать в множестве L нулевой элемент; именно: 9 = {0, 0,..., 0}. (3) Вместе с тем ясно, что в L для любого х существует про- тивоположный элемент — х; именно: --Х={-----Х1(--Хо,..., — хп}. (4) Аксиома 5) сразу усматривается из соотношения (2). Наконец, аксиомы 6), 7), 8) соблюдаются вследствие соотношений (1), (2), а также вследствие сочетательного и распределительного свойств для умножения действительных чисел. Таким образом, множество L с заданными линейными опе- рациями является действительным линейным пространством. Мы будем называть его действительным координатным про- странством Кп. Замечание. Рассматриваемое сейчас множество L не позволяет считать множитель а в соотношении (2) комплекс- ным числом, так как при комплексном а в правой части (2)
18 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. Г получится набор комплексных чисел, не являющийся эле- ментом множества L. 4. Обозначим на этот раз через L множество всех упо- рядоченных наборов из комплексных чисел, по п чисел в каждом. Линейные операции определим формулами (1) и (2), считая теперь, что a, Хр у}- (/=!,..., л)—комплексные числа. Как и в предыдущем пункте, все аксиомы 1) — 8) соблюдены, причем нулевой и противоположный элементы выражаются формулами (3) и (4). Таким образом, L есть линейное прост- ранство, комплексное, поскольку комплексны числа а. Мы будем называть его комплексным координатным пространст- вом Кп. Замечание. Ничто не мешает нам, однако, в соотно- шениях (1), (2) употреблять в качестве а только действитель- ные числа (при комплексных Хр у}). В таком случае множе- ство L оказывается действительным линейным пространством. Отсюда ясно, что одни и те же предметы (например, упорядо- ченные наборы комплексных чисел) могут служить в качестве векторов различных линейных пространств. Поэтому в общем определении § 1 линейным пространством называется не просто множество L, а множество вместе с заданными в нем линейными операциями, причем необходимо указывать, из какого поля берутся множители а. 5. Пространство матриц. Как принято, будем на- зывать прямоугольной матрицей, точнее, т \ п- матрицей таб- лицу чисел, расположенных в т строчках по п чисел в каждой. Если числа, составляющие матрицу, обозначены через aik (z=l, 2,..., т; k=\, 2,..., л), а сама матрица — через а, то будем писать ЙЦ . Й1„ -- а21 й22 • • • а2и Л/nl • • • Q-mn Самой этой записью данные числа располагаются также и по столбцам (число находится в строке с номером г и в столбце с номером k). Наряду с подробной записью матрицы в виде таблицы мы часто будем употреблять сокращенную запись: „ ° = li aih II-
ПРИМЕРЫ 19 § 21 Условимся матрицу называть действительной или комплекс- ной в случаях, когда она составлена соответственно из дейст- вительных или из комплексных чисел. Пусть L — множество всех т'Х.п-матриц, например дейст- вительных. Две матрицы будем считать равными элементами множества L в том и только в том случае, когда в них соот- ветствующие места заняты одинаковыми, числами (т. е. на пересечении i-й строки и Л-го столбца и в одной и в другой матрице стоит одно и то же число). Установим в множестве L линейные операции.. Именно, если a = ||a/fe||, b = — произвольные матрицы из L, а — произвольное действитель- ное число, то мы положим = aik-\-bik\\, аа — || a.aik ||. (5) Иначе говоря, при сложении т X //-матриц а и b мы попар- но складываем одинаково расположенные в них числа и bik; при умножении матрицы а на число а мы умножаем на а все числа, составляющие матрицу а. Совершенно так же, как в п. 3, можно установить, что линейные операции (5) удов- летворяют требованиям аксиом 1)—8); при этом роль нуле- вого элемента в L играет матрица 0, состоящая из одних нулей (нулевая матрица), а противоположным элементом для a = j| Ц служит матрица |j — a!tl ||. Тем самым L с линей- ными операциями (5) является действительным линейным про- странством. Аналогично множество всех комплексных т X п- матриц с линейными операциями (5), где а — комплексное, яв- ляется комплексным линейным пространством. Разумеется, рас- сматривая комплексные т X «-матрицы, мы можем считать а действительным; тогда мы получим действительное линей- ное пространство тех же комплексных матриц. Замечание. В частном случае т= \ (при данном п) мы получаем матрицы, каждая из которых имеет только одну строку (состоящую из п чисел). Линейное пространство та- ких матриц есть не что иное, как координатное пространство Кп (см. п. 3). При п=1 и данном т получаются матрицы, имеющие только один столбец; ясно, что они также образу- ют координатное пространство, именно Кт. Более того, про- странство любых т X «-матриц можно рассматривать как координатное пространство Ктп, поскольку ничто не меша- ет установить для всех элементов матриц общую нумерацию
20 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. I по какому-нибудь единому стандарту и выписать их в одну строку или в один столбец. 6. Пространство непрерывныхфункций. Возь- мем на числовой оси произвольный сегмент -ц sC т т2 и обо- значим через L множество всех функций, непрерывных на этом сегменте и принимающих действительные значения. Имея в виду, что элемент х из L есть некоторая непре- рывная функция х (т), Т] т т2, будем писать х={х(т)}. Считая х произвольным, рассмотрим еще один также произ- вольный элемент _у = {у(т)}. Элементы х и у будем считать равными в том и только в том случае, когда х(т)—(т), т. е. когда х(т) и _у(т) совпадают в любой точке т сегмента Определим линейные операции в L, полагая х+>={х(т)4-_у(т)}, ах={ах(т)}, (6) где а -—действительное число. Иначе говоря, мы складываем функции и умножаем их на числа обычным образом, как принято в анализе. Существенно заметить, что при сложении непрерывных функций и при умножении непрерывной функ- ции на постоянную получаются снова непрерывные функции. Легко убедиться, что линейные операции (6) удовлетворяют требованиям аксиом 1)—8). При этом нулевой элемент О есть функция, равная нулю во всех точках т сегмента [ti, т2]; для элемента х={х(т)} противоположным служит {—х(т)|. Таким образом, множество всех действительных непрерыв- ных на функций с линейными операциями (6) есть действительное линейное пространство. Если в качестве L мы возьмем множество всех непрерыв- ных на tj eg: т sC т2 функций с комплексными значениями, т. е. функций вида х (т) = и (т) -ф- iv (т), то в этом множестве можно задать линейные операции (6) при комплексном а. Все аксиомы 1)—-8) здесь также удовлетворены, и мы полу- чаем комплексное линейное пространство непрерывных функ- ций с комплексными значениями. Аналогично примерам, которые рассматривались в пп. 4 и 5, мы можем и в данном случае множество непрерывных функций х (т) = и (т) -j- iv (т) сделать действительным линейным пространством, если в равен- ствах (6) будем в качестве а допускать только действитель- ные числа.
ПРИМЕРЫ 21 § 21 7. Пространство интегрируемых функций1). Рассмотрим всевозможные действительные функции, интегри- руемые на сегменте Множество этих функций обозначим через L. Известно, что если мы изменим интегрируемую функцию в одной точке как угодно (сохранив остальные ее значения), то она останется интегрируемой, а интеграл от нее будет равен тому же числу, что и до изменения. То же самое можно сказать, если функция изменяется в нескольких точ- ках и даже в бесконечном множестве точек при условии, что это множество имеет меру нуль. Такого рода изменения функции с точки зрения теории интегрирования несущественны. Поэтому в вопросах теории интегрирования целесообразно не различать две функции, если они совпадают на сегменте "Ч т т2 почти везде, т. е. во всех точках сегмента ч т sC ч, кроме, может быть, некоторого множества меры нуль. В связи с этим условимся два элемента х={х(т)}, _у=[у(т)} множества L считать равными, если х(т)—_у(т) почти везде на сегменте ч т «С ч- Соответственно допу- стимая замена произвольного элемента Л'={х(т)}£ L заклю- чается в любом изменении значений функции х(т) на любом множестве меры нуль. Легко убедиться, что такое определение равенства эле- ментов L удовлетворяет трем требованиям п. 3 § 1. Для пер- вых двух это очевидно. Пусть теперь у = х, то есть у(т) — х(т) всюду, кроме некоторого множества меры нуль; пусть z — х, то есть z(t) = x(-) всюду, кроме неко- торого множества меры нуль. Тогда (т) = z (-с) всюду, кроме, быть может, объединения множеств и <М>г. По объединение двух множеств меры нуль есть множество меры нуль. Следовательно, у(т) = г(т) почти всюду, а значит, y=z. Таким образом, и третье требование удовлетворено: если у — X, z=x, то у = z. Если в множестве L определить линейные операции согласно формулам (6) п. 6, то будут обеспечены и инвари- антность линейных операций относительно допустимых замен, и соблюдение всех аксиом 1)—8). Не останавливаясь на дока- зательстве этих обстоятельств, заметим только, что в данном ') Читатель, не знакомый с теорией интегрирования, этот пункт может пропустить.
22 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ Г случае нулевым элементом является 9 = {0 (т)}, где 0(т)—- любая функция, равная нулю почти везде на сегменте [4, те]. Множество' L с заданными линейными операциями называ- ется пространством функций, интегрируемых на сегменте [т], т2|. 8. Контрпример. Обозначим через L множество всех упорядоченных наборов действительных чисел по л(/1^>1) чисел в каждом, т. е. множество того же вида, что и в п. 3. Определим сумму двух элементов из L так же, как в п. 3: х-гУ={хх-'гУъ х^-'гуъ..., хп^руп\. (7) Умножение х на а пусть дается правилом ах = {axt, х2,..., хп} (8) (справа на а умножается только xt). Вследствие соотноше- ния (7) аксиомы 1)—4) удовлетворены, причем 0 = {0, 0,..., 0}, —х={— X], — х2,...,— хп}. Легко проверить также, что соблюдаются требования аксиом 5), 6), 8). Вместе с тем аксиома 7) нарушена: (a-}-P)x={(a-J-P)xi, xit..., х„}, ах -J- ₽х = {(а Р) Xi, 2х2, ..., 2х„}. Таким образом, множество L с операциями (7), (8) не является линейным пространством. § 3. Простейшие следствия из аксиом линейного пространства 1. Перейдем к изложению обшей теории, т. е. к выводам из аксиом 1)—8) независимо от частных особенностей кон- кретных линейных пространств. Имеют место следующие предложения: 1) В каждом линейном пространстве нулевой вектор только один. Доказательство. Пусть элементы 91 и 0.2 нулевые. Вследствие аксиом 1) и 3) они совпадают: 02=02 01 = 0j =Op Замечание. Разумеется, когда мы говорим, что нуле- вой вектор только один, то мы не различаем равные векторы. |В том же смысле следует понимать утверждение единствен-
§ 3] простейшие следствия из аксиом 23 ности и в других теоремах (например, в следующем предло- жении). 2) Для любого вектора х существует только один противоположный вектор. Доказательство. Предположим, что х Ji — 6 и что хЦ-у2 = 0. Аксиомы 1)—4) позволяют записать следующую цепочку равенств: у., =уч -|- 6 =уч (х _У1) — (у2 -f- х) у\ — —(х >2) Н- уз=б + Ji =Уь то есть у-2 =yi. 3) Произведение любого вектора х на число 0 равно нулевому вектору 6. Доказательство. Для данного вектора х возьмем противоположный вектор у. Используя аксиомы 2)—5) и 7), получаем 0-х = 0-х -|- б = 0-х -j- (х -]-у) = (0 1)х -|-у = х -f-у = 0. 4) Произведение любого вектора х на число — 1 равно вектору, противоположному для х, т.е. (—1)х = —х. Доказательство. Нужно установить, что х-]- -j-(—1)х = 0. Из предыдущего свойства и аксиом 5) и 7) имеем х-[-(— 1)х = (1 — 1)х = О-х = 0. 5) Произведение нулевого вектора 0 на любое число а равно нулевому вектору. Доказательство. Возьмем произвольный вектор х. Используя аксиому 6) и свойство 3), находим я0 = а (0 • х) = (а 0) х = 0 х = 0. 2. Замечания. 1) Из свойства 5) следует, что произ- ведение ненулевого вектора на число, не равное нулю, все- гда есть ненулевой вектор. В самом деле, если бы при А -Д 0, а гД 0 было Аа = 0, то вследствие свойства 5) и аксиом 5)—6) мы получили бы а = 1 = а=4-(М = = \ К I к к что противоречит условию а -Д 0.
24 ЛИНЕЙНЫЕ ПРОСТРАНСТВА (ГЛ. I 2) Если a р и а 0, то аа -ф $а. В самом деле, если бы оказалось аа = $а, то аа (— Р) а = 0 или (а — р) а = 0, что противоречит предыдущему, так как а—Рт^О и а 0. 3. В линейном пространстве определено действие вы- читания. Именно, вектор х называется разностью век- тора b и вектора а, если х-\~а = Ь, что записывается х = b — а. Докажем, что для любых элементов а и b разность существует и единственна. Существование. Докажем, что вектор х = Ь -\- — 1)а является разностью b — а. Вследствие аксиом 2), 3), 5), 7) и свойства 3) имеем: х а = b (— 1) а а = b (— 1 -|-l)a = Z>-|-O-a = Z>. Единственность. Покажем, что если х является раз- ностью b — а, то его всегда можно представить в виде х = Ь-]-(—1)а. В самом деле, из равенства x-jy а — b с по- мощью аксиом 2), 3), 5), 7) и свойства 3) получаем х — л; —|— 0 = аг —(1— 1) а = х-I-а(— 1) cz = &—j—(— 1)а. 4. В дальнейшем мы будем пользоваться аксиомами линей- ного пространства и свойствами, установленными в этом пара- графе, без подробных пояснений. Вследствие аксиом и полу- ченных здесь результатов выкладки, в которых участвуют элементы линейного пространства, проводятся аналогично пре- образованиям в элементарной алгебре, с той лишь разницей, что нет умножения и деления векторов и нужно различать число нуль и нулевой вектор. В частности, можно переносить вектор из одной части векторного равенства в другую, умножая переносимый век- тор на минус единицу (или, что то же самое, заменяя его противоположным вектором). § 4. Линейная комбинация. Линейная зависимость 1. Пусть дано конечное число элементов линейного прост- ранства: a,b,c,...,q. Пусть далее а,р,у,...,х — произвольные числа. Определение 1. Всякий элемент х пространства L, представимый в виде х — аа -]- -ус -j- v.q,
§ 4] ЛИНЕЙНАЯ КОМБИНАЦИЯ. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 25 называется линейной комбинацией элементов а, Ь, с,..., q. Говорят также,' что х линейно выражается через a, b, с,...,q. Определение 2. Линейная комбинация называется три- виальной, если а = Р — р —... = х = 0, и называется нетри- виальной, если среди чисел а, р,..., х хотя бы одно отлично от нуля. Определение 3. Система векторов а, Ь, с, ..., q называется линейно зависимой, если существует нетривиальная линейная комбинация векторов а, Ь, с,..., q, равная нулевому вектору; иначе говоря, если справедливо равенство аа-j- fib pc -]- ... --|-хс/ = 0, где среди чисел а, р, р,... ,х хотя бы одно отлично от нуля. Определение 4. Система векторов а, Ь, с, ... , q называется линейно независимой, если равенство аа -С pZ? pc -j- • • • + = 6 возможно только в том случае, когда а = р — р - ... = х = 0. 2. Рассмотрим свойства введенных понятий. 1) Непосредственно из определений видно, что всякая ко- нечная система векторов является либо линейно зависимой, либо линейно независимой. Покажем, что система, состоящая из одного вектора, линейно зависима тогда и только тогда, когда этот вектор нулевой. В самом деле, равенство а© — Ь при любом а, в част- ности при а ф 0, установлено в п. 1 § 3. Пусть теперь х =£ 0 и 0.x — 0. Тогда а = 0 согласно п. 2 § 3. 2) Если часть системы линейно зависима, то и вся система линейно зависима. Пусть известно, что в системе а,Ь,с, ..., q часть, со- стоящая, например, из векторов с,..., q, линейно зависима. Значит, существуют числа р, ..., х, не все равные нулю и такие, что рс -1- ... v.q = 0. Но тогда линейная комбинация 0 • а 4~ 0 • b -j- ~[С -j- ... -J- v.q — 0 нетривиальна, поскольку отличные от нуля числа имеются среди р, ..., х. 3) Если вся система линейно независима, то и любая ее часть линейно независима. Это вытекает непосредственно из предыдущего свойства. В частности, нулевой вектор не может входить в линейно независимую систему.
26 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. I 4) Если система линейно зависима, то в ней найдется хотя бы один вектор, который линейно выражается через остальные векторы этой системы. В самом деле, если аа-ф--ф-ус-ф- ••• + v-q — ^, а среди коэффициентов а, р, ...,-х есть отличные от нуля, то любой из векторов, имеющих ненулевые коэффициенты, можно линей- но выразить через остальные векторы системы. Так например, если ау; О, то Свойство 4) не только необходимо, но н достаточно для линейной зависимости системы векторов. Именно, справед- ливо следующее утверждение. 5) Если некоторый элемент системы является линей- ной комбинацией остальных элементов этой системы, то система линейно зависима. Действительно, если а —р7>4-7'с+ то и линейная комбинация в левой части последнего равенства нетривиальна. 6) Пусть аь ak — какие-нибудь векторы. Пусть каждый из векторов Ci, cit ..., сп линейно выражается через ait ..., ak: С\ = аца1 -ф- ... -f- fbikak, c2 — a2iai -ф- ... -ф- а2Лал, cn — antai -ф- ... -ф- anftaft. Пусть далее вектор b линейно выражается через , (2^, Cj, • . . > Cn. b = X1ai~|- ... -ф-Xftaft-ф-piCj-ф- ... -|-Р‘ясл- Тогда вектор b линейно выражается через векторы ai,..., ak. Доказательство. b — (Xi -ф- jijaii -ф- ... -ф- pnani) <21 -ф- • • • • -ф- (X/, -ф- piaiA -ф- ... -ф- pnanfe)
§ 5] ЛЕММА О БАЗИСНОМ МИНОРЕ 27 § 5. Лемма о базисном миноре 1. Пусть дана прямоугольная матрица А —1| 1|. Будем рассматривать строчки этой матрицы как векторы координат- ного пространства К,„ а столбцы — как векторы коорди- натного пространства Кт (см. § 2, пп. 3—5). Тогда мы смо- жем говорить о линейной зависимости и независимости строк данной матрицы или о линейной зависимости и независимости ее столбцов. 2. Пусть отмечено k разных строк и k разных столбцов матрицы A(k^n, ksSL tn). Элементы ’) матрицы А, стоящие на пересечении отмеченных строк и столбцов, сами образуют некоторую, очевидно квадратную, матрицу В. Определитель матрицы В называется минором порядка k данной матрицы А. Отметим, если это возможно, еще одну строку и еще один столбец матрицы А, не повторяя тех, которые уже были отме- чены раньше. Теперь все отмеченные строки и столбцы своим пересечением определяют некоторую квадратную матрицу С. Определитель матрицы С есть минор порядка k -j-1 ма- трицы А. Мы будем называть е₽о окаймляющим для перво- начального взятого минора (т. е. для определителя матрицы В). Замечания. 1) Если k = n или k = m, то для мино- ров порядка k окаймляющих миноров нет. 2) Если А=1, то матрица В состоит из одного элемента матрицы А. Миноры первого порядка представляют собой численные значения элементов матрицы. 3. Определение 1. Минор матрицы называется базис- ным, если он не равен нулю, а окаймляющие его миноры либо все равны нулю, либо отсутствуют вовсе. Определение 2. Столбцы матрицы, пересекающие базисный минор, называются базисными столбцами. Анало- гичная терминология употребляется для строк. Замечание. Матрица может иметь несколько базис- ных миноров и соответственно несколько систем базисных ) Элементами матрицы называют составляющие ее числа: ап, als, ... Однако точнее следует сказать, что элементами ма- трицы являются символы ап, а12, ... При этом два элемента a,-ft и aji считают различными, если или ftytZ (не исключая воз- можности, что ajh и aji обозначают одно и то же число). Заметим еще, что в ряде случаев рассматриваются матрицы, где под а,-* подразумеваются не числа, а какие-нибудь другие объекты, напри- мер функции.
28 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. I столбцов. Всякая матрица, кроме нулевой, имеет по крайней мере один базисный минор и, тем самым, по крайней мере одну систему базисных столбцов. 4. Лемма о базисном миноре. Столбцы матрицы, пересекающие базисный минор, линейно независимы; всякий столбец через них линейно выражается. Эта же лемма, согласно определению 2, может быть высказана так: Базисные столбцы линейно независимы; любой столбец матрицы линейно выражается через базисные. Доказательство первого утверждения леммы — от противного. Предположим, что базисные столбцы линейно зависимы. Тогда линейно зависимы столбцы базисного минора. Но в таком случае базисный минор равен нулю, что проти- воречит его определению. Доказательство второго утверждения. Будем считать для определенности, что рассматриваемый базисный минор имеет порядок г и занимает левый верхний угол матрицы: <2ц ... atr ... а}/1 ... Qin <2ri ... а гг ... агь ... агп ат\ • • • атг • • • О-тЬ • • • ®тп Обозначим этот базисный минор через D. Возьмем произвольные индексы г, k (1 =g i =g m, и составим определитель порядка г —1 Оц ... С1г <21* <zrj ... агг агь ... а,г aik Докажем, что Д,-* = 0. Рассмотрим три возможных случая: 1) 2sgr. В этом случае Д,* = 0, так как в нем послед- няя строка совпадает с одной из предыдущих строк. 2) k г. В этом случае Д;* = 0 потому, что в нем по- следний столбец совпадает с одним из предыдущих.
§ 5] ЛЕММА О БАЗИСНОМ МИНОРЕ 29 3) i г, k~^>r. В этом случае определитель Д,-* является окаймляющим для минора D и равен нулю потому, что D — базисный минор. Зафиксируем k и будем считать, что I пробегает всевоз- можные значения от 1 до т. Разложим Aik по элементам последней строки. Алгебраи- ческие дополнения элементов последней строки обозначим через Аь ..., Ar<J. При изменении I эти величины остаются неизменными, так как алгебраическое дополнение какого-либо элемента зависит только от его места в опре- делителе, но не зависит от численного значения самого эле- мента. В результате разложения получим = А1ац ... -j- Arair -ф- Ar ^aik = 0, (1) причем = (2) Соотношения (1) и (2) дают aik = (— аП + • • • + ----yf) air- Напомним, что k зафиксировано, I пробегает все значения от 1 до т; поэтому Формула (3) представляет А-й столбец матрицы (который может быть взят произвольно) в виде линейной комбинации базисных столбцов. Лемма доказана. Замечание. Разумеется, аналогичная лемма имеет место и для базисных строк. 5. Как следствие леммы о базисном миноре получается следующая. Теорема. Определитель квадратной матрицы равен нулю в том и только в том случае, когда между столб- цами этой матрицы имеется линейная зависимость. Ана- логичное утверждение справедливо и для строк. Доказательство. Если столбцы п X «-матрицы зави- симы, то ее определитель равен нулю, что известно как одно из основных свойств определителей. Покажем, что если столбцы независимы, то определитель не равен нулю. В самом
ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. Г деле, если столбцы независимы, а определитель равен 0, то должен найтись базисный минор М порядка <^п. Но тогда имеется столбец, который не входит в систему базисных столбцов, соответствующую минору М, и который линейно выражается через эту систему, т. е. между столбцами имеется зависимость, что противоречит предположению. § 6. Основная лемма о двух системах векторов 1. Пусть даны две системы векторов alt а2, ... , ah и bt, Ьг, ..., bm из одного и того же линейного пространства. Лемма 1 (основная). Если система Ь\, Ьг, ..., Ьт ли- нейно независима, а каждый из векторов Ь, линейно выра- жается через систему ait а2, ..., ak, то т k. Доказательство проведем от противного. Предпо- ложим, что Выпишем формулы, выражающие векторы bt через векторы а/. bi — anai -ф- = -ф- (1) Ьт -1 — + • • • “Г am-l kak, — ат1&1 + • • • H amk^k и рассмотрим матрицу || a{j-1|. Если матрица || а,-у || нулевая, то bi= ... =bm = <J и система bi, ..., bm линейно зави- сима, что противоречит условию леммы. Пусть матрица || о.{]-|) не нулевая. Тогда она имеет базисный минор, причем поря- док базисного минора не превышает числа столбцов k. Число строк в матрице ||at-y||, равное т, больше k и, следовательно, больше числа базисных строк этой матрицы. Таким образом, матрица 1|<Ч7 || имеет некоторую систему базисных строк и еще по крайней мере одну строку, не входящую в эту систему. Согласно лемме о базисном миноре указанная строка линейно выражается через базисные. Но это означает, что между строками матрицы имеется линейная зависимость (см. § 4, п. 2, предложения 5 и 2). Напишем ее в виде 11 {«и, ..., «нФ -ф- ... -ф- Xm {ат1, ..., ат,ф = {0, ..., 0}, (2) где среди чисел ..., 'i~m есть отличные от нуля.
§ 6] ОСНОВНАЯ ЛЕММА О ДВУХ СИСТЕМАХ ВЕКТОРОВ 31 Умножим равенства (1) соответственно на Хъ Хт и сложим их почленно. Учитывая линейную зависимость (2), найдем Xi^i -|- ... -j- (?-lal 1 4“ ••• 4* ^фат1) 4" • • • ... 4~ ak (4al* 4- • • • ~'Г ^mamk) = 0 • О1 4~ • • • 4~ 0 " аь == Система bi, ..., bm оказалась линейно зависимой, что невоз- можно по условию леммы. Полученное противоречие пока- зывает, что лемма 1 доказана. 2. Говорят, что векторы образуют линейно независимую подсистему в системе а\, ..., ak(kесли векторы а^, ..., линейно независимы и входят в систему «в .... Очевидно, что система аь ..., ak содержит (по крайней мере одну) линейно независимую подсистему в том и только в том случае, когда среди векторов alt ..., ak имеется хотя бы один ненулевой. 3. Лемма 2. Пусть система векторов at, ..., аг, arii линейно зависима, а ее подсистема at, ..., аг линейно независима. Тогда вектор аг,^ линейно выражается через векторы а1г ..., аг. Доказательство. Имеем зависимость 4- • • ~Ь ^гаг 4- 4nar+i = (3) где среди чисел Х1(..., Хг, Хг+1 есть отличные от нуля. Ясно, что Xr+i не может быть равным нулю, так как в этом слу- чае оказалась бы зависимой подсистема aj, ..., аг. Таким образом, Хг+1 ф 0, и мы из формулы (3) находим ___[ Xj \ I ! Хг X ar+i — I — -у—I ai 4~ • • • 4~— >—) ап \ лг+1/ \ Аг+1/ что и требовалось доказать. 4. Определение. Пусть система .......ak содержит линейно независимую подсистему, состоящую из г векторов. Число г называется рангом системы ait ..., ak, если всякая ее подсистема из большего числа векторов линейно зависима, либо если таких подсистем нет совсем (is случае г = /г). Коротко: рангом системы называется максимальное число ее линейно независимых векторов. Если все векторы системы ..., нулевые, то будем говорить, что ее ранг равен нулю.
32 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. I 5. Л е м м а 3 (обобщенная основная). Пусть каждый из г векторов Ьь ..., bm линейно выражается через векторы аъ • • • > аь- Тогда ранг системы Ьъ..., Ьт не больше ранга системы аь ..., ak. Доказательство. Обозначим через г ранг системы tzi...ak. Если г —О, то справедливость утверждения леммы 3 очевидна. Если r = k, то справедливость утвержде- ния леммы 3 следует из леммы 1. В самом деле, ранг си- стемы bit ..., bm по лемме 1 не больше k = f. Пусть 0<^г<^/г. Тогда в системе аь ак найдется г линейно независимых векторов. Пусть это будут векторы аъ ..., аг. Добавляя к ним еще один вектор из системы Qi....а*, всякий раз будем получать линейно зависимые системы, а именно аь ..., at, ..., ait ..., аГ, ak. По лемме 2 каждый из векторов аг+1, ..., ak линейно выражается через векторы ..., ar. С другой стороны, по условию леммы каждый вектор Ьх, ..., Ьт линейно выра- жается через все векторы ai, ..., ak. Отсюда и из предыду- щего заключения следует, что каждый вектор bt, ..., brl линейно выражается через аь ..., аг (см. § 4, п. 2, предло- жение 6). Но тогда по лемме 1 число векторов в любой линейно независимой подсистеме системы blt ..., bm не больше г. Лемма 3 доказана. § 7. Ранг матрицы 1. Определение. Рангом матрицы называется макси- мальное число ее линейно независимых столбцов. Иначе говоря, ранг матрицы есть ранг системы ее столб- цов, рассматриваемых как векторы координатного про- странства. Ранг матрицы А будем обозначать символом Rang А. Если матрица А нулевая, то Rang А — 0, так как у пуле- вой матрицы нет линейно независимых столбцов. Отметим, что ранг ненулевой матрицы всегда положителен.
7] РАНГ МАТРИЦЫ 33 2. Теорема о ранге матрицы. Ранг произвольной матрицы равен максимальному порядку ее миноров, отличных от нуля. Доказательство. Если Rang А — 0, то А — нулевая Матрица, и у нее нет отличных от нуля миноров. Естественно Считать в этом случае, что максимальный порядок отличных от нуля миноров равен нулю. Пусть далее матрица А — не нулевая. Если некоторый ее минор М порядка г не равен нулю, а все миноры более высокого порядка равны нулю или отсутствуют вовсе, то М является базисным минором. По лемме о базисном миноре столбцы матрицы А, пересекающие минор 7И, линейно неза- висимы. Поэтому Rang А г. По той же лемме любой стол- бец матрицы А линейно выражается через базисные столбцы. Отсюда, применяя лемму 3 § 6, находим, что |Rang At^r. Таким образом, Rang^ = r, что и требовалось доказать. 3. Из рассуждений, проведенных в предыдущем пункте, (вытекает ряд важных следствий: 1) Ранг ненулевой матрицы равен порядку любого ее базисного минора. В самом деле, если М — произвольный базисный минор, г — его порядок, то, повторяя предыдущие рассуждения, находим, что Rang А — г. 2) Все базисные миноры ненулевой матрицы имеют одинаковый порядок, равный ее рангу. 3) Если в матрице А минор Л1 базисный, то все ми- норы более высокого порядка равны нулю (а не только миноры, окаймляющие 714). 4) Максимальное число линейно независимых строк произвольной матрицы А равно максимальному числу ее линейно независимых столбцов (то есть, равно рангу Л). Доказательство. Если матрица А нулевая, то число линейно независимых строк, как и число линейно независи- мых столбцов, равно пулю. Пусть А — ненулевая матрица. Транспонируем матрицу А. Тогда ее строки перейдут в столбцы транспонированной матрицы А*, линейно независимые строки перейдут в линейно независимые столбцы А*, а максималь- ный порядок отличных от нуля миноров сохранится, поскольку при транспонировании каждый из миноров сохраняет свое
34 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. I числовое значение. Таким образом, Rang А — Rang А* и равен максимальному числу линейно независимых строк матрицы А. 5) Если А — произвольная т^п-матрица, то Rang А не превышает меньшего из двух чисел т и п. 4. Из предыдущего ясно, что ранг матрицы не изменяется при перестановке ее столбцов или строк. Кроме того, ранг матрицы не изменится, если к одному из ее столбцов прибавить линейную комбинацию других столбцов, поскольку такая операция не изменяет числовых значений ее миноров. Аналогично ранг сохраняется, если к одной из строк прибавить линейную комбинацию других строк. Перечисленные в этом пункте свойства обычно исполь- зуются для вычисления ранга матрицы. Именно, данную мат- рицу преобразуют так, чтобы ранг не изменился, но чтобы в результате получилась матрица, у которой сразу виден базисный минор. § 8. Конечномерные и бесконечномерные пространства. Базис 1. Определение 1. Линейное пространство назы- вается п-мерным, если в нем имеется линейно независимая система, состоящая из п векторов, а всякая система, со- стоящая из большего числа векторов, является линейно за- висимой. Число п называется размерностью линейного простран- ства. Таким образом, размерность пространства — это наибольшее число его линейно независимых векторов. Например, пространство геометрических векторов (см. § 2, п. 1) трехмерно, так как в нем имеется три независимых век- тора, а любые четыре связаны линейной зависимостью. Гео- метрические векторы, расположенные в одной плоскости, образуют двумерное пространство; в нем любые два некол- линеарных вектора линейно независимы, а всякие три вектора линейно зависимы. Векторы, лежащие на одной прямой, образуют одномерное пространство. Линейное пространство,
РАЗМЕРНОСТЬ. БАЗИС 85 § 8] содержащее единственный элемент — нулевой вектор 6,— является нульмерным. 2. Все n-мерные пространства (и = 0, 1, 2, 3,...) образуют класс конечномерных пространств. Но этим не исчерпывает- ся множество всех линейных пространств вообще. Определение 2. Линейное пространство называется бесконечномерным, если для любого целого числа 7V^>0 в нем найдется линейно независимая система, состоящая из N векторов. Пример. Линейное пространство непрерывных на дан- ном сегменте функций (см. § 2, п. 6) является бесконечно- мерным. Чтобы убедиться в этом, достаточно рассмотреть степенные функции 1, т, т2, ..., tN. Нетрудно установить их линейную независимость. В са- мом деле, любая их линейная комбинация представляет собой многочлен степени не выше N “О + «It + a2t2 + • • • + «А^ —Р G). Но у всякого многочлена с ненулевыми коэффициентами есть лишь конечное число корней, поэтому />(?) = О, т. е. {р(т)} = 6 тогда и только тогда, когда а0 = = а2 = . .. = аЛг= 0. Тем-самым показано, что рассматриваемые элементы незави- симы, а само пространство бесконечномерно, поскольку чис- ло N может быть сколь угодно большим. 3. Введем весьма важное для дальнейшего Определение 3. Система векторов eJ( ..., е„ в про- странстве L называется базисом, если: 1) векторы Cj, ..., е„ линейно независимы; 2) любой вектор х из пространства L линейно выража- ется 61, ..., еп, то есть x = x1ei-\-...-\-xnen. (1) Равенство вида (1) называется разложением вектора х по базису 61, ..., е„; числовые коэффициенты хи хп называются координатами вектора х в этом базисе. 4. Теорема. Линейное пространство п-мерно тогда и только тогда, когда в нем есть базис, состоящий из п векторов.
36 ЛИНЕЙНЫЕ ПРОСТРАНСТВА ТТЛ. Г Доказательство. 1) Пусть пространство L является «-мерным. Это значит, что в нем есть линейно независимая система ....... е„, состоящая из п векторов, а добавив к ней произвольный вектор х из L, мы получим линейно зависимую систему et, ..., е„, х. По лемме 2 из § 6 век- тор х линейно выражается через векторы .... еп. Поэтому система е}, ..., е„ образует базис в L. 2) Пусть L имеет базис elt ..., е„. Рассмотрим в про- странстве L произвольную линейно независимую систему векторов Ьь Ьт. По определению базиса каждый из векторов bj линейно выражается через еь ..., еп. Поэтому miQn в силу леммы 1 из § 6. Значит, любая система векторов из L, содержащая более чем п векторов, линейно зависима. Вместе с тем, базис fi,..., еп образует линейно независимую систему, содержа- щую п векторов. Таким образом, размерность L равна и. Замечание. Как видно из проведенного доказательства, в «-мерном пространстве любая независимая система из п векторов является базисом. Б. В качестве приложения доказанной в п. 4 теоремы установим, что координатное пространство Кп является «-мерным. С этой целью рассмотрим в Кп векторы «?! = {!, О, 0}, «=<»• 0|: <2> «, = |0, 0.... I}. Согласно определению линейных операций в Кп (см. § 2, п. 3) любой вектор из Кп линейно выражается через векторы ₽i, ..., е„. Именно: х — (Xi, х^, .., хп| — x^i —|— | ... | хпеп. (3) Отсюда ясно, что линейная комбинация векторов eit еп равна 6= {0, 0, ..., 0} только в случае, когда все ее коэф- фициенты равны нулю. Значит, векторы eit ..., еп незави- симы и составляют базис /<„, так что пространство Кп яв- ляется «-мерным.
§ 9] ЛИНЕЙНЫЕ ОПЕРАЦИИ В КООРДИНАТАХ 37 § 9. Линейные операции в координатах 1. Пусть пространство L является n-мерным, а векторы Ci, • • > еп образуют в нем базис. Теорема 1. Разложение вектора по данному базису единственно. Доказательство. Пусть вектор х из L имеет два разложения: х = Х\в\ —|—... х„еп и х =Х1С14-... -4- хпеп. Тогда (J?i — xi)et -j-... -J- (хп — х„)е„ = б, а так как векторы базиса линейно независимы, то Xi —xi=... = x„ — х„ = 0, откуда Xj^X,...., хп = х„. Теорема доказана. Следствие. Все координаты нулевого вектора 9 равны нулю при любом выборе базиса: 6 —— 0 • -4~ 0 • е% 4-... -4~ 0 • еп. (1) Теорема 2. При умножении вектора на число каж- дая его координата умножается на это число. При сло- жении двух векторов складываются их соответствую- щие координаты. Доказательство. Пусть даны векторы х, у. Разло- жим их по базису: x = Xie1-4-...4-xne„, у — У1е14- • • 4~ Упеп- Пусть а — произвольное число. Вследствие аксиом линей- ного пространства имеем: ах = a (xte! 4-... 4- хпеп) = (axi) б! 4-... 4- (ах„) еп. Таким образом, вектор ах имеет координаты ахь..., ахп. Далее, х - j-у = (xtet -J- • • • 4~ хпеп) 4“ (Уiei 4~ • • • 4~Упеп) = = (-*14" Ji) ei 4- • • • + (хп 4"Ул) еп> то есть вектор х 4~у имеет координаты хг 4"Уь • • •, хп -\~Уп-
88 ЛИНЕЙНЫЕ ПРОСТРАНСТВА 2. Пусть a, b,..., q— произвольная из L. Разложим каждый из них по базису: G| • - • ] Ппепу b — bi€i -[-... -J- Ьпет Я = <71^ qnen и наряду с векторами (2) рассмотрим матрицу ГЛ, образован- ную их координатами: м = ь, ... ьп Я1 ••• Яп Тогда справедлива Теорема 3. Ранг системы векторов (2) равен рангу матрицы М. Доказательство. Предположим, что между векто- рами (2) имеется линейная зависимость aa4-₽fc + ... + x? = e. (3) Тогда из формул (1), (3), теоремы 2 и теоремы 1 имеем a {«1,. 4“ Р - ”>^n} +•••“!-••Pin} = {0,.. .,0}. (4) Иначе говоря, между строками матрицы 714 имеется ли- нейная зависимость с теми же коэффициентами а, р, ... , х. Обратно, из (4) следует (3). Аналогичные рассуждения можно провести, взяв не всю систему (2), а какую-нибудь ее под- систему и соответствующую подсистему строк матрицы М. (т. е. те ее строки, в которых выписаны координаты векто- ров выбранной подсистемы). Поэтому подсистема векторов из системы (2) линейно независима тогда и только тогда, когда линейно независима соответствующая подсистема строк матрицы М. Значит, максимальное число линейно независи- мых векторов системы (2) совпадает с максимальным числом линейно независимых строк матрицы М. Теорема 3 доказана. 3. Если число векторов в системе (2) равно п, то мат- рица М становится квадратной. В этом случае получаем следствие предыдущей теоремы;
§ 101 ИЗОМОРФИЗМ ЛИНЕЙНЫХ ПРОСТРАНСТВ 39 В п-мерном пространстве система из п векторов ли- нейно зависима тогда и только тогда, когда опреде- литель матрицы координат этих векторов равен нулю: Д — Det М — 0 (т. е. когда ранг матрицы Л4 меньше п). Легко понять, что это утверждение по существу не отли- чается от теоремы в п. 5 § 5. Оно нередко используется при практической проверке линейной зависимости или неза- висимости конкретных систем векторов. § 10. Изоморфизм линейных пространств 1. Пусть даны два линейных пространства L и L' и между ними установлено взаимно однозначное соответствие, то есть: 1) каждому вектору а из L соответствует некоторый вектор а' из //,' 2) разные векторы из L имеют разные образы в L'; 3) образы элементов из L заполняют все I’. Определение. Пространства L и £' называются линейно изоморфными, если между ними можно установить взаимно однозначное соответствие с соблюдением условий (а —|— Ь) •— а —|— b, (аа)' = аа'. (1) (2) Взаимно однозначное соответствие, удовлетворяющее усло- виям (1) и (2), называется линейным изоморфизмом про- странств L и L’. Иначе говоря, при линейном изоморфизме образ суммы равен сумме образов, а образ произведения вектора на число равен произведению его образа на это же число. Алгебраи- ческие и геометрические свойства линейно изоморфных про- странств совершенно тождественны. Замечание. Линейный изоморфизм возможен лишь при условии, что и в L, и в L' числовые множители берутся из одного и того же алгебраического поля (например, оба пространства L и L' действительны или оба комплексны). Так, если L — комплексное, a L' — действительное, то условие (2) невыполнимо потому, что в I.’ не определено умножение на комплексные множители, допустимое в L.
40 ЛИНЕЙНЫЕ ПРОСТРАНСТВА ГГЛ I Теорема 1. Для каждого п все действительные п-мерные пространства линейно изоморфны между собой. Теорема 1а. Для каждого п все комплексные п-мерные пространства линейно изоморфны между собой. Доказательства теоремы 1 и теоремы 1а формаль- но совпадают, разница состоит лишь в том, что числовые множители берутся из разных полей. Пусть L и L' оба л-мерны, причем оба действительны или оба комплексны. Вы- берем произвольный базис в каждом из них: еь еп£ L; 4> ..., I-1). Пусть х—какой-либо элемент из L. Разложим его по базису: х = XiC] -I-... -{- хпеп. Поставим в соответствие элементу х такой элемент х! £ V, что х! = хре\-\-...-\-хпеп. Вследствие теоремы о единственности разложения век- тора по базису такое соответствие взаимно однозначно. Про- верим выполнение условий изоморфизма: 1) U + У)’ = Ui + >0 е’1 + • • • + Un + Уп) еп = Uicj 4- - • • + хпе^) - j- (ytei 4-... 4-упе„) = х' 2) (ах)’ = (ах,) 44-...-)- (ах„) е'п — a (х^ -)-••• + *п4) = = ах'. Мы видим, что установленное соответствие между L и L' удовлетворяет условиям (1), (2). Теорема доказана. Замечание. Фактически доказано, что изоморфны лю- бые два линейных пространства одинаковой размерности над одним и тем же алгебраическим полем. 2. Вследствие доказанной теоремы все действительные «-мерные линейные пространства изоморфны действительному координатному пространству К„; все комплексные «-мерные пространства изоморфны комплексному К„. Таким образом, в теории «-мерных линейных пространств, не теряя общности, можно ограничиться изучением пространств Кп. ’) Символ £ обозначает включение данного элемента в данное множество. Запись e^L читается так: принадлежит /.».
§ 10] ИЗОМОРФИЗМ ЛИНЕЙНЫХ ПРОСТРАНСТВ 3. Теорема 2. Линейное пространство, изоморфное п-мерному, само является п-мерным. Доказательство. Пусть дано n-мерное линейное пространство L, и пусть L'—пространство, изоморфное L. Докажем сначала, что при линейном изоморфизме образом пулевого элемента 6 £ является нулевой элемент простран- ства L'. Для этого возьмем произвольный элемент а’ £ L' и его прообраз а £ L. Так как а = a J- 6, то с' = (а + еу. (3) Но по определению изоморфизма (а 4-6)' = а'4-6'. (4) Из (3) и (4) следует: а'-]-О' —а'. Поэтому образ 6' эле- мента 6 является нулевым элементом пространства Покажем далее, что если в L взять независимую систему векторов, то их образы будут независимыми векторами в L'. Пусть а, Ь, ..., q — независимая система в L. Рассмот- рйм соотношение аа' 4- р// 4- • • • 4- = 6'- (5) По определению изоморфизма равенство (5) можно перепи- сать так: (аа 4- р& 4-... 4- х<?)' = 6'. А так как прообразом нулевого элемента является нулевой вектор из L, то аа 4- [ib 4~ • • • 4~ *Я = 0- (6) В силу линейной независимости векторов а, Ь, ..., q в L из (6) следует, что а — р =... = /. = 0. (7) Таким образом, из (5) вытекает (7); значит, векторы а',Ь', ... ...,q' независимы в L’. Так как пространство L является п-мер- ным, то в нем есть п линейно независимых векторов. Их образы в L' также независимы. Значит, размерность L' не меньше чем п. В этом рассуждении можно поменять ролями L и Lr, и тогда получится, что размерность L не меньше, чем
42 ЛИНЕЙНЫЕ ПРОСТРАНСТВА ГГЛ. Г размерность I.'. Поэтому размерность L' равна п, и теорема доказана. Следствие 1. Конечномерные пространства разных размерностей не изоморфны. Следствие 2. Бесконечномерное пространство не изоморфно никакому конечномерному. § 11. Соответствие между комплексными и действительными пространствами 1. Конечномерные комплексные и действительные линей- ные пространства находятся в некотором соотношении, смысл которого будет сейчас выяснен. Начнем с рассмотрения при- мера. Геометрические векторы, расположенные на одной прямой, образуют одномерное действительное линейное пространство. Это связано с тем фактом, что посредством умножения на действительное число произвольный ненулевой вектор можно преобразовать в любой другой коллинеарный ему вектор. Геометрические векторы, расположенные на плоскости, образуют двумерное действительное пространство. Здесь уже нельзя фиксированный вектор преобразовать путем умноже- ния в любой другой. Запас действительных множителей слишком мал по сравнению с разнообразием векторов, вхо- дящих в это пространство, и потому два вектора могут оказаться линейно независимыми. Запас комплексных множителей вдвое богаче. Поэтому умножение векторов на комплексные числа можно определить так, что совокупность геометрических векторов на плоскости превратится в одномерное комплексное пространство. Для этого нужно иметь возможность путем умножения преобра- зовать всякий ненулевой вектор данной плоскости в любой другой вектор той же плоскости. Эта задача решается, если определить произведение гео- метрического вектора на комплексное число следующим образом. Пусть а — произвольный вектор на плоскости. Будем считать, что он отложен из начала координат. Пусть далее а = р (cos у -ф- i sin <?) — комплексный множитель. Повернем вектор а вокруг начала координат на угол <р, а затем умно- жим на действительное число р. Полученный вектор обозна-
$ 11] КОМПЛЕКСНОЕ И ДЕЙСТВИТЕЛЬНОЕ ПРОСТРАНСТВА 43 чим через b и положим аа = Ь. Складывать векторы по- прежнему будем по правилу параллелограмма. При таком определении сложения и умножения все акси- омы линейного пространства соблюдаются. Чтобы убедиться в этом, достаточно заметить, что сами комплексные числа изображаются векторами на плоскости и что у нас сложение векторов и умножение комплексного числа а на вектор а определены точно так же, как обычно определяют сложение комплексных чисел и умножение комплексного числа а на комплексное число а. Поэтому в нашем случае аксиомы 1)—8) соблюдены, поскольку они соблюдены для комплекс- ных чисел. Теперь какой-нибудь один ненулевой вектор об- разует линейно независимую систему, а любые два вектора линейно зависимы (поскольку умножение включает поворот), так что полученное комплексное пространство является одно- мерным. 2. Мы видим, что одномерное комплексное пространство и двумерное действительное пространство можно построить из одних и тех же предметов, именно из векторов на пло- скости, причем сложение векторов будет определено одина- ково в обоих случаях. Умножение определяется по-разному, что неизбежно, так как различны запасы множителей. Подчеркнем, однако, что умножение на действительные числа производится в этих пространствах одним и тем же способом. 3. Легко убедиться, что рассмотренный пример является частным случаем более общего явления: каждому комплекс- ному линейному пространству соответствует действительное пространство вдвое большей размерности, причем соответ- ствие хотя и не является изоморфизмом, но очень похоже на изоморфизм. Именно, справедлива Теорема. Комплексное линейное пространство Сп размерности п можно взаимно однозначно отобразить на действительное линейное пространство Т2„ размерности 2п так, что соблюдается условие (аb)'— а'b', (1) а для действительных множителей X соблюдается условие (ka)' = kar. (2)
44 ЛИНЕЙНЫЕ ПРОСТРАНСТВА ГГЛ I Замечание. Как и в § 10, здесь штрихом помечается образ в Lin элемента из Сп. Доказательство теоремы. Согласно § 10 все комплексные n-мерные пространства изоморфны. Поэтому мы можем ограничиться рассмотрением любого из них. Возьмем в качестве Сп комплексное координатное пространство. Пусть а = {Xj -ф- IX.,, Х3-|-/Х4, •••> д ф /Л'2п} — любой элемент из Сп. Сопоставим с ним элемент П --Х%, Х§, Xfo • •, из действительного координатного пространства, которому мы придаем роль Lvn. Так как разложение комплексного числа на действительную и мнимую части производится един- ственным образом, то установленное между С„ и L2n соот- ветствие взаимно однозначно. Справедливость (1) и (2) при действительном Л усматривается с очевидностью. Замечание. При п = 1 имеем а — [х -ф- 1у], а' = [х, у}, что возвращает нас к исходному примеру. 4. В дальнейшем, говоря о геометрических векторах, мы будем считать их элементами действительного пространства. § 12. Линейное подпространство 1. Пусть L — линейное пространство, L — некоторое мно- жество элементов из L. Определение. Множество L в пространстве L назы- вается линейным подпространством, если соблюдены сле- дующие условия: 1) для любых х, у из L их сумма х-{-у также входит в L; 2) для любого х С L и любого числа а произведение ах С L. Замечание. Ради краткости мы будем во многих слу- чаях линейное подпространство называть просто подпро- странством. 2. Пусть L — линейное подпространство в L. Операции сложения векторов и умножения их на числа, заданные в L,
ЛИНЕЙНОЕ ПОДПРОСТРАНСТВО 45 § 12] будем рассматривать применительно лишь к тем элементам, которые входят в L. Тогда справедлива Теорема 1. В линейном пространстве L каждое ли- нейное подпространство L само является линейным про- странством. Доказательство. По определению подпространства действия сложения и умножения на число не выводят за пределы L. Аксиомы линейного пространства 1)—2) и 5)—8) заведомо выполнены в L, так как они выполнены вообще для всех элементов L. Поэтому для доказательства надо про- верить только аксиомы 3) и 4), то есть установить, что вместе с каждым элементом х из L в подпространство L входит противоположный элемент — х и что 0 £ L. По второму условию определения подпространства имеем — х = (—1)-х С L. Применяя первое условие, получаем 0 — х (— х) С L. Теорема доказана. 3. Пересечением некоторой совокупности множеств назы- вается совокупность тех элементов, которые одновременно принадлежат всем рассматриваемым множествам. Пересечение двух множеств и а® обозначается символом сЛ S3. Эту запись мы неоднократно используем ниже. Теорема 2. Пересечение любой совокупности подпро- странств данного линейного пространства L тоже яв- ляется линейным подпространством. Доказательство для простоты изложения проведем в случае двух подпространств и Lg. Пусть L3 = Lj £2, а векторы х, у принадлежат L3. Рассматривая х, у как эле- менты Li, по определению подпространства находим, что х € Ьь ах £ Li (а—произвольное число). Точно так же x-j-_yC Lg, ах g Lg. Но это значит, что x-j-_yC L3, ах £ поэтому L3 удовлетворяет определению подпро- странства. Теорема 2 доказана. 4. Примеры подпространств. 1) Множество L, состоящее только из одного нулевого элемента 0 данного
46 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. t пространства, образует его подпространство. Действительно, е_|-е=б g д «6=0^1. 2) В л8-мерном пространстве квадратных п X «-матриц множество симметрических матриц ||aZft||, то есть таких, что а/л = ал;, образует подпространство. Множество кососимметрических матриц, характеризу- ющихся тем, что aik — — aki, также образует подпростран- ство в пространстве п X «-матриц. 3) В пространстве всевозможных функций, заданных на отрезке тд т т2, каждое из следующих множеств обра- зует линейное подпространство: а) функции, непрерывные в некоторой внутренней точке т0 интервала т т2; б) функции, непрерывные в интервале -ti в) функции, непрерывные на всем отрезке [tj, t8]; г) функции, непрерывные на отрезке [тъ т2] вместе с их производными до порядка N включительно, где N—про- извольное целое положительное число; д) функции, имеющие па отрезке [т1э т2] производные всех порядков; е) всевозможные многочлены, рассматриваемые на отрезке [тд ta]; ж) многочлены, степени которых не превосходят фикси- рованного целого числа N^>0. В примере 3) каждое из перечисленных выше подпро- странств содержится в предыдущем, и все они, за исключе- нием последнего, бесконечномерны (последнее имеет размер- ность 7V-|- 1). з) Зафиксируем на отрезке [т1; т2] произвольное множе- ство точек е-Х. Функции, равные нулю в точках множества аЛ, также образуют подпространство. В качестве упражнения предлагаем читателю выяснить, как зависит размерность этого подпространства от выбора множества еХ. 4) Пусть L — трехмерное пространство геометрических векторов в обычном евклидовом пространстве. Будем считать, что векторы отложены из начала координат. Рассмотрим все векторы, расположенные в какой-нибудь плоскости, прохо- лящей через начало координат. Такие векторы образуют под- пространство.
5 i3] ЛИНЕЙНАЯ ОБОЛОЧКА 47 Доказательство того, что перечисленные выше подпро- странства действительно удовлетворяют определению п. 1, предоставляем читателю. 5. Укажем примеры подмножеств линейного пространства, которые не являются подпространствами. а) В трехмерном пространстве геометрических векторов рассмотрим совокупность векторов, концы которых лежат в фиксированной плоскости, не проходящей через начало координат. Они не образуют подпространства, так как и сумма двух векторов, и произведение вектора на любое число (=£ 1) уже не входят в это подмножество. б) В этом же пространстве рассмотрим векторы, концы которых лежат на поверхности конуса с вершиной в начале координат. Произведение любого вектора из рассматриваемого множества на любое число снова принадлежит этому множе- ству. Тем не менее указанное множество не является под- пространством, так как операция сложения, вообще говоря, выводит за его пределы. § 13. Линейная оболочка 1. Пусть в линейном пространстве L дана система векто- ров alt ..., ак. Определение. Множество всевозможных линейных комбинаций вида X = сцй! -|-... -}- а*ал называется линейной оболочкой данной системы и обозна- чается символом L(at, ..., ak). Иногда говорят, что L(alt ..., —линейная оболочка, натянутая на векторы аь ..., ak. Теорема 1. Линейная оболочка любой системы век- торов является линейным подпространством в простран- стве L. Доказательство. Возьмем из линейной оболочки L(ai, ak) произвольные векторы х и у: X = a.iai-\-...-\-a.kak6. L(ab •••• а/г)> у—Pi^i -f-... -f- ^kak € ь (й1, • • • > йл). Тогда ^4~.У = (а1~Ь₽1)й14--..~Ь(<хлЧ-₽л)а* € Ь(й1, ...» ak).
48 ЛИНЕЙНЫЕ ПРОСТРАНСТВА ГГЛ. Г Кроме того, для любого числа X имеем Хх —(Xa1)ai-{-...4-(bft)aft С L(ait ак). 2. Замечание. Линейная оболочка L (аь .... aft) может совпасть со всем пространством L (например, если аь ... ..., ак— базис в L). 3. Теорема 2. Если каждый вектор системы ск,ст линейно выражается через векторы системы alt .ak, то L(cb cm)czL(al, .... ak)'). Доказательство. Пусть х( L(ci..........ст\ т. е. вы- ражается через Сь ..., ст. Тогда, согласно свойству 6) п. 2 § 4, вектор х выражается через ai....ак. Следовательно, х£ i(ai, ...» а.к). Таким образом, L(c1( ..., .....ак). Следствие. Линейная оболочка любой подсистемы дачной системы векторов включается в линейную обо- лочку всей данной системы. Теорема 3. Если система аь ..., ак имеет ранг г 0, то всякая ее линейно независимая подсистема, со- стоящая из г векторов, является базисом в линейной оболочке L(ai, ..., ak). Доказательство. Система аь ..., ак ранга г(г^>0) имеет линейно независимую подсистему, состоящую из г век- торов. Предположим для определенности, что линейно назави- симы первые г векторов данной системы. Тогда, так как ранг системы аь ..., ак равен г, то каждый из векторов ак линейно выражается через векторы ai.............. аг. Отсюда и по теореме 2 X (&1> •. •, аг, агЛ.\, • •, ак~) <—. / (oj, «- *, а^). С другой стороны, по следствию из теоремы 2 L (ai. • • •, а^ <—L (й|, ..., аГ, йГ4-ь •.., аку. Следовательно, L(alf ..., аг, а.^, ..., ак) совпадает с I.(ai, ..., аг). Значит, каждый элемент х из L(at, ..., ак) 1) Символ г~ обозначает включение первого из указанных мно- жеств во второе. Запись вида СаЙ* читается «еЛ? содержится в ЛЗ» (при этом не исключено, что совпадает с о®).
5 13] ЛИНЕЙНАЯ ОБОЛОЧКА 49 разлагается по аь ..., аг. Поэтому и вследствие независи- мости векторов аь ..., а. они составляют базис в L (аь .,., ak). Теорема 4. Если ранг системы аь ak равен г, то L (alt ..., ak) является r-мерным подпространством. Доказательство. Предположим, что г^>0. Тогда по предыдущей теореме в L (at, • • •, аЕ) имеется базис из г эле- ментов. Отсюда и по теореме из п. 4 § 8 L («ь .... ak) имеет размерность, равную г. Предположим, что г — 0. В этом случае ai — ... = ak — 0. Но тогда L(ai, ..., ak) включает только 0 и, следовательно, имеет размерность 0. 4. Рассмотрим примеры. 1) Пусть а, Ь, с (а б)— геометрические векторы, лежащие на одной прямой. В этом случае L(a, b, c) = L(a) (рис. 1). Рис. 1. Здесь L (а) — одномерное подпространство, которое со- стоит из всех векторов, лежащих на данной прямой; вектор а в этом подпространстве составляет базис. 2) Пусть а, Ь, с — геометрические векторы, причем а и b не коллинеарны, с = а-\-Ь. В этом случае L(a, b, c) — L(a, Ь) (рис. 2), так что произвольный вектор х Q L(a, b, с) пред- ставляется в виде х — аа -ф- pfe. Здесь L(a, b) — двумерное подпространство, которое со- стоит из всех векторов, компланарных с векторами а, Ь. Векторы а, b составляют базис в L (а, Ь). 3. Пусть функции 1, т, т2, .... рассматриваются как элементы линейного пространства L непрерывных функций, заданных на отрезке [ti, tg]. Тогда 1(1, t, т2, ..., xN) есть подпространство 1, состоящее из всех многочленов степени не выше N. 5. В заключение отметим одно очевидное, но важное пред- ложение: в конечномерном пространстве всякое подпро- странство является линейной оболочкой некоторой си- стемы элементов. Для доказательства достаточно заметить, что в «-мер- ном пространстве 1 всякое подпространство 1 конечномерно
ЛИНЕЙНЫЕ ПРОСТРАНСТВА ГГЛ. I (причем имеет размерность л; это ясно, так как максималь- ное число линейно независимых элементов в I не может быть больше, чем в L). Но в таком случае либо L нуль- мерно, и тогда L = L (6), либо L имеет базис qx, qr, и тогда L — L(qit ..., qr). В последнем случае подпространство L состоит из тех и только тех векторов, которые имеют вид = (1) где tb tr — произвольные числа. Пусть в пространстве L имеется базис еь еп, причем х — х^ +... + хпеп, 4i = qnei 4- + • • + Чп^п (здесь 1=1, ..., г; хь ..., хп — координаты вектора х; qu, #S(-, •••> Чт—координаты вектора qj}. Тогда формулу (1) можно заменить соотношениями в коор- динатах Х\ = 411^1 4” ^>'2^2 4- • • • 4" Ч1Л> (2) хп—4“ 4~ • • • 4" #nAг- Соотношения вида (2) называются параметрическими уравнениями подпространства L(qi, ..., qr).
§ 14] СУММА ПОДПРОСТРАНСТВ. ПРЯМАЯ СУММА 51 §14. Сумма подпространств. Прямая сумма 1. Пусть в линейном пространстве L даны два линейных подпространства Li и L?. Обозначим через L множество всех векторов х, представимых в виде Х = Xi -|- лу, где Xi С Ii, € I'i (рис. 3). Легко убедиться, что L есть линейное подпространство в L. В самом деле, возьмем вместе с х С L еще вектор х' £ L, т. е. а/ = xt х.}, где х[ £ Li, х$ £ L$ тогда вектор X + х' = (лу -j- x'i) 4- (Xi 4- xj) принадлежит L, так как _>у4--4 С Li, лу4^-4С Ьа- Кроме того, ах — алу 4~ сау £ Ь> так как ®*t € М, «лу С Подпространство L называется суммой подпространств Lt и 12 и обозначается так: L = Li-,rLi. На рис. 3 показан частный случай, когда L — L трехмерно, и Li двумерны. 2. Понятие суммы подпространств непосредственно пере- носится на любое число слагаемых. Именно, пусть в про- странстве L даны подпространства Llt ..., тогда их сумма L = Li 4- Li 4-... 4- Lk есть линейное подпространство, состоящее из всех векторов вида х = х14-...4-хь где Xi С Li, ..., xk £ Lh. (1)
52 ЛИНЕЙНЫЕ ПРОСТРАНСТВА ГГЛ. Т 3. Определение. Если для каждого х £ L разложе- ние (3) единственно, то L называется прямой суммой под- пространств Li, .... L*. Для обозначения прямой суммы мы будем пользоваться знаком ф, например: £ = М @ @ @ ^k- Мы будем употреблять знак @ в тех подчеркнуть, что речь идет именно о статочные для того, чтобы сумма случаях, когда нужно прямой сумме. В качестве примера на рис. 4 показана пря- мая сумма одномерных подпространств и L* Отметим, что сумма Ц 4" Ь-j на рис. 3 не является прямой суммой. В двух следующих пунктах даются усло- вия, необходимые и до- подпространств была прямой суммой. 4. Теорема 1. Сумма L = Li-|-L* является прямой суммой подпространств Ц,..., Lk тогда и только тогда, когда ни одно из подпространств Li, ..., Lk не имеет общих элементов, кроме б, с суммой остальных. Доказательство. 1) Пусть дано, что пересечение каждого из рассматриваемых подпространств с суммой опаль- ных состоит только из нулевого вектора 6. Докажем, что 1 = Li @.. Lk. Предположим, что для вектора х С L существуют два разложения: х = Xi л'я -j-... -j- Xk, X — Jci -f- -|- xk, (2) где Xj £ Lj, Xj £ Lj. Нужно проверить, что Xj = Xj (3) для каждого из номеров /. Из (2) имеем О — (Xj — А'1) -j- (Xg — Xg) -J-... -J- (xk — xft). (4)
§ 141 СУММА ПОДПРОСТРАНСТВ. ПРЯМАЯ СУММА 53 Положим У1 — — (Xi—xt). Тогда yt = xt—xt £ Lt, = (х8 — х2)— Х/г) С Т2Тд., и потому yt = 9, то есть Xi = х,. Далее, вводя Уч~— (х2— х2), пользуясь равенством (4) и тем, что L2 Р| (Li 4~ L3 -|-... L*) — 9, получаем x2 = xg. Аналогично доказываются остальные равенства (3). 2) Пусть дано, что для любого xL L разложение (1) единственно. Покажем, что, например, Lj не имеет с L2 4-... -|- Lfe общих элементов, кроме 9. Предположим про- тивное, т. е. что есть z 9 такой, что zL Lt, zL L2 ... 4~ Но в таком случае z — zg . -|- zk, где z2 £ L2,... ..., zk С L*. Поэтому можно написать 9==z 4~(——0гл> где z С Li, г2 £ L2, ..., zk £ Lk. С другой стороны, 9 = 9-|-94-. ..4-9. Таким образом, для 9 с L получились два разных разло- жения вида (1), что противоречит условию. 5. Теорема 2. L = Li4-..-4~^* является прямой суммой подпространств Lt, .... Lk в том и только в том случае, если всякая система ненулевых векторов aj.а*, взятых по одному из каждого Lj (т. е. aj £ Lj, j — = 1....k), линейно независима. Доказательство. 1) Пусть L является прямой суммой подпространств L\, Lk- Возьмем произвольные ненулевые векторы аь ..., ak по одному из каждого Lj (aj £ Lj). До- кажем, что они линейно независимы. Предположим, что си- стема alt ..., ak зависима. Тогда один из этих векторов линейно выражается через остальные. Будем считать для опре- деленности, что at линейно выражается через а2, ..., ak. Но в таком случае этот вектор принадлежит и Lt, и сумме Т2-|_•••4“Lk, что противоречит теореме 1. 2) Пусть любая система ненулевых векторов at, ..., ak, взятых соответственно из Lt....... Lk, линейно независима. Докажем, что L = 1^Lk есть прямая сумма. Пред- положим противное. Тогда по теореме 1 одно из подпро- странств Llt ..., Lk имеет общий ненулевой вектор с суммой остальных. Пусть, например, ненулевой вектор at принадле- жит Li и L%-|-...4- L^ Тогда ai = at-^~.. ak{at L^,...
54 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. I a’k С £-*)• Вместо последнего соотношения можно напи- сать а1 = ега2-|-..считая ег = 0 в случае а, —О и беря в этом случае в качестве «,• любой вектор из L,-, лишь бы он не был равен 0; если же а, ф 0, то будем считать ег = 1 и at = al. Тем самым указаны ненулевые векторы at, ak, at £ которые связаны линейной зависимостью. Мы полу- чаем противоречие с условием теоремы. 6. Если само пространство L разложено в прямую сумму своих подпространств Lf, ..., Lk, то каждый вектор х раз- лагается, и притом единственным образом, на компоненты Xi, ..., хк, лежащие соответственно в Llt ..., Lk. В частности, если et, еп — базис в L, то L разла- гается в прямую сумму одномерных подпространств: L — = Li ф •. • © Ln, где Li — линейная оболочка базисного век- тора et (т. е. Lt состоит из векторов, которые получаются умножением ег на всевозможные числа). 7. Теорема 3. Пусть в линейном пространстве L имеются подпространства Lk и Ц, размерности которых соответственно равны k и I. Если их пересечение имеет, размерность т, то размерность их суммы Lk-\-Li равна r = k~\~l — т1). Для доказательства теоремы 3 потребуется Лемма. В п-мерном пространстве всякую независи- мую систему векторов в числе, меньшем чем п, можно дополнить до базиса. Доказательство леммы. Пусть еь ..., ek — неза- висимая система векторов, k<^n. Найдется по крайней мере один вектор такой, что eit ..., ек, ek+i — тоже незави- симая система. Если бы такого вектора ек+1 не было, то любой вектор из L можно было бы выразить черезе1г..., ек, что противоречит условию k<^n. Если k-\-\<^n, то рассуждение можно повторить и до- бавить к системе еще один вектор, не нарушая линейной независимости. Так можно продолжать до тех пор, пока число векторов в системе достигнет п; тогда она превра- тится в базис. Лемма доказана. Доказательство теоремы 3. Положим Lm = — Lk[]Li и выберем в подпространстве Lm базис ..., ет. J) В частности, при т — 0 сумма Lk Д- Li будет прямой.
§ 14] СУММА ПОДПРОСТРАНСТВ. ПРЯМАЯ СУММА Б5 Используя лемму, дополним его до базисов в подпростран- ствах Lk и Lp Cj, ..., ..., - базис в Lk, ^1, •••> em.rl, • ••, баЗИС В £./, Сопоставляя определение суммы подпространств с опре- делением линейной оболочки (см. § 13), найдем, что Lft -I- Ll = L (Cl, а а а , С т а а а , С*, Стг1, • • • , е l)‘ (5) Докажем, что векторы ^Ь • • • > ет> > ek> ет+Ъ • • > е1 (6) линейно независимы. Предположим противное. Пусть суще- ствует нетривиальная зависимость а1е1 ~Ь • • • ~Ь а-тет ~Ь am+lem+l ~Ь • • • • • • -|- akek "j_ afe+l^m+1 ~Ь • • • И- °ге1 — (7) Среди чисел аЛ1Ь ..., а.г есть отличные от нуля, иначе были бы линейно зависимы векторы et, ..., ет, em+l, ...,ek, образующие базис в L*. Положим a*+iem+i~|-- ..-J-arcz — ХФ 6. (8) Из (8) следует, что х С Lh а из (7) следует, что х £ Lk, поэтому х С Li [~| Lk. Следовательно, х линейно выражается через векторы е1г ..., ет. Таким образом, имеется соотно- шение вида a*+lem+l -f- • • • -4- O-r^l = Pl^l ~Ь • • • ?mem- (9) Равенство (9) означает нетривиальную линейную зависи- мость между векторами еь ..., ет,е'т,ъ ...,е\, что невозможно, поскольку указанные векторы образуют базис в Lz. Тем самым мы получили противоречие, и независимость векторов (6) доказана. Теперь соотношение (5) означает, что векторы (6) образуют базис в ТЛ-|-1г. Следовательно, размерность Lk -J- Li равна числу векторов в системе (6), то есть числу r = k-\-l—т. Теорема 3 доказана. 8. Теорема 4. Размерность прямой суммы подпро- странств равна сумме размерностей слагаемых. Объеди- нение любых базисов, выбранных по одному в каждом сла- гаемом, образует базис в прямой сумме.
56 ЛИНЕЙНЫЕ ПРОСТРАНСТВА ГГЛ. Г Доказательство. Если слагаемых два, то первое утверждение теоремы 4 вытекает из теоремы 3 с учетом теоремы 1, вследствие которой т = 0. Второе утверждение теоремы 4 в случае двух слагаемых следует из доказательства теоремы 3, точнее, из того факта, что система векторов (6) независима (в записи системы (6) теперь нужно положить т = 0 и вычеркнуть векторы ^1, ..., Ст). Заметим далее, что если Е, -ф- L2 -ф- L3 -ф- • • • 4* Lp есть прямая сумма, то Et -J- L* Lt -ф- Е2 4~ Е3 = (Ei 4~ Е2) -ф- L3 и т. д. также являются прямыми суммами. Поэтому в общем слу- чае оба утверждения теоремы 4 доказываются по индукции. 9. Отметим, наконец, следующее сочетательное свой- ство для прямых сумм: если L = LV®L, (I) Е = Е2©...фЕА, (II) то Е = Li ф Е2 ф • •. © Е*. (Ill) Доказательство. Пусть х — любой элемент L. Имеем: x — Xi-^-х, где Xi£Li, х £ Е. Так как х £ Е, то х = = х2-|-... ф-xk, где х2£ Е2, ..., xk С Eft. Таким образом, для любого х £ Е имеем X == Xj —|— Х2 —1~ • • • 4“ (*) где х; £ Lt. Обратно, из (*) следует х £ Е. Докажем един- ственность (*). Пусть x = xj©x2©...©Xft, x'i^Li. Отсюда х=х'1-\-х’; здесь х' = х24~ • - •4_-г*- Следова- тельно, х' С Е. Поэтому и согласно определению (I) полу- чаем x[ — Xi, х' = х. Из последнего равенства и по опреде- лению (II) находим x't — Xi для /=2, ..., k. Тем самым (III) доказано. Установленным свойством приходится пользоваться в слу- чаях, когда разложение пространства (или подпространства) L в прямую сумму производится последовательно: L — Li ф L', Е' =Е2© L" и т. д. (см., например, гл. VII, § 10).
ГЛАВА II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ. ПРЕОБРАЗОВАНИЯ КООРДИНАТ § 1. Сокращенная запись суммирования 1. В дальнейшем часто встречаются суммы, в которых слагаемые обозначены одной буквой с индексами, например ••• ® таких случаях удобно применять сокращенное обозначение суммирования: N ат + am+i + • • + aN = У Я/ = У, <4 i=m m^i^N (читается: «сумма я, от 1=щ до №). 2. Свойства знака суммирования. N 1) у а = Na, поскольку здесь повторяется N одииако- « = 1 вых слагаемых, равных а при любом I. 2) Общий множитель можно выносить за знак суммы: S cai = С У ai- i=m i=m 2) У (fl« "1“ ^i) — У ai 4~ У ^i- i==m i = m i~m 4) Величина суммы не зависит от того, какой буквой обозначен индекс суммирования: Лг W N У ai~ ат~\~ am+i Ч~ ••• -|-аЛГ-1-|-O/V = У «]= У, Я/,. i—m j=m k = m 5) Если суммирование производится по двум различным индексам, каждый из которых меняется независимо от
58 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [ГЛ. IT другого, то порядок суммирования безразличен: m2«/^A’2 При суммировании по разным индексам скобки обычно А, / А, \ А, Л'2 опускают и вместо £ У а,-У пишут У У а,-7, под- z = mx\j—m% ! i = mi J=tnt разумевая, что слагаемые ах-у- сначала суммируются по j при фиксированном i (внутренняя сумма), затем полученные вели- чины суммируются по I (внешняя сумма). Пятое свойство распространяется на случай суммирования по трем или боль- шему числу разных индексов. Отметим, что если пределы изменения одного индекса зависят от другого индекса суммирования, то при перемене порядка суммирования пределы изменения каждого из индек- сов, вообще говоря, становятся другими; в частности, 6) При суммировании по двум (или нескольким) индексам можно выносить из-под знака внутренней суммы множитель, не зависящий от индекса внутреннего суммирования: А, А, А, А, У, У, Oij-bi = у bi У atj. i=mi j=tnt i = mi J—mz Перечисленные выше свойства знака У непосредственно вытекают из правил арифметических действий и часто исполь- зуются в дальнейшем. 3. Для сокращения записи условимся, что если пределы изменения индекса суммирования не указаны, то подразуме- вается суммирование от 1 до п, например: £> = У i i = 1 Кроме того, если суммирование от 1 до п ведется по не- скольким индексам, не зависящим друг от друга, то мы бу- дем писать один знак суммы и под ним все те индексы, по
§ 1] СОКРАЩЕННАЯ ЗАПИСЬ СУММИРОВАНИЯ 56 которым идет суммирование, то есть п п п 2 ®'ijkl== Xj У Xj aijM‘ i, J, k i = 1 j = 1 k = 1 Дело в том, что ниже чаще всего встречается суммиро- вание в пределах от 1 до п, где и— размерность рассма- триваемых пространств. Условимся, наконец, что если индексы суммирования под знаком суммы совсем не указаны, то это значит, что сумми- рование производится по всем тем индексам, каждый из ко- торых под знаком суммы встречается два раза, причем по каждому из таких индексов ведется суммирование от 1 до п. Например, a.-fej = сЛ4- а^+ ... +аЛ^«; Xj Aiaijxj== У У Ajaiixi == У Ai У aijxp 7—1 1 = 1 7=1 Обратим внимание на внутреннюю сумму в правой части последнего равенства. Общий член этой суммы зависит от двух индексов, но суммирование ведется только по одному из них (по индексу /'), так что результат суммы зависит от п другого индекса (от номера г). Полагая = Xj aijxj и поль- 7=1 зуясь сокращенными обозначениями, можно написать Индексы, по которым ведется суммирование, часто назы- вают немыми или заглушенными. Согласно свойству 4) п. 2 обозначение заглушенных индексов можно изменять в про- цессе выкладок, например J» = Xja17X/=Xja“X«, ...»«. (1) Индексы, по которым суммирование не производится, обычно называют свободными. Важно следить за тем, чтобы свободные индексы в правой и левой частях каждого равен- ства были обозначены одинаково. Так, например, равенства (1) можно заменить следующей эквивалентной записью: У У к Xj akjxj == У ak«.xa, k = 1, ..fl,
ГГЛ. II 60 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ но нельзя заменять обозначение свободного индекса только в одной какой-нибудь части равенства. Ниже мы увидим (см. гл. V), что во многих случаях индексы удобно ставить сверху (X, а‘к и т. п.). При этом следят за тем, чтобы в процессе выкладок нижние свободные индексы оставались нижними, верхние свободные индексы оставались верхними. В дальнейшем будут встречаться суммы, под знаком кото- рых имеется несколько заглушенных индексов. При упо- треблении таких выражений независимые заглушенные индексы необходимо обозначать различными буквами. Например, у =4. у в; (У =2 а1<- Индексы / и р остались свободными (это значит, что пре- дыдущая строчка заменяет /г2 равенств). 4. 3 а м е ч а н и е. В литературе широко употребляется еще более краткая запись, при которой опускают не только пределы суммирования и указание индексов, но и сам знак суммы. При такой системе записи считают, например, что Mzk — k р. Л-Л k рл Однако такая запись требует от читателя значительного навыка, и мы опускать знак суммы не будем. § 2. Линейное преобразование переменных. Произведение линейных преобразований переменных и произведение матриц 1. Пусть xt, ..., хп— упорядоченный набор независимых переменных. Пусть дана т X «-матрица: Ьц ... bin Напишем соотношения brnl • • • bmn У1 — ЬцХ) binxn. (1) Ут — bmiXi ... -j- ЬтпХп,
§ 2] ПРОИЗВЕДЕНИЕ ПРЕОБРАЗОВАНИИ МАТРИЦ 61 где через yt, ут обозначены численные значения правых частей (1); ясно, что ylf ..., ут изменяются в зависимости ОТ X], ..., хп. Система соотношений (1) называется линейным преобра- зованием переменных xt, ..., хп в переменные у1г ..., ут; числа называются коэффициентами линейного преобразо- вания (1); составленная из них матрица В называется матри- цей этого линейного преобразования. Будучи заданной, ма- трица определяет линейное преобразование (1). Замечание. Упорядоченный набор переменных xh...,x„ можно было бы рассматривать как переменную точку коор- динатного пространства. Точно так же можно геометрически истолковать yt, ..., ут. Однако представляется целесообраз- ным линейное преобразование переменных определять как чисто арифметическое (или алгебраическое) понятие, не связывая с ним заранее каких-либо геометрических предста- влений. 2. Пусть дана р X /«-матрица «и ... aim А= @pi • • О-рт Напишем соответствующее ей линейное преобразование пере- менных в виде ^1—••• -j-aimym, (2) Zp--ар1У1 “F • • • артУт- Здесь независимые переменные обозначены через yt,..., ут, хотя соотношения (2) поначалу рассматриваются вне связи с соотношениями (1). Вместе с тем можно считать, что yit ..., ут в правых частях (2) суть те же величины, которые определяются равенствами (1) по переменным xlt ..., хп. В таком случае Zi, ...» zp становятся функциями от независимых переменных Xi....хп, а уь ..., ут получают роль посредников. Если промежуточные переменные yt, ..., ут исключить из равенств (1) и (2), то zit ..., zp будут выражены через Xj, х„ явно. Чтобы провести эту операцию, нужно в пра- вых частях (2) заменить _у7- их выражениями (1). После этого
62 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [ГЛ. и в каждом уравнении (2) каждая из переменных xt, ..., х„ встретится т раз. Приводя подобные члены и обозначая получаемые коэффициенты через сц, с12, ..., напишем резуль- тат в виде ^1 --сИ-*4~|- ••• (3) zp----CpiXl ~Ь • • • ~Ь српхп- Таким образом, мы снова имеем некоторое линейное пре- образование переменных; его матрица С11 ••• On С — Cpi . .. Срп Определение. Линейное преобразование переменных (3), полученное в результате исключения уь ут из (2) и (1), называется произведением линейного преобразования переменных (2) на линейное преобразование переменных (1). При этом р X л-матрица С называется произведением р X т~ матрицы А на т X //-матрицу В. Символически: С —АВ. 3. Найдем формулу, которая выражает любой элемент матрицы С через элементы матриц А и В. Для этого нужно фактически (а не на словах) произвести исключение величин У1> Ут из соотношений (1) и (2). В целях экономии выкладок запишем систему (1) сокращенно в виде п У)= ^bJkxk, Л = 1 где /=1, 2.....т соответствуют номерам уравнений. Ана- логично запишем систему (2): т Zi= 2 авУр Z=l, р. Теперь имеем т / п \ п / т \ zi== У а< / ( УЬ/^хр] = У( УД»/bf/ijX/g. (4) 7=1 /
S 2] ПРОИЗВЕДЕНИЕ ПРЕОБРАЗОВАНИИ МАТРИЦ 63 С другой стороны, равенствам (3) можно дать сокращенную запись: п Zi == eik^k‘ (б) Л = 1 Из (4) и (5) находим т Cik~— aijbjkt (6) /=1 или cik = ailblk~]- (7) Выражение (7) называется произведением г-й строки ма- трицы А на /г-й столбец матрицы В (по аналогии с извест- ной из аналитической геометрии формулой, выражающей скалярное произведение векторов через их координаты). Число столбцов матрицы А должно быть равно числу строк матрицы В, иначе произведение АВ не определено. Число строк и столбцов произведения можно выразить по схеме (р X т)-{т X л)=(?ХП). Два произведения АВ и ВА одновременно определены тогда и только тогда, когда А и В — квадратные матрицы одина- кового порядка. Замечание 1. Разумеется, произведение матриц можно было бы определить непосредственно с помощью формулы (7), не учитывая ее происхождения из линейных преобразований. Замечание 2. Умножение матриц, вообще говоря, не коммутативно, в чем легко убедиться на примерах. Пусть Д-1 1 ° л'_|| 0 0 ’ 5==| 0 1 II 0 0 1Г Тогда Лв = | 0 0 ВА = 1 0 0 II 1 0 0 ||- 4. Наборы переменных хг, у.-, zk запишем в виде матриц- столбцов: Xi У1 ?! ' Х= , Y— , Z= • Хп Ут ZP
64 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [ГЛ. П Тогда формулы преобразования переменных (1), (2) и (3) можно записать в виде матричных равенств Y~BX, Z=AY, Z—CX, где С—АВ. 5. Укажем ряд тождеств, которые выражают свойства умножения матриц: 1) А (ВС) — (АВ) С (ассоциативность); в силу этого свой- ства произведение трех матриц АВС можно писать без скобок; 2) (а А) В = А (аВ) = а АВ', 3) А (В + О = АВ 4-АС; (В -|- С) А = ВА -ф- СА. Здесь а — произвольное число, А, В, С —- произвольные матрицы, у которых число столбцов и строк обеспечивает возможность выполнения указанных выше действий. Доказательство тождеств 1), 2), 3) проводится без труда и останавливаться на нем мы не будем. 6. Нам придется употреблять еще операцию транспони- рования матрицы. Эту операцию мы будем обозначать звез- дочкой, считая, что А*— матрица, полученная из матрицы А заменой ее строк соответствующими (по номеру) столбцами. Имеют место очевидные тождества 4) (А 4-В)* = А* ф-В*; 5) (аА)* = аА*. Кроме того, 6) (АВ)* = В*А*. В справедливости последнего тождества легко убедиться, если принять во внимание, что произведение А на В строит- ся по схеме: строка А на столбец В. § 3. Квадратные матрицы и невырожденные преобразования 1. В этом параграфе мы рассмотрим более подробно ли- нейные преобразования, при которых сохраняется число пе- ременных. Таким преобразованиям соответствуют квадратные матрицы. 2. Напомним, что определителем или детерминантом «Хи-матрицы А = || aZy-|| называется величина DetA= 2 8<й. ...4 01^,2... at пП, (1)
§ 3J НЕВЫРОЖДЕННЫЕ ПРЕОБРАЗОВАНИЯ 65 где О, если среди чисел 1Ь 1$,..., 1п есть одинаковые; —}— 1, если перестановка (ti,z2, четная; — 1, если перестановка (ij, /□,..., /„) нечетная. Индексы li, В,..., 1п принимают значения 1, 2,..., п. В формуле (1) вторые индексы элементов матрицы А взяты в натуральном порядке. Для иного их расположения, а также в случае их повторений имеем S = (2) ....'А Докажем теорему, важную для дальнейшего. Теорема. Определитель произведения матриц равен произведению их определителей, то есть Det АВ = Det /Det Я. Доказательство. Используя (1), (2) и формулу (6) предыдущего параграфа, получаем Det/£=DetC = У. В,- f ch, ... а „ = = J] ... in / 2 ainJnbJnn\ = Ч,..-,1п \J\ / \j„ I = S . ( S . binn = A, • • ,jn Vi, • • An / = 5] (Det А) 8Л.. j bj, ।... bJnn = Det A • D et B, что и требовалось. 3. Квадратная матрица называется невырожденной или неособенной, если ее определитель не равен нулю. Линей- ное преобразование переменных лу,..., хп в переменные У1,..., уп называется невырожденным или неособенным, если оно имеет невырожденную квадратную матрицу. Согласно п. 2 произведение невырожденных матриц есть невырожденная матрица; произведение невырожденных ли- нейных преобразований, переменных есть невырожденное ли- нейное преобразование переменных.
66 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ |ГЛ. II Невырожденная п X «-матрица Л имеет ранг г~п. Это ясно, так как определитель такой матрицы является ее базис- ным минором. Вырожденная матрица имеет ранг г<^п. Это также ясно, так как определитель вырожденной матрицы равен нулю и, следовательно, ее базисные миноры имеют порядок, меньший п (либо их нет, но тогда г = 0). В понижении ранга матрицы (сравнительно со стандартным случаем г=п) и заключается ее вырождение. 4. Пусть дано невырожденное линейное преобразование переменных с матрицей Д = ||я/у-|| У’1 — aitXi 4-... -J- ainxn, Уп — "Г" • • ~~Н ^ПпАп- (3) Введем обозначение А = Det А. По условию A X 0. В таком случае система (3) с произволь- но данными j'i,..., уп и неизвестными хъ..., хп имеет един- ственное решение. Найдем его. Для этого удобно применить формулы Крамера. Согласно этим формулам х^ выражается в виде дроби, знаменатель которой есть А, а числитель получается заменой Л-го столбца А столбцом из величин Уь • • •, уп- Развертывая определитель, стоящий в числителе такой дроби, получим = -д (AfeTl + •••-)- ^пкУп)> где через /1ц,,..., Ank обозначены алгебраические дополне- ния элементов &-го столбца определителя матрицы А. Таким образом, *1=^ы----+4у^ I ......................... (4) Равенства (4), выражающие хь..., хп через yt,..., у„ из формулы (3), представляют собой линейное преобразова- ние переменных; оно называется обратным для линейного преобразования (3), где уь..., уп выражаются через хь..., хп.
§ 3] НЕВЫРОЖДЕННЫЕ ПРЕОБРАЗОВАНИЯ 67 Матрица преобразования (4) называется обратной для (невырожденной) матрицы А преобразования (3); ее обозна- чают через Л \ Таким образом, если ЙЦ •. • а1п А = А = Det А ф О, • &пп то АП1 Д д Ann Д Следует обратить внимание на то, что в матрице А~* по строкам расположены алгебраические дополнения тех эле- ментов матрицы А, которые в матрице А расположены в соответствующих (по номеру) столбцах. 5. Так как равенства (4) выражают решение системы (3) относительно неизвестных лу,..., хп, то подстановка выра- жений (4) в правые части (3) должна дать в результате У1 =Ji. Уг= Уг, (5) Уп= Уп- Такое преобразование называется тождественным', его матрица обозначается буквой Е и называется единичной: Е — 1 0 ... О О 1 ... О О 0 ... 1 Поскольку произведение преобразования (3) на обратное ему преобразование (4) есть тождественное преобразование (5), то, соответственно, произведение матрицы А на обратную ей матрицу А~* есть единичная матрица Е: АА~1 — Е. (6)
68 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ (ГЛ. II 6. Согласно п. 2 имеем из (6) (Det A). (Det А~*)= 1. Отсюда Det А"1 ф 0, и матрица А-1 невырождена. В та- ком случае решение системы (4) относительно уъуп единственно и, следовательно, совпадает с выражениями (3). Поэтому подстановка выражений (3) в правые части (4) должна дать тождественное преобразование Xj = Xi, Хл = Х& хп = хп. Одновременно получаем А~1А = Е. 7. Итак, каждое невырожденное линейное преобразование переменных хъ..., хп в yt......уп имеет единственное об- ратное линейное преобразование переменных у1г уп в xt,..., хп\ оно также невырождено; обратное ему есть ис- ходное преобразование. Каждая невырожденная матрица имеет единственную обратную; она также невырождена; обратная ей есть исходная матрица. 8. Понятия обратного преобразования и обратной матрицы можно определять несколько иным способом. Именно, пусть даны два линейных преобразования переменных, которые мы запишем сокращенно: = aHxi <7) с п X «-матрицей А = || || и Xj----- Ь jk^ k (8) с и X «-матрицей В = || bjk ||. Тогда преобразование (8) можно назвать преобразованием, обратным преобразованию (7), если произведение преобразования (7) на преобразование (8) есть тождественное преобразование yi = ^t (9)
§ 3] НЕВЫРОЖДЕННЫЕ ПРЕОБРАЗОВАНИЯ 69 Соответственно матрицу В можно назвать обратной матри- цей для А, если АВ = Е. (10) Невырожденность преобразования (7) и матрицы А можно не оговаривать заранее. Она неизбежно следует из (10), так как вследствие (10) (Det А) - (Det В) = 1, и поэтому Det Л 0. Но при условии Det А 0 система (7) с неизвестными Xi,хп и известными уь..., уп имеет единственное ре- шение. Следовательно, выражения (8) с учетом (9), т. е. с учетом, что г^—у^, должны совпасть с выражениями (4). Тем самым мы возвращаемся к нашему первоначальному определению обратного преобразования и обратной матрицы. 9. Если А и В невырождены, то имеет место тождество (АВу1 = В 1А~\ Доказательство. Пусть ЕГ1 Л"1 — С; тогда (АВ) С = (АВ) (В-1 А'1) = А (ВВ1) Л-1 = АЕА~1 = — (АЕ) А~г — АА~1 — Е. Следовательно, С=(АВ)~1 согласно п. 8; см. (10). 10. В предыдущем пункте мы воспользовались тем, что для любой п X «-матрицы Л справедливо легко проверяемое тождество: АЕ — Л (а также ЕА — А), где Е — уже извест- ная нам единичная матрица. Можно сказать, что в умножении матриц Е играет такую же роль, какую единица играет в умножении чисел. Замечали е. Легко доказать, что другой матрицы с та- ким же свойством нет. Более того, если для какой-нибудь одной невырожденной матрицы Л соблюдается равенство АЕХ = А, то Et = Е. В самом деле, £, = EEj = (A'1 A) Ei = Л’1 (AEi) = Л~*Л = Е. И. Вместе с произведением матриц определены натураль- ные степени матрицы: Л® = АА, Л3 — ЛЛЛ и т. д. Тем самым определено понятие многочлена от матрицы: Р (Л) = аоЛ" -j- aj Л” ' апИ Ч” 7X;> О1; где ав,..., ап — числа, а Р (Л) есть п X «-матрица.
70 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [ГЛ 1J Принято считать, что любая п X «-матрица А в нулевой степени равна единичной п X «-матрице Е: А°=Е. Поэтому слагаемое апЕ в выражении (11) играет роль сво- бодного члена. § 4. Ранг произведения матриц 1. Пусть даны: т X «-матрица А — Цо/уЦ, «Хр-мат- рица В — ||Z>,7||, т X р-матрица С=||с;у||, равная их произве- дению: С—АВ. Имеет место Теорема 1. Ранг произведения матриц не больше ранга любого из сомножителей, то есть Rang АВ^ Rang А, (1) Rang АВ^В_ Rang В. (2) Доказательство, Установим неравенство (2), Сначала отметим два тривиальных случая: 1) Если Rang В~0, то матрица В нулевая. Тогда С=АВ — тоже нулевая матрица, RangC=0 и (2) соб- людено. 2) Если Rang 73 =р (где р — число столбцов матрицы В), то (2) также соблюдено, поскольку Rang С не превосходит числа столбцов р в матрице С. Положим Rang /3= г и будем теперь считать, что 0 / При таком предположении матрица В имеет некоторую систему из г базисных столбцов и еще хотя бы один стол- бец, не принадлежащий этой системе. Пусть для определен- ности базисными являются первые г столбцов матрицы В. Рассмотрим любой столбец с номером k, k^>r. По лемме о базисном миноре он линейно выражается через базисные столбцы: Это же выражение в краткой записи имеет вид Г bjk — £ ^-sbjs, 5=1 здесь /=1,2, ..., п, а индекс k зафиксирован. (3)
РАНГ ПРОИЗВЕДЕНИЯ МАТРИЦ 7 § 4] С другой стороны, по определению произведения матриц имеем (-ik ~~~ j Ьjk- СО Из (3) и (4) п 1г \ г 1 п \ г Cik = 1 У asbjs j == 1 |Я5 2^ &Ч fs / == °~s C‘s’ (5) /=1 \ 4=1 ( S=I \ У=| / 5=1 где 1 I т, индекс k зафиксирован и имеет такое же числовое значение, как в формуле (3). Равенства (5) показы- вают, что в матрице С любой столбец с номером k, k^>r> линейно выражается через ее первые г столбцов: cik cmk С11 ет1 -ф- .. . 4- 0. г С1г Стг Отсюда и в силу леммы 3 из § 6 гл. I ранг системы всех столбцов матрицы С не больше г, то есть Rang СО, и неравенство (2) доказано. Теперь для доказательства неравенства (1) достаточно перейти к транспонированным матрицам. В самом деле, согласно свойству 6) из п. 6 § 2, С*— (АВ)* = В* А*. (6) Из (6) и вследствие установленного неравенства для вто- рого сомножителя имеем Rang С = Rang С* Rang А* — Rang А. Тем самым теорема доказана полностью. 2. Во избежание недоразумений полезно сделать следую- щее предупреждение по поводу доказательства неравенства (2). Как было показано, в матрице С любой столбец с номером /г, /г^>г, линейно выражается через ее первые А столбцов. Мы не знаем, являются ли эти столбцы независимыми. Поэтому нельзя утверждать, что Rang С = г. На простых числовых примерах можно убедиться, что такое утверждение не толь- ко не обосновано, по и неверно.
72 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [ГЛ. II 3. Пусть даны: произвольная т X «-матрица А, невырож- денная квадратная п X «-матрица В и невырожденная квад- ратная >иХ«г’матРи,1а &'• Имеет место Теорема 2. Ранги произведений АВ и В'А равны рангу матрицы А, то есть Rang АВ — Rang А, если Det В ф 0 (7) и Rang/ТЛ = Rang Л, если Det В' 0. (8) Иначе можно сказать, что ранг сохраняется при умно- жении данной, матрицы на невырожденную матрицу (слева или справа). Доказательство теоремы 2. Пусть С —А-В. Тогда Rang С=С Rang Л по теореме 1. Но вследствие невы- рожденности В имеем: А = АВВ~А = СВ'\ так что Rang А eg; Rang С по той же теореме 1. Тем самым (7) доказано. Равенство (8) доказывается аналогично. § 5. Преобразование координат при изменении базиса 1. Во многих случаях встречается необходимость данный базис заменить новым. Мы выведем сейчас формулы, по кото- рым преобразуются координаты произвольного вектора при переходе к новому базису. 2. Пусть Ln — линейное «-мерное пространство, еь..., еп — его базис. Пусть е{,е'п — новый базис в L„. Разло- жим каждый из векторов ej......е'п по старому базису; мы получим ej — Рцё\ 4- РучРг “И • • • -f~ Р\пеп’ £2 = <-Т -ф- РчяРъ Ропеп, (О еп---Pntex *+- Prdei ~f~ • • • “F Рппеп- Коэффициенты этих разложений составляют квадратную «Х«* матрицу Рц • • • Pin Р ki... р>
§ 5] ПРЕОБРАЗОВАНИЕ КООРДИНАТ 73 3. Строка матрицы Р с номером I образована координа- тами вектора е\ в первоначальном базисе. Так как новые базисные векторы е'п независимы, то матрица Р не- вырождена, т. е. Det Р ^0. (1) С другой стороны, если произвольно взять матрицу Р при условии (1), то векторы е'т определяемые равен- ствами (I), будут независимы в, следовательно, составят базис. Таким образом, переход к любому новому базису опреде- ляется заданием матрицы Р при единственном условии ее невы рожден ности. 4. Пусть х—произвольный вектор из Ln. Разложим его по старому и по новому базису: x—^XjEj, х = ^.х-е[- J i Запишем формулы (I) сокращенно в виде п e'i — У Pi}ej, z = 1,..., п. (I) 7=1 Отсюда и из второго разложения х имеем Сравнивая это разложение с первым, найдем *7 = У PijX'i, п, (II) i=l или в подробной записи л'1 = РцХ) 4- РцХ.: -|-... -|- PniXn, Xi = РцХ) РцХ.> -|- . .. PniXn, Хп — Р\пх\ + PinX'i + - .. + Рппх'п. (П) Формулы (II) выражают старые координаты х1гхп вектора х через его новые координаты х{,.... х'п и пред- ставляют собой линейное преобразование переменных х[,..., х'п в переменные хьхп. Матрица этого преобразования есть Р*, 1. е. получается транспонированием матрицы Р. Поэтому,
74 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ПЕРЕМЕННЫХ [ГЛ. II обозначая через X и X' матрицы-столбцы, состоящие из старых и новых координат вектора х, можем записать фор- мулы (II) в виде матричного равенства Х = Р*АА (Па) Преобразование (II) невырождено, так как Det Р* = Det Р ф 0. Таким образом, любому изменению базиса соответствует невырожденное линейное преобразование координат каждого вектора. 5. Новые координаты вектора выражаются через его старые координаты с помощью линейного преобразования, обратного преобразованию (II). Мы напишем его в виде Xi — QiiA'i Qi-2X« -4-... -f- Q.\nxn, л‘2 = QsiXi -р ОлчХч -4—... Олпхп, Хп QnlXl ~J- Qn2Xg —г • • • “Т" QnrXn (III) или сокращенно п /= Матрица преобразован! обратна матрице Р*: Q = 1 1Я (III), котор Qu • • • Qin = 1,..., п. (Ill) ую мы обозначим через Q, = (Р*Г1. (2) Qni • • • Qnn Заметим, что каждый из элементов матрицы Q равен алгебраическому дополнению элемента матрицы Р с теми же номерами строки и столбца, поделенному на DetP. Анало- гично (Па) можно написать, что X’ = QX. (П1а) 6. Равенство (2), связывающее матрицы Р и Q, можно переписать двумя другими эквивалентными способами; именно: P*Q = E, QP*=E. (3)
§ 5] ПРЕОБРАЗОВАНИЕ КООРДИНАТ 75 Для дальнейшего полезно равенства (3) в свою очередь переписать еще в другой форме, используя для обозначения элементов единичной матрицы Е так называемый символ Кронекера 8/у-. По определению {О, если I ф ], 1, если i = j. Отсюда два матричных равенства (3) заменяются соот- ветственно двумя системами числовых равенств: Ц PziQz/ = 8Z/, £ ^iPu = (4) i i В первом из них /-я строка матрицы Р* умножается на j-й столбец матрицы Q, а во втором /г-я строка матрицы Q умножается на Z-й столбец матрицы Р*. 7. Заметим в заключение, что всякое невырожденное ли- нейное преобразование переменных хь ..., хп в переменные Ар х'п можно рассматривать как преобразование коор- динат векторов в л-мерном линейном пространстве. В самом деле, если нам дано преобразование (III), то мы знаем матри- цу Q (Det Q ф 0). По ней мы найдем Р* = Ег* и Р = (Р*)*. Зная матрицу Р, получим соответствующий базис е'1г е'п по формулам (I).
ГЛАВА III. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. ПЛОСКОСТИ В АФФИННОМ ПРОСТРАНСТВЕ § 1. Аффинное пространство 1. В линейном пространстве элементами являются векторы как объекты линейных операций. Однако во многих задачах в центре внимания оказываются геометрические факты, связан- ные со взаимным расположением фигур (подмножеств) в рас- сматриваемо.м пространстве, в то время как линейные операции отступают на задний план. Поэтому наряду с линейным пространством вводится по- нятие аффинного пространства, элементы которого называются точками. Точки аффинного пространства определенным образом связаны с векторами линейного пространства (подобно тому, как это делается в элементарной аналитической геометрии). Условия этих связей даны в следующем пункте вместе с оп- ределением аффинного пространства. 2. Пусть дано некоторое множество ?(, элементы кото- рого будем называть точками и обозначать заглавными латин- скими буквами А, В, ..., М, ... Пусть дано также некоторое линейное пространство L. Пусть с каждой упорядоченной парой точек из ?( сопоставлен вектор из L. Если паре точек А, В соответствует вектор х, то напишем: х = АВ\ здесь АВ есть только новое обозначение вектора х. Первая из двух точек называется началом вектора АВ вторая — его концом. Определение. Множество $(, сопоставленное с линей ным пространством L, называется аффинным пространством если соблюдены следующие две аксиомы: 1) Для каждой точки А из ?1 и каждого вектора х из L найдется и притом единственная точка В из §1 такая, что АВ = х. 2) Если АВ — х, ВС—у, то АС—х-]-у (рис. 5).
77 § 1] АФФИННОЕ ПРОСТРАНСТВО Аффинное пространство называется действительным или комплексным, конечномерным или бесконечномерным в зави- симости от того, действительным или комплексным, конечно- мерным или бесконечномерным является соответствующее ему линейное пространство L. Размерностью аффинного простран- ства 81 называют число, равное размерности линейного про- странства L. Замечание 1. Всякое линейное пространство L можно рассматривать как аффинное пространство 8(. Для этого достаточно векторы назвать точками и каждой паре векто- ров а, Ь, рассматриваемых s как точки множества 81, по- ставить в соответствие век- тор b — а £ L. Замечание 2. Всякое аффинное пространство 81 можно рассматривать как линейное. Для этого доста- точно зафиксировать какую- Z? Рис. 5. нибудь точку О простран- ства 81. Тогда с произвольной точкой М £ 81 сопоставляется ее радиус-вектор ОМ. Множество радиус-векторов всех то- чек пространства 81 и составляет пространство L. Замечание 3. В дальнейшем в конкретных случаях мы каждый раз указываем, что является объектом нашего рас- смотрения: аффинное или линейное пространство. Однако можно раз и навсегда условиться рассматривать аффинное пространство с отмеченной в нем точкой. Тогда в пашем распоряжении будут и точки, и векторы. 3. Отметим два простейших свойства аффинного прост- ранства. Теорема 1. С каждой парой совпадающих точек из 8( сопоставляется нулевой вектор из L. Доказательство. Будем считать, что А — произволь- ная точка и что с парой точек АА сопоставлен вектор z. Пусть х — произвольный вектор из L. Тогда по первой аксиоме аффинного пространства найдется точка В такая, что АВ = х. Применяя вторую аксиому, получим х z = z -ф- х — АА -j- АВ = АВ — х; следовательно, z = f).
СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [ГЛ. III Теорема 2. Если АВ = х, то В А = — х. Доказательство. Пусть В А—у. Тогда х 4- у = АВ -k ВА=~АА = О, откуда у =— х. § 2. Аффинные координаты 1. Будем считать, что данное аффинное пространство ?1 является л-мерным, и введем в нем так называемую аффинную систему координат. Для этого в Й выберем произвольную точку О, которую назовем началом координат, а в соответствующем линейном пространстве L возьмем какой-нибудь базис еь еп. Пусть М — произвольная точка из ?(. Вместе с началом координат она определяет вектор ОМ £ L, который называется радиус- вектором точки М. Разлагая радиус-вектор ОМ по базису еЪ •••, eni получим ом=.Vici хге.2 4- • • • 4- хпеп- Коэффициенты этого разложения хъ хп называются аф- финными координатами точки М (относительно выбранной системы с началом О и базисом et, еп). Обратим внима- ние на то, что аффинная система координат задается двумя разнородными объектами — точкой О из аффинного простран- ства и базисом еь ..., еп нз линейного пространства. Координаты каждой точки М определены однозначно ввиду единственности разложения вектора ОЛ1 по базису еп. 2. Пусть дана другая произвольная точка N с координа- тами _У1, уп. Покажем, как выражаются координаты век- тора MN через аффинные координаты точек М и N. Исполь- зуя аксиому 2 и теорему 2 из § 1, находим ~MN= МО 4- ON— ON— ОМ = —(j’i—-*ч) ci 4~ • • • 4~ О’«—хп> так что вектор MN имеет координаты j/j — xlt ..., уп — хп. Иначе говоря, чтобы получить координаты вектора MN, нужно из координат его конца вычесть соответствующие координаты начала.
§ 2] АФФИННЫЕ КООРДИНАТЫ 79 3. Сохраняя выбранный базис, перенесем начало координат из точки О в точку 01. Координаты Ot в первоначальной системе обозначим через ап и будем считать их известными. Найдем новые аффинные координаты хь ..., хп произвольной точки Л1. (Старые координаты точки М обозна- чаем через Xi, ..., хп.) Имеем векторное равенство 07Й = О01-|-0Гм, или, что то же самое, Xi^i . -j- хпеп = апеп -ф- Xi₽i хпеп. Отсюда, вследствие единственности разложения вектора по базису, находим Х[ = х, -|- аь 7=1, ...» п. 4. Если начало координат остается на месте, но меняется базис, то аффинные координаты точек преобразуются так же, как координаты их радиус-векторов, то есть по формулам § 5 гл. II. 5. Предположим теперь, что от данной аффинной системы координат с началом О и базисом еь ..., еп мы переходим к новой системе с началом О' и базисом e't, ..., е'п. При этом считаем известными координаты О' в старой системе (ai, ..., ап), а также разложения векторов нового базиса по старому базису: e'i = ^Pijej. Используя результаты двух предыдущих пунктов и § 5 гл. II, получим формулы, выражающие старые координаты Л],..., хп произвольной точки М через ее новые коорди- наты x'i,...,x'n, Xi — ’^Pjix'j-^-ai, 7=1, ..., и. (1) Наряду с формулами (1) имеют место обратные формулы Q(* j (Xj Cl j) Qiy-X) । at, где Q = (P*)-1 (cm. § 5 гл. Il), a't =— XQtjap Преобразования аффинных координат неоднократно исполь- зуются в дальнейшем.
80 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [ГЛ. 111 § 3. Плоскости 1. Пусть в «-мерном аффинном пространстве ?(„ зафикси- рована произвольная точка А, и в соответствующем линейном пространстве Ln зафиксировано произвольное г-мерное под- пространство Lr. Определение. Множество всех точек М аффинного пространства, для которых AM С Lr> называется г-мерной плоскостью, проходящей через точку А в направлении под- пространства Lr (см. рис. 6, где г = 2). Говорят также, что Lr есть направляющее подпростран- ство этой плоскости. Очевидно, что каждая плоскость опре- деляет однозначно свое направляющее под- пространство. Рис. 6. Точку М называют текущей точкой плоско- сти. На рис. 6 показаны три положения Afb М2, М3 текущей точки М. 2. Частные слу- чаи. 1) Если г = 0, то плоскость состоит из одной точки А. Поэтому каждую точ- ку аффинного пространства можно рассматривать как нуль- мерную плоскость. 2) Одномерная плоскость называется прямой линией (короче, прямой). 3) Плоскость .’размерности п—1 называется гиперпло- скостью. 4) При r=ti плоскость совпадает со всем простран- ством ?[„. 3. В определении плоскости выделена точка А. Докажем, что в действительности все точки плоскости равно- правны. Обозначим плоскость через Пг и зафиксируем произволь- ную точку в С Щ. Надо доказать, что точка М принадлежит плоскости Пг тогда и только тогда, когда BM С Lr (т. е. что любая точка В может играть роль точки А). Пусть BM С Lr (рис. 7). По определению плоскости АВ С Lr. Отсюда и по определению подпространства AM —
§ 3] плоскости == АВ -j- ВМ £ Lr, поэтому М С Щ. Обратно, если М £ Пг, то AM С следовательно, ВМ = AM — АВ С Lr. 4. Теор е м а. Всякая r-мерная плоскость в аффинном пространстве сама является r-мерным аффинным про- странством. Доказательство. Пусть дано аффинное простран- ство §1, которому соответствует линейное пространство £; пусть Пг — плоскость, проходящая через точку А в напра- влении подпространства Lr. Возьмем в плоскости П, две произвольные точки М, N. По определению аффинного про- странства им соответствует вектор MN £ L. По определению плоскости векторы AM и__________________________ AN принадлежат подпро-'к \ странству Lr. Следовательно, \. MN = AN — АМ £ Lr. \ У ~~--------- Таким образом, каждой \ упорядоченной паре точек М, N плоскости Пг постав- “ лен в соответствие вектор Рис. 7. MN из r-мерного линейного пространства Lr. При этом соблюдение для Пг первой из аксиом п. 2 § 1 вытекает из определения r-мерной плоско- сти, а вторая из аксиом п. 2 § 1 справедлива для Пг по- тому, что она соблюдается для всего аффинного простран- ства ?(. Теорема доказана. Замечание. Если плоскость проходит через начало аффинной системы координат в направлении подпростран- ства Lr, то совокупность радиус-векторов ее точек образует линейное пространство, по определению совпадающее с под- пространством Lr. б. Пусть в аффинном пространстве 91 даны точки Ао, А}, ... , Аг (в числе г -ф-1). Говорят, что эти точки нахо- дятся в общем положении, если они не принадлежат одной (г — 1 фмерной плоскости. Читатель легко может проверить, что точки Ло, Аь..., Аг находятся в общем положении тогда и только тогда, когда векторы A0Ai, ... , АВАГ линейно независимы (рис. 8), причем безразлично, какую из точек брать в качестве Ай (то
82 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [ГЛ. Ilf есть в качестве начала векторов, идущих из нее в другие точки). Из сказанного в этом пункте и из определения плоскости следует, что через систему точек /%, At, ..., Аг, находящихся в общем положении, проходит r-мерная плоскость и притом только одна. 6. Предположим, что в пространстве зафиксирована какая-нибудь аффинная система координат с началом О и базисом еь ... , еп. Рассмотрим плоскость П„ проходящую через точку А в направлении подпространства Lr. Будем считать, что точка А имеет координаты pit ... , рп и что Lr задается как линейная оболочка независимой системы векторов qb ... , qr (см. гл. I, § 13, п. 5). Тогда радиус-век- тор ОМ текущей точки плоскости можно записать в виде OM = OAA-AM — OAA-tlqi-]- ... A-xrqr, (1) где параметры tj, ... , тг независимо друг от друга пробегают всевозможные числовые значения, а вектор О A —piCt -j- • •• • •• -гРпАп (рис. 9). Разложим векторы qt, ... , qr по базису еь ... , еп: Ч} = + Чре^ + • •. -г 4jnen- Координаты текущей точки М обозначим, как обыч- но, через (хь ... , хп) и запишем векторное равенство (1) в
§ 3] плоскости координатах. В результате получим п числовых равенств Х1------'711'4 ~Г ~Г • • • ~Г С1гАг хп------f- ?2ят2 -f- • • • -f- Чгп^г ~ГРп- (2) Эти равенства называются параметрическими уравнениями плоскости Пг (в данной системе координат). Обратим внима- ние на то, что все уравнения системы (2) являются линейными относительно координат текущей точки и параметров ту. Верно и обратное: геометрическое место точек, опреде- ляемых уравнениями (2) при всевозможных значениях ту, есть плоскость, проходящая через точку А в направлении подпро- странства Lr = L (qi, ... , дг). В самом деле, уравнения (2) равносильны векторному равенству (1), которое означает, что вектор AM £ Lr. Если для системы (2) написать соответствующую однород- ную систему, то естьрь ... , рп заменить нулями, то мы полу- чим параметрические уравнения направляющего подпростран- ства плоскости ПЛ. 7. Пр и м е р. Пространство, изучаемое в стереометрии, является трехмерным аффинным пространством. В нем одно- мерные и двумерные плоскости совпадают соответственно с прямыми линиями и плоскостями, понимаемыми в элемен- тарно-геометрическом смысле. Это нетрудно доказать различ- ными способами, например, воспользовавшись результатами предыдущего пункта и параметрическими уравнениями прямой и плоскости, известными из элементарного курса аналитиче- ской геометрии. 8. Важное замечание. В отличие от пространства, изучаемого в элементарной геометрии, в аффинном простран- стве не определены метрические понятия: расстояние между точками и длины линий, площади и объемы фигур, углы и перпендикулярность. При исследовании фигур в аффинном пространстве изучаются лишь те геометрические свойства, которые не зависят от метрических понятий. Тем не менее такое исследование является содержательным и позволяет решать многие задачи. 9. Прежде чем продолжить изучение плоскостей (а также других фигур в аффинном пространстве), мы изложим в сле- дующих параграфах необходимый для этого алгебраический аппарат: системы уравнений первой степени.
84 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ (ГЛ. 111 § 4. Системы уравнений первой степени L Рассмотрим систему уравнений anxi 4~ 4“ • •• 4" ainxn —t>i, 4- 4'а2лл'л ==^i> amlxl 4~ amixi 4- • • • 4- атпхп = Ьт. Буквы йц, ... , атп, bv, ... , bm обозначают числа, хь ... , х„ — неизвестные. Числа а,-7- называются коэффициентами системы зуют т X «-матрицу ЙИ • • а1п О) известные (1) и обра- • • • атп которая называется основной матрицей системы (1). Будем считать в дальнейшем, что матрица А не нулевая, то есть что среди коэффициентов системы (1) есть отличные от нуля. Числа bt, ... , bm называют свободными членами урав- нений. Матрица аи ••• а\п «ml • • • &тп Ьщ называется расширенной матрицей системы (1). Всякий упорядоченный набор чисел хъ ... , хп, подста- новка которых вместо неизвестных обращает все уравнения системы в арифметические тождества, называется решением системы. Система называется совместной, если она имеет хотя бы одно решение. 2. Теорема Кронекера — Капелл и. Для того чтобы система (1) была совместной, необходимо и доста- точно, чтобы ранг ее расширенной матрицы был равен рангу основной матрицы'. Rang В — Rang А. (2) Доказательство. 1. Необходимость. Очевидно, что Rang В Rang А. (3)
§ 4] СИСТЕМЫ УРАВНЕНИЙ ПЕРВОЙ СТЕПЕНИ 85 Обозначим через аь ..., ап столбцы матрицы А, через b — столбец свободных членов и будем все эти столбцы рас- сматривать как векторы координатного пространства К„. Пусть система (1) имеет решение (лу, , хп). Это решение обращает уравнения в систему числовых тождеств, которые можно записать в виде одного векторного равенства XjOi х2а2 . 4- хпап — Ь. (4) Из формулы (4) следует, что векторы аь ... ,а„, b линейно выражаются через векторы ... ,ап. По лемме 3 из § 6 гл. I и в силу определения ранга матрицы имеем Rang В С Rang А. (5) Из (3) и (5) следует равенство (2). 2. Достаточность. Пусть соблюдается равенство (2). Матрица А по условию ненулевая, поэтому у нее есть базис- ный минор порядка r = RangX2>®- Допустим для определенности, что базисными являются первые г столбцов а]г ... ,аг. Рассмотрим систему векторов ... ,аг, Ь. Эта система линейно зависима, ибо в против- ном случае Rang В = г 4~ 1 г. Поэтому вектор b выра- жается через линейно независимые векторы аь ... ,аг(см. гл. I, § 6, лемму 2): ь=4*~ • • * 4~ (б) Положим Х1 = хь ... , хг = \п xr+i — ... = х„ = 0. (7) Записав систему (1) в векторной форме (4) и подставив в нее величины (7), получим тождество (6). Таким образом, система (1) совместна: она имеет по крайней мере одно реше- ние (7). Теорема доказана. 3. Отметим частный случай, когда число уравнений равно числу неизвестных, и матрица А (в этом случае квадратная) невырождена, то есть ан ... а1п £) = Det А = #nl • • • Тогда система (1) имеет единственное решение, которое может быть найдено по правилу Крамера: Xi -— 2) » >••• i Хп----- D . loj
86 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [ГЛ. III Здесь через Dj(b) обозначен определитель, который полу- чается из D заменой его /-го столбца на столбец свободных членов, то есть «и ... «1 y_i «1 y+i ... а1п Dj(b) = (8) ani • • • ап j~i bn ап /Л1 ... йпп Замечание 1. Если обозначить через х вектор (х1г , хп), записанный в виде столбца, то систему (1) можно представить в виде матричного уравнения Ах — Ь, а формулы Крамера (8) — в виде матричного равенства х=А 1Ь. (1а) (8а) Переход от формулы (1а) к формуле (8а) получается умно- жением обеих частей равенства слева на матрицу Л-1. Замечание 2. Для практического решения систем с большим числом уравнений и неизвестных формулы (8) неудобны ввиду трудности вычисления определителей D и Dj (b). Поэтому для решения таких систем разработан ряд дру- гих методов, которые излагаются в руководствах по вычисли- тельной математике. 4. Вернемся к рассмотрению системы (1) при произволь- ных т и п, предполагая, что соблюдены условия совмест- ности (2). Наша цель — найти все решения системы. Число г, равное рангу матриц А и В, назовем рангом системы (1). Будем считать для определенности, что базисный минор мат- рицы А занимает в ней верхний левый угол (этого всегда можно добиться изменением нумерации неизвестных и пере- становкой уравнений). Обозначим этот минор через В: ан • • • о1г В = #:0. arl ... arr Минор В является базисным и для матрицы В, поэтому строки матрицы В с номерами г —}— 1, ... , т являются линей- ными комбинациями первых г ее строк (см. гл. I, § 7). Это значит, что уравнения с номерами r-j-1, ..., т представляют
§ 4] СИСТЕМЫ УРАВНЕНИЙ ПЕРВОЙ СТЕПЕНИ 87 собой линейные комбинации первых г уравнений, так что система (1) эквивалентна системе ai\xi ~г • • • ainxn — by ar\xi + • • • + arnxn == br. (Ю) Оставим в левых частях лишь те слагаемые, коэффициенты которых образуют базисный минор D, все остальные члены перенесем направо: а11х1 -}“••• “Ь alrxr — bi Qi r+iXr+i ... Qlnxru (11) -f- • • • -f- arrxr -— br — ar r+iXr+i — ... — amxn- . Неизвестные xr^> ... , xn будем называть свободными. Им можно придать любые числовые значения. Тогда неизвестные хь ...-, хг однозначно определятся из системы (И) по фор- мулам Крамера: (12) Здесь, как и выше, через а,- обозначены столбцы основной матрицы А системы (10), через b — столбец свободных чле- нов системы (10); символ Dj определяется формулой (9), в которой нужно п заменить на г и вместо вектора b под- ставить вектор b — хг,хаглЛ — ... — хпап. Пользуясь свойствами определителей, разложим числитель формулы (12). Мы получим v __ Dj (b) Dj (ar+i) Dj (an) J~~D-------p—Xr+i-...----------^-Xn (7 = 1, .... r). Введем обозначения Pi—^’ ...D -> Z=l, ..., r, A = r—j— I, .... n. Тогда из (13) Х1 =Р1 + 47+1 1 xr+l + (13) (14) (15) xr----P-r Qr^l r xr+l “H • • 4nrxn-
88 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ (ГЛ. III Добавим сюда еще п—г очевидных равенств: -С-+!> (16) •Vn — хп. Всю совокупность равенств (15) и (16) торным соотношением заменим одним век- Чпг О О Хп. (17) 1 Формула (17) дает общее решение системы (1), поскольку выражает все неизвестные лу, хп хг_.\, хп через сво- бодные неизвестные хг+!, ..., хп, которым можно придавать любые численные значения. Покажем, что при этом все воз- можные решения системы (1) будут исчерпаны. В самом деле, если ду, ..., xr, xr_^i, ..., хп — любое заданное решение си- стемы (1), то хг+1, ..., хп имеют определенные численные значения; подставляя их в систему (1) и повторяя предыду- щие выкладки, получаем равенство (17). 5. Обозначим столбец в левой части равенства (17) через х; столбцы в правой части этого равенства обозначим по порядку их расположения через р, qrJr\, ..., qn. Тогда ра- венство (17) примет вид X—рА-хг+'Чг+\ 4- ... -\~xnqn. (18) Равенства (18) и (17) следует понимать как равенства между векторами координатного пространства Кп. 6. Следствие. Если система (1) совместна и ее ранг г меньше числа неизвестных п, то эта система имеет бесконечное множество решений. Замечание. Выбор свободных неизвестных, вообще говоря, можно делать по-разному. Однако не всякие и — г неизвестных можно принять за свободные. Нужно, чтобы в системе (1) коэффициенты при остальных г неизвестных составили базисный минор матрицы А.
§ 5] ОДНОРОДНЫЕ СИСТЕМЫ 89 § 5. Однородные системы 1. Система уравнений Oil Л'1 ~Г й1л хп = О, (1) "4“ • • • Н- ^тпХп — О называется однородной; в этом случае правые части всех уравнений равны нулю: bt= ... =Ьт = 0. (2) 2. Однородная система всегда совместна. С одной сто- роны, это вытекает из теоремы Кронекера — Капелли: Rang В — Rang А, так как матрица В получается из Л добав- лением нулевого столбца. С другой стороны, сразу видно, что система (1) имеет нулевое решение: Xi — ... = хп = 0. Нулевое решение однородной системы называется три- виальным. Остальные решения, т. е. не состоящие только из одних нулей, называются нетривиальными. 3. Как и раньше, будем рассматривать решения системы (1) в качестве векторов координатного пространства Кп. Теорема 1. Множество решений однородной си- стемы образует в пространстве Кп подпространство раз- мерности п — г, где г — ранг системы. Доказательство. Вследствие условия (2) ‘J~ D Поэтому в рассматриваемом случае р=6 и формула (18) §4 выражает любое решение х в виде линейной комбинации векторов qr_^, ..., qn. Обратно, всякая линейная комбинация векторов qr_^, ..., qn дает решение однородной системы (1). Иначе говоря, множество X всех решений такой системы есть линейная оболочка векторов qrJt.it ..., qn в Кп. Следова- тельно, X является линейным подпространством в Кп. Теперь убедимся, что векторы qrJri, ..., qn линейно неза- висимы. С этой целью рассмотрим матрицу Г, составленную
90 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [ГЛ. III координатами векторов qrjrb q„ Qr^i> • • • > qrr Qr^.11 • • • Qni Г = Qr-tl r • • • Qnr 1 ... 0 0 ... 1 Нижний минор максимального порядка матрицы Г является ее базисным минором (он равен единице, т. е. отличен от нуля, и не имеет окаймляющих). Следовательно, столбцы Г линейно независимы. Тем самым линейно независимы векторы Qr^i> • • • > Qn- Отсюда следует, что векторы ^r+i, qn составляют базис в X. Но число их равно п — г. Значит, размерность X равна п — г, и теорема доказана. 4. Пусть известна какая-нибудь линейно независимая си- стема решений в числе п — п Cll * cln (3) Тогда любое решение x системы (1) представляется в виде линейной комбинации данных решений (3): х — Tjti -j- ... -j- (4) обратно, любая линейная комбинация вида (4) дает решение. Оба утверждения сразу следуют из предыдущей теоремы. Именно, согласно этой теореме подпространство X решений системы (1) имеет размерность п — г; следовательно, решения 41, ..., сп _г составляют в нем базис. Определение. Всякая линейно независимая система решений в числе п—г называется фундаментальной для системы уравнений (1). В ы в о д. Чтобы решить однородную систему уравне- ний (1), достаточно найти какую-нибудь фундаментальную систему ее решений сь ..., с„_г. Тогда все решения системы (1) даются формулой (4), в которой каждый из параметров 'Ч. • • , г независимо от других пробегает всевозможные числовые значения.
§ 5] ОДНОРОДНЫЕ СИСТЕМЫ 91 Замечание. Одна из фундаментальных систем решений составлена столбцами матрицы Г. Эту систему решений дают формулы (14) предыдущего параграфа. 5. Пример. Рассмотрим систему уравнений Х1 -ф- хе -4- х3— х4=0, ) V V I V —0 ( Х% Лз —р Х& V. J Здесь п — 4, г = ‘2. Значит, пространство решений имеет раз- мерность п — г = 2. Следовательно, нам достаточно найти какие-нибудь два независимых решения, например: Xi — 0, Xi = 0, х3=1, х4=1; Xj = 2, х2 — —1, х3 ——1, Xi = 0. Отсюда получаем общее решение системы (5): Х1 0 2 Xi 0 — 1 х3 = 4 1 + т2 — 1 XI 1 0 6. Важные частные случаи. 1) Однородная си- стема п уравнений с п неизвестными: -ф- ... -|- ainXn — О, I • • • И ---------- 0. Относительно системы (6) мы отметим только следующую теорему, которая часто используется в приложениях линей- ной алгебры. Теорема 2. Система вида (6) имеет нетривиальное решение тогда и только тогда, когда ее определитель равен нулю: D = Det || aiy|]=0. Действительно, в этом и только в этом случае г = — Rang А <4 и и размерность пространства решений положи- тельна: и — г ~> 0.
92 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ (ГЛ. III 2) Однородная система п—1 независимых уравнений с п неизвестными: (7) ®Л-1 1-^1 Ч- • • • «П -1 /А П == 0- . Условие независимости уравнений означает, что (прямоуголь- ная) матрица Л = ||о;7{| системы (7) имеет ранг г — п—1. В этом случае пространство решений одномерно (и — г=1)> и для получения общего решения системы (7) достаточно найти одно ее нетривиальное решение. Покажем, как это сделать. Составим вспомогательную квадратную матрицу А по- рядка и, которая получается из матрицы А прибавлением сверху новой строки; именно: «01 • °ОЛ А=г-- «11 • °1л ап 1 1 • • 1 п где ам, аВп—произвольные числа. Через Лву обозначим алгебраические дополнения элементов аВ]- в матрице А. Тогда величины aci — -^oi> • • •» хп — (^) образуют решение системы (7). В самом деле, подставим ве- личины (8) в уравнение с номером Z; мы получим сумму произведений элементов одной строки матрицы А на алге- браические дополнения элементов другой строки, равную, как известно, нулю: «П^01 ~|~ ••• ~}~Я/лАп —0- Таким образом, числа (8) действительно удовлетворяют си- стеме (7). Обозначим через /Ну минор матрицы А порядка п— 1, который получается вычеркиванием столбца с номером /: Ди ... «1 y_i «1 y+i ... а1л а-п ач j 1 ач /+1 • • ®п-1 1 • • • @п-1 j-1 /д! * •• ®л-1 п
ОДНОРОДНЫЕ СИСТЕМЫ 93 § 5] Тогда А>у- = (—1/+1 Mj. Среди миноров Mj имеется по край- ней мере один, не равный нулю (базисный минор матрицы А), поэтому решение (8) нетривиально. Общее решение системы (7) можно записать в виде Xj = {— 1)/+1 /И/t, где т — произвольное число. Иначе говоря, решение системы (1) пропорционально минорам максимального порядка матри- цы А, взятым с чередующимися знаками. Иногда это записы- вают так: ... =/И1:(—/И2):/И3: ... 7. Выше, в п. 3, мы доказали, что однородная система уравнений первой степени ранга г определяет в «-мерном линейном пространстве L„ подпространство размерности п—г. Покажем, что верно и обратное. Именно, справедлива Теорема 3. Всякое подпространство размерности k в пространстве Ln с данным базисом является подпро- странством решений некоторой однородной системы ли- нейных уравнений ранга п—k. Доказательство. Пусть в Ln даны базис еь ..., еп и подпространство L*. Возьмем в этом подпространстве k независимых векторов, которые мы обозначим ••• ..., е'п, используя лемму из п. 7 § 14 гл. I, дополним их до базиса в L„: е^, ..., еп—jj, еп—..., еп. (9) Подпространство Lk является линейной оболочкой векто- ров e'n_k + i, ..., е'п. Поэтому вектор х из Ln лежит в Lfc тогда и только тогда, когда его координаты в базисе (9), имеющие номера 1, ..., п— k, равны нулю: х- = 0 (Z=l, ..., n — k\ (10) Формулы (10) представляют собой систему уравнений, опре- деляющую Lk в базисе (9). Перейдем к исходному базису Оь ..., еп. Для этого воспользуемся формулами преобразования коор- динат (см. гл. II, § 5) x'i=^ QijXj, i= 1, ..., п.
94 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ ГГЛ. III Отсюда получим искомую систему уравнений (11), эквива- лентную системе (10): У, QijXj=0, 1 = 1, п— k. (11) /=1 Так как n X й'матР11ца Q = || Qi/ll невырожденная, то все ее строки линейно независимы. Следовательно, ранг системы (11) равен числу ее уравнений: r — n — k. Теорема 3 доказана. 8. Как видно из проведенного доказательства, конкретная запись системы уравнений, определяющей зависит от вы- бора базиса. Кроме того, в данном базисе данное подпространство может задаваться различными однородными системами урав- нений. Это ясно, поскольку для системы (11) имеется беско- нечное множество других, эквивалентных ей систем. Покажем, как можно строить такие системы. Пусть 11ц ... hi n_k н=ы= hfl-k 1 • • • ^n-k n-k — любая невырожденная квадратная матрица порядка п — k. Фиксируя I, умножим уравнения (11) соответственно на числа (1=1, ..., п — /г) и сложим их; затем выпишем найденные соотношения, беря Z=l, п — k. Мы получим однород- ную систему п — h п У, 1>п У, QijXj = 0 х==1 7=1 Если ввести числа (/=1, ..., п — k). (12) n — k Rij— У hnQij j=i (Z=l, ..., n — k; /=1, «), (13) то система (12) запишется более просто: У RtjXj = 0 (1=1, n — k). (14) 7=1 Система (14), очевидно, есть следствие системы (И). Пока- жем, что система (11) в свою очередь есть следствие си- стемы (14). При каждом фиксированном /(1^/^л) фор-
§ 5] ОДНОРОДНЫЕ СИСТЕМЫ 95 мулу (13) можно рассматривать как систему уравнений с не- известными Qij и правыми частями Rij. Решая эту систему по правилу Крамера для каждого J, находим, что п — ь Qi,= 2 <15) а=1 где матрица = — обратная по отношению к матрице Н=\\Ьн\\. Формула (15) показывает, что коэффициенты системы (11) выражаются через коэффициенты системы (14) с помощью матрицы совершенно аналогично тому, как коэффи- циенты (14) выражались через (И) с помощью матрицы || Иц ||. Таким образом, системы (11) и (14) эквивалентны. Итак, по данной системе (11) мы можем получить бесконечное мно- жество эквивалентных ей систем вида (12), поскольку беско- нечно многими способами можно выбирать невырожденную матрицу Н. Замечание. Если прямоугольные матрицы систем урав- нений (11) и (14) обозначить соответственно через Q и R, то две системы равенств (13) и (15) можно заменить двумя матричными равенствами R = HQ, Q = H'R. Отсюда следует, что RangR = RangQ. Иначе говоря, все си- стемы вида (14), которые мы строим поданной системе (11), имеют один и тот же ранг, равный п — k. Пример. Система Xi -|~ — xs — xt— О, Xi — Xi —j— X3 —|— X& = 0 определяет в четырехмерном линейном пространстве некото- рое двумерное подпространство Li. Беря получим в качестве (14) систему Xi = 0, Xi — хз — Xt = О, которая определяет то же самое подпространство Li, что и данная система (иначе говоря, мы заменяем данные уравнения их полусуммой и полуразностыо).
96 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [ГЛ ГИГ 9. В заключение параграфа докажем, что линейное невы- рожденное преобразование переменных сохраняет ранг си- стемы уравнений (1). Запишем систему (1) в виде матричного равенства АХ = 0, (1л) где Л = || a{j || есть /и у/г-матрица коэффициентов, X— мат- рица-столбец неизвестных xt, ., х„, нуль в правой части обозначает нулевую и'/ 1-матрицу. Пусть дана замена пере- менных X'=QX (см. формулы (III а) и (III) § 5 гл. II; Q — невырожденная п X «-матрица). Тогда Х = Р*Х', (13) гдеР = || Рм || = (Q1)*. Подставляя (16) в (1а), получим матрич- ную запись рассматриваемой системы уравнений в новых пере- менных (х{, , х'п): (АР*)Х' = 0, или подробнее 2 ( У, а1лрЛ хк = 0, I = 1.........tn. ! k — I \а — I / Матрица Р невырождена, так что Rang АР* = Rang А согласно п. 3 § 4 гл. II. Тем самым утверждение, сформули- рованное в начале этого пункта, доказано. § 6. Неоднородные системы 1. Пусть дана неоднородная система । ср У / —- (1) /=1 где /=1, ..., tn и среди чисел есть отличные от нуля. Допустим, что система совместна, то есть Rang А — Rang В—г. Пусть {x|J, ..., Хп] — некоторое решение системы (1). Под- ставив это решение в систему (1), получим тождества I п у н(7х;=^-. (2) 7 = 1
§ 6] НЕОДНОРОДНЫЕ СИСТЕМЫ 97 Вычтем тождества (2) из уравнений (1). В результате полу- чится система (3), эквивалентная системе (1): У, aij(Xj — х}) = 0. (3) Положим Xj — xaj = iij', тогда получим однородную систему 2 aijitj—Q. /=1 (4) Пусть для системы ная система решений уравнений (4) известна фундаменталь- (5) В таком случае, согласно результатам п. 4 § 5, любое решение системы (4) выражается в виде линейной комбинации векторов (5), то есть Uj-- X1C1J + • • • + ^П-Г^Л-Г р (6) где tnr—произвольные числа. Так как ttj — Xj — xj, то из (6) находим ХГ—•••+гп-гСп_гу), (7) Назовем xj, ..., х„ частным решением системы (1). Сумма, стоящая в скобках в формуле (7), представляет собой обшее решение системы (4). Система (4), полученная из системы (1) заменой правых частей нулями, называется однородной системой, соответ- ствующей системе (1). Формула (7) показывает, что справедлива Теорема 1. Общее решение неоднородной системы (1) представляется в виде суммы произвольного частного решения этой системы и общего решения соответствую- щей ей однородной системы. 2. Геометрическое истолкование множества решений неоднородной системы линейных Уравнений, Рассмотрим n-мерное аффинное пространство 31п. Зафиксируем в нем какую-нибудь аффинную систему коор-
СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ (ГЛ. III динат. Тогда каждому решению Xj, хп системы (1) можно поставить в соответствие точку пространства с координа- тами хь , хп. Имеет место Теорема 2. Все решения системы (1) образуют в плоскость размерности п — г. Доказательство. Все решения системы (1) даются формулой (7). Ввиду независимости векторов (5) эта формула есть не что иное, как параметрические уравнения некоторой плоскости размерности п—г (см. § 3, п. 6). Теорема 2 доказана. Теорема 3. В аффинном пространстве $[„ и в любых аффинных координатах всякая плоскость Пт может быть задана системой линейных уравнений вида (1) и ранга г = п — т. Доказательство. Пусть плоскость Пт проходит через точку А, имеющую координаты (xj, ..., х„), в направлении подпространства Lm. Перенесем начало аффинной системы координат в точку А, сохраняя прежний базис. Координаты текущей точки М в исходной системе обозначим через (xt, ..., хг), в новой системе — через (хь ..., х„); последние совпадают с координатами вектора AM С Ьт. По теореме 3 из § 5 подпространство Lm задается некоторой однородной системой линейных уравнений ранга г = п—nv. п ^aijXj — 0, l—\,...,r. Учитывая, что Xj — Xj— х°-, получаем п 2 aijtXj — х") = 0. 7=1 Положив bi — ^aijXj, найдем систему уравнений 2 UijXj- = bh i=l, ..., г, (8) /=1 которая имеет тот же ранг г — п— т и определяет Пт в исходных координатах. Теорема 3 доказана. 3. Следствие. Плоскость задается однородной систе- мой линейных уравнений тогда и только тогда, когда она проходит через начало координат.
§ 6] НЕОДНОРОДНЫЕ СИСТЕМЫ 99 4. Важный частный случай. Гиперплоскость за- дается одним линейным уравнением апхп = Ь. Б. Каждое из уравнений (8) можно рассматривать как уравнение некоторой гиперплоскости. Поэтому каждую пло- скость размерности т можно рассматривать как пересечение некоторых гиперплоскостей в количестве т — п. 6. Если система линейных уравнений несовместна, то геометрически это означает, что нет пи одной точки, принад- лежащей сразу всем гиперплоскостям, которые задаются уравнениями системы. 7. Очевидно, что при переходе к новым аффинным коор- динатам вид уравнений (8) меняется. Кроме того, данная пло- скость Пт в данной системе аффинных координат может задаваться различными системами уравнений. Это ясно, по- скольку для системы (8) имеется бесконечное множество дру- гих, эквивалентных ей систем. Так, например, можно взять любую невырожденную квадратную матрицу /7 = || Лг i, j=l, 2, г, и написать следствия системы (8): a«ixj — M = 0. (9) Если ввести обозначения а'ч= Л b'i = S Л--Л. а = I а = I то уравнения (9) запишутся более просто: 2 a-'tjXj — b'i, (10) 7=1 Система уравнений (10) не только следует из системы (8), но является эквивалентной ей (что доказывается так же, как аналогичное утверждение в п. 8 § 5). Возможность перехода от системы (8) к разным системам вида (10) геометрически означает, что Пст можно определять как пересечение различных наборов независимых гиперпло- скостей в числе п — т. Независимость гиперплоскостей еле-
100 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ (ТЛГПГ дует понимать в том смысле, что ранг совместной системы (10) уравнений этих гиперплоскостей имеет максимально возмож- ное значение, т. е. равен числу уравнений (г — п — т). § 7. Взаимное расположение плоскостей 1. Пересекающиеся плоскости. Во всем этом параграфе размерности плоскостей и подпространств обозна- чены индексами снизу. Пусть две плоскости Щ и П( в аф- финном пространстве имеют общую точку А. Примем эту точку за начало аффинной системы координат. Когда текущая точка М пробегает плоскость Пл (или ПД вектор AM про- бегает подпространство Lk .(соответственно £?). Поэтому вопрос Рис. 10. о взаимном расположении двух пересекающихся плоскостей естественно связан с рассмот- рением подпространств Lk и Lt в векторном пространстве Ln. Используя свойства подпространств (гл. I, §§ 12—14), нетрудно установить следующие факты: 1) Если плоскости П* и Hz пересекаются, то их пересе- чением является некоторая плоскость П„ (на рис. 10 взято k — l—2, т— 1). Замечание 1. Не исключена возможность, что Пт состоит из одной точки (/«— 0). Это видно на примере двух пересекающихся прямых или прямой и плоскости (рис. 11). В общем случае по одной точке могут пересекаться две пло- скости, сумма размерностей которых не превышает размер- ности пространства, например двумерные плоскости в четырех- мерном пространстве.
§ 71 ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПЛОСКОСТЕЙ 101 Замечание 2. Мы не исключаем и другого крайнего случая, когда одна из двух плоскостей целиком принадлежит другой. Например, ЩсгП/, k<^l, тогда Пт = П*, (на рис. 12 k — m— 1, Z=2). 2) Если плоскости Щ и П, пересекаются по плоскости Пт, то существует единственная плоскость Пг размерности г = = k -|~ I — т, содержащая Пь и Uz, причем ни в какой пло- скости меньшей размерности Щ и П* не могут одновременно поместиться. Направляющее подпространство Lr плоскости Пг является суммой направляющих подпространств Lk и Lt. Эта сумма является прямой суммой тогда и только тогда, когда Щ и П; пересекаются по одной точке (/и = 0, см. рис. 13). Рис. 12. Рис. 13. В частном случае, когда k-\-l—т = п, роль плоскости Пг выполняет все пространство (при г — п — З см. рис. 10). 3) Если пересекающиеся плоскости II*. и IIZ содер- жатся в какой-нибудь плоскости Пг, то размерность их пере- сечения m^k~\-l — г. В частности, —п (1) для любых двух пересекающихся плоскостей из 21„. 4) Если плоскости П* и Hz проходят через точку А в направлении подпространств L* и Lz соответственно и если Lk содержится в Lz, то плоскость Щ содержится в пло- скости IIZ. Если при этом k = I, то II* совпадает с Hz (также и L* совпадает с Lz). 2. Параллельные плоскости. Пусть теперь пло- скость II* определяется точкой А и подпространством Lk, а плоскость Hz — точкой В и подпространством Lz. Будем считать, что l^k. Определение. Плоскость П* параллельна плоскости Hz, если Lkc^Li. Позволим себе также говорить, что в этом случае пло- скость Hz параллельна плоскости П*.
102 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ (ГЛ (И Замечание 1. Согласно этому определению включение Щ ст Пг является частным случаем параллельности. Замечание 2. Если Щ параллельна П/, причем k — l, то Ц совпадает с Lz. Замечание 3. Легко убедиться, что при « = 3 частные случаи k = l=\, k — l—2 и k= 1, I— 2 согласуются с понятием параллельности прямых и плоскостей, известным из элементарной геометрии (рис. 14). Пусть в произвольной аффинной системе координат две плоскости П и П' одинаковой размерности заданы Рис. 14. системами линейных уравнений. Пользуясь определением парал- лельности, нетрудно установить следующее утверждение. Для того чтобы П и II' были параллельны, необходимо и достаточно, чтобы соответствующие однородные си- стемы уравнений были эквивалентны. В частности, две гиперплоскости параллельны тогда и только тогда, когда в одних и тех же координатах они задаются уравнениями TZjjVi + ... 4- апхп-\- Ь = 0 и atXi 4~ • • • 4“ апхп 4" Ь' — О (2) (2') с пропорциональными коэффициентами при переменных: £1 ап а'1~ а'п Для совпадения гиперплоскостей (2) и (2') необходимо и достаточно, чтобы были пропорциональны все коэффициенты
§ 7] ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПЛОСКОСТЕЙ 103 их уравнений: — = ____________________ а;-"- Ь-п- Теорема 1. Пусть в аффинном пространстве даны плоскость Щ и точка В. Тогда существует един- ственная плоскость Щ размерности k, проходящая через точку В параллельно П/г. Если В £ Щ, то Щ совпадает с П/г; если точка В расположена вне ПА, то плоскости Щ и К* не пересекаются. Доказательство настолько подготовлено предыду- щим, что не требует изложения. 3. Скрещивающиеся плоскости. Определение. Две плоскости называются скрещиваю- щимися, если они не пересекаются и не параллельны. Хорошо известно, что в трехмерном пространстве §[3 две прямые линии, то есть одномерные плоскости, могут скрещи- ваться, тогда как прямая линия и двумерная плоскость в скрещиваться не могут. С повышением размерности простран- ства оно становится более просторным, в результате чего появляется возможность строить в нем скрещивающиеся пло- скости разных размерностей, а не только одномерные. Ниже сформулирована теорема 2, содержание которой можно рас- сматривать как общий прием построения скрещивающихся плоскостей. Именно, пусть в аффинном пространстве дана ПЛОСКОСТЬ Пг (/<«). ВоЗЬМеМ ПРОИЗВОЛЬНУЮ ПЛОСКОСТЬ life так, чтобы ПА и Пг не были параллельны и пересекались; плоскость, по которой они пересекаются, обозначим через Пт. Пусть Пг — плоскость наименьшей размерности, содержа- щая Щ и Пг. Мы знаем, что r = k-\-l—т. Теорема 2. Если k-\-l — т<^ п, то всякая k-мерная плоскость, которая параллельна Пй и не лежит в Пг, скрещивается с IIZ. Следствие. Если целые числа k, I, т, п удовлетво- ряют неравенствам Osg т k, 0^т<^1, k-ф-1 — т<^п, то в найдутся скрещивающиеся плоскости П* и IIZ с направляющими подпространствами и L{, пересечение которых Lm — Lk [] Lz имеет размерность т.
104 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ [ГЛ. ПГ Доказательство теоремы 2. Так как r—k-\- —т<^п, то плоскость Пг не исчерпывает собой всего пространства 81„. Это позволяет взять (с большим произволом) точку С, не лежащую в Пг. Обозначим через П* плоскость размерности k, проходящую через точку С параллельно П*. Ясно, что И* не содержится в Пг и что, выбирая по-разному точку С, мы можем получить любую A-мерную плоскость, удовлетворяющую условию теоремы. (См. рис. 15, на кото- ром А = Z== 2, г = 3, п = 4, и трехмерные плоскости условно Рис. 15. изображены в виде параллелепипедов.) Докажем, что пло- скости Пг и И* скрещиваются. Заметим, что плоскость П* не параллельна П/, так как в противном случае или LkczLi или Lt az Lk, что противоречит условию расположения пло- скостей И* и Пг. Теперь докажем, что Щ и Пг не пересекаются. Проведем через точку С вспомогательную r-мерную плоскость И', параллельную Пг. Тогда ЩсгП', и поэтому Щ не может пересечь Пг, ибо в противном случае точка их пересечения принадлежала бы параллельным плоскостям Пг и Щ. Следо- вательно, И* скрещивается с Пг. Теорема 2 доказана. Пусть в «-мерном аффинном пространстве даны скре- щивающиеся плоскости life и Пг с направляющими подпро- странствами I* и Lb причем Lk Q Ll = Lm, A—|-Z— т<^п. Теорема 3. Существует единственная плоскость Пг+1 размерности r-(-l=(A-J-Z—т)-]~ 1, содержащая пло- скости Пй и II/.
§ 7] ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПЛОСКОСТЕЙ 105 Доказательство. Выберем произвольную точку А С Щ и зафиксируем произвольную точку В £ Пг; обозначим через L(AB) линейную оболочку вектора АВ (рис. 16). Допустим, что существует какая-то плоскость П, содержащая Пk и Пг; пусть L — ее направляющее подпространство. Очевидно, что L должно содержать Lfc, Lt и L (АВ), а следовательно, и сумму этих подпространств. Обозначим эту сумму через Lry\. Lr^i — Lk-\- Ll-\- L (AB) cz L. Обратно, если L — любое подпространство, включаю- щее Lr+l, то плоскость П, проходящая через точку А в на- правлении L, будет содержать Щ и Пг. В самом деле, так Рис. 16. как А £ П и Lk cz L, то Щ cz П; так как Л ( П и АВ £ L, то В СП, так как В £ П и Lt cJL, то Пг cz П. Мы получим среди всех плоскостей П искомую плоскость Пг+1 минимальной размерности г -ф- 1 в том единственном случае, когда в качестве L берется Lr+1. Подсчитаем г -ф- 1. С этой целью рассмотрим L'—Lk-\-Li и обозначим размерность L' черёз р. По теореме 3 из § 14 гл. I имеем p = k-]-l— т. Ниже мы покажем, что Lr+1 = L' -ф- L (АВ) ерь прямая сумма; поэтому размерность Lr+\ равна р-1-1, то есть (гД-1) = — (k -ф-1 — т) -ф- 1. Итак, нужно установить, что Lr+1 = L' ф L (АВ). Для этого достаточно показать, что вектор АВ не принадлежит подпространству L'. Предположим противное. Пусть АВ £ L'. Тогда по определению суммы подпространств существуют
106 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ (ГЛ. ПГ 'векторы х, у такие, что х € Ь*, у С Llt АВ = х-]-у. (3) , По первой аксиоме аффинного пространства найдется точка С 1 такая, что АС=х, причем С С Щ- По второй аксиоме аффин- ного пространства I1 x4-Cfi — АССВ = АВ. (4) Учитывая (3), (4), находим, что BC=^-yeLt, (5) так что С £ Uz. Получается, что плоскости Щ и П, имеют общую точку С, но это невозможно, поскольку плоскости Щ и Пг скрещиваются. Тем самым доказательство теоремы 3 ! завершено. Замечание. Рис. 16 лишь частично иллюстрирует тео- 1 рему 3. Например, если размерности Щ и Пг больше т и различны между собой, m^l, T[r+l^IL^^[n, то, как не- трудно подсчитать, п 7; полностью нарисовать такую ситуа- цию невозможно. Однако мы и ниже часто будем поль- 1 зоваться рисунками, изображающими фигуры в пространствах малых размерностей (п=2, 3, иногда л = 4) для иллюстра- ции определений и рассуждений, относящихся к любым «-мер- ным пространствам. 4. Проведенные выше рассуждения показывают, что плос- кости Щ и Hz, о которых идет речь в теореме 3, не содер- жатся ни в какой плоскости меньшей размерности, чем г —f- 1. Поэтому справедлива также Теорема 4. Если скрещивающиеся плоскости Hft и Hz лежат в плоскости П6, то s^(k-\-l — /«)-]-1. (6) (Здесь, как и выше, т — размерность пересечения LfeQLz.) Следствие. Если в имеются скрещивающиеся плоскости П/( и IIZ положительных размерностей, то k^n — Ч, 1^п — Ч. (7) Неравенства (7) следуют из соотношения (6) при s = «, так как для скрещивающихся плоскостей k — m^l, I — m^l. Частный случай. Гиперплоскость не может скрещи- ваться с какой-либо плоскостью положительной размерности.
§ 7] ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПЛОСКОСТЕЙ 107 5. Сохраняя обозначения предыдущего пункта, сформули- руем достаточное условие пересечения двух плоскостей. Теорема 5. Если в даны плоскости П/г и Пг такие, что k -ф-1 — т^п, (8) где т—размерность пересечения Lm направляющих под- пространств Lk и L[, то IIft и Пг пересекаются. Доказательство. Исключая тривиальный случай, когда какая-нибудь из данных плоскостей совпадает со всем про- странством, имеем k < п, 1<^п. (9) В расположении двух данных плоскостей могут быть лишь три возможности: либо IIft параллельна IIZ, либо плоскости IIft и Пг скрещиваются, либо они пересекаются. Если Щ параллельна Пг, то для размерности т пересече- ния соответствующих им подпространств Lk и Lz имеем /и = min (Л, /) (10) и соотношения (9) и (10) противоречат неравенству (8). Если ПЛ и Пг скрещиваются, то соблюдается неравенство (6) при s = п, что тоже противоречит условию (8). Остается предположить, что Щ и Пг пересекаются. Теорема 5 доказана. Замечание. Нетрудно доказать, что в условиях тео- ремы 5 фактически соблюдается равенство k-\-l — щ = п. Однако в вычислениях оценочного характера легче проверить неравенство, чем равенство, поэтому достаточное условие пересечения плоскостей мы сформулировали в виде неравен- ства (8). 6- Укажем алгебраическую интерпретацию теоремы о пере- сечении плоскостей. Пусть даны две неоднородные порознь совместные системы линейных уравнений, ранги которых равны rt и г2. Объеди- ним эти две системы, то есть будем рассматривать совместно все входящие в них уравнения. Для такой «объединенной» системы составим соответствующую ей однородную систему К обозначим ранг последней через г0.
108 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ ГГЛ. ПТ Если ,по «объединенная-» неоднородная система уравнений совместна. В самом деле, если данные системы уравнений определяют плоскости Щ и Пг, то однородная система, соответствующая объединению данных систем, определяет Lm — Lk[\Lt. Соот- ветственно имеем: k = n— гь 1—п — гг, т—п — г0. Таким образом, k -ф-1 — т — п-\-гй — (н -ф- г2) 2= п, и, следовательно, плоскости Щ и Пг пересекаются. А это и означает совмест- ность объединенной системы. В качестве упражнения рекомендуем читателю доказать сформулированное в этом пункте утверждение чисто алгеб- раически, опираясь не на теорему 5, а на теорему Кроне- кера — Капелли, и проверить попутно, что из неравенства Л-фг^Го на самом деле следует равенство П га =/"о- § 8. Системы линейных неравенств и выпуклые многогранники 1. В этом параграфе мы будем рассматривать действитель- ное «-мерное аффинное пространство ?ГЯ, считая, что в нем дана аффинная система координат. 2. Пусть через некоторую точку С имеющую коор- динаты (х?, ... , Хп), проведена прямая в направлении век- тора I, координаты которого обозначим {4.../„}. Согласно п. 6 §«3 эту прямую можно задать параметрическими уравне- ниями Xt~Xi 1=1, (1) — оо -ф- °°- Пусть на прямой (1) выбраны какие-нибудь точки А и В. Соответствующие им значения параметра т обозначим t, и та. Предположим, что 'ti<T'c2. Определение. Множество точек прямой, удовлетво- ряющих неравенствам Ti t t2, называется отрезком АВ. 3. Если точка А имеет координаты (аь ... , ап), точка В имеет координаты (bt, ... , &„), то в качестве направляющего вектора прямой можно взять вектор 1= АВ. Тогда — а,-,
§ 8] ВЫПУКЛЫЕ МНОГОГРАННИКИ 109 и для текущей точки прямой имеем Xi = 04 + {bi — о,) т = (1 — t) at -ф- причем т = 0 в точке А, х = 1 в точке В, так что отрезок АВ задается теперь неравенствами 0 sg t sg 1. Положим 1 — t = а, т = р. Тогда для точек отрезка АВ и только для них имеем Xi=a.Oi -j-ffc,-, Z=l, ... , п, (2) а 0, р 0, а р = 1. Точка, в которой a = p = i, называется серединой от- резка АВ. 4. Определение. Множество точек действительного аффинного пространства называется выпуклым, если вместе с каждыми двумя своими точками А, В оно содержит отре- зок АВ. Простейшими примерами выпуклых множеств могут слу- жить: отрезок, плоскость любой размерности, все простран- ство 31„. Множество, состоящее из одной точки, п пустое множе- ство также считаются выпуклыми. Непосредственно из определения следует, что пересечение любой совокупности выпуклых множеств само является выпук- лым множеством. В самом деле, если точки А, В принадлежат пересечению некоторой совокупности выпуклых множеств, то отрезок АВ принадлежит каждому из этих множеств, а зна- чит, и их пересечению. 5. Пусть в пространстве дана произвольная гипер- плоскость AjXj -ф- ... -ф- Апхп -ф- С=0. (3) Гиперплоскость (3) разбивает пространство на две части, назы- ваемые открытыми полупространствами. Их точки характе- ризуются неравенствами 2 AiXi + С<0 и £ AiXi + С> 0 (4) соответственно. Присоединяя к открытому полупространству гиперплоскость (3), мы получим так называемое замкнутое полупространство. Одно из них состоит из точек, координаты
но СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ (ГЛ. III которых удовлетворяют неравенству £А*/ + С<0. (5) Другое: 2А^4-С^0. (6) 6. Существенно, что рассматриваемое пространство яв- ляется действительным. В комплексном случае никакая гипер- плоскость не разделяет пространства, подобно тому как одна прямая не разделяет трехмерного действительного простран- ства. Подробнее это означает, что если точки А и В в ком- плексном пространстве не принадлежат какой-либо гипер- плоскости, то их можно соединить линией, не пересекающей этой гиперплоскости. Напротив, в действительном простран- стве, если точки А и В принадлежат двум разным открытым полупространствам (4), то любая кривая, соединяющая А и В, пересекает гиперплоскость (3). Доказательство опускаем. 7. Теорема 1. Каждое полупространство является выпуклым множеством. Доказательство проведем, например, для полупространства (5). Пусть точки А и В принадлежат этому полупространству. Тогда и для произвольной точки X отрезка АВ, учитывая (2), полу- чаем 2 A,xt + С= Ai (aai + С(а-|- ₽) = =а (S А,<И + С) + ₽ (£ Aibi + С) < 0. Таким образом, точка X принадлежит полупространству (5). Но точка X на отрезке АВ взята произвольно, значит, весь отрезок АВ принадлежит полупространству (5), что и требо- валось установить. 8. Определение. Пересечение конечного числа полу- пространств (если оно не пусто) называется выпуклым много- гранником. Мы ограничимся рассмотрением многогранников, образо- ванных пересечением замкнутых полупространств. С наглядной точки зрения выпуклый многогранник пред- ставляет собой кусок пространства, высеченный несколькими
§ 81 ВЫПУКЛЫЕ МНОГОГРАННИКИ 111 гиперплоскостями (при л = 3 см. рис. 17). Этот кусок может простираться в бесконечность Рис. 17. (рис. 18). Может случиться также, что многогранник целиком содержится в некоторой A-мерной плоскости k<^n (см. Если имеется т полу- пространств, задаваемых не- равенствами п У AtjXj 4~ Cj гС О, у=1 i— 1, ... , т, (7) то многограннику (пересече- нию полупространств (7)) принадлежат те и только те Рис. 19. точки, координаты которых удовлетворяют системе неравенств АцХ14~ • • • 4~ Ainxn 4- Ci О, (8) С другой стороны, если система вида (8) совместна, то она определяет многогранник, образованный пересечением полупространств (7). Замечание. Очевидно, что неравенство вида (6) можно всегда заменить неравенством вида (7), умножив все его коэф- фициенты на (—1). 9. Многогранник называется п-мерным параллелепипедом, если в некоторой аффинной системе координат он задается
112 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ (ГЛ. пг неравенствами вида Xi 1=1, ... , П, (9) где Е/, t]i — какие-нибудь числа. В частности, говорят, что параллелепипед построен на независимых векторах ех, , еп, приложенных к точке О, если он задается неравенствами 0<х;«:1, 1 = 1, ... , п, (10) в координатах с началом О и базисом еь ... , еп. Неравенства (9) всегда можно привести к виду (10) с по- мощью преобразования аффинных координат. л-мерный параллелепипед при п=1 представляет собой отрезок, при п=2— параллелограмм. Часть параллелепипеда (10), расположенная в какой-нибудь из гиперплоскостей Х; = 0 или х,-=1, сама является (л— 1)-мерным параллелепипедом и называется (л— 1)-мерной гранью параллелепипеда (10). Можно рассматривать грани этих (л— 1)-мерных параллелепипедов, грани их граней й т. д. Таким путем получается набор ^-мерных параллелепипедов разных размерностей k, п— 1 l.Bce они называются ^-мерными гранями исходного параллелепипеда (10). Одномерные грани называются ребрами, их концы — вершинами параллелепи- педа. Можно показать, что вершинами параллелепипеда (10) являются те и только те точки, у которых каждая из коор- динат равна либо нулю, либо единице. Пример. В трехмерном евклидовом пространстве с задан- ной декартовой прямоугольной системой координат (х, у, г) рассмотрим прямоугольные параллелепипеды, ребра которых параллельны координатным осям. Пусть (х0, _ув, д0) — коор- динаты центра параллелепипеда, а, Ь, с — длины его ребер, параллельных осям х, у, z соответственно. Обозначим через множество тех параллелепипедов указанного вида, центры которых лежат в кубе | х | I, |у | £, | z | sS В, длины ребер не превышают tj. Каждому параллелепипеду из множества ох? можно поставить в соответствие точку шестимерного аффин- ного пространства с координатами (х0, у0, z0, а, Ь, с). Тогда само множество можно рассматривать как шести- мерный параллелепипед — I Xq То 0 а Tj, 0 sC т),
§ 81 ВЫПУКЛЫЕ МНОГОГРАННИКИ 113 Заметим, что геометрические фигуры одного пространства часто бывает удобно рассматривать как точки другого про- странства. 10. Определение. Множество точек в аффинном про- странстве называется ограниченным, если координаты всех точек этого множества удовлетворяют неравенству | Xi | М (2И 0 — некоторое число). Пользуясь формулами § 2, нетрудно проверить, что это определение не зависит от выбора аффинной системы коор- динат. Множество ограничено в том и только в том случае, если оно содержится в некотором параллелепипеде. 11. Определение. Выпуклой оболочкой множества точек в аффинном пространстве 21 называется такое выпуклое множество cz 81, которое содержится в любом выпуклом множестве, содержащем Иначе говоря, выпуклая оболочка представляет собой пересечение всевозможных выпуклых множеств, содержащих W & Рис. 20. данное множество говорят также, что является наи- меньшим выпуклым множеством, содержащим (рис. 20). Пример. Выпуклой оболочкой двух точек А, В является отрезок АВ. Можно доказать, что выпуклая оболочка любого конеч- ного числа точек является ограниченным выпуклым много- гранником и что всякий ограниченный выпуклый много- гранник вида (8) представляет собой выпуклую оболочку некоторой конечной системы точек, называемых его вер- шинами.
114 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [ГЛ. Ill 12. Покажем одно геометрическое построение, которое бывает полезно в вопросах о выпуклых оболочках. Пусть дано выпуклое множество и точка М. Построим всевозможные отрезки вида MX, при X £ и множество точек всех таких отрезков обозначим через 33 (рис. 21). Справедлива Теорема 2. Множество <33 является выпуклой обо- лочкой объединения [J М. Доказательство. Если М £ &3, то <33 = и утверж- дение теоремы очевидно. Пусть точка М не принадлежит множеству о/?. Любое выпуклое множество, содержащее с/У U М, обязано содержать все <33, поэтому нам достаточно проверить выпуклость <33. Пусть точки А, В £ <33. Тогда точка А лежит на некотором отрезке MX, а точка В — на некотором отрезке М У, где X, У С (рис. 22). Нам нужно Рис. 21. Рис. 22. установить, что отрезок АВ целиком содержится в множе- стве <33. Пусть С—произвольная точка отрезка АВ. Тогда (если исключить тривиальные случаи совпадения какой-либо из точек А, В с какой-нибудь из точек М, X, У), будем иметь МА = ХМХ, 0<Х<1, МВ = 1>.МУ, 0<р<1; MC=aMA + PMB, aSsO, р^О, а-|~р=1. На отрезке ХУ найдется точка Z такая, что MZ=~MX-y^My, У 1 ’V
§ 81 ВЫПУКЛЫЕ МНОГОГРАННИКИ 115 где v = аХРн 0<А<Д. Точка Z содержится в множе- стве оЛ вследствие выпуклости последнего. Легко видеть, что 7MC=vMZ, то есть, что точка С принадлежит отрезку MZrzeB. Тем самым теорема 2 доказана. 13. Отметим простейшие свойства выпуклой оболочки. 1) Множество esZ совпадает со своей выпуклой оболочкой тогда и только тогда, когда оно выпукло. 2) Если ДсзД, то выпуклая оболочка множества еД содержится в выпуклой оболочке множества sAg. Эти два свойства вытекают непосредственно из опре- делений выпуклого множества и выпуклой оболочки. 3) Пусть — [J и пусть ©Д— выпуклая обо- лочка множества оД. Тогда выпуклая оболочка мно- жества совпадает с выпуклой оболочкой объединения еД [J &Д. Доказательство. Д ДсД IJ еД; поэтому содержится в выпуклой оболочке множества &Д |J ©тД. С другой стороны, — выпуклое множество, содержащее еД и поэтому выпуклая оболочка объединения ©Д (J ©Д содержится в orf. Таким образом, множество и выпуклая оболочка множества ©Д (J ©Д совпадают. 14. Пусть в аффинном пространстве 9( даны точки Ао, Д1,..., Ар с радиус-векторами а0, аъ...,ар соответственно. Имеет место Теорема 3. Выпуклая оболочка системы, точек А^, Д,..., Ар задается формулой X = Иойо -J- СЦЙ! -|- . . . -ф- О-рйр, (11) где х—радиус-вектор произвольной точки из выпуклой обо- лочки, числа а0,..., ар удовлетворяют условиям а0-ф-а1-|~...-ф-ар=1, ) an5s0, af^O.....ap2s0. J ' Доказательство проведем посредством индукции по числу точек. Для двух точек теорема 3 справедлива, так как при Е=1 формулы (11) и (12) задают отрезок ДД.
116 СИСТЕМЫ УРАВНЕНИЙ И ПЛОСКОСТИ 1ГЛ. Ш Пусть теорема 3 доказана для /> + 1 точек. Рассмотрим точки Ао, ...,Ар, их выпуклую оболочку обозначим до- бавим еще одну точку Ap+i с радиус-вектором аРл1' и построим выпуклую оболочку а® объединения Q АрлХ. По свойству 3 п. 13 множество <33 совпадает с выпуклой оболочкой си- стемы точек Ао, Аь ...» Ар, Ap+i. По теореме 2 множество <33 состоит из всевозможных отрезков АР^Х, где Л С Радиус-вектор х точки X дается равенством (11). Обо- вначим через у радиус-вектор произвольной точки отрезка Ap+tX. Тогда y = ax-j-pap+i, а + р=1, а 2^0, 02=0. (13) Положим P,= aaf, 1 = 0,.,., р\ ₽Р+1 = Р. (14) Из формул (11) — (14) получаем У = !+о + • • • + Ррйр 4- РР+1 ap+i, 1 ₽о+...+₽р+₽Р+« = 1, ₽/^0, /=о,...( р+1. Г > Таким образом, каждая точка множества <33 удовлетворяет соотношениям (15). Обратно, подставив величины (14) в формулы (15), получим для у выражение вида (13), где х удовлетворяет соотношениям (11) и (12). Это значит, что каждая точка, удовлетворяющая условиям (15), принадлежит множеству <33. Теорема 3 доказана. 15. Определение. Выпуклая оболочка системы точек Ло, Ai,..., Аг, находящихся в общем положении, называется r-мерным симплексом с вершинами Ао, Аь ..., Аг. Из теоремы 3 следует, что симплекс с вершинами АО,...,АГ задается формулами (11) и (12) при р=г. При этом числа ae,..., аг называются барицентрическими координатами точки симплекса, имеющей радиус-вектор х. Частные случаи: нульмерный симплекс — одна точка; одномерный симплекс — отрезок; двумерный симплекс —треугольник; трехмерный симплекс — треугольная пирамида. Точка симплекса, в которой все барицентрические динаты р авны между собой I a0 =... = a, = —гд), коор- назы- вается центром симплекса.
§ 81 ВЫПУКЛЫЕ МНОГОГРАННИКИ 117 Пусть Тг — симплекс с вершинами Дь Аь .... А„ и пусть Ai0, AiltAik — какие-нибудь из его вершин. Л-мерный симплекс, который является выпуклой оболочкой вершин At0, Ait, •••> ^tk’ называется k-мерной гранью симплекса Тг. Одномерные грани, то есть отрезки, соединяющие вер- шины, называются ребрами симплекса. Две грани размерностей Лиг — (k 4~ 1)называются противо- положными гранями симплекса Тг, если они не имеют общих вершин. Рекомендуем читателю в качестве упражнений дока- зать, что симплекс является выпуклой оболочкой пары про- тивоположных граней, что противоположные грани симплекса всегда располагаются в скрещивающихся плоскостях и что отрезок, соединяющий центры противоположных граней, про- ходит через центр симплекса. 16. Докажем, что л-мерный симплекс в л-мерном пространстве представляет собой пересечение замкнутых подпространств в числе л1. Пусть Ао, At, ..., А„ — вершины симплекса Тп. Примем До за начало координат, базис выберем следующим образом: et = АоДь е2 == АдАз, ..., е„ = AqA„. Тогда соотношения (11) и (12) (при р = п) в координатах примут вид -У1 — л j, Ха = ctg, -------- Cfn, ао 4~ ai 4~ • • • И- ап — и «о 0, at 2= 0, ..., ап О, откуда следует, что Xt 0, xs 0, ..., хп О, Xi 4- хг 4-... 4“ хп 1. (16) (17) С другой стороны, из (17) вытекает (16), если положить az = Xt для I = 1,..., л, a0 = 1 — (xi 4" хъ 4" • • • Таким образом, системы (16) и (17) эквивалентны и задают один и тот же симплекс Тп (при л = 3 см. рис. 23).
118 СИСТЕМЫ УРАВНЕНИИ И ПЛОСКОСТИ [ГЛ. ПГ Система неравенств (17) показывает, пересечением каких полупространств образован симплекс Тп. 17. Мы говорили выше, что многогранник можно пред- ставлять себе как кусок пространства, «высеченный» несколь- кими гиперплоскостями. Можно доказать, что если многогранник ограничен, то число m этих «высекающих» гиперплоско- jK стей, то есть число полу- /М пространств, пересечением которых образован много- гранник, обязательно превы- шает размерность простран- ___*- ства. Наименьшему возмож- ному числу m = n-\- 1 cool- ie ветствует симплекс. Рис. 23. Отметим попутно, что слово «симплекс» (simplex) в переводе с латинского означает «простой». 18. Пусть задан многогранник системой неравенств вида (8), и пусть дана функция z — Со ~Ь • • • спхп, (18) где Со, сь сп — числовые коэффициенты, х1г...,хп— координаты точки из 9(„. Задача о нахождении максимума и минимума функции (18) на многограннике (8) имеет настолько важное значение для приложений (в частности, в экономике), что исследование этой задачи и разработка численных методов ее решения выдели- лись в самостоятельную область, которая получила название «линейного программирования». С другой стороны, отметим, что геометрическая теория выпуклых многогранников является существенным подспорьем для алгебраической теории линейных неравенств.
ГЛАВА IV. ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ § 1. Линейные формы 1. Предположим, что в линейном пространстве L задана числовая функция векторного аргумента, т. е. каждому век- тору х поставлено в соответствие число а (х). В этой главе мы будем понимать функцию а(х) обще- принятым образом, именно будем считать ее инвариантной; это значит, что значение а(х) не зависит от выбора базиса в пространстве L. Замечание. В некоторых дальнейших главах нам при- дется отказаться от общепринятой точки зрения и рассмат- ривать функции, численное значение которых определяется для данного х £ L (или для данных х, у,... С Ь) при помо- щи базиса в L и может от выбора базиса зависеть. Впрочем, и в этом случае можно вернуться к общепринятой точке зрения, расширив понятие области определения функции. В самом деле, если через g обозначить множество всех ба- зисов пространства L, то мы можем рассматривать функцию а(х, е), где х £ L, е £ g. Мы получаем обычную (инвари- антную) функцию а (х), если а (х, ё) = а (х) для всех е £ g. Определение. Функция а (х) называется линейной, если: 1) а (х -}-_у) = а (х)-|- а (у) для любых векторов х, у из L; 2) а (ах) — аа (х) для любого числа а и любого вектора х из L. В качестве значений функции а(х) будем брать действи- тельные числа, если L действительно, и будем допускать комплексные числа, если L комплексно. 2. Примеры. 1) Пусть х = х^еу-ф-...-|-хпеп, где ..., еп — базис в L. В каждом базисе еь ..., еп положим a(x) = Xi. Тогда свойства 1) и 2) п. 1 для й(х) соблюдаются, но а(х) не удовлетворяет определению линейной функции, поскольку зависит от выбранного базиса.
120 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ ГГЛ. IV 2) Пусть L — пространство многочленов степени не выше п. Пусть каждому многочлену х (т) из L ставится в соответ- ствие число а (х) по формуле *2 с(х)=$ x(y)dt, (1) где т, sg т sg т2 — заданный отрезок числовой оси. Ясно, что числовое значение а (х) не зависит от выбора базиса в L. Условия 1) и 2) п. 1 соблюдены вследствие известных свойств определенного интеграла. Таким образом, функция (1) является линейной функцией в пространстве L. Замечание. Линейную функцию (1) можно рассматри- вать также в бесконечномерном пространстве непрерывных функций, заданных на произвольно выбранном отрезке [т{, tjj при условии, что tj Ti, та 5s т2, или в пространстве всех интегрируемых на [т{, tj] функций (тоже бесконечномерном). 3. Пусть в пространстве L дана линейная функция а (х). Считая, что пространство L является «-мерным, зафиксируем в нем произвольный базис еъ ..., еп и разложим вектор х по этому базису: х = XjCj -ф-... -ф- хпеп. Тогда линейная функция запишется в виде а (х) — a (Xici + • • • + хпе„) = xta (с,) -ф-... -ф- хпа (е„). (2) Обозначим через значение функции а (х) на базисном векторе е£ ап = а(еп). (3) Если базис фиксирован, то с,- — вполне определенные числа. Подставив величины (3) в равенство (2), получим выражение функции а(х) в виде однородного многочлена первой степени относительно координат вектора х: а С*7) — Q1X1 -ф- flgX2 -ф-... -J- апхп. (4) 4. Однородные многочлены степени k принято называть формами степени А; при k — 1 употребляют термин «линей- ные формы», при А —2— термин «квадратичные формы». Согласно формуле (4) всякая линейная функция а (х) в «-мерном линейном пространстве является линейной формой относительно координат ее аргумента х. В связи с этим линейные функции обычно называют ли- нейными формами.
§ И ЛИНЕЙНЫЕ ФОРМЫ 121 5. В пространстве Ln перейдем к новому базису e't,., е'п по формуле о) (см. § 5 гл. II). В новом базисе линейная форма будет иметь новые коэффициенты а\: а (х) = а\х[ -j- АЛ + • • • + а'пх'п. Найдем a'i, пользуясь тем, что эти числа являются значени- ями формы а(х) на новых базисных векторах: а\ = а (4). Пользуясь выражением (I) для векторов е'{ и линейно- стью функции а(х), находим й» — й Pijej) = ^ija (fj) = Итак, = (5) Мы видим, что формула (5) совершенно аналогична формуле (I). 6. Докажем, что закон преобразования коэффициентов, выраженный формулой (5), обеспечивает инвариантность значений функции, которая в базисе еъ ..., еп задается форму- лой (4). С этой целью используем формулы (III) и (4) из § 5 гл. II. Положим в новом базисе а W = S a'iXi = S Qik*k\ (6) I ) К Заметим, что в формуле (6) и в других аналогичных слу- чаях индексы суммирования в скобках нужно обозначать разными буквами, иначе возникнет путаница при раскрытии скобок. Раскрываем скобки и делаем перегруппировку сла- гаемых: diXi -- У, 0-jXkPlfi.ik-- У) У) Pifl.lk'j------- У) i i, j, k j, k i j, k (7) где — символ Кронекера. Если j ф k, то 8y* = 0, и та- кие слагаемые учитывать не нужно. Если /=Л, то 8у-у= 1,
122 ЛИНЕЙНЫЕ, билинейные И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV так что cijxftjj = djXj. Поэтому 2 ajx^‘jk == У ajxг СО j. k j Сопоставляя формулы (6) — (8), окончательно имеем a (*) = У a'ix'i = У ajXj, i j то есть численное значение величины а(х) при изменении базиса сохраняется. 7. В линейном пространстве L (быть может, бесконечно- мерном) рассмотрим всевозможные линейные формы, то есть числовые линейные функции одного векторного аргумента. Будем понимать сумму функций и произведение функции на число в обычном (арифметическом) смысле. Имеет место Теорема 1. Множество L* всех линейных функций, заданных в пространстве L, представляет собой линейное пространство. Доказательство. Докажем прежде всего, что сум- ма двух произвольных линейных функций а(х), Ь(х) также является линейной функцией. Положим с (х) = а (х) b (х). Тогда с (х+у) — а (-*+.У) + b (x+j)=[a (х) + а (у)] + + IP (-*) + ь О)] = [« (х) -ф- b (х)] 4- [а (у) b О)] = с (х) с(». Кроме того, с (ах) = а (ах) -J- Ь (ах) = аа (х) -ф- (х) = а [а (х) -J- b (х)] = = ас (х). Таким образом, линейность суммы доказана. Покажем теперь, что если линейную функцию умножить на произвольное число X, то получится линейная функция. Пусть с (х) = Ха (х). Тогда с (х 4-у)=Ха (х 4- у)—Ха (х) 4- Ха (у) = с (х) 4- с (у). Далее с (ах) = Ха (ах) = Хаа (х) — ас (х). Тем самым показано, что Ха(х)—линейная функция. Итак, если а(х), b(x) £ L*, то а(х)4~Ь(х) £ L* и Ха(х) £ L* при любом X. Нулевым элементом L* является (линейная) функция 6 (х), равная нулю для любого вектора х.
ЛИНЕЙНЫЕ ФОРМЫ 123 § И Функция (— 1)* а(х) является противоположной для а(х). Нетрудно проверить, что для L* выполняются все аксио- мы линейного пространства, откуда и вытекает справедли- вость теоремы 1. 8. Определение. Линейное пространство L* всех линейных функций, определенных на L, называется сопря- женным пространству L. Замечание. Согласно определению линейной функции в сопряженном пространстве допускается умножение на такие же числа, как и в исходном; иначе говоря, если L — действительное, то и L* — действительное, если L — комплексное, то и L* — комплексное. 9. Теорема 2. Если линейное пространство п-мерно, то сопряженное ему пространство также п-мерно. Доказательство. Введем в L базис eit..., еп и раз- ложим по нему произвольный вектор х из L: х = Xj£?i х$е% -ф-... —|— хпеп. Тогда произвольный вектор а из сопряженного пространства L*, то есть линейная функция а(х), записывается в виде а (х) = aiXi —j- а%х% —J-... —J- апхп и однозначно определяется заданием набора коэффициентов (tzi,..., а„). Этот набор можно рассматривать как вектор из координатного пространства Кп. При сложении линейных функций и умножении их на число соответственно складыва- ются и умножаются на число их коэффициенты. Поэтому в данном случае L* изоморфно координатному пространству Кп. Теорема 2 доказана. ДО. В заключение параграфа рассмотрим геометрический смысл линейной формы. Для этого используем аффинное пространство ?(„, считая векторы из Ъп радиус-векторами точек из ?(„, отложенными из некоторой точки О. Будем счи- тать, что значение функции а (х) в точке А равно ее зна- чению на векторе х—ОА. Тем самым функция а(х) будет определена в Справедливы следующие утверждения: 1) Множество точек, в которых линейная функция а(х) принимает постоянное значение, представляет собой гипер- плоскость.
124 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV 2) Всякая гиперплоскость представляет собой геометри- ческое место точек, в которых некоторая линейная функция сохраняет постоянное значение. 3) Гиперплоскости, соответствующие разным значениям данной линейной функции а(х), параллельны. 4) Гиперплоскость, на которой а(х)=О, проходит через начало координат. Для доказательства этих фактов достаточно записать ра- венство а(х) = с в координатах aixi “Ь ачхз Ч- • • • апхп — с и воспользоваться результатами §§ 6, 7 гл. III. § 2. Билинейные формы 1. Числовая функция а (х, у) двух векторных аргументов х, у называется билинейной, если она линейна по каждому аргументу, то есть 1) а(Х1 + х<ъУ}=а(хьу)-\-а(хъу), а (ах, у) — аа (х, >); 2) а (х, yi +_у2) — а (х, _n) -J- а (х, у$, а (х, ау) = аа (х, у). Здесь х, у, хъ х8, уь у3—любые векторы пространства L, а — произвольное число. 2. Пусть L — линейное «-мерное пространство, еь... ..., еп—базис в нем, и пусть аргументы билинейной функции разложены по этому базису: X == J] Xiei’ У ~ Тогда a(x,y)=a(^ixlei, ^укек)='^>х{Ука (еь еД (1) Введем обозначения: O-ik ® (^Ь (2) Тогда получим a(x,j)= У, aikxtyk. (3) i, fc=I Формула (3) выражает функцию а(х,у) в координатах по данному базису.
§ 2] БИЛИНЕЙНЫЕ ФОРМЫ 125 Многочлен в правой части формулы (3) называется били- нейной формой. Вместе с ним билинейной формой называют и самую функцию а(х,у). Числа aitt называются коэффици- ентами данной формы в базисе еь..., еп. В качестве аргу- ментов х, у можно рассматривать векторы как действитель- ного, так и комплексного линейного пространства. Соответ- ственно говорят, что форма а(х,у) дана в действительном или в комплексном пространстве. В последнем случае в ка- честве значений формы а(х, у) допускают комплексные числа; коэффициенты aik в этом случае также являются, вообще говоря, комплексными числами. 3. Легко доказать, что множество всех билинейных форм, заданных в линейном пространстве L, тоже образует линей- ное пространство (если понимать сложение форм и умноже- ние их на число в обычном арифметическом смысле; см. § 1, где доказательство проведено для линейных форм). 4. В данном базисе еь..., еп рассмотрим одночленные билинейные формы У)=х.Ук- (4) Из (2) и (3) а (х, у) = У, aikIik (х, у). (5) Если взять x = et, у — ет при любых фиксированных I и т, то 11т=1, а все остальные формы (4) будут равны нулю. Отсюда следует, что формы (4) независимы. Поэтому они образуют базис в пространстве билинейных форм. Формула (5) дает разложение билинейной формы (1) по базису (4). Базис (4) состоит из я2 элементов. Следовательно, про- странство билинейных форм имеет размерность л2. 5. Билинейная форма а(х,у) называется симметричной, если для любых х,у £ L а (х, у)—а {у, х). Билинейная форма а(х,у) называется кососимметричной, если для любых х, у £ L а(х,у)= — а (у, х). В случае симметричной билинейной формы коэффициенты симметричны: aik=aki (см. формулу (2)). В случае кососим- метричной формы aik = —aki и, в частности, a;i~0. Как
(7) 126 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV симметричные, так и кососимметричные билинейные формы образуют подпространства в пространстве всех билинейных форм с аргументами из L. Чтобы найти размерности этих подпространств, построим в них базисы. Симметричную билинейную форму можно записать в виде а (х, у) = У, aik (xtyk + xk jf) + У ацх{yt. (6) i<Z.k i Рассмотрим формы = + при 1фк, hi {х,у)=х1У1. Билинейные формы (7) линейно независимы и симметричны, а любая симметричная билинейная форма выражается через них по формуле вида (6). Поэтому формы (7) составляют базис в подпространстве всех симметричных билинейных форм. Количе- ство элементов в базисе (7) равно С„-}-л = у п(п-\-1). Та- кова Же и размерность подпространства симметричных форм. Отсюда следует, что при любом выборе независимых сим- метричных билинейных форм W\(x,y), Wjy(x,y) в числе N = 1) произвольная симметричная форма может быть представлена в виде N а(х,у)= У \wt(x,y), i = \ где X,- — числовые коэффициенты. Для кососимметричных билинейных форм имеем а (х, у) = У aik (х^у» — xkyi), i<k и в качестве базиса можно взять формы 7 ik (х, у) — xtyk — xkyt. Их общее число равно N=-^-п(п—1). Следовательно, при любом выборе кососимметричных независимых форм wh... .получаем для произвольной кососимметричной формы
БИЛИНЕЙНЫЕ ФОРМЫ 127 § 21 a(x,j) представление Лг a(x,j) = ^iWi(x,y\ 6. Теорема. Пространство билинейных форм является прямой суммой подпространства симметричных и подпро- странства кососимметричных билинейных форм. Доказательство. Очевидно, что билинейная форма является одновременно симметричной и кососимметричной тогда и только тогда, когда она нулевая. Отсюда и из тео- ремы 1 § 14 гл. I следует, что сумма рассматриваемых под- пространств является прямой суммой. С другой стороны, всякая билинейная форма а(х,у) может быть представлена в виде суммы симметричной и косо- симметричной форм, именно а (х, у) — ~ (а (х, у) 4- а (у, х)) -f - у (а (х, у)—а (у, х)). Следовательно, прямая сумма рассматриваемых подпространств совпадает со всем пространством. Теорема доказана. 7. Пусть делается переход к новому базису: 4 = (8) В новом базисе x='£x'ie'i, у—^у^е'ц. Вследствие инвариантности формы а(х,у) имеем а (х, у) = J1, aikXi yk — У, a’^x'ty'k, (9) где aik — новые коэффициенты. Разумеется, инвариантность формы а(х,у) не означает инвариантности ее коэффициентов (вообще говоря, а,:* ф aik). Найдем выражения коэффициен- тов a'ik через старые alk. Воспользуемся тем, что значения формы на базисных векторах совпадают с коэффициентами формы: aik=a{e'i, ek). (10) Вместо новых базисных векторов e’i, ek подставим в (10) их выражения (8): a (ei, e'k) — а ( У У Pklet},
128 ЛИНЕЙНЫЕ. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ. [ГЛ. IV Теперь, ввиду линейности формы а(х,у) по каждому из аргументов, получаем Р j jP kla /> ^z)* Таким образом, п a'ik— У, ajiPijPki- 0) Замечание. Выражения (1) можно получить иным спо- собом, исходя из (9). Именно, так как, согласно § 5 гл. И, Xj — У) PijXi, Уi У PMyk, то из (9) имеем У a-jiXjyi — У a-flP ijP kix'iy'k = У a'ikx'iy'k. Отсюда снова находим (1). Вместе с тем видно, что не только (I) следует из (9), но и (9) следует из (1). Таким образом, инвариантность формы влечет за собой закон преобразова- ния ее коэффициентов согласно равенствам (I); в свою оче- редь преобразование коэффициентов по закону (I) гаранти- рует инвариантность формы. § 3. Матрица билинейной формы 1. Пусть дана произвольная билинейная форма. Запишем ее в развернутом виде: а (х, у) = У aikXi yk == = ацХ1 У1 аыХ]у2 zzinXi_yn ~Ь OviXsyi а^Х^у^ -|- ... а*пх%уп -|- + anixnyi + + аппхпуп. Если выписать отсюда таблицу коэффициентов, то получится квадратная матрица, которая называется матрицей билиней- ной формы: «11 ZZ12 ... ZZjn л __ «21 аЧЛ . . • «2п «П1 «п2 • • • апп
МАТРИЦА БИЛИНЕЙНОЙ ФОРМЫ 129 § 3] В данном базисе матрица билинейной формы полностью ее определяет, так как дает все ее коэффициенты. 2. Допустим, что совершается переход к новому базису e'i = ^p4ei- В новом базисе форма а(х,у) имеет другую матрицу Д' = |]а^Ц. Элементы a,:fc матрицы Д' выражаются форму- лами (I) предыдущего параграфа. Преобразуем эти формулы так, чтобы получить матричное соотношение, выражающее (I) целиком. Для этого запишем (1) в виде a«==£P>7(ayzPw) (1) J. i и введем величины ajiPki* (a) I Вследствие (1) и (a) ол = £Р(/> (₽) i Составим матрицу C = ||cyft||, считая, как обычно, что первый индекс дает номер строчки, второй — номер столбца. Соотношения (а) и ф) рассмотрим с точки зрения умно- жения матриц. При изменении индекса I величина ау7 пробе- гает строчку матрицы А, а величина Pki — строчку матрицы Р. Таким образом, в (а) записано произведение строки на строку. Чтобы превратить строку в столбец, достаточно транспонировать матрицу. Соответственно в соотношении (а) будем рассматривать второй множитель под знаком суммы как элемент матрицы Р* (транспонированной матрицы Р). Тогда получим произведение строки матрицы А на столбец матрицы Р*. Иначе говоря, (а) эквивалентно матричному равенству С = ДР*. (ой) Теперь рассмотрим формулу ф). Здесь сразу замечаем, что справа имеем произведение строчки на столбец. Тем самым из ф) следует А' = РС. фО Из (<xj) и фО получаем искомую формулу Д'= РДР*. (2)
130 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV Формула (2) выражает матрицу билинейной формы в новом базисе через матрицу этой формы в старом базисе и матри- цу Р, с помощью которой делается переход от старого базиса к новому. 3. Выводы из формулы (2). Заметим, что Р и Р* —- невырожденные матрицы. Отсюда и по теореме о ранге про- изведения матриц (гл. II, § 4) Rang 4' = Rang А. (3) Определение. Рангом билинейной формы называется ранг ее матрицы. Вследствие равенства (3) ранг билинейной формы является инвариантом относительно изменений базиса и тем самым представляет собой величину, которая связана с самой фор- мой, независимо от ее координатного представления. Несколько позже (в § И) для ранга билинейной формы будет дано геометрическое истолкование. 4. Рассмотрим определитель матрицы билинейной формы в некотором базисе: А = Det А. В другом базисе Д' = Det А'. Из формулы (2) и теоремы о перемножении определителей следует, что Д' = A. (Det Pf. (4) Таким образом, определитель матрицы билинейной формы не является инвариантом, а изменяется при переходе к новому базису по формуле (4). 5- Пусть даны какая-нибудь билинейная форма а (х, у) == — У aijxiyp У которой определитель Д ф 0, и произвольная линейная форма b(x)='^ibixi. Тогда можно так выбрать у, чтобы а(х,у) = Ь(х) для любого х £ L (при фиксирован- ном у). Для этого достаточно найти (ji, ..., из системы i /Уj — определитель которой равен Д =4 0. Таким образом, одна билинейная форма а(х,у) как бы содержит в себе всевоз- можные линейные формы, заданные в L.
КВАДРАТИЧНЫЕ ФОРМЫ 131 § 4] § 4. Квадратичные формы 1. Пусть билинейная форма а(х,у) является симметричной: а (у, х) = а (х, у). Это равносильно тому, что в любом базисе симметрична ее матрица: А* = А. В самом деле, --а (pb а (^fe> ei)--aki- Отождествим оба аргумента формы а(х,у). Тогда получим а (х, х) = а (х, _у) при у — х. Функция а(х,х) называется квадратичной формой, отве- чающей данной симметричной билинейной форме а(х,у). Исходная (симметричная) билинейная форма а(х,у) назы- вается полярной для квадратичной формы а(х,х). 2. Докажем, что полярная билинейная форма однозначно определяется своей квадратичной формой. Пусть дана числовая функция /(х) векторного аргумента. Предположим, что /(х) есть некоторая квадратичная форма, т. е. /(х)=а(х, х), причем а(х,у) нам неизвестна. Чтобы найти ее, рассмотрим /(x-j-j), где х, у — произвольные векторы. Пользуясь свойствами билинейной формы и ее сим- метричностью, имеем / (х+J) = а (* + У, х + J) = а (х, х) -J- а (х, у) + «Ux)+ a(j,j)=/(x)+ 2fl(x,j)+/(j)- Отсюда получаем искомое выражение a(x,j)=l[/(x+j)-/(x)-/O)]. (1) 3. Формулу (1) можно принять за определение квадра- тичной формы. Именно можно сказать, что /(х) называется квадратичной формой, если левая часть формулы (1) является билинейной функцией. Следует заметить, что определение квадратичной формы не предусматривает наличия базиса; тем самым, оно приме- нимо в бесконечномерных пространствах. 4. Пример. Пусть L — линейное пространство функций, непрерывных на отрезке [0, 1]. Рассмотрим функцию f(x)=\[x{f)Ydt, о аргумент которой х = х(/)£ L.
132 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV Имеем 4 [/Х* + J)—f(x) = $ х (t)y (0 dt. о (2) Нетрудно непосредственно проверить, что в правой части равенства (2) стоит билинейная форма. Таким образом, f(x) есть квадратичная форма в бесконечномерном пространстве L. В дальнейшем (§ 10) мы увидим, что отсюда можно полу- чить важные выводы, например доказывать интегральные неравенства, опираясь на чисто алгебраические теоремы. 5. Вернемся к «-мерному случаю. В «-мерном простран- стве рассмотрим квадратичную форму и запишем ее выраже- ние через координаты аргументов. Пусть а(х,у)=а(у,х), х=у. Тогда f(x}=a (х, х)=£ aikXiXk = = anXiXjai2XiX2-j- ... -j- OinXiX„-j- —|— «31X3X1 —j— «33X3X3 ~... “f* ^2дХзХл —|— 4~ aitlxnxl 4~ aniXnX^, ~b • • • 4“ annXnXn, (3) Если принять во внимание симметричность коэффициен- тов, то члены суммы (3), кроме диагональных, естественно объединяются в пары. При этом получается часто употреб- ляемая запись квадратичной формы в виде f (х) = «их) 2 «13X1X3 -J- 2«13Х1Х3 -J-... -j- 2«i„x1x„ -|- 4~ «33X2 4“ 2 «33X3X3 2а2пХзХп 4-........................4- (4) 4- аппх‘п- Заметим, что в первой строчке формулы (4) выписаны все члены, содержащие хь 6. Матрицей квадратичной формы называется матрица ее полярной билинейной формы «11 ... «1П А= «П1 ... Опп
§ 41 КВАДРАТИЧНЫЕ ФОРМЫ 133 Из этого определения сразу следует, что матрица квадратич- ной формы преобразуется по формуле А' — РАР*, которая доказана в предыдущем параграфе. 7. Ранг квадратичной формы по определению равен рангу ее матрицы: г — Rang А. 8. Квадратичные формы имеют важные геометрические приложения, которые рассматриваются ниже, в гл. VIII и XI. Сейчас мы не будем связывать с квадратичными формами какие-либо геометрические объекты и будем рассматривать их свойства с алгебраической точки зрения. 9. Если в некотором базисе окажется, что все коэффи- циенты aifc = 0 при i k, то говорят, что в этом базисе квадратичная форма имеет канонический вид /(х) — ацх1 -}- ai2xi -j-... -J- аппх„. Для того чтобы получить канонический вид квадратич- ной формы, базис нужно выбрать специально. В произволь- ном базисе квадратичная форма будет полной, то есть будет, вообще говоря, иметь все члены. Приведение квадратичной формы к каноническому виду является важной задачей как в теоретических вопросах, так н в прикладной математике. Ниже будут даны два метода приведения квадратичной формы к каноническому виду: ме- тод Лагранжа и метод Якоби. 10. Если форма приведена к каноническому виду, то ее матрица становится диагональной: «11 О А — «22 (5) О «пп Так как ранг квадратичной формы есть инвариант, то он равен числу отличных от нуля диагональных элементов мат- рицы (5).
134 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV Если ранг — г п, то после надлежащего изменения но- меров матрицу (5) можно записать в виде а”... О а” 0 О "• о 11. Замечание. Если привести к каноническому виду квадратичную форму, то одновременно приведется к диаго- нальному виду и ее билинейная форма а (хг У) = ЙЦ-*лУ1 “Ь аппХ„уп. § 5. Приведение квадратичной формы к каноническому виду методом Лагранжа 1. Пусть дана квадратичная форма f (х) — а (х,х). Вслед- ствие формулы (4) § 4 мы можем в любом базисе записать f(x) в виде /(х) = ацх1 Ч- 2alix-lxi-\-...-]- 2ainx1xn-\- g(xs,..., хп), (1) где g—квадратичная форма, не включающая хи Запись вида (1) позволяет доказать возможность приве- дения квадратичной формы к каноническому виду по индук- ции. Теорема. Каждую квадратичную форму с помощью невырожденного линейного преобразования можно привести к каноническому виду. Замечание. Здесь речь идет о преобразовании пере- менных, именно числовых аргументов хь..., хп многочлена (1). Но теорему можно понимать и геометрически, поскольку всякое невырожденное преобразование переменных можно рассматривать как преобразование координат при переходе к новому базису (см. гл. II). 2. Доказательство теоремы. Квадратичная форма от одного переменного всегда имеет канонический вид anx'i. Примем как предположение индукции, что любую квадра- тичную форму от (п—1) числовых аргументов можно при- вести к каноническому виду невырожденным линейным пре- образованием (п—1) переменных.
МЕТОД ЛАГРАНЖА 135 § 5] Рассмотрим произвольную квадратичную форму /(х) от и числовых аргументов: /(х) = 2 aijXiXj' Пользуясь предположением индукции, докажем, что ее можно привести к каноническому виду невырожденным линейным преобразованием п переменных. Возможны два случая: 1) Первый случай. В квадр'атичной форме /(х) хотя бы один из коэффициентов ait при квадратах переменных отличен от нуля. Не нарушая общности, можем считать, что именно По данным коэффициентам формы /(х) со- ставим следующее линейное преобразование: У1---ЯцХ1 С1ПХП ~~ Xg, (2) Матрицу этого преобразования обозначим Q: «11 «12 • • • «1п О 1 ... О О 0 ... 1 Преобразование (2) невырождено, так как Det Q=ап Q. Отметим также, что невырожденность преобразования (2) вы- текает из его обратимости, которая в свою очередь сразу видна из формул (2). Возведем в квадрат выражение и разделим на аи ф 0: -—yl = -— (ацХ1 «1«х2 + «1Пхп)*= “11 “11 = йцХ] -j— 2GigXjXg -1~... -j- 2aJnXjXn -{- (х2,..., xn), где <р— некоторая квадратичная форма аргументов х2, ...,х„, т. е. <р не включает xt. Введем еще одну квадратичную фор- му тех же аргументов х2,..., хя, положив (х2,..., х„) = g(x2,..., х„) — (х2..х„),
136 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV где g(xs,..., хп) дана записью /(х) в виде (1). Тогда по- лучим /(*) = ~У1 + Ф (*& • • •. -*-»)> «11 или, что то же самое, /С*Э=У1 + Ф (№ • • • > Уп)- аи По предположению индукции существует такое невырож- денное преобразование переменных в числе п—1 — .S k = 2,...,n, (3) 1=2 которое приводит к каноническому виду форму ф: ф0’9>.... Уп) = +... + bnnz*n. Дополним преобразование (3) так, чтобы в нем участво- вали все п переменных. Именно, положим zi =Уъ Zi== 0-j zn~ Ип^Уз + • • • + ЯппУп- , Преобразуем переменные хь..., хп в переменные уь... ..., уп по формулам (2), а затем переменные yt,..., уп преобра- зуем по формулам (4). В результате получим преобразование переменных хьхп в переменные zt,...,zn, которое при- водит исходную квадратичную форму к каноническому виду f (х) = -J- ZSl + Ь^2 -г • • • + bnnZn- а11 Последнее преобразование является невырожденным, так как представляет собой произведение невырожденных преобразо- ваний (2) и (4). 2) Второй случай. В квадратичной форме /(х) все диагональные коэффициенты аи равны нулю. Тогда преды- дущие рассуждения неприменимы. Но какой-нибудь из коэф- фициентов отличен от нуля; пусть это будет Тогда квад- ратичная форма имеет вид /(х) = 2olsXiXg -j-... (5)
§ 6] НОРМАЛЬНЫЙ ВИД КВАДРАТИЧНОЙ ФОРМЫ 137 Сделаем преобразование: Xj Xf —]— Х2, Х2 = Xj — X2, X3 = XS, (6) Преобразование (6) обратимо и, следовательно, является не- вырожденным. Подставив величины (6) в квадратичную форму (5), по- лучим /(х) = 2а12х| — 2а12х§ (7) Слагаемое 2а12Х| не может исчезнуть при приведении по- добных членов, так как все члены квадратичной формы, ко- торые не выписаны в выражении (5), не содержат произве- дения XjX8 и не могут в результате преобразования (6) дать величину xf. Далее квадратичную форму (7) можно невырожденным преобразованием привести к каноническому виду, поскольку дело свелось к первому случаю: коэффициент при х? отличен от нуля. Тем самым рассуждения индукции завершены и теорема доказана. 3. 3 а м е ч а н и е. Из доказательства видно, что квадра- тичную форму с действительными коэффициентами можно привести к каноническому виду с помощью невырожденного линейного преобразования, которое также имеет действитель- ные коэффициенты. § 6. Нормальный вид квадратичной формы 1. Пусть квадратичная форма /(х) приведена к канониче- скому виду Г f<x) = ^laiixsi, (1) i=l где а11г..., a,r^0, г — ранг/(х). 2. Допустим, что мы имеем дело с комплексным прост- ранством и разрешаем себе пользоваться линейными
138 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV преобразованиями с комплексными коэффициентами. Положим У1 = УацХь если i^r, 1 у{=хь если i^>r. ) Из (1) и (2) получим (3) считая, что уп уг+1,..., уп— новые координаты век- тора х. Выражение (3) называется нормальным видом квад- ратичной формы /(х). Заметив, что преобразование (2) невы- рождено, сделаем вывод: В комплексном пространстве всякую квадратичную форму можно с помощью невырожденного линейного пре- образования привести к нормальному виду (3). 3. Ограничимся теперь действительными пространствами и действительными линейными преобразованиями. Учитывая, что среди коэффициентов ац могут быть отрицательные, по- ложим yi = 'K[aiilxi, если i^r, 1 <4 yi = xh если 1^>г. ) Если первые k коэффициентов ац положительны, а осталь- ные отрицательны, то из (1) и (4) мы получим /(х) —у I + >.. -j-yl — >|+i —...— у}. (5) Выражение (5) также называется нормальным видом формы f[x). Таким образом, в действительном пространстве с по- мощью невырожденных действительных линейных преобра- зований всякую квадратичную форму можно привести к нормальному виду (5). 4. В следующем параграфе мы докажем, что в действи- тельном пространстве число положительных и число отрица- тельных членов в формуле (5) не зависит от того, каким именно (действительным) преобразованием квадратичная фор- ма приведена к нормальному виду. § 7. Закон инерции квадратичных форм 1. Пусть в действительном пространстве дана квадратич- ная форма ранга г: f[x)=^iaihxixte,
§ 7] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ 139 где {xj — координаты вектора х в некотором базисе ei,... • • • j crt. Пусть ё1,ёп— какой-нибудь базис, в котором /(х) имеет нормальный вид: + (1) Здесь {_>',}— координаты вектора х в базисе ёь..., ёп. 2. Число положительных и число отрицательных членов в формуле (1) называется соответственно положительным и от- рицательным индексом формы; разность между положитель- ным и отрицательным индексом называется ее сигнатурой. 3. Теорема (закон инерции квадратичных форм). Поло- жительный и отрицательный индексы являются инвари- антами квадратичной формы, то есть не зависят от выбора базиса, в котором она имеет нормальный вид. Доказательство. Пусть имеется еще один базис В1>...,ёп, в котором форма f(x) имеет нормальный вид: f(x)=z\-\-...-\-z*m — ?Д+1—— z2r, (2) где {zj— координаты х в базисе ёь ..., ёп. Нужно доказать, что k — m. Предположим, что k У т, например k т. Рассмотрим формулы преобразования координат Zi^Quyp (3) Заметим, что матрица Q коэффициентов Qtj невырождена. Подставим выражения (3) в формулу (2). Мы должны получить выражение (1); таким образом, имеем тождество г1 Ч~ • • • Ч~ — ?т+1—•..—zf=yl ~j~yk —J'ft+l—...—Уг (4) т. е. равенство, верное при любых Ji,..., уп уГлъ ..., ут считая, что Zi, ..., zn выражены через уь ..., уп с по- мощью (3). Составим вспомогательную однородную систему уравнений Qu J’i Ч" • • • Ч" Qia-Ул = О» О-ггйУ\ Ч~ • • • Ч- О-ткУк — 0. (5)
140 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV В системе (5) число неизвестных больше числа уравнений вследствие предположения k т. Поэтому система (5) имеет нетривиальное решение .,yk. Подставим это решение в тождество (4), взяв дополнительно уь^ = ...=уг=угл1==...==уп = Ъ. (6) В результате, учитывая (3), (5) и (6), получим У1~^-• •---------— ?т+1— ••• — (7) Однако это невозможно, так как левая часть (7) строго по- ложительна, тогда как правая либо отрицательна, либо равна нулю. Значит, k не может быть больше т. Совершенно аналогично устанавливается, что т не может быть больше, чем k. Поэтому k = m. Теорема доказана. § 8. Приведение квадратичной формы к каноническому виду методом Якоби 1. Пусть дана квадратичная форма/(х), которая расписана в координатах в некотором базисе et,..., е„. f(x) — а (х, х) — V aikXiXk. Как известно, ®ik--------------------------& Составим матрицу квадратичной формы /(х): Оц «12 013 • • • й1л ^21 аа °23 • • • A o3i о32 с33 ... а3п • &п1 • • • ^пп Рассмотрим так называемые главные миноры матрицы А: Д ___п А _______I Он 012 а1 — Оц, а2 — Ogj «2'2 Oil 012 013 ^3— Ogi 022 Os3 A„ = DetA. (1) 031 О32 Озз
МЕТОД ЯКОБИ 141 § 8] Кроме того, для удобства записи дальнейших формул введем величину До, считая До=1. Метод Якоби проходит в предположении, что все главные миноры матрицы А отличны от нуля: Д, 7^ О, Д2 Ф 0, ..., Дп Ф 0. (2) При этих предположениях ищется специальный новый базис такой, чтобы 8j = £>11£’1, = Рц 8] Р^е^, ek = Pklel Pkite + • • • “Ь Pkkekt еп—Pniei р 4~ £*пп^п* J Для того чтобы привести квадратичную форму f(x) к каноническому виду, достаточно для любого k(l<^ke^ri) обеспечить условия a(e'i, e'k)=atk = 0 при i — 1, 2, ..., k—1. (4) Тогда a'kt тоже будут равны нулю (вследствие симметрич- ности матрицы квадратичной формы), и отличными от нуля окажутся лишь коэффициенты при квадратах числовых аргу- ментов. 2. Заметим, что для выполнения условий (4) достаточно потребовать соблюдения равенств a(eh e'k) — 0, Z= 1, 2,..., k—1, k=l, 2,n. (5) В самом деле, из (5) и (3) имеем a (Ai, e'k) — а (Рц?1 Рц^ь te) = = P,-ie(<?i, te) ~г • • Рн^ (et> е*) = 0. Для упрощения дальнейших выводов добавим к (5) дополни- тельное равенство a(ek, е'к)=1. (6) 3. При k — 1 условия (5) исчезают и остается только (6), из которого, с учетом первой строчки формул (3), находим 1 = о (eb Cj)=Риа (еь ei) — Рцвн-
142 ЛИНЕЙНЫЕ. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV Отсюда р ___________________________— 11 Си ’ поскольку ЙЦ Ф 0. Учитывая обозначения (1), можно написать 4. Дальше будем проводить рассуждение по индукции. Допустим, что уже определены все коэффициенты, входящие в первые k—1 строк формул (3). Для нахождения коэффи- циентов, входящих в строку с номером k, запишем условия (5) и (6) вместе «(О, 4) = 0, ..., a(ek_t, ек) = 0, a(ek, e'lt)=l. (7) Отсюда, используя (3), получим для искомых коэффициентов систему уравнений anPki + апРkt +... Ч- atkPkk — 0, ak-i iPki Ч~ ak-i t Pkt + • • • 4" ak-t kPkk — ak\Pki + QktPkt otkkPkk = i- (7a) Определитель системы (7a) совпадает c и отличен от нуля вследствие предположения (2). Поэтому искомые коэффи- циенты РА1, ..., Ркк найдутся. Остается проверить, что по- строенное преобразование невырождено. С этой целью найдем из системы (7а) коэффициент Ркк. Применяя правило Крамера, получим Оц ... О1А_1 о akl ••• ak k-1 1 Далее, используя треугольную структуру матрицы преобразо- вания (3), найдем определитель D этой матрицы: г)__р р р _________А». Aj ___ 1 и — РпР2г...Рпп — У1-ys... Лп — дл- Таким образом, D ф 0, а значит, преобразование (3) невы- рождено.
§ 9] ЗНАКООПРЕДЕЛЕННЫЕ КВАДРАТИЧНЫЕ ФОРМЫ 143 5. Теперь мы можем определить и коэффициенты квадра- тичной формы в новом базисе е[,..., е'п. Достаточно вычис- лить лишь диагональные коэффициенты, так как осталь- ные заведомо равны нулю. Используя (3), (7) и (8), на- ходим аьь = о (ей, Ck) — a (Pkiei • • • + Pkkek> ~ — Pkka(ek> e'k) = Pkk = -^’ Значит, в базисе, который построен по методу Якоби, (х;/+ д1 (^)2+ •. •+4^ W. “1 “а ап § 9. Положительно определенные и отрицательно определенные квадратичные формы 1. В этом параграфе будем рассматривать только дейст- вительные пространства. Пусть в линейном пространстве, хотя бы бесконечно- мерном, задана квадратичная форма /(х). Определение 1. Форма/(х)называется положительно определенной, если /(х)^>0 для всех х ф 0. Заметим, что /(0) = О всегда. В самом деле, так как 0 = = 0 • z и f (х) = а (х, х), где z — произвольный вектор, a (x> У) — билинейная функция, то /(0)=c(O-z, 0-z') = 0-a(z, z) = G. Определение 2. Квадратичная форма /(х) называется отрицательно определенной, если /(х)<^0 для любого х ф 0. Очевидно, что достаточно рассмотреть положительно опре- деленные формы, поскольку отрицательно определенные полу- чаются из них сменой знака. 2. Ограничиваясь квадратичными формами в конечномер- ных (л-мерных) пространствах, укажем прежде всего ряд простых необходимых признаков положительной определен- ности. Пусть в каком-нибудь базисе еъ..., еп дана квадра- тичная форма /(х) = а (х, х) = 2 aikXjXk. Как нам известно, а^ — а^е,, e/t).
144 линейные, билинейные И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV 1) Если /(х) является положительно определенной, то ац^>0 при всех 1=1, 2, п. Доказательство. ац = а{еь et)=f (ег)>0. Замечание. Это условие вовсе не достаточно для по- ложительной определенности формы. Пример: форма f(x)=xj -}- 1 OOOxjXo xf имеет ац= 1^>0, но на векторе (— 1, 1) принимает отрица- тельное значение. 2) Если форма f(x) положительно определена, то опре- делитель ее матрицы положителен: A = DetX>0. Для доказательства приведем f(x) к каноническому виду. Пусть е'1,...,е'п — канонический базис, то есть базис, в кото- ром f(x) имеет канонический вид: /•(х) = а'п (xtf+... а'пп(xtf. Согласно предыдущему признаку все Обозначим через Д' определитель матрицы формы f(x) в канойическом базисе. Имеем Д' = о ^пп — Цц ... апп 0. О С другой стороны, по формуле (4) § 3 A' = A(DetP)2, значит, Д^>(). Замечание. И это условие не является достаточным для положительной определенности квадратичной формы. Пример: форма f(x)= — х\~ х82 имеет Д^>0, однако /(х)=с0. 3) В «-мерном пространстве каждая положительно опре- деленная форма имеет ранг п. Доказательство вытекает из неравенства Д ф 0.
§ 91 ЗНАКООПРЕДЕЛЕННЫЕ КВАДРАТИЧНЫЕ ФОРМЫ 145 3. Теорема (критерий Сильвестра). Для положитель- ной. определенности квадратичной формы необходимо и достаточно, чтобы все главные миноры ее матрицы были положительны. Доказательство необходимости. Пусть форма fix) положительно определена. Возьмем произвольный базис еь • • , ek,..., еп и построим линейную оболочку L(eb ..., ek). Будем теперь рассматривать квадратичную форму fix) не на всем пространстве, а лишь на подпространстве L(еь ..., ek). Если х £ L(ei....ek), то x={xlt..., xk, 0,..., 0} и ь fix)— 2 aijXiXj. Все остальные члены, у коэффициентов которых хотя бы один из двух индексов больше k, исчезают за счет нулевых значений координат. Форма fix) на подпространстве Е(еь..., ek) является по- ложительно определенной, так как она положительно опре- делена на всем пространстве. Поэтому определитель формы fix), рассматриваемой на 1Де\...ek), положителен: ап ••• aik аы • • • akk Но Д* — главный минор порядка k матрицы квадратичной формы fix), индекс k может принимать значения 1, 2,..., п. Тем самым необходимость признака доказана. Доказательство достаточности. Пусть Дь "Ъ- 0 при k= 1,..., п. Приведем квадратичную форму к каноническому виду методом Якоби. Получим fix)=£ (x;r+ix^+...+ixtf. Если х ф 6, то хотя бы одна из координат х* ф 0, и, следо- вательно, /(х)^>0. Теорема доказана. 4. Обратим внимание на двумерный случай. Пусть f = ax'2 -]- 2bxy су2,
146 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV где на этот раз числовые аргументы формы обозначены через х, у. Условие Сильвестра сводится к неравенствам а b b с а^> 0, — ас — Ь* 0. Разумеется, в двумерном случае теорему Сильвестра можно установить без какой-либо специальной теории, поскольку для положительной определенности необходимо а^>0 и при 0 f= № + № + • § 10. Определитель Грама. Неравенство Коши—Буняковского 1. Предположим, что в произвольном линейном прост- ранстве L (может быть, бесконечномерном) дана квадратичная форма f(x)=a(x, х) и конечная система векторов pi,...,pk. Определение. Определителем Грама для квадратич- ной формы а(х,х) и системы векторов pi,...,ptl называется величина a(pi,pi) ... a(plt pk) G(Pi, .,Pk)== a(pk,Pi)--- a(pk,pk) С определителями такого вида приходится часто иметь дело в математической физике и интегральных уравнениях. 2. Теорема. Пусть пространство L действительно, а квадратичная форма а (х, х) положительно определена. Тогда, если векторы р1,...,рк линейно независимы, то О(рь ...,Pk)>0. Если векторы рь ...,Pk зависимы, то G(pi,...,pk) — G. Доказательство. 1) Пусть векторы рь ..., pk линейно независимы. В таком случае они составят базис в своей линейной оболочке L (р\, ..., рк). Произвольный вектор х С L(pi,, Pk) можно записать в виде X — XiPi • 4“ xhPk'
§ 10] НЕРАВЕНСТВО КОШИ — БУНЯКОВСКОГО 147 Будем рассматривать f(x) на векторах из L (pi,..,, pk). В базисе р1} ..., pk имеем ь f(x)= У, a^Xj i. 7=1 (даже если исходное пространство L бесконечномерно). Так как f(x) положительно определена на всем простран- стве L, то она положительно определена и на подпростран- стве L (рь ..., pk), так что «11 ... «1й 0. (1) «*1 • - • akk Заметим, что = a(pit pj). Отсюда и из (1) G(pi, /’*)=Лй>0. 2) Пусть теперь pi, ..., pk линейно зависимы. Тогда най- дутся числа X]....Хь не все равные нулю, для которых XjPi ХЛрй = 0. Учтем, что а(х, 0) = О и подставим в это тождество х =Pt, 6 == Xipi -j- ... -j- ХЛр*. Придавая I значения 1, ..., k, получим однородную систему k линейных уравнений с k неизвестными Xia(pi, Pi)+ ... +Х*«(Р1, Ра) = 0, Х1«(рь pi)-}- ••• ~^~^ka(Pk> Pk) — 0, Эта система заведомо имеет нетривиальное решение X,, ..., ХЛ. Поэтому ее определитель равен нулю: G(Pi.....Р*)=0. Теорема доказана. 3. Важный частный случай. В условиях доказан- ной теоремы рассмотрим систему, состоящую из двух векто- ров pi, р2. Имеем a (Pi, Pi) a (pi, ръ) > а (ръ Pi) a (pir р3)
148 линейные, билинейные и КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV Если раскрыть этот определитель, учитывая симметричность билинейной формы, то получится неравенство (pi, Ps)]2 < a (pi, pi) • a (р2, pt), (2) которое называется неравенством Коши — Бундовского. При этом знак равенства имеет место тогда и только .тогда, когда векторы рг и р2 линейно зависимы. 4. Рассмотрим пространство непрерывных функций, задан- ных на каком-нибудь отрезке ti^zt^to. В этом простран- стве рассмотрим квадратичную форму *2 /(х) = $ [X (0]в dt (в связи с этим см. выше, § 4, п. 4). Для f(x) полярной билинейной формой является h а(х,У) = \ x(t)y(t)dt. Нетрудно сообразить, что f(x) положительно определена. В самом деле, если непрерывная функция x(t) отлична от тождественного нуля, то J [х(/)]2Л> 0. 6 Поэтому в данном случае можно применить неравенство (1). В результате получим неравенство Коши — Буняковского для интегралов: [^2 /а ^2 \ х (t)y (t) dtl ( [X (О]2 dt Л [у (/)|2 dt. (3) fi J h fi Знак равенства в формуле (3) имеет место в том и только в том случае, когда система x(t),y(t) линейно зависима, или, проще сказать, когда одна из функций x(t), y(f) пропорцио- нальна другой (например, y(t) = Cx(t), С = const). Этот пример показывает, как алгебраические теоремы работают за пределами собственно алгебры и дают возмож- ность получить результаты из анализа. Общей основой таких приложений является построение в бесконечномерном функ- циональном пространстве конечномерных линейных оболочек.
НУЛЕВОЕ ПОДПРОСТРАНСТВО 149 § П] §11 . Нулевое подпространство билинейной и квадратичной формы 1. Пусть а(х, у) — билинейная форма, заданная в про- странстве L. Определение 1. Будем называть правым нулевым под- пространством формы а (х, у) множество всех элементов у, для каждого из которых при любом х £ L соблюдается равенство а (х, у) — 0. (*) Это определение, очевидно, не зависит от размерности и может быть использовано в бесконечномерном случае. Правое нулевое подпространство будем обозначать Lg. Аналогично определим левое нулевое подпространство L'g, именно: у £ Lg, если а (у, х) = 0 при любом х £ L. 2. Докажем прежде всего, что Lg на самом деле является линейным подпространством. ПустьУьУ'з С То- Тогда а(х,уд — 0, а(х, у/2) = 0 при любом х. Но отсюда следует, что «(х, У! J’2) = а (х, J’i) -]- а (х, >'2) = 0, а (х, “J’i) = аа (х, i) = 0. Таким образом, yt -4-у3 £ Lg и ayt С Ц. Совершенно аналогично доказывается, что подпростран- ством является и Lg. 3. Далее будем рассматривать и-мерное пространство. Зафиксируем в нем базис а, ..., еп и запишем билинейную форму в координатах: а{х, y)=^laijXlyJ, где а,7 — a(eh ej). Покажем, что у С То тогда и только тогда, когда У;а,7уу = 0 (1) при всех значениях I (i= 1, 2, ..., я). Для этого напишем тождество aijyjjxt. (а) Если выполняются условия (1), то выполняется и (*). С другой стороны, из условия (*) следует, что в правой ZaiJxiyj=X(X
150 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV части равенства (а) все коэффициенты при Xi обращаются в нуль, а это и дает нам систему (1). Точно так же, у £ L'o тогда и только тогда, когда 2 вцУ, = 0 (2) при всех значениях j (j=\, 2, л). Равенства (1) и (2) представляют собой системы уравне- ний, определяющие и в координатах. По теоремам о линейных системах (см. гл. III) (размер- ность £о) = (размерность Ь'й) = п—г, где г — ранг били- нейной формы а (х, у), т. е. ранг ее матрицы. Отсюда следует, что ранг билинейной формы можно опре- делить геометрически. Именно, ранг формы а (х, у) равен разности между размерностью всего пространства и размер- ностью нулевого подпространства этой формы (какое здесь брать нулевое подпространство — правое или левое, — без- различно, так как их размерности одинаковы). 4. Определение 2. Билинейная форма называется невырожденной, если размерность Ь'й (или Ц) равна нулю. В остальных случаях билинейная форма называется вырож- денной. Иначе говоря, билинейная форма вырождена, если ее нулевые подпространства имеют ненулевую размерность, или (что то же самое) если ее ранг меньше размерности про- странства: г <^п, или если определитель ее матрицы равен нулю: Д = Пе1Д = 0. 5. Предположим, что билинейная форма а\х, j) вырождена, т. е. ее ранг г<Г«. Введем в пространстве специальный базис еь е2, ..., еп такой, чтобы ег+ь ..., еп£ Ц. Для этого нужно сначала выбрать линейно независимые векторы из L'o (число их как раз равно размерности £о), а затем дополнить их до базиса во всем пространстве. Посмотрим, как при таком выборе базиса будет выглядеть матрица билинейной формы. Если j=r-[- 1, ..., п, то вследствие определения aij — a(eb еу) = 0. Таким образом, °и ... а1г 0 ... 0 Л___ аа ... air 0 ... О @ni ... апг 0 ... 0
§ И] НУЛЕВОЕ ПОДПРОСТРАНСТВО 151 Матрица упрощается, причем тем сильнее, чем ниже ранг билинейной формы (чем выше размерность нулевого подпро- странства). Если выбрать базис так, чтобы последние п—г базисных векторов попали в левое нулевое подпространство, то это тоже приведет к упрощению матрицы, но теперь в нуль обратятся не столбцы, а последние строки в числе п — г: «и • • • «1л «/•1 • агп О О Пусть билинейная форма симметрична, тогда Ц совпадает с Ц (докажите). Поместим базисные векторы er+i, , еп в £q. Тогда эти же векторы окажутся в £о, и матрица при- мет особенно простой вид «и ... «V- 0 ... О аг\ ... агг 0 ... О О ... О 0 ... О (3) о ... о о ... о Таким образом, если ранг г симметричной билинейной формы меньше п, то ее рассмотрение полностью сводится к под- пространству размерности г (натянутому на et, ..., ег). 6. Рассмотрим теперь квадратичную форму /(х) = а(х, х). Определение 3. Нулевым подпространством квадра- тичной формы называется нулевое подпространство £0 ее полярной формы а (х, _у). Различать Lg и Ц здесь нет надобности, так как Li = L0. Если квадратичная форма невырождена, то ее нулевое подпространство нульмерно. Если форма вырождена, то ее ранг r<^n, a Lo имеет размерность п—г. В базисе еь ..., еп, векторы er+i, ..., еп которого помещаются в Lo, матрица квадратичной формы имеет вид (3), и форму /(х) можно рассматривать в г-мерном подпространстве Z.(fi, ег).
152 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV § 12. Нулевой конус квадратичной формы 1. Наряду с данным линейным пространством L будем рассматривать аффинное пространство 81, считая, что элемен- тами L являются радиус-векторы точек из 8(. 2. Определение. Множество точек аффинного про- странства называется конусом с вершиной О, если вместе с каждой своей точкой М, не совпадающей с О, оно содержит всю прямую ОМ (при и = 3 см. рис. 24). IB некоторых случаях одну точку О удобно рассматривать как конус, со- стоящий только из вершины. Простей- шими примерами конусов могут слу- жить любая плоскость, проходящая че- рез точку О, а также все простран- ство 81. 3. Пусть в пространстве L дана квадратичная форма f(x). Ее можно рассматривать и в аффинном простран- стве 31, считая, что значение /(х) в Рис 24 точке М определяется при х—ОМ, т. е. равно f (ОМ). Обозначим через Ко множество тех точек аффинного про- странства, в которых квадратичная форма /(х) равна нулю (М£ Кв, если /(О7Й) = 0). Теорема 1. Множество Кй представляет собой конус с вершиной в начале координат. Доказательство. Может случиться, что Ко состоит из одной точки О (например, если пространство действитель- ное, а форма /(х) положительно определена). Тогда утверж- дение верно, поскольку мы условились одну точку рассмат- ривать как конус. Предположим, что существует точка М ф 0, для которой ___ /W —° при х—ОМ. Проведем через О и М прямую и возьмем на ней любую точку М* (рис. 25). Положим ОМ* — X*. Тогда х* — Кх, где X — некоторое число. Следовательно, f(x*)=/(Хх)=а (Хх, Хх)=Х2а (х, х) — X2 f (х)=0.
§ 13J ПРИМЕРЫ НУЛЕВЫХ КОНУСОВ 153 Таким образом, с каждой точкой М ф 0 множество Ко содержит и все точки прямой ОМ (рис. 25). 4. Определение. Множество K# называется нулевым конусом квадратичной формы /(х). б. Следует обратить внимание на то, что конус не является, вообще говоря, линейным подпространством: если /(х) = 0, /(_у) = 0, то может быть /(х-|-_у) ф 0. 6. Теорема 2. Нулевое подпро- странство квадратичной формы всегда является частью нулевого конуса этой формы: Lo a Ко. Замечание. £0 определено как мно- жество векторов в линейном простран- стве, а Ко — как множество точек в аф- финном пространстве. Поэтому, говоря о включении Ц>с:Ко, нужно подразумевать, что Lo есть точеч- ное множество концов радиус-векторов из Рис. 25. нулевого подпространства. Доказательство теоремы. Пусть у С Lo, У = ОМ. Тогда а(х, _у) = 0 при любом х. Положим х=у; получим а (у, У}—— Следовательно, у С Ко в том смысле, что 714 С Ко, где 7И — конец вектора у. §13. Простейшие примеры нулевых конусов квадратичных форм 1. Рассмотрим более подробно частные случаи, встречаю- щиеся в элементарной аналитической геометрии. Будем счи- тать, что квадратичная форма не равна нулю тождественно и приведена к нормальному виду. 2. Действительная плоскость (п = 2). 1) — — х|. Здесь г — 2 и размерность Lo равна нулю. Следовательно, Lo состоит только из нулевой точки. Нулевой конус Ко определяется уравнением xf — х| = 0 и распадается на две прямые: xi = x2, xt —— х2. Из-за малой размерности конус не является поверхностью, а представляет собой линию, состоящую из двух пересекающихся прямых (рис. 26).
154 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV 2) /(x) = xjЗдесь также г —2 и размерность Lo равна 0. Нулевой конус определяется уравнением Xi-j-x| = 0 и состоит из одной точки. Иногда говорят, что такое уравне- ние определяет мнимый конус. 3) f(x) — x\. Здесь г = 1, размерность L® равна 1. Конус Ко определяется уравнением х| = 0, следовательно, Ко состоит из точек, для которых Xi = 0. Нетрудно сообразить, что в данном случае Lo должно совпадать с Ко- В самом деле, размерность Lo равна 1, а по предыдущему Lo должно войти в нулевой конус, так что Lo и будет единственной прямой A'i = 0, содержащейся в Ка. Конус Ко определяется уравне- нием второй степени. В рассматривае- мом случае говорят, что у Ко каждую точку оси х2 нужно считать дважды. В записи квадратичной формы уча- ствует только один квадрат: xf. Это произошло потому, что базисный век- тор е2 помещен в нулевое подпро- странство. 3. Трехмерное действи- тельное пространство (л = 3). 1) /(х)=-j- — xf. Здесь г = 3 и размерность Lo равна нулю, определяется уравнением — х| = 0. Нулевой конус Если рассматривать пространство с элементарной точки зрения, с углами, расстояниями и т. п„ то такое уравнение определяет круглый конус с осью на оси х3 и прямым углом между образующими. Евклидово пространство в данном случае служит мо- делью линейного пространства. Однако нужно иметь в виду, что в линейном (и в аффинном) пространстве не опреде- лены углы, нет правила измерения расстояний и потому не имеет смысла понятие «круглый конус». Все же это не препятствует использованию евклидова пространства в качестве модели линейного (или аффинного) пространства. Дополнительные свойства, евклидова пространства только помогают наглядности описаний. 2) /(х) = х|-(-х|-)-х|. Здесь г = 3, размерность Lo равна нулю, Ко определяется уравнением xf -]- х| х| = 0. Это — мнимый конус; в действительном пространстве он имеет одну только нулевую точку.
§ 131 ПРИМЕРЫ НУЛЕВЫХ КОНУСОВ 155 3) /(х)=х|4“х2- Здесь г = 2, размерность Lo равна 1. Таким образом, Lo представляет собой одномерное линейное подпространство, то есть прямую, проходящую через начало координат. Конус Ко определяется уравнением xf -j- = О и состоит из точек вида (0, 0, х3), т. е. представляет собой множество точек третьей оси. Так как LoczKo> то ясно, что £о — та же самая прямая (третья координатная ось). Только следует иметь в виду, что в Ко каждая точка этой прямой считается не один, а два раза. Заметим, что третий базисный вектор es помещен в Lo. Поэтому в представлении формы исчезло все, что связано с третьей координатой. 4) f(x) = xl — Здесь г = 2, размерность L# равна 1. Конус Ко определяется уравнением — х% = 0. Левая часть этого уравнения разлагается на два множителя первой сте- пени, так что конус Ко состоит из двух плоскостей. В каче- стве модели линейного пространства будем рассматривать евклидово пространство. Тогда Ко изобразится в виде пары плоскостей, которые проходят через ось х3, пересекаются под прямым углом и пересекают плоскость х3 = 0 по бис- сектрисам координатных углов (рис. 27). В этом примере подпространство Lo можно найти двумя способами: путем вычислений или из геометрических сообра- жений. Рассмотрим оба пути.
156 ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. IV Запишем полярную билинейную форму и приравняем ее нулю: Нужно найти такие _У = (_У1, _Уа, .Уз), Для которых это уравне- ние соблюдается при любом х — (х1, х2, х3). Ясно, что = а _у3 может принимать любые значения. Таким образом, Lo совпадает с третьей координатной осью. Получить этот результат геометрическим путем, как дела- лось в предыдущем примере, непосредственно нельзя. Известно, что Lo—прямая, проходящая через начало координат, но таких прямых в Хо много, и выделить одну из них в каче- стве Lo сразу не удается. Однако можно поступить иначе. Заметим, что в запись квадратичной формы не входит третья координата. Это зна- чит, что третий базисный вектор помещен в Lo. Ввиду одно- мерности нулевого подпространства отсюда следует, что оно совпадает с третьей координатной осью. 5) f(x)=xl. Здесь r= 1, размерность L# равна 2, конус Ко имеет уравнение xf — 0 и является плоскостью Xj = 0 (дважды взятой). Lq геометрически представляет собой ту же самую ПЛОСКОСТЬ Xi = 0. 4. Замечание. Выше рассмотрены все варианты, кото- рые могут встречаться при изучении Lo и К(1 в двумерном и трехмерном действительных пространствах. В самом деле, произвольную квадратичную форму можно привести к кано- ническому виду, а затем, если понадобится, умножить на (—1). Тем самым дело сведется к одному из рассмотренных выше случаев.
ГЛАВА V. ТЕНЗОРНАЯ АЛГЕБРА § 1. Взаимные базисы. Контравариантные и ковариантные векторы 1. Пусть L — линейное n-мерное пространство, L* — со- пряженное ему (то есть пространство всех линейных форм, заданных на L; см. выше, •§ 1 предыдущей главы). Введем в L произвольный базис еь ..., еп. Координаты произволь- ного вектора х из L в базисе еь еп будем обозначать {х1, ..., х"}. В сопряженном пространстве выберем базис е1(х), ..., еп(х) так, чтобы значения линейных форм е'(х) на векторах образовали единичную матрицу: = (1) где —символ Кронекера (8}=1 при i=j, О при * -A-jY Определение. Базис ^(х), ..., е"(х) в L*, удовлет- воряющий условиям (1), называется взаимным с данным базисом ..., еп в L. Из определения следует, что для данного базиса суще- ствует единственный взаимный базис и что он задается фор- мулами е1 (х) == 1 • х1 0 • хи + ... -|- 0 • х", е® (х) = 0 • х1 -|- 1 • х® -j- ... 0 • х", е"(х)=(Ьх1-|-(Ьх®-|- ... +1-х". 2. В пространстве L перейдем к новому базису е^,..., еп’. Для удобства дальнейших обозначений формулы (I) из § 5 гл. II мы запишем теперь несколько иначе, именно: (I)
158 ТЕНЗОРНАЯ АЛГЕБРА [ГЛ. V Здесь и далее мы помечаем штрихами индексы, относя- щиеся к новому базису; никакого другого специального смысла символам Г, 2', /г' мы не придаем, так что 1'=1, 2'=2, ..., rf = n. Теперь в матрице Р по строкам изменяется верхний индекс, по столбцам изменяется нижний индекс: Р1, Р*. ... Рп. pl pi рп р____ *2' г9' *2' Рп’Р*п' ... Рп' Пусть произвольный вектор х из L разложен по старому и по новому базису: x—x1ei-}- ... -^-xnen=xvei’-\- ... -}-хп'еП'. Формулу (III) из § 5 гл. II, выражающую новые коорди- наты через старые, запишем так: = (П) Матрицу коэффициентов правых частей равенств (II) будем обозначать через Q. При этом нужно считать, что верхний индекс изменяется по столбцу, а нижний — по строке: Qi' Qf ... Qn QI' QI' ... Q3„' Of Q* ... Qn При указанной здесь расстановке индексов и в матрице Р, и в матрице Q штрихованный индекс означает номер строки, нештрихованный индекс — номер столбца. Равенства Q = (P*)-\ Р = ^УЛ (2) остаются в силе, а формулы (4) из § 5 гл. И принимают вид = (3) Соотношениями (2) и (3) мы часто будем пользоваться ниже, не оговаривая этого дополнительно. 3. В сопряженном пространстве L* возьмем базис ег(х), ..., еп'(х), взаимный с новым базисом в L, т. е.
§ И КОНТРАВАРИАНТНЫЕ И КОВАРИАНТНЫЕ ВЕКТОРЫ 159 удовлетворяющий условиям =8?,'. (4) Найдем формулы перехода от базиса ек (х) к базису ек’ (х). Заведомо справедливы соотношения вида ?'(х)=^Л»е‘(х) (5) с некоторыми коэффициентами Л*. Поэтому дело сводится к вычислению коэффициентов Л* по заданным Рд. Из (4), (5), (I) и (1) имеем 8?' = ек' (М = 2 лГ? (^) = 2 Ake* ffi = k k \ i J = S Ak^ek (et) = 2 A%ptft. i, k i, k Следовательно, 2Л*Рр = 8?'. (6) a Обозначим матрицу искомых коэффициентов правых частей (5) через А, считая, что штрихованный индекс означает номер строки, нештрихованный означает номер столбца, то есть изменяется по строке. Тогда все равенства (6) равносильны одному матричному равенству АР*=Е, (7) где, как обычно, звездочка означает транспонирование. Из (7) получаем Л=(Р*)_1 = О. Таким образом, ек' (x) = ^iQkkek{x). (I*) 4. Пусть произвольная линейная форма и(х), т. е. элемент пространства L*, разложена по старому и по новому базису: и(х) = «1С1 (х)-|- ... -4-ипе"(х) = И1-е1'(х)4- ••• -\-иП'еп' (х). Найдем формулы, которые выражают новые координаты формы и(х), т. е. коэффициенты разложения п(х) по базису е1 (х), через ее старые координаты. Для этого вспомним, что коэффициенты искомых формул составляют матрицу, обрат-
160 ТЕНЗОРНАЯ АЛГЕБРА [ГЛ. V ную и транспонированную к матрице формул (I*). Но обра- щение и транспонирование матрицы Q дает Р. Таким образом, (п*) 5. Мы видим, что формулы (I*) и (П*) получаются из известных нам формул (I) и (П), если поменять ролями ма- трицы Р и Q. 6. Для большей наглядности приведем следующую схему. В пространстве L te""1 'to'' 1! II £ В пространстве £* * X !! " ' Ч». 7 + II + о W : М + * + Л- м * Ч. » ' з a s £ £ u(x) = Uje‘ (X)+ ••• ... +п„е«(л)е£* n(x) = nrev (x)+ ... -I-k/wca* ₽=((?*)-* 7. Назовем сверткой элемента й = й1е:1-|- ... -\-апеп из L с элементом п (х) = ще1 (х)... ипеп(х) из L* число, которое обозначается через (й, и) или (и, а) и определяется равенством (а, и) — нца1-}- ... -j-nna', = ^luf!a'1. Очевидно, что свертка есть инвариант, поскольку она пред- ставляет собой не что иное, как значение инвариантной формы и(х) = WiX1 + • • + на векторе х — а = ахех ... +й"е„. Инвариантность свертки можно вывести также как след- ствие формул (П) и (П*). В самом деле, А' Ь’\ а / X ₽ / - 2 (S W) «У=2 =2 w • а, (3 \ А' / а. ₽ А
§ 1J КОНТРАВАРИАНТНЫЕ И КОВАРИАНТНЫЕ ВЕКТОРЫ 161 8. Очевидно, что свертка обладает следующими двумя свойствами: А) При умножении и или х на число свертка (и, х) умножается на то же число: (аи, х)=(и, ах) = а(и, х). Б) Свертка распределительна по сложению: (и-{-и', х) = (и, x)-j-(«r, (и, х ~]~х')=(и, x)-j-(H« 9. Обратим внимание на полную симметрию взаимоотно- шений L и L*. Рассмотрим свертку (и, х)=И1Х14- ••• 4-ипхп. Если здесь элемент и из L* фиксирован, а х={ х1.....х" } из L произвольно изменяется, то свертка (и, х) представляет собой линейную форму с числовыми аргументами х1,..., х", принятую в качестве и. При этом L можно считать коорди- натным пространством. Ничто не мешает нам, однако, счи- тать также и элементом координатного пространства, именно тем элементом, который определяется коэффициентами формы (и, х), и писать и = { , ц„}. Будем теперь предполагать, что фиксирован элемент х — {х1, ..., х"} из L, а меняется и = { щ,..., ип}. В таком случае свертка (и, х) есть линейная форма с числовыми аргументами щ, ..., ип. Мы можем принять в качестве х не набор {х1.....хп\ коэффициентов этой формы, а саму форму. Тем самым элементы х £ L получают точно такое же истолкование по отношению к элементам и С L*, какое эле- менты и £ L* имеют по отношению к элементам х £ L. Иначе говоря, если пространство L* есть сопряженное для L, то L можно рассматривать как сопряженное для L*. 10. Симметрия взаимоотношений L и L* уже усматри- валась выше при переходе от формул (I), (II) к формулам (I*), (II*) (см. также таблицу, приведенную в п. 6). Наряду с этим следует иметь в виду, что одно из пространств L и L* (именно L) принято в качестве исходного. Это обстоя- тельство сказывается на терминологии, о которой говорится в следующем пункте. 11. Преобразование по формуле (I) с матрицей Р назы- вается преобразованием по ковариантному закону.
162 ТЕНЗОРНАЯ АЛГЕБРА ГГЛ V Преобразование по формуле (II) с матрицей Q называется преобразованием по контравариантному закону. В данном пространстве L координаты каждого вектора преобразуются по контравариантному закону. В сопряженном пространстве координаты векторов преобразуются по кова- риантному закону. В соответствии с этим векторы данного пространства L принято называть контравариантными, а элементы сопряжен- ного пространства — ковариантными векторами. 12. В тензорном исчислении принято в случае ковари- антного закона преобразования пользоваться нижними индек- сами, в случае контравариантного закона преобразования пользоваться верхними индексами. В соответствии с этим мы пометили верхними индексами координаты векторов из L. Расстановка индексов у элементов матриц Р и Q делается с таким расчетом, чтобы индекс суммирования, дважды встре- чающийся в выражении общего члена суммы, один раз был нижним индексом и один раз — верхним (См. таблицу п. 6). Если же под знаком суммы имеются свободные индексы, по которым нет суммирования, то такие же индексы (соответст- венно верхние или нижние) ставятся у величины, полученной в результате суммирования. Соблюдение этих правил помогает определять законы преобразования величин, получаемых в результате суммирования. Вместе с тем эти правила застав- ляют, например, обозначать верхними индексами номера ба- зисных ковариантных векторов. 13. Ниже, в пределах этой главы, мы будем всюду счи- тать, что выбираемые в L и L* базисы взаимны. Базис в L*, взаимный с базисом {et} £ L, будем обозначать через {е1} (упрощая прежнее обозначение е*(х)\ Произвольный элемент в I* будет обозначаться через и (или v и т. п.) вместо и(х) (или и(х) и т. п.). 14. Новое определение сопряженного про- странства. Понятие сопряженных пространств можно изло- жить несколько иным способом, так что их взаимное равно- правие будет видно сразу из самого определения. Пусть L и L* — два линейных пространства; ради про- стоты изложения мы с самого начала предположим, что они конечномерны и имеют одну и ту же размерность = п. Пред- положим, что с любой парой элементов х С L, а £ L* сопо- ставлено число; мы обозначим его через (х, и) и назовем
§ 1] КОНТРАВАРИАНТНЫЕ И КОВАРИАНТНЫЕ ВЕКТОРЫ 163 сверткой элементов х, и, если имеют место следующие свойства: 1) Распределительное свойство по каждому элементу: (х, ll1JrUi) = (x, izi) + (x, и2), (%1 + х2> и)=(Х1, и) + (х2, и) для любых х, хъ х2 £ L, и, иь и2 £ L*. 2) Сочетательное свойство относительно умножения на число любого элемента: (ах, и) = (х, аи) = а(х, и). 3) Свойство невырожденности: если ап линейно независимы в L и (о1; и) = 0, (ап, и)=0, то и есть ну- левой элемент в L*. Аналогично, если blt ..., bn линейно независимы в L* и (х, bi)—0, .... (х, fc„)=0, то х есть нулевой элемент в L. Пространства L и L* могут быть оба действительными или оба комплексными; соответственно этим двум случаям все числа, о которых здесь говорится, предполагаются дей- ствительными или комплексными. Обозначим через elt ..., еп произвольный базис в L, через ё1, ..., ё"—произвольный базис в L*. Пусть х = = '£ixlei£' L, u—'^tukeh^ L*. Вследствие свойств 1) и 2) имеем (х, а) = 2 aix'ilk, (8) где а* —(e;, ё*). Таким образом, свертка выражается в виде билинейной формы (8). Легко убедиться, что свойство 3), т. е. условие невырожденности, означает невырожденность билинейной формы (8). Легко убедиться также, что свертки (х, и) можно задавать формулой (8) по-разному, пр о из- k k вольно назначая числа at, лишь бы иметь Det о/ ф 0; условия 1), 2), 3) будут при этом соблюдены. Пространства L и L* назовем (взаимно) сопряженными, если для них задана свертка и если они рассматри- ваются вместе с данной сверткой. При нашем теперешнем определении мы можем для данного L построить бесконечно много различных сопряженных пространств L* (точнее говоря, по-разному сопряженных с L). Желая
164 ТЕНЗОРНАЯ АЛГЕБРА 1ГЛ. V исключить такую неопределенность, мы определим понятие эквивалентности линейных пространств, сопряженных по-раз- ному с данным L. Обозначим через L* и L| два «-мерных пространства, сопряженных с L. Назовем их эквивалентными в смысле сопряженности с L, если между ними существует линейный изоморфизм такой, что (х, и) = (х, if), (9) где х — произвольный элемент из L, и—произвольный эле- мент из L*, 1/— соответствующий ему по изоморфизму эле- мент Lg. Легко убедиться, что все линейные пространства, сопря- женные с данным L, эквивалентны между собой. Чтобы доказать высказанное утверждение, достаточно установить, что если для L и L* дана (произвольная) свертка, то для любого базиса еь еп £ L найдется единственный взаим- ный с ним базис е1, ... , еп в пространстве L*. Иначе говоря, е1, ... , еп £L* можно найти (единственным образом) так, что (ег, е*) = В?. Для доказательства рассмотрим произвольный базис ek, с помощью которого задана свертка формулой (8). Будем искать первый вектор е1 базиса е1, ... , еп в виде е1 = ^ё1 -ф- -ф-... -ф- а„ёл. Мы должны иметь (еь е1)=1, (е% е1)=0, ... , (еп, е1)=0. Отсюда a’aj + + а"ап = 1, + • • • + а"ап = °> (Ю) anPi -ф- Ола2 -ф- ... -ф- а^рп — 0. Система (10) однозначно разрешима, так как Det af Ф 0. Аналогично, полагая е2=[Дё’ -ф- ... -ф- р„ё'!, найдем е2 из усло- вий (^ е2)—0, (<?а, е2)= 1, (еа, е2) = 0, ..., (<?„, е<2) = 0. Продолжая процесс, найдем все векторы е\ ... , еп £ L* такие, что (е,-, efc) = 8* Они составят независимую систему. В самом деле, пусть
§ 1] КОНТРАВАРЙАНТНЫЕ И КОВАРИАНТНЫЕ ВЕКТОРЫ 165 Свертывая левую и правую части этого равенства с вектором ek С L, найдем 6*)’ или Xfc = 0 (k=\, 2,..., и), поскольку (ek, е')=В* и (ek, 0*)=О. Тем самым доказано, что для любого базиса fi, ... » е„ С L существует взаимный базис е1, ... , еп в пространстве L* при любом задании сопряженности меж- ду L и L*. Докажем единственность. Допустим, что для данного базиса fi, • • • , fn € найдутся в пространстве L* два взаимных базиса: е\ и e‘t. Имеем: (ek, е') = В* и (eh, e‘)=8j,. Отсюда (ek, f‘—е‘) = 0 для всех k—\, ..., п и при любом Z=l, 2...... п. Отсюда и по условию невырожденности находим е\— е’ = 0*, или f‘=f‘. Пусть теперь х=ххе14- • • • 4~ хпеп (г L, « = ще’ ... 4“ чпеп Е L*, где е{ и ек — взаимные базисы. Формула (8) теперь принимает вид (Х, W) = X,H1-f- ... -\-Xnlln. (11) Вместе с тем доказана эквивалентность всех пространств, сопряженных с L. В самом деле, пусть L* и LJ— два про- странства, сопряженных с L, ех, ... , е„— любой базис в L, f1, ... , еп — взаимный с ним базис в L*, (f1/, ..., (епу — взаимный с fi, ... , еп базис в LJ. Установим линейный изо- морфизм между L* и L|, полагая и'=П1 (е1)' -|- ...J- п„ (fПУ, if £ L|, в качестве соответствующего элемента для произвольного н = Hjf14- • • • + wnf", « € Ь*• Тогда вследствие (И) (х, и)=(х, if). Теперь ясно, что новое определение сопряженных пространств по существу не отличается от ранее изложенного. Достаточно заметить, что с произвольным элементом и £ L* сопоставляется линейная форма (х, и)=«1Х1 -j- чпхп, где иь ... , ип — коэффициенты (постоянные координаты дан- ного вектора и £ L*).
166 ТЕНЗОРНАЯ АЛГЕБРА (ГЛ. V § 2. Тензорное произведение линейных пространств 1. Пусть даны линейные пространства L и L, одновре- менно действительные или комплексные (возможно, беско- нечномерные). С помощью векторов из £ и £ мы построим некоторые новые объекты, множество которых обозначим через Т. Прежде всего, элементами Т будем считать всевозможные пары векторов ab, где а £ £, b £ £. Кроме того, в качестве элементов Т будем рассматривать всевозможные наборы таких пар, взятых каждый раз в конечном числе. Никаких других элементов в Т уже не будет. Иначе говоря, любой элемент t £ Т имеет вид /={аЛ, ... , akbk}, (1) где аь ... , ak£ L, Ьь ... , bk £ L. Смысл этого равенства заключается только в том, что элемент множества Т, обозначенный буквой t, есть набор пар axbi, ... , akbb. Договоримся на первом месте пары всегда писать элемент из £. Если £ и £ совпадают, то пары векторов, которые составляют элементы множества Т, считаются упорядочен- ными, т. е. порядок записи векторов в паре существен. Таким образом, в случае £ = £, а £ L,b £ £, вообще говоря, ab ф Ьа. 2. Для дальнейшего оказывается более удобным пару cb называть произведением а на Ь, кроме того, вместо слов «набор пар» употреблять слово сумма. Соответственно вместо (1) будем писать t = -j- ... + okbk, (Г) где ai, ... , ak£ L, bi, ... , bk £ L. Заметим, что очень часто пару ab называют формальным произведением а на Ь, а сумму (1') — формальной суммой. Далее мы увидим, что указанная арифметическая терминология имеет достаточно оснований. 3. Для множества Т мы введем три условия эквивалент- ности, т. е. условия, при которых некоторые элементы Т счи- таются равными. Именно: 1) формальная сумма не зависит от порядка слагаемых; 2) (а -J- Ь) с = ас -j- be, где а, b — любые векторы из £, с — любой вектор из £; ана- логично a(b с)= ab ас, где а С £, Ь, с £ £;
§ 2] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРОСТРАНСТВ 167 3) (аа) b — a (ab), где а, b — любые векторы, взятые соот- ветственно из L и L, а — любое число (действительное, если L и L — действительные пространства, комплексное, если эти пространства комплексны). Замечание. Мы не упомянули еще одно условие экви- валентности как само собой разумеющееся (его следовало бы поставить на самом первом месте), именно, что при допусти- мой замене векторов ... , ак, blt ... , bfi элемент t подвер- гается допустимой замене, то есть переходит в равный себе. 4. Условия п. 3, другими словами, означают, что мы счи- таем допустимыми заменами элемента :== °i^i 4" • • • 4" € Т (2) а) изменение порядка записи пар а^, ..., в сумме (2); б) замену одной пары суммой пар или замену суммы пар одной парой согласно 2) п. 3; . например, если == ajто пару aibi в составе t допустимо заменить суммой a'tbi -f- а[Ьй в) перенос числового сомножителя от одного вектора дан- ной пары к другому вектору той же пары. Вместе с этим два элемента tlt £ Т считаются равными в том и только в том случае, когда с помощью конечного числа допустимых замен их можно привести к одному и тому же набору пар элементов из L и L. 5. В множестве Т мы введем линейные операции. 1. Суммой двух элементов множества Т t -|“ . . . -|“ — 01^1 4“ Ombm назовем элемент этого множества, который представляет собой набор пар элемента t, объединенный с набором пар эле- мента t': t-\-V = 01^14" ... 4" ak^k 4- с1^1 4- • •. 4- ambm- 2) Произведение элемента t на число а определим равен- ством al = (aai) bi 4~ ... 4- (аа/;) Вследствие п. 4 сумма и произведение а! инвариантны относительно допустимых замен элементов t и Г.
168 ТЕНЗОРНАЯ АЛГЕБРА |ГЛ. V Докажем, что множество 7 вместе с такими линейными операциями является линейным пространством. Прежде всего заметим, что аксиомы 1), 2) и 5) — 8) линей- ного пространства с очевидностью соблюдаются для Т вслед- ствие данного сейчас определения линейных операций и вслед- ствие условий 1) и 3) п. 3. Остается проверить аксиомы 3) и 4). Чтобы проверить аксиому 3), нужно обнаружить в Т нуле- вой элемент. Покажем, что нулевым элементом в Т является пара 60, где 6 — нулевой элемент £, 6 — нулевой элемент L. Для этого предварительно установим, что каким бы ни был элемент b£ L, имеем 66 = 6Ь (аналогично 66 = afi для любого а £ L). В самом деле, согласно условию 3) п. 3 66=6 (0 • Ь) = (0 • 6) b = ВЬ. Отсюда ab + 68 = ab 4- Bb = (a -f-6) b = ab. Наконец, если t=a1b1-\- ... -|-akbk — любой элемент из Т, то f4-66=0^14- ... 4-(«Л + е6) = аА4- ... -\-akbk = t. Тем самым соблюдение третьей аксиомы линейного прост- ранства для Т установлено. Четвертая аксиома проверяется без труда. Именно, для любого t£T противоположным элементом является (—1)-/. Действительно, t4- (—* i)- f=сЛ 4-... 4- ak^k 4- +(— i)(«A4~ ••• 4~сЛ);=(<г1 + (— ••• • • (с* (— О ak) bk — 6 • bi 4~ • • 4- ® — = се4- ... 4-бё=ее. Доказательство нашего утверждения по поводу множества Т полностью завершено. 6. Определение. Линейное пространство Т с учетом конструкции его элементов в виде сумм произведений эле- ментов из L и L называется тензорным произведением про- странства L на L. Для его обозначения употребляется
§ 2] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРОСТРАНСТВ 169 символическая запись T=L®1. Элементы пространства Т, рассматриваемые как суммы произведений элементов из L и L, называются тензорами над пространствами L и L. 7. Наряду с пространствами L и L рассмотрим сопряжен- ные им пространства L* и L* и введем еще одну операцию, называемую сверткой элементов из Т с элементами из L* и из L*. Возьмем сначала в качестве элемента Т одну пару ab, а £ L, b £ L. Пусть п£ L*. Свертку пары ab по ее второму (правому) элементу с элементом и (правую свертку) обозна- чим через (ab, й) и определим равенством (ab, ii) = a(b, а). (3) Здесь (Ь, и) есть свертка элемента b £ L с элементом и £ L *, понимаемая в смысле п. 7 § 1 этой главы. Так как (Ь, и)— число, то свертка (3) является вектором, коллинеарным а, т. е. вектором из L. Свертка пары ab по ее первому (левому) элементу с элементом г> £ L* (левая свертка) обозначается и определяется согласно равенству (у, ab) = (v, a)b. Это есть вектор из L, коллинеарный с вектором Ь. Свертку элемента t — aibi -f- например правую с элементом и £ L*, определим почленно: (oi^i -{- • • • Ч- atPk> н) = ai (Ръ и) + • • • 4~ ak (b/,, и). 8. Свертка элемента t £ Т с элементом £ L* или с элементом и £ L* инвариантна относительно допустимых замен элемента t. Доказательство. Согласно определению свертки и вследствие п. 7 § 1 этой главы свертка распределительна относительно сложений элементов из Т, L и.£; числовые со- множители выносятся за знак свертки. Поэтому при допу- стимой замене элемента t получается также допустимая заме- на его свертки с и или v.
170 ТЕНЗОРНАЯ АЛГЕБРА (ГЛ. V Следствие. Если два элемента t\, Т равны, то свертки ti и по правым элементам их пар с одним и тем же элементом и С L* также равны (разумеется, анало- гичное утверждение имеет место для сверток по левым элементам'). § 3. Базис в тензорном произведении. Координаты тензора 1. Пусть теперь L и L конечномерны; обозначим их размерности соответственно через л и т. Пусть ег, , еп — базис в L, ёь... , ёт— базис в L. Рассмотрим Т—L(x)L. Лемма. Если • • • ~Ь etfln — (1) где а.} £ L, то at — a^—... =ап = 6. (2) Доказательство. Рассмотрим в L* базис е\ ... , еп, взаимный с данным базисом в L. Возьмем левую свертку равенства (1) с вектором е\ На основании п. 7 § 2 мы полу- чим равенство: (с1, <?i)Й1(е1, сДо-)- ... -[-(е1, еп)ап = = (е\ 0)0 = 0-0 = 0. Отсюда 1 • 21 —0 • а2 —|— ... —J— 0 • ап = 0. Следовательно, ai = 0. Аналогично найдем остальные равенства (2), свертывая (1) с е\ ... , еп. Лемма доказана. 2. Теорема 1. Всевозможные пары etej линейно не- зависимы в пространстве Т. Доказательство. Пусть имеется соотношение = (3) i. i где а,-у — некоторые числа. Равенство (3) можно записать в виде So i \ J 1
КООРДИНАТЫ ТЕНЗОРА 171 § 3] Отсюда и из предыдущей леммы следует, что = ® (4) j для каждого номера I. А так как Sj — векторы базиса, то из (4) следует, что аг^ = 0. Теорема 1 доказана. Теорема 2. Пары егё] образуют базис в простран- стве Т. Доказательство. Пусть t £ Т; имеем: t — а^ . ..-\-akbk. Разложим векторы ob..., ak £ L по базису еъ ..., еп, а векторы Ьь ... , bh £ L — по базису ..., ёт. Тогда после группировки членов получим п tn t='Ei S (5) i~1j = 1 где — некоторые числовые коэффициенты. Согласно (5) любой элемент из Т линейно выражается через пары егё}. Отсюда и из теоремы 1 следует теорема 2. Следствие. Если L и L имеют размерности пит, то тензорное произведение Т= L (£) Ь конечномерно и имеет размерность пт. 3. Теперь мы специально рассмотрим три случая тензор- ного произведения двух пространств, когда либо оба прост- ранства совпадают, либо одно из них является сопряженным к другому. Пусть L — пространство размерности п, L* — сопряжен- ное ему; пусть et,..., еп — базис в L; е1, ... , еп — взаимный с ним базис в L*. 1) Тензорное произведение L на L будем обозначать через Т%. Согласно п. 2 любой элемент t £ Tg = L Q L имеет разложение t=^eiej. (6) Элементы произведения 71 = L (х) L называются двухвалент- ными контравариантными тензорами над пространст- вом L. 2) Произведение L* на L* обозначим через Т®. Элементы этого произведения называются двухвалентными ковариант-
172 ТЕНЗОРНАЯ АЛГЕБРА 1ГЛ V ними тензорами над L. Для любого t£ Т% = L* (х) L* имеем (7) 3) Произведение L на L* обозначим через Т]; его эле- менты называются двухвалентными смешанными тензо- рами над L. Для любого Т[ = L (х) L* имеем t = ^<.ei(J. (8) Замечание. Элементы самих пространств L и [*, т. е. контравариантные и ковариантные векторы, называются также одновалентными тензорами (контра- и ковариантными -соот- ветственно). 4. Коэффициенты разложений (6), (7), (8) называются опре- деляющими числами или координатами своих тензоров в базисе еь ... , еп пространства L. Они помечаются верх- ними или нижними индексами в зависимости от структуры тензора (как именно, видно из (6), (7), (8)). Замечание. Поскольку тензоры определяются коорди- натами, то часто, когда говорят «дан тензор», пишут при этом его координаты, например t" (подобно тому, как в аналити- ческой геометрии говорят: дана точка (х, _у)). 5. Элементы произвольной квадратной п X «-матрицы можно принять за координаты некоторого тензора в данном базисе. Их заданием в виде таблицы (т. е. соответственно индексам) всегда будет определен некоторый тензор в Т1, а также в 7j и в Т\. При переходе к новому базису коор- динаты тензоров преобразуются по специальным законам, отвечающим 7^, и Т{. Найдем эти законы. 6. Для координат тензоров из Т% = L (х) L имеет место контравариантный закон преобразования по обоим индексам. Это значит, что если мы в пространстве L перейдем к новому базису ev=^P[eb (9) то новые координаты тензора t £ будут выражаться через его старые координаты по формулам (I) й J
§ 3] КООРДИНАТЫ ТЕНЗОРА 173 Доказательство. Для формул (9) обратными яв- ляются еi — 2 О/е i'- Отсюда * = У, = У, /Q'iei' У <$еЛ = i> A i1 Г / С другой стороны, t=^'i'evef. (11) Сравнивая (10) и (11), получим (I), что и требовалось. 7. Закон преобразования (I) выведен нами как следствие инвариантности тензоров f ( относительно выбора базиса в пространстве; мы воспользовались этой инвариантностью в тот момент, когда сравнивали (10) и (11). Наоборот, ин- вариантность тензоров t С Т1 следует из (1). Подробнее: если в базисе еь ..., еп С L произвольно даны числа т'7 (z, J = = 1, 2, ..., ri) и если при переходе к другому базису е^, ..., еп> £ L по формулам (9) они заменяются числами т,1'? согласно (I), то У t’-'i'eref — £ Доказательство. Применяя (9) и (I), получим 2 (S Q{) (1>к) = = S (S (S Qfpj') eiej =2 т“₽8‘8^=2 8. Для координат тензоров из T$ = L* (x)L* имеет место ковариантный закон преобразования по обоим индексам: (И) Для координат тензоров из Т\ — L (х) L* имеет место контра- вариантный закон преобразования по верхнему индексу и ковариантный по нижнему: 4=^jQiPf- 0П) Обе формулы (II) и (III) выводятся, исходя из инвариант- ности тензоров в и Т[ относительно выбора базиса в L,
174 ТЕНЗОРНАЯ АЛГЕБРА [ГЛ V вполне аналогично формуле (I). При этом для вывода фор- мулы (II) нужно вместо (9) использовать известные нам равенства = (12) Для вывода (Ill) следует использовать и равенства (9), и равенства (12). Замечание. В свою очередь инвариантность тензоров в Г» и Г{ в том смысле, как это объяснено в п. 7 для 77, следует из (И) и (III). 9. Линейные операции над тензорами в 77, и Т{ выражаются в координатах по обычным правилам. 1) При сложении тензоров их координаты складываются: например, если t — С Т20, s='^a,'eieJ (Е Т%, то € т2. Разумеется, сложение тензоров разной структуры не опреде- лено. Если бы мы вздумали складывать их координаты, то не получили бы инвариантного результата. 2) При умножении тензора на число все его координаты умножаются на то же число; например, для 1 ( 10. Выражение свертки в координатах требует несколько более подробного объяснения. Пусть даны двухвалентный контравариантный тензор t — £ Т„ и ковариантный вектор w = 2w«e‘ С L*. Рассмотрим, например, правую сверт- ку t с вектором и. Имеем (7, и)=(2т'уе1-еу, ^lukek)='Sl^'Uk^i(ej, ek)~ —2 =2 CS tiktik) ei. Таким образом, в результате этой свертки мы получаем не- который вектор x = € Е, координаты которого нахо- дятся путем суммирования по второму индексу т'/; Аналогично в случае левой свертки (и, 0=2(2^4)^,
§ 3] КООРДИНАТЫ ТЕНЗОРА 175 мы получаем вектор = С L, координаты которого находятся путем суммирования по первому индексу т'7: И. Если £ L, то правая свертка (t, х) = 2(2г/АУ)ег. Это есть вектор zz = 2?z;e‘ € L*, т. е. вектор сопряженного к L пространства. Координаты его находятся путем суммиро- вания по второму индексу «• = 2'Г«-У- Левая свертка представляет собой также вектор из L* и сво- дится к суммированию по первому индексу 12. В случае 1 = £ Т\ возможна свертка и с век- тором x='£xkek ( 1ис вектором u — ^ukek £ L*. Именно: & х)==(^^е.е>, ^ixkek') = ^iJxkei^> ek) = £(£У)ег. Аналогично & «) = (S 2 «Z) = 2 xijuk (ер е V = £ (£ 47*) Таким образом, если х £ L, то (#, х) £ L. Если и g L*, то (t, и) Е L*. 13. Для t £ Т\ возможна внутренняя свертка, которая заключается в замене каждой пары afii в составе t = аА~|-... ...-\-akbk C L, bt £ L*) сверткой (a,-, Zz;). Это определение не связано с выбором базиса, поэтому внутренняя свертка смешанного тензора t есть инвариантное число, зависящее только от выбора элемента t из пространства Т\. Если обозначить внутреннюю свертку t через (t), то в произвольном базисе имеем (О = 2 (ен е') = 2 S = + т2 + • • • + т«- Отсюда также можно вывести инвариантность внутренней свертки как следствие формулы (III). В самом деле, из (III) имеем S 4=S =S 4 k’ i, j \k' } i, j k
176 ТЕНЗОРНАЯ АЛГЕБРА ГГЛ V 14. Мы видим, что свертка во всех случаях приводится в координатах к суммированию по одному контравариантному (верхнему) индексу и по одному ковариантному (нижнему) индексу. При этом общее число валентностей, т. е. общее число индексов, которыми помечены координаты тензоров, понижается на две единицы. В тех случаях, когда остается один индекс, результат свертки есть одновалентный тензор (век- тор из L или из L*), Например, свертка ^itkiuk = x’ оставляет один свободный индекс (верхний) и дает вектор ^x'ej £ L. В тех случаях, когда свободных индексов не остается (как в п. 13), получается числовой инвариант. Поэтому числовые инварианты часто называют тензорами нулевой валентности. § 4. Тензоры билинейных форм 1. Пусть в линейном n-мерном пространстве L дана ин- вариантная билинейная форма а(х, у), х, у £ L. Если в L задан базис еь ..., еп, то в этом базисе форма а (х, у) имеет координатное представление: а(х, y)==^laiJxiyf. (1) Пусть делается переход к новому базису в L: ev = ^pivei- В новом базисе форма а (х, у) получает другое координатное представление с новыми коэффициентами Согласно § 3 гл. IV ar/' = S aijPvPir Таким образом, коэффициенты билинейной формы в L пре- образуются по ковариантному закону для каждого индекса (см. (И) п. 8 § 3). Поэтому с формой а(х, у/) можно сопо- ставить тензор из Та, именно Он называется тензором данной билинейной формы. Из п. 7 § 3 следует, что тензор а сопоставляется с формой а(х, у) инвариантно (т. е. он один и тот же независимо от выбора базиса в пространстве L). Обратно, любому тензору (2) из отвечает билинейная форма в L. В самом деле, если сделать левую свертку (2)
ТЕНЗОРЫ БИЛИНЕЙНЫХ ФОРМ 177 § 4] с вектором £ L, а затем найденный вектор (из L*) свернуть с вектором j = € Ь> то получится правая часть (1). Тем самым с тензором а сопоставляется билинейная форма а(х, j) = ((x, a), y) = YlaiJxiyl. (3) Инвариантность такого построения билинейной формы в L по заранее данному тензору в 7% очевидна, поскольку свертка есть инвариант. 2. Чтобы установить аналогичную связь с теорией били- нейных форм для тензоров из Т% и Т{, нужно рассматривать билинейные формы от двух ковариантных векторных аргу- ментов и билинейные формы, у которых один из векторных аргументов является контравариантным, другой — ковариант- ным. И те и другие формы определяются как функции с числовыми значениями, линейные по каждому аргументу. Кроме того, должна быть потребована их инвариантность, т. е. независимость их числовых значений от выбора базиса (см. ниже, пп. 3, 4). 3. Билинейная форма а (и, д) с двумя ковариантными аргументами u='£iuiet £ L*, v='£viei £ L* имеет коорди- натное представление а (и, т))=2 a^UfVj с коэффициентами а,, — а(е\ е1}. Отсюда и из (1*) п. 3 § 1 аг' i' = а (е1', е?) — а (е‘, Q*' Qj' — £ a1' Of QT. Таким образом, коэффициенты формы а (и, г») преобразуются по контравариантному закону для каждого индекса (см. (I) н. 6 § 3). Поэтому с формой а (и, v) инвариантно сопостав- ляется тензор из То, именно а = У j. Обратно, любому заранее данному тензору а £ Т% отвечает в виде свертки инвариантная билинейная форма а (и, щ)=((п, a),
178 ТЕНЗОРНАЯ АЛГЕБРА 1ГЛ. V 4. Для билинейной формы а(х, и) с двумя разнородными аргументами х = £ L, и — £ L* имеем а (х, и) = 2 a{x?tij, где а{=а(ер е^). Отсюда а{' — а (е.„ еГ) = а (ер Р\, Q? = £ а/Р', QT. Таким образом, коэффициенты формы а(х, и) преобразуются по ковариантному закону для нижнего индекса и по контра- вариантному— для верхнего. Поэтому с формой а(х, и) инвариантно сопоставляется тензор из Т\, именно Обратно, любому заранее данному тензору а С Т\ отвечает билинейная форма а(х, х), и) = у aix‘tij. 5. Заметим, что валентности тензора формы противопо- ложны валентностям ее аргументов. Например, если некоторый аргумент формы является ковариантным, то соответствующий ему индекс тензора этой формы будет контравариантным (верхним). 6. Формулы (2) и (3) п. 1 устанавливают взаимно одно- значное соответствие между билинейными формами в L и тензорами в Т%. Очевидно, это соответствие является изомор- физмом относительно линейных операций. Таким образом, в смысле линейной алгебры теория тензоров в Т% равносильна теории форм а(х, у) в L. То же самое можно сказать по поводу теории тензоров в и в Т{ и теории форм а (и, т>) и а(х, и). Однако построение отдельной теории тензоров (помимо теории форм) необходимо. Во-первых, дело в том, что в рамки теории форм не укладывается операция свертки. Во- вторых, тензоры сопоставляются не только с формами, но и со многими другими объектами алгебры в геометрии (а также механики и физики). Такое сопоставление, прежде всего, позволяет общими методами строить инварианты рассматри- ваемых объектов (чаще всего в виде сверток). Кроме того,
§ 41 ТЕНЗОРЫ БИЛИНЕЙНЫХ ФОРМ 179 отсюда возникает возможность выражать связи между объек- тами в виде тензорных уравнений, т. е. в виде равенств между тензорами. Важной особенностью тензорных уравнений является их инвариантность. 7. Именно, пусть имеется, например, уравнение тг, = 0. (4) Оно означает, что в данном базисе все координаты некото- рого тензора из 7^ равны нулю. Но тогда координаты этого тензора равны нулю в любом другом базисе. Арифметически это обстоятельство усматривается из формулы (I) п. 6 § 3, но по существу оно непосредственно проистекает из самого определения тензоров из как инвариантных объектов (уравнение (4) выражает инвариантный факт, что тензор -f = 2 есть нулевой элемент в Т^). Разумеется, то же самое можно сказать про уравнения вида и т* = 0. Вследствие инвариантности тензорных уравнений для до- казательства их справедливости достаточно сделать проверку в каком-нибудь одном, по возможности удобном базисе. Это простое соображение будет часто применяться в дальнейшем. 8. Укажем один признак, позволяющий распознавать двухвалентные тензоры. Пусть некоторый объект А определен в любом базисе еj, ..., еп пространства L координатами а^, но мы не знаем, как изменяются его координаты при переходе от одного базиса к другому. Имеет место предложение: Если свертка координат aik по какому-нибудь индексу с координатами любого контравариантного вектора всегда имеет по оставшемуся свободному индексу ковариант- ный закон преобразования, то сами координаты а^ пре- образуются по ковариантному закону для каждого индекса. Доказательство проведем для свертки по первому индексу. Пусть x — ^lxiei— произвольный контравариантный вектор (т. е. х ( рассмотрим свертку bk = Xlailtxi. По условию мы можем рассматривать bk как координаты некоторого вектора b £ L* (в базисе е1...е"). Возьмем в L еще один, также произвольный вектор = Тогда (А _у) == у; bkyk = 2 (5)
180 ТЕНЗОРНАЯ АЛГЕБРА (ГЛ. V есть инвариант. Следовательно, правая часть (5) есть коор- динатное представление инвариантной билинейной формы. Отсюда и вследствие п. 1 наше предложение доказано. Замечание. На основании доказанного предложения объекту А инвариантно сопоставляется тензор из Т$. Соот- ветственно это предложение можно считать признаком кова- риантных двухвалентных тензоров. 9. Аналогично, если является контр авар иантным вектором при любом выборе ковариантного вектора аг, то a,k есть двухвалентный контра- вариантный тензор. Если yk — У, atxf является контравариантным вектором при любом выборе контравариантного вектора х1, то — смешанный тензор. Оба утверждения сводятся (подобно предыдущему) к пп. 3, 4. § 5. Многовалентные тензоры. Произведение тензоров 1. Поскольку определено тензорное произведение двух пространств, тем самым определено также тензорное произ- ведение пространств, взятых в любом числе. Достаточно перемножать их последовательно в каком-либо порядке. Если даны линейные пространства Lt, Е2, L3, то произведение 7'=(Е1 (х) Е2)(х) Е3 имеет в качестве своих элементов фор- мальные суммы любого конечного числа слагаемых вида (ab)c, где а С Lt, b С L2, с g L3. Условия эквивалентности и соответственно допустимые замены элементов Т получаются сочетанием условий эквивалентности элементов произведения Lt (х) Eg на Е3 и произведения Lt на Eg. Например, ((a' а") Ь)с = (а'Ь) с -|- (а"Е) с; ((аа) Е) с = (а (аЕ)) с = (аЕ) ас, где а — число. Кроме того, мы дополнительно потребуем условие эквивалентности ассоциативного характера (аЕ) с = a (be).
§ 5] ПРОИЗВЕДЕНИЕ ТЕНЗОРОВ 181 Оно означает тождество (Ц 0 L2) 0 L3 = Lj 0 (I2 0 La) и позволяет писать аЬс вместо (аЬ)с или а(Ьс). Линейные операции в Т определены вместе с произведением Ц 0 на L3. Одновременно определена, и свертка, левая — с элемен- тами из L*, правая — с элементами из L3. Можно определить также свертку по средним элементам троек с элементом и £ L*, полагая (сцЬ^+ akbkck, и)—fa, и)алС1 -f-...-j-fa, u)akck. Эта свертка есть элемент произведения Li 0 L3. 2. Тензорное произведение любого числа пространств определяется по индукции. 3. Пусть дано линейное пространство L. Положим 7'₽=(L0L0...0L)0(L*0L*0...0L*), где имеется р сомножителей L и q сомножителей L*. Эле- менты из Тр будем называть тензорами над пространством L, контравариантными р раз и ковариантными q раз (или имеющими р контравариантных и q ковариантных валент- ностей). Для единообразия обозначим также L через Т10 и L* через Г}, что согласуется с условием, по которому элементы из L и L* называются одновалентными тензорами. 4. Поскольку каждое пространство Тр является линейным, то для тензоров в каждом из этих пространств определены линейные операции. Сложение тензоров из разных прост- ранств Тд\ И Тд} мы не определяем. б. Помимо линейных операций над тензорами в каждом lpq, мы определим произведение тензоров, взятых из каких угодно, хотя бы различных пространств и Пусть г С Тд\, s С Произведением г на s назовем упорядоченную пару rs, понимаемую как элемент тензорного произведения Тд[ 0 7^. Вообще говоря, rs ф sr. В согласии с п. 1 имеем для любых г, s, t (rs)t = r(st). Соответственно получаем произведение трех тензоров: rst— =(rs)t=r(st\ Вместе с тем определено произведение тен- зоров для любого числа сомножителей.
182 ТЕНЗОРНАЯ АЛГЕБРА [ГЛ. V 6- Допустим, что г и s могут быть представлены в од- ночленном виде, т. е. в виде произведения элементов из L и L*: Г • • @Р1Ь1 • • • S -— tZj . .. UpcJ)\ ... bq^f где Oj, ..., ^Pi> •••} apn£. bit •••> bqt) bit bqs £ L • Тогда rs = 01... aPlbi... bqfii... apfii... bgs. Здесь порядок записи сомножителей из одного пространства (L или £*) существен. Однако учитывать здесь взаимное расположение каких-нибудь двух элементов из разных про- странств не имеет смысла, поскольку такие элементы разли- чаются сами собой. Поэтому в любом произведении элемен- тов из L и L* мы всегда будем выписывать сначала все элементы из L, потом все элементы из L*, сохраняя задан- ный порядок элементов и в том и в другом случае. Таким образом, rs = at... aPlai... aPsbi... b91bi... b9s. 7. Положим a = ai...aPl, считая, что щ, ..., aPl могут быть какими угодно элементами из L. Если pi = O, то усло- вимся считать а=1. Аналогично будем понимать а, b и Ь. Тогда произвольные тензоры г и s (г £ Тр\, s £ 7^;) можно записать символически в виде: г = У, ab, s = У\аЬ. На основании изложенного в п. 1, произведение rs можно получить путем почленного умножения первой из этих сумм на вторую. Учитывая п. 6, имеем rs = У aabb. Отсюда ясно, что rs £ 8. Пусть t £ Tpq, причем ps^\, 9^1. Аналогично пре- дыдущему положим a = ai...ap, b = bi- ..bg, t=^ab. Выберем среди 1, 2, ..., р некоторый номер I и среди 1, 2, q — номер т. Обозначим через а' произведение всех
§ Б] ПРОИЗВЕДЕНИЕ ТЕНЗОРОВ 183 элементов ар, за исключением аь через Ь'— произ- ведение всех элементов bi, bq, за исключением Ьт. Назо- вем внутренней сверткой тензора t по /-м элементам L и по от-м элементам L* объект (Ozm = S(«z, Здесь (az, hm)—свертка элемента at С L с элементом bm С L*> т. е. число (свое для каждого слагаемого суммы). Таким образом, свертка (t)lm есть тензор из 7^2}. Если р—1^1 и q—1^1, то к тензору (t)m можно в свою очередь применить операцию свертки; мы получим тензор из Тр~%. Разумеется, обе операции можно сделать сразу; на- пример, (ОН = ((01)2= У(«ь ^i)(«2> Ьч)а-А...арЬ-А...Ьд. Если p = q, то можно исчерпать все валентности тензора t и получить, как говорят, его полную свертку (число). 9. Свертки двух тензоров, которые мы рассматривали выше, всегда можно свести к внутренней свертке одного тензора. Для этого достаточно данные тензоры перемножить и сделать внутреннюю свертку их произведения. Например, свертка элемента х £ L с элементом и £ L* есть внутрен- няя свертка произведения xw, правая свертка тензора i ( 7, с элементом и С L* есть (ta)|. 10. В заключение этого параграфа мы должны сделать ряд весьма существенных замечаний по поводу операций над тензорами. Прежде всего, вследствие сказанного в п. 1, ли- нейные операции в Tq инвариантны относительно допустимых замен элементов в Tpq. Произведение rs £ fgi+gi Г € Tpqi, s £ Tpq& инвариантно относительно допустимых замен элемен- тов г и s в Tq[ и Tpql, т. е. при таких преобразованиях оно само получает также допустимую замену в Без этих свойств определение линейных операций над тензорами и произведения тензоров было бы бессмысленным. 11. Из сказанного в п. 1 этого параграфа и в п. 8 § 2 следует, что при допустимой замене тензора t в Tq свертка (tfm испытывает также допустимую замену в 7q~\. Отсюда имеем: если то (^)т = (^)т-
184 ТЕНЗОРНАЯ АЛГЕБРА (ГЛ. V Доказательство. Равенство t'.> == tx означает, что с помощью допустимых замен тензоров и их можно привести к одному и тому же набору t произведений эле- ментов из L и L*. Но тогда (ft)m и с помощью допу- стимых замен сведутся к 12. В наших определениях мы нигде не использовали базисов. Поэтому линейные операции над тензорами, а также операции перемножения тензоров и внутренней свертки дают результаты, инвариантные в смысле независимости от выбора базиса. В частности, полная свертка тензора есть числовой инва- риант. § 6. Координаты многовалентных тензоров 1. Пусть et, ..., еп — базис в L, е1, ..., еп — взаимный с ним базис в L*. Из теоремы 2 § 3 (по индукции) следует, что всевозможные произведения вида состав- ляют базис в Тд. Таким образом, для любого t £ Тд имеет место разло- жение t = У т'.1 ‘' '.Ре, ...е, ел...еч. Числа т71 ' ;р определяют тензор t и называются его коор- Л "‘Jq динатами в базисе еь ..., еп пространства L. В данном ба- зисе они могут задаваться произвольно, т. е. как бы ни взять числа по ним всегда будет определен рый тензор. При этом часто пишут: t — также: дан тензор Т/1”’;р. Следует иметь в виду, *1 '"Jq что фактическое задание какого-нибудь конкретного некото- говорят однако, тензора, хотя бы только трехвалентного, требует довольно сложной информации в виде таблиц, поскольку численные значения координат должны быть указаны для каждой комбинации индексов. 2. При переходе к новому базису Ту*’”/ преобразуются по контравариантному закону для каждого верхнего индекса
§ 6] КООРДИНАТЫ МНОГОВАЛЕНТНЫХ ТЕНЗОРОВ 185 и по ковари антному закону для каждого нижнего индекса. Именно: Л ‘ ‘ Ч = У ‘ ’ [р Q*1... QzPpyi... ph, (*) jy.-.iq ii.--.jq «1 ip j1 jq где суммирование идет по нештрихованным индексам. Доказательство. Согласно (I), (I*) § 1 ev = ^Plveb е1' = ^$е1. Для этих формул обратными являются Cl = У Qi4> е — У Plve1'. Отсюда t — У xP"lP ei ...е{ eh... eh = 2j Jf-iq 1 'р = У (У 4W1... Q‘?M...ph} ер. ..ерЛ.. .еЧ (1) h’-h ч ^«р A jg) h ‘р 4 ’ С другой стороны, t — У Л' ’ • • • ер eh... eh. (2) K'-lq 1 v Сравнивая (1) и (2), получим (*), что и требовалось. 3. Закон преобразования (*) выведен нами как следствие инвариантности тензоров t С 1Р (мы воспользовались инва- риантностью t, когда сравнивали (1) и (2)). Наоборот, инва- риантность тензоров t С T‘q следует из (*); именно, вслед- ствие (*) X ^ip ,lPe - е -eji ejq-— \ Ji" ’?- ,.е. eh...eh. Ji — jq 1 P ii — Jq '1 *P Выводить это равенство из (*) мы не будем, отсылая чита- теля к п. 7 § 3, где сущность дела показана в частном случае. 4. Линейные операции над тензорами, взятыми в каком- нибудь Tq, выражаются в координатах по обычным прави- лам: при сложении тензоров их координаты складываются, при умножении тензора на число — умножаются на то же число. 5. При умножении тензора г С 7^} на тензор s £ 7^ каждая координата тензора г умножается на каждую коор-
186 ТЕНЗОРНАЯ АЛГЕБРА [ГЛ. V динату тензора s и все такие произведения являются коор- динатами тензора rs С Тр}фр|. Например, если г = У г,е‘, s=’£sjef, г, s £ Ti, то гs = у г,-Sye‘W $ Т* полагая г$ = = получим tl}-=riSj. Замечание. Вообще говоря, rs ф sr. Неравенство rs и sr легко усмотреть также в координатах. В самом деле, полагая sr = t=^,tt получим /=У sJrieiel— ^isirJe,eJ. Отсюда ti}- = Sfj и ti} Ф t(j. 6. Координаты свертки (f}m получаются из координат тен- зора t путем суммирования по одному верхнему и одному нижнему индексу, причем верхний индекс занимает место с номером /, а нижний — с номером пг. Сущность дела здесь лучше всего пояснить на конкретном примере. Пусть t='Xial^eiejeae^. Тогда, например, (01 = У (ei> е₽) a‘k^iek = 2 = Zj fS j. k \ ₽ / Таким образом, координатами (^) являются суммы вида У где суммирование идет по первому верхнему и вто- ₽ рому нижнему индексам. § 7. Полилинейные формы и их тензоры 1. Пусть дана инвариантная числовая функция a(xit..., xq, и1, ..., пр) от векторных аргументов хь ..., xq £ L, их, ..., ир С L*. Такая функция называется полилинейной формой, если она линейна по каждому своему аргументу. 2. Пусть в пространстве L выбран базис еь ..., еп, а в пространстве L*— взаимный с ним базис е\ еп. Тогда каждый контравариантный аргумент xk С L данной формы может быть разложен по базису eit еп: xk = У, XkCt = x\ei 4-... Ч- xnken. Аналогично каждый ковариантный аргумент разлагается по е\ .... еп: uk = ^Uje‘ — ще1 -j- • • • + ипеп.
ПОЛИЛИНЕЙНЫЕ ФОРМЫ И ИХ ТЕНЗОРЫ 187 § Л Отсюда а(хь Хд, и1, ир) = = aQix{1eji, .... 24 А •••> 2«V'₽)- Тем самым вследствие линейности формы получается ее коор- динатное представление а(хь ...,xv и\ uP) = ^a\\\\ljpxJil ...х^-и1г..ир1р, (1) где 4-"'^=а(ч> •••’%> е''> еЪ (2) — коэффициенты правой части (1). Согласно (2) они пред- ставляют собой значения формы на базисных векторах. 3. При переходе к новому базису е^, еп- в L имеем ef = Ур1гек- (3) }k 4-i Jk v ’ Соответственно в L* a=Jq.v*. (4) В новом базисе координатное представление формы будет иметь новые коэффициенты. Вследствие инвариантности формы они также являются ее значениями на базисных век- торах (разумеется, новых). Таким образом, а1,"’,Р = а(е..., е.>, ..., е1Р). (5) Из (5) с учетом (2), (3) и (4) найдем аЧ • ‘ • 1р — V аЧ ‘ • 'j>Q4 ... Q'ppA... piq (6) h---jq A ‘p h jq где справа суммирование идет по нештрихованным индексам. Мы видим, что закон (6) преобразования коэффициентов инвариантной полилинейной формы а(хь ..., xq, и1, ..., ир) совпадает с законом (*) § 6 преобразования координат тензора в Тр. Следовательно, с каждой формой а(xt, xq, и1, ир) инвариантно сопоставляется тензор в Г£: а = ‘'.'%% • • • eipetl • • • (7) он называется тензором данной формы.
188 ТЕНЗОРНАЯ АЛГЕБРА [ГЛ. V Обратно, каждому тензору (7) отвечает инвариантная полилинейная форма (1), Заметим, что эта форма представ- ляет собой полную свертку произведения axt... Xqti1.. .ир. § 8. Симметрирование и альтернирование. Косые формы 1. Рассмотрим в базисе <т, ..., еп £ L полилинейную форму а (х, у, z,..., t) = £ aijk.. . У (О и соответствующий ей (ковариантный) тензор Форма (1) называется симметричной по данной паре аргументов, если их перестановка не меняет значения формы. Например, а (х, у, z, t) симметрична по первому и третьему аргу- ментам, если а(х, у, z, ..., t)= a(z, у, х..I) при любых х,у, z, i С L. Симметрия формы по данной паре аргументов влечет сим- метрию ее тензора по соответствующей паре индексов; в нашем примере имеем симметрию тензора по первому и третьему индексам: aijit...s = akji ...s- В самом деле, O-ijk...5 — о (е,, еj, ек, ..., е5) — а (ек, е j, е^, •.., е5) — ак𧕠Обратно, если, например, 0,7*...^ = Ofe7,-...«> т0 a(x,y,z, ..., t)=Ylaijk,.,sxiylzk.ts — Ylakji..,sx^ylzk...f = — £aijk.'.sziy,xlt ... ts — a(z,y,x, ..., t). Полилинейная форма называется симметричной, если она симметрична по каждой паре аргументов; симметричной форме соответствует симметричный тензор. 2. Форма (1) называется кососимметричной по данной паре аргументов, если их перестановка меняет знак формы. Например, а(х,у, z, ..., t) кососимметрична по первому и третьему аргументам, если а (х, у, г,..., t) — — a(z,y,x,...,t) при любых х, у, z,..., t; тензор такой формы кососимме- тричен по первому и третьему индексам, т. е. a/y-fe...s=—akji...s- Полилинейная форма называется кососимметричной или косой, если она кососимметрична по каждой паре аргументов; кососимметричной форме соответствует кососимметричный тензор. Косая форма не меняет своего числового значения при любой четной перестановке ее аргументов. При любой нечет-
§ 8] СИММЕТРИРОВАНИЕ И АЛЬТЕРНИРОВАНИЕ 189 ной перестановке аргументов косая форма умножается на минус единицу. 3. Симметрия или косая симметрия формы от ковариант- ных аргументов и соответственно контравариантного тензора определяется в полной аналогии с предыдущим. В случае смешанного тензора свойства симметрии или косой симметрии могут иметь место для нижних индексов или для верхних индексов. Но для пары индексов, из которых один нижний, другой верхний, эти свойства не инвариантны. Например, для тензора а* в некотором базисе возможно равенство = (/, А==1, 2....и); однако при переходе к другому базису оно, вообще говоря, нарушится. 4. Если а (х, у, z, ..., f) — произвольная полилинейная форма, то с ней по определенному стандарту может быть сопоставлена симметричная форма от тех же аргументов. Именно: (а (х, у, z,..., 0)=S а (х, у, z,..., t), где сумма справа берется по всем перестановкам символов х, у, z,..., t‘, пг — число этих символов (число аргументов). Эта операция называется симметрированием и обозначается круглыми скобками. В частных случаях т = 2 и от = 3 имеем (а (х, у)) = X {а _у) _j_ а (у, х)}, (а (х, у, z)) = — {а (х,y,z)-[-a (у, z, х) + -j- a (z, х, у) Ц- а (у, х, z) Ц- а (х, z,y)-j-a (z, у, х)}. Симметрированию формы соответствует симметрирование ее тензора; например: а(*Л = "2Г “Ь ’ a(W —-^p{aijk + ajhi -]- akij -j- ajik -]- alkj -j- akjl}. Если сама форма а симметрична, то (d)=a. 5. С симметрированием тензора полилинейной формы при- ходится, например, иметь дело в тех случаях, когда аргументы этой формы отождествляются. Именно, если
190 ТЕНЗОРНАЯ АЛГЕБРА [ГЛ. V — билинейная (вообще говоря, не симметричная) форма, и мы строим квадратичную форму а(х,х), то происходит приведе- ние подобных членов: aiftx£xft -j- aftfxftx£ = (aik -j- aki) х{хк = 2a(ik}xtxk. Коэффициентами полученной квадратичной формы называются числа они составляют ее (симметричную) матрицу. По- лярной для а(х,х) является форма (а(х,_у)). Аналогично «(,7*) называются коэффициентами кубичной формы а(х, х, х), которая получается путем отождествления аргументов трили- нейной формы a(x,y,z). 6. Операция альтернирования заключается в том, что с произвольной полилинейной формой а(х,у, z, f) по определенному стандарту сопоставляется кососимметричная (косая) форма от тех же аргументов. Она обозначается квад- ратными скобками и определяется равенством [а (х,у, z,..., 0]{^1 а (Х’У>z’ • • • ’~ -S2 а ' • - *)}. где первая сумма берется по всем четным перестановкам символов х, у, z,..., t, вторая — по всем нечетным. Например: [а (х, _у)] = А- {а (х, у)—а (у, х)}, [а (х, У,г)] = -^-{а (х, y,z)+a (у, z, х) -J- a (z, х, у) — а (у, x,z) — а (х, z, у) — a (z, у, х)}. Соответственно имеем операцию альтернирования тензора: 1 / ч яр/]— 2] (^«/ a-ji)’ а[<А1 = 3] ajki~r akij aJik aikJ akji\ Если форма а косая (кососимметрична по всем аргументам), то [а] - а. 7. Отметим два простых свойства множества косых форм: 1) При отождествлении хотя бы двух аргументов косая форма обращается в нуль.
СИММЕТРИРОВАНИЕ И АЛЬТЕРНИРОВАНИЕ 191 § 81 В самом деле, пусть, например, совпадают первые два аргумента косой формы; тогда а{у,у, z, — — а(у,y,z,t). Следовательно, 2а (у, у, z, ..., 0 = 0. 2) Если число аргументов косой формы, превышает размерность пространства, то форма тождественно равна нулю. В самом деле, в этом случае аргументы связаны линей- ной зависимостью и, следовательно, один из них линейно выражается через остальные. Пусть, например, х = оу -j- flz -|- —| — X/. Тогда а(х, у, z,..., t) = = о.а(у,у, z,..., f)-\-$a(z,y, z,...,f}-\- ... -\-\a(t,y,z, ...,0, и вследствие первого свойства а(у,у, z,.... 0 = 0,... .... a (t, у, z,..., t) = 0. Отсюда а (х, у, z,..., t) = 0. 8. Рассмотрим косые формы, у которых число аргументов равно размерности пространства. Пусть а (х, у,..., 0 — произвольная косая форма от п аргументов х, y,...,t, принадлежащих «-мерному простран- ству L. Зафиксируем в L произвольный базис еь ..., еп и разложим по нему аргументы формы. Согласно п. 2 § 7 имеем а (х, д/,..., 0 = Ц аг,,-г... 1пх^у*> ... 0», (2) где ahh ...ln = a ieii> О2, • • • > е«„)- Из определения косой формы и свойства 1) предыдущего пункта a(ei,, <?,-2,..., eir) = а(еь еъ ..., е„), то есть а1Рг ...in = . inal 2... «• (3) Подставив (3) в (2), мы видим, что в данном базисе рас- сматриваемую форму можно представить в виде а(х,у,..., 1) — ац. (4)
192 ТЕНЗОРНАЯ АЛГЕБРА [ГЛ. V где А — определитель, составленный из координат аргументов: А = 2 8Zli,... tn xiiy‘! ... = X1 X9 ... хп у1 у2 ... уп ? /2 ... ё (5) Коэффициент Д12...п будем называть основным коэффи- циентом косой формы (2). Все остальные ее коэффициенты равны либо нулю, либо ±Ci8...„ (в соответствии с форму- лой (3)). Если ai2...n = 0> то косая форма a(x,y,...,t) равна нулю тождественно. Если С12...п7^0, то а(х,у,..., t) отлична от нуля, когда аргументы линейно независимы. Из формул (4) и (5) следует, что с точностью до число- вого множителя в пространстве L существует лишь одна косая форма от п аргументов. В самом деле, если данная форма а(х, у,..., t) не равна нулю тождественно, Ь(х,у,..., t) — любая другая косая форма от п аргументов, то Ь(х,у,..., = ,.п- Д = В-а(х,у,..., t), где О 2 ... п Р «12... п’ Заметим, что все рассуждения этого пункта проведены в дан- ном базисе, использована лишь косая симметрия форм, но не использована их инвариантность. Этим мы воспользуемся в следующей главе при рассмотрении кососимметричных полилинейных функций, числовое значение которых не инва- риантно по отношению к смене базиса. 9. Более детальному изучению косых форм и кососиммет- ричных тензоров специально посвящена десятая глава. § 9. Второй вариант изложения понятия тензорного произведения двух линейных пространств 1. В начале этой главы, в § 2 мы определили тензорное произведение Т—L как множество, элементами которого являются любые конечные наборы пар, составленных элемен- тами из L и L. Таким образом, если в качестве элементов L
§9] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ (ВТОРОЙ ВАРИАНТ) 193 и L выбраны конкретные объекты, то элементы L 0 L так- же вполне конкретны (наборы пар этих объектов). В кон- струкцию L ® L нам пришлось включить описание допусти- мых замен и линейных операций для элементов множества \ L ® L, чтобы сделать его линейным пространством. Поскольку нам пришлось конструировать линейное пространство L$L, то изложение понятия тензорного произведения выглядело довольно сложным. Мы изложим сейчас определение тензорного произведения L 0 L снова, совершенно независимо от предыдущего. Оно будет более экономно в том отношении, что в качестве L0 L будет • заранее взято некоторое линейное пространство Т (смысл равенства 7'=L0L будет заключаться в установле- нии лишь некоторых взаимоотношений между элементами L, L и Т). К сожалению, это новое определение будет обла- дать своими недостатками. Дело в том, что в новой конст- рукции тензорного произведения L 0 L останется значитель- ный произвол (в отличие от старой конструкции, где эле- менты L 0 L вполне определены элементами L и L). Поэтому первоначально далее определяется по данным L и L не одно тензорное произведение L 0 L, а множество разных. Но затем мы определим некоторое естественное понятие изоморфизма этих тензорных произведений, в силу которого они окажутся изо- морфными (эквивалентными) друг другу, а также тензорному произведению L на L в смысле нашей старой конструкции § 2. Конечно, чтобы изложить эти вещи, придется также потратить известный труд; в общем итоге экономии изложе- ния по сравнению с первоначальным вариантом, пожалуй, не будет. 2. Мы все-таки даем этот новый вариант изложения поня- тия тензорного произведения, имея в виду, насколько возможно, помочь читателю уяснить себе следующий вопрос. Пусть сказано, что линейное пространство Т является тензорным произведением линейного пространства L на линей- 1ное пространство L. Ограничимся сейчас конечномерным слу- чаем. Тогда размерность Т равна произведению размерностей L и L. Но, разумеется, одного лишь этого соотношения раз-
194 ТЕНЗОРНАЯ АЛГЕБРА |ГЛ. V мерностей недостаточно, чтобы охарактеризовать Т как тен- зорное произведение L 0L. Дело в том, что в конкретных случаях конструкцию тензорного произведения, описанную в § 2, мы можем не усмотреть. Более того, все три прост- ранства L, L и Т могут быть даны с точностью до линей- ных изоморфизмов, а тогда формальные суммы, описанные в § 2, заменятся элементами совсем другой природы. Поэтому ответ на вопрос, что значит, что Т является произведением L ® L, в такой общей ситуации на основе § 2 по существу нельзя и дать. Для этого требуется само определение тен- зорного произведения высказать в более общей форме, что и будет дальше сделано. 3. Пусть даны линейные пространства L и L размерностей п и m соответственно. Пусть дано также линейное простран- ство Т, размерность которого равна произведению пт. Все пространства L, L и Т предполагаются одновременно действи- тельными или одновременно комплексными. Пусть далее дано некоторое отображение f пары про- странств L, L в пространство Т. Это значит, что с произ- вольной парой элементов а, а, где а £ L, а QL, сопоставлен элемент t £ Т. Будем для простоты писать t = aa, (1) отождествляя тем самым пару аа с ее образом t=f(a,a) в пространстве Т. Условимся и в дальнейшем на первом месте пары Писать элемент пространства L; если L совпадает с L, то пару в правой части равенства (1) будем считать упоря- доченной; таким образом, вообще говоря, аа ф аа, то есть элементы, которые в пространстве Т отвечают в силу ото- бражения f парам аа и аа, не обязаны совпадать. Предположим, что имеют место следующие свойства ото- бражения f. 1. Распределительное свойство относительно каждого элемента пары: (а -ф- Ь) а — аа -ф- Ьа, (2) а (а -ф- Ь} — аа -j- ab (3) для любых a,b £ L, a,b £ L.
§9] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ (ВТОРОЙ ВАРИАНТ) 195 2. Сочетательное свойство: (а а) а — а (аа) = а (а а) (4) для любых а С L, а £ L и для любого числа а (действитель- ного или комплексного в зависимости от того, действительны или комплексны пространства L, L, Т). В силу свойств (2), (3), (4) вместо слова пара можно с достаточным основанием употреблять слово произведение. Соответственно этому равенство (1) следует читать так: эле- мент t пространства Т есть произведение элемента а из L на элемент а из L. Замечание. Сейчас равенства (2), (3), (4), в отличие от сходных равенств § 2, выражают свойства отображения /, а не условия допустимых замен в Т. Дело в том, что допустимые замены уже заданы в Т заранее, одновременно с определением Т в качестве линейного пространства. 3. Свойство невырожденности отображе- ния /: если элементы аь ...,ап линейно независимы в L, элементы Йь ..., ат линейно независимы в L, то система а(йА (z = 1, 2,..., и; /г = 1, 2,..., т) их попарных произведе- ний линейно независима в Т. Согласно предыдущему некоторые элементы пространства Т являются произведениями элементов пространств L и L. Например, вследствие (4) нулевой элемент в Т является про- изведением нулевого элемента L па любой элемент L, или любого элемента L на нулевой элемент L. Однако не каждый элемент Т есть произведение какого-нибудь элемента L на какой-нибудь элемент L. Вместе с тем легко доказать сле- дующее утверждение: каждый элемент t является линей- ной комбинацией произведений элементов из L и L. Доказательство. Пусть еь еп — базис в L, ё1,...,ёт — базис в L. Тогда вследствие условия (3) система всех попарных произведений е;й/г есть базис в Т (поскольку размерность Т равна пт). Таким образом, любой элемент t £ Т может быть представлен в виде t = ^tike^k. (5) Здесь z— 1, 2, Утверждение доказано.
196 ТЕНЗОРНАЯ АЛГЕБРА [ГЛ. V Замечание. Если положить У, t,ket = ёк = ак, то равенство (5) примет вид t — ^akak. (6) Тем самым каждый элемент t £ Т можно представить в виде суммы произведений элементов из L и L. 4. Определение. Линейное пространство Т размер- ности пт, рассматриваемое вместе с данным отображением f в него пары линейных пространств L, L размерностей п и т соответственно, называется тензорным произведением L на L, если f удовлетворяет условиям (1), (2), (3) п. 2. Символически T=L ® L. Элементы пространства Т, рассматриваемые в виде ли- нейных комбинаций произведений элементов из L и L, т. е. в виде (5) или в виде (6), называются тензорами над L и L. Числа tlk в равенстве (5) называются координатами тензора t в базисе (или в базисах е{ и е* пространств L и £.). 5. Покажем, как построить отображение f со свойствами (1), (2), (3) п. 2. Одновременно уясним себе степень произвола в этом построении. Предположим сначала, что отображение f уже дано. Пусть ег и е* — произвольные базисы в L и L. Тогда вследствие свойства (3) попарные произведения определяемые ото- бражением /, составляют базис в Т. Допустим, что мы знаем et g L, ёь £ L и £ Т. В таком случае мы полностью знаем отображение /, т. е. для любых х L, х £ L знаем произ- ведение хх в пространстве Т. В самом деле, х = У х‘е{, х = У xkek. (7) Отсюда и вследствие свойств (1). (2) хх — У х‘е^ = £x‘xkei6k. (8) Таким образом, если отображение f существует, то оно однозначно определяется заданием произвольных базисов ег и ёк в L и L и заданием базиса eik в Т, элементы которого суть попарные произведения е, на ёк, т. е. eik = et6k (послед- ние равенства следует понимать так, что eik есть образ пары еь ёк именно при отображении /).
§91 ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ (ВТОРОЙ ВАРИАНТ) 197 Но легко видеть, что по этим же условиям найдется искомое отображение f. В самом деле, пусть даны et £ L, L и eik£T А = 1,2,wi); считаем, что каждая из этих систем линейно независима в своем прост- ранстве. Назначим eik в качестве образов пар eit ёк относи- тельно искомого отображения /, т. е. положим etek — eik. Эти равенства обеспечить можно, так как число всех равно п, число всех ek равно т, а число всех eik равно пт. После этого на произвольной паре х, х, где х и х даны равен- ством (7), определим f по равенству (8). Для построенного таким путем отображения / свойства (1) и (2) п. 3 с легкостью проверяются. Проверим, например, тождество (2). Пусть у = ^у’е1. Тогда (х 4- у) X — 2 (х1 +У) Xkeiek = £ xlxkeiek -f- = хх 4- ух. Чуть труднее проверить третье свойство, т. е. невырожден- ность построенного отображения f. Возьмем какую угодно новую пару базисов аг и ak в L и L. Нам нужно показать, что попарные произведения aza/; (т. е. образы пар ait ak в Г) линейно независимы. Имеем П/'--PyGiy Clk'-----Pk'€k. Отсюда ar = (9) Мы видим, что векторы линейно выражаются через etek. Следовательно, ранг системы в пространстве Т не больше ранга системы егёЛ. Но из (9) получаем etek = QfQfe (Ю) Здесь величина Qj' стандартным образом определены по Р1., (см. § 1). Аналогично определены Q* по Р*-. Из (10) за- ключаем, что ранг системы etek не выше ранга системы Следовательно, ранги этих систем равны. А так как система eiSk по условию независима в Т, то независима и система (так как имеет тот же ранг, равный общему числу векторов). Итак, мы доказали существование нужных нам отобра- жений и полностью выяснили произвол в их конструкции.
198 ТЕНЗОРНАЯ АЛГЕБРА [ГЛ. V 6. Возвращаясь к определению п. 3, заключаем, что L@L определено нами с произволом точно таким же, какой имеется в выборе отображения f. 7. Обозначим через <р произвольное взаимно однозначное отображение f — ср (/) пространства Т на себя, которое является линейным изоморфизмом этого пространства (см. § 10 гл. I). Обозначим через У7 суперпозицию отображений f и ср; симво- лически: = Это равенство следует понимать так: сна- чала f переводит произвольную пару а, а(а( L, а £ L) в эле- мент t пространства Т, затем <р переводит t в f = cp(Z). Определение. Тензорные произведения L на L, уста- новленные с помощью отображений f и f, будем называть изоморфными, если /7 = а>/, где ср — какой-нибудь линейный изоморфизм Т на себя. Тензоры t и f будем называть соот- ветствующими по данному изоморфизму тензорных произве- дений, если — Согласно этому определению все тензоры, построенные с помощью /, отображаются в тензоры, построенные с помощью = Чтобы пояснить, почему рассмотрение тензоров, построенных с помощью /, равносильно рассмотрению их образов при изоморфизме, встанем на арифметическую точку зрения, т. е. будем рассматривать тензоры в координатах. Пусть (е.ёд.)' = ср(е,ёк), t — Тогда t'=^tik(e^k)', (11) где t,k — точно те же числа, что и в равенстве (5). Таким образом, при изоморфизме соответствующие тензоры в соот- ветствующих базисах имеют одни и те же координаты. Таким образом, при изоморфизме меняется только изображение тен- зоров в виде тех или иных элементов пространства Т. Но координаты тензоров, а следовательно, и все уравнения, отно- сящиеся к ним в каких-либо задачах, остаются без изменений. 8. Укажем, наконец, следующее предложение, доказатель- ство которого предоставим читателю: если f и f — два отобра- жения пары пространств L и L в пространство Т, удовлет- воряющие условиям (1), (2), (3) п. 3, то найдется изоморфизм <р пространства Т на себя такой, что /' = ср/. Отсюда следует Теорема. Все тензорные произведения данного линей- ного пространства L на данное линейное пространство L изоморфны друг другу.
ГЛАВА VI. ПОНЯТИЕ ГРУППЫ И НЕКОТОРЫЕ ЕГО ПРИЛОЖЕНИЯ § 1. Группы и подгруппы. Распределение базисов на классы по данной подгруппе матриц. Ориентация 1. Пусть дано множество G, для элементов которого уста- новлено понятие равенства (или допустимой замены, см. § 1 гл. I), и задана некоторая операция, называемая операцией умножения. Эта операция с каждой парой элементов а, b из G, взятых в определенном порядке, сопоставляет некоторый элемент с того же множества. Символически пишут c = ab и говорят, что с есть произведение а на Ь. При этом пред- полагают, что произведение ab инвариантно относительно допустимых замен сомножителей а и Ь. Определение. Множество G с заданной в нем опе- рацией умножения называется группой (относительно этой операции), если соблюдены требования следующих аксиом: 1. Для любых а, Ь, с С G (ab) с=а (be). 2. Существует элемент е ( О такой, что для любого а С G имеет место равенство ае = а. Элемент е называется единицей группы. 3. Для любого о ( О существует х С G такой, что ах= е. Этот элемент называется обратным для а и обозначается через а '. 2. Из аксиом 1, 2, 3 легко выводятся следующие пред- ложения: а) Если ах = е, то ха = е. Доказательство. Согласно аксиоме 3 существует у С G такой, что ху~е. С другой стороны, если ах — е,
200 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ (ГЛ. VI то а = ае = а(ху) = (ах)у — еу, откуда а — еу. Следова- тельно, ха — х (еу) — ху — е. б) еа — а для любого a f О. Доказательство. По аксиоме 3 и по доказанному существует х такой, что ах = е и ха = е. Таким образом, еа - (ах) а = а (ха) — ае — а. в) Если ах — е, ау = е, то у = х. Доказательство. Имеем у =уе =у(ах) — (уа)х — — ех — х. Доказанные теоремы означают, что в группе нет необхо- димости различать левый и правый обратные элементы, а также левую и правую единицы. Кроме того, в группе всегда и притом однозначно определено действие, обратное групповому умно- жению; именно, уравнение ах = Ь имеет единственное реше- ние: х — а ЛЬ, а уравнение ха — Ь— единственное решение х — Ьа *. Отсюда следует, наконец, что каждая группа имеет только одну единицу. В самом деле, если ае = а и ае* — а, то, как доказано, е* — е. 3. Важным примером группы является множество всех невырожденных п X л-матриц (или действительных, или комп- лексных) с операцией умножения, которая определена в § 2 гл. II. Единицей в группе невырожденных пХ‘и'матРиЦ является единичная матрица Е; матрица, обратная к данной невырожденной, строится согласно пп. 4—8 § 3 гл. II. Про- верку первой аксиомы группы для умножения матриц (т. е. ассоциативности: (АВ) С = А (ВС)) предоставляем читателю. Пример матриц показывает, что умножение в группе, вообще говоря, не коммутативно (см. выше, п. 3 § 2 гл. II). 4. Группа называется коммутативной или абелевой, если для любых ее элементов а, b имеет место равенство ab = ba. Впрочем, в этом случае групповую операцию часто называют сложением, соответственно вместо ab часто пишут а Ь. Тогда единицу абелевой группы называют нулевым элементом. Примеры. 1) Каждое линейное пространство является абелевой группой относительно операции сложения элементов. Это ясно, поскольку первые четыре аксиомы линейного про- странства в точности совпадают с тремя аксиомами группы при дополнительном условии коммутативности. 2) Множество всех действительных чисел, отличных от нуля, образует коммутативную группу относительно операции
§ 1] ПОДГРУППЫ. КЛАССЫ БАЗИСОВ. ОРИЕНТАЦИЯ 201 обычного умножения. Единицей этой группы является число единица, элементом, обратными числу X, является число X-1. 5. Определение. Некоторое подмножество G элемен- тов группы называется ее подгруппой, если из а £ G, b g G следует ab £ G и из а g G следует а"1 g G. Отсюда, в частности, е С G. Тем самым при указанных условиях требования аксиом 1—3 п. 1 соблюдены для G, и подмножество G само является группой относительно той же операции умножения, какая задана во всей группе G. Единица группы G является единицей любой ее подгруппы. 6. Примеры подгрупп. 1)В произвольной группе G единица е образует подгруппу, состоящую из одного эле- мента. 2) Всю группу G можно рассматривать как ее подгруппу. 3) Если линейное пространство L рассматривается как группа относительно операции сложения, то любое его под- пространство является подгруппой. Рекомендуем читателю построить пример подгруппы в L, которая не была бы под- пространством. 4) В группе действительных чисел, не равных нулю (см. пример 2 п. 4), все положительные числа образуют подгруппу. 5) В этой же группе есть другая подгруппа, состоящая из двух элементов — чисел X = 1 и X = — 1. 6) В группе всех действительных невырожденных п X «-матриц рассмотрим подмножество G, состоящее из матриц с положительным определителем. Из теоремы об определителе произведения матриц (гл. 11, § 3) следует, что G — подгруппа. В самом деле, если А, В £ G, то Det АВ — Det А Det В 0, следовательно, АВ С G. Если А £ G, то Det A“* = (Det А)~*^>0 и, значит, А-1 £ G. 7) В группе всех действительных (или комплексных) невы- рожденных п X «-матриц рассмотрим подмножество G, состоя- щее из всех матриц, определитель которых имеет модуль = 1. Легко убедиться, что G является подгруппой. В самом деле, если А, В С G, то | Det АВ | = | Det А | • | Det В | = 1, следо- вательно, АВ £ G; если А£ G, то I Det А-1 | = | Det А j ’= 1; I следовательно, A-1 g G.
202 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI 7. Пусть в группе всех невырожденных п X «-матриц выделена некоторая подгруппа О. Рассмотрим линейное «-мер- ное пространство L (действительное, если G состоит из дей- ствительных матриц; комплексное, если эти матрицы комп- лексны). Возьмем в L какой-нибудь базис еь ..., еп и перейдем к другому базису ei’ = ^ Pt-ei (1) при условии, что коэффициенты Ру составляют матрицу Р из подгруппы О. Для сокращения записи вместо (1) удобно писать е’ — Ре, (1а) понимая (1а) как матричное равенство, в котором элементами матриц-столбцов е и е' являются векторы, элементами квад- ратной матрицы Р — числа: Р\- ...Pi- е - е — Р = р, рп, 1 п • * • tn Беря в качестве Р всевозможные матрицы из G, мы будем получать, таким образом, разнообразные базисы е'\ они составят некоторый класс базисов; обозначим его через ё (е). Будем говорить, что класс ё (е) порожден базисом е по данной под- группе G. 8. Из того, что G является подгруппой, вытекает важная Теорем а. Если какой-нибудь базис е' принадлежит ё (е), то класс, порожденный базисом е', совпадает с ё (е). Сим- волически: ё (/) = ё (е). Доказательство. Пусть е" — произвольный базис. Предположим, что е" С ё (/). Это значит, что существует матрица Р' £ G, для которой е'' = Р'е'. С другой стороны, е' С ё (е). Соответственно имеем матрицу Р ( G, для кото- рой е' — Ре. Отсюда е"={Р'Р)е. Но так как G — подгруппа и так как Р С G, Р'( G, то Р'Р С G. Следовательно, е" С ё (е). Таким образом, каждый базис из ё (Е) входит в ё (е), т. е. класс ё (е') включен в класс ё (е). Заметим теперь, что в случае е’ = Ре, Р G, будет е = Р~1е’, причем P~l С G (так как G— подгруппа). Иначе говоря, если е’ С ё (е), то е С ё (ег). Значит, в предыдущем
§ 1 ] ПОДГРУППЫ. КЛАССЫ БАЗИСОВ. ОРИЕНТАЦИЯ 203 L — евклидова плоскость рассуждении <? (е) и (е') можно поменять ролями. Поэтому класс S (с) включен в класс ё (/). Тем самым (5" (с') = й'(с) и теорема доказана. Замечание. Так как выбор базиса, порождающего класс, безразличен в пределах этого класса, то в дальнейшем вместо ё (с) мы часто будем писать просто ё. 9. Из доказанного в предыдущем пункте утверждения следует, что множество всех базисов в £ разделяется на классы по заданной подгруппе О так, что каждый базис входит точно в один класс (два класса либо совсем не имеют об- щих базисов, либо пол- ностью совпадают). Каж- дый класс S инвариантен относительно данной под- группы О;это означает,что для любого базиса е £ ё в для любой матрицы Р £ G будет е' — Ре £ ё. (То есть после преобра- зования с помощью лю- бой матрицы подгруппы G любой базис класса с? опается в этом классе.) 10. Пример. Пусть линейное пространство лежащих в ней векторов), G — под- группа действительных матриц второго порядка, определи- тели которых равны по модулю единице. Тогда каждый класс ё состоит из базисов с одной и той же площадью базисного параллелограмма (рис. 28) (разным классам отвечают разные значения этой площади). В самом деле, пусть er = aei4-pe2, e# = В<?2. (2) Обозначим через S площадь базисного параллелограмма для ci, е.’, через У—аналогичную площадь для е^, е%. Из (2) имеем 5' = S | аВ — Рт |. Если матрица Р преобразования (2) принадлежит G, то | аВ — рр | = 1 и £' = <£'. Обратно, если 6'' = S, то Р С О. 11. Пусть £ снова обозначает линейное н-мерное про- странство. Будем предполагать его действительным. Обозначим
204 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI теперь через О подгруппу, состоящую из всех п X «-матриц с положительным определителем. Возьмем в L произвольный базис е и построим класс ё (с) по подгруппе G; будем далее обозначать этот класс через ё. Очевидно, что класс ё не исчерпывает всех базисов про- странства L. В самом деле, если Р — какая-нибудь п X «-матрица с от- рицательным определителем, то базис ё = Ре не входите ё. Возьмем такой базис ё и построим по подгруппе О класс ё (ё); будем его обозначать дальше через ё'. Покажем, что других классов, кроме ё и ё', в данном случае нет. Для любого базиса е" пространства L найдутся невырожденные матрицы Р' и Р" такие, что е” = Р"е и е" = Р,ё. Из последнего равенства и из соотношения ё = Ре имеем: е" = (Р'Р) е; следовательно, Р' — Р'Р. Отсюда Det Р" = — Det Р' Det Р. Так как Det Р 0, то определители матриц Р' и Р’ имеют разные знаки. Значит, один из них положителен. Если DetP"^>0, то е* £ ё; если DetP'3>0, то ё’, что и требовалось установить. 12. Итак, все базисы пространства L разделяются по под- группе О (Р £ О, если DetP^>0) на два класса. 13. Если два базиса пространства L принадлежат какому- нибудь одному из этих двух классов, то они называются одинаково ориентированными. Два базиса называются про- тивоположно ориентированными, если они входят в разные классы. Базисы, входящие в какой-нибудь один из этих классов, принято называть также положительно ориентиро- ванными (или правыми); тогда базисы другого класса называют отрицательно ориентированными (или левыми). Л ю б о й из двух классов можно шыбрать в качестве класса положительно ориентированных базисов. Если этот выбор сделан, то говорят, что в пространстве L задана ориен- тация. 14. Разумеется, чтобы высказать понятие ориентации про- странства, нет необходимости предварительно говорить о груп- пах. Мы выскажем сейчас это важное понятие еще раз, дру- гими словами, так, что группы при этом упоминаться не будут.
§ 1 ] ПОДГРУППЫ. КЛАССЫ БАЗИСОВ. ОРИЕНТАЦИЯ 205 Пусть Ci....еп и ег>, ..., еп- — два произвольных базиса пространства L. Имеем (3) где коэффициенты Р\> составляют невырожденную матрицу Р, то есть Det Р 0. Если DetP^>0, то базис еу называется одинаково ориен- тированным с базисом е,; если DetP<^0, то базис е{> назы- вается противоположно ориентированным с базисом ег. 15. Имеют место следующие предложения: 1. Если базис Cf одинаково ориентирован с базисом eit то et одинаково ориентирован с с,-. В самом деле, согласно (3) векторы е{> выражены через е,- при помощи матрицы Р; обратно, векторы с, выражаются через еу с помощью матрицы Р1. Таким образом, Det Р-1 = (Det Р)’1 0. 2. Если два базиса одинаково ориентированы с третьим, то они одинаково ориентированы между собой. В самом деле, пусть векторы е? выражены через с помощью матрицы Р, пусть векторы ег-< выражены через eL с помощью матрицы Р' и DetP^>0, Detp'^>0. Тогда векторы выражаются через с помощью матрицы Р'Р1 и мы получаем Det (PT1) = Det Р' • Det Р"1 > 0. 3. Если два базиса противоположно ориентированы с третьим, то они друг с другом ориентированы одинаково. В самом деле, если DetP<^0, DetP'<^0, то Det^P *)^>0. 16. Выберем в пространстве L произвольный базис е{ и назовем его положительно ориентированным (или правым). Назовем также положительно ориентированным (или правым) всякий другой базис, который одинаково ориентирован с ₽,•; назовем отрицательно ориентированным (или левым) всякий базис, который противоположно ориентирован с базисом с;. Тем самым все базисы пространства L будут распределены на два класса. Вследствие трех предложений, доказанных в п. 15, любые два базиса из одного класса одинаково ориен- тированы друг с другом; любые два базиса из разных клас- сов ориентированы противоположно. Указанные классы равно- правны, т. е. любой из них можно выбрать в качестве класса положительно ориентированных базисов. Если этот выбор сделан (назначением базиса е,), то гов.орят, что в пространстве [задана ориентация.
206 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI 17. В заключение заметим, что понятие ориентации суще- ственно связано с тем, что базис рассматривается как упоря- доченный набор векторов. Если нумерация векторов базиса меняется так, что два вектора обмениваются номерами, а осталь- ные сохраняют свои номера, то ориентация базиса меняется на противоположную. В самом деле, пусть базисы е, и е? связаны соотношением (3), и пусть сделано указанное изме- нение нумерации векторов е?. При этом в матрице Р про- изойдет перестановка двух строк и, следовательно, опреде- литель этой матрицы изменит знак. § 2. Группы преобразований. Изоморфизм и гомоморфизм групп 1. Пусть имеется некоторое множество 7И, элементы кото- рого условимся называть точками. Говорят, что задано преобразование множества М, если каждой точке х из М поставлена в соответствие некоторая точка у того же множества М. Символически пишут У =f(x). При этом у называют образом точки х, а точку х—про- образом точки у. Преобразования f и g считаются равным и, если g(x) — —f (х) для любой ТОЧКИ X £ М. Преобразование f называют взаимно однозначным или обратимым, если каждая точка у С М является образом некоторой и притом единственной точки х£ М. В этом случае преобразование, которое произвольной точке y—f(x) ставит в соответствие ее прообраз х, называется обратным для исходного преобразования f и обозначается f1: y=f(x), x^f'ly). Преобразование е называется тождественным, если е (х) == х для любой точки х из М. Ясно, что тождественное преобра- зование обратимо, причем = В частном случае, когда Л4 — числовая прямая — оо оо, понятие преобразования совпадает с понятием функции, заданной на всей прямой. Если функция t=f(x)
§21 ГРУППЫ ПРЕОБРАЗОВАНИЙ 207 имеет (однозначную) обратную функцию g(t), также заданную на всей прямой —со <^-|-оо, то эта обратная функция задает обратное преобразование (символически: f~l=g\ 2. Пусть ср, f — какие-нибудь преобразования множества М. Произведением ср на f мы будем называть преобразова- ние /, которое действует по формуле Х(х) = ср[/(х)] для любой точки х из М. Символически будем писать '/ = ср f. В случае, когда М — числовая прямая, произведение пре- образования t — ср (т) на преобразование/=/(т) есть сложная функция t — <р[/(т)]. Произведение преобразований, вообще говоря, не коммутативно (например, sh3 х ф sh х3). Для любого преобразования / произвольного множества М имеем очевидные тождества fe = ef=f, (1) а если f обратимо, то ffl = e. (2) Ограничиваясь рассмотрением взаимно однозначных пре- образований, укажем, что если fg=e или gf=e, то g—f~\ (3) Произведение преобразований ассоциативно, то есть ф(ср/) = (фср)/ (4) для любых трех преобразований / ср, ср множества М. Это ясно, поскольку каждое из преобразований (4) действует по формуле у — {ср [/(х)]}. Если преобразования ср, f обратимы, то оба произведения ср/ и /ср тоже обратимы, причем ('?/Г1=Г1'?-1. (5) Взаимная однозначность каждого из преобразований ср/ и /ср непосредственно следует из взаимной однозначности <р и /, формула (5) вытекает из (1)—(4), так как (/-1ср-1)(ср/) =/-1 (<р-»ф)/=/-1е/=/-1/= е. 3. Из определений и свойств, изложенных в пп. 1, 2, сле- дует, что всевозможные обратимые преобразования заданного
ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI множества 7И образуют группу относительно умножений пре- образований. 4. Определение. Всякая совокупность О преобразо- ваний множества 7И называется группой преобразований этого 1множества, если О образуют группу относительно умножения щреобразований. Из третьей аксиомы группы следует, что в любую группу |Преобразований могут входить только обратимые преобразо- вания. Можно сказать поэтому, что любая группа преобразо- ваний множества Л1 является подгруппой в группе всех обра- тимых преобразований этого множества. 5. Ниже, в пределах этой главы мы будем рассматривать только обратимые преобразования, часто не оговаривая этого дополнительно. 6. Пусть Q—какая-нибудь совокупность преобразований множества 7И. Так как равенство (5) соблюдается для любых трех преобразований, то О будет группой, если: а) из принадлежности О двух преобразований /, сле- дует, что /о С О и с₽/ g О; б) из принадлежности О некоторого преобразования / следует существование и принадлежность О обратного ему преобразования /-1. Отсюда уже вытекает принадлежность О тождественного преобразования е; оно является единицей группы О (см. в связи с этим формулы (1) и (2)). 7. В качестве важного примера укажем группу всех не- вырожденных (действительных или комплексных) линейных преобразований п переменных. Множество А1 в этом случае есть /ьмсрное координатное действительное или комплексное пространство. То, что невырожденные линейные преобразо- вания составляют группу, фактически показано в § 3 гл. II; именно, там установлено, что произведение невырожденных линейных преобразований есть невырожденное линейное пре- образование, и преобразование, обратное к невырожденному линейному, является таким же. Тем самым соблюдены условия а) и б) п 6. 8. Пусть О, О'—какие-нибудь группы, и пусть группа G отображена на О'. Условимся для обозначения образов упо- треблять штрихи; например, а'£ G'—образ элемента а £ G. Определение. Взаимно однозначное отображение О на О' называется изоморфизмом, если образ произведения
§ 21 ГРУППЫ ПРЕОБРАЗОВАНИИ 209 равен произведению образов; символически: (a/?)' = a'b'. (6) Докажем, что при изоморфизме образ а'единицы е группы О является единицей в группе О'. В самом деле, пусть а' — любой элемент группы О'; он соответствует некоторому элементу а группы О. Имеем: ае = а; следовательно, по определению изоморфизма а'е' — (ае)' — а', (7) то есть е’— единица в О'. Если существует изоморфизм О на О', то группы О и О' называются изоморфными друг другу. При изоморфизме все соотношения между элементами одной группы переносятся на другую. Поэтому с точки зрения теории групп изоморфные группы имеют одинаковое строение. Достаточно изучить одну, чтобы знать другую. Примеры. 1) Пусть О—группа всех действительных невырожденных «Хи-матриц, О'—группа всех действитель- ных невырожденных линейных преобразований л переменных (рассматриваемых как преобразования координатного прост- ранства Кп). Сопоставим с произвольной матрицей А из О линейное преобразование из О', имеющее матрицу А. Тем самым группа О будет взаимно однозначно отображена на О'. Установленное отображение является изоморфизмом, поскольку преобразование с матрицей АВ есть произведение преобра- зований с матрицами А и В. При этом изоморфизме все груп- повые соотношения, в частности все подгруппы, переносятся из О в О’. Например, подгруппе матриц из О, определитель которых по модулю равен единице, отвечает определенная подгруппа в О'. Она состоит из линейных преобразований с единичным модулем определителя. Позднее мы познако- мимся с некоторыми другими важными соответствующими друг другу подгруппами в О и в О'. 2) Если линейные пространства L и L’ линейно изоморфны, то они изоморфны и как группы. Обратное, вообще говоря, неверно. В самом деле, из §§ 10, 11 гл. I следует, что «-мер- ное комплексное пространство Сп и действительное простран- ство L<2n размерности 2я изоморфны как группы (относи- тельно операции сложения векторов), в то время как они не являются линейно изоморфными пространствами.
210 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI 3) Используя п. 6, нетрудно проверить, что совокупность линейных функций при всевозможных л^О образует группу преобр азований числовой прямой — со со. Обозначим эту группу через О. Ее называют группой линей- ных преобразований числовой прямой. Пусть О'—группа действительных чисел л (л 0) относительно умножения; Поставив в соответствие каждому преобразованию f = число л, мы получим изоморфное отображение G на G', кото- рое является, частным случаем примера 1) при п=1. Выше, в п. 6 § 1, были указаны две подгруппы в группе О'. Им соответствуют в О две подгруппы, определяемые условиями: 1) л = ± 1; 2) Х>0. Первая из этих подгрупп состоит всего из двух преобра- зований: тождественного отображения числовой оси < = т и зеркального отражения t = — t. Вторая подгруппа состоит из бесконечного множества преобразований, именно из всех линейных преобразований, сохраняющих направление числовой осп. 9. Определение. Отображение группы О в группу О' называется гомоморфизмом, если образ произведения любых двух элементов из О является произведением их образов в О'. Иначе говоря, требуется лишь соблюдение условия (6). При этом может случиться, что а' = Ь' при а ф Ь и что неко- торые элементы группы О' не являются образами каких бы то ни было элементов из О. Гомоморфизм будем символи- чески обозначать так: G-+G'. Ясно, что изоморфизм есть частный случай гомомор- физма. Другой частный случай гомоморфизма мы получим, поста- вив в соответствие каждому элементу произвольно выбранной группы О единицу какой-либо группы О'. Тогда имеем: а' — е', b' — e', (ab)' = е' = а'Ь', и (6) соблюдено. 10. Теор ем а. При любом гомоморфизме О—^О' образ группы О является подгруппой в О'. Доказательство. Образ группы О обозначим через О. Пусть а', Ь'— произвольные элементы из 0, а, b — какие- нибудь из их прообразов. Вследствие (6) умножение не выво- дит за пределы G-. a'b' — О. (8)
§2] ГРУППЫ ПРЕОБРАЗОВАНИИ 211 Из (6) следует также, что а'(а = (аа 1)' = е'. (9) Аналогично п. 8 (см. формулу (7)) устанавливается, что образ е' единичного элемента группы G является единицей в О’. Поэтому (9) означает, что (аТ1 =(«-*)'С О- (Ю) Соотношения (8) и (10) показывают, что О удовлетворяет определению подгруппы. Замечание. Можно доказать, что совокупность всех прообразов единичного элемента группы О' при гомомор- физме G—>G' образует подгруппу в О; эту подгруппу назы- вают ядром гомоморфизма G—>G'. На доказательстве оста- навливаться не будем. 11. Рассмотрим некоторые примеры гомоморфизмов, важ- ные для дальнейшего. Пустя G—группа всех невырожденных действительных п X л-матриц, О'— группа действительных чисел X (Х^£0) относительно умножения. Построим следующие отображения G в G': 1) Каждой матрице А£ О ставится в соответствие одно и то же число Х=1. 2) Все матрицы, у которых DetA^>0, отображаются в число X = -j-l; все матрицы, у которых DetA<^0, имеют своим образом число X ——1. 3) Пусть зафиксировано любое действительное число о. Каждой матрице А £ G ставится в соответствие число X = х=[Ое1Л|Х 4) Матрице А ставится в соответствие Х = | Det Д|°, если Det А > 0, Х=—|DetA|a, если DetA<0. Во всех четырех примерах имеем гомоморфизм G—>0'. В первом — вследствие того, что вся группа G отображена в единицу группы G'. В трех остальных — вследствие теоремы об определителе произведения матриц. Вместо группы чисел X (X 0) можно взять изоморфную ей группу линейных преобразований t = Xt (Х^О) числовой прямой. Тогда мы получим четыре гомоморфизма, в которых образами G являются группы преобразований числовой пря- мой, состоящие соответственно 1) из одного тождественного преобразования: t — z;
212 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ 1ГЛ. VI 2) из двух преобразований: t = t и t —— т; 3) из всех преобразований t — у которых к^>0; 4) из всех линейных преобразований t = (Х^О). Оказывается, что перечисленные выше в этом пункте четыре вида отображений G и G' исчерпывают все вообще возможные гомоморфизмы О в О'. Это утверждение будет существенно использовано в следующем параграфе (см., § 3, п. 8). Там же будут даны указания по поводу его доказа- тельства. § 3. Инварианты. Осевые инварианты. Псевдоинварианты 1. Пусть дано /г-мерное линейное пространство L, которое для упрощения дальнейших формулировок мы будем считать действительным. Предположим, что в L выбран и зафикси- рован класс базисов S по некоторой подгруппе О невырож- денных (действительных) п X п-матриц. Наряду с пространством L рассмотрим некоторое множе- ство Т, конкретная природа элементов которого формально не имеет значения. Фактически же в качестве Т нам будут встречаться совокупности геометрических объектов простран- ства L или каких-либо алгебраических объектов, связанных с этим пространством. Пусть задана числовая функция а двух аргументов: про- извольного элемента t из множества Т и произвольного ба- зиса е из класса a=ty(t, 4 (1) Предположим, что значения функции (1) действительны и для всевозможных Т заполняют всю числовую ось — со < с <00 (ПРИ любом фиксированном е). Можно представлять себе, что (как часто бывает в гео- метрии) правая часть (1) есть символическая запись некоторой функции от координат объекта t. Соответственно вместо (1) можно написать а = ф(Xi, ... , хл), (1') где х^ ... , Xn—координаты t относительно базиса е, т. е. числа, которые каким-либо способом определяют объект t при задании базиса е.
§3] ИНВАРИАНТЫ И ПСЕВДОИНВАРИАНТЫ 213 Пример. Объект t есть параллелограмм, построенный в евклидовой плоскости на упорядоченной паре векторов р, q: р = {хъ х2}, q={yi, J'2}; в качестве (!') напишем (в данном случае) a = Xiy.2— х9уь Здесь подразумевается, что Xi, и _уь у.2 суть координаты р и q в некотором базисе е; тогда хь х2, уь _у2 можно считать координатами t в том же базисе. Если е брать в классе ортонормированных базисов евклидовой плоскости, то число а будет ориентированной площадью параллелограмма t. 2. Пусть дано значение а — ф (£, ё). Предположим, что от базиса е мы переходим к любому другому базизу ё того же класса <?: e' = Pe, Р G. Потребуем, чтобы число а' = ф(£, ег) определялось зада- нием числа а и матрицы Р без каких-либо дополнительных сведений по поводу объекта t и исходного базиса е. Иначе говоря, мы будем считать, что а' является функцией от а и от элементов р\' матрицы Р = Символически: a'=f(a, Р). (2) Кроме того, будем предполагать, что для каждой мат- рицы Р из О функция (2) задает обратимое преобразование числовой оси —со а -|- со, которое мы будем обозна- чать символом fP. Мы будем часто вместо выражения (2) употреблять равносильную ему запись а'— /р(а). 3. При соблюдении требований пунктов пп. 1,2 будем говорить, что в пространстве L на множестве Т задана скалярная величина а относительно группы G. Формула (2) называется законом преобразования скалярной величины а. 4. Функцию f(a, Р) нельзя выбирать произвольно. Усло- вия п. 2 накладывают на нее жесткие ограничения, сущность которых заключается в том, что преобразования a'~fp(a) составляют группу. Точнее, имеет место
214 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI Теорема. Закон преобразования скалярной величины есть гомоморфизм группы матриц G в группу всех обра- тимых преобразований числовой прямой. Пояснение. Формула (2) ставит в соответствие каждой матрице Pf G преобразование a’—fP(a) числовой прямой — со а -|~ оо. Теорема утверждает, что это соответствие есть гомоморфное отображение. Обозначим через И множество преобразований a'=fP(a), отвечающих всевозможным матрицам Р из G; тогда из сфор- мулированной теоремы и пп. 10 и 4 § 2 вытекает Следствие. Множество Н есть группа преобразо- ваний числовой прямой — сс<^ а <со. Доказательство теоремы. Поскольку обрати- мость каждого преобразования a'—fP(a) дана, а все обра- тимые преобразования числовой прямой—- со а со составляют группу, то достаточно проверить, что fp’fp — fp’p (3) для любых матриц Р, Р’ из О. Возьмем произвольный базис е б $ и рассмотрим базисы е' —Ре, е” = Ре’= (Р’Р)е. Обозначим через а, а’, а" значения скалярной величины (1) в базисах е, е’ и е" соответственно. Согласно п. 2 имеем а"=/(а', Р') = /(а, Р’Р). (4) Из (2) и (4) получаем условие на функцию f Р), P') = f(a, Р'Р). (5) Правой части равенства (5) соответствует преобразование fP>P. Сложной функции, стоящей в левой части равенства (5), соот- ветствует преобразование, равное произведению fP<fP. Поэтому соотношение (5) (где а — любое число, — оо а -ф- ос) равносильно формуле (3). Теорема доказана. 5. Замечание. В справедливости теоремы можно убе- диться с помощью несколько более наглядных соображений. В самом деле, пусть матрица Р £ G дает переход от базиса е к базису е', а матрица Р' £ G — переходит ог ба- зиса е’ к базису е". Тогда матрица Р'Р С G дает непосред- ственный переход от е к е". Пересчитаем значения нашей величины, исходя из базиса е и переходя к базису е" один раз — через посредство базиса е', другой раз — непосредст- венно. Если fP'fP 7^ fP'P, то мы получим разные результаты,
§3] ИНВАРИАНТЫ И ПСЕВДОИНВАРИАНТЫ 215 что недопустимо, так как для каждого объекта из Г в каждом бдзисе класса § значение величины должно быть однозначно определенным. Следовательно, fpfp~fp'P, что и требуется. 6. Каждый гомоморфизм группы G в любую группу пре- образований числовой прямой задает в пространстве L неко- торую скалярную величину. Поясним это подробнее. Пусть некоторый гомоморфизм ставит в соответствие матрице Р С G обратимое преобразо- вание fP числовой прямой, то есть функцию a' —fp (а), задан- ную на всей прямой и имеющую обратную функцию, тоже заданную на всей прямой. Положим f(a, P)=fp(a). Тогда из (3) следует (5) и (4), откуда вытекает однозначная опре- деленность величины а во всех базисах класса Мы должны построить множество Т, то есть определить геометрические объекты f, на которых была бы задана ска- лярная величина а с данным законом преобразования/(а, Р). Это можно сделать по-разному. Например, в качестве t можно взять точку числовой прямой, которая имеет координату а в обычной декартовой шкале. Одновременно следует считать, что в классе е выбран произвольный базис е. При переходе к новому базису е' — Ре перейдем на числовой прямой к дру- гой шкале по формуле a'=fP(a). Будем считать, что в ба- зисе е’ той же точке t отвечает ее координата а’ в новой шкале. Тогда все требования пп. 1, 2 будут соблюдены. 7. Особенно часто встречаются так называемые линейные геометрические объекты или линейные скалярные величины, которые характеризуются тем, что преобразования fp линейны, то есть закон преобразования (2) имеет вид a’=f(P)a. В этом случае вместо (5) имеем более простое соотно- шение /(р)/(^')=/т. (6) наложенное только на матрицы Р, Р' (любые из О). Соотношение (6) легко вывести сразу, без ссылки на (5). В самом деле, если a'=f(P)a, а" =а’, то а" = /(Р)/(Г)а.
216 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI С другой стороны, мы должны иметь непосредственно а"=/(Р/У)а. Тем самым выполняется (6). 8. Пусть теперь G— группа в сех действительных невы- рожденных «Хп-матриц (п фиксировано). Как сообщалось (без доказательства) в п. 11 § 2, все гомоморфизмы Q в группу действительных чисел (по умно- жению) сводятся к четырем видам отображений, которые перечислены в п. И § 2. Это же утверждение можно высказать так: Если числовая функция f(P) от матричного аргумента удовлетворяет соотношению (6) для любых Р, Р' £ G, то: 1) либо /(Р)=1 для всех Р Q G; 2)либо/(Р)=1 для Р( О, DetP>0, и/(Р) = —1 для PC G, DetP<0; 3) либо /(Р) = |DetРj’ для всех PC G (здесь а — какое- нибудь данное действительное число); 4) либо f(P) — ± | Det Р |а, где знак плюс имеет место для Р С G, DetP^>(), знак минус—-для Р С G, DetP<0. Заметим, что случаи 3) и 4) включают, в частности, случаи 1) и 2) при о = 0. Заметим, что мы исключаем из рассмот- рения тривиальный случай, когда/(Р) является тождественным нулем (/(Р) = 0 для всех Р С G). Доказательство высказанного утверждения мы могли бы провести лишь с помощью некоторых средств, изложенных в дальнейших главах. Поэтому мы даем это доказательство в специальном приложении (см. Приложение в конце книги). Но мы воспользуемся высказанным утверждением теперь же. Оно позволит нам перечислить все возможные виды линей- ных величин. Именно, существуют лишь следующие четыре вида линейных скалярных величин: 1) Инварианты, то есть величины, не зависящие от выбора базиса. Их закон преобразования а = а (I) для любой матрицы Р. Группа Н состоит из одного тождест- венного преобразования числовой оси.
§ 3 ] ИНВАРИАНТЫ И ПСЕВДОИНВАРИАНТЫ 217 В предыдущих главах мы неоднократно предполагали, что имеем дело именно с такими величинами (например, когда рассматривали линейные, квадратичные, билинейные и поли- линейные формы). 2) Осевые (или аксиальные) инварианты. Их закон пре- образования таков: ( а, если DetPJ>0, а | — а, если Det Р 0. Здесь группа Н состоит из двух линейных преобразований а' = а и а' — —а. Название «осевые инварианты» выражает зависимость этих величин от ориентации координатных осей. Они не меняются при переходе к новому базису с сохранением ориентации, но меняют знак, если ориентация базиса заменяется на противо- положную. Пример. К числу осевых инвариантов принадлежит ориентированная площадь ориентированного параллелограмма на евклидовой плоскости. Эта величина положительна, если пара векторов, определяющих параллелограмм и его ориен- тацию, одинаково ориентирована с базисом, отрицательна — в противном случае. Элементы множества Т — всевозможные ориентированные параллелограммы на евклидовой плос- кости. 3) Псевдоинварианты веса а. Их закон преобразования имеет вид а'=а | Det Р |°, (III) где о — заданное действительное число. Здесь каждой матрице Р ставится в соответствие линей- ное преобразование а' = Ха при X = | Det Р |°. Группа Н состоит из всех линейных преобразований а' = Ха с положительным коэффициентом X. Пример. Согласно § 3 гл. IV определитель матрицы инвариантной билинейной формы преобразуется по закону A' = A(DetP)2. Таким образом, величина Д относится к числу псевдоин- вариантов веса о = 2. Множество Т в этом примере состоит
218 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI из всевозможных инвариантных билинейных форм, заданных в пространстве L. 4) Осевые псевдоинварианты веса а: ( a|DetP|a, если DetP>0, аГ==( —a|DetP|°, если DetP<0, (IV) где о — заданное действительное число. 9. Если G—какая-нибудь группа действительных п X «-мат- риц, то скалярные величины с законами преобразования (I), (II), (III) и (IV) называются соответственно инвариантами, осе- выми (или аксиальными) инвариантами, псевдоинвариантами веса а и. осевыми (или аксиальными) псевдоинвариантами веса а относительно группы G. В случае группы матриц, у которых |DetP|—1, псевдоинварианты не отличаются от инвариантов, а осевые псевдоинварианты — от осевых инва- риантов. Если же наложить условие DetP=;-|-l, то все четыре класса величин становятся неразличимыми (сводятся к инва- риантам относительно указанной группы). Отметим попутно, что группу матриц с определителем, равным единице, обычно называют унимодулярпой группой (как в действительном, так и в комплексном случае). 10. Термин «инвариант» часто употребляется в более широ- ком смысле, чем в пп. 8, 9. Именно, инвариантами какой-либо группы преобразований называются всевозможные объекты, свойства и величины, сохраняющиеся при применении любого преобразования из данной группы. Очевидно, что каждый инвариант некоторой группы яв- ляется инвариантом для любой ее подгруппы. Обратное неверно: инвариант подгруппы может не быть инвариантом всей группы. В этом смысле можно сказать, что чем обширней группа преобразований, тем меньше у нее инвариантов, но зато они отражают более устойчивые, более глубокие свойства реаль- ного мира. Геометрия распадается на ряд разделов, в каждом из ко- торых исследуются инварианты какой-нибудь определенной группы преобразований того или иного пространства. Так например, в элементарной геометрии рассматриваются свой- ства фигур в трехмерном евклидовом пространстве, сохра-
§41 ТЕНЗОРНЫЕ ВЕЛИЧИНЫ 219 няющиеся при любом движении фигуры как твердого тела (иначе говоря, инварианты группы движений трехмерного евклидова пространства). В следующих главах мы познако- мимся с несколькими важными группами преобразований и с некоторыми их инвариантами. § 4. Тензорные величины 1. Здесь мы определим некоторые классы величин, род- ственные тензорам и включающие их как частный случай. Геометрическим истолкованием этих величин мы сейчас за- ниматься не будем. Мы будем только предполагать, что в каждом базисе они задаются известным набором чисел (коор- динат) и что при переходе к новому базису эти числа пре- образуются так же, как коэффициенты полилинейных форм. Чтобы не осложнять изложения громоздкими формулами, бу- дем считать, что определяющие числа (координаты величин) помечены двумя индексами (нижним и верхним). Соответст- венно будем рассматривать формы от двух векторных аргу- ментов (один из которых контравариантный, другой ковари- антный). Переход к любому числу индексов тривиален. 2. Пусть в линейном л-мерном пространстве L дана били- нейная форма а(х,и\ х £ L, и £ L*. Если в L введен базис et,..., еп, а в L* — взаимный базис е1,..., е", то х = x'et .. .. ,-\-хпеп, 11 = 11^ . .-\-ипеп, и форма а(х, и) получает координатное представление а (х, «) = У, акх1ик, где аь. = a (eit ek). (1) При переходе к новому базису имеем = ^'=Vq^_ (2) Коэффициенты координатного представления формы при этом изменятся. Новые коэффициенты akJ, будут выражаться через старые коэффициенты ак тем или иным способом в зависи- мости от характера самой формы как скалярной величины. Именно, может случиться, что числовое значение а(х, и) данной формы на произвольной паре векторов х, и заменится
220 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI новым значением а'(х, и); тогда закон преобразования а(х, и) в а'(х, и) определит закон преобразования в а?,'. Мы будем предполагать, что данная форма как скалярная величина относится к одному из четырех классов, указанных в п. 7 предыдущего параграфа. Соответственно рассмотрим четыре случая. 3. 1) Форма а(х, и) является инвариантом. В этом случае а? = а’ (е?, ек') — а (е?, ек). Отсюда с учетом (1) и (2) получаем с1) Это есть известный нам закон преобразования координат (двухвалентного смешанного) тензора. 2) Форма а(х, и) является осевым инвариантом. В этом случае а|' = а' (е?, ек>) = ± а (ер, ек>), где имеем знак плюс, если DetP^>0, знак минус, если DetP<^0. Отсюда с учетом (1) и (2) при том же условии насчет знака в правой части. Величины, у которых определяющие числа а1? преобразу- ются по закону (II), называются осевыми (или аксиальными) тензорами. 3) Форма а(х, и) является псевдоинвариантом веса а. В этом случае ак.' = а'(ер, ек') = а (ер, eh‘) [ Det Р j0. Отсюда с учетом (1) и (2) ак: = | Det Р |° akP\,Q%. (III) Величины, у которых определяющие числа ак: преобразу- ются по закону (III), называются псевдотензорами веса а. 4) Форма а(х, и) является осевым псевдоинвариантом веса о. В этом случае а^, = a1 (ер, ек') — ±а (er, ек') | Det Р |°
§41 ТЕНЗОРНЫЕ ВЕЛИЧИНЫ 22Г п соответственно ± | Det Р аР, (IV) где справа берется знак плюс, если DetP^>0, знак минус, если Det Р 0. Величины, у которых определяющие числа преобразу- ются по закону (IV), называются осевыми (или аксиальными) псевдотензорами веса а. 4. Законы преобразований (I) — (IV) для выведены нами как следствие соответствующих законов преобразова- ния (I)-(IV) § 3 для скалярной величины а(х, и). Легко показать, что и обратно, если ak. преобразуются по законам (I) — (IV), то для скалярной величины а (х, и) = У аРк'иь имеют место соответственно законы преобразований (l)-(IV) § 3. 5. В этом параграфе мы считали, что преобразование (2) определяется любой невырожденной матрицей Р. Можно предполагать, что матрицы Р берутся из некоторой группы G, а допустимые базисы составляют соответствующий класс ё. Тогда высказанные выше определения дадут нам четыре класса тензорных величин относительно группы G. 6. Будем рассматривать совокупность чисел а* как точку координатного пространства К (размерности /г2). Тогда лю- бой из четырех законов (I) — (IV) определяет по заданной матрице Р £ G некоторое преобразование пространства К (разумеется, свое для каждого закона (I) — (IV)). Обозначим это преобразование для какого-нибудь одного закона (I)—(IV) через fp. Справедливы утверждения: а) Множество всех fp (Р t G) является некоторой груп- пой Н преобразований пространства К. в) Отображение G на Н, при котором матрице Р С G соответствует преобразование fp £ Н, является гомоморфиз- мом; именно fp'fp—fp’P (3) для любых матриц Р', Р £ G. Доказательство аналогично п. 4 § 3.
222 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI Соотношение (3) чрезвычайно важно. Если бы оно не имело места, то законы (I) — (IV) были бы бессмысленны, так как различные переходы к новому базису — непосредст- венно или через промежуточные базисы—давали бы разные результаты. 7. Из законов преобразований (I) — (IV) следует, что обра- щение в нуль всех координат тензорной величины в одном базисе влечет за собой обращение в нуль всех ее координат в любом другом базисе: если й? = 0, то а*' = 0. 8. Если определяющие числа тензорной величины (любого из четырех классов) помечены многими индексами, то внизу пишутся те из них, по которым в законах преобразований (I)—(IV) идет суммирование с верхними индексами элемен- тов матрицы Р. Число нижних индексов называется ковари- антной валентностью тензорной величины. Остальные индексы пишутся сверху; число их равно контравариантной валентности. Замечание. Скалярные величины любого из четырех классов, о которых говорилось в § 3, можно рассматривать как тензорные величины (соответствующего класса) нулевой валентности. 9. Пусть Т означает множество всех тензорных вели- чин какого-нибудь одного из классов (I) — (IV) и какой- нибудь одной структуры в отношении валентностей (т. е. с одним и тем же числом нижних и верхних индексов). Тогда, если над элементами Т производить линейные операции, как в координатном пространстве (т. е. сумму величин строить путем сложения их соответствующих координат, произведение величины на число — путем умножения на это число всех ее координат), то в результате будут получаться тензорные величины того же множества Т. Убедимся в этом, взяв для простоты в качестве Т мно- жество двухвалентных смешанных псевдотензоров дан- ного веса а. Рассмотрим два псевдотензора из У с коорди- натами ак и Ьк в некотором базисе. В новом базисе полу- чим ак, bk. Можно считать, что а? выражены уже напи- санным в п. 3 равенством (III). Аналогично bk: = | Det Р\°^ь№оК. (Ша) Складывая (III) и (Ша) почленно, получим «д' + bk: = I Det Р Г 2 ) РдСГ.
§ 4] ТЕНЗОРНЫЕ ВЕЛИЧИНЫ 223 Таким образом, сумма двух тензорных величин из Т имеет точно тот же закон преобразования, что и каждая из этих величин. Умножая обе части равенства (Ш) на произ- k' fl вольное число а, увидим, что аа? выражается через аа, по тому же закону. 10. Если две тензорные величины принадлежат Т, то равенство между ними имеет инвариантный характер. Под- робнее, пусть, например, для а* и Ьк имеем в одном базисе равенства при любых /, k. Тогда в любом другом базисе Чтобы убедиться в этом, достаточно заме- тить, что, согласно п. 9, разность Z>* — а* есть тензорная величина и, следовательно, обращение ее в нуль не зависит от базиса. Замечание. Разумеется, в одном базисе равенство Ьк = а[ возможно для любых величин а[, b';. Но если эти величины взяты из разных классов (I) — (IV), т. е. имеют разные законы преобразований, то при переходе к новым базисам равенство нарушится. 11. Произведение двух любых тензорных величин, взятых из каких угодно классов (I) — (IV), строится путем умножения каждой координаты одной величины на каждую координату другой (в одном и том же базисе). По- лученная величина будет относится к одному из классов (1) — (IV) в зависимости от выбора сомножителей. Например, если есть псевдотензор веса bi — псевдотензор веса с2, то а/7»™будет (четырехвалентным) псевдотензором веса В самом деле, при указанных предположениях а-' = | Det Р р У afPi'Q*, bf = | Det Р р у b™PJj’Qm. перемножая эти равенства, получим a-'b"' = | Det Р Г1+°2 у aib^PrP^QkQ^. 12. Отметим, что произведение двух осевых тензоров есть обычный тензор. Произведение обычного тензора на осевой есть осевой тензор. 13. Свертка по одному верхнему и одному нижнему индексу тензорной величины одного из классов (I) — (IV)
224 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ [ГЛ. VI дает тензорную величину того же класса. Полная свертка приводит к скалярной величине того же класса. Например, свертка двухвалентного смешанного псевдотензора веса а есть псевдоинвариант веса а. В самом деле, из (III) имеем = | Det Р Г аМ = | Det Р |° ^ таким образом, для величины а = 2 °” получается закон пре- образования вида (III) § 3. § 5. Ориентированный объем параллелепипеда. Дискриминантный тензор 1. Пусть в линейном /г-мерном пространстве L выбран некоторый базис еъ ..., еп и тем самым задана ориентация пространства (см. § 1). Возьмем в L упорядоченный набор произвольных векторов хь х2, ..., х„, и каждый из них разложим по данному базису: Xi = xjej... -^-х"еп, хп = х,пе1-1г- ... +х”е„. Матрицу, составленную из коэффициентов этих разложений, т. е. из координат векторов xt, ..., х„ по базису еь ..., ет обозначим через X. Сопоставим с упорядоченным набором векторов Xi,..., хп число D(xb ..., хп), равное определителю матрицы X: х{ .. • Х1 О(хъ хп)= • Хп . п • хп При переходе к другому базису ei' = ^Pvet (1) мы сопоставим с тем же набором векторов xlt хп число 1У(х1, хп), равное определителю матрицы X', которая составлена из координат векторов Xi, .... хп по базису еу, .... е„/.
ДИСКРИМИНАНТНЫЙ ТЕНЗОР 225 § 5] Легко найти закон преобразования величины D(xt,хп); Именно, вместе с (1) мы имеем для координат любого век- тора следующие равенства: х1' = ^Q'ix\ Отсюда получаем матричное равенство X' = XQ*. Следовательно, Dr (xi...х„)=Det X' = Det X Det Q* = = Det Q* D(xt,..., x„). Но, как мы знаем, Q* = P-1. Таким образом, имеет место соотношение D'(xb .... xn) = ± | Det Р |-1 D(xb ..., хп\ (2) где справа следует брать знак плюс, если DetP^>0, знак минус, если DetP<^0, Мы видим, что D(xit хп) является осевым псевдо- инвариантом веса а ——1, который определен на всех упо- рядоченных наборах из п векторов каждый. Заметим, что D(xit ..., х„)^>0, если векторы х1г ..., хп линейно неза- висимы и упорядоченный набор Xi, ..., хп ориентирован положительно (т. е. одинаково с базисом еь еп). 2. Из свойств определителя непосредственно следует, что D(xi, х„) представляет собой полилинейную форму, т. е. функцию, линейную по каждому своему векторному аргу- менту. Форма D(xb ..., х„) является косой, т. е. кососиммет- ричной по любой паре аргументов (поскольку определитель меняет знак при перестановке двух строк). Разлагая определитель согласно его непосредственному определению, получаем координатное представление формы D(xlt хп) в базисе еь .еп: D(x\, ..., х„)=2\... inxi хпп- Здесь 8,- ^ = 0, если среди индексов 1Ь ..., /п имеются одинаковые; 8г . z =-ф 1, если Zb ..., i„ составляют чет- ную перестановку натуральных чисел 1,2, ..., /г; 8^ ... { = = — 1, если перестановка ..., in нечетная.
226 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ 1ГЛ. VI Отсюда и из предыдущего пункта следует, что 8,t... f является осевым ковариантным псевдотензором веса с =—1. Ясно также, что 8,-... кососимметрпчен по любой паре индексов. Замечание. Можно прямым путем убедится, что если мы подвергнем 8^ ... ^ преобразованию по чисто ковариант- ному закону вида (IV) § 4, то получим числа 8,- , = ± | Det Р 8,- ... 1Р\\ ... Р» (3) 1 ••• п 1 " 1 1п точно такие же, как 8,-^ ... Именно, 8г' ... ,-^=0, если среди индексов есть одинаковые; 8- .- = ±1 в зависимости от 1 ••• 1п четности перестановки i[ ... i'n. Для пояснения мы заметим только, что если zj = l, zj —2, ..., Гп=п, то сумма в пра- вой части (3) равна DetP; поэтому 8р2'...„' =-j-1; осталь- ные случаи предоставляем читателю. 3. Пользуясь формой D(xi, ..., хп), можно построить новую косую форму от А'ь ..., хп, которая уже будет осе- вым инвариантом, т. е. будет только знаком реагировать на ориентацию базиса, сохраняя во всех базисах свою абсолют- ную величину. Но для этого нам придется привлечь на по- мощь некоторую инвариантную квадратичную форму. Возьмем по своему усмотрению какую угодно инвариант- ную квадратичную форму а (х, х) прн единственном условии, чтобы она была невырожденной. В произвольном базисе еь ..., еп эта форма имеет определенное координатное пред- ставление и вместе с ним определенную матрицу Д; при этом Д==Ое1Д=£0. При переходе к новому базису согласно (1), форма а(х, х) получит новую матрицу А'. Если Д'—Det Д', то, как нам известно, Д' —Д (DetP)2. Отсюда = /|ДТ |DetPj. (4) Перемножая почленно (2) и (4), найдем /Ж£'(-*1. •••> х„) = ±/[Д|О(х1, .... х„). Таким образом, косая полилинейная форма ]/| Д | D (xt,..., хп) является осевым инвариантом.
§ 5] ДИСКРИМИНАНТНЫЙ ТЕНЗОР 227 4. Отсюда сразу следует, что в произвольном базисе eit еп числа % г, являются координатами некоторого осевого тензора. Его на- зывают дискриминантным тензором для формы а(х, х). В гл. VIII—X дискриминантный тензор будет существенно использован. 5. Пусть $1 — действительное аффинное «-мерное про- странство, соответствующее линейному «-мерному простран- ству L. Возьмем произвольную точку А £ ?1 и произвольные век- торы Xi, ..., С L в числе, равном размерности. Пусть далее Л1 — какая-нибудь точка пространства?!, определяемая равенством ЛЛ1 == -ф- ... -j-tnx„, где tj, ..., — действительные числа. Если ть ..., т„ изме- няются независимо друг от друга при условиях 0 sg: ==g 1 (k—1......п), то всевозможные получаемые при этом точки составляют некоторую пространственную фигуру, которая называется параллелепипедом, построенным на векторах Л'1, ..., хп, приложенных к точке А. При п = 2 параллеле- пипед называется также параллелограммом (см. выше, § 8 гл. III). Пусть пространство L ориентировано заданием базиса eh ..., еп. Тогда, если векторы xlt ..., хп линейно незави- симы, то построенному на них параллелепипеду приписы- вается положительная или отрицательная ориентация. Именно, параллелепипед считается положительно ориентированным, если положительно ориентирован упорядоченный набор век- торов Xi, ..., хп. 6. Мы хотим с каждым параллелепипедом сопоставить некоторое число, которое по аналогии с трехмерным евкли- довым пространством естественно было бы назвать его объе- мом (в двумерном случае — площадью). Учитывая эту аналогию, мы предъявим к искомой величине следующие требования: 1) Объем должен зависеть только от векторов хь ..., хп, но не от точки А. 2) Объем должен быть положительным числом в случае положительной ориентации параллелепипеда, отрицательным —
228 ПОНЯТИЕ ГРУППЫ И ЕГО ПРИЛОЖЕНИЯ 1ГЛ. VI в случае отрицательной ориентации; должен быть нулем, если векторы хь х„ линейно зависимы (тогда весь па- раллелепипед лежит в гиперплоскости). 3) Абсолютная величина объема должна быть инва- риантом. 4) При удлинении одного из векторов хь ..., хп в а раз объем должен увеличиваться в о. раз. 5) Если xi — х\ -j- x't, то объем параллелепипеда, по- строенного на векторах хь х.>, ..., хп, должен равняться сумме объемов параллелепипедов, построенных на xj, х2, ... ..., хп и x'i, Хо, ..., Хп, аналогичное свойство должно иметь место в отношении остальных векторов набора хь хп. Оказывается, что указанные требования по существу определяют объем как функцию от xt,..., х„. В самом деле, они означают, что эта функция должна быть полилинейной формой от Хь ..., х„, кососимметричной по каждой паре аргументов; как числовая величина она должна быть осевым инвариантом. Но в точности такими свойствами обладает полилинейная форма У |,Д |D(хь ..., х„), приведенная в п. 3. С другой стороны, согласно изложенному в § 8 гл. V, всякая другая полилинейная форма, обладающая теми же свойствами, про- порциональна форме У | Д \D(xh ..., х„). Таким образом, если объем ориентированного параллелепипеда, который по- строен на векторах хь..., х„, обозначить через V(х.,..., хп), то V(x1( .... х„)=СУ|ДТР(х1, х„), (5) где С—любая инвариантная постоянная (разумеется, отлич- ная от нуля). 7. Мы можем менять постоянную С и форму а(х, х), определитель Д которой участвует в равенстве (5). Однако множитель G У\Д | в правой части (5) будет единственным образом определен, если мы по своему усмотрению назначим параллелепипед с единичным объемом, т. е. произвольно возь- мем линейно независимые векторы at, ..., ап и потребуем, чтобы оя)=1. Определяя указанным способом С У1 Д |, получим формулу: V(xb . ч D(Xt, хп) n)^D(Ol.......«„)•
§ 5] ДИСКРИМИНАНТНЫЙ ТЕНЗОР 229 Таким образом, измерение объемов в аффинном пространстве однозначно определяется произвольным выбором единицы объема. Мотивированный выбор единицы объема естественно делается в линейных пространствах, наделенных метрикой; 66 этом см. гл. VIII. 8. Если при замене базисов мы будем использовать не всю группу невырожденных матриц, а ограничимся ее унимо- дулярной подгруппой G, то не будет надобности в квадра- тичной форме а {х, х), так как относительно G сама величина D(xi, ..., хп) является инвариантом. При этом необходимо также ограничиться базисами из некоторого класса отно- сительно унимодулярной подгруппы G. Допустим, что класс выбран. Полагая в этом случае V(*i -*«)=СО (хь..., хп), (6) получим объем как инвариант относительно унимодулярной подгруппы. Так как D(eh ..., е„)—1, то С= Vg, где Уо = V (еь ..., е„) есть объем параллелепипеда, построенного на базисных векторах еь..., еп. Заметим еще, что можно в формуле (6) взять С=1; тогда V(elt ..., еп)—1, то есть параллелепипед, построенный на базисных векторах , ет имеет единичный объем. В данном случае все базисы выбран- ного класса & характеризуются тем, что для них V = -ф-1. 9. Точно также вспомогательная квадратичная форма а(х,х) не нужна, если рассматривается какой-либо класс базисов S (е) по подгруппе матриц с единичным модулем определителя. В та- ком случае объем тоже выражается формулой (6), но является осевым инвариантом. Будем считать, как и выше, что С=1. Тогда параллелепипед, построенный на векторах базиса е, сно- ва будет иметь объем V == -ф-1, а все базисы класса S будут характеризоваться тем, что для них |У| = 1. При этом V = -ф-1 или V = — 1 в зависимости от ориентации про- извольного базиса класса £ (<?) по отношению к исходному базису е. Чтобы подчеркнуть зависимость знака объема от ориента- ции, часто употребляют термин «ориентированный объем параллелепипеда».
ГЛАВА VII. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ЛИНЕЙНЫХ ПРОСТРАНСТВ I § 1. Общие сведения 1. Определение. Отображение у = Ах, х £ L, у £ L, линейного пространства L в себя (или на себя) называется линейным, если A (a-Vj рх2) = а А (лу) -j- р А (х^) (1) для любых векторов л'ь х« £ L и любых чисел а, [3. Здесь и в дальнейшем числовые множители действительны или комплексны в зависимости от того, действительно или комп- лексно пространство L. Отображение у— Ах называют также линейным преобра- зованием пространства L; иногда говорят, что А(х) есть ли- нейный оператор в L. Линейные преобразования представляют собой многомерное обобщение линейной функции одного числового аргумента f(x) — kx. Их разнообразие быстро растет с повышением размерности. При записи линейных преобразований скобки обычно опускают и вместо А(х) пишут Ах. Простейшими примерами линейных преобразований могут служить тождественное преобразование Ех = х (2) и нулевое преобразование 0х — 0, где слева 0 есть символ линейного преобразования, которое каждому вектору х ставит в соответствие нулевой вектор. 2. Произведение двух любых линейных преобразований А и В линейно: АВ (axi -j- рх2) = А (аВх! -j- $Bxs) — zABxi -ф рАВх*
ОБЩИЕ СВЕДЕНИЯ 231 § И 3. Для линейных преобразований определяются операции сложения и умножения на числа: (Л -J- В) х = Ах Вх, (а А) х — а Ах. (3) Нетрудно показать, что преобразования А-[-В и аА тоже линейны и что множество линейных преобразований прост- ранства L само является линейным пространством. Роль нуле- вого вектора в пространстве линейных преобразований вы- полняет пулевое преобразование 0. Доказательство этих утверждений предоставляем читателю. 4. Наличие трех операций: умножения линейных преобра- зований, сложения и умножения их на числа — позволяет строить многочлены от преобразований: Р (А) = «оА" Ап 1 -j-... -j- an_i А Ц- а„В, (4) где ау- — числа; степени преобразования определяются повтор- ным умножением: А2 = АА, А3 = ААА и т. п. Для любого преобразования А по определению считают, что А° = В, (5) так что слагаемое а„В в многочлене (4) играет роль свобод- ного члена. 5. Предполагая пространство конечномерным, введем в нем базис elt..., еп. Предположим, что нам известны образы базисных векто- ров Aeh в данном базисе, то есть известны коэффициенты разложений: А^=£А;а. (6) Тогда известна матрица величин А*. Один из индексов по- ставлен сверху, а другой снизу не случайно. Ниже мы по- кажем, что А есть тензор с такими валентностями. Положим |А{ ••• ••• A,1, А’ ... А« Знак * поставлен потому, что гораздо чаще в приложениях линейных преобразований встречается не эта матрица, а транспонированная, и для нее оставлен более простой сим- вол А.
232 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII Покажем, что, зная матрицу А, можно для любого х вы- числить у: У = ^y‘ei = Ах = А ek). Воспользуемся линейностью преобразования А: у — ^Ае* — У xkAajea. Изменив обозначение одного из индексов, получим у=S ^ei==S (S ег> i \ k ) откуда У = у, A'kXk, z = 1,.... л. (7) /?= 1 Эта координатная запись равносильна одному матричному равенству Легко проверить, что разные матрицы А и В задают в данном базисе разные линейные преобразования. Итак, линейное преобразование у = Ах векторов прост- ранства L выражается в виде линейного преобразования пере- менных (7), которое в матричной форме записывается т е м ж е самым равенством у—Ах. Оно называется коорди- натным представлением линейного преобразования А. 6. Используя формулы (3) и (7), нетрудно проверить, что при сложении линейных преобразований их матрицы скла- дываются, при умножении линейного преобразования на число матрица умножается на то же число, так что пространство линейных преобразований «-мерного линейного простран- ства L изоморфно пространству п X «-матриц. Аналогич- но § 2 гл. II можно показать, что при умножении двух линейных преобразований их матрицы перемножаются. Тож- дественному преобразованию соответствует единичная матри- ца Е, нулевому преобразованию соответствует матрица, со-
§ 2] ЛИНЕЙНОЕ преобразование как тензор 233 стоящая из нулей. Согласно сказанному равенства (2) — (5) можно в равной мере понимать и как выражения для пре- образований, и как выражения для матриц. 7. Укажем некоторые обобщения понятий, введенных в этом параграфе. Пусть даны два линейных пространства L и L'. Линейным отображением пространства L в пространство L' или линейным оператором из L в L' называется функция у = Ах, которая каждому вектору х С L ставит в соответ- ствие некоторый вектор у из L' и удовлетворяет условию линейности (1). При L'=L получаем линейное преобразование, определенное в п. 1. Для линейных операторов определены действия сложения и умножения на число согласно формулам (3); можно показать, что множество всех линейных отобра- жений пространства L в L’ само образует линейное прост- ранство. Если каждое из пространств L и L' рассматривать как группу относительно сложения векторов, то любой линейный оператор L —- L' представляет собой гомоморфизм. Если про- странства L и L' конечномерны и в них выбраны базисы, то линейный оператор L —> L’ задается матрицей и выражается в виде линейного преобразования координат векторов, но в отличие от п. 4 матрица, вообще говоря, будет прямоуголь- ной. При совпадении размерностей L и L' оператор А имеет квадратную матрицу. Пусть даны три линейных пространства L, L', L", и пусть рассматриваются два линейных отображения: 1) у = Вх, где х £ L, у С L’, 2) z — Ау, где у £ L’, z £ L". Произведение АВ оператора А на оператор В опреде- ляется формулой z = АВх = А (Вх) и отображает L в L". Линейность АВ доказывается так же, как в п. 1. § 2. Линейное преобразование как тензор 1. Будем считать, что пространство L является и-мерным. Рассмотрим линейное преобразование = Ах пространства L. Оно определено инвариантно, то есть независимо от каких бы то ни было базисов.
234 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII Теперь нас интересует тензорная природа преобразования. В пространстве L перейдем к новому базису ev, ...,еп'. Тогда Aek' = ^lA'lk-ea>. Как выражаются через А}.? Нетрудно сообразить, что имеет место тензорный закон преобразования, соответствую- щий расстановке индексов. Это можно установить без всяких вычислений. Действительно, совокупность всех векторов х из L совпадает с множеством всевозможных одновалентных контравариантных тензоров. Свертка 2^ Л/.Уг при любом х £ L дает одновалентный контравариантный тензор у\ которому соответствует один вполне определенный вектор у= УУс,-, независимо от базиса е{. Отсюда на основании известного признака (гл. V, § 4, пп. 8, 9) заключаем, что Л/, — тензор, и сразу можем написать закон преобразования его опреде- ляющих чисел: i, k О) Таким образом, каждому линейному преобразованию инва- риантно сопоставляется тензор Д = (2) из Т\ = Ь0Ь*, где е\ еп £ L*— базис, взаимный с ci,... , еп. Верно и обратное: всякому двухвалентному смешанному тензору можно инвариантно сопоставить линейное преобразо- вание, поскольку свертка тензора (2) с вектором x — x'ei .,.-\-хпеп дает контравариантный вектор: у —yiei 4~. • -+УЧ» y, = '^jAitxk, не зависящий от выбора базиса еь еп. 2. Можно рассматривать линейные отображения L в £*, L* в L, L* в L* и аналогично предыдущему доказать, что им также соответствуют двухвалентные тензоры. Покажем, как расставить индексы, зная уже, что преобра- зование представляет собой тензор. Пусть, например, п — Ах, где х £ L, и С L*. Перейдем к координатной записи. Вектор х контравариантный, его
§ 2] ЛИНЕЙНОЕ ПРЕОБРАЗОВАНИЕ КАК ТЕНЗОР 235 координаты помечаются индексами сверху: {xl!}. Буква А должна иметь нижний индекс k, чтобы можно было провести свертку по k. Вектор и ковариантный, его координаты по- мечаются индексами снизу: {и,-}. Поэтому в результате свертки должен получаться кова- риантный вектор. Это значит, что и другой индекс у буквы А должен быть нижним: И/= S Aikxh. Эта запись соответствует тому, что линейное отображение пространства L в сопряженное пространство L* сопостав- ляется с дважды ковариантным тензором А,-*. Аналогично для преобразования y — Bv сопряженного пространства L* в L имеем координатное представление вида у = так что соответствующий тензор В11 является дважды контра- вариантным. 3. Пусть А — линейное преобразование пространства L. Матрица А этого преобразования в данном базисе ..., е„ записывается так: А} А1 ... А> д __ ^‘2 • • • А? А" ... А"| При переходе к новому базису ец,еп> получится новая матрица А', элементы которой выражаются формулой (1). Запишем формулу (1) в матричной символике. Для того чтобы не спутать порядок умножения матриц, лучше написать их подробно. Строчки матрицы Р развертываются по верхнему индексу: р;> ... Р« pi, р", рп Г) _ 2 1 2 • • • 1 2' Р'п' Р3п- ... Рп'
236 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII Строчки матрицы Q развертываются по нижнему индексу: Qf Qf ... QV Q = Qf Qf ... Qf Qf Qf ... Qf Формулу (1) можно переписать так: с ь Отсюда получаем искомое матричное выражение A'=QAP* или A'=QAQ-\ (la) где, как обычно, Q = (P*V. 4. Из полученных матричных формул вытекают очень важные следствия. Поскольку Q — невырожденная матрица, то из формулы (1а) следует, что Rang А’ — Rang А. Таким образом, ранг мат- рицы А есть инвариант. Далее, инвариантом является опре- делитель линейного преобразования, поскольку Det А' = Det Q Det A (Det Qf1 = Det A. Инвариантом является также полная свертка тензора А,; 2 Аа — + А% -|-... -j- Л", а которая представляет собой след матрицы линейного преоб- разования. Следует заметить, что когда мы говорим «определитель матрицы» или «след матрицы», не указывая, какому объекту эта матрица отвечает, то вопрос об инвариантности не ясен. Например, и определитель, и след матрицы билинейной формы не являются инвариантами. 5. Пусть А — линейное преобразование пространства, и пусть тем же символом А обозначена матрица этого преоб- разования в произвольно выбранном базисе. Предыдущий пункт позволяет ввести следующие определения:
§ 3] ГРУППА НЕВЫРОЖДЕННЫХ ПРЕОБРАЗОВАНИИ 237 1) Рангом преобразования А называется ранг матрицы А. 2) Определителем преобразования А называется опреде- литель матрицы А. 3) Следом преобразования А называется след матрицы Л, Геометрический смысл ранга и определителя преобразо- вания рассмотрен в следующем параграфе. § 3. Геометрический смысл ранга и определителя линейного преобразования. Группа невырожденных линейных преобразований 1. Пусть в векторном «-мерном пространстве L задано линейное преобразование А. Предположим, что Rang А = г. Обозначим через или через A(L) образ пространства L, то есть множество элементов у вида у = Ах, где х про- бегает все L. Теорема 1. Множество rAt = А(Е) есть линейное подпространство размерности г в пространстве L. Доказательство. Имеем у — Ах = А (£ xke^ = £ xkAek. Следовательно, = A (L) представляет собой линейную обо- лочку векторов Аеь ..., Аеп; но, как известно, линейная оболочка данной системы векторов есть подпространство, размерность которого равна рангу этой системы векторов. Координаты векторов Aet,..., Аеп образуют строки матрицы А, так что размерность A(L) равна рангу А. Теорема доказана. 2. Обозначим через полный прообраз нулевого вектора 6 при преобразовании А, то есть множество всех тех векторов х пространства L, для которых Ах = 0. Множество назы- вают ядром преобразования А. Теорема 2. Если Rang А = г, то ядро е-Р" преобразо- вания А является подпространством размерности п — г в пространстве L. Доказательство, х С тогда и только тогда, когда Ах = Ъ. Записав это векторное равенство в координатах в произвольном базисе еь...,еп, получим систему однородных линейных уравнений, ранг которой равен г: A\x1~\-...-\-Ainxn = O, Afx14-... + А£х" = 0. U)
238 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) ТТЛ- VH Согласно § 5 гл. 111 множество векторов, координаты которых удовлетворяют системе (1), является подпростран- ством размерности п— г, что и требовалось доказать. 3. Теоремы 1 и 2 позволяют дать два геометрических определения ранга преобразования, эквивалентных первона- чальному алгебраическому определению (§ 2, п. 5). 1) Ранг линейного преобразования равен размерности образа всего пространства L. 2) Ранг линейного преобразования равен разности между размерностью пространства и размерностью ядра преобразо- вания (то есть полного прообраза нулевого вектора). 4. Пусть г<^п. Рассмотрим действие преобразования А с геометрической точки зрения. При этом нам будет удобно не делать разницы между линейным пространством L и соответствующим ему аффинным пространством ?(, отождествляя каждую точку из с ее р адиус-вектор ом. Рассмотрим неоднородную систему уравнений ^A'jx1—у1, г=1,..., я, (2) гдеЛ = !!.Л}[| — матрица рассматриваемого линейного пре- образования. Эта система разрешима тогда и только тогда, когда вектор _у=Ус1-{-•••+УЧ1 принадлежит подпростран- ству = /(£). Для каждого у С множество решений системы (2) образует плоскость размерности п — г, парал- лельную подпространству ©-/ ‘ (см. в связи с этим §§ 6, 7 гл. 111). Очевидно, что каждая точка пространства принадле- жит одной из таких плоскостей. Таким образом, все пространство расслаивается на парал- лельные плоскости размерности п—г, каждая из которых отображается в одну точку подпространства 5. Определение. В случае, когда Rang А — и, пре- образование А называется невырожденным. Можно дать другие эквивалентные условия невырожден- ности: 1) Det / ф О, 2) o# = /(L)=L, 3) ®/Г = 6. Каждый элемент пространства L имеет в этом случае прообраз и притом единственный. Это можно проверить
§ 3] ГРУППА НЕВЫРОЖДЕННЫХ ПРЕОБРАЗОВАНИЙ 239 непосредственно, решив систему (2) по правилу Крамера. Обозначив через Д* элементы обратной матрицы А'1, получим или в символической форме = (3) Преобразование (3) является линейным преобразованием, обратным данному. 6. Т е о р е м а 3. Множество всех невырожденных ли- нейных преобразований образует группу преобразований пространства L. Доказательство. Из теоремы о ранге произведения матриц (гл. II, § 4) следует, что преобразование АВ невы- рождено, если невырождены Л и В. Далее Det Д-1 = — (Det Д)'*7-0, поэтому обратное преобразование Д1 не- вырождено. Таким образом, множество невырожденных ли- нейных преобразований пространства L удовлетворяет опре- делению группы преобразований (см. § 2 гл. VI). 7. Т е о р е м а 4. В п-мерном линейном пространстве невырожденное линейное преобразование А определяется однозначно, если заданы: произвольная система п незави- симых векторов х1г..., хп в качестве прообразов и про- извольная система п независимых векторов yh ..., уп в качестве образов. Доказательство. Векторы х1эхп примем за базис в L и разложим по этому базису векторы У\,..., уп Уь — ak-Xi -j-... -J- dkX№ (4) Матрица А искомого преобразования в базисе xltхп однозначно определяется заданием векторов (4), поскольку ее столбцы образованы координатами этих векторов (Д*= а\, см. выше, п. 5 § 1). Det А ф 0 вследствие независимости векторов (4). Тем самым теорема 4 доказана. 8. Выясним геометрический смысл определителя линей- ного преобразования Д. С этой целью будем пользоваться понятием объема парал- лелепипеда (см. § 5 гл. VI). Определим класс базисов по подгруппе матриц с единичным модулем детерминанта и возь- мем один из базисов <?ь..., еп этого класса. Обозначим 1/0 ориентированный объем параллелепипеда, построенного на
240 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII векторах eltе,„ и вычислим ориентированный объем V параллелепипеда, построенного на векторах Aej...... Аеп. Учитывая, что координаты векторов Дег образуют столбцы матрицы А, получаем согласно формуле (6) § 5 гл. VI V= Vft Det А. Следовательно, при данном линейном преобразовании все объемы изменяются в одно и то же число раз, и детерминант преобразования является коэффициентом этого измене- ния. В случае невырожденного преобразования получаем Vj£0, причем базисы ., еп и Aeit Аеп имеют одинаковую ориентацию, если Det/^>0, и противоположную ориента- цию, если Det/I<^0. В случае вырожденного преобразова- ния Det/4 = 0, векторы Аеь..., Аеп линейно зависимы, V = 0. Заметим еще, что равенство (5) может быть непо- средственно выведено из теоремы об определителе произве- дения матриц. § 4. Инвариантные подпространства 1. Определение. Подпространство L'd. называет- ся инвариантным подпространством преобразования у = Ах, если Ах С L' для каждого х С L'. (Символически можно записать A (JLr) cz L'.) Примерами инвариантных подпространств могут служить подпространства и введенные в § 3. Докажем это: 1) Ах £ <М для любого вектора х £ L, в частности для любого х С поэтому А (<ь<) с: 2) Если х б. то Дл' = 6£ так что Л (©Т^) с: Нулевое подпространство (состоящее из одного вектора 6) инвариантно для любого линейного преобразования А, по- скольку Л6 = 6. 2. Пусть L' — подпространство, инвариантное относитель- но А. Тогда преобразование А не выводит за пределы L' векторы, принадлежащие L'. Тем самым в подпространстве L' определено линейное преобразование у = Ах, х £ L’, yQL’. (1) Мы будем говорить, что преобразование А, заданное в пространстве L, индуцирует преобразование (1) в инвари- антном подпространстве L'. Иногда удобно индуцированное
ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 241 § 4] преобразование обозначать другим символом (отличным от буквы А), например А'. Тогда А'х = Ах, если х £ А'х не определено, если х не принадлежит L'. Если преобразование А невырождено, то индуцированное преобразование А' тоже невырождено, и потому A(L') = — A'(L')~L'. Это ясно, поскольку в противном случае на- шелся бы вектор х £ L' cziL, х ф 6, для которого Ах — 6. 3. Если подпространство L не инвариантно относительно А, то найдется вектор х Q L, для которого Ах не принадле- жит L. Поэтому А не индуцирует в подпространстве L ни- какого Преобразования. 4. Покажем, что если известно инвариантное подпростран- ство L’, то можно упростить матрицу преобразования, по- местив в U несколько базисных векторов. Пусть векторы еъ..., ek £ L'. Тогда их образы принад- лежат L' и разлагаются по этим же векторам: Aei = A\et -j- A^e/j, Aek — 4~ • • • 4“ А i,ek. Дальше идут, вообще говоря, более длинные разложения: Ae^+i — Afe-piei 4" • • • 4~ Ah-i^Ck А;г| 1е*-р i 4" • • -4~ + i en> Aen— Anej . 4- Апе^ 4- An^ ct-pi 4~ • • *4" Таким образом, в рассматриваемом случае матрица преоб- разования (транспонированная по отношению к матрице ко- эффициентов выписанных разложений) запишется так: А' ... А1 Afe.pi Ah А* ... AUfe+i ... Akn ДЩ ... Ak+l О .............. Afe+1 ...Л" (2) 5. Рассмотрим важный частный случай, когда пространст- во L является прямой суммой двух ненулевых инвариантных
242 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII подпространств L' и L": L = L'@ L", A (U) cz L', A (L") cz L". Выберем базисы в L' и L": Ci, ..., С/, £ L , • • • > £п С С • Тогда по теореме 4 из § 14 гл. I векторы еь еп обра- зуют базис пространства L. В таком базисе выкладки пре- дыдущего пункта применимы и к еь ек и к efelb поэтому матрица А распадается на два автономных «ящика-* А = k\ k О О (n—k'jXfji—k) Эти «ящики» представляют собой матрицы линейных пре- образований, индуцированных на £' и L". Тем самым изучение преобразования всего пространства в целом сводится к изучению его действия в L’ и L”. 6. Ниже, в § 10, используется Л е м м а. Если L = L' ф L" и подпространства L', L" инвариантны относительно А, то А (L) = A (L') ф А (£")• Доказательство. Если L есть сумма L' и L” (хотя бы и не прямая), то, как нетрудно проверить, Л(£) = = A (L') 4~ A (L''). С другой стороны, вследствие инвариант- ности U и L" имеем Отсюда A(L')<=L', A(L")czL”. A(L') П Л(£")сГ П L", но сумма L' п L" прямая, поэтому //["!£" = 6. Следовательно, Д(Т')П A(L")=6 и, значит, Л(Г)+Л (L")= Л(Г)ф Л(Т"), что и требовалось доказать. § 5. Примеры линейных преобразований Предварительное замечание. Рассматривая при- меры преобразований, удобно не делать разницы между ли- нейным пространством L и соответствующим аффинным про- странством (как в п. 4 § 3).
§ 5] ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИЙ 243 1. Подобие. Размерность пространства L любая. Пре- образование задается формулой Ах = \х для любого х и некоторого фиксированного \ называемого коэффициентом подобия. Все векторы «растягиваются» в оди- наковое число раз (при |X | <^ 1 — фактически сжимаются). В этом случае каждое подпространство является инвариант- ным. Матрица подобного преобразования «-мерного про- странства при произвольном выборе базиса имеет вид X О О X А = кЕ— DeU^X". Тождественное преобразование Е можно рассматривать как подобие с коэффициентом, равным единице, а пулевое преобразование 0 — как подобие с коэффициентом, равным •нулю. В пространстве всех линейных, преобразований, задан- ных на L, подобные преобразования А = )Е образуют одно- мерное подпространство (прямую, проходящую через точки 0 и Е). 2. /1 = 3. Пусть х = {х\ х2, х3}—произвольный вектор, _У = {У, У, У }— его образ. Преобразование у = Ах зада- дим формулами у1 — х1 х2 -ф- х3, у2 = X1 X2 X3, (1) у3 = 2х’ -ф- х2 — х3. Ясно, что преобразование вырожденное, причем Rang А — 2. Образом всего пространства служит подпространство = А(Е), задаваемое уравнением у2=у. Найдем полный прообраз произвольной точки yt = a, y2=a, y3 = b плоскости еМ = А(Е) (рис. 29). При указанных значениях у1, у2, у3 система (1) совместна; первое уравнение можно отбросить, и останутся два уравнения, определяющие прямую: х1 х2 -j- х3 = a, 2х' -ф- х2 — х3 = Ь, которую обозначим через
244 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) (ГЛ. VII Найденная прямая и есть искомый прообраз. При разных а и b все такие прямые параллельны между собой и покры- вают все пространство. На рис. 29 буквой &К обозначена прямая, которая является полным прообразом 6. Точки, не лежащие на плоскости Л(Т), прообразов не имеют. Рис. 29. 3. и = 2. Преобразование у = Ах зададим формулами Матрица преобразования А = вольную точку М и ее образ М'. оси х1. Продолжим этот отрезок k 0 II I. Возьмем произ- Отрезок Л1Л1' параллелен до пересечения с осью х2 в точке К (рис. 30). Тогда при любом выборе точки М имеем КМ' _ КМ ~~ k.
§ 5] ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИЙ 245 Если | k | 1, то отрезок КМ сжимается. Если k <^0, то точки М и М' лежат в разных полуплоскостях х’^>0 и Такое преобразование называется сжатием по направле- нию оси х1 к оси х2. Название «сжатие» условно; при |Л|^>1 следовало бы говорить «растяжение». с матрицей А — правлении оси х2 ходит растяжение, см. рис. 32). 0 II представляет собой сжатие в на- я || оси х1 (при | k | > 1 фактически проис- б. Преобразование У = Л1Х1, Л2х2 (2)
246 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII |называется сжатием по направлениям двух осей |см. рис. 33, 1на котором ki = , k-2 = 2^. Рис. 33. Матрица II О А = j О Д преобразования (2) является Положим 1 диагональной: II 1 0 I О Д’ Тогда Л = АД = ДА. Поэтому преобразование с матрицей А можно получить как суперпозицию сжатия в направлении
§ 5] ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИЙ 247 оси х1 к оси х'г и сжатия в направлении оси х2 к оси х\ произведенных в любом порядке. Преобразования такого вида часто встречаются в теории упругости. Легко проверить, что в каждом из примеров пп. 3—5 оси х1 и № являются инвариантными подпространствами. 6. Пусть L = L’ © L"; размерность L какая угодно, под- пространства L' и L" не нулевые. Пусть L' и L"— инва- риантные подпространства преобразования А, которое в L' индуцирует тождественное преобразование, а в L”— подобие с коэффициентом к Такое преобразование называется сжа- тием с коэффициентом X к подпространству V в направлении подпространства L". Представив х в виде х = х' ~[-х", х' £ Ь', х" С Т", получим Ах — х' Пусть векторы еь ..., е1г образуют базис в £', векторы ehvu ..., еп-—базис в L". Тогда в базисе е1г ..., еп матрица преобразования А имеет вид 1 О о Отметим, что линейная оболочка L ..., любой подсистемы базиса еъ е„ представляет собой инвариант- ное подпространство. 7. Положив в предыдущем примере Х = 0, получим пре- образование, которое называется проекцией пространства L на подпространство L' в направлении подпространства L". Проекцию можно определить непосредственно следующим образом. Если х—любой вектор из L, то он однозначно представляется в виде х — х'~\-х", где х' £ L', х" £ L". Тогда проекция х на L' в направлении L" есть Ах = х'. Проекция является вырожденным преобразованием, образом всего L служит L', а полным прообразом нулевого вектора является L". 8. Далее в виде примера мы даем следующую важную для дальнейшего конструкцию. Пусть в пространстве L
248 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII зафиксирован базис е1г ..., еп. В этом базисе преобразование, которое мы обозначим G„(X) или, короче, G, зададим форму- лами G<?i = Хе1, Geg = тд —Хс^, Ge3 = е» -j- Хе3, Ge„ = ел-1 ^'еп- Матрица этого преобразования в базисе eit еп назы- вается п-мерной числу X: жордановой клеткой, соответствующей Gn (Х)= х 1 О X 1 X На главной диагонали жордановой клетки стоят X, на парал- лельной соседней сверху диагонали — единицы, остальные элементы — нули. Подпространства вида Ь(еь ..., ek), k<^n, являются инвариантными, в каждом из них преобразование задается жордановой клеткой Gft(X) размерности k. Очевидно, что преобразование О„(Х) вырождено тогда и только тогда, когда Х = 0. В этом случае e^ = G(L)= = L(ei, ..., е^Л), <sr=L(ei). Рассмотрим подробнее трехмерный случай при Х = 0. Преобразование Л = 03(0) задается формулой так что У1 0 1 0 X1 У1 _—: 0 0 1 X2 > У ООО X3 у* = X2, J2 = х3 У= 0. Каждая прямая, параллельная оси х1 и пересекающая пло- скость х1 = 0 в точке (0, а, V), переводится в точку с коор- динатами {а, Ь, 0), расположенную на плоскости Xя —0. Если оси х1, х\ Xя взаимно перпендикулярны, то можно
§ 6] СОБСТВЕННЫЕ ВЕКТОРЫ 249 считать, что сначала все пространство проектируется на пло- скость (х*, х'л), а затем эта плоскость накладывается на Рис. 34. плоскость (х1, х2) так, что положительная полуось х2 совме- щается с положительной полуосью х1, положительная полуось х3 совмещается с положительной полуосью х2 (рис. 34). § 6. Собственные векторы и характеристический многочлен преобразования 1. Определение. Собственным вектором данного линейного преобразования А называется всякий ненулевой вектор х, удовлетворяющий условию Ах=\х, (1) где X — какое-нибудь число. Число X называется собственным значением преобразо- вания А, соответствующим данному собственному вектору х. Для краткости говорят: «X — собственное значение дан- ного собственного вектора». Собственный вектор переходит в коллинеарный ему вектор. В действительном пространстве собственное значение показывает, во сколько раз собствен- ный вектор «вытягивается» (при | X | 1 фактически «сжи- мается»).
250 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII Нетрудно сообразить, что если х — собственный вектор, то ах — также собственный вектор при любом ат^О, и что линейная оболочка каждого собственного вектора представ- ляет собой инвариантное одномерное подпространство (инва- риантную прямую). 2. Во многих вопросах алгебры и ее приложений встре- чается необходимость найти все собственные векторы данного линейного преобразования. Займемся этой задачей. Рассмотрим линейное преобразование у = Ах. Рассмотрим вместе с ним тождественное преобразование Е. Мы имеем Ех = Е при любом х( L. Поэтому условие (1), при кото- ром х является собственным вектором данного преобразова- ния, можно записать в виде (А —ХЕ)х = 0. (2) Пусть преобразование у —Ах представлено в некотором базисе еь .... еп формулами ук = У Акх}\ k = 1, ..., п. (3) Так как единичная матрица Е = ||8*|1, то вследствие (3) соотношение (2) равносильно следующей системе однородных уравнений: £(А* — Х8)) х1 = 0, k = 1.. (4) где х1, ..., х"—координаты собственного вектора х в ба- зисе еь ..., еп, X—собственное значение вектора х. Определение. Матрица А — \Е системы (4) назы- вается характеристической матрицей данного преобразо- вания А, ее определитель p(X) = Det(A —ХЕ)= А| — X Аг ... А!. Al А1-Х ... А1 А" А“ ... А" —X называется характеристическим определителем преобразо- вания А. Очевидно, что jp(X) есть многочлен степени п относи- тельно X. Его называют характеристическим многочленом матрицы А (или преобразования А).
СОБСТВЕННЫЕ ВЕКТОРЫ 251 § С] Общий план решения задачи о собственных векторах сво- дится тегерь к следующему. Сначала составляется так назы- ваемое характеристическое уравнение р(Х) = О. (5) Равенство (5) необходимо и достаточно для того, чтобы система (4) имела нетривиальные решения. Поэтому в ком- плексном пространстве корни уравнения (5) и только они являются собственными значениями преобразования А. В дей- ствительном пространстве собственными значениями являются все действительные корни и только они. Допустим, что все корни Хъ ..., Х„ найдены. Предположим для определенности, что мы имеем дело с действительным пространством. Тогда, отбросив все комплексные корни, будем последовательно перебирать остальные. Каждый из них подставим в систему (4). Каждый раз эта система получит определенные числовые коэффициенты. Ранг полученной системы будет некоторым числом г, причем г<^л, так что система будет иметь п—г независи- мых решений. Найдя их, мы найдем тем самым п — г неза- висимых собственных векторов с одним и тем же собствен- ным значением, равным взятому корню. Их линейная обо- лочка, с исключением из нее нулевого вектора, дает все собственные векторы с тем же собственным значением. Это следует из теоремы о множестве решений линейной одно- родной системы уравнений. Перебрав таким способом все действительные корни ха- рактеристического уравнения, мы найдем вообще все соб- ственные векторы данного преобразования. В случае комплексного пространства нужно перебрать все корни Xi, ..., Х„. 3. Примеры. 1) Подобие представляет собой преобра- зование, для которого все ненулевые векторы являются соб- ственными с одним и тем же собственным значением, равным коэффициенту подобия. 2) Преобразование Ся(Хо) (см. выше § 5, п. 8) имеет только один линейно независимый собственный вектор. Дей- ствительно, для G„(X0) характеристический многочлен />(Х)== = (Хо — X)" имеет единственный корень Х = Х0 кратности п. При Х = Хо характеристическая матрица G„(X0)— Хв£ имеет ранг п—1 (ненулевой минор порядка п—1 получается
1252 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII вычеркиванием левого столбца и нижней строки). Поэтому си- стема вида (4), составленная для преобразования G,, (Хо), имеет при Х = >0 только одно линейно независимое решение. Из формул (3) § 5 видно, что собственным является вектор ег. 3) Преобразование двумерной действительной плоскости лл+2х2, ) У = — x’J-x2 J не имеет собственных векторов, так как П(Х) = Х‘-—2X-J-3 не имеет действительных корней. Предоставляем читателю найти собственные значения и собственные векторы в остальных примерах § 5. § 7. Основные теоремы о характеристическом многочлене и собственных векторах 1. Теорема 1. Ранг характеристической матрицы при фиксированном X есть инвариант относительно изме- нения базиса. Доказательство. Теорема является следствием общего предложения об инвариантности ранга матрицы линейного преобразования, поскольку характеристическая матрица есть матрица преобразования А — \Е. 2. Т е о р е м а 2. Характеристический многочлен р (X) инвариантен относительно преобразования базиса. Доказательство. Пусть А и А' — матрицы данного преобразования в базисах eh ..., е„ и е[, ..., е’п, Р — ма- трица перехода от первого базиса ко второму, Q = (P*)~I. Согласно § 2 имеем А' — ХЕ=А' — XE' — Q(A — X/:')QJ (1) (Е' — Е, так как тождественное преобразование в любом базисе имеет единичную матрицу). Из (1) находим Det (Д' — Х£) = Det Q Det (Д — XL) Det Q"1 = Det (Д — XL). Замечание. Запишем характеристический многочлен в виде р(Х) = (-1)«(Х«-Р1Х"-‘+^«-2- ... +(-1)>„]. Нетрудно проверить, что — след матрицы Д, рп = Det А. Из теоремы 2 вытекает инвариантность всех коэффициентов
§ 7] ТЕОРЕМЫ О ХАРАКТЕРИСТИЧЕСКОМ МНОГОЧЛЕНЕ 253 /ДХ), в частности pt и рп. Тем самым мы получили другое доказательство инвариантности определителя и следа матрицы преобразования. 3- Теорема 3. Если Ь = Ц@ Li и ненулевые инвариантные относительно А подпространства, то р(к)—р1(к)р^(к), где pi(E), р8(Х) — характеристические многочлены преобразований, индуцированных в Ц и Ь%. Доказательство. Пусть еь ek — базис в Lj, т* ь1, • • • > еп — базис в Т2. Согласно § 4 в базисе eif еп пространства L матрица А—\Е имеет вид <7ц—X д12 ... <21/; 7721 7782-----X - • • 72g* А-ЛЕ = <7*1 77*2 ... а**-----X 77*+1 *+1 — X . . . а*41 п О ......................... <7л *|-1 • • • 7Znn——X Отсюда Det (А — Х£) = 77ц— X <212 ... <21* 77'21 7728 — X . .. <ZS* 77*1 77*2 ••• 77**—X 77*-<-1 *+1 ------X ... <2*+1 п *4-1 • • • 77nrt X ==Р1(Х)-/72(Х). 4. Теорема 4. Если некоторому собственному значе- нию X отвечает т линейно независимых собственных век- торов, то их линейная оболочка L является т-мерным ин- вариантным подпространством, а индуцированное в L пре- образование есть подобие с коэффициентом X. Доказательство. Пусть eit ет — линейно неза- висимые собственные векторы, соответствующие числу X. Возьмем произвольный вектор х из L — L(е\,..., <?m), разло- жим его по базису elt ..., ет подпространства L и применим к нему данное преобразование А.
254 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII Получим Ах = A (xiei + ... -|-хтет) = х'Аег -|- ... -\-хтАет = = х1^ хтУет — Ух б; L, откуда и вытекает теорема 4. 5. В приложениях линейной алгебры очень важную роль играет вопрос об упрощении матрицы линейного преобразо- вания за счет выбора подходящего базиса. Теорема б. Матрица преобразования А диагональна тогда и только тогда, когда базис состоит из собствен- ных векторов. Доказательство. 1) Если базис elt еп состоит из собственных векторов преобразования Д то Aet = Xjgj, Aei — Х2<?2, (2) где Xj, Х2, ..., Xn—собственные значения (вообще говоря, различные). Коэффициенты правых частей равенств (2) обра- зуют матрицу А*, которая в данном случае совпадает с ма- трицей А: Преобразование у=Ах в ное представление этом базисе имеет координат- Ji = XjXj, у % Х2Хо, (4) Уп---
§ 8] НИЛЬПОТЕНТНЫЕ ПРЕОБРАЗОВАНИЯ 255 2) Пусть дано, что в некотором базисе ei, .... еп матри- ца А имеет диагональный вид О Апп Тогда Л* = А, Aet — Ае2 = -^2^2, Аеп = Апеп, а это значит, что все базисные векторы собственные, при- чем л/==Л-. Теорема доказана. Замечание. Преобразование (4) можно представить как произведение п сжатий; сначала производится сжатие с коэф- фициентом Xj к подпространству L (е2, ..., еп) в направлении L(<?i), затем сжатие с коэффициентом Х2 к подпространству L(ci, <?3, • ••> в направлении Ь(е2) и г. д. Нетрудно про- верить, что сжатия можно проводить в любом порядке. (При фактически получаются «растяжения».) 6. Примеры п. 3 предыдущего параграфа показывают, что базиса из собственных векторов может не быть, а тогда матрицу преобразования нельзя привести к диагональному виду. Вопрос о том, как в таком случае можно упростить матрицу преобразования, рассматривается ниже, в §§ 9, 10. § 8. Нильпотентные преобразования. Общая структура вырожденных преобразований 1. В этом параграфе рассматриваются вырожденные ли- нейные преобразования в n-мерном пространстве L, действи- тельном или комплексном — безразлично. 2. Определение. Преобразование В называется ниль- потентным, если Вр = 0 для какой-либо положительной степени р. Иначе говоря, Врх = ® для любого х £ L. (1)
256 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII Наименьшее (натуральное) число р, для которого соблю- дается (1), называется высотой нильпотентного преобразо- вания. Замечание. Если Врх — 0 для некоторого числа р и некоторого вектора х С L, то для этого вектора х и лю- бого (целого) т^>р имеем Втх = Вт~р (Врх) = ВтрЬ = 0. Простейшим примером нильпотентного преобразования может служить нулевое преобразование 0; его высота равна единице. Всякое нильпотентное преобразование вырождено. Это ясно: если BP = Q, то Det (Вр) — (Det Bf = 0; значит, DetB = 0. Однако нильпотентные преобразования — это не просто частный случай вырожденных преобразований; они являются основным элементом в структуре любого вырожденного пре- образования. Именно, справедлива Теорема. Пусть В — вырожденное линейное преобра- зование пространства L. Тогда L = L1®Lil (2) где Lt, Li — инвариантные подпространства, причем: 1) преобразование, индуцированное в Lb ниль патентно; 2) если подпространство Li не нулевое, то индуциро- ванное в нем преобразование невырождено. Короче, можно сказать, что В нильпотентно в Lt и не- вырождено в Li. В частности, преобразование В нильпо- тентно в пространстве L, если размерность равна п (Li=L), а размерность /.2 равна нулю (La —0) и только в этом случае. Доказательство см. ниже, п. 4; оно опирается на вспомо- гательные предложения, изложенные в п. 3. 3. Рассмотрим последовательные степени данного выро- жденного преобразования В: В, В\ В\ ..., Вк, ... Обозначим через ядро преобразования Вк, через — образ всего пространства L при преобразовании Вк. Пусть — размерность Согласно п. 1 § 3 г* = Rang (В*).
§ 8] НИЛЬПОТЕНТНЫЕ ПРЕОБРАЗОВАНИЯ 257 Исследуем свойства последовательностей подпространств <Жк и (А=1, 2, ...). 1) <Мк при любом k является инвариантным подпро- странством для преобразования В. Доказательство. Если х С то существует у £ L такой, что Bky = x. Отсюда находим Вх = В (Вку) = ВкЛЛу = Вь (By) £ <Жк. 2) Имеют место следующие включения'. J. I 0^*1 > 0^*2 >... > о/К*к > 6^/гц-1 * • • (3) В самом деле, включения (3) следуют из предыдущего свойства, так как = В (^к) cz <^к. 3) Справедливы соотношения n'>ri'^>...'^>rp^rp = rp^ = ...=rk^=..., (4) где р — некоторое натуральное число. Вместе с тем <Жь = <Жр при k>p. В инвариантном подпространстве <Мр индуцируется не- вырожденное преобразование. Доказательство. Из (3) видно, что гу- 5= гу+1. Вслед- ствие вырожденности В имеем 1\<^п. Ранги гу- неотрица- тельны, поэтому строгих неравенств в последовательности (4) может быть лишь конечное число. Пусть р — наименьшее натуральное число, для которого соблюдается равенство = (5) Если гр = 0, то, очевидно, rk — Гр — 0, о^к=оУ%р = 6 при k"y>p. Пусть гр5=1. Тогда из (5) и (3) следует, что В индуцирует в подпространстве е^р невырожденное преобра- зование, ТО есть e/Zp+1=B(e^p)=e/Zp, ОТКуда е^р+2 = — B(e^p+i) — B (ы^р) — Ы^р. Аналогично е^р + 9 — е^р, ... ..., <Мк~<Мр при любом k^>p. Вместе с тем гк — гр при k^>p. Третье свойство доказано полностью. 4) Имеют место следующие включения: CL 2 CZ . .. CZ к CZ ft+i CZ . .. (6) При этом &И к—<е,Ир, если k>p, (7) где р — наименьшее число, удовлетворяющее условию (5).
258 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII Доказательство. Включения (6) очевидны. В самом 'деле, если х £ то Вкх — 0 и Вк^х — В (Вкх) = 6, так что х £ ©4"ft+i. По теореме 2 § 3 размерность nk подпространства ©Г’’* равна п — rk. До тех пор, пока ранги rk строго убывают с ростом k, размерности строго возрастают. Для kp^p все ранги rk одинаковы; вместе с тем одинаковы и размер- ности пр, прль пь, ... Отсюда и из (6) следует (7). 5) k при любом k является инвариантным подпро- странством преобразования В. Преобразование, индуциро- ванное в k, нильпотентно. Доказательство. Инвариантность при /г=1 следует из соотношений а при Л}>1—- из включений (6), поскольку Вk. Ниль- потентность преобразования, индуцированного в оче- видна, так как Вк{^И*)=6. 4. Доказательство теоремы п. 2. Покажем, что Ь = ^Гр®^р, (8) если р удовлетворяет условию (5). Поскольку В нильпотентно в и невырождено в <^р, то гем самым будет получено искомое разложение (2) (/:, = Wz’p, L2 = &$p). Мы знаем, что сумма размерностей и е//р равна п, поэтому для полу- чения формулы (8) достаточно проверить, что ®^Р П = (9) (см. в связи с этим § 14 гл. I). Равенство (9) докажем от противного. Пусть х ф 6, х £ ©-^°р [~| <Мр. Рассмотрим векторы х, Вх, ..., Врх — ^. (10) Все они принадлежат <Мр (вследствие инвариантности <^р). Обозначим через у последний из векторов системы (10), отличный от 6 (у = Вкх, где k — некоторое число, 0 k <^р). Тогда будем иметь у yt 0, By — 6, у £ e/Zp. (11) Но (И) противоречит невырожденности преобразования В в подпространстве <^р. Тем самым (9) установлено, и тео- рема доказана.
§ 9] КАНОНИЧЕСКИЙ БАЗИС 259 5. 3 а м е ч а н и я. 1) Из п. 3 видно, что высота нильпо- тентного преобразования, индуцированного в подпростран- стве равна р (здесь, как и выше, р — наименьшее из чисел, удовлетворяющих условию (5); при k<^p с ростом k происходит расширение подпространств k и сужение под- пространств при k^p подпространства &Е’k и уже не изменяются). Таким образом, подпространство ©А’р может быть.найдено как ядро преобразования Вк при любом k^p. Аналогично <^p==B*(L) при k^p. 2) Нетрудно заметить также, что при k<^p пересечения Q e^k содержат ненулевые векторы, поэтому суммы ® не являются прямыми и не исчерпывают всего пространства L. § 9. Канонический базис нильпотентного преобразования 1. Рассмотрим еще некоторые вопросы, связанные с ниль- потентными преобразованиями. Сначала введем терминологию, важную для дальнейшего. Будем говорить, что векторы cj, а2, ..., ak образуют серию длиной k относительно преобразования В (не обя- зательно нильпотентного), если эти векторы не нулевые, и если Bai = ait Bai — as, ..., Ва1гЛ~ ak, Bak = 8. (1) Вектор Ci будем называть старшим или первым, вектор aft— младшим или последним вектором серии (1). Если о О, Ba = f>, то будем говорить, что а образует серию, состоящую из одного вектора, и является в ней одновре- менно старшим и младшим. Базис пространства L будем называть каноническим от- носительно преобразования В, если он состоит из одной серии или из нескольких серий, не имеющих друг с другом общих векторов. 2. Отметим следующие свойства нильпотентных преобра- зований: 1) Если в пространстве L имеется серия относи- тельно нильпотентного преобразования В, содержащая k векторов, то высота этого преобразования pysk.
260 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII В самом деле, в серии вида (1) Вк лах = ak ф 6, откуда p^>k — 1. 2) Если высота нильпотентного преобразования В равна р, то существует серия относительно В длиной р и нет более длинных серий. Доказательство. По определению высоты в про- странстве существует вектор х такой, что Вр~1хфВ. Тогда векторы х, Вх, В*х, ..., Врхх образуют серию длиной р, так как среди них нет нулевых (в противном случае Вр~Гх был бы нулевым) и B(Bp ix) — = Врх = В. Более длинной серии в пространстве быть не может по предыдущему свойству. 3) Всякая серия линейно независима. Доказательство. Напишем для (произвольной) серии (1) соотношение \ai (*) Подействуем на обе части этого равенства оператором В* *. Мы получим X1cft = 0, так как B^ai =?ak, B^aj—B при i^>l. Поскольку ak ф 0, находим Х1==0. Теперь, действуя на (*) оператором Bk~\ найдем — 0. Продолжая процесс, получим, что все числа Xft = 0. Утверждение доказано. Следствие. Если п—размерность пространства L, р — высота нильпотентного преобразования в L, то р^п. 4) Если в пространстве L для некоторого преобразо- вания В существует канонический базис, то преобразова- ние В нильпотентно и его высота равна числу векторов в самой длинной серии этого базиса. Доказательство. Пусть elt ..., еп — канонический базис, и пусть в самую длинную из его серий входит k век- торов. Тогда для каждого базисного вектора имеем: Bkej — B. Возьмем произвольный вектор х £ L, разложим его по ба- зису еь ..., еп и применим к нему преобразование В,{: Вкх = Вк (л-1 а +... + Хпеп) = х1 В "а +... + хпВкеп = 0.
§ 9] КАНОНИЧЕСКИЙ БАЗИС 261 Это значит, что преобразование В нильпотентно и его вы- сота p^k. С другой стороны, по свойству 1) имеем p^k. Следовательно, p—k. 3. Примеры. 1) Для нулевого преобразования 0 любой вектор образует серию длиной А=1, поэтому любой базис пространства L является каноническим относительно 0. Не- трудно заметить, что если преобразование В имеет высоту р=1, то оно является нулевым (В = 0). 2) Рассмотрим преобразование Gn(0) (см. п. 8 § 5 при Х = 0). По определению преобразования G„(0) существует базис Ci, ..., еп, состоящий из одной серии: Gn(0)еп = еп_л....Оп(0)е^ = еь Gn(0)e1 = 6. Отюда и из свойства 4) в п. 2 следует, что преобразование G„(0) нильпотентно и его высота р = п. Отметим, что матрица этого преобразования в заданном базисе eit ..., еп — вырожденная «-мерная жорданова клетка О 1 О 3) Пусть в базисе е1....... еп некоторое преобразова- ние В задается матрицей, в которой вдоль главной диагонали располагается несколько вырожденных жордановых клеток разных размерностей, а остальные элементы — нули. Эту матрицу символически запишем так: (2) Не ограничивая общности, можно считать, что /ci 2г 2г... так как изменением нумерации базисных векторов можно добиться перестановки клеток, идущих вдоль диаго- нали матрицы В.
262 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) (ГЛ. VII Для наглядности выпишем полностью матрицу вида (2) с тремя клетками размерностей = 4, k.2 = 3 и k3 = 1: О4(0) О G3(0) О G,(0) 0 10 0 0 0 0 0 0 0 10 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 I 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 о| (2а) Одномерная клетка Gt(O) состоит из одного числа нуль. В пределах каждой из клеток Gfc(0) размерности k >=2 над главной диагональю расположена диагональ из единиц. Между двумя соседними клетками эти единицы разделены нулем. Таким образом, одна диагональ матрицы (2а), как и вообще любой матрицы вида (2), состоит из единиц, прерываемых нулями. Эта диагональ расположена непосредственно над главной диагональю матрицы. Все остальные элементы ма- трицы — нули. Вследствие (2) базис еь ..., еп канонический; он состоит из Z попарно непересекающихся серий, длина наибольшей из них kb Отсюда следует, что В — нильпотентное преобразо- вание с высотой p = ki. Линейная оболочка каждой серии, входящей в базис, является инвариантным подпространством. Этот пример включает в себя два предыдущих как част- ные случаи. Если ki=\, то все клетки одномерные, каждая из них состоит из одного числа нуль, вся матрица нулевая, и преобразование В нулевое. Если Z= 1, то матрица В со- стоит из одной клетки: E? = G„(O). Нетрудно видеть, что и обратно, если для преобразова- ния В существует канонический базис и попарно непересе- кающиеся серии базиса расположены одна за другой, то матрица преобразования В в таком базисе имеет вид (2). Каждой серии соответствует клетка ОЛн(0), размерность кото- рой ka равна числу векторов в серии.
§ 9] КАНОНИЧЕСКИЙ БАЗИС 263 4. Последний из рассмотренных выше примеров охваты- вает всевозможные нильпотентные преобразования. Это сле- дует из основной теоремы (теоремы 1), которую мы чуть дальше сформулируем и докажем. 5. Лемма. Пусть дана система векторов, которая представляет собой объединение нескольких серий. Тогда, если последние векторы всех этих серий составляют ли- нейно независимую систему, то и вся данная система векторов линейно независима. Доказательство удобнее провести после основной теоремы. Теорема 1. Для каждого нильпотентного преобра- зования существует канонический базис (далеко не един- ственный). Доказательство теоремы мы проведем кон- структивно, т. е. фактически покажем, как построить канонический базис. Пусть В — нильпотентное преобразова- ние высоты р в /2-мерном пространстве L. Рассмотрим уже знакомую нам последовательность вклю- чений 1 CZeB'2 CZ. ..CZeB' k CZ fc+1 CZ... CZ = L, где ©T^k — ядро преобразования Bk. Построим следующие подпространства: cTs = B^), ^3 = В^(^П3), ..., Мы имеем В(Д'Г)) = 0. Следовательно, все е2Г2, Д^'3,..., р принадлежат (<ДГi cz ©ВД. С другой сторо.ны, ^';+1 = В1 (©Г/+1) = В‘~1 В (©гГ/+1) cz В1-1 (®гГг) = (так как B(<a4'"ij^)cz&4/'i). Таким образом, еТр CZ еТр_! CZ... CZ ©ЙД CZ ©<Гj. Пусть kj — размерность eft'п, — размерность Выберем в базис, векторы которого обозначим £>Р рР • рР—\ рр-- 1- *’ V S+*’ * л-/ • • *> •••> ent. (3) Точка с запятой разделяет две группы векторов, каждая из которых имеет некоторый специальный характер; эти группы помечены верхним индексом.
1264 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII Выбор базиса (3) производится при следующих условиях. В качестве первой группы, т. е. еР, берется любой базис в e%zp; в качестве второй группы, т. е. е?-1, берется любое дополнение еР до базиса е/Гр_, и т. д. Поскольку еР £ о/ь= Врл (<s^р), то все эти векторы имеют прообразы относительно Вр \ Возьмем для вектора ер какой-нибудь прообраз е1.. Имеем еР=Вр 1 (е!). Вместе с тем мы получаем для каждого i (i—1, ..., Z.’p) серию длины р: е\, ej — В (<?/), ..., еР = Вр 1 (el); Вр(е})=0. Аналогично при kp i кр_л векторы еР~1 имеют про- образы е) относительно ВР~\ поскольку при этих значе- ниях I будет еРл g e/fP~l = Вр~* (©^z=p_i). Соответственно для каждого I kp^i) получается серия длины р—1: с/, \el = В (el), ..., еР~' = Вр‘2 (еЦ; Bpi (el) = 6. Продолжая про- цесс, мы получим систему векторов, которую запишем сокра- щенно по следующей схеме: 0) Здесь в каждой строке из каждой группы выписан только последний представитель; например, в первой строке из группы ер, .... еР записан только . h- 1 kp kp В схеме (4) некоторые группы могут не существовать. Например, если с-%р совпадает с e%"p_i, то вторую группу в схеме (4) следует вычеркнуть. Заметим еще для пояснения, что если, например, = 3 (/с2 =/г:(), то во второй строке схемы (4) выпадает группа ер., и следующая строка имеет ту же длину. В схеме (4) серии расположены по столбцам и
§ 9] КАНОНИЧЕСКИЙ БАЗИС 265 идут снизу вверх. Нижний индекс можно рассматривать как номер серии, верхний индекс дает номер вектора внутри серии. Таким образом, в верхней строке расположены по- следние векторы серий. Они образуют базис в и, следо- вательно, линейно независимы; отсюда и по лемме заклю- чаем, что независимы все векторы системы (4). Докажем, что общее число I их равно п, т. е. размерности L. Очевидно, Z— tii -J- k% -|- k3 -j-... -|- kp (5) (напомним, что в схеме (4) каждый написанный столбец на самом деле представляет собой символическое обозначение нескольких столбцов). Пусть — ранг преобразования Вк на подпространстве ©Т"fc+i (которое является инвариантным отно- сительно Вк, так как Вк (©^*+1) = k+i cz *+0- Учитывая, что k — ядро Вк в подпространстве имеем: И1=«2 — Рь ^2 Pb «2 = Пз Ра, Л3=Рй ир-1 — пр Рр-р ^р — Рр-р ир = и. Отсюда п — «j -|~ pi 4-... -J- 4“ Pp-i = nt 4~ ^1, 4~ ... kp. Следовательно, 1=п, и тео- рема доказана. На рис. 35 дана иллю- страция схемы (4) в случае, когда и = 4, Р = 3, «1 — 2, Рис. 35. а пространства е/Г2 и е/Г3, будучи одномерными, совпадают. Замечание. Если доказывать только факт сущест- вования канонического базиса, то можно ограничиться более краткими рассуждениями, воспользовавшись индукцией по высоте преобразования. Именно, пусть в пространстве L задано нильпотентное преобразование В некоторой высоты />4~ 1 =Э=2. Тогда в подпространстве <^i = B(L) преобразова- ние В имеет высоту р. Пусть в канонический базис найден (если р— 1, то любой базис в <Mi является канони- ческим). Начальные векторы серий этого базиса дополним прообразами относительно В, удлинив тем самым каждую
266 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII из серий на один вектор. Затем совокупность последних векторов серий дополним до базиса в подпространстве ©•/'Y В результате получим систему векторов в числе rt-j-Hi — n (Г1 = Rang В = размерности с<,), независимую в силу леммы и потому образующую базис в L, очевидно, канонический. 6. Вернемся к доказательству леммы. Мы всегда можем считать, что данная система векторов записана по схеме (4). Составим произвольную линейную комбинацию всех векторов этой системы и приравняем ее нулевому вектору. В подроб- ной записи мы получим следующее равенство, в левой части которого все суммы берутся только по нижнему индексу: У, «и* Ч- У af ~ 'ei ”1+• • •+S +2 чч + *p >!рЛ П> +S °* - -1 + S <*f - -2+• • •+S a«! e'i+• • • ftp kpl ki кр kp~i +У’а^!=е; (6) *p здесь —-некоторые числа (коэффициенты линейной ком- бинации). Расположение написанных сумм соответствует схеме (4). Под знаком каждой суммы указано число, до которого идет суммирование по i, причем начинается сумми- рование после числа, написанного под знаком предыдущей суммы той же строки (в первых суммах каждой строки суммирование начинается от единицы). Если в схеме (4) какая-нибудь группа столбцов отсутст- вует, то в соответствующем столбце соотношения (6) будем считать множители а? равными нулю. Подействуем па обе части равенства (6) оператором Вр *. Мы получим из последней строки или = 6 (7) kp
§ 9] КАНОНИЧЕСКИЙ БАЗИС 267 (все остальные члены суммы (3) при воздействии на них оператором Вр~1 дадут в результате 6). Если последние векторы всех серий образуют независимую систему, то и часть еР, ..., еР этой системы независима. Тогда из (7) имеем а! = О, ..., а* =0. Теперь вычеркнем в соотношении (6) нижнюю строку. На оставшуюся часть подействуем оператором Вр~“. Аналогично предыдущему получим, что числа а,5, а/, которые участвуют во второй снизу строке, все равны нулю. Продолжая процесс, установим, что вообще все а? = 0. Лемма доказана. 7. Пусть В — нильпотентное преобразование с высотой р. Обозначим через lj число серий длины j в некотором каноническом базисе преобразования В. Теорема 2. Для каждого j (j -С р) число lj является инвариантом относительно перехода к другому канони- ческому базису преобразования В. Доказательство. Для базиса, который построен в доказательстве предыдущей теоремы, имеем по построению lp = kp, lj = kj—kB" l\=ni — k.. Рассмотрим совершенно произвольный канонический базис. Заметим, что последние векторы всех его серий должны попасть в Обозначим общее число этих векторов через п\, число попавших в е?Гр через k'p, число попавших в е%р i через к'р\ и т. д. Имеем kp ' kp, kр _ \ kp \, ..., ni Пу (8) так как в каждом случае число независимых векторов не больше размерности содержащего их пространства. Пусть п' — число всех векторов рассматриваемого произвольного базиса. Тогда согласно доказательству предыдущей теоремы (см. равенство (5)) tf=n{-\-k^-\-...-\-kp, । , , , , (8а) п — «1 «2 Д-... Д- kp. Так как ri = n, то из (8) и (8а) находим п\ — пъ k'j=kj. Но 1р — kp, lj — kj kj^\, 2 - j <Др, l\ — щ k.,. Следовательно, l'j = lj при любом j. Теорема доказана.
268 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ VII Замечание. Сущность доказательства предыдущей тео- ремы можно высказать в двух словах следующим образом: размерности kj и щ подпространств е#'у и инвариантны по самому определению этих подпространств; но для любого канонического базиса все lk выражаются через kj и П\. Следовательно, инвариантны и все 1^. 8» Нетрудно выразить lk через ранги преобразований В' на данном пространстве L. Обозначим ранг В’ на L через г у. По предыдущему имеем nj = nj+i Рг Вместе с тем Яу = И—Гу, Иу+1—« —Гу+1. Из написанных равенств получаем Ру=Гу—Гу+1. Таким образом, при 2^/<^р lj — kj — — — Pj = r pt — 2Гу4* г /+! (9) Кроме того, А = ч — 2г, г8, Zp = грЛ. (9а) Замечание. Каждой серии канонического базиса отве- чает жорданона клетка в матрице (2). Поэтому формула (9) выражает количество lk жордановых клеток размерности k в матрице (2) для всех значений k (1 k и). Заметим еще, что, полагая г0 — п (как ранг Вп = Е) и г* —0 при k>-p (поскольку при имеем £?* = ©), мы можем вместо (9) и (9а) пользоваться только формулой (9): lk = rk_i — 2г*4-г*+1; (9) здесь можно брать любое 1. 9. Отметим очевидный факт, используемый в дальнейшем. Преобразование В вырождено тогда и только тогда, когда оно имеет собственное значение, равное нулю. 10. Теор е м а 3. Для того чтобы линейное преобразо- вание В в п-мерном пространстве L было нильпотентным, необходимо и достаточно, чтобы его характеристический многочлен имел вид р(к) — (—Х)л,
§ 9] канонический базис 269 Доказательство. Необходимость вытекает из тео- ремы 1, так как в случае нильпотентного преобразования В характеристическая матрица В — к£ в каноническом базисе имеет на диагонали элементы (—к), а ниже диагонали нули, и потому р (к) = Det {В — к£) = (—- к)п. Достаточность сейчас доказывать не будем, так как она вытекает из следующей, более общей теоремы. 11. Пусть В — вырожденное преобразование; пусть p(k) = (—l)"kmi(k —ка)"12 ... (к —ку)т/ (10) — его характеристический многочлен. Корни к2, ..., к?- (вообще говоря, комплексные) все разные. Согласно теореме § 8 имеем L = Li (J) 1-2, (И) причем В нильпотентно на Lj, невырождено на Т2 (Ц и инвариантны относительно В). Теорема 4. Размерность Li равна кратности mi нулевого корня многочлена р(к). На подпространстве преобразование В имеет характеристический многочлен (к) = (— 1)« - "Ч (к — к.)"1* ... (к — ку)"»/. Доказательство. По теореме S § 7 имеем соот- ветственно (И) Р(^=Р^)рг(У). (12) Пусть «1 — размерность Li. По теореме 3 (по ее уже дока- занной части) pi(k) = (—1У«к«*. (13) Сравнивая (10), (12) и (13), находим: щ^т^ С другой стороны, если tii<^mi, то ра(к) должен иметь нулевой корень кратности mi — nt'y>0. Однако это невозможно, поскольку преобразование В на /2 невырождено. Таким образом, щ = т\. Отсюда, а также из (10), (12) и (13) следует и второе утверждение теоремы. Замечание 1. Ясно, что достаточность в теореме 3 является частным случаем теоремы 4 при nii = n. Замечание 2. Обозначим через р высоту преобразова- ния В в Li. Имеем: р -С поскольку высота преобразования
270 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ПРОСТРАНСТВ) [ГЛ. VII не превышает размерности пространства. С другой стороны, мы знаем, что Li может быть определено как ядро преобра- зования В,! при любом k~^p. Поэтому, если кратность тл нулевого собственного значения известна, то мы можем найти Lj как ядро преобразования Вт^ не вычисляя р. § 10. Приведение матрицы преобразования к жордановой нормальной форме 1. Определение. Говорят, что матрица А имеет жор- данову нормальную форму, если вдоль ее главной диагонали расположены жордановы клетки, а остальные элементы — нули: (М 0 • О) о Не исключена возможность, что в матрице (1) ki — kj или 'ki — lj для некоторых номеро