Автор: Халмош П.  

Теги: математика  

Год: 1963

Текст
                    П. ХАЛМОШ
КОНЕЧНОМЕРНЫЕ
ВЕКТОРНЫЕ
ПРОСТРАНСТВА
ПЕРЕВОД С АНГЛИЙСКОГО
Д. Ф. БОРИСОВОЙ и Д. А. РАЙКОВА
ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1963

517.1 Х17 FINITE-DIMENSIONAL VECTOR SPACES by PAUL R. HALMOS Professor of Mathematics The University oj Chicago SECOND EDITION D. VAN NOSTRAND COMPANY, INC. PRINCETON, NEW JERSEY. TORONTO LONDON NEW YORK
ОГЛАВЛЕНИЕ Предисловие ............................................. 6 Глава I. Пространства.................................... 9 § 1. Поля........................................... 9 § 2. Векторные пространства........................ 11 § 3. Примеры....................................... 12 § 4. Замечания .................................... 14 § 5. Линейная зависимость.......................... 16 § 6. Линейные комбинации........................... 19 § 7. Базисы ....................................... 20 § 8. Размерность................................... 24 § 9. Изоморфизм.................................... 26 § 10. Подпространства............................... 28 § 11. Действия над подпространствами ............... 30 § 12. Размерность подпространства................... 31 § 13. Сопряженные пространства ..................... 33 § 14. Скобки........................................ 34 § 15. Сопряженные базисы .......................... 37 § 16. Рефлексивность................................ 39 § 17. Аннуляторы ................................... 41 § 18. Прямые суммы ................................. 44 § 19. Размерность прямой суммы...................... 46 § 20. Сопряженное к прямой сумме.................... 47 § 21. Факторпространства............................ 49 § 22. Размерность факторпространства................ 51 § 23. Билинейные формы.............................. 53 § 24. Тензорные произведения ....................... 57 § 25. Произведение базисов ......................... 59 § 26. Перестановки.................................. 62 § 27. Циклы......................................... 65 § 28. Четность . ................................... 67 § 29. Полилинейные формы ........................... 70 § 30. Знакопеременные формы ........................ 72 § 31. Знакопеременные формы максимальной степени . . 75 Глава II. Операторы..................................... 78 § 32. Линейные операторы ........................... 78 § 33. Линейные операторы как векторы................ 80
4 ОГЛАВЛЕНИЕ § 34. Произведения.................................. 82 § 35. Полиномы...................................... 83 § 36. Обратимость................................... 86 § 37. Матрицы ...................................... 90 § 38. Матрицы операторов ........................... 93 § 39. Инвариантность................................ 98 § 40. Приводимость.................................. 99 § 41. Проекторы.................................... 101 § 42. ' Комбинации проекторов ..................... 102 § 43. Проекторы и инвариантность .................. 105 § 44. Сопряженный оператор......................... 107 § 45. Сопряженные проекторы ....................... 109 § 46. Изменение базиса............................. 112 § 47. Подобие ..................................... 114 § 48. Фактороператоры.............................. 119 § 49. Область значений и нуль-пространство......... 120 § 50. Ранг и дефект ............................... 122 § 51. Операторы ранга один ........................ 125 § 52. Тензорные произведения операторов ........... 128 § 53. Определители ................................ 132 § 54. Собственные значения ........................ 137 § 55. Кратность ................................... 139 § 56. Треугольный вид..................’............ 143 - § 57. Нильпотентность.............................. 146 § 58. Жорданова форма ............................. 151 Глава III. Ортогональность............................. 158 § 59. Скалярные произведения ...................... 158 § 60. Комплексные скалярные произведения........... 160 § 61. Пространства со скалярным произведением . . . 162 § 62. .Ортогональность ............................ 163 § 63. Полнота..................................... 166 § 64. Неравенство Шварца .......................... 168 § 65. Полные ортонормальные множества............... 170 • § 66. Теорема об ортогональном разложении.......... 173 § 67. Линейные функционалы .................; . . 174 § 68. Круглые скобки против квадратных............. 176 § 69. Естественные изоморфизмы .................... 178 § 70. Самосопряженные операторы ................... 181 § 71. Поляризация.................................. 185 § 72. Положительные операторы...................... 187 § 73. Изометрии ................................... 190 § 74. Изменение ортогонального базиса ............. 192 § 75. Перпендикулярные проекторы................... 195 § 76. Комбинации перпендикулярных проекторов . . . 198 § 77. Комплексификация ............................ 201 § 78. Характеризация спектра ...................... 205 § 79. Спектральная теорема ........................ 208 § 80. Нормальные операторы......................... 213 § 81. Ортогональные операторы...................... 218 § 82. Функции от операторов ....................... 221
ОГЛАВЛЕНИЕ 5 § 83. Полярное разложение........................ 227 § 84. Перестановочность ......................... 229 § 85. Самосопряженные операторы ранга один .... 231 Глава IV. Анализ ................................. 234 § 86. Сходимость векторов........................ 234 § 87. Норма ..................................... 235 § 88. Выражения для нормы ....................... 238 § 89. Нормы самосопряженных операторов........... 240 § 90. Принцип минимакса.......................... 241 § 91. Сходимость линейных операторов ............ 243 § 92. Эргодическая теорема....................... 246 § 93. Степенные ряды............................. 247 Приложение. Гильбертово пространство ................ 251 Рекомендуемая литература ............................ 257 Предметный указатель ................................ 259 Указатель обозначений.................................263
ПРЕДИСЛОВИЕ Цель, поставленная мною в этой книге,— изучить линейные операторы на конечномерных векторных про- странствах методами более общих теорий. Идея заключает- ся в выдвижении на первый план простых геометрических понятий, общих для многих разделов математики и ее применений, притом на языке, выдающем профессиональ- ные секреты и показывающем читателю действительный ход мыслей тех, кто доказывает теоремы об интегральных уравнениях и гильбертовых пространствах. Однако мое, субъективное освещение вопроса отнюдь не должно раз- деляться читателем. Если не считать редких ссылок на курс математики для высшей школы, книга представляет собой самостоятельное целое и может быть прочитана любым, кто стремится глубже ознакомиться с линейными проблемами, обычно рассматриваемыми в курсах теории матриц или «высшей» алгебры. Алгебраические бескоор- динатные методы не теряют силы и изящества при ограни- чении конечномерным случаем и, на мой взгляд, столь же элементарны, как классический координатный метод. Первоначально я намеревался включать в эту книгу теорему в том и только в том случае, когда уже существует ее бесконечномерное обобщение. Однако соблазнительная легкость некоторых существенно конечномерных понятий и результатов оказалась неотразимой, так что конечный результат носит лишь едва заметный отпечаток моих первоначальных намерений. Наиболее ясно он прояв- ляется в том, что упор делается всюду на обобщаемые методы, а не на получение возможно более сильных резуль- татов. Читатель сможет кое-где усмотреть очевидные способы сокращения предложенных мною доказательств. Но в таких случаях все шансы за то, что бесконечномер-
ПРЕДИСЛОВИЕ 7 ный аналог более короткого доказательства либо значи- тельно длиннее, либо вообще не существует. Первоначальный вариант этой книги (впервые опуб- ликованной издательством Princeton University Press в 1942 г. в качестве седьмого выпуска серии Annals of Mathematics Studies) находился в обращении в течение нескольких лет. Помимо некоторых незначительных изме- нений в стиле изложения и порядке расположения мате- риала, различие между первоначальным и настоящим текстом заключается в том, что последний содержит сле- дующий новый материал: 1) краткое рассмотрение полей, причем при изучении векторных пространств со скалярным произведением особое внимание уделяется веществен- ному случаю; 2) определение определителей в инвариант- ных терминах с помощью теории полилинейных форм; 3) упражнения. Упражнения (их более трехсот) составляют наиболее важное дополнение; надеюсь, что их найдут полезными как студенты, так и преподаватели. При этом читатель должен знать о них две вещи. Во-первых, если упражне- ние дается не в повелительной («Доказать, что...») и не в вопросительной («Верно ли, что...?»), а просто в декла- ративной форме, то его следует рассматривать как призыв к исследованию. В таких случаях читателю предлагается установить, верно ли утверждение или ложно, доказать его, если оно верно, или построить контрпример, если оно ложно, и, что важнее всего, рассмотреть такие изме- нения условия и заключения, которые бы истинные утверждения превращали в ложные, а ложные — в ис- тинные. Во-вторых, упражнения, какова бы ни была их грамматическая форма, не всегда помещены там, где само их местоположение служило бы указанием для решения. Часто упражнения приводятся сразу после того, как утверждение приобретает смысл, и значительно раньше, чем развит механизм для их быстрого решения. Можно ожидать, что читатель, пытающийся (даже безуспешно) решить подобную «несвоевременную» задачу, сможет бла- годаря такой попытке лучше оценить и понять последую- щее.' Имея в виду возможные будущие издания этой книги, я прошу читателей сообщить мне об ошибках в уп- ражнениях и предложить свои исправления и добавления.
8 ПРЕДИСЛОВИЕ (Разумеется, то же относится и к основному тексту книги.) Ни одна из теорем и почти ни одно из упражнений не являются моим открытием; большая часть их известна большинству работающих математиков, и притом уже давно. Хотя я и не привожу подробного списка источни- ков, тем не менее вполне сознаю, что очень многим обязан книгам и работам, по которым я учился, а также друзьям и всем тем, кто до и после опубликования первого варианта поддержал меня своим одобрением и высказал много ценных критических замечаний. Особенно признателен я Дж. Л. Дубу и Арлен Броуну, прочитавшим всю руко- пись в ее первом и втором вариантах и давшим мне много полезных советов, и Дж. фон Нейману, бывшему одним из творцов современных идей и методов, которые я пы- тался здесь изложить, и чье преподавание вдохновило меня на написание этой книги.
ГЛАВА I ПРОСТРАНСТВА § 1. Поля В дальнейшем нам придется пользоваться различными числовыми классами (как, например, классы всех веще- ственных или комплексных чисел). Чтобы не связывать себя на этой ранней стадии каким-либо конкретным клас- сом, мы воспользуемся приемом наименования чисел скалярами. Читатель не потеряет ничего существенного, понимая истоду под скалярами вещественные или комп- лексные числа; в разбираемых далее примерах встретятся оба класса. Для точности (а также чтобы действовать на должном уровне общности) перечислим все нужные нам в дальнейшем общие факты о скалярах. А. Каждой паре скаляров а, (3 отвечает скаляр а + р, называемый суммой аир, причем 1) сложение коммутативно, а+ р — Р + а, 2) сложение ассоциативно, а+(р + Y) = (а + Р) + У’ 3) существует однозначно определенный скаляр О (называемый нулем) такой, что a-j- О = а для каждого скаляра а, 4) каждому скаляру а отвечает однозначно определен- ный скаляр —а такой, что a+( —а) = 0. В. Каждой паре скаляров a, Р отвечает скаляр ар, называемый произведением аир, причем. 1) умножение коммутативно, аР = Ра, 2) умножение ассоциативно, а(Ру) = (ар)у, 3)' существует однозначно определенный ненулевой скаляр 1 (называемый единицей) такой, что al = а для каждого скаляра а,
10 ПРОСТРАНСТВА [ГЛ. I 4) каждому ненулевому скаляру а отвечает однозначно определенный скаляр а"1 (^или такой, что аа-1 = 1. С. Умножение дистрибутивно относительно сложения, а (Р + Y) = а₽ + ау. Если сложение и умножение определены в некотором множестве объектов (скаляров) так, что выполнены усло- вия А, В и С. то это множество (с заданными в нем опера- циями) называется полем. Так, например, множество й всех рациональных чисел (с обычными определениями суммы и произведения) есть поле, и то же верно для мно- жеств 31 всех вещественных и всех комплексных чисел. Упражнения 1. Почти все законы элементарной арифметики являются след- ствиями аксиом, определяющих поле. Доказать, в частности, что если У— поле и а, 0, у принадлежат 3?, то справедливы следующие соотношения: а) 0 -ф- а = а. Ь) Если а + р = а -|- у, то 0 = у. с) а + (0 — а) = 0. (Здесь 0 — а = 0 + (— а).) d) а-0 = 0-а = 0. (Для ясности или выделения мы иногда обозначаем умножение точкой.) е) (—1)а = — а. f) (-а) (-В) = а0 g) Если а0 = 0, то либо а = 0, либо 0 = 0 (либо то и другое одновременно). 2. а) Является ли множество всех целых положительных чисел полем? (Имея дело с хорошо известными системами, как, например, система целых чисел, мы почти всегда будем употреблять обычные операции сложения и умножения. Редкие случаи отступления от этого соглашения будут отчетливо оговариваться. Здесь и всюду в даль- нейшем под словом «положительное» понимается «большее или равное нулю». Желая исключить равенство нулю, мы будем гово- рить «строго положительное».) Ь) А множество всех целых чисел? с) Могут ли измениться ответы на эти вопросы, если сложение или умножение (или и то и другое) определить иначе? 3. Пусть т—целое число >2и Zm— множество всех положи- тельных целых чисел, меньших т : Zm = {0,1, ..., т— 1}. Для а и 0, принадлежащих Zm, будем под а + 0 понимать наименьший положительный остаток, полученный от деления (обычной) суммы а и 0 на т, и, аналогично, под а0 — наименьший положительный остаток, полученный от деления (обычного) произведения а и 0 на т. (Например, если т = 12, то 3 + 11 = 2 и 3 11 = 9.) а) Доказать, что Хт— поле тогда и только тогда, когда т — простое число.
ВЕКТОРНЫЕ ПРОСТРАНСТВА 11 § 2] Ь) Что есть —1 в Z6? с) Что есть j в Z,? 4. Пример где р — простое, показывает, что не все законы элементарной арифметики справедливы в полях; например, в Z2 1-|-1 = 0. Доказать, что если У— поле, то либо результат повтор- ного прибавления 1 к самой себе всегда отличен от нуля, либо 0 впервые получается, когда число слагаемых — простое. (По опре- делению, характеристикой поля 3- называется 0 в первом случае и указанное критическое простое число — во втором.) 5. Пусть <3. (]/2)—множество всех вещественных чисел вида а+Р/2, где а и р — рациональные числа. а) Является ли й(]/2) полем? Ь) А если требовать, чтобы а и Р были целыми? 6. а) Образует ли множество всех полиномов с целыми коэффи- циентами поле? Ь) А если разрешить коэффициентам принимать любые веще- ственные значения? 7. Пусть S3— множество всех (упорядоченных) пар (а, Р) вещественных чисел. а) Станет ли -Г полем, если сложение и умнсЛкение определить так: (а, Р)4-(у, д) = (а4-у, РЧ-ё) и (а, Р) (у, б) = (ау, Р6)? Ь) Если сложение и умножение определить правилами (а, Р)4-(у, 6) = (а4-у, Р + 6) И (а, Р)(у, 6) = (ау —рб, абЧ-Ру), будет ли тогда 3- полем? с) Каков будет ответ, если в предшествующих двух вопросах рассматривать упорядоченные пары не вещественных, а комплекс- ных чисел? § 2. Векторные пространства Теперь мы подошли к основному понятию этой книги. В нижеследующем определении предполагается, что нам задано некоторое поле .3, и .все рассматриваемые скаляры должны быть его элементами. .Определение. Векторным пространством назы- вается множество У элементов, именуемых векторами, удовлетворяющее следующим аксиомам:
12 ПРОСТРАНСТВА [ГЛ. I А. Каждой паре х, у векторов из У отвечает вектор х + у, называемый суммой х и у, причем 1) сложение коммутативно, х-\~у = У[х, 2) сложение ассоциативно, х4- (у -|-z) = (x'^y)J^z, 3) в У существует однозначно определенный вектор О (называемый началом) такой, что х 0 = х для каждого вектора х, 4) каждому вектору х из У отвечает однозначно опре- деленный вектор — х такой, что х + (— х) = 0. В. Каждой паре а, х, где а — скаляр, а х — вектор из У, отвечает вектор ах, называемый произведением а и х, причем 1) умножение на скаляры ассоциативно, а (0х) = = (ар) х, и 2) 1х = х для каждого вектора х. С. 1) Умножение на скаляры дистрибутивно относи-- тельно сложения векторов, а (х 4 у) = ах-{-ау, и 2) умножение на векторы дистрибутивно относительно сложения скаляров, (а + Р) х = ах4- Р^- Эти аксиомы не претендуют на логическую независи- мость; они просто являются удобной характеризацией объектов, которые мы желаем изучить. Отношение между векторным пространством У и основным полем 4 выра- жают, говоря, что У — векторное пространство над р . Если .у7—поле Л вещественных чисел, то У назы- вается вещественным векторным пространством', анало- гично, если у — поле Q, или говорят о рациональном или, соответственно, комплексном векторных простран- ствах. § 3. Примеры Прежде чем рассматривать следствия из аксиом, при- ведем несколько примеров. Во всем последующем изложе- нии мы неоднократно будем ссылаться на эти примеры и употреблять обозначения, которые вводятся в этих примерах. 1. Пусть У (=g) — множество всех комплексных чисел; если понимать под х4- у и ах обычные сумму и произведение комплексных чисел, У станет комплекс- ным векторным пространством.
ПРИМЕРЫ 13 § 3] 2. Пусть — множество всех полиномов от перемен- ной t с комплексными коэффициентами. Чтобы сделать aft комплексным векторным пространством, будем понимать под сложением векторов и умножением на скаляр обыч- ные операции сложения двух полиномов и умножения полинома на комплексное число; началом в afi будет поли- ном, тождественно равный нулю. Пример 1 слишком прост, а пример 2 слишком сложен, чтобы считаться типичным для основного содержания этой книги. Приведем теперь другой пример комплекс- ного векторного пространства, достаточно общий (как мы увидим позже) для всех наших целей. 3. Пусть g'1 — множество всех упорядоченных набо- ров по п комплексных чисел. Если х = (£х, . . . , £п), у = (ц1, . . . , цп) — элементы g'1, положим, по опреде- лению, ж + У = (В1 + Пр • • •> В» + П»), aa: = (agx, . . ., а£п), О = (0, . . ., 0), -*=(~ВХ, • • •> -U- Легко проверить, что все условия аксиом А, В и С § 2 выполнены, так что gn — комплексное векторное про- странство; мы будем называть его п-мерным комплексным координатным пространством. 4. Пусть для каждого положительного целого п — множество всех полиномов степени < п — 1с комплекс- ными (как в примере 2) коэффициентами, с присоединен- ным к нему полиномом, тождественно равным нулю. (При обычном понимании степени полинома, степень этого полинома не определена, так что мы не можем гово- рить, что его степень < п — 1.) При том же определении линейных операций (сложения и умножения на скаляр), что и в примере 2, есть комплексное векторное про- странство. 5. В близком родстве с g" находится множество всех упорядоченных наборов по п вещественных чисел. При том же формальном определении сложения и умноже- ния на скаляры, что и для <ёп, за тем исключением, что теперь рассматриваются лишь вещественные скаляры а, становится вещественным векторным пространством;
14 ПРОСТРАНСТВА [ГЛ. I мы будем называть его п-мерным вещественным коорди- натным пространством. 6. Все предшествующие примеры допускают обобще- ние. Так, пример 1 допускает следующее очевидное обоб- щение: каждое поле может рассматриваться как вектор- ное пространство над самим собой. А одновременное обоб- щение примеров 3 и 5 получится, если, приняв за исход- ный пункт произвольное поле р, образовать множество всевозможных упорядоченных наборов по п элемен- тов из f с таким же формальным определением линейных операций, как в случае ^:=сё. 7. Согласно определению поле содержит по крайней мере два элемента; векторное же пространство может состоять и из одного только элемента. Поскольку каждое векторное пространство содержит начало, имеется по существу (т. е. с точностью до обозначений) только одно векторное пространство, состоящее из единственного век- тора. Это самое тривиальное векторное пространство будет обозначаться 0. 8. Если в множестве всех вещественных чисел опре- делить обычным образом сложение вещественных чисел и умножение вещественного числа на рациональное, то станет рациональным векторным пространством. 9. Если в множестве 'ё всех комплексных чисел опре- делить обычным образом сложение комплексных чисел и умножение комплексного числа на вещественное, то станет вещественным векторным пространством. (Срав- нить с примером 1; эти примеры совершенно различны.) § 4. Замечания Следует сделать несколько замечаний относительно наших аксиом и обозначений. Существуют черты рази- тельного сходства (и в равной мере различия) между акси- омами поля и аксиомами векторного пространства над полем. В обоих случаях аксиомы А описывают аддитив- ную структуру системы, аксиомы В — ее мультиплика- тивную структуру, а аксиомы С устанавливают связь между этими структурами. Те, кто знаком с алгебраиче- ской терминологией, узнают в аксиомах А (как в § 1, так и в § 2) определяющие условия коммутативной труп-
4] ЗАМЕЧАНИЯ 15 пы; аксиомы В и С в § 2 выражают тот факт, что эта группа имеет скаляры своими операторами. Попутно заметим, что когда скаляры являются элементами не поля, а кольца, соответствующее обобщение понятия векторного пространства называется модулем. Некоторые вещественные векторные пространства (как J?2 и J?3) часто встречаются в геометрии. На этой стадии может показаться неоправданным наше по-видимому бес- полезное пристрастие к полям, отличным от и, в част- ности, к полю ’ё комплексных чисел. Но, как мы надеемся, читатель согласится принять на веру, что позднее нам придется воспользоваться глубокими свойствами ком- плексных чисел (сопряженность, алгебраическая замкну- тость) и что комплексные числа играют важную роль как в применениях векторных пространств к современной (квантово-механической) физике, так и при математиче- ском обобщении наших результатов на гильбертово про- странство. Одно из больших неудобств комплексных про- странств заключается в трудности наглядного изображе- ния; обычное изображение пространства 'g1 (диаграмма Аргана) неотличимо от изображения J?2, а графическое представление ??2 по-видимому выходит за пределы че- ловеческих возможностей. Поэтому в тех случаях, когда нам придется пользоваться наглядным языком, мы будем применять к <gn терминологию и говорить, например, о как о плоскости. И, наконец, замечание по поводу обозначений. Сим- вол 0 употреблялся в двояком смысле: то как скаляр, то как вектор. Позже положение усложнится еще тем, что при введении линейных функционалов и операторов этому символу будут придаваться и другие значения. К счастью, взаимоотношения различных интерпретаций символа 0 таковы, что после этого предостережения такая практика не породит никакой путаницы. Упражнения 1. Доказать, что если х, у — векторы, а а — скаляр, справед- ливы следующие соотношения: а)' 0 + х=х. Ь) — 0 = 0. с) а-0 = 0.
16 ПРОСТРАНСТВА [ГЛ. I d) 0'i = 0. (Обращаем внимание на то, что в обеих частях равенства стоит один и тот же символ 0; слева он означает ска- ляр, а справа — вектор.) е) Если ах = 0, то либо а = 0, либо х = 0 (либо и то и другое). f) — х = (—1) х. g) у + (х — у) = х. (Здесь х — у = х + (—у).) 2. Если р— простое число, то Zpn—векторное пространство над Zp (см. § 1, упражнение 3); сколько векторов содержит это векторное пространство? 3. Пусть — множество всех (упорядоченных) пар веществен- ных чисел. Если х = (£1; £2) и У = (Л1> Н-з) — элементы Т3, будем писать х -Н У — (?i -к Л i> аж = (а^1, 0), 0=(0, 0), -*=Нь -£а). Будет ли V3 при таком определении линейных операций векторным пространством? Почему? 4. Иногда подмножество векторного пространства само являет- ся векторным пространством (относительно уже введенных линей- ных операций). Рассмотрим, например, векторное пространство g3 и его подмножество состоящее из тех векторов (£ь |2, g3), для которых а) Ь) с) d) е) — вещественное число, &т = 0, £1 = 0, либо g2 = 0, Bi Ч- &3=о, £1+ ?2=1- В каком из этих случаев %3 будет векторным пространством? 5. Рассмотрим векторное пространство сРи его подмножества %3, состоящие из тех векторов (полиномов) х, для которых а) степень х равна трем, Ь) 2х (0) =ж(1), с) х (t) 0, когда 0 -'С t 1, d) х(«) = а:(1 — t) для всех t. В каком из этих случаев V1 будет векторным пространством? § 5. Линейная зависимость Теперь, после описания пространств, которыми мы будем заниматься, нам следует установить те отношения между их элементами, которые будут представлять для нас интерес. Сначала несколько слов об обозначении суммирования. Если каждому элементу i некоторого множества индексов
ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 17 § Ы отнесен вектор xit причем точное указание этого множе- ства не требуется или представляет неудобство, мы будем просто говорить о множестве {хг} векторов. (Мы допускаем возможность того, что двум различным индексам соот- ветствует один и тот же вектор. Поэтому следует со всей определенностью сказать, что важно не то, какие век- торы входят в {хг}, а то, как они входят.) Если рас- сматриваемое множество индексов конечно, мы будем обозначать сумму соответствующих векторов У (или, i если желательно, более определенным символом, напри- п мер 2 Удачным приемом, позволяющим избежать 4=1 частого и докучливого рассмотрения отдельных случаев, является допущение в общую теорию сумм 2 хг даже тогда, г когда нет индексов г, по которым должно производиться суммирование, или, более точно,— когда рассматривае- мое множество индексов пусто. (Конечно, в этом случае нет векторов, подлежащих суммированию, или, более точно, множество {xt} также пусто.) Вполне естественно, что значением такой «пустой суммы» по определению считается вектор 0. Определение. Конечное множество {хД век- торов называется линейно зависимым, если существует соответствующее множество {aj скаляров, не все из кото- рых равны нулю, такое, что 2аЛ = 0. Если же из i 2 = 0 следует, что а4 = 0 для каждого г, то множество i {Xj} называется линейно независимым. Это определение сформулировано так, чтобы оно охва- тывало и- случай пустого множества; результат в этом случае, хотя, быть может, и парадоксален, весьма удо- влетворительно согласуется с остальной частью теории. Он заключается в том, что пустое множество векторов линейно независимо. Действительно, если нет никаких индексов г, то невозможно выбрать какие-нибудь из них и отнес.ти им ненулевые скаляры так, чтобы соответствую- щая сумма стала равной нулю. Трудность не в том, чтобы обойтись без отнесения нулевого значения, а в том, чтобы 2 П. Халмош
18 ПРОСТРАНСТВА [ГЛ. I найти индекс, которому вообще можно было бы что-ни- будь отнести. Заметим, что из этого доказательства сле- дует, что пустое множество не является линейно зависи- мым; для читателя, не знакомого с доказательствами посредством «пустой импликации», эквивалентность опре- деления линейной независимости простому отрицанию определения линейной зависимости требует некоторого дополнительного интуитивного оправдания. Простейший способ освоиться с утверждением, что «2 atxt = О г влечет а4 = 0 для каждого I» в том случае, когда индек- . сов i не существует, состоит в следующей его перефра- зировке: «если 2 aixi= то нет ни одного индекса i, г для которого а£ =# О». В такой редакции утверждение, очевидно, справедливо и когда вообще нет ни одного ин- декса i. Линейная зависимость и независимость — свойства множеств векторов; однако вошло в обычай применять соответствующие прилагательные к самим векторам, так что иногда вместо «линейно независимое множество век- торов» мы будем говорить «множество линейно независимых векторов». Будет удобно говорить также о линейной зави- симости и независимости не обязательно конечного мно- жества Ж векторов. Мы скажем, что Ж линейно неза- висимо, если этим свойством обладает каждое его конечное подмножество; в противном случае % будет называться линейно зависимым. Чтобы лучше вникнуть в смысл линейной зависимости, рассмотрим примеры, уже встречавшиеся нам ранее. 1) Любые два вектора х и у из <ё1 образуют линейно зависимое множество. Когда х = у = 0, это тривиально; в противном же случае имеем, например, соотношение ух -ф ( — У — 0. Так как, очевидно, каждое множество, содержащее линейно зависимое подмножество, само ли- нейно зависимо, то это показывает, что каждое множе- ство в <ё1, содержащее более одного элемента, линейно вависимо. 2) Более интересно положение в пространстве Так, скажем, векторы х, у, z, определяемые формулами x(0 = l-t y(t) = t(l-t), =
6] ЛИНЕЙНЫЕ КОМБИНАЦИИ 19 линейно зависимы, поскольку х-\-у — z = 0. Однако бесконечное множество векторов х0, xlt х2, ... , опре- деленных формулами ж0 (Д = 1, х± (Д = t, х2 (Д = t2, линейно независимо, ибо, если бы имелось какое-нибудь соотношение вида а0;г0-г a^-l- . .. + anxn = 0, то мы получили бы полиномиальное тождество a0 + ах« + ... + ап«п = 0, откуда а0 = ах = ... = ап = 0. 3) Как уже упоминалось, пространства <g>n являются прототипами тех пространств, которые нам нужно изу- чить; рассмотрим, например, случай п = 3. Для тех, кто знаком с многомерной геометрией, понятие линейной зави- симости в этом пространстве (или, точнее говоря, в его ве- щественном аналоге J?3) имеет конкретный геометриче- ский смысл, который мы лишь упомянем. На геометри- ческом языке.два вектора линейно зависимы тогда и только тогда, когда они коллинеарны с началом, а три вектора линейно зависимы тогда и только тогда, когда они ком- планарны с началом. (Если понимать под вектором не точку в пространстве, а стрелку, проведенную из начала в некоторую данную точку, то в предыдущей фразе сле- дует в обоих случаях опустить слова «с началом».) Вскоре мы введем понятие линейных многообразий (или векторных подпространств) в векторном пространстве и в этой связи будем иногда пользоваться языком, подсказываемым по- добными геометрическими рассмотрениями. § 6. Линейные комбинации Если х = 2 аА> будем говорить, что х — линейная г комбинация {хД; без дальнейших пояснений будут ис- пользоваться все простые грамматические производные этой терминологии. Так, в случае, когда х есть линейная комбинация {хД, мы будем говорить, что х линейно зави- сит от {яД; предоставим читателю доказать, что если {а;Д 2*
20 ПРОСТРАНСТВА [ГЛ. I линейно независимо, то для того, чтобы х было линейной комбинацией {хД, необходимо и достаточно, чтобы рас- ширенное множество, полученное путем присоединения х к {хД, было линейно зависимо. Заметим, что, в соответ- ствии с определением пустой суммы, начало является линейной комбинацией пустого множества векторов; бо- лее того, это — единственный вектор, обладающий этим свойством. Следующая теорема представляет собой фундамен- тальный результат, относящийся к линейной зависи- мости. Теорема. Множество ненулевых векторов хг, ..., хп линейно зависимо тогда и только тогда, когда некоторое хк, 2 С к < и, является линейной комбинацией предшест- вующих векторов. Доказательство. Предположим, что векторы хг, ... , хп линейно зависимы, и пусть к — первое целое >2, для которого xlt ... , хк линейно зависимы. (В наи- худшем случае наше предположение гарантирует, что к = и.) Тогда «А + • • • + акхк = 0 при надлежащих коэффициентах а (не все из которых равны нулю); более того, во всяком случае ак =# 0, ибо мы имели бы тогда отношение линейной зависимости между xlt ... , xk^, в противоречие с определением. Следовательно, —«л-1 „ хь-и Хъ — —— х. + ... -} * «л 1 ай что и требовалось. Этим доказана необходимость нашего условия; достаточность очевидна, поскольку, как было раньше отмечено, каждое множество, содержащее линейно зависимое множество, само линейно зависимо. § 7. Базисы Определение. Базисом (или координатной си- стемой) векторного пространства У* называется множе- ство % линейно независимых векторов, такое, что каждый вектор пространства V является линейной комбинацией
БАЗИСЫ 21 sn элементов из ЕС. Векторное пространство Т конечномерно, если оно имеет конечный базис. За исключением эпизодических примеров, наше вни- мание да протяжении всей книги будет сосредоточено на конечномерных векторных пространствах. За примерами базисов мы обратимся снова к про- странствам &3 и <ёп. В & множество {хп}, где xn(t) = Г (п = 0, 1, 2, . . .), есть базис; по определению, каждый полином есть линейная комбинация конечного числа хп. Более того, й нет конечного базиса, так как для любого заданного конечного множества полиномов можно найти полином степени большей, чем у всех них; этот последний полином, очевидно, не будет линейной комбинацией пре- дыдущих. Примером базиса в является множество векторов хг (I = i, . . . , п), определенных условием, что j-й коор- динатой xt служит dZj-. (Здесь мы впервые пользуемся по- пулярным кронекеровским д; оно определяется так: 6i; = l, если i = ;, и до = 0, если I Ф j). Таким образом, мы утверждаем, что в 'ё3 векторы хг = (1, 0, 0), х2 = (0, 1, 0), х3= (0, 0, 1) образуют базис. Легко видеть, что они линейно независимы, а формула ® = (В1> ?21 ?з) = ^1'^1 + ё2'^2‘Г ёз^з показывает, что каждый вектор х из r63 есть линейная комбинация этих векторов. В произвольном конечномерном векторном простран- стве У’ с базисом {х±, . . . , хп}, как мы знаем, каждый вектор х может быть записан в виде х = 2 Ва; i мы утверждаем, что все 5 однозначно определяются этим вектором х. Это доказывается приемом, часто используе- мым в теории линейной зависимости. Если бы х = то после вычитания мы имели бы £(^-^ = 0.
22 ПРОСТРАНСТВА £ГЛ. I Вследствие линейной независимости векторов xit отсюда следовало бы, что — т]г= 0 для i = 1, . . . , п; другими словами, каждое совпадает с соответствующим т|Р (Заметим, что запись {z1; . . . , хп} для базиса, образо- ванного п элементами, неподходяща в случае п = 0. Несмотря на это, мы будем часто пользоваться этим обо- значением. Всякий раз, делая это, мы, в принципе, обя- заны добавить специальное рассмотрение, имеющее целью распространить полученные результаты на векторное пространство О. Однако в действительности всё относя- щееся к этому пространству столь тривиально, что под- робности не заслуживают расписывания, и мы будем опускать их.) Теорема. Пусть — конечномерное векторное про- странство и {ylt . . . , ут} — некоторое множество его линейно независимых векторов. Тогда, если они не образуют еще базиса, можно найти такие векторы ymtl, . . , ymtp, что совокупность всех у, т. е. {уи ..., ут, ymtl.Ут.Р}, уже образует базис. Другими словами, каждое линейно независимое множество может быть расширено до базиса. Доказательство. Так как У конечномерно, то оно обладает конечным базисом, скажем, {Xj, . . . , хп}. Рассмотрим множество if векторов У1. • • > Ут. Хх, ...,Хп и, сохраняя порядок следования векторов, применим к этому множеству несколько раз подряд теорему § 6. Множество if линейно зависимо, так как каждый из векторов у (как и вообще всякий вектор) есть линейная комбинация векторов х. Следовательно, некоторый вектор из if является линейной комбинацией предшествующих; пусть z — первый такой вектор. Тогда z отличен от любого из векторов у (поскольку эти векторы линейно независимы) и потому равен некоторому х, скажем, z = xv Рассмотрим новое множество сУ векторов уг,...,ут, хх, ,. xi+1...хп. Заметим, что каждый вектор из У является линейной ком- бинацией векторов множества , так как через уг, ... , ут, xlt ... , х^ можно выразитьх^, а затем через ж1, . . . , xi- ^.»i • • • > хп — любой вектор (векторы х образуют
$ 7] БАЗИСЫ 23 базис). Если &” линейно независимо, то цель достигнута. Если же нет, то таким же способом будем применять тео- рему § 6 снова и снова до тех пор, пока не получим линей- но независимого множества, содержащего . . . , ут, через векторы которого можно выразить каждый вектор из У1. Это множество и будет базисом, содержащим век- торы у. Упражнения 1. а) Доказать, что четыре вектора ® = (1, 0, 0), у=(0, 1, 0), 2 = (0, 0, 1), u = (l, 1, 1) образуют в g3 линейно зависимое множество, но любые три из них линейно независимы. Проверка линейной зависимости векторов х=(51, 5г. 5з), !/=(П1. Пз) и z=(5lt £2, 5з) в g3 производится следующим образом. Предположим, что можно подобрать а, р и у так, что ах + (Зу + ух = 0. Это означает, что a?i + ₽i1i+YCi=0. а5з+Рг12+У?2=0> а5з + РЛз+У?з=0- Векторы х, у, z линейно зависимы тогда и только тогда, когда эта система уравнений имеет решение, отличное ота = Р = у = 0. Ь) Пусть х, у, z и и — векторы из ,+, определенные формулами х(/) = 1, У(0 = 4, z(Z) = Z2 и u(t) = 1 -f- t -f- t2. Доказать, что х, у, z и и линейно зависимы, но любые три из них линейно незави- симы. 2. Доказать, что если 31 рассматривать как рациональное векторное пространство (см. § 3, 8), то для линейной независимости векторов 1 и g из 31 необходимо и достаточно, чтобы вещественное число 5 было иррациональным. 3. Верно ли, что если х, у z — линейно независимые векторы, то этим же свойством обладают х + у, у + z, г~ i? 4. а) Каким условиям должен удовлетворять скаляр 5, чтобы векторы (1 + 5, 1— 5) и (1 — 1 + 5) из !ё2 были линейно за- висимы? Ь) Каким условиям должен удовлетворять скаляр 5, чтобы век- торы (5, 1, 0), (1, 5, 1), (0> 1> 5) из ЗР были линейно зависимы? с) Каков будет ответ на вопрос Ь) при замене 31? на й3? 5. а) Векторы (5t, 5г) и (щ, Цг) из !g2 линейно зависимы тогда и только тогда, когда 51Цг=й111. Ь) Найти аналогичное необходимое и достаточное условие ли- нейной зависимости двух векторов из g3. Сделать то же для трех векторов из !g3. с) Имеется ли в g2 множество, состоящее из трех линейно неза- висимых векторов?
24 ПРОСТРАНСТВА [ГЛ. I 6. а) Каким условиям должны удовлетворять скаляры | и г), чтобы векторы (1, д) и (1, т]) из g2 были линейно зависимы? Ь) Каким условиям должны удовлетворять скаляры 5, т), чтобы векторы (1, g, £2), (1, ц, т|2) и (1, £, £2) из g3 были линейно зависимы? Обобщить а) и Ь) на gn. 7. а) Найти в g4 два базиса, единственными общими векторами которых служат (0, 0, 1, 1) и (1, 1, 0, 0). Ь) Найти два базиса в g4 так, чтобы они не имели ни одного общего вектора, причем один из них содержал векторы (1, 0, 0, 0) и (1, 1, 0, 0), а другой — векторы (1, 1, 1, 0) и (1, 1, 1, 1). 8. а) Каким условиям должен удовлетворять скаляр 5, чтобы векторы (1, 1, 1) и (1, 52) образовывали базис в g3? b) Каким условиям должен удовлетворять скаляр 5, чтобы век- торы (0, 1, 5), (5, 0, 1) и (5, 1,1 + 5) образовывали базис в g3? 9. Рассмотрим множество всех тех векторов из +3, каждая координата которых равна либо 0, либо 1; сколько различных бази- сов содержит это множество? 10. Пусть % — множество, состоящее из шести векторов (1, 1,0,0), (1,0, 1,0), (1,0,0, 1), (0, 1,1,0), (0, 1,0, 1), (0,0, 1,1) пространства g4. Найти два различных максимальных линейно независимых подмножества этого множества. (Максимальное линей- но независимое подмноя;ество множества —это линейно незави- симое подмножество + из %, становящееся линейно зависимым вся- кий раз, когда к нему присоединен не принадлежащий ему вектор из .) 11. Доказать, что каждое векторное пространство обладает базисом. (Доказательство этого факта недостижимо для тех, кто не знаком с какими-либо трансфинитными ухищрениями, подобными полному упорядочению или лемме Цорна.) § 8. Размерность Теорема 1. Все базисы конечномерного векторного пространства V состоят из одинакового числа векторов. Доказательство. Доказательство этой теоре- мы представляет собой небольшое усовершенствование метода, использованного в § 6, и, между прочим, дает несколько больше, чем утверждается в теореме. Пусть {+, . ... хп} и У = {г/п . . . , ут} — два конечных множества векторов, каждое из которых обладает одним из двух определяющих свойств базиса, а именно, каждый вектор из V является’ линейной комбинацией векторов х (которые, однако, не предполагаются линейно независимы- ми), векторы же у линейно независимы (но не предпола- гается, что каждый вектор пространства является их
§ 8] РАЗМЕРНОСТЬ 25 линейной комбинацией). К множеству е5р векторов Ут,' •*•!’ • • ' Хп можно так же, как раньше, применить теорему § 6. И снова мы знаем, что каждый вектор является линейной комбинацией векторов из if и что if линейно зависимо. Рассуждая точно так же, как раньше, получаем множе- ство if' векторов Ут' 3-1’ • • • ' ^l-l’ ^i+l’ • • ' по-прежнему с тем свойством, что каждый вектор являет- ся линейной комбинацией векторов из if'. Припишем теперь г/т1 перед множеством if' и применим то же рас- суждение. Продолжая этот процесс, заметим, что векторы х не будут исчерпаны раньше векторов у, поскольку в противном случае оставшиеся векторы у оказались бы линейными комбинациями уже включенных в if, тогда как мы знаем, что векторы у линейно независимы. Дру- гими словами, после т-кратного применения этого рас- суждения получится множество, обладающее свойством множества векторов х и отличающееся от него тем, что т векторов х заменено векторами у. Это простое на вид утвер- ждение и есть как раз то, что нам нужно; из него следует, что и>т. Следовательно, если и fP и й/ являются бази- сами (так что каждое из них обладает обоими свойствами), то /г > m и /и > тг. Определение. Размерностью конечномерного векторного пространства 5F называют число элементов его базиса. Заметим, что так как пустое множество векторов является базисом тривиального пространства 0, то из определения следует, что это пространство имеет размер- ность 0. В то же время это определение (вместе с тем фак- том, что в § 7 уже демонстрировался конкретный базис про- странства ®11) оправдывает наконец нашу терминологию и позволяет объявить приятный результат: и-мерное коорди- натное пространство /г-мерно. (Так как аргументация одна и та же для .J?'1 и для 'вп, то утверждение справед- ливо и для вещественного, и для комплексного случая.) Нашим дальнейшим результатом является следствие из теоремы 1 (получающееся с помощью теоремы § 7):
26 ПРОСТРАНСТВА [ГЛ. I Теорема 2. Каждое множество из и 4-1 векторов п-мерного векторного пространства V линейно зависимо. Множество из п векторов пространства V является бази- сом тогда и только тогда, когда оно линейно независимо, или, иначе, тогда и только тогда, когда каждый вектор из V является линейной комбинацией элементов этого множества. § 9. Изоморфизм В качестве применения понятия линейного базиса или координатной системы, мы выполним теперь данное не- явно обещание и покажем, что каждое конечномерное век- торное пространство над полем ¥ по существу совпадает (выражаясь техническим языком, изоморфно) с некото- рым д?Л. Определение. Два векторных пространства СЦ и V (над одним и тем же полем) изоморфны, если можно установить взаимно однозначное соответствие между век- торами х из Ц и у из У* (скажем, у = Т (х)) так, чтобы Т (а^х + а2ж2) = ахТ (.rj + а2Т (ж2). Другими словами, 2/ и У* изоморфны, если между ними можно установить изоморфизм (подобный Т), где под изоморфизмом понимается взаимно однозначное соот- ветствие, сохраняющее все линейные соотношения. Легко видеть, что изоморфные конечномерные вектор- ные пространства имеют одинаковую размерность: каж- дому базису одного пространства соответствует базис другого пространства. Таким образом, размерность являет- ся инвариантом изоморфизма; мы покажем теперь, что это — единственный инвариант изоморфизма, в том смысле, что любые два векторных пространства одинаковой конечной размерности (и, конечно, над одним и тем же полем) изоморфны. Так как изоморфизм Ц и V, с одной стороны, и и Ж— с другой стороны, влекут изомор- физм 7/ и Ж, то достаточно будет доказать следующую теорему. Теорема. Всякое п-мерное векторное пространство ТГ над полем F изоморфно &п. Доказательство. Пусть {а:;, . . . , хп} — лю- бой базис пространства Т. Каждый вектор х из V может
ИЗОМОРФИЗМ 27 i 9] быть записан в виде + . • • + ^па:п, причем, как мы знаем, скаляры £1; . . . , |п однозначно определяются вектором х. Рассмотрим взаимно однозначное соот- ветствие ^^±(51, • - £п) между У’ и Если у = т]1х1 + . . . + ЛЛ, то ах + Ру = (а^ + Prh) а?! + ... + (“Bn + РЛп) хп‘, этим и установлен утверждаемый изоморфизм. Мог бы возникнуть соблазн утверждать, что теперь было бы глупо пытаться сохранять видимость общности, толкуя об общих и-мерных векторных пространствах, поскольку мы знаем, что с точки зрения изучения линей- ных проблем изоморфные векторные пространства не- отличимы, а потому можно всегда с тем же успехом изу- чать рп. Но есть один выигрыш. Важнейшие свойства век- торов и векторных пространств — это те," которые не за- висят от координатных систем или, другими словами, инвариантны при изоморфизмах. Однако, соответствие между F* и было установлено путем выбора некоторой координатной системы; если бы мы всегда изучали то мы всегда были бы связаны с этой конкретной коорди- натной системой, или же, в противном случае, всегда сталкивались бы с необходимостью показывать, что наши определения и теоремы не зависят от координатной си- стемы, в которой их случилось установить. (Эта неприят- ная дилемма станет ясней позже, в тех нескольких слу- чаях, когда для формулирования определения мы будем вынуждены воспользоваться конкретной координатной системой.) Поэтому в большей части этой книги мы будем игнорировать только что доказанную теорему и рассмат- ривать и-мерные векторные пространства сами по себе независимо от какого бы то ни было базиса. Кроме только что упомянутых причин, есть и другие основания посту- пать подобным образом: многие конкретные примеры век- торных пространств, как, скажем, <55п, утратили бы боль- шую часть своего наглядного содержания, если бы мы преобразовывали их в и говорили только о коорди- натах. При изучении векторных пространств, подобных <^п, и их отношения к другим векторным пространствам
28 ПРОСТРАНСТВА [ГЛ. I мы должны уметь обращаться с ними с одинаковой лег- костью в различных координатных системах или, что по существу то же самое, мы должны уметь обращаться с ними, не пользуясь вообще никакой координатной си- стемой. Упражнения 1. а) Какова размерность множества g всех комплексных чисел, рассматриваемого как вещественное векторное пространство? (См. § 3, 9.) b) С каждым комплексным векторным пространством V1 тесно связано вещественное векторное пространство получающееся из Т3, если условиться допускать умножение векторов из V1 только на вещественные скаляры. Если размерность комплексного вектор- ного пространства равна п, то какова размерность вещественного векторного пространства Т3'? 2. Является ли множество всех вещественных чисел конечно- мерным векторным пространством над полем <2 всех рациональных чисел? (См. § 3, 8. Вопрос не тривиален; он требует некоторых сведений о кардинальных числах.) 3. Сколько векторов существует в n-мерном векторном про- странстве над полем Zp (р — простое число)? 4. Обсудить следующее утверждение: если два рациональных векторных пространства обладают одним и тем же кардинальным числом (т. е. между ними существует взаимно однозначное соответ- 'ствие), то они изоморфны (т. е. между ними существует взаимно однозначное соответствие, сохраняющее линейные соотношения). Для разумного обсуждения необходимо знание основных фактов арифметики кардинальных чисел. § 10. Подпространства Объектами, которыми интересуется геометрия, являют- ся не только точки рассматриваемого пространства, но также его прямые, плоскости и т. д. Мы приступаем к изу- чению аналогов этих многомерных элементов в общих векторных пространствах. Определение. Непустое подмножество век- торного пространства ТГ называется подпространством, или линейным многообразием, если &Ж вместе с каждой парой своих векторов х, у содержит также все их линей- ные комбинации ах+ $у. Обращаем внимание: вместе с каждым вектором х подпространство содержит х — х. Значит, при истолко-
§ 10J ПОДПРОСТРАНСТВА 29 вании подпространств как обобщенных прямых и плоско- стей следует проявлять осмотрительность, и рассматри- вать только те прямые и плоскости, которые проходят через начало. Подпространство а'И векторного пространства У само является векторным пространством; читатель легко про- верит, что относительно уже имеющихся в У операций сложения векторов и умножения их на скаляры это мно- жество удовлетворяет аксиомам А, В и С § 2. Двумя особыми примерами подпространств являются I) множество ©, состоящее из единственного элемента — начала, и II) всё пространство Т. Следующие примеры менее тривиальны. 1) Пусть тип — любые два строго положительных целых числа, причем т<' п. —множество всех векто- ров х = (£х, ...,£,) из У, для которых = . . . — = U = 0. 2) При тех же т, п, что и в примере 1), рассмотрим пространство и т любых вещественных чисел tlt <2, . . . , tm. o/it — множество всех векторов (полиномов) X ИЗ &п, ДЛЯ которых X (tj) = . . . = х {tm) = 0. 3) q/K — множество всех векторов х из для которых х (t) = х (— t) тождественно относительно t. Нам понадобятся некоторые обозначения и термины. Для любого семейства {a/Zv} подмножеств данного множе- ства (например, для семейства подпространств векторного пространства У) через []<^v будет обозначаться Пересе- V чение всех </Zv, т. е. множество тех точек, которые входят во все Далее, если <М и — подмножества некоторого множества, мы пишем s/Z CZ если о/И — подмножество в JV*, т. е. если каждый элемент из &/Z принадлежит также (Заметим, что мы не исключаем возможности a/il — Л'; так, мы пишем У С=У, так же. как и Q CZ У.) Для конечно- го семейства ..., <Мп} вместо мы будем писать V 0^1 П • • • ’> в случае, когда два подпространства М и таковы, что &/Z = ©, мы будем говорить, что <М и дизъюнктны.
30 ПРОСТРАНСТВА [ГЛ. I § И. Действия над подпространствами Теорема 1. Пересечение любого семейства подпро- странств есть подпространство. Доказательство. Будем для различения эле- ментов данного семейства пользоваться индексом v и пусть v Поскольку каждое c^v содержит 0, е# также содержит 0 и, значит, не пусто. Если х и у принадлежат <М (т. е. всем s^v), то аат+Рр принадлежит всем a//v, а потому М — подпространство. Чтобы познакомиться с применением этой теоремы, предположим, что if — произвольное множество векто- ров (не обязательно подпространство) векторного про- странства ТА Тогда несомненно существуют подпростран- ства <Ж, содержащие все элементы из if (т. е. такие, что например, таким подпространством является всё ТА Пусть с^'—пересечение всех подпространств, содержащих еТ; очевидно, у# само является подпростран- ством, содержащим^. Более того, ясно, что а'И — наимень- шее такое подпространство; если if содержится также в подпространстве Jff, if^ZJT, то п^сЛА Та к определенное подпространство называется подпространством, порож- денным if, или натянутым на <f, или линейной оболоч- кой if. Следующий результат устанавливает связь между понятием линейной оболочки и понятиями, рассмотрен- ными в §§ 5—9. Теорема 2. Подпространство <М, порожденное каким-либо множеством if векторов векторного простран- ства У, совпадает с множеством всевозможных линейных комбинаций элементов из if. Доказательство. Ясно, что линейная комби- нация линейных комбинаций элементов множества if сно- ва может быть записана в виде линейной комбинации эле- ментов из if. Поэтому множество всевозможных линейных комбинаций элементов из if является подпространством, содержащим if, а значит и М. А теперь обратим рассужде- ние:^ содержит^ и является подпространством; значит, <>М содержит все линейные комбинации элементов из if.
§ 12] РАЗМЕРНОСТЬ ПОДПРОСТРАНСТВА 31 Мы видим тем самым, что в нашей новой терминологии базис можно определить как множество линейно незави- симых векторов, порождающее всё пространство. Следующий наш результат является простым следстви- ем теоремы 2; его доказательство можно спокойно предо- ставить читателю. Теорема 3. Подпространство М, натянутое на объединение каких-либо подпространств ftC и eft), совпа- дает с множеством всевозможных векторов вида х-\-у, где х — вектор из <§£, а у — из eft). Этой теоремой подсказывается для подпространства s/Z, порожденного объединением подпространств gft> и е/£", обо- значение eft) -|- eft). Мы будем говорить, что подпространство Ж векторного пространства 4ft является дополнением к подпространству gft), если eft)f\eft) = <3 и <§ft) fteft) = 4ft. § 12. Размерность подпространства Теорема 1. Подпространство М п-мерного век- торного пространства 4ft является векторным простран- ством размерности < п. Доказательство. Возможно следующее обман- чиво короткое доказательство этой теоремы. Каждое мно- жество, состоящее из п +1 векторов пространства 4ft, линейно зависимо, значит, то же верно и в о,И\ поэтому, в частности, число элементов любого базиса подпростран- ства будет < п, что и требовалось доказать. Слабый пункт этого рассуждения состоит в том, что мы определили размерность п требованием; чтобы прежде всего существовал конечный базис, и затем, чтобы он со- держал точно п элементов. Приведенное доказательство показывает только, что ни один базис не может содержать более п элементов; но оно не показывает, что хоть один базис существует. Однако, раз уже эта трудность заме- чена, легко восполнить пробел. Если = 0, то М 0-мерно, и всё доказано. Если содержит ненулевой вектор х, то пусть (CZ o/Z) — подпространство, натянутое на х1. Если — то 1-мерно, и всё доказано. Если же 0# =f=<MY, то пусть хг— элемент из , не содержащийся в b/Zj, и <з$2 —подпространство, натянутое на хг и а:2; и так далее. А теперь мы вправе воспользоваться приве-
32 ПРОСТРАНСТВА [ГЛ. t денным выше соображением: после не более чем п таких шагов процесс закончится, поскольку (по теореме 2 § 8) нельзя найти п 4-1 линейно независимых векторов. Важным следствием этого второго корректного дока- зательства теоремы 1 является Теорема 2. Каково бы ни было т-мерное подпро- странство о/И п-мерного векторного пространства У, мож- но найти базис {х1г . . . , хт, xmtl, . . . , х,,} простран- ства У' такой, что хг, . . . , хт принадлежат подпро- странству М и потому образуют его базис. Мы будем обозначать размерность векторного про- странства V' символом При таком обозначении теорема 1 утверждает, что если <М — подпространство конечномерного векторного пространства V, то dimc/Z< <dimr. Упражнения 1. Если и —конечномерные подпространства одинаковой размерности и то <М=ЛГ. 2. Если и — подпространства векторного пространства и каждый вектор из Т3 принадлежит либо -М, либо (либо тому и другому), ТО либо = либо JT = (либо Т3). 3. Если х, у и z — векторы, для которых х + у + z = 0, то х и у порождают то же подпространство, что у и z. 4. Пусть х и у — векторы, а оМ — подпространство векторного пространства Т^3; пусть, далее, — подпространство, натянутое на М и х, а Ж"— подпространство, натянутое на <М и у. Доказать, что если у принадлежит но не принадлежит еМ, то х принадле- жит >К. 5. Пусть X, еМ nN - подпространства векторного пространства. а) Показать, что равенство не всегда выполняется. Ь) Доказать, что х п ум+(х Г) = (х л +(х п . 6. а) Возможно ли, чтобы нетривиальное подпространство векторного пространства Т3 (т. е. подпространство, отличное и от 0, и от %3) имело единственное дополнение? Ъ) Если <М— m-мерное подпространство n-мерного векторного пространства, то каждое дополнение к имеет размерность п—т. 7. а) Показать, что трехмерные подпространства пятимерного векторного пространства не дизъюнктны.
§ 13] СОПРЯЖЕННЫЕ ПРОСТРАНСТВА 33 Ь) Если М и —конечномерные подпространства векторного пространства, то 8. Полином х называется четным, если х (— t) = x(t) тожде- ственно относительно t (см. § 10, 3)), и нечетным, если х( — t) — = —х (/). а) Как класс М четных полиномов, так и класс JT нечетных полиномов являются подпространствами пространства всех (комплексных) полиномов. Ь) Доказать, что М и jfP служат дополнениями друг к другу. § 13. Сопряженные пространства Определение. Линейным функционалом на век- торном пространстве У* называется скалярная функция у, определенная для каждого вектора х и обладающая свой- ством у (аха:х + а2х>) = а±у (жх) + а2у (тождественно относительно векторов х±, х2 и скаляров ах, а2). Рассмотрим несколько примеров линейных функцио- налов. 1) Для всех х = (£х, из 'g'1 положим у(х) = gx. Более общим образом, взяв п любых скаляров ах, . . . , а„, положим y(a:) = a1g1+ ... 4-аХ- Заметим, что для любого линейного функционала у на любом векторном пространстве у (0) = у (0-0) = 0-у(0) = 0; по этой причине линейный функционал, как мы опреде- лили его, называют иногда однородным. В частности, /gn У (*) = “151 + • • • + «Лп + ₽ не является линейным функционалом, если только [3 не есть 0. 2) Для любого полинома х из положим у (х) = х (0). Более общим образом, взяв п любых скаляров ах, . . . , ап и п любых вещественных чисел ?х, . . . , tn, положим у (х) = axz (fx) + . . . + апх (Q. 3 П. Халмош
34 ПРОСТРАНСТВА [ГЛ. I Еще один пример, в некотором смысле — предельный случай только что рассмотренного, получается следующим образом. Пусть (а, Ь) — любой конечный интервал веще- ственной оси t и а — любая комплексная интегрируемая функция, определенная на (а, 6); определим у следующим образом: ь у (х) = а (/) х (£) dt. а 3) На произвольном векторном пространстве ТС опре- делим у, положив У (х) = О для каждого х из ТС. В последнем примере содержится первый намек на некую общую ситуацию. Пусть ТС> — любое векторное про- странство и Г' — совокупность всех линейных функцио- налов на ТС. Обозначим через 0 линейный функционал, определенный в примере 3 (см. замечание в конце § 4). Если yt и у2 — линейные функционалы на ТС, аг и а2 — скаляры, обозначим через у функцию, определенную формулой У W (ж) + а2у2 (х). Легко видеть, что у — линейный функционал; мы будем обозначать его а±уг а2у2. При таком определении линей- ных понятий (нуль, сложение, умножение на скаляр) множество ТС' образует векторное пространство; его назы- вают пространством, сопряженным к У*. § 14. Скобки Лрежде чем приступить к более подробному изучению линейных функционалов и сопряженных пространств, мы хотим ввести обозначение, которое на первый взгляд может показаться странным, но впоследствии прояснит многие ситуации. Обычно мы обозначаем линейный функ- ционал одной буквой, например у. Однако иногда оказы- вается необходимым пользоваться полным функциональ- ным обозначением и как-то указывать, что если у —линей- ный функционал на ТС, а х — вектор из ТС, то у (х) — некий конкретный скаляр. Согласно принимаемому нами
§ 14] СКОБКИ 35 обозначению вместо того, чтобы к у приписывать х, за- ключенное в круглые скобки, мы будем заключать х и у в квадратные скобки, отделяя запятой. Учитывая необыч- ность этого обозначения, уделим ему еще несколько слов. Как мы только что отметили, [z, у] есть замена обыч- ного функционального символа у (х)', оба эти символа обозначают скаляр, получающийся, если взять значение, принимаемое линейной функцией у на векторе х. Рассмот- рим аналогичную ситуацию (относящуюся, однако, к не- линейным' функциям). Пусть ^ — вещественная функция вещественного переменного, определенная для каждого вещественного числа х формулой у (х) = х2. Обозначение [х, у] есть символический способ выписки рецепта дей- ствий, которые на самом деле следует произвести; он соответствует предложению [возьми число и возведи его в квадрат]. Используя это обозначение, можно подытожить ска- занное так: каждому векторному пространству "Т мы относим сопряженное пространство состоящее из всех линейных функционалов на У*; каждой паре х, у, где я —вектор из иТ, а у — линейный функционал из Т', мы сопоставляем скаляр [а:, у], определяемый как зна- чение у на х. С применением символа [х, у] определяющее свойство линейного функционала выражается формулой [ад + ВД, у] = y] + a2[*2, у], (1) а определение линейных операций для линейных функ- ционалов — формулой [х, а1у1 + а2у2] = а1[х, у^ + а^х, у2]. (2) Совместно оба эти соотношения выражают, говоря, что [х, у] есть билинейный функционал векторов х из Т* и у из ТС'. Упражнения 1. Будем рассматривать множество всех комплексных чисел как вещественное векторное пространство (см. § 3, 9). Пусть для каждого х = (ц-НБг из $ (где — вещественные числа и 1 = (Л — 1) функция у определена формулой а) У (*) = 5i. Ь) у (х) = &г, 3*
36 ПРОСТРАНСТВА [ГЛ. I !/(*) = £?, У (д) = Е1 —%2. У (*) = /Si + Si- с) d) е) тельным числом всегда корень из этого числа.) В каких из этих случаев у является линейным функционалом? 2. Пусть для каждого z=(£i, ё21 5з) из !ё3 функция у опреде- лена формулой а) Ъ) с) d) В 3. мулой (Знаком квадратного корня перед положи- обозначается положительный квадратный У И = £14-?2, У (*)=fi—1з, У W=Sl + 1> у (z) = ^-2^4-3^. каких из этих случаев у является линейным функционалом? Пусть для каждого х из J1 функция у определяется фор- +2 у (х) = х (Z) dt, -1 а) 2 Ь) у(х)= J [X(OF dt, О 1 с) У (I)= t2x (t) dt, О 1 d) у (х) = х (t2) dt, о е) Нх) = ^-, y(x)=^U В каких из этих случаев у является линейным функцио- налом? 4. Пусть (ао, ап d2, ...) — произвольная последовательность п комплексных чисел. Для каждого элемента х из Й=0 п положим у(х) = ^ ?i«j- Доказать, что у—элемент из &>' и что iZo каждый элемент из .3®' может быть получен таким способом при надлежащем выборе чисел ц. 5. Пусть у — ненулевой линейный функционал на векторном пространстве V1 и d—произвольный скаляр; всегда ли существует вектор г из ‘F такой, что [г, у] = а?
s 15] СОПРЯЖЕННЫЕ БАЗИСЫ 37 6. Доказать, что если у и z — линейные функционалы (на одном и том же векторном пространстве), причем [х, у] = 0 всякий раз, как [х, z] = 0, то существует скаляра такой, что у = az. (Указание: предполагая [х0, z] =# О, взять a = [x0, у]/[хо, z].) § 15. Сопряженные базисы Еще несколько слов, прежде чем приступать к дока- зательствам важных теорем. Понятие сопряженного про- странства было определено безотносительно к каким- либо координатным системам; а уже беглый взгляд на нижеследующие доказательства обнаружит чрезмерное обилие координатных систем. Мы хотим подчеркнуть, что это явление неизбежно; мы собираемся установить резуль- таты, касающиеся размерности, а это — понятие, само определение которого^ (пока что) давалось в терминах базиса. Теорема 1. Пусть ТГ-п-мерное векторное про- странство и {xlf ...,хп} — его базис, каковы бы ни были скаляры alt ..., an, существует один и только один линейный функционал у на V такой, что [я4, y] = ai для i — 1, . .., п. Доказательство. Каждое г из F может быть однозначно записано в виде х — 4* .. . + если у — линейный функционал, то [*, У] = 51 [*!> ?/]+ • • • +5п[яп, у]. Из этого соотношения явствует единственность требуе- мого у, если [х4, у] = аг, то значение [х, у] определяется для каждого х формулой [х, у] = У, Это рассуждение г можно также обратить: если определить у формулой [я, у} = 5iai + • • • + то у действительно будет линейным функционалом и [жр у] = at. Теорема 2. Если У-п-мерное векторное про- странство и Ж = {xj, ...,хп} — его базис, то в V' существует единственный базис Ж' = {г/1, . .., уп}, обла- дающий тем свойством, что [х^ yj] = bij. Следовательно, пространство, сопряженное к п-мерному, п-мерно. Базис Ж' называют сопряженным к базису Ж.
38 ПРОСТРАНСТВА [ГЛ. I Доказательство. Из теоремы 1 следует, что для каждого j = l, ...,п может быть найдено един- ственное У] из такое, что у,] = Si;; остается только доказать, что множество ЯД = {yv. .., уп} есть базис пространства У*'. Во-первых, — линейно независимое множество, так как если ахух + ... -f-a,tz/n = O или, другими словами, если [ж, + • • • + апУп] = <*i [*, г/i] + ... + ап [ж, уп] = О для всех х, то для х = хг мы будем иметь О = 2 “j [я4, уj\ = 2 «Д,- = «г- i i Во-вторых, каждое у из ТС' является линейной комби- нацией векторов ух, .. ., уп. Чтобы доказать это, поло- жим [х£, у] = а4; тогда для ж = 2^Л будем иметь г у} = 5iai + • • • + Uan- С другой стороны, к. У}]=2^|Л- У]] = 1}- г Подставив в предыдущее равенство, получим [ж, у] = ах [х, ух] + ... + ап [х, уп} = = [*, ai?/i+ • • • + «по- следовательно, у = a1y1+ ... -\-апуп, и теорема до- казана. Нам потребуется также очевидное следствие теоремы 2. Теорема 3. Для любых двух различных векторов и, v п-мерного векторного пространства ТС существует линейный функционал у на ТС такой, что [н, у] =# [г», г/]; или, что равносильно этому, для любого ненулевого век- тора х из V найдется вектор у из ТС' такой, что [ж, у] =# 0. Доказательство. То, что два утверждения теоремы действительно равносильны, показывает рассмот- рение вектора ,х = и— v. В соответствии с этим будем доказывать, только последнее утверждение.
»1в] РЕФЛЕКСИВНОСТЬ 39 Пусть ^'={х1, .хп} — произвольный базис про- странства ТС, W = {У1, Уъ} — сопряженный базис в ТС'. Если х = то (как выше) [х, уД = Поэ- i тому, если [х, у} = 0 для всех у, и, в частности, если [ж, уД = О ДЛЯ 7 = 1, ...,п, то х = 0. § 16. Рефлексивность Естественно полагать, что если пространство ТС', сопряженное к векторному пространству ТС, и связи между пространством и его сопряженным представляют вообще какой-нибудь интерес для ТС, то они в той же мере представляют интерес и для ТС'. Другими словами, мы намереваемся теперь образовать пространство (F")', со- пряженное к ТС'-, для простоты мы будем обозначать его ТС". Словесное описание элемента из У*" громоздко: такой элемент является линейным функционалом от линей- ных функционалов. Однако именно в этом пункте про- является наибольшее преимущество обозначения [х, у]; с его помощью легко рассматривать ТС и его связь с ТС". Рассматривая символ [х, у} при некотором фиксиро- ванном у~у0, мы не получаем ничего нового: [х, у0] есть просто другой способ записи значения уй (х) функции у0 на векторе х. Однако если в символе [х, у] зафиксиро- вать некоторое х = хй, то мы заметим, что функция от векторов пространства ТС', значение которой на у равно [х0, у], есть скалярная функция, оказывающаяся линей- ной (см. § 14, (2)); другими словами, [х0, у] определяет линейный функционал на ТС' и, следовательно, элемент из Г". Этим методом мы выявили некоторые линейные функ- ционалы на ТС', но все ли? Для конечномерного случая ответ положителен, как показывает следующая Теорема. Если ТС — конечномерное векторное про- странство, то каждому линейному функционалу z0 на ТС' отвечает вектор хй из ТС такой, что z0 (у) = [х0, у] = у (хп) для каждого у из ТС'', соответствие z0 х0 между ТС" и ТС есть изоморфизм. Соответствие, описанное в этом утверждении, назы- вается естественным соответствием между ТС" и ТС.
40 ПРОСТРАНСТВА [ГЛ. I Доказательство. Рассмотрим это соответст- вие с точки зрения перехода от У к иначе говоря, каждому х0 из У поставим в соответствие вектор z0 из У", определяемый условием z0 (у) = у (я0) для каждого у из V' Так как [я, у] линейно зависит от х, то отображение х0 —> z0 линейно. Покажем, что это — взаимно однозначное отображе- ние У На его образ; другими словами, мы утверждаем, что если Яр я2 —векторы из У, a zlt z2 — соответствующие векторы из У" (так что г1(у) = [я1, у] и z2(y) = [я2, у] для всех у из V') и если zx = z2, то х± = х2. Сказать z1 = z2 все равно, что сказать [я15 у] = [я2, у] для каж- дого у из V'\ а тогда требуемое заключение следует из теоремы 3 § 15. Два последних абзаца вместе показывают, что множе- ство тех линейных функционалов z на У' (т. е. элементов из У"), которые действительно имеют требуемый вид (т. е. z (у) тождественно равно [я, у] при надлежащем подборе я из У), является подпространством простран- ства У", изоморфным У, и потому тг-мерным. Но тг-мер- ность У влечет тг-мерность У', которая в свою очередь влечет тг-мерность У". Следовательно, У" должно сов- падать со своим только что описанным тг-мерным подпро- странством, и теорема доказана. Важно отметить, что теорема устанавливает не только, что У и У" изоморфны — это тривиально вытекает из того факта, что они имеют одинаковую размерность,— но и то, что естественное соответствие есть изоморфизм. Это свойство векторных пространств называется рефлек- сивностью', каждое конечномерное векторное пространство рефлексивно. Часто оказывается удобным допускать в отношении У" некоторую неряшливость: в случае конечномерных век- торных пространств мы будем отождествлять У" с У (посредством естественного изоморфизма) и говорить, что элемент z0 из У" совпадает с элементом я0 из У, всякий раз, как z0(y) = [x0, у] для всех у из У'. На этом языке очень легко выразить связь между базисом ££ простран- ства У и базисом, сопряженным к его сопряженному, в У"; симметрия соотношения [яр у]=б^ показывает, что
S 17] АННУЛЯТОРЫ 41 § 17. Аннуляторы Определение. Аннулятором of ° подмножества (не обязательно подпространства) векторного простран- ства 5^ называется множество всех векторов у из У'' таких, что [х, г/] =0 для всех х из <У. Так, О° = У' и Т00 = 0(СУ‘'). Если Т конечномерно и of содержит ненулевой вектор, т. е. ^=0, то, как показывает теорема 3 § 15, <У° ф Т'. Теорема 1. Если рЛ — т-мерное подпространство п-мерного векторного пространства ТА, то <Ма есть (п — т)-мерное подпространство пространства f. Доказательство. Предоставляем читателю проверить, что а#0 (в действительности для произ- вольного всегда есть подпространство; остается дока- зать только утверждение, касающееся размерности . Пусть ЕЕ = {хг , . . . , хп } — базис в Т, первые т элементов которого взяты из а/Е (и потому образуют базис в с//); и пусть ЕЕ' = {yv . . ., уп} — сопряженный базис в Т". Обозначим через jT подпространство (в Т’'), натя- нутое на векторы уш+1, . . . , уп; очевидно JE имеет раз- мерность п — т. Докажем, что a/!ta=JE\ Любой вектор х из есть линейная комбинация век- торов ж15 . . . , хт, т Х = 2 г=1 так что для каждого / = т +1 , . . . , п имеем т Уу] — 2 = i=l Другими словами, принадлежит для / = т-1,. . . . . . , п\ следовательно, Ж С Л°. С другой стороны, пусть у — произвольный элемент из е<°. Принадлежа У', он является линейной комбинацией базисных векторов yv . . . , уп, п У=2ш >=*
¥L ПРОСТРАНСТВА [ГЛ. I Так как, по предположению, у принадлежит а#0, то для каждого i = 1, . . . , т имеем п о = К, у} = yj\ = другими словами, у есть линейная комбинация векторов pm+i,. .., уп. Это означает, что у принадлежит jfE, так что и теорема доказана. Теорема 2. Если М— подпространство конечно- мерного векторного пространства Е', то = —М. Доказательство. Отметим, что здесь мы поль- зуемся соглашением об отождествлении ТЕ и ТЕ", приня- тым в конце § 16. По определению, а'%°° есть множество всех векторов х таких, что [ж, у] =0 для всех у из Л°. Так как, по определению а/И°, [х, у] =0 для всех х из М и у из &#°, то заключаем, что а$О^0°. Для завершения доказательства остается привлечь размерностные сооб- ражения. Пусть ail m-мерно; тогда аЛ1° имеет размерность п — т, a еМ°° — размерность п — (п — т) = т. Значит, ail=Ma°, что и требовалось доказать. Упражнения 1. Построить ненулевой линейный функционал у на g3 такой, что для !! = (!, 1, 1) и г2 = (1, — 1) выполняются условия [яр у] = — [*2, У1 = 0- 2. Векторы хх = (1, 1, 1), я2 = (1, 1, —1) и х3 — (1, —1, —1) образуют в ft3 базис. Обозначая через {ylt у2, у3} сопряженный базис, найти [я, yj, [я, у2] и [х, у3], если х = (0, 1, ОЦ 3. Доказать, что если у — линейный функционал на п-мерном векторном пространстве Т3, то множество тех векторов х, для кото- рых [г, у] = 0, образует в Т3 подпространство; какова его размер- ность? 4. Пусть у(х) =gt+ g2+ |3, где х — (gt, g2, |3) — вектор из g3; показать, что у —линейный функционал на $3; найти базис под- пространства, состоящего из тех векторов х, для которых [х, у] =0. 5. Доказать, что если у1( ..., ут—линейные функционалы на n-мерном векторном пространстве Т3, причем ш<п, то в Т3 сущест- вует ненулевой вектор х такой, что [г, у?] — 0 для / = 1, ..., т. Что означает этот результат в приложении к решениям линейных уравнений?
i 17] АННУЛЯТОРЫ 43 6. Пусть ylt ... , Ут— линейные функционалы на п-мерном векторном пространстве Т3, причем m-<n. Каким условиям должны подчиняться скаляры at, ...,ат, чтобы существовал вектор х такой, что [х, у,] =; a;- для / = 1, гаг? Что означает этот результат в при- ложении к решениям линейных уравнений? 7. Если Т3 — га-мерное векторное пространство над конечным полем и то число гаг-мерных подпространств в Т3 равно числу (га— гаг)-мерных подпространств. 8. а) Доказать, что каково бы ни было подмножество конеч- номерного векторного пространства, совпадает с подпростран- ством, натянутым на . Ь) Если <5^ и <7—подмножества векторного пространства и , то с) Если с/7 и ./J'"'1 — подпространства конечномерного векторного пространства, то (з^П ,/(л')°—и (Ука- зание: последовательно применить Ь) и теорему 2 § 17.) d) Справедливо ли заключение пункта с), если векторные про- странства не обязательно конечномерны? 9. Подпространства, о которых идет речь в этом упражнении, не обязательно конечномерны; большинство его пунктов (но не все) опирается на какого-либо рода трансфинитные соображения, необ- ходимые для обоснования того, что каждое векторное пространство обладает базисом (ср. упражнение И § 7). а) Пусть. / и е — скалярные функции, определенные на множе- стве JgC; если а, (1 —скаляры, пусть h=af + Pg означает функцию, определяемую условием h(x)=aj(x) + Pg(x) для всех х из %. Мно- жество всех таких функций является векторным пространством при этом определении линейных операций, и то же справедливо для всех финитно-ненулевых функций. (Функция / на дг называется финитно-ненулевой, если множество тех х из %, для которых / (z) =# 0, конечно.) Ь) Каждое векторное пространство изоморфно множеству всех финитно-ненулевых функций на некотором множестве. с) Если Т3 — векторное пространство с базисом дг и / —ска- лярная функция, определенная на множестве %, то на Т3 существу- ет единственный линейный функционал у такой, что [х, y] = f(x) для всех х из d) Используя а), Ь) и с), доказать, что каждое векторное про- странство ‘У3 изоморфно подпространству пространства Т3'. е) Какие векторные пространства изоморфны своим сопря- женным? f) Если 2/ —линейно независимое подмножество векторного пространства СУ3, то в ‘7/3 существует базис, содержащий У. (Ср этот результат с теоремой § 7.) g)-Если ср—множество и у — его элемент, будем через fy обозначать скалярную функцию, определенную на <£ условием /и(х)= 1 или 0 соответственно тому, будет ли х = у или х =У у.
44 ПРОСТРАНСТВА [ГЛ. I Пусть 3/ — множество всех функций /у с присоединенной к ним функцией g, определенной условием g (х) = 1 для всех х из %. Дока- зать, что если бесконечно, то У — линейно независимое подмно- жество векторного пространства всех скалярных функций на %, h) Естественное отображение %0 в определено для всех векторных пространств (не только конечномерных): для каждого элемента хо из Т3 соответствующий ему элемент zo из определяет- ся условием zo(y) = [zo, у\ для всех у из Т3'. Доказать, что если Т3 рефлексивно (т. е. если каждое z0 из Т3" может быть получено таким образом при надлежащем выборе zo), то конечномерно. (Указание: представить V” в виде множества всех скалярных функций на неко- тором множестве и затем, пользуясь g), f) и с), построить элемент из У3", не порождаемый ни одним элементом из V'J.) Предостережение: утверждение, что векторное пространство рефлексивно тогда и только тогда, когда оно конечномерно, шокирует большинство знатоков вопроса. Причина — в том, что общепри- нятое и плодотворное обобщение понятия рефлексивности на бесконечномерные пространства является не столь простым, как данное в h). § 18. Прямые суммы Мы рассмотрим несколько важных общих методов построения новых векторных пространств из уже имею- щихся; в этом параграфе мы начнем с простейшего из этих методов. Определение. Пусть 7/ и Т — векторные про- странства (над одним и тем же полем). Их прямой суммой называется векторное пространство Ж (обозначаемое <7/©F'), элементами которого являются всевозможные упорядоченные пары у} с х из % и у из а линейные операции определены формулой «1 (^1. У1) + «2 (^2. Уг) = (ВД + ад. а1У1 + «2Уг>- Заметим, что образование прямой суммы аналогично способу построения плоскости по двум ее координат- ным осям. Перейдем к изучению связи этого понятия с некото- рыми понятиями, рассмотренными нами ранее Множество всех векторов вида (х, 0) образует в Ж* подпространство; соответствие {х, 0)^ta: показывает, что это подпространство изоморфно Удобно еще раз по- зволить себе логическую неаккуратность и, отождествляя х и (х, 0), говорить об как о подпространстве про- странства Разумеется, аналогичным образом векторы
ПРЯМЫЕ СУММЫ 45 S '81 у из У могут быть отождествлены с векторами вида (0, у) из и мы можем рассматривать У как подпространство в Ж. Конечно, эта терминология не совсем точна, но обойти логическую трудность здесь гораздо легче, чем в случае второго сопряженного пространства. Можно было бы определить прямую сумму 7/ и У (по крайней мере в том случае, когда Lll и У не имеют общих ненулевых векторов) как множество, содержащее все х из СЦ, все у из У и все те пары {х, у), в которых х Ф 0 и у 4= 0. Это определение приводит к теории, во всех деталях аналогичной той, которую мы разовьем, но она порождает неудобства при доказательстве теорем из-за вызываемой ею необходимо- сти различать отдельные случаи. Однако ясно, что с точки зрения этого определения СЦ действительно является под- множеством в В этом смысле, или с точностью до изоморфизма при принятом нами определении, поста- вим теперь вопрос: какова связь между U и У, если рас- сматривать эти пространства как подпроотранства объ- емлющего пространства WI Теорема. Если 7/ и У — подпространства век- торного пространства W, то следующие три условия эквивалентны'. 1) Ж = 7/©Г. 2) 7/Г|У=<Э и 9/ + У=W (т. е. 7/ и У служат до- полнениями друг к другу). 3) Каждый вектор z из Ж может быть записан одним и только одним способом в виде z = х у у, где х принад- лежит СЦ, а у принадлежит У. Доказательство. Мы докажем импликации 1) 2) 3) =Ф 1). 1) =Ф 2). Пусть Ж = 7/©У- Если z = (y у} принадле- жит одновременно 7/ и У, то х — у = 0, так что z = 0; это показывает, что 7/р]У = 0. Из того, что каждое z из Ж представимо в виде z = (х, 0) у (0, у), следует, что 7/ + У = Ж. 2) => 3). Если принять 2), так что, в частности, 7/ У У=Ж, то ясно, что каждое z из Ж обладает требуемым представлением z = х-{-у. Чтобы доказать единствен- ность; допустим, что z = х1~\~у1 и z = х2 У у2, где хг и х2 принадлежат 7/, а уг и у2 принадлежат У. Так как у у ух = х2 У у2, то хА — х2 = у2 — ух. Так как левая часть
46 ПРОСТРАНСТВА [ГЛ I этого равенства принадлежит %, а правая У, то из дизъ- юнктности подпространств СЦ и У следует, что х± = х2 и У1 = Уг- 3) 1). Эта импликация практически неотличима от определения прямой суммы. Если образовать прямую сумму‘Т/фУ, азатем отождествить (х, 0) и (0, у) соответ- ственно с х и у, то это обяжет нас к отождествлению сум- мы {х, у) — (х, 0) + (0, у) с тем, что по нашему предпо- ложению является общим элементом z = x + y про- странства W', из предположенной единственности пред- ставления z в виде х 4- у заключаем, что соответствие между (х, 0) и а: (а также между (0, у) и у) взаимно одно- значно. Если подпространства 7/ и У векторного простран- ства У дизъюнктны и в совокупности порождают У (т. е. если они удовлетворяют условию 2)), принято говорить, что У есть внутренняя прямая сумма % и У”; символиче- ски это, как прежде, записывают У = 9/@У. Желая оттенить различие между этим понятием и тем, которое было определено раньше, мы будем называть У в первом случае внешней прямой суммой 7/ и У. В силу рассмот- ренных выше естественных изоморфизмов и особенно вви- ду последней теоремы, это различие скорее формальное, чем по существу. В соответствии с нашим отождествитель- ным соглашением мы будем обычно игнорировать его § 19. Размерность прямой суммы Что можно сказать о размерности прямой суммы? Если 7/ n-мерно, У ш-мерно и У = ^/@У, то какова размерность У? На этот вопрос легко ответить. Теорема 1. Размерность прямой суммы равна сумме размерностей ее слагаемых. Доказательство. Мы утверждаем, что если {xlt . . ., xv} — базис пространства % и {ylt . . ., ут} — базис пространства У, то . множество {хг, . . ., хп, yt, . . ., ут} (или, более точно, множество {(а^, 0), . . . . . ., (xv, 0>, (0, {/!>, . . ., (0, ут)}) служит базисом в У. Простейшее доказательство этого утверждения состоит в использовании импликации 1) => 3) теоремы предыду- щего параграфа. Так как каждое z из У может быть запи-
§ 20] СОПРЯЖЕННОЕ К ПРЯМОЙ СУММЕ 47 сано в виде z = х + у, где х — линейная комбинация векторов хг, . . хп, а у — линейная комбинация век- торов уг, . . ут, то W действительно порождается ука- занным множеством. Чтобы показать, что это множество к тому же линейно независимо, допустим, что «Л + • • • + апхп + Р1У1 + • • + РтУт = О’ Из единственности представления 0 в виде х + у вытекает, что а А + ... + «л = + . .. + ₽mym = 0, а тогда из линейной независимости векторов х и линейной независимости векторов у следует, что «1= • • =«п=Р1= • • • =Рт = °- Теорема 2. Каковы бы ни были (п + т)-мерное векторное пространство W и его п-мерное подпространство СЦ, в 'W' существует т-мерное подпространство Т' такое, что W = cll@V'. Доказательство. Пусть {хг, . . ., xv} — ка- кой-либо базис в 7/; по теореме § 7 в найдется множе- ство векторов {ylt . . ., ут} такое, что {хг, . . ., хп, у±, . . ., ут} будет базцсом в Ж. Пусть У — подпростран- ство, натянутое на yv . . ., ут; мы опустим проверку того, что Ж* = еЦ@У'- Теорема 2 означает, что каждое подпространство конечномерного векторного пространства обладает до- полнением. § 20. Сопряженное к прямой сумме В дальнейшем понятие прямой суммы будет большей частью относиться к подпространствам векторного про- странства У; это избавит нас от хлопот с принятым в § 18 отождествительным соглашением и к тому же окажется наиболее полезным в ходе дальнейшей работы. А пока заключим наше изучение прямых сумм установлением простых связей между сопряженными пространствами, аннуляторами и прямыми суммами. Чтобы оттенить нашу нынешнюю точку зрения на прямые суммы, мы вернемся к прежним обозначениям.
48 ПРОСТРАНСТВА [ГЛ. Теорема. Если <Ли J' - подпространства вектор- ного пространства V и Уто еЛЬ' изоморфно изоморфно <М° и V. Доказательство. Для упрощения записи мы на протяжении этого доказательства будем обозначать буквами х, х ,х° соответственно элементы пространств Л' и и аналогично закрепим буквы у за и буквы z за Т. (Эта запись вовсе не должна означать, что, скажем, между векторами х из aft и х из М' существует какая-то особая зависимость.) Если г принадлежит одновременно а#° и t#’°, т. е. г (ж) = г (у) = 0 для всех хну, то г' (г) = z (х 4- у) = О для всех z; это показывает, что а<° и ,#‘° дизъюнктны. Далее, для любого вектора г' из Г' иг = х-\- у положим х° (z) = z (у) и у° (г) = г' (х). Легко видеть, что опреде- ленные так функции х° и у° являются линейными функ- циями на (т. е. элементами принадлежащими соответственно и из того, что z' =х°-\-у°, выте- кает, что V' действительно является прямой суммой И JT- Чтобы доказать утверждаемый изоморфизм, отнесем каждому х° функционал у' из определяемый равен- ством у' (у) = х°(у), и предоставим читателю шаблонную проверку того, что соответствие х° —> у' линейно и взаимно однозначно, а потому является изоморфизмом между и соответствующий результат для и all' полу- чается по симметрии перестановкой х и у. (Заметим, что для конечномерных векторных пространств одно лишь существование изоморфизма, скажем, между е#° и JT', тривиально следует из размерностных соображений; действительно, и jfT' имеют ту же размерность, что и Заметим по поводу всего нашего изложения теории прямых сумм, что в числе два нет ничего магического; можно было бы определить прямую сумму любого конеч- ного числа векторных пространств и доказать очевидные аналоги всех теорем трех последних параграфов, причем усложнились бы только обозначения. Предупреждаем, что позже мы воспользуемся этим замечанием и будем рассматривать вытекающие из него теоремы как дока- занные.
§ 21] ФАКТОРПРОСТРАЙСТВА 49 Упражнения 1. Пусть х, у, и и v—векторы из g4, а М и JV*—подпростран- ства в g4, натянутые соответственно на {х, у} и {и, v}. В каких из нижеследующих случаев ^4 = ®0ф.Ж“? a) z=(l, 1, 0, 0), у = (1, 0, 1, 0), и=(0, 1, 0, 1), р = (0, 0, 1, 1). Ъ) х = (— 1, 1, 1, 0), у = (0, 1, 1, 1), и = (1, 0, 0, 0), а=(0, 0, 0, 1). с) я = (1, 0, 0, 1), у = (0, 1, 1, 0), и=(1, 0, 1, 0), р = (0, 1, 0, 1). 2. Если М—подпространство, образованное теми векторами (bl> • • •. U. £п+1, • • •, ?2п) из g2n, для которых g1==.. .=gn = o, и ,jV'— подпространство тех векторов, для которых Zj = %n+j (i = 1, ..., п), то <&п=<М'§!Л\ 3. Построить три подпространства М, JV\ и JV\векторного про- странства так, чтобы = , но (Это означает, что для прямых сумм не существует закона сокращения). Каковагеометрическая картина, соответствующая этойситуации? 4. а) Пусть F и Ж—векторные пространства; какова связь между ®ф(ЖфЖ) и (®фЖ)фЖ (т. е. в каком смысле обра- зование прямых сумм является ассоциативной операцией)? Ь) В каком смысле образование прямых сумм коммутативно? 5. а) Три подпространства X, еМ и ЦУ векторного пространства Ж называются независимыми, если каждое из них дизъюнктно с суммой двух других. Доказать, что Ж =с£?ф(еЛф.#’) (а также Ж = (<$?ф^)Ф^) тогда и только тогда, когда М и ЦУ незави- симы и Ж = X+М-\г JV*. (Подпространство Х+М-УЦУ* есть множе- ство всевозможных векторов вида у+ z с я из <5?, у из и z из УУ.) Ь) Привести пример трех подпространств векторного простран- ства Ж, образующих в сумме Ж, попарно дизъюнктных и тем не менее не являющихся независимыми. с) Пусть х, у и г — элементы векторного пространства, а X, <М и ЦУ, соответственно,— порожденные ими подпространства. Доказать, что векторы х, у и z линейно независимы тогда и только тогда, цогда подпространства X, М и ЦУ независимы. d) Доказать, что три конечномерных подпространства незави- симы тогда и только тогда, когда сумма их размерностей равна размерности их суммы. е) Обобщить результаты а) — d) с трех на любое конечное число подпространств. § 21. Факторпространства Как мы уже знаем, если а# — подпространство век- торного пространства (Ж, обычно существует много других подпространств в ТГ таких, что . Не суще- 4 п. Халмош
50 ПРОСТРАНСТВА [ГЛ. I ствует никакого естественного способа отличать из всего множества дополнений к &Ж какое-то одно. Однако суще- ствует естественная конструкция, связывающая с М и У новое векторное пространство, играющее для всех прак- тических целей роль дополнения к М. Теоретическое преимущество, которое эта конструкция имеет перед образованием произвольного дополнения, заключается именно в ее «естественном» характере, т. е. в том, что она не зависит от выбора какого-нибудь базиса, да, собствен- но говоря, и вообще от выбора чего бы то ни было. Чтобы понять эту конструкцию, неплохо иметь в виду какой-нибудь образец. Предположим, например, что У=J?2 (вещественная координатная плоскость), а М состоит из всех тех векторов (£п £2), для которых £2= 0 (горизонтальная ось). Каждое дополнение к есть прямая (отличная от горизонтальной оси), проходящая через начало. Заметим, что всякое такое дополнение обла- дает тем свойством, что оно пересекает каждую горизон- тальную прямую точно в одной точке. Идея описываемой конструкции состоит в превращении множества всех горизонтальных прямых в векторное пространство. Прежде всего выделим с помощью ftft некоторые под- множества из У. (Мы снова вернулись к общему случаю.) Для произвольного вектора х из У обозначим через xft-a/ft множество всевозможных сумм х-\-у с у из s#; каждое множество вида xft-a/ft называется смежным классом по dft. (В предыдущем примере плоскости с выде- ленной прямой смежные классы — это горизонтальные прямые.) Заметим, что один и тот же смежный класс может порождаться двумя разными векторами, т. е. даже если х #= у, может случиться, что ж 4 а#= y-fta/ft. Тем самым имеет смысл говорить о смежном классе, скажем, по aft, не указывая, от .какого элемента (или элемен- тов) он получился; сказать, что gft? есть смежный класс (по а#), означает просто, что существует по крайней мере одно такое х, что gft?~x-ftaft. Пусть q%? и eft—смежные классы (по а#); обозначим через eft? -(- eft? множество всевозможных сумм и 4- v с и из ffi? и v из eft?', мы утверждаем, что eft? -|- eft? также является смежным классом по aft. Действительно, если eft? =х-ft aft и eft?—у ft-aft, то каждый элемент из ftft? ft-eft? принадлежит
§ 22] РАЗМЕРНОСТЬ ФАКТОРПРОСТРАНСТВА 51 смежному классу (х-}гу)лЛ1 (заметим, что <М и, обратно, каждый элемент из (х + у) + <М принадлежит + <%". (Если, например, z принадлежит»#, то (х+у) + z= = (x + z) + (у + 0).) Другими словами, — = (ху)&Я, так что e%? + <yf есть смежный класс, что и утверждалось. Предоставим читателю проверку того, что сложение смежных классов коммутативно и ассоциативно. Смежный класс (т. е. 0 Ц- &#) таков, что + е#для любого смежного класса Stf, причем —единственный смежный класс, обладающий таким свойством. (Если (х + Л1) + (у + е#) = х -|-all, то х-\-<М содержит х^гу, так что я + у = хи для некоторого и из </; отсюда у принадлежит <М, а потому у -\-Л1=аИ.) Если @%?—смеж- ный класс, то множество, состоящее из всех векторов —и, где и принадлежит е%?, тоже является смежным классом; мы будем обозначать его —$№. Смежный класс —таков, что е%? + (—причем ——единственный смеж- ный класс, обладающий таким свойством. Подытожим: сложение смежных классов удовлетворяет аксиомам А § 2. Пусть —смежный класс и а — скаляр; если а #= 0, обозначим через affi? множество, образованное всевоз- можными векторами аи с низ под Gift? будем понимать о#. Простая проверка показывает, что так определенное умножение удовлетворяет аксиомам В и С § 2. Таким образом, доказано, что множество всех смежных классов является векторным пространством относительно определенных выше линейных операций. Это векторное пространство называется факторпространством простран- ства 5^ по подпространству (или модулю) М и обозначает- ся ТГ /&Я. § 22. Размерность факторпространства Теорема 1. Если &Я и ЛЯ—дополнительные друг к другу подпространства векторного пространства Т', то соответствие, относящее каждому вектору у из Л^ смежный класс у-\-М, является изоморфизмом между ЛЯ и Т/Л1. Доказательство. Если у1. г/2—элементы из ЛЯ такие, что = то, в частности, ^принадле- жит i/a-|-s/Z, а потому у^ — у^-'х, где х принадлежит Л1 4*
52 ПРОСТРАНСТВА [ГЛ. I Так как это означает, что yL—у2= х, а®# и дизъюнктны, то х = 0 и, следовательно, Ух=у2. (Напомним, что вместе с ух и у2 также уг~у2 принадлежит Это рассуждение показывает, что изучаемое нами соответствие взаимно одно- значно на том, что оно охватывает. Чтобы доказать, что оно охватывает достаточно много, рассмотрим произ- вольный смежный класс по скажем, z-q-c#. Так как + z можно записать в виде у^х сгиз^иу из отсюда вытекает (поскольку х-\-<М=е$), что z<М =у<М. Это показывает, что каждый смежный класс по oj'ft может быть получен выбором некоторого эле- мента из (взамен какого-нибудь прежнего элемента из У); следовательно, у —> у-|-е/# — действительно взаимно однозначное соответствие между и У/е#. Линейность этого соответствия следует непосредственно из опреде- ления линейных операций в ’T'larfl-, в самом деле, (а^! + а2у2) + a# = ах (^ 4- <з#) + а2 (у2 + е#). Т е о р е м a 2. Если — т-мерное подпространство п-мерного векторного пространства У, то У/®^ имеет размерность п — т. Доказательство. По теореме 2 § 49 можно найти такое подпространство jff*, что ®^©.У=У. Про- странство имеет размерность п — т (по теореме 1 § 19), и это пространство изоморфно пространству У/®< (по только что доказанной теореме 1). В теории факторпространств существует немало вопро- сов, которые можно было бы рассмотреть (например, о связи этих пространств с сопряженными пространствами и аннуляторами). Поскольку, однако, большинство таких вопросов представляет собой едва ли больше, чем упражне- ния, требующие использования техники, которой мы уже располагаем, мы обратимся вместо этого к некоторым новым и неочевидным способам построения полезных векторных пространств. Упражнения 1. Рассмотрим факторпространства, получаемые путем факто- ризации пространства всех полиномов по различным его под- пространствам. Если М = ?Рп, будет ли &>1<М конечномерным? А если М—подпространство, состоящее из всех четных полиномов?
§ 23] БИЛИНЕЙНЫЕ ФОРМЫ 53 А если <М—подпространство, состоящее из всех полиномов, деля- щихся на хп (где xr,{t} = <”)? 2. Пусть $ и J — произвольные подмножества векторного пространства (не обязательно смежные классы по какому-нибудь подпространству); ничто не мешает нам определить^ -|- J точно так, как определялось сложение для смежных классов, и аналогич- но можно определить аа? (где а — скаляр). Какие аксиомы вектор- ного пространства выполнены при наделении класса всех подмно- жеств векторного пространства этими «линейными операциями» ? 3. а) Пусть М—подпространство векторного пространства Ж. Два вектора хну называются сравнимыми по модулю &№, символи- чески х = у (еМ), если х—у принадлежит М. Доказать, что срав- нимость по модулю еМ есть отношение эквивалентности, т. е. что оно рефлексивно (х = х), симметрично (если х = у, то у = х) и транзитивно (если х = у и у = z, то х = z). Ь) Если аг, а2 — скаляры, a xlf хг, у, и у2 векторы, для которых х± = у-t (vfl) и х2 = у2 {М}, то = а1уг+а2у2 (®$). с) Сравнимость по модулю <М разбивает Ж на классы эквива- лентности, т. е. такие множества, что два вектора принадлежат одно- му и тому же множеству тогда и только тогда, когда они сравнимы. Доказать, что подмножество векторного пространства ‘V1 является классом эквивалентности по модулю -М тогда и только тогда, когда оно является смежным классом по М. 4. а) Пусть М—подпространство векторного пространства Ж. Каждому линейному функционалу у на (т. е. каждому элемен- ту у из отвечает линейный функционал z на %® (т. е. элемент z из У3'), определяемый равенством z (х) = у(х-\-<М). Доказать, что соответствие у -»z есть изоморфизм между (Ж/®Й5)' и М°. Ь) Пусть <М — подпространство векторного пространства Ж. Каждому смежному классу у+аЖ по М° в Ж' (т. е. каждому эле- менту о№ из Ж'/оЖ) отвечает линейный функционал z на <М (т. е. элемент z из еЖ), определяемый условием z(z) = y(z). Доказать, что z однозначно определяется смежным классом && (т. е. не зави- сит от специального выбора у) и что соответствие -> z есть изо- морфизм между Ж'/аЖ И еМ'. 5. Пусть -Ж— конечномерное векторное пространство и Ж = = ЖфЖ'. Доказать, что соответствие \х, у} -> (у, х} есть изомор- физм между Ж и Ж'. § 23. Билинейные формы Прямая сумма Ж= 7/©У векторных пространств 7/ и У (над одним и тем же полем) снова есть векторное про- странство; мы собираемся изучить некоторые функции на Ж. (Для этой цели первоначальное определение 7/©У, с помощью упорядоченных пар, наиболее подходяще.) Значение такой функции, скажем w, на некотором эле- менте {х, у) из Ж будем обозначать w (х, у). Рассмотрение
54 ПРОСТРАНСТВА [ГЛ. 1 линейных функций на Ж1 уже не представляет для нас особого интереса; основные относящиеся к ним факты были рассмотрены в § 20. Теперь мы хотим рассмотреть билинейные функции; по определению, это скалярные функции на У*, обладающие тем свойством, что для каж- дого фиксированного значения любого из аргументов они линейно зависят от другого. Более точно, скалярная функ- ция w на W называется билинейной формой (или билиней- ным функционалом), если w (ал + а2х2, у) = axw fo, у) ф- а2да (ж2, у) И да (ж, а1?/1 + а2г/2) = а1да(ж, У1) + а2да (*> У2) тождественно относительно всех входящих векторов и ска- ляров. В одной специальной ситуации нам уже встретились билинейные функционалы. А именно: если ТС— про- странство, сопряженное к 41, ТС=41', и да (х, у) = [х, у] (см. § 44), то да — билинейный функционал на 41@4Г • В качестве примера более общей ситуации, пусть 41 и У— произвольные векторные пространства (как всегда, над одним и тем же полем), и и v — элементы, соответ- ственно, из 41' и У', и да (х, у) = и (х) v (у) для всех х из 41 и у из У. Еще более общий пример получим, выбрав конечное число элементов в 41', скажем, ult ..., uh, и такое же число элементов в У', скажем, п1, . . ., vh, и положив да (х, у) = иг (х) (у) +. . . + uk (х) vk (у). Какое из слов «функционал» или «форма» употребляется, зависит отчасти от контекста, и, пожалуй, еще больше от прихоти автора. В этой книге мы будем обычно упо- треблять «функционал» с прилагательным «линейный» и «форма» с прилагательным «билинейная» (и его много- мерными обобщениями). Пусть дах и да2 — билинейные формы на У*, aj и а2 — скаляры и да — функция на У*, определяемая формулой да (х, у) = a^i (ж, у) + а2да2 (х, у). Легко видеть, что да — билинейная форма; мы будем обо- значать ее а1да1 + а2да2. При таком’ определении линейных операций множество всех билинейных форм на У* является
§ 23] БИЛИНЕЙНЫЕ ФОРМЫ 55 векторным пространством. Основная цель дальнейшей части этого параграфа — установить (для конечномерного случая), как размерность этого пространства зависит от размерностей ‘2/ и ТС. Теорема!. Если Ц — п-мерное векторное простран- ство с базисом {хх, . . ., хп} и ТС-m-мерное векторное пространство с базисом {yY, . . ., ут], то для всякого множества пт скаляров {%} (i = 1, . . ., п; j = 1, . . ., т) существует и притом только одна билинейная форма w на (и@У' такая, что w (xt, у,) = ai;- для всех i и j. Доказательство. Если х — 2 у = 2 Л/У, Г j и ш — билинейная форма на <2/©У* такая, что w (xv у}} = = aj7-, то w {х, у)=2 2 &ля (^> Уз) = 23 ^ла,- i j i j Из этого равенства явствует единственность w; существо- вание же требуемого w доказывается прочтением того же равенства справа налево, т. е. принятием его за определе- ние w. (Сравнить этот результат с теоремой 1 § 15.) Теорема 2. Если6}/—п-мерное векторное простран- ство с базисом {xlt . . хп} и ТС -m-мерное векторное пространство с базисом {у1, . . ., ут], то векторное пространство W всех билинейных форм на 7/ ©F* обладает однозначно определенным базисом {&ур9} (р = 1, . . ., п; q = 1, . . ., т}, удовлетворяющим условиям wpq (xit у^) = = 6ip6-q. Следовательно, размерность пространства всех билинейных форм на CU@C‘ равна произведению размер- ностей 7/ и ТС. Доказательство. Применяя теорему 1, опре- делим wpq (для каждого фиксированного р и q) заданным условием wpq (xt, у^ — 6ip6jq. Так определенные билиней- ные формы линейно независимы, ибо из 2 2 ^pq^pq ~ О р q следует, что 0=22 ^pq^ip^jq = р q
56 ПРОСТРАНСТВА [ГЛ. I Кроме того, если w — произвольный элемент из Ж и w (хг, — aip то w = 2 S aPqwpq- Действительно, при р 1 *= S (/ = 2 имеем i j (*> У) = 3 S ^jbipbjq = £РЧг г } а потому W {х, у) = 3 S £ДЬ«г j = S S OpqWpq & У) i 3 Р Q Следовательно, векторы wpq образуют базис пространства билинейных форм, и теоремй доказана. (Сравнить этот результат с теоремой 2 § 15.) Упражнения 1. а) Если ш—билинейная форма на 31п фЛп, то существуют скаляры ai?- (i, / = 1, ..., п) такие, что, каковы бы ни были * = (51, •••, 5п) и У=(П1, •••, Пп), у)=2 СкаляРы i j ai} однозначно определяются формой w. Ь) Если z — линейный функционал на пространстве всех билинейных форм на /Я’1 ф .4'1п, то существуют скаляры такие, что (в обозначениях из а)) z (ш) = 2 2 aijPij Для кажД0Г0 w- Ска- » i ляры p,j однозначно определяются функционалом z. 2. Билинейную форму w на й фУ® называют вырожденной, если как функция одного из своих аргументов она тождественно равна нулю для некоторых ненулевых значений другого аргумента; в противном случае ее называют невырожденной. а) Привести пример вырожденной (пе тождественно нулевой) билинейной формы на Ь) Привести пример невырожденной билинейной формы на gs®g2- 3. Если w — билинейная форма на ^фТ0, у0 — элемент из Ж и у — функция на 41, определенная равенством у (x) = w (х, уо), то у — линейный функционал на 41. Верно ли, что если форма w—невырожденная, то каждый линейный функционал на 41 может быть получен таким способом (надлежащим выбором уо)? 4. Пусть для всех х и у из функция w определена равенством: 1 а) w (х, у) = аГ(<) у (t) dt, о b) w(x, у) = »(!) +у (1),
ТЕНЗОРНЫЕ ПРОИЗВЕДЕНИЯ 57 § 24] С) ш(х, у) = Я (1)-1/(1), d) ш(х, y)=^(l)(-J)j=1 В каких из этих случаев w является билинейной формой на 5ЭП ф <^>п? В каких случаях она невырожденна? 5. Существуют ли векторное пространство Ж и билинейная фор- ма w на Ж ф Ж такие, что ш не равно тождественно нулю, по ш(х, х) = 0 для каждого х из Ж? 6. а) Билинейную форму ш на ф Ж называют симметричной, если w (х, у) = ш (у, х) для всех х и у. Квадратичной формой на cl/z> называют функцию g на Ж, получающуюся из билинейной формы w, если положить q(x)=w(x, х). Доказать, что если характеристика основного скалярного поля отлична от 2, то каждая симметричная билинейная форма однозначно определяется соответствующей квадратичной формой. Что случится, если характеристика равна 2? Ь) Могут ли несимметричная и симметричная билинейные фор- мы определить одну и ту же квадратичную форму? § 24. Тензорные произведения В этом параграфе будет описан , новый метод построе- ния из двух векторных пространств третьего, а именно их тензорного произведения. Нам представится относитель- но мало случаев использовать тензорные произведения, но их теория тесно соприкасается с некоторыми рассмат- риваемыми далее вопросами, а также применяется в дру- гих родственных разделах математики, как теория пред- ставления групп и тензорное исчисление. Это понятие суще- ственно сложнее понятия прямой суммы; поэтому мы начнем с рассмотрения некоторых примеров, показываю- щих, как должны выглядеть тензорные произведения; мы будем руководствоваться этими примерами при уста- новлении определения. Пусть СЦ — множество всех полиномов, скажем, с комплексными коэффициентами от одной переменной s; V — множество всех полиномов от другой переменной i; и наконец, Ж — множество всех полиномов от двух пере- менных s и t. С очевидными определениями линейных опе- раций,. 7/, Т* и Ж являются комплексными векторными пространствами; в этом случае нам было бы желательно назвать Ж, или нечто подобное ему, тензорным произве- дением % и Ж. Одним из оснований для такой терминоло- гии является то, что если взяты некоторое х из 7/ и неко- торое у из У, то можно образовать их произведение, !, е
58 ПРОСТРАНСТВА [ГЛ. I элемент из Ж, определенный равенством z (s, f)=x (s) у (i). (Это — обычное произведение двух полиномов. Здесь, как и раньше, мы упорно игнорируем то не относящееся к делу обстоятельство, что можно перемножать и два эле- мента из сЦ , т. е. что произведение двух полиномов от одной и той же переменной есть снова полином от этой перемен- ной. Векторные пространства, в которых определено хо- рошее понятие умножения, называют алгебрами, и их изучение, как таковое, выходит за рамки этой книги.) В предыдущем примере рассматривались векторные пространства, элементами которых служат функции. При желании можно было бы считать и обычное векторное пространство совокупностью функций; областью опре- деления в этом случае является множество, состоящее ровно из п точек, скажем, из п первых (строго) положи- тельных целых чисел. Другими словами, вектор (|х, ..., £„) можно считать функцией £, значение которой £ (i) опре- делено для г = 1, . . . , и; определение векторных операций в 'гУ таково, что в нойых обозначениях они соответствуют обычным операциям, выполняемым над функциями £. Если одновременно рассматривать как совокуп- ность функций т], значение которых т; (/) определено для 7 = 1, . . ., т, то было бы желательно считать тензорным произведением 'ё” и сЗт множество всех функций £, значение которых £ (i, j) определено для i=l, . .., п и / = 1, .. ., т. Другими словами, тензорное произведение здесь — совокупность всех функций, определенных на множестве, состоящем ровно из пт элементов, а потому, естественно, изоморфно <ёпт. Этот пример выявляет свой- ство тензорных произведений, а именно мультипликатив- ность размерностей, — которое было бы желательно со- хранить в общем случае. Попытаемся теперь выделить самые важные свойства этих примеров. Определение прямой суммы было одним из возможных способов придать строгий характер грубой интуитивной идее — написать, формально, сумму двух векторов, принадлежащих различным векторным про- странствам. Подобно этому, наши примеры наводят на мысль, что тензорное произведение °Ц ® 1'" двух вектор- ных пространств 7/ и У должно было бы быть таким, чтобы каждому х из 7/ и каждому у из У отвечало некое «про-
§ 25] ПРОИЗВЕДЕНИЕ БАЗИСОВ 59 изведение» ,z = x®y в <11- причем это соответствие между х и z для каждого фиксированного у, так же как соответствие между у a z для каждого фиксированного х, было линейным. (Разумеется, под этим понимается, что (dpT! + а2г2) ® у должно быть равно ах (zj ® у) + а2 (х2 ® у) и что аналогичное равенство должно выполняться для ж 0 («12/1 + а2у2).) Проще говоря, х ® у должно определять билинейную (векторную) функцию от х и у. Понятие формального умножения наводит также на мысль, что если и и v — линейные функционалы соответ- ственно на % и F, то их произведение w, определяемое равенством w(x, у) = u(x)v(y), должно быть в некото- ром смысле общим элементом сопряженного пространства (7/ 0У")'. Заметим, что это произведение есть билиней- ная (скалярная) функция от х и у. § 25. Произведение базисов Еще одно небольшое предварительное пояснение, и мы сможем обсудить формальное определение тензорного произведения. Оказывается, что технически удобней по- дойти к 7/ ® V окольным путем, определив его как сопряженное к некоторому другому- пространству; для получения самого 7/ ® Т мы неявно воспользуемся реф- лексивностью. Поскольку рефлексивность была доказана лишь для конечномерных пространств, мы ограничим наше определение только такими пространствами. Определение. Тензорным произведением 7/ ® Т' двух конечномерных векторных пространств 7/ и V (над одним и тем же полем) называется пространство, сопря- женное к векторному пространству всех билинейных форм на 7/ © V. Для каждой пары векторов х и у с х из <U пу из 'Т* их тензорное произведение z = х ® у есть элемент из 7/ ® Т", определенный для каждой билинейной фор- мы w равенством z (w) = w (х, у). Это определение является одним из самых быстрых строгих подходов к теории, но позже оно приводит к не- которым неприятным техническим осложнениям. Заме- тим, однако, что каковы бы ни были его недостатки, оно, очевидно, обладает двумя требуемыми свойствами: а именно ясно, что размерность мультипликативна
60 ПРОСТРАНСТВА [ГЛ. I (см. теорему 2 § 23 и теорему 2 § 15) и что х ® у линейно зависит от каждого своего сомножителя. Другое возможное (и заслуженно популярное) опре- деление тензорного произведения — это определение с помощью формальных произведений. Согласно этому определению, СЦ,®'Е' получается, если рассмотреть все- возможные символы вида 2 0 у) ив множестве г таких символов произвести отождествления, требуемые линейностью векторных операций и билинейностью тен- зорного умножения. (Для ревнителей строгости: в этом определении х ® у означает просто упорядоченную пару х и у; знак умножения есть просто напоминание о наме- рениях.) Ни то, ни другое определение не просто; мы предпочли данное нами потому, что оно кажется более гармонирующим с духом последующего изложения. Основной недостаток нашего определения в том, что его нелегко распространить на наиболее важные обобщения конечномерных векторных пространств, а именно на мо- дули и бесконечномерные пространства. Пока мы докажем только одну теорему о тензорных произведениях. Эта теорема служит еще одним оправда- нием использования терминологии, принятой для про- изведений, и, кстати, уточняет утверждение о мульти- пликативности размерности. Теорема. Если = {агр ..., хп} и У = {ylt ..., ут} — базисы соответственно в С11 и то множество Z векто- ров 2у = х{ 0 у. (i = 1, .. ., л; / = 1, . . ., т) является базисом Доказательство. Пусть wVQ — билинейная форма на сЦ@аЕ' такая, что ® ^) = (г, р = 1, . . ., л; /, q = 1, .. ., лг); существование таких билинейных форм, и тот факт, что они образуют базис пространства всех билинейных форм, следуют из теоремы 2 § 23. Пусть {к^} — сопряженный базис в СЦ ® Т, так что |щ0-, wpq] = 6ip6JQ. Для произ- вольной билинейной формы w = 2 2 apqwpq на си®Т р <?
§ 25] ПРОИЗВЕДЕНИЕ БАЗИСОВ 61 имеем w'ij (ш) = [w, w'ij] = 2 3 = = у,)=гц (w). Р 9 Справедливость утверждения теоремы следует теперь из того, что векторы ьиу образуют базис пространства 'У/ ®У\ Упражнения 1. Пусть х = (1, 1) и у = (1, 1, 1) — векторы соответственно в .‘Й2 и найти координаты х0у в ,.922®._?23 относительно произ- ведения базисов {x^yj}, где х{ = (д{1, di2), а у3 = (д1у> б2з, д3з). 2. Пусть ^п,т—пространство всех полиномов z от двух пере- менных s, t с комплексными коэффициентами, таких, что либо z = 0, либо z (s, t) имеет степень •'m— 1 для каждого фиксирован- ного 5 и -С га— 1 для каждого фиксированного t. Доказать, что между .:fJn ® £Рт и ,iPn> т существует изоморфизм, при котором элемент z из £Рп> т, соответствующий х® у (с х из .'Рп и у из 2Рт), задается равенством z (s, t) —х (s) у (Z). 3. В какой мере образование тензорных произведений комму- тативно и ассоциативно? Как обстоит дело с дистрибутивным законом ®0(F©f) = (lZ®^)©(® ®Ж)? 4. Верно ли, что если ж и у —элементы конечномерного вектор- ного пространства, то х®у = у®х? 5. а) Пусть Т3— конечномерное вещественное векторное про- странство, а ®—множество g всех комплексных чисел, рассма- триваемое как (двумерное) вещественное векторное пространство. Образуем тензорное произведение ‘7/3+ = ®®тэ. Доказать, что существует способ определения умножения элементов из Ръ+ на комплексные числа, при котором а (х ® у) = ах® у для всех а и х из 4S и у из Т3. Ь) Доказать, что относительно векторного сложения и умноже- ния на комплексные скаляры, определенного как в а), Т3+ являет- ся комплексным векторным пространством. с) Выразить размерность комплексного векторного простран- ства Т3+ через размерность вещественного векторного простран- ства d) Доказать, что векторное пространство изоморфно под- пространству пространства Т"+ (рассматриваемого как веществен- ное векторное пространство). Мораль этого упражнения в том, что не только каждое комплекс- ное векторное пространство можно рассматривать как вещественное векторное пространство, но в определенном смысле верно и обратное. Векторное пространство 7/3+ называется комплексификацией про- странства ^/3. 6. Пусть Я1 и Т3—конечномерные векторные пространства; что представляет собой пространство, сопряженное к ^Z'®^'?
62 пространства гл. J § 26. Перестановки Основной предмет этой книги принято именовать линейной алгеброй. Однако в трех последних параграфах упор был сделан на нечто, называемое полилинейной алгеброй. Трудно точно сказать, где пролегает граница между двумя этими предметами. А так как каждый из них весьма обширен, было бы непрактично пытаться втис- нуть детальное изучение обоих в одну книгу. Но нежела- тельно рассматривать линейную алгебру и в абсолютно чистом виде; добавление даже небольшой порции поли- линейной теории (подобной содержащейся в современном изложении тензорных произведений и определителей) расширяет область применимости линейной теории далеко непропорционально затраченным усилиям. Поэтому- мы намерены продолжить изучение полилинейной алгебры; наша цель заключается в том, чтобы проложить более или менее прямой путь от знаний, которыми мы уже рас- полагаем, к основным фактам, касающимся определи- телей. Имея это в виду, мы посвятим три следующих параграфа рассмотрению некоторых простых фактов ком- бинаторики; связь этих фактов с полилинейной алгеброй выяснится сразу же после этого изучения. Под перестановкой целых чисел от 1 до к (включи- тельно) мы будем понимать взаимно однозначное пре- образование, относящее каждому такому целому другое (а возможно и то же самое) целое из той же совокуп- ности. Говоря, что преобразование л взаимно однозначно, мы, естественно, имеем в виду, что если л (1), . .., л (к) — целые числа, которые л относит числам 1, ..., к, то равен- ство л (i) = л (/) может иметь место только в случае i = j. Поскольку это влечет то, что оба множества {1, ...,к} и {л (1), ..., л (к)} состоят точно из к элементов,' отсюда следует, что они состоят точно из одних и тех же элемен- тов. Отсюда, в свою очередь, заключаем, что перестанов- ка л множества {1, . . .,/с} отображает это множество на себя, т. е., если 1 -< /< к, существует по крайней мере одно (и на самом деле ровно одно) i такое, что л(г) = /. Общее число рассматриваемых целых чисел, а именно к, будет считаться далее фиксированным.
ПЕРЕСТАНОВКИ 63 § 26] Теория перестановок, как и всякая теория вообще, будет понятней в свете каких-либо нетривиальных при- меров. Однако, прежде чем приводить какие-то примеры, напомним, что вообще можно делать с перестановками; благодаря этому примеры пояснят не только само основ- ное понятие, но и его основные свойства. Если а иг — произвольные перестановки, можно опре- делить еще одну перестановку (обозначаемую пт), поло- жив (стт) (г) = ст (ti) для каждого i. Чтобы показать что стт — действительно перестановка, заметим, что если (стт) (ё) = (стт) (у), то т(Ё) = т(у) (поскольку ст взаимно однозначно), а потому i = j (поскольку т взаимно однозначно). Перестановка стт называется произведением перестановок ст и т. Преду- преждение: порядок существен. В общем случае стт тст, или, другими словами, умножение перестановок не ком- мутативно. Умножение перестановок ассоциативно, т. е. если л, стит — перестановки, то (лст) т = л (стт). (1) Чтобы доказать это, нужно показать, что ((лст) т) (г) = (л (от)) (г) для каждого г. Доказательство состоит из нескольких применений определения произведения, а именно: ((лст) т) (г) = (лст) (тё) = л (ст (т (Ё))) и (л (от)) (г) = л ((от) (г)) = л (ст (т (Ё))). Основываясь на этом результате, мы можем — и будем — опускать скобки при записи произведения трех или более перестановок. Этот результат позволяет также доказать очевидные законы действий со степенями. Степени пере- становки л определяют по индукции, полагая лх = л и лр+1 = л-лр для всех р = 1, 2,3, ...; из ассоциатив- ного закона следует, что лрл9 = лр+9 и (лр)9 = лР9 для всех р и q. Заметим, что любые две степени перестановки перестановочны друг с другом, т. е. лрл9 = л3л<
64 ПРОСТРАНСТВА [ГЛ. 1 Простейшая перестановка — тождественная (обозна- чаемая е); она определяется условием e(i) = i для каж- дого i. Какова бы ни была перестановка л, ел = ле = л; (2) другими словами, умножение на е оставляет каждую пере- становку неизменной. Доказательство непосредственно: для каждого i имеем (ел) (i) = 8 (л (/)) = л (i) и (ле) (i) = л (е (г)) = л (г). Относительно умножения перестановка е ведет себя так же, как число 1. По аналогии с соглашением, принятым для чисел, нулевая степень любой перестановки опреде- ляется равенством л° = е. Для каждой перестановки л существует перестановка (обозначаемая л"1) такая, что Л"1Л = ЛЛ'1 = 8. (3) Для определения л'1 (у), где, конечно, 1<у< к, находим единственное i такое, что л(£) = у, и пишем л-1(у) = 1; справедливость равенств (3) есть непосредственное след- ствие определений. Перестановка л'1 называется обратной к перестановке л. Пусть <У\ — множество всех перестановок целых чисел от 1 до к. Доказанное до сих пор сводится к тому, что для элементов множества <ifk может быть определена операция умножения, причем 1) это умножение ассоциативно, 2) существует тождественный элемент, т. е. элемент, умножение на который оставляет л:юбой элемент из afk неизменным, и 3) каждый элемент обладает обратным, т. е. элементом, произведение которого с данным есть тождественный элемент. Множество, удовлетворяющее условиям 1)—3), называют группой относительно поня- тия умножения, к которому они относятся; в частности, множество называют симметрической группой степе- ни к. Заметим, что целые 1, . .., к можно было бы заме- нить любыми к различными объектами. Это не затронуло бы ни одного из определенных выше понятий, измени- лись бы только обозначения.
5 27] ЦИКЛЫ 65 § 27. Циклы Вот простой пример перестановки: выбираем любые два различных целых числа в пределах от 1 до к, скажем, р и q, и пишем x(p) = q, r(q)=p и, наконец, r(z) = z, если i =£ р и i =р q. Определенная так перестановка г будет обозначаться (р, q); каждая перестановка та- кого вида называется транспозицией. Если г — транспо- зиция, то т2 = е. Другой полезный способ построения примеров таков: выбираем р различных целых чисел, заключенных в пре- делах от 1 до к, скажем, zx,.. ., zp, и пишем: если 1 < / < р, если i =р ..., i =£ i . Определенная так перестановка а будет обозначаться (zx, . . ip). Если р = 1, то о = е; если р = 2, то о — транспозиция. При 1<р< к каждая перестановка вида (zx, . . ., zp) называется р-членным циклом, или просто циклом', двучленные циклы — это не что иное как транс- позиции. Предупреждение: не предполагается, что ir < . .. . . . < zp. Например, для к = 5 и р = 3 существует двад- цать различных циклов. Отметим также, что обозначение для циклов не однозначно; символы (1, 2, 3), (2. 3, 1) и (3, 1, 2) означают все одну и ту же перестановку. Циклы (zx, . .., Zp) и (/х, . .., Д) называются независимыми, если ни одно из i не равно ни одному из /. Если о и г — незави- симые циклы, то стт = га, или, другими словами, пит перестановочны. Теорема!. Каждая перестановка есть произведе- ние попарно независимых циклов. Доказательство. Если л — некоторая пере- становка и i таково, что л (z) #= z (предположим пока, что л е), образуем последовательность (z, л (z), л2 (z),.. .). Так как от 1 до к существует только конечное число различных целых чисел, то должны существовать показа- тели степени р и q (0 < р < g) такие, что лр (г) = л3 (z). Поскольку л взаимно однозначно, тогда л3'р (z) = i, т. е., при очевидном изменении обозначения, мы уже доказали, 5 П. Халмош
66 ПРОСТРАНСТВА [ГЛ. I что должен существовать строго положительный показа- тель степени р такой, что лр (z) = i. Если р — наимень- ший показатель степени, обладающий таким свойством, то целые числа i, . . ., ap l(i) попарно различны. (Действи- тельно, если 0<q < г < р и л’ (г) = лг (г), то лг‘а (z) = z, в противоречие с минимальностью р.) Значит, (I, . . . . . ., л"'1 (г)) — р-членный цикл. Если в пределах от 1 до к существует /, отличное от каждого г, ..., лр-1(г), равно каки от л; (у), повторение той же процедуры приводит к циклу с j вместо i. Такое образование циклов продол- жаем, пока после каждого шага еще можно найти новое целое число, которое л не относит самому себе; построен- ное так произведение независимых циклов и есть л. Слу- чай л = е охватывается достаточно естественным согла- шением, что под произведением без сомножителей, «пустым произведением», нужно понимать тождественную пере- становку. Теорема 2. Каждый цикл есть произведение транс- позиций. Доказательство. Пусть ст есть р-членный цикл; для простоты записи мы проведем доказательство, в дей- ствительности совершенно общее, для частного случая р = 5. Оно состоит из одной строчки: (Ч> ^2> ^з> Ч’ ~ (h> ^5) (h> ^4) (Ч’ ^з) (гИ гг)- Быть может, окажутся небесполезными некоторые допол- нительные пояснения. Согласно определению произведе- ния перестановок правая часть последнего равенства дей- ствует на каждое число от 1 до к наизнанку, или, быть может, понятнее, справа налево. Так, например, резуль- тат применения (z\, z5) (z\, z4)(0, z3) (zx, z2) к i3 вычисляется следующим образом: (z1; z2) (z3) = z3, (z4, z3) (z3) = zp (0> Q (h) = iy (0, a потому (г\, z6) (0, z4) x X ^3) (0’ *2) (b) = Для дальнейших ссылок зафиксируем очевидное след- ствие двух предыдущих теорем. Теорема 3. Каждая перестановка есть произве- дение транспозиций. Заметим, что теоремы 2 и 3 не содержат требования независимости транспозиций; в общем случае последние и не являются независимыми.
§ 28] ЧЕТНОСТЬ 67 Упражнения 1. а) Сколько перестановок содержится в fe? Ь) Сколько различных р-членных циклов содержится в . (l<p<fc)? 2. Если п и т — перестановки (из <У\), то (пт) 1=т-1а_1. 3. а) Для любых перестановок о и т (из if fe) существует и притом единственная перестановка л такая, что пл = т. Ь) Если л, п и т — перестановки, такие, что лп = лт, то п = т. 4. Привести пример перестановки, не являющейся произве- дением независимых транспозиций. 5. Доказать, что каждая перестановка из к есть произведе- ние транспозиций вида (/, где 1 </<(4. Единственно ли такое разложение на множители? 6. Будет ли обращение цикла также циклом? 7. Доказать, что представление перестановки в виде произве- дения независимых циклов с точностью до порядка сомножителей единственно. 8. Порядком, перестановки л называется наименьшее целое р(>0) такое, что лр = е. а) Каждая перестановка имеет порядок. Ь) Каков порядок р-членного цикла? с) Пусть п — р-членный цикл, т — (/-членный цикл, причем о и т независимы; каков порядок пт? d) Привести пример, показывающий, что предположение неза- висимости в с) существенно. е) Если л — перестановка порядка р и л? = е, то q делится на р. 9. Всякая перестановка из k (4>1) может быть записана в виде произведения, каждый множитель которого есть одна из транспозиций (1, 2), (1, 3), (1, 4), ..., (1, к.) 10. Перестановки пит называют сопряженными, если суще- ствует перестановка л такая, что пл = лт. Доказать, что пит являются сопряженными перестановками тогда и только тогда, когда они имеют одинаковое строение циклов. (Это означает, что в пред- ставлении п в виде произведения независимых циклов число р-членных циклов совпадает для каждого р с соответствующим числом для т.) § 28. Четность Равенство (1, 3) (1, 2) = (1, 2) (2,3) ( = (1,2, 3)) пока- зывает, что представление перестановки (даже цикла) в виде произведения транспозиций не обязательно един- ственно. А так как (1, 3) (1, 4) (1, 2) (3, 4) (3, 2) = (1, 4) х X (1, 3) (1, 2) (= (1, 2, 3, 4)), то даже число транс- позиций, в произведение которых раскладывается данный цикл, не обязательно однозначно определено. Тем не 5*
68 ПРОСТРАНСТВА [tn. i менее, в разложении на множители есть нечто однознач- ное, а именно четность или нечетность числа входящих в разложение транспозиций. Перейдем к точной формули- ровке и доказательству этого факта. Для простоты записи положим к = 4. Пусть / — поли- ном (от четырех переменных t±, t2, t3 ,i4), определенный равенством f (^i> ^2’ ^з» ^i)—(^1 ^2) (^1 ^з) (H ^4) (^2 ^з) (^2 ^4) (^з ^4)- (В общем случае / есть произведение всевозможных разно- стей — tj с 1 < i < /</с.) Каждая перестановка л из переводит / в новый полином, обозначаемый л/; по определению (л/) (£х, i2, t3, Z4) = / (^n(i), ^л(2), ^л(З), ^л(4)). Словами: л/ получается путем замены в f каждой пере- менной той, индекс которой получится, если подвергнуть индекс данной переменной действию перестановки л. На- пример, если г = (2, 4), то ('*'/) (^1> ^2> ^3’ ^4) = = (ij £4) (tt t3) (<4 ^г)(^4 ^з) (^4 ^2) (^3 Если О = (1, 2, 3, 4), так что стт = (1, 3, 2), то (ст (т/)) (Zj, t2, t3, = ((от) f) (tY, t2, t3, Z4) = = (i3 Т,) (t3 i2)(t3 t^) (tx i2) (^4 £4) (^ ^4)- Эти вычисления представляют собой иллюстрацию и подсказывают доказательство трех важных фактов. 1) Для каждой перестановки л сомножители в л/ те же, что и сомножители в / с точностью до знака и порядка; следовательно, л/=/ или л/= —Перестановка л называется четной, если л/ = /, и нечетной, если л/ = = —/. Для каждой перестановки л положим sgn л (чи- тается: сигнум л) равным +1 или —1 соответственно тому, четна л или нечетна; таким образом, всегда л/ = = (sgn л) f. 2) Если т — транспозиция, то sgn т = —1, или, что равносильно этому, каждая транспозиция
§ 28] ЧЕТНОСТЬ 69 нечетна. Доказательство состоит в очевидном обобщении следующего рассуждения, проведенного на нашем при- мере (2, 4). Лишь один сомножитель полинома / содер- жит одновременно и t2 и и этот сомножитель меняет знак при переходе от / к л/. Сомножители, не содержащие ни t2, ни i4, остаются неизменными. Сомножители, содер- жащие только одну из переменных t2, /4, входят парами (как, например, пара (t2 — t3) и (t3— /4) или пара (tL — i2) и (i4 —Z4)). Каждый сомножитель такой пары переходит в другой ее сомножитель, возможно с переменой знака; но если знак меняется у одного сомножителя, он меняется и у его напарника. 3) Для любых перестановок а и г имеем = ст(г/); следовательно, or четна тогда и только тогда, когда пит обладают одинаковой четностью. Заме- тим, что sgn (от) = (sgn о) (sgn г). Из 2) и 3) вытекает, что произведение нескольких транспозиций четно тогда и только тогда, когда этих транспозиций — четное число, и нечетно — в противном случае. (Заметим, в частности, что, как видно из доказа- тельства теоремы 2 § 27, р-членный цикл четен тогда и только тогда, когда р нечетно; другими словами, если а — р-членный цикл, то sgn а = (—1)р+1.) В итоге прихо- дим к заключению: каким бы образом перестановка л ни разлагалась в произведение транспозиций,число сомножи- телей либо всегда четно (в том случае, когда л четна), либо всегда нечетно (в том случае, когда л нечетна). Произведение двух четных перестановок четно; пере- становка, обратная к четной, четна; тождественная перестановка четна. Резюмируя эти факты, говорят, что множество всех четных перестановок является под- группой группы <ffk; эту подгруппу (обозначаемую ^k) называют знакопеременной группой степени к. Упражнения 1. Сколько перестановок содержится в 2. Дать примеры четных перестановок четного порядка и чет- ных перестановок нечетного порядка; то же для нечетных пере- становок. 3. Всякая перестановка из может быть записана в виде произведения, каждый сомножитель которого является одним из трехчленных циклов (1, 2, 3), (1, 2, 4), ..., (1, 2 к).
70 ПРОСТРАНСТВА [ГЛ. I § 29. Полилинейные формы Теперь мы подготовлены к тому, чтобы продолжить изучение полилинейной, алгебры. Основным ее понятием служит понятие полилинейной формы (или функционала), очевидное обобщение понятия билинейной формы. Пусть ..., векторные пространства (над одним и тем же полем); к-линейной формой (к = 1, 2, 3, ...) называют скалярную функцию на прямой сумме Т\@...@Т\, обладающую тем свойством, что при произвольных фикси- рованных значениях любых ее к — 1 аргументов она линейно зависит от оставшегося аргумента. 1-линейные формы — это просто линейные функционалы (на Т\), а 2-линейные формы — это билинейные формы (на © Т'2); 3-линейные (трилинейные) формы — это скалярные функ- ции w (на У'хфУ’гфУ’з) такие, что w(a1x1 + a2x2, у, z) = a1w(x1, у, z) + a2w(x2, у, z), и аналогичные тождества выполнены для w (х, ах уг 4- -|-a2z/2, z) и w (х, у, axZi + a2z2). Полилинейной формой называют функцию, ft-линейную при некотором к. На полилинейный случай легко распространяется зна- чительная часть теории билинейных форм. Так, например, если и ш2 — ft-линейные формы, ах и а2 — скаляры и w определено равенством w (xv . . ., xk) = axsyx (xlt . . ., xh) + a2w2 (xv xh) для любых из i — 1, .. ., к, то w является ft-линейной формой, обозначаемой ахшх + а2ш2. При таком опре- делении линейных операций множество всех ft-линейных форм является векторным пространством; размерность этого векторного пространства равна произведению пг .. . пк, где, разумеется, размерность пространства T’j, Доказательства всех этих утверждений совершенно ана- логичны доказательствам соответствующих утверждений длд билинейного случая (в § 23). Мы могли бы продол- жить аналогию с билинейной теорией и, в частности, изу- чать кратные тензорные произведения. Чтобы свести наше отклонение к полилинейности к минимуму, мы вместо этого пойдем в другом, более специальном и для наших целей более полезном направлении.
§ 29] ПОЛИЛИНЕЙНЫЕ ФОРМЫ 71 В дальнейшем мы ограничимся рассмотрением того случая, когда все к пространств равны одному и тому же векторному пространству, скажем У; будем предполагать, что Т конечномерно. В этом случае мы будем называть «/с-линейную форму на Ух ф ... ф Уй» просто «/с-линейной формой на У*», или даже еще проще «^-линейной формой»; такой язык несколько неточен, но в контексте совершенно недвусмыслен? Если размер- ность У равна и, то размерность векторного простран- ства всех /с-линейных форм на У равна пк. В дальнейшем изложении пространство У и, конечно, размерность п будут считаться фиксированными. Специальный характер изучаемого нами случая позво- лит нам воспользоваться техникой, не обладающей уни- версальной применимостью, а именно, техникой приме- нения к /с-линейным формам перестановок из <ffh. Если w — /с-линейная форма и' л — перестановка из <zfh, будем писать nw(xt, . xh) = w(xn(V), . .., xnW), каковы бы ни были xt, ..., xk из У. Так определенная функция л w снова является /с-линейной формой. (Зна- чение nw на (а?!, . .., xh) правильнее было бы обозначать (лау)(а,1, . ,.,а;ь); однако, так как наше более простое обозначение явно не порождает никакой путаницы, мы будем продолжать пользоваться им.) Путем применения перестановок к /«-линейным фор- мам можно определить некоторые интересные множества таких форм. Так, например, /с-линейная форма w назы- вается симметричной, если л® = w для каждой переста- новки л из ofh. (Заметим, что .при /с = 1 это условие три- виально выполняется.) Множество всех симметричных /с-линейных форм является подпространством простран- ства всех /с-линейных форм. Значит, в частности, начало этого пространства, /с-линейная форма 0, симметрична. Для получения нетривиального примера предположим, что к — 2, и, взяв линейные функционалы z/x и z/2 на У, напишем щ (а?п ж2) = уг (а;х) г/2 (а;2) + уг (а;2) г/2 (х^. Этот способ построения /с-линейных форм допускает полез- ные обобщения. Так, например, если 1<Л< /с<н,
72 ПРОСТРАНСТВА [ГЛ. I и — Л-линейная форма и v — (к — Л)-линейная форма, то равенство w(xr, хк) = и (хх, xh)-v(xhtl, хк) определяет /с-линейную форму w, которая вообще не сим- метрична. Симметричная Ar-линейная форма может быть получена из w (и, собственно говоря, из любой данной /с-линейной формы) образованием 2nw, гДе суммиро- вание распространяется на все перестановки л из а7\. Мы не убудем дальше заниматься симметричными /с-линейными формами. Мы ввели их здесь потому, что они составляют весьма естественный класс функций, опре- делимый в терминах перестановок. А теперь перейдем к другому классу функций, играющему значительно более важную роль в теории. § 30. Знакопеременные формы /с-линейная форма w называется кососимметричной^ если aw = —w для каждой нечетной перестановки п из afh. Эквивалентно, w называется кососимметричной, если aw = (sgn л)щ для каждой перестановки л из &к. (Если aw = (sgn л) w для всех а, то, в частности, aw = = —w, когда л нечетна. Обратно, если aw = —w для всех нечетных л, то, разлагая данную произвольную пе- рестановку л в произведение транспозиций, скажем, л = гх ... гд, замечаем, что sgn л = (—1)’, и так как aw = (—I)9 w, то заключаем, что aw = (sgn л) w, как и утверждалось. В этом доказательстве неявно использует- ся тот недоказанный нами, но легко устанавливаемый факт, что если а иг — перестановки из то о (rw) = = (стт) w.) Множество всех кососимметричных /с-линей- ных форм есть подпространство пространства всех /с-ли- нейных форм. Для получения нетривиального примера кососимметричной билинейной формы w берем линейные функционалы ух и у2 и полагаем щ (хх, т2) = ух (хх) у2 (х2) - г/х (ж2) у2 (тх). Более общим образом, кососимметричная А-линейная форма может быть получена из произвольной к-линейной формы
§ 30] ЗНАКОПЕРЕМЕННЫЕ ФОРМЫ 73 w путем образования 2(sgn л)лш, где суммирование распространяется на все перестановки л из afk. /с-линейная форма w называется знакопеременной, если w(xt, ... , xh) = 0 всякий раз, когда какие-либо два из векторов х совпадают. (Заметим, что при к = 1 это условие удовлетворяется по пустоте множества объектов, к которым оно относится.) Множество всех знакоперемен- ных /с-линейных форм есть подпространство пространства всех fc-линейных форм. Между знакопеременными и косо- симметричными формами имеется важная связь. Теорема 1. Каждая знакопеременная полилиней- ная форма кососимметрична. Доказательство. Пусть w — знакоперемен- ная /с-линейная форма, a i и j — целые числа, такие, что 1 < i < j < к. Положим = хк); если все векторы х, отличные от хг и х^, зафиксировать (временно), то w0 будет знакопеременной билинейной фор- мой от двух своих аргументов. Так как, по билинейности, xi + xj) = = U)0(Zi, x^ + w^, X^W^Xj, Xi) + w0(x}, Xj), а по знакопеременности w0 левая часть и два крайних члена правой части этого равенства — нули, тову0 (xj, хг) = = —w0 (хг, Xj). Но это означает, что (i,j)w(xlt ...,xk)= -w(xlt . . .,х^, или, в силу произвольности векторов х, что (г, /) w = —w. Поскольку каждая нечетная перестановка л есть произве- дение нечетного числа транспозиций, подобных (г, /), заключаем, что nw — —w для каждой нечетной л, и теорема доказана. В вопросе о связи знакопеременных форм с кососим- метричными имеется одна тонкость. Рассмотрим следую- щее «доказательство» обращения теоремы 1: если w — косо- симметричная /с-линейная форма, 1< г < /< к и xlt . . ,,хк — такие векторы, что хг = х^, то (/, /) w (ж1( ...., хк) = = w(x1, ..., хк), поскольку xi = Xj, и в то же время (i,/) w (xlt ..., хк) = —w (а?!, ..., ccfe), поскольку w
74 ПРОСТРАНСТВА [ГЛ. I кососимметрична; значит, w (хх,..., xh) = —w xk), т. e. w знакопеременна. Это доказательство оши- бочно; его слабым пунктом является заключение, что «если w = —w, то w = 0». Присмотревшись к нему ближе, мы обнаружим, что оно основывается на следую- щем рассуждении: если w— —ш, то w~^w = 0, т. е. (1 +1) w = 0. Это правильно. Но беда в том, что в неко- торых полях 1 4-1 = 0, а потому переход от (1 + 1) w = 0 к w = 0 незаконен; и действительно, обращение тео- ремы 1 неверно для векторных пространств над такими полями. Т е о р е м а 2. Если a?15 ..., a;fe — линейно зависимые векторы и w — знакопеременная к-линейная форма, то w (жх, ..., xh) = 0. Доказательство. Если х1 = 0 для некоторого г, то утверждение теоремы тривиально. Пусть все хг отличны от 0. По теореме § 6 найдется вектор xh, 2 < h < к, являющийся линейной комбинацией предшествующих п-1 векторов. Если, скажем, xh— 2 аЛ> заменим xh г—0 в w (з\, ..., xk) этим разложением, воспользуемся линей- ностью w (х±, ..., xh) по ее /г-му аргументу и (7г — 1)- кратным применением предположенной знакоперемен- ности w придем к требуемому заключению. В одном предельном случае (а именно, когда к = п) справедливо некоторого рода обращение теоремы 2. Теорема 3. Если w — ненулевая знакопеременная п-линейная форма и х±, ..., хп — линейно независимые век- торы, то w (жп ..., жп) =# 0. Доказательство. Так как (теорема 2 § 8) векторы хг, ..., хп образуют базис, можно каждый из произвольно заданного множества п векторов у±, ..., уп представить в виде линейной комбинации векторов х. Заменим каждое у в w (уг, ..., уп) соответствующей ли- нейной комбинацией и, пользуясь полилинейностью, разложим полученное выражение. Мы придем к длинной линейной комбинации членов вида ®(zr, ..., z„), где каж- дое z есть один из векторов х. Если в таком члене два z совпадают, этот член должен равняться нулю, посколь- ку w знакопеременна. С другой стороны, если все z раз-
§ 31] ЗНАКОПЕРЕМЕННЫЕ ФОРМЫ МАКСИМАЛЬНОЙ СТЕПЕНИ 75 ЛИЧНЫ, ТО W (zn Z^) = ЛШ (х1У xv) при некоторой перестановке л. Из кососимметричности w (теорема 1) вытекает, что w (zx, ..., zv) — (sgn л) w (х1Уxn). Если бы w (х1У..., xv) равнялась 0, то мы получили бы, что w (zx, z„) = О и, значит, w (у1У ..., уГ:) = 0 для всех ..., уп, в противоречие с предположением, что w =j= 0. Из доказательства (но не формулировки) этого резуль- тата вытекает ценное следствие. Теорема 4. Любые две знакопеременные п-линей- ные формы линейно зависимы. Доказательство. Пусть и w2 — знакопе- ременные и-линейные формы и {х1У ..., хп} — базис. Каж- дый из любых заданных п векторов у1У..., уп запишем в виде линейной комбинации векторов х и так же, как выше, заменим каждое у в выражениях (у1У и ш2(у1У ..., уг) соответствующей линейной комбинацией. Мы получим, что и wi(yl, ..., pj, и w2 (у1У уп) есть (одна и та же) линейная комбинация членов“вида wr (zlt ... ..., zri) и w2 (zly ..., z„), где каждое z есть одно из х. Будучи скалярами, ш1(х1, ..., хп) и w2 (ж1, ..., хг) линейно зави- симы, так что существуют скаляры ах и а2, не равные одно- временно нулю и такие, что ..., x^~ira2w2 (х1У ... .., хп) = 0; из этих фактов следует, что + a2w2 = 0, и теорема доказана. § 31. Знакопеременные формы максимальной степени Просмотрев последний параграф, читатель заметит, что мы не привели ни одного нетривиального примера зна- копеременных /с-линейных форм и даже косвенно не на- мекнули на какую-либо касающуюся их теорему сущест- вования. На самом деле они не всегда существуют; так, например, из теоремы 2 § 30 вытекает, что если к > п, то 0 — единственная знакопеременная /с-линейная форма. (См. теорему 2 § 8.) Для имеющихся в виду примене- ний нам потребуется лишь одна теорема существова- ния; переходим к доказательству ее довольно яркой формы. Теорема. Векторное пространство знакоперемен- ных п-линейных форм на п-мерном векторном простран- стве одномерно.
76 ПРОСТРАНСТВА [ГЛ. I Доказательство. Покажем сначала, что если к < п, то существует по крайней мере одна ненулевая знакопеременная А-линейная форма; доказа- тельство будет вестись индукцией по к. При к = 1 требуе- мый результат вытекает из существования нетривиальных линейных функционалов (см. теорему 3 § 15). Пусть 1 < к < < п и v — ненулевая знакопеременная А-линейная фор- ма; используя ее, построим ненулевую знакопеременную (& + 1)-линейную форму w. Поскольку v =# 0, можно найти векторы х°, ..., x°k, для которых v (ж°, ..., x°k) #= О (верхние значки здесь просто индексы). Так как к < п, то существует вектор-а£+1, не принадлежащий подпростран- ству, натянутому на х°, ..., х°ь, а тогда (см. теорему 1 § 17) найдется линейный функционал и такой, что и (х[) = ... = и (x°k) = 0, но и (x°k+l) ф 0. Искомая (к + 1)-линейная форма w получается из линейного функционала и и /с-линейной формы v следую- щим образом: h щ(ж1; ..., xh, жй+1) = 2 (i, k + l)v(xlt .. .,xh)u(xi)- г—1 -Ofe,...,^)»^). (1) Так, например, если к = 3, то w (х1г х2, х3, х4) = V (z4, х2, х3) и (х4) + V (ж1, xit х3) и (ж2) 4- 4- V (ж4, х2, ж4) и (х3) — V (хп х2, х3) и (ж4). Из элементарных рассмотрений § 29 следует, что w, дей- ствительно, есть (А 4- 1)-линейная форма; нам нужно дока- зать, что она ненулевая и знакопеременная. То, что w не равна тождественно нулю, доказывается легко. В самом деле, из того, что и (х[) = 0 для i = 1, ... ..., к, следует, что если мы заменим в (1) каждое xt на x°t, i = 1, ..., к-\~ 1, то первые к членов суммы в правой части обратятся в нуль, и значит W (х°...x°h, x°k+l) = —v (ж°, .. ., x°k) и (x°k+l) Ф 0. (2) Предположим теперь, что ..., хм — векторы, а i, j — целые числа такие, что 1 < I < /< А: 4 1 и хг = х,. Нам нужно доказать, что при этих обстоятельствах w (хг, ..., xk, xhtl) = 0. Заметим, что xt и Xj одновременно
§ 31] ЗЙАКОПЕРЁМЕЙНЫЕ ФОРМЫ максйМальйой СТЕПЁЙЙ 77 входят в качестве аргументов v в к — 1 из общего числа /с 4-1 членов правой части формулы (1). Так как о знако- переменна, все эти члены обращаются в нуль. Дальнейшая часть доказательства естественно распа- дается на два случая. Если / = то остается только (i, к + 1)н(я:1, ..., x^u^-v^, ..., xfe) и (жь+1), что очевидно равно 0, поскольку x.L = ж/;+1. Если же к, то каждый из двух еще оставшихся возможно не равных нулю членов может быть получен из другого с помощью транспозиции (г, /). Значит, эти члены отличаются только знаком,, а потому их сумма равна нулю. Этим доказано, что w знакопеременна, и тем самым доказано, что размер- ность пространства всех знакопеременных и-линейных форм не меньше 1. Тб же, что размерность пространства знакопеременных и-линейных форм не больше 1, есть не- посредственное следствие теоремы 4 § 30. На этом заканчивается наше ознакомление с полили- нейной алгеброй. Читатель вполне мог бы обвинить нас в том, что оно было не очень строго мотивировано. Пол- ная мотивировка и не может содержаться в этой книге; оправданием изучения полилинейной алгебры является широкая применимость этого предмета. Единственным же применением ее, которое мы сделаем, будет применение к теории определителей (которые, разумеется, можно было бы рассмотреть и с помощью более прямых, но менее изящных методов, в большей степени зависящих от произ- вола в выборе базиса); это будет сделано в следующей главе. Упражнения 1. Если w ^-линейная форма, а характеристика основного поля скаляров отлична от 2.(т. е. если 1 + 1 =# 0), то w является суммой симметричной и кососимметричной ^-линейных форм. Что будет, если характеристика равна 2? 2. Дать пример кососимметричной, но не знакопеременной полилинейной формы. (Напомним, что, ввиду сказанного в § 30, поле скаляров должно иметь характеристику 2.) 3. Привести пример ненулевой знакопеременной /с-л инейной формы w на га-мерном пространстве (к < ге) такой, что w(xlt..., хк)=0 для некоторого множества линейно независимых векторов х1г ..., xk. 4. Какова размерность пространства всех симметричных А-линейпых форм? А кососимметричных? А знакопеременных?
ГЛАВА II ОПЕРАТОРЫ § 32. Линейные операторы Мы переходим теперь к тем вопросам, которые дейст- вительно придают векторным пространствам интерес. Определение. Линейным оператором А на векторном пространстве (или линейным отображе- нием в себя) называется соответствие, относящее каждому вектору х из вектор Ах из У’ так, что А (ах + Рр) = аАх + [3/1 у для любых векторов х и у и скаляров аир. Как и по поводу определения линейных функционалов, заметим, что для линейного оператора А, как он нами определен, АО = 0. По этой причине такие операторы иногда называют однородными линейными операторами. Прежде чем изучать какие бы то ни было свойства линейных операторов, приведем несколько примеров. Мы не будем входить в доказательство того, что рас- сматриваемые ниже операторы действительно линейны; во всех случаях проверка равенства, определяющего ли- нейность, будет простым упражнением. 1) Для последующего будут особо важны два специаль- ных оператора, всюду в дальнейшем обозначаемые соот- ветственно символами 0 и 1, определяемые (для всех х) равенствами Ох = 0 и ix = х. 2) Пусть х0 — любой фиксированный вектор простран- ства F и у0 — любой линейный функционал на Т"; поло- жим Ах = у0 (х) х0. Более общим образом, пусть {xv ..., хп} — произвольное конечное множество векто- ров из У и {г/р ..., Уп} — такое же количество линейных
§ 32] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 79 функционалов на ТА; положим Ах = у1(х)х1-[- + уп(х) хп. Нетрудно доказать, что если, в частности, ТА п-мерно и векторы хг, .. ., хп образуют его базис, то каждый линейный оператор А на ТА может быть представлен в только что указанном виде. 3) Пусть л — перестановка целых чисел {1, ..., п}; для каждого вектора х = {g]5 ..., gn} из положим Ла; = = (£л(1), • ••, £я(п))- Аналогично, пусть л —полиноме ком- плексными коэффициентами; для каждого вектора (поли- нома) х из ТА положим Ах --- у, где у — полином, опре- деляемый равенством у (t) = х (л (/)). п— 1 4) Для любого х из &п, x(t) = 2 положим 3=0 п— 1 (Dx) (t) = 2 ДД* (Мы используем здесь букву D для 3=0 напоминания, что Dx есть производная пэдгинома х. Заметим, что так же, как на мы могли бы определить D и на позже мы воспользуемся этим. Отметим, что дифференцирование полиномов допускает чисто алгебраи- ческое определение и не нуждается в обычной теории пре- делов.) П— 1 t 5) Для каждого х из <^, x(t) = 2 положим 3=0 п— 1 3=0 обозначением Так же, как ti+1. (Мы снова маскируем алгебраическим хорошо известное аналитическое понятие, в 4) (Dx) (t) заменяло ~, здесь (Sx) (t) t есть не что иное, как х (s) ds.) о 6) Пусть т — полином с комплексными коэффициен- тами от переменной t. (Можно, хотя это и не очень выгодно, считать т элементом пространства а?5.) Для каждого х из обозначим через Мх полином, определенный форму- лой (Мх) (t) = m(t)x(t). Это специальное обозначение введено для дальнейших целей; в случае т (t) = t мы будем обозначать оператор М буквой Т так что (Тх) (t) — = tx (t\.
80 ОПЕРАТОРЫ [ГЛ. II § 33. Линейные операторы как векторы Приступим теперь к установлению некоторых элемен- тарных свойств и связей линейных операторов, заданных на векторном пространстве. Точнее говоря, укажем не- которые способы получения из данных операторов но- вых; как правило, мы будем ограничиваться определе- нием новых операторов, опуская доказательство их линей- ности. Пусть А и В — линейные операторы; их сумму S = — Л-\В мы определим равенством Sx = Ах + Вх (для всех х). Заметим, что из коммутативности и ассоциатив- ности сложения в непосредственно следует, что сложе- ние линейных операторов коммутативно и ассоциативно. Но это далеко еще не все. Рассмотрение суммы любого линейного оператора А и линейного оператора 0 (опре- деленного *в предыдущем параграфе) показывает, что А + 0 = А. Далее, обозначая для каждого Л через —А оператор, определенный равенством (— Л) х — — (Ах), видим, что ЛЦ-( — Л) = 0 и что так определенный опе- ратор — Л является единственным линейным оператором В, обладающим тем свойством, что А^В = 0. Подыто- жим: свойства векторного пространства, описанные в ак- сиомах А § 2, вновь обнаруживаются в множестве всех линейных операторов на этом пространстве; множество всех линейных операторов образует коммутативную груп- пу относительно операции сложения. Продолжим в том же духе. Теперь уже никого не уди- вит, что множество всех линейных операторов на вектор- ном пространстве удовлетворяет также аксиомам В и С векторных пространств. И это действительно так. Для любого Л и любого скаляра а определим произведение аЛ равенством (аЛ)а; = а(Ла;). Выполнение аксиом В и С очевидно. Таким образом, справедлива следующая Т е о р е м а. Множество всех линейных операторов на векторном пространстве само является векторным пространством. Мы будем вообще игнорировать эту теорему; дело в том, что о линейных операторах можно сказать гораздо большее, а один лишь факт, что они образуют векторное пространство, используется крайне редко. Это «гораздо
§ 33] ЛИНЕЙНЫЕ ОПЕРАТОРЫ КАК ВЕКТОРЫ 81 большее», что можно сказать о линейных операторах, заключается в том, что для них существует достаточно удовлетворительное определение умножения, которое будет рассмотрено в следующем параграфе. Упражнения 1. Доказать, что каждое из описываемых ниже соответствий линейно. а) V—множество g комплексных чисел, рассматриваемое как вещественное' векторное пространство; Ах— число, комплексно сопряженное к х. Ь) V3 есть :j3\ (Ах) (t) = x (£—]— 1) — х (t) для каждого полинома х. с) есть Л-кратпое тензорное произведение векторного про- странства с самим собою; А задано условием A (xt&... = = хя (1) ® ® жл(к)’ гДе я — перестановка множества {1, ..., к}. d) — множество всех ^-линейных форм w па векторном про- странстве; Aw(xlt ..., xil) = w(xJt(y), ..., хя^), где л — перестановка множества {1, ..., Л}. е) —множество всех ^--линейных форм w на векторном про- странстве; Aw=~^kw, где суммирование распространено на все перестановки л из f) То же, что в е), с тем отличием, что Ах= (sgn л) пш. 2. Доказать, что если V3— конечномерное векторное простран- ство, то пространство всех линейных операторов на ЧА3 конечно- мерно, и найти его размерность. 3. Понятие «линейного оператора», как оно было определено выше, слишком узко для некоторых целей. Согласно более общему определению, линейным отображением векторного пространства 41 в векторное пространство V над тем же полем называется соответ- ствие А, относящее каждому вектору х из 41 вектор Ах из Чгз так, что А (ах 4- Ру) = аАх рлу. Доказать, что каждое из описанных ниже соответствий являет- ся линейным отображением в этом обобщенном смысле. а) Ч33— поле скаляров пространства А — линейный функ- ционал на 41. Ь) 41 —прямая сумма пространства ЧА3 с некоторым другим пространством; А отображает каждую пару из 41 па ее первую координату. с) ЧА3—факторпространство пространства 44 по некоторому под- пространству; А отображает каждый вектор из 44 па определяемый им смежный класс. d) Пусть w — билинейный функционал на прямой сумме ® и — пространство, сопряженное к ЧА3^ определим А как соответствие, которое каждому хо из 44 относит линейный функцио- нал на ЧА3^ получаемый, если первый аргумент в w положить равным х0. 6 п. Халмош
82 OnEPA'fOPbl [ГЛ. Il 4. а) Предположим, что 41 и' 7'3 - векторные пространства над одним и тем же полем. Если Л и В — линейные отображения 41 в а и Р — скаляры и Сх = аАх -j- Рву для каждого х из 41, то С — линейное отображение 41 в 7/3. Ь) Если принять, по определению, С = аА + Р5, то множество всех линейных отображений 41 в V станет векторным пространством относительно этого определения липейных операций. с) Доказать, что если 41 и Т3 конечномерны, то пространство всех линейных отображений 41 в Т'' также конечномерно, и найти его размерность. 5. Пусть аЛ1 — zre-мерное подпространство n-мерного векторного пространства 7/3. Доказать, что множество тех линейных операторов А на V0, для которых Ах = 0 при всех х из <М, является подпро- странством множества всех линейных операторов па V, и найти размерность этого подпространства. § 34. Произведения Произведение Р — АВ линейных операторов А и В определяется равенством Рх = А(Вх). Понятие умножения будет основным для всего дальней- шего. Прежде чем иллюстрировать значение произведений операторов примерами, остановимся на смысле символа Р = АВ. Когда говорят, что Р — оператор, то это, ко- нечно, означает, что каков бы ни был вектор х, Р что-то с ним делает. Что именно — устанавливается, если подей- ствовать на х оператором В, т. е. найти Вх, а затем при- менить к результату А. Другими словами, если смотреть на символ оператора как на рецепт для выполнения опре- деленных действий, то символ произведения двух опера- торов следует читать справа налево. Порядок отображе- ния посредством АВ таков: сначала отобразить посред- ством В, затем — посредством А. Может показаться, что мы поднимаем много шуму по малозначительному поводу; однако, как мы вскоре увидим, умножение опера- торов вообще не коммутативно, так что порядок, в ко- тором производится отображение, совсем не безраз- личен. Наиболее известный пример некоммутативности можно найти в пространстве Рассмотрим операторы диффе- ренцирования и умножения D и Т, определяемые равен-
§ 35] Полиномы 83 ствами (Dx) (t) = и (Тх) (t) = tx (t); имеем (DTx) (t) = ~ (tx(t)) ~ х (t) 4-t, а (TDx) (t) = t£. Другими словами, не только неверно, что DT— TD (т. е. DT — TD = 0), но на самом деле (DT — TD) х = х для каждого х, так что DT — TD = 1. Основываясь на примерах § 32, читатель мог бы построить много примеров пар неперестановочных операто- ров. Те, кто привык представлять себе линейные отобра- жения геометрически, могут, например, легко убедиться в том, что произведение двух вращений TCP (вокруг начала) вообще зависит от порядка, в котором они выпол- няются. Большинство формальных алгебраических свойств числового умножения (за уже отмеченным важным исключением коммутативности) справедливо и в алгебре операторов. Так, Л0 = 04 = 0, (1) А1 = 1А = А, (2) А(В + С) = АВААС, (3) (А + В)С = АС-(-ВС, (4) А (ВС) = (АВ) С. (5) Доказательства всех этих тождеств непосредственно сле- дуют из определений сложения и умножения; для поясне- ния принципа докажем (3), один из законов дистрибу- тивности. Доказательство состоит из следующих выкладок: (4 (В + С)) х = А ((В + С)х) = А (Вх + Сх) = = А (Вх) + А (Сх) = (АВ) х + (АС) х = (АВ + АС) х. § 35. Полиномы Закон ассоциативности умножения позволяет записы- вать произведение трех (или большего числа) сомножите- лей без всяких скобок; в частности, можно рассматривать произведение любого конечного числа, скажем, т 6*
84 ОПЕРАТОРЫ [ГЛ. II сомножителей, каждый из которых равен А. Это произ- ведение зависит только от А и т (и не зависит, как только что было отмечено, от какой бы то ни было расстановки скобок); мы будем обозначать его Ат. Хотя умножение операторов вообще не коммутативно, такое обозначение оправдано тем, что для степеней одного оператора имеют место обычные законы действий над показателями: Лп,Лт = Лп+т и (Л")т = Лпт. Заметим, что АГ = А; при- нято также считать, по определению, Л° = 1. При этих определениях действия со степенями одного оператора — почти такие же, как в обычной арифметике. В частности, можно определить полиномы от линейного оператора. Так, если р — любой полином со скалярными коэффициен- тами от переменной t, скажем р (t) = а0-- apt + ... + anf11, можно образовать линейный оператор Р (л) = «о1 + aiA + • • • + а^- Правила алгебраических действий с такими полиномами просты. Так, p(t)q(t) = r(t) влечет р (A) q (А) = г(Л) (так что, в частности, любые р (Л) и q (Л) перестано- вочны); если р (t) = а (тождественно), мы будем обычно (вместо р (Л) = а-1) писать р(Л) = а; это согласует- ся с использованием символов 0 и 1 для линейных опера- торов. Если р — полином от двух переменных, а Л и В — линейные операторы, обычно бывает невозможно придать символу р(А, В) какое-нибудь разумное истолкование. Конечно, затруднение состоит в том, что А и В могут быть неперестановочны, и даже простой одночлен, как, скажем, s2t, может породить путаницу. Если р (s, t) = = s2t, что нужно понимать под р (Л, В)? Будет это А2В, или АВА, или ВЛ2? Важно осознать, что здесь заключена трудность; к счастью, нам нет необходимости пытаться справиться с ней. Мы будем работать с полиномами от нескольких переменных, только если речь идет о пере- становочных операторах, а тогда все просто. Так, если АВ = В А, то Л "В”1 = ВтАч, а тогда р (Л, В) имеет одно- значный смысл для каждого полинома р. Формальные свойства соответствия между (перестановочными) опера- торами и полиномами одинаково справедливы как для
§ 3 5] ПОЛИНОМЫ 85 одного, так и для нескольких переменных, по мы не будем вдаваться в это. В качестве примера возможного поведения степеней оператора рассмотрим оператор дифференцирования D на У (пли, с таким же успехом, на для некоторого п). Легко видеть, что каковы бы ни были положительное целое к и полином х из Sk, (D х) (Z) = . Заметим, что, во всяком случае, оператор D понижает степень поли- нома, па который он действует, ровно на одну единицу (в предположении, конечно, что эта степень >1). Пусть х — полином, скажем, степени п — 1; что такое D,lxi Или иначе: каково произведение двух (перестановочных) операторов Dk и Dnk (где к — некоторое целое число между 0 и к), рассматриваемых па пространстве ^п? Мы приводим этот пример, чтобы выявить озадачивающее обстоятельство, содержащееся в ответе на последний вопрос: произведение двух операторов может оказаться равным нулю даже тогда, когда ни один из них не равен пулю. Ненулевой оператор, произведение которого с неко- торым ненулевым оператором равно нулю, называют делителем нуля. Упражнения 1. Вычислить линейные операторы DnSn и SnDn, п=1, 2, другими словами, найти, во что переводит каждый такой оператор произвольный элемент из .'Р. (Здесь D и 5' означают операторы диф- ференцирования и интегрирования, определенные в § 32.) 2. Если А и В — линейные операторы, такие, что АВ — ВА перестановочно с А, то А>! В — ВАк = кА'1^1 (АВ— В А) для каждо- го положительного целого к. 3. Пусть Ах(В) =: x(t -|-1) для каждого х из доказать, что если D — оператор дифференцирования, то 1! + 2! +’"+(п—1)!~ ' 4. а) Для каждого линейного оператора А на /г-мерном вектор- ном пространстве существует ненулевой полином р степени <лг2 такой, что р(Л)=0. Ь) Пусть Ах = уо (х) хо (см. § 32, 2)); найти ненулевой полином р такой,' что р(А)=0. Какова наименьшая возможная степень полинома р? 5. Произведение линейных отображений различных векторных пространств определено только в том случае, когда они «спарецы»
86 ОПЕРАТОРЫ [ГЛ. II в следующем смысле. Пусть V* и Ж — векторные пространства над одним и тем же полем и пусть А, В — линейные отображения соответственно Ф в У3 н‘F в Ж. Произведение С = ВА (порядок существен) определим как линейное отображение 41 в задаваемое равенством Сх — В (Ах). Интерпретировать и доказать как можно большее число равенств (1)—(5) § 34 для этого понятия умножения. 6. Пусть А — линейный оператор на re-мерном векторном пространстве Т3. . а) Доказать, что множество всех тех линейных операторов В па 7'э, для которых АВ = 0, есть подпространство пространства всех линейных операторов на Ь) Показать, что при надлежащем выборе А размерность под- пространства, описанного в а), может быть сделана равной 0, га или га2. Какие вообще значения может принимать эта размерность? с) Можно ли способом, описанным в а) (при надлежащем выбо- ре Л), получить каждое из подпространств пространства всех ли- нейных операторов? 7. Пусть А — линейный оператор на векторном пространстве рассмотрим соответствие, относящее каждому линейному операто- ру X „а V' линейный оператор АХ. Доказать, что это соответствие является линейным оператором (на пространстве всех линейных операторов). Можно ли таким способом (при надлежащем выборе Л) получить каждый линейный оператор на этом пространстве? § 36. Обратимость В каждом из двух предыдущих параграфов было приведено по примеру; эти примеры выявляют два скверных свойства умножения линейных операторов, а именно: некоммутативность и существование делителей нуля. Обратимся теперь к более приятным свойствам, которыми иногда обладают линейные операторы. Может случиться, что линейный оператор А обладает одним или обоими из следующих двух весьма специаль- ных свойств. (1) Если Ху Ф х,у, то Аху =f= Ахг. (II) Для каждого вектора у существует (по крайней мере один) вектор х такой, что Ах = у. В том случае, когда А обладает обоими этими свойст- вами, мы будем говорить, что А обратим. Если А обра- тим, мы определим линейный оператор, называемый обратным к А и обозначаемый А'1, следующим образом. Для любого вектора у0 можно (по свойству (II)) найти х0 такое, что Ах0 = у0. Более того, это х0 однозначно определено, ибо если хп #= £j, то (по свойству (I)) уп~
§ 36] ОБРАТИМОСТЬ 87 = Ах0 Ф Ах±. Мы положим Д-1г/0 равным х0. Чтобы до- казать линейность Л’1, найдем А'1 (а1у1 + а2у2). Если Ах1 = у1 и Ах2 = у2, то, в силу линейности А, имеем А (ад + ад) = aiy1 + a2y2, а потому А"1 (а^ + а2у2) = — О.^Х^ -Ц Ct2^2 = (Х]Л iyi -j- сь2Д 1у2. В качестве тривиального примера обратимого опера- тора укажем тождественный оператор 1; очевидно, I'1 = 1. Оператор 0 не обратим; для него нарушаются, в той мере, в какой это вообще возможно, оба условия (I) и (II). Из определения непосредственно следует, что каков бы ни был обратимый оператор А, АА~1 = А-1А = 1; покажем, что эти равенства характеризуют А Е Теорема 1. Если А, В и С — такие линейные операторы, что АВ = СА = \, то А обратим и -Г1 = В — С. Доказательство. Если Ах1 — Ах2, то САхх = = САх2, а потому (поскольку СА = 1) хх = х2; дру- гими словами, первое условие определения обратимости оператора выполнено. Второе условие также выполнено, ибо, если у — любой вектор и х = By, то у — АВу = = Ах. Умножая АВ = 1 слева, а СА=1 справа на Л"1, получаем Л'1 = В = С. Чтобы показать, что ни одно из условий АВ = 1, СА = 1 в отдельности не достаточно для обеспечения обратимости Л, вспомним операторы дифференцирования и интегрирования D и S, определенные в § 32, 4) и 5). Хотя DS = 1, ни D, ни S не обратим; для D нарушено условие (I), а для S — условие (II). В конечномерных пространствах ситуация проще. Теорема 2. Линейный оператор А на конечномер- ном векторном пространстве ТС обратим тогда и только тогда, когда Ах = 0 влечет х = 0, а также тогда и толь- ко тогда, когда каждое у из Е может быть записано в виде у = Ах. Доказательство. Если А обратим, то оба условия выполнены тривиальным образом. Предположим теперь, что Ах = 0 влечет х = 0. Тогда и =£ и, т. е.
88 ОПЕРАТОРЫ [ГЛ. II и — v #= 0 влечет А (и — v) =# 0, т. е. Au #= Av, и свой- ство (I) доказано. Для доказательства свойства (И) пред- положим, что {жх, . хп] — базис пространства Т'; мы утверждаем, что {Ла^, .. ., ЛжД— также базис. Согласно теореме 2 § 8, требует доказательства лишь линейная независимость. Но ^,aiAxi = 0 означает А (2 atxt) = О, г i а в силу предположения это влечет У = 0; но тогда линейная независимость векторов х1 показывает, что ах = . . . = ап —- 0. Следовательно, действительно, каж- дый вектор у может быть записан в виде у — У а^Ах^ = = аЛ). Предположим теперь, что каждое у есть Ах, и пусть {г/х, . .., уп}— любой базис в ТА. Для каждого уг можно найти (не обязательно единственное) такое, что yi = Ахр, мы утверждаем, что {xt, . . .,хп}—также базис. Действи- тельно, У a^i = 0 влечет У aiAxi = У = 0, так г г i что со = ... = ап = 0. Значит, каждое х может быть записано в виде х = У и, на только что указанном i основании, Ах = 0 влечет х = 0. Теорема 3. Если А и В обратимы, то АВ обра- тимо и (АВ)'1 = В'1А'1. Если А обратим и а 0, то -1 аА обратим и (аЛ) 1 = — Л*1. Если А обратим, то А 1 обратим и (Л^1)-1 = Л. Доказательство. Согласно теореме 1 доста- точно доказать (для первого утверждения), что результат умножения АВ на В'А'1 как слева, так и справа, есть тождественный оператор; проверку этого предоставим читателю. Доказательства двух оставшихся утвержде- ний в основном совпадают с доказательством первого; например, последнее утверждение следует из того, что равенства А А 1 = Л-1Л = 1 совершенно симметричны относительно Л и Л-1. Мы закончим рассмотрение обратимости следующим замечанием. Действуя в духе предыдущего параграфа, можно было бы, при желании, определить рациональные
36] ОБРАТИМОСТЬ 89 функции от А, когда это возможно, с помощью А1. Мы не встретимся с необходимостью делать это, за исключе- нием одного случая: если А обратим, то, как мы знаем, Ап (п = 1, 2, . ..) также обратим; мы будем вместо (Л”)"1 писать А~п, так что Л'п= (/Г1)’1. Упражнения 1. Какие из линейных операторов, описанных в упражнении 1 § 33, обратимы? 2. Линейный оператор А па У2 определяется формулой g2) = №+R2, т^+^2), где а, Р, у и б — фиксированные скаляры. Доказать, что А обратим тогда и только тогда, когда аб — Ру+О. 3. Если А и В — линейные операторы (на одном и том же век- торном пространстве), то для того, чтобы они оба были обратимы, не- обходимо и достаточно, чтобы были обратимы АВ и ВА. 4. Если А и В — линейные операторы на конечномерном век- торном пространстве и АВ = 1, то А и В обратимы. 5. а) Если А, В, С и D — линейные операторы (все — па одном и том же векторном пространстве) и как А + В, так и А — В обра- тимы, то существуют линейные операторы X и У такие, что AX+BY = C и BX + AY = D. b) Насколько необходимы предположения обратимости в а)? 6. а) Линейный оператор на конечномерном векторном про- странстве обратим тогда и только тогда, когда он сохраняет линей- ную независимость. Под утверждением, что А сохраняет линейную независимость, понимается, что всякий раз, когда %—линейно независимое множество в Y3, А %?— также линейно независимое множество в +’. (Символ AQ' обозначает, конечно, множество всех векторов вида Ах, где х принадлежит Ь) Необходимо ли предположение конечномерности для спра- ведливости а)? 7. Показать, что линейный оператор А, для которого А2— А + + 1=0, обратим. 8. Если А аВ —линейные операторы (на одном и том же вектор- ном пространстве) и АВ = 1, то А называют левым обратным оператора В, а В — правым обратным оператора А. Доказать, что если А имеет единственный правый обратный, скажем В, то А обра- тим. (Указание: рассмотреть В А + В — 1.) 9. 'Если А — обратимый линейный оператор на конечномерном векторном пространстве то существует полином р такой, что Л-1=р (Л). (Указание: найти ненулевой полином q наименьшей
90 ОПЕРАТОРЫ [ГЛ. II степени, для которого q (Л) = 0, и доказать, что его свободный член не может быть равен 0.) 10. Придумать разумное определение обратимости для линей- ных отображений одного векторного пространства в другое. Исполь- зуя это определение, установить, (есть ли и) какое из линейных отображений, описанных в упражнении 3 § 33, обратимо? § 37. Матрицы А теперь снова вернемся к нити наших рассуждений; введя новое понятие — линейного оператора, мы должны теперь установить, как оно связано со старыми понятиями базиса, линейных функционалов и т. д. Одним из наиболее важных средств изучения линей- ных операторов на конечномерных векторных простран- ствах является понятие матрицы. Так как это понятие вообще не имеет приемлемого аналога в бесконечномер- ных пространствах и так как в большинстве рассмотре- ний можно обойтись без него, мы попытаемся не пользо- ваться им при доказательстве теорем. Однако все же важно знать, что такое матрица, и мы приступаем теперь к детальному рассмотрению этого вопроса. Определение. Пусть Т' — «-мерное векторное пространство, = {24, . .., хп} — его произвольный базис и А — линейный оператор на Т". Так как каждый вектор является линейной комбинацией векторов хг, имеем, в частности, Л = 2 aijxi для j = 1, ..., п. Множество (ai3) из «2 скаляров, помечен- ных двойным индексом г, у, называют матрицей опера- тора А в координатной системе ; мы будем обычно обо- значать ее [А], или [А; %']< если окажется необходимым указание базиса Ж, к которому она отнесена. Матрицу (ai3) обычно записывают в виде квадратной таблицы: an ai2 • • аш а21 а22 • • • агп [А] = anl ап2 • • • -
§ 37] МАТРИЦЫ 91 скаляры (au, ain) образуют строку, а (а1?-, anj) — столбец этой матрицы. Это определение характеризует не «матрицу», а «мат- рицу, ассоциированную в некоторых условиях с линей- ным оператором». Часто бывает полезным рассматривать матрицу как нечто существующее само по себе в виде квадратной таблицы; однако в этой книге матрица будет обычно связываться с линейным оператором и базисом. Несколько замечаний относительно обозначений. Обыч- но матрицу обозначают тем же символом, что и оператор, скажем, А. Оправдание этому можно найти в дальнейших рассмотрениях (относящихся4 к свойствам матриц). Мы не следуем здесь этому обыкновению, поскольку одной из наших основных целей, применительно к матрицам, является упор на то, что они зависят от координатной системы (тогда как понятие линейного оператора — нет), а также изучение того, как изменяется соответствие между матрицами и линейными операторами прц переходе от одной координатной системы к другой. Обращаем внимание также на особенность индексиро- вания элементов atJ- матрицы [4]. Базис есть базис, и до сих пор, хотя мы обычно и индексировали его элементы первыми п положительными целыми числами, порядок элементов в нем был совершенно несуществен. Однако при рассмотрении матрицы принято говорить, скажем, о ее первой строке или первом столбце. Этот язык оправ- дан только, если мы мыслим элементы базиса % распо- ложенными в определенном порядке. Поскольку в боль- шей части наших рассмотрений порядок строк и столб- цов матрицы столь же несуществен, как и порядок эле- ментов базиса, мы не включили этот аспект понятия матрицы в наше определение. Важно, однако, понимать, что вид квадратной таблицы, ассоциированной с матри- цей [4], изменяется при переходе к другому упорядоче- нию базиса /2’. Соответственно этому всё, что будет ска- зано о матрицах, может быть истолковано с двух различ- ных точек зрения: либо в строгом соответствии с буквой нашего определения, либо следуя модифицированному определению, связывающему матрицу (с упорядочен- ными строками и столбцами) не только с линейным опера- тором и базисом, но также и с упорядочением базиса,
92 ОПЕРАТОРЫ [ГЛ. II Еще несколько слов для посвященных. Сама суть дела, а не своенравие автора, заставляет нас писать = У aijXi г вместо более обычного равенства Axi = S aijxj- 3 Дело в том, что мы хотим, чтобы формулы матричного умножения и действия матриц на числовые векторы (т. е. векторы (£15 из (в11) имели нормальный вид, но где-то в процессе перехода 'от векторов к их координатам индексы меняются местами. Вот точная формулировка нашего правила: запишите Ах^ в виде линейной комбина- ции векторов xL, ..., х:1 и выпишите полученные при этом коэффициенты в качестве j-го столбца матрицы [А ]. (Первый индекс коэффициента — всегда индекс строки, а второй — индекс столбца.) Рассмотрим для примера оператор дифференцирова- ния D на пространстве ^4 и базис {24, ..., хп], опреде- ленный равенствами xt (i) =' Z11, i=A,...,n. Какова матрица оператора D в этом базисе? Имеем: Dx± = Oxj -j- 0х2 И . .. 4 4 0xn Z>x2 = l^ 4 0x2... 1 0хпЛ4 Ox,, Dx3 = 0xt + 2х2 + .. . 4- 0хп л -1- 0х„ (1) Z>xn=0.r14-0x2 + ...4-(n—1) ^„^4-Ох^, а потому -010. 0 0 2. . 0 . 0 0 • 0 (2) 0 0 0. . 0 п — 1 .0 0 0. . 0 0 Неприятное явление перестановки индексов обнаружи- вается сравнением формул (1) и (2).
§ 38] МАТРИЦЫ ОПЕРАТОРОВ 93 § 38. Матрицы операторов А теперь нам предстоит выполнить некоторую формаль- ную работу, большую часть которой мы проделаем, не входя в детали. Задача такова: как в фиксированной координатной системе SB = {а^, ..., хп}, зная матрицы операторов А и В, найти матрицы операторов аА--$В, АВ, 0, 1 и т. д.? Пусть [4] = (%.), [В] = (pi3.), С = аА + ₽В, [С] = (у0); мы утверждаем, что Уц = 4 РРгц далее, если [0] = (oi3) и [1] = (ei3), то оъ. = 0 и eii= (дельта Кронекера). Более сложное правило: если С = АВ, [С] — (у^), то Угу = 2«^Рм- к Для доказательства воспользуемся определением мат- рицы, ассоциированной с оператором, и проделаем сле- дующие манипуляции: Cxj = A (BXj) = А (2 Phj.rJ = 3 Рад Ахк = к к = 2 рад- (2 «г/г ^г) = 2 (2«Ж) к г г к Связь между операторами и матрицами точно такая же, как между векторами и их координатами, и аналог теоремы § 9 об изоморфизме справедлив в наилучшем воз- можном смысле. Эти утверждения имеют следующий точный смысл. С помощью фиксированного базиса SB мы поставили в соответствие каждому линейному оператору А некото- рую матрицу [4]; соответствие описывается равенствами 4aj = ai3- хг. Мы утверждаем, что это соответствие взаимно однозначно (т. е. матрицы двух различных опера- торов различны) и что каждая таблица (ai3) из га2 скаля- ров является .матрицей некоторого оператора. Чтобы
94 ОПЁРАТОРЫ [ГЛ. It доказать это, заметим, во-первых, что знание матрицы оператора А вполне определяет А (т. е. этим Ах однознач- но определено для каждого х)-, а именно, если х — У то Ах = 2 ^Axj = 2 (2 anxi) = 2(2 ai&) xi- (Иначе j j i i j говоря, если у = Ax = У то г = 2 аи i Сравнить это равенство с замечаниями, сделанными в § 37 по поводу своенравного поведения индексов.) Во-вторых, ничто не мешает нам прочитать равенство Ах> = 2 anxi в обратном порядке. Другими словами, какова бы ни была таблица (ai3), —мы можем воспользоваться этим равенством для определения линейного оператора А; ясно, что его матрицей будет как раз (%•). (Однако, еще раз подчеркнем тот основной факт, что это взаимно однознач- ное соответствие между операторами и матрицами было установлено с помощью определенной координатной си- стемы и что при переходе от одной координатной системы к другой один и тот же линейный оператор может соот- ветствовать разным матрицам, так же как одной и той же матрице могут соответствовать разные линейные опера- торы.) Следующая теорема подытоживает существенную часть этих рассмотрений. Т е о р е м а. Определим в множестве всех матриц (%), (Pi;) и т. д., i, / = 1, ..., п (рассматриваемых вне связи с линейными операторами), сумму, умножение на скаляры, произведение, (oi}-) и (ei7) формулами (%)+ (₽!,) = (“О’+ ₽«)- a (aj = (aai;), (%) (₽i3) = (2%А;) > h %=°> = Тогда соответствие (устанавливаемое с помощью произ- вольной координатной системы ТЕ = [xL, ..., хп} п-мер- ного векторного пространства ТЕ) между всеми линейными операторами А на ТЕ и всеми матрицами (au), описывав-
§ 38] Матрицы Операторов gg мое равенствами Ах.; = У, at Xj, является изоморфизмом', г другими словами, это — взаимно однозначное соответ- ствие, сохраняющее сумму, умножение на скаляры, про- изведение, 0 и 1. Мы старательно избегали рассмотрения матрицы опера- тора А'1. Выражение для [Л'1] через элементы ао- матри- цы [Л] дать можно, но оно не просто и, к счастью, не потребуется нам. Упражнения 1. Пусть А — линейный оператор на <Рп, определенный фор- мулой (Дх)(г) = ж (i—|— 1), и {хо, ..., хп_А — базис в .5°п, определенный формулами Xj (г) = V, j — Q, ..., п—1. Найти матрицу оператора А в этом базисе. 2. Найти матрицу оператора сопряжения в g, рассматриваемом как вещественное векторное пространство, в базисе {1, г} (где / = /^Т). 3. а) Пусть л — перестановка целых чисел 1, ..., га; для каждо- го вектора z = (£х, ..., gn) из <@п положим Ах = (£я(1), ..., £я(п)). Найти матрицу оператора Л в базисе-^, ..., хп}, т%е х4 = (641,б,,,). Ь) Найти все матрицы, перестановочные с матрицей оператора А. 4. Рассмотрим векторное пространство, состоящее из всех вещественных квадратных матриц второго порядка. Пусть А — линейный оператор на этом пространстве, пер вводящий каждую матрицу X в РХ, где Р=^ . Найти его матрицу в базисе, /1 0 \ /0 1\ /0 0\ Z0 0\ состоящем из J , J , (.10> <01> 5. Рассмотрим' векторное пространство, состоящее из всех линейных операторов на векторном пространстве У0, и пусть А (левый) оператор умножения, относящий каждому оператору X па ср0 оператор РХ, где Р — некоторый заданный оператор на . Каким условиям должно удовлетворять Р, чтобы А был обратимым? 6. Доказать, что если I, J и К соответственно комплексные матрицы f01Y И Л О л ' < —1 ОД ’ oj ’ <0 — ij (где f = то /2=Л = ^2=__1> IJ=z—JI=Kt jk = — —KJ = I и KI=—IK=J. 7. а) Доказать, что если А, В и С — линейные операторы на двумерном векторном пространстве, то {АВ— В А)2 перестановоч- но с С. Ь) Справедливо ли утверждение а) для пространств высших размерностей?
96 ОПЕРАТОРЫ [ГЛ. II 8. Пусть А — линейный оператор на g2, определенный форму- лой Л(£1? £2) =(?i+?2> £а)- Доказать, что если линейный оператор В перестановочен с Л, то существует такой полином р, что В =р (Л). 9. В каких из нижеследующих случаев справедливо равенство р(Л)=0? /1 1 1\ а) р(1) = ^-3£2Ч-3£— 1, Л= 0 11. \о о 1 у /1 1 1\ Ь) Р (/) = г2--3г, А = \ 111. \1 1 1/ /1 1 0\ с) р(£) = «3-|-£г+£+1, Л= 1 11. \0 1 1/ (где i = V —1), а С = АВ — 1ВА, то С34-С2 + С = 0. 11. Если А а В — линейные операторы на векторном простран- стве и АВ=0, то будет ли отсюда следовать, что ВА =0? 12. Что произойдет с матрицей линейного оператора па конеч- номерном векторном пространстве, если элементы базиса, относи- тельно которого вычислена матрица, подвергнуть перестановке? 13. а) Пусть 7/3—конечномерное векторное пространство с базисом{xj, ..., xn} Hctj, ..., ап — попарно различные скаляры. Если Л —линейный оператор, для которого Axj=a.jXj, / = 1, ..., га, а В — линейный оператор, перестановочный с Л, то существуют скаляры Рг, ...,_ рп такие, что Bxj = $jXj. b) Доказать, что линейный оператор В на конечномерном век- торном пространстве 7/3, перестановочный с каждым линейным опе- ратором на 73, есть скаляр (т. е. существует скаляр Р такой, что Вх=$х для всех х из Т3). 14. Если {xj, ..., хк} и {у1, ..., yh}—линейно независимые мно- жества векторов конечномерного векторного пространства Т'3, то существует обратимый линейный оператор А на такой, что Ах] = ур /=1.....к. 15. Если матрица [4] = (ai;) такова, что ai{ = 0, г = 1.га, то существуют матрицы [В] = (0{,) и [С] = (Уг,-) такие, что [Л] = = [5] [С] — [С] [5]. (Указание: испытать =
§ 38] МАТРИЦЫ ОПЕРАТОРОВ 97 16. Определить, какие из следующих матриц обратимы, и найти обратные матрицы, когда они существуют. /О 1 0\ е) I О 0 11. \1 О О/ /1 0 1\ f) 1 О 1 . \1 о 1/ /О 1 0\ g) 1 0 1 . \0 1 о/ 17. При каких значениях а Найти обратные, матрицы, когда следующие матрицы обратимы? это возможно. 18. При каких значениях а Найти обратные матрицы, когда следующие матрицы обратимы? это возможно. /1 а 0\ a) ala. \0 a 1J /а 1 0\ b) la 1 . \0 1 а/ /О 1 а\ с) I 1 а О I . \а 0 1/ /1 1 1\ d) I 1 1 a I . \1 а 1/ 19. а) Теория матриц легко обобщается на линейные отображе- ния в другие векторные пространства. Предположим, что 41 и 7/s'— векторные пространства над одним и тем же полем, {xj, ..., zn\ и {Ух, ..., ]/,,,}—базисы соответственно в 41 п 7'“ и А — линейное отображение 41 в ‘V3. По определению, матрица отображения А есть прямоугольная таблица из т х п скаляров, определяемая равенствами -4^ = 2! аП'Уг- г Определить сложепие и умножение прямоугольных матриц так, чтобы обобщить возможно большее число результатов § 38. (Заметим, что произведение матрицы из тх строк и пк столбцов с матрицей из т2 строк и п2 столбцов в этом порядке определено лишь если nL = т2.) Ь) Пусть А и В — перемножаемые матрицы. Разобьем А на четыре прямоугольных клетки (верхнюю левую, верхнюю правую, нижнюю левую, нижнюю правую) и затем В — аналогичным образом, 7 П. Халмош
98 ОПЕРАТОРЫ [ГЛ. И так, чтобы число столбцов верхней левой клетки матрицы А равня- лось числу строк верхней левой клетки матрицы В. Если, в очевид- ной сокращенной записи, эти разбиения обозначены |_Mii д__-Bis) Л22/ \-В21 В22/ то АВ__MnSn 4-Ы12_В21 Ых1512-|-л12в22\ \^21^11Ч"^4'22^21 Ч21512-ф Л22522 / с) Используя подпространства и дополнения, выразить резуль- тат Ь) в терминах линейных отображений (а не матриц). d) Обобщить Ь) и с) па случай большего (чем четыре) числа блоков. § 39. Инвариантность Возможным отношением между подпространствами а/Л векторного пространства и линейными операторами А на этом пространстве является инвариантность. Мы гово- рим, что лЛ инвариантно относительно А, если «х при- надлежит о-//» влечет «Ах принадлежит &#». (Заметим, что справедливость этой импликации требуется только в одном направлении; мы не предполагаем, что каждое у из а/Л мо- жет быть представлено в виде у = Ах, где х принадлежит лЛ-, равным образом мы не предполагаем, что «Ах при- надлежит аЛ» влечет «х принадлежит е#». Вскоре будут рассмотрены примеры, в которых эти не предполагаемые нами условия действительно не выполнены.) Как мы знаем, подпространство векторного пространства само является векторным пространством; если известно, что &Л инвариантно относительно А, то можно игнорировать тот факт, что А определено вне &#, и рассматривать А как линейный оператор, определенный на векторном про- странстве лЛ. Часто инвариантность рассматривается относительно не одного, а целого множества линейных операторов: <?// инвариантно относительно множества, если оно инвариантно относительно каждого элемента этого множества. Что можно сказать о матрице линейного оператора А на и-мерном векторном пространстве V, если известно, что некоторое ЛЛ инвариантно относительно Л? Другими словами: имеется ли разумный способ выбора такого ба зиса ЗЛ = {ху, ..., т,4} в У, чтобы матрица
§ 40] Приводимость 99 [Д = ( имела особенно простой вид? Ответ содержится в теоре- ме 2 § 12: мы можем выбрать так, чтобы а:1, х1Л при- надлежали All, а ж,п+1, хп — нет. Выразим Ах^ через хг, ..., хп. При т + 1 < j < п нельзя сказать ничего, кроме того, что Axj = 2 Однако, если 1</<т, г то Xj принадлежит ей, и потому (поскольку инвариант- но относительно Л) также Axj принадлежит Следова- тельно, в этом случае Ах^ есть линейная комбинация век- торов хг, хт; коэффициенты ац, у которых т-|-1 < i< п, все равны нулю. Поэтому матрица [Л] оператора Л в этой координатной системе принимает вид [Д] [ад [0] [Д]/ ’ где [Лх1 — (m-строчная) матрица оператора Л, рассма- триваемого как линейный оператор на пространстве с//1 (в координатной системе {х1, ..., хт}), [Л2] и [Во] — некоторые таблицы скаляров (соответственно из га — т строк и п — т столбцов и из т строк и п — т столбцов), а [0] — прямоугольная таблица (из п — т строк и т столбцов), состоящая из одних нулей. (Важно отметить то неприятное обстоятельство, что матрица [Во] не обя- зательно должна быть нулевой.) § 40. Приводимость Особенно важным частным случаем понятия инвариант- ности является понятие приводимости. Если М и — два подпространства, такие, что оба они инвариантны относительно Л, и ТА есть их прямая сумма, то Л приво- дится (разлагается) парой (</£, jf). Различие между инвариантностью и приводимостью заключается в том, что в первом случае среди множества всех подпространств, инвариантных относительно Л, может не оказаться никаких двух, кроме Q и ТА, которые бы обладали тем свойством, что ТА есть их прямая сумма. Или, говоря иначе, если инвариантно относительно Л, то хотя, конечно, можно многими способами найти такое чтобы ТА-АНТА^А. может случиться, что ни одно из этих J\A не будет инвариантным относительно Л. 7*
100 ОПЕРАТОРЫ [ГЛ. II Описанный процесс приведения оператора допускает обращение. Пусть <М и — любые два векторных про- странства, а А и В — любые линейные операторы (соответ- ственно на М и Пусть далее V' — прямая сум- ма Л и на можно определить линейный оператор С, называе- мый прямой суммой А и В, положив Cz = С (х, у) = (Ах, By). Мы опускаем подробное рассмотрение прямых сумм опе- раторов и приведем лишь результаты. Доказательство их не представит труда. Если (Л, JA) приводит С и если обозначить через А линейный оператор С, рассматривае- мый только на Л, а через В линейный оператор С, рас- сматриваемый только на J\T, то С будет прямой сум- мой А и В. Надлежащим выбором базиса (а именно выбором^, ..., жтиз е//ижт+1, ..., х,г из можно привести “матрицу ^пря- мой суммы А 'лВ к виду, продемонстрированному в пре- дыдущем параграфе, с [Л1] = [Л], [5о] = [0] и [Л2] = [В]. Каков бы ни был полином р, если положить А'= — р (А) и В'=р(В), то прямой суммой С' операторов А' и В' будет р(С). У пражнения 1. Пусть матрицей линейного оператора (на двумерном вектор- , „ „ / 0 0 \ ном пространстве) в некоторой координатной системе служит ( q • Сколько имеется подпространств, инвариантных относительно этого оператора? 2. Привести пример линейного оператора А на конечномерном векторном пространстве Т3, который имел бы 0 и Л единствен- ными инвариантными подпространствами. 3. Пусть Л — оператор дифференцирования на У>п. Если m<n, то подпространство инвариантно относительно!). Обратим ли D па Существует ли в &>п дополнение к iPm, которое вместе с приводило бы Д? 4. Доказать, что подпространство, натянутое на пару подпро- странств, каждое из которых инвариантно относительно некоторо- го оператора А, также инвариантно относительно А.
§ 41] ПРОЕКТОРЫ 101 § 41. Проекторы Для наших целей особенно важна еще одна связь между прямыми суммами и линейными операторами. Определение. Если ТС—прямая сумма и JC, так что каждое z из ТС единственным образом записы- вается в виде z = x-f- у с х из и у из jfC, то проектором на <М параллельно JC называется оператор Е, опреде- ленный равенством Ez = x. Если прямые суммы важны, то важны и проекторы, ибо, как мы увидим, они являются очень мощным алге- браическим орудием изучения геометрического понятия прямой суммы. Читатель легко поймет причины употреб- ления слова «проектор», если представит себе пару осей (линейных многообразий) в плоскости (их прямой сумме). Чтобы картина получилась достаточно общей, не про- водите перпендикулярных осей! Мы перескакиваем через пункт, доказательство кото- рого достаточно просто, чтобы его можно было опустить, но наличие которого следует сознавать: нужно показать, что Е — линейный оператор. Предоставим сделать это читателю и перейдем к разысканию специальных свойств проекторов. Теорема 1. Линейный оператор Е является про- ектором на некоторое подпространство тогда и только тогда, когда он идемпотентен, т. е. Е2 = Е. Доказательство. Пусть Е — проектор на <М параллельно JC и z — x-j- у с х из е# и у из так как разложение х есть z-f-O, то E2z = EEz = Ех — х= Ez. Обратно, предположим, что Е2 = Е. Пусть JC — множе- ство всех тех векторов z из ТС, для которых Ez = 0, a a/ft — множество всех тех векторов z, для которых Ez = z. Очевидно, Л'1 и JC — подпространства; докажем, что ТС@ ЛГ• Принимая во внимание теорему § 18, мы должны доказать, что <Л1 и JC дизъюнктны и их объедине- ние порождает У. Если z принадлежит то Ez = z; если же z принад- лежит JC, то Ez = 0; значит, если z принадлежит и Л1, и то z = 0. Для любого z имеем z — Ez-T (l-E)z. Положим Ez — х и (1 —E)z = у. Тогда Ex = E2z = = Ez = х, а Еу — Е (1 — Е) z — Ez — E2z = 0, так что
102 ОПЕРАТОРЫ [ГЛ. II х принадлежит &11, а у принадлежит . Этим доказано, что У' = @ JT и что Е действительно служит проек- тором на е// параллельно jf. Из приведенного доказательства непосредственно сле- дует также Теорема 2. Если Е — проектор на М параллель- но , то а'И и являются соответственно множест- вами всех решений уравнений Ez = z и Ez = 0. С помощью этих двух теорем можно устранить кажу- щуюся несимметричность ролей, которые играют <Л и .Д" в определении проекторов. Если каждому z = х^у поставить в соответствие не х, а у, мы также получим идемпотентный линейный оператор. Этот оператор (а именно, 1 —Е) будет проектором на параллельно с$. Подытожим сказанное. Теорема 3. Линейный оператор Е является про- ектором тогда и только тогда, когда 1—Е проектор', если Е—проектор на ЛЬ параллельно Ж, то 1—Е есть проектор на параллельно Л1. § 42. Комбинации проекторов Продолжая в духе теоремы 3 предыдущего параграфа, мы исследуем условия, при которых различные алгебраиче- ские комбинации проекторов также являются проекторами. Теорема. Пусть Е± и Е2 соответственно проек- торы на и <Л2 параллельно и и основное поле скаляров таково, что 1 +1 ¥= 0. (I) Ег + Е2 есть проектор тогда и только тогда, когда ЕУЕ2 = E2Ei = 0; при выполнении этого условия Е = Е^Еъ есть проектор на <М = парал- лельно лг = (II) Е± — Е2 есть проектор тогда и только тогда, когда Е±Е2 = Е2ЕГ = Е2; при выполнении этого условия Е = Ег — Ё2 есть проектор на парал- лельно Л"‘ = (III) Если Е±Е2 — Е2Ег = Е, то Е есть проектор на <Л = о-#! П < параллельно = JV\ + Доказательство. Напомним паши обозначе- ния. Если ДУ 11 =4-—подпространства, то есть подпространство, порожденное их объединением; запись
§ 42] КОМБИНАЦИИ ПРОЕКТОРОВ 103 означает, что и дизъюнктны и тогда е%?@ = е5£? + з®’; есть пересечение и Ж. (I) Если Е±-]-Е2 = Е—проектор, то (Е^Е^ = Е2 = = Е = Ех 4- Е2 , а потому £х£2+ад = о. (1) Умножив (1) слева и справа на Elt получим Е±Е2 + Е1Е2Е1 = 0, E1EiE1 + Е2Еу = 0; вычитание дает EtE2 — E2EY = 0. Значит, Et и Е2 пере- становочны и (1) показывает, что их произведение равно нулю. (Здесь нам и понадобилось предположение, что 14-1 =4= 0.) Поскольку, обратно, из EYE2 = E2EV = 0 очевидно следует (1), мы видим, что условие (I) также достаточно для того, чтобы Е было проектором. Будем, начиная отсюда, предполагать, что Е — проектор; по теореме 2 § 41, М и JT являются, соответствен- но, множествами всех решений уравнений Ez = z и Ez = 0. Положим z = + = ^2 + ^2, где zi = £iz и х2 = E2z принадлежат соответственно аЦл и ®/Z2, a yt = (1 — E^)z и Уг — (1 — £2)z —соответственно и Если z— вектор из М, Exz-YE2z = z, то z = £1 (х2 у2) 4~ £2 (zj 4- У1) = Егу2 -р Е2ух. Поскольку £j (£^2) = Е±у2 и £2 (£2i/1) = EaJy, мы пред- ставили z в виде суммы вектора из и вектора из &#2, так что CZo^i + 0^2- Обратно, если z является сум- мой вектора из и вектора из а#2, то {Ех '-Е^ z = z, так что z принадлежит Следовательно, Л(, = а/^л-а^. Наконец, если z принадлежит и и е#2, так что £xz = = £2z = z, то z = £xz — Et (E2z) = 0, и, значит, и a#2 дизъюнктны; тем самым доказано, что s£ =2^1@в/^2- Остается найти jF, т. е. найти все решения уравнения £Lz--£2z — 0. Если z принадлежит это уравнение, очевидно, выполнено; обратно, £xz4-£2z = 0 влечет (по умножении слева соответственно на £, и £2) £1z + £i£22 = 0 и £2£1z4-£2z = 0. Поскольку F.1E2z = = E2Erz = 0 для всех z, получаем окончательно £xz = £2z = 0, так что z принадлежит одновременно И J\[\.
104 ОПЕРАТОРЫ [ГЛ. II Техника, использованная при этом доказательстве, и полученные результаты позволяют уже без труда дока- зать оставшиеся части теоремы. (II) По теореме 3 § 41, — Е2 есть проектор тогда и только тогда, когда 1 — (Ех — Е2) = (1 — ЁХ)-^Ё2 есть проектор. Согласно (I) это имеет место (поскольку ведь 1—2?! — проектор на параллельно тогда и только тогда, когда (1- ЕХ)Е2 = ^(1-^ = 0, (2) причем в этом случае (1 — Ех) Е2 является проектором на параллельно Г] ЛГ2. Поскольку (2) эквивалентно равенствам ЕХЕ2 = Е2ЕХ = Е2, утвержде- ние (II) доказано. (III) То, что равенства Е = ЕХЕ2 = Е2ЕХ влекут, что Е есть проектор, — ясно, поскольку тогда Е идемпотент- но. Поэтому предположим, что £1 и Е2 перестановочны, и найдем и Если Ez = z, то Exz = ExEz = ExExE2z — = ExE2z = z, и аналогично E2z — z, так что z содержится одновременно в <Jlx и <^2. Обратное очевидно: если Exz = = z = E2z, то Ez = z. Предположим теперь, что E,1E'2z=0; отсюда следует, что E2z принадлежит а на основании перестановочности Ех и Ё2,— что Exz принадлежит JE2. Это — даже большая симметрия, чем нужно нам;- по- скольку z = E2z + (1 — z и (1 — Ё2) z принадле- жит j!/\, мы представили z в виде суммы вектора из и вектора из jE'2. Обратно, если z — такая сумма, то ExE2z — Q', это завершает доказательство того, что = Позже мы еще вернемся к теоремам этого типа и полу- чим в некоторых случаях более точные результаты. Одна- ко, прежде чем перейти к другой теме, обратим внимание на несколько второстепенных особенностей теоремы этого параграфа. Во-первых, отметим, что хотя и в (I), и в (II) а/it nj/Е были прямыми суммами заданных подпространств, в (III) установлено только, что JT — J/\ + jT2- Рассмот- рение возможности Ех = Е2 = Е показывает, что это неизбежно. Кроме того, утверждалась лишь достаточность условия (III); можно построить проекторы Ех и Е2, произ- ведение которых ЕХЕ2 будет проектором, но для которых ЕХЁ2 и Е2ЕХ различны. Наконец, можно предположить,
§ 43] ПРОЕКТОРЫ И ИНВАРИАНТНОСТЬ 105 что результат (I) распространим по индукции на случай более чем двух слагаемых. Это предположение хотя и вер- но, но, вопреки ожиданиям, не тривиально; позже мы докажем его в одном особо интересующем нас случае. § 43. Проекторы и инвариантность Мы уже видели, что изучение проекторов равносильно изучению разложений в прямые суммы. С помощью проек- торов можно также изучать понятия инвариантности и приводимости. Теорема 1. Если подпространство АЕ инвариант- но относительно линейного оператора А, то ЕАЕ = АЕ для каждого проектора Е на АЕ. Обратно, если ЕАЕ = АЕ для некоторого проектора Е на &Е, то о/Е инвариантно относительно А. Доказательство. Пусть аЕ инвариантно от- носительно А, ТА = АЕ @ JE для некоторого JE и Е — проектор на ©# параллельно JT. Для любого z = х~Уу (с х из &Е и у из jE) имеем AEz = Ах и EAEz = ЕАх', поскольку принадлежность х подпространству о/Е обеспе- чивает принадлежность Ах тому же подпространству, заключаем, что ЕАх также равно Ах, что и требовалось. Обратно, предположим, что Т = <М @ JE и ЕАЕ = = АЕ для проектора Е на &Е параллельно JE Если х принадлежит то Ех = х, так что ЕАх — ЕАЕх = АЕх = Ах, и, следовательно, Ах также принадлежит е/Е. Теорема 2. Если ТА = М @ JE, то линейный опе- ратор А на ТА приводится парой {АЕ, тогда и только тогда, когда ЕА = АЕ, где Е — проектор на аЕ парал- лельно je. Доказательство. Предположим сначала, что ЕА = АЕ, и докажем, что А приводится парой {АЕ, JA}. Если х принадлежит АЕ, то Ах = АЕх = ЕАх, так что Ах также принадлежит аЕ\ если х принадлежит JE, то Ех = 0 и ЕАх — АЕх = АО = 0, так что Ах также принадлежит jE- Теперь предположим, что Л приводится парой (е^, jE), И докажем, что ЕА = АЕ. Так как АЕ инвариантно отно-
106 ОПЕРАТОРЫ [ГЛ. II сительно А, то, по теореме 1, ЕАЕ = АЕ', поскольку JF также инвариантно относительно A, al—Е есть проек- тор на jff, то, аналогично, (1 — Е) А (1 — Е) = А (1 — Е). Из последнего равенства, по выполнении указанных умножений и упрощений, получаем ЕАЕ = ЕА, и теоре- ма полностью доказана. Упражнения 1. а) Пусть Е— проектор па векторном пространстве У3; пере- определим умножение на скаляр так, чтобы произведение вектора х на скаляр а в новом смысле равнялось прежнему произведению Ех на а. Показать, что сложение векторов (в старом смысле) и умножение на скаляр (в новом смысле) удовлетворяют всем аксиомам векторного пространства за исключением \-х = х. Ь) В какой мере справедливо, что описанный в а) метод являет- ся единственным способом построения систем, удовлетворяющих всем аксиомам векторного пространства, за исключением 1-х = х1 2. а) Пусть — векторное пространство, — его вектор и у0—линейный функционал на положим Ах=[х,уо]хо для каждого х из ‘У3. Каким условиям должны, удовлетворять хц и уо, чтобы А было проектором?. Ь) ЕслиЛ —проектор, скажем, на параллельно охаракте- ризовать <М и .А в терминах хо и уо. 3. Если А есть умножение слева на Р в пространстве линейных операторов (см. упражнение 5 § 38), то каким условиям должен удовлетворять Р, чтобы А было проектором? 4. Если А—линейный оператор, Е—проектор и F = 1—Е, то А = ЕАЕ+ЕА F + F А Е + FA F. Использовать этот результат для доказательства правила умноже- ния клеточных (квадратных) матриц (как в упражнении 19 § 38). 5. а) Если и Е2— перестановочные проекторы соответствен- но на <МХ и оМ2 параллельно Щ \ и то Ех + Е2— ЕХЕ2 есть проектор. Ь) Пусть Ех -|- Ег — ЕХЕ2 — проектор на М параллельно АА \ описать М и JV‘ в терминах Мх, о//2, и ’г. 6. а) Указать такой не идемпотентный линейный оператор А, для которого бы Л3 (1 — Л)=0. Ь) Указать не идемпотентный линейный оператор, для которого бы Л(1 —И)3 = 0. . с) Доказать, что линейный оператор А, для которого А2 (1 — А)=А (1 — Л)3 = 0, идемпотентен. 7. а) Доказать, что проектор, определенный на конечномерном векторном пространстве, имеет в некотором базисе матрицу (eij) следующего специального вида: е.; - —0 или 1 для всех i и j и еХ]==0, если i =/= j. Ь) Инволюцией называется лппейпый оператор U, для которого U2=l. Показать, что равенство U = 2Е — 1 устанавливает взаим-
§ 44] СОПРЯЖЕННЫЙ ОПЕРАТОР 107 но однозначное соответствие между множествами всех проекторов Е и всех инволюций U. с) Что вытекает из а) и Ь) для матрицы инволюции на конечно- мерном векторном пространстве? 8. а) Пусть еЛ+, JV\ и — подпространства пространства Л'2 всех векторов (g1; g2), характеризуемые соответственно условия- ми g1 = g2, £1=0. ^2 = 0. Показать, что если и Е2 — проекторы на соответственно параллельно 2 и 2, то Е1Е2 = 7?2 и ЕЪЕХ = ЕХ. Ь) Пусть М~— подпространство, характеризуемое условием g1= — g2. Если £о— проектор на jV\ параллельно М~, то Е2Е0— проектор, но Е0Е2 — нет. 9. Показать, что если Е, F и G — проекторы на векторном про- странстве над полем характеристики, не равной 2, и Е-1-F + G = 1, то EF = FE = EG = GE = FG = GF — Q. Пройдет ли доказательство, если вместо трех проекторов взять четыре? § 44. Сопряженный оператор Исследуем теперь, как связаны между собой поня- тия линейного оператора и сопряженного пространства. Пусть F' — любое векторное пространство и у — любой элемент из Е'1', для любого линейного оператора А на У* рассмотрим выражение [Ах, р]. При каждом фиксирован- ном у функция у', определенная формулой у' (х) = = [Ах, у], является линейным функционалом на Т’; используя для у', как и для у, обозначение с помощью квадратных скобок, имеем [Ах, у[ = [я, у'[. Если теперь считать у пробегающим V, то этим способом каждому у будет поставлено в соответствие некоторое у', зависящее, конечно, от у, положим у' = А’у. Определяющим свойством А’ является равенство [Ах,у[ = [х, А'у]. (1) Мы утверждаем, что А' есть линейный оператор на Т’'. Действительно, если у = а1г/1Ц-а2р2, то [х, А'у] = [Ах, у] = ах [Ах, у^ + а2 [Ах, у2] = = ах [г, A'yJ + а2 [г, А’у2] = [х, а1А'у1 + а2А'у2]. Линейный оператор А' называют сопряженным к А; этот и следующий параграфы будут посвящены изучению свойств А'. Разделаемся сначала с формальными алгебраи-
108 ОПЕРАТОРЫ [ГЛ. II ческими правилами; вот они: 0' = 0, (2) г = 1, (3) (-4 + В)' = Л' + В', (4) (аАу = аЛ', (5) (АВ)' = В'А', (6) (Л’1)' = (А'у\ (7) Здесь (7) нужно понимать в следующем смысле: если А обратим, то А' также обратим, и имеет место (7). Доказа- тельства всех этих соотношений элементарны; чтобы продемонстрировать, как они проводятся, выполним вы- кладки, приводящие к (6) и (7). Чтобы доказать (6), достаточно просто заметить, что [АВх, у] — [Вх, А'у] = [х, В'А'у]. Для доказательства формулы (7) предположим, что А обратим, так что А А'1 = А1 А = 1. Применяя к этим равенствам (3) и (6), получаем (Л-1)'Л'= Л'(Л-1)'= 1. Теорема 1 § 36 показывает тогда, что А' обратим и имеет место формула (7). В конечномерных пространствах справедливо еще одно важное соотношение: Л" = Л. (8) Это соотношение следует понимать не буквально. В том, что написано, А" есть оператор не на V, а на простран- стве V, сопряженном к V'. Если, однако, отождествить V и ТА посредством естественного изоморфизма, то А" будет действовать на Т, и (8) приобретет смысл. В такой интерпретации доказательство соотношения (8) три- виально. Из рефлексивности Т следует, что каждый линейный функционал на У' может быть получен рас- смотрением [z, у] как функции от у при некотором фикси- рованном х из У. Поскольку [х, А'у] определяет функ- цию (линейный функционал) от у, оно может быть записа- но в виде [х', у]. Вектор х по определению есть здесь А"х, Следовательно, для каждого у из У и каждого х
§45] СОПРЯЖЕННЫЕ ПРОЕКТОРЫ Ю9 из У имеем [Ах, у] = [х, А'у] = [А"х, у]- равенство первого и последнего выражений этой цепочки и приводит к формуле (8). При предположении, в котором выведено (8) (т. е. конечномерности пространства) несимметричность истол- кования формулы (7) можно устранить; мы утверждаем, что в этом случае обратимость А' влечет обратимость А, а значит и справедливость формулы (7). Доказательство: применить прежнее истолкование формулы (7) к А' и А" вместо А и А'. Итогом наших рассмотрений в рефлексивном конечно- мерном случае является утверждение, что А—> А' есть взаимно однозначное отображение множества всех линей- ных операторов, заданных на , на множество всех линейных операторов, заданных на ТА", и даже алге- браический антиизоморфизм. (Приставка «ацти» обуслов- лена правилом перестановочности (6).) § 45. Сопряженные проекторы Существует один важный случай, когда порядок следования сомножителей не обращается, т. е. (АВ)' = = А'В', а именно тот случай, когда Ап В перестановочны. В частности, имеем (Л’1)' = (Л')п и, более общим образом, (р (Л))' = р (Л') для каждого полинома р. Отсюда сле- дует, что если £—проектор, то Е'—тоже проектор. Возни- кает вопрос: с каким разложением в прямую сумму связан проектор £'? Т е о р ема 1. ЕслиЕ—проектор на &fl параллельно , то Е’—проектор на JE" параллельно а‘И°. Доказательство. Мы уже знаем, что (Е')2 = Е', а также V = (см. § 20). Нужно только найти подпространства, состоящие из всех решений уравнений Е'у = 0 и Е'у = у. Мы сделаем это в четыре шага. (I) Если у принадлежит &<°, то для всех х [а:, Е'у] = [Ех, у] = 0, так что Е’у = 0.
110 ОПЁРАТОРЫ [гл. it (II) Если Е'у = 0, то для всех х из М [я, у] = [Ех, у] = [х, Е'у] = О, так что у принадлежит ®Ж°. (III) Если у принадлежит jfF°, то для всех х [х, z/] = [Ех, у] + [(1 - Е) х, у] = [Лх, у] = [х, Е'у], так что Е’у = у. (IV) Если Е'у = у, то для всех х из jfF [я> У] = [я, Е'у] = [Ех, у] = О, так что у принадлежит 1#’°. (I) и (II) в совокупности показывают, что множеством решений уравнения £"у = 0 служит <Al°, а (III) и (IV) — что множеством решений уравнения Е'у — у служит jfF°. Тем самым теорема доказана. Теорема 2, Если аМ инвариантно относительно А, то e/ft° инвариантно относительно А'; если А приводится парой (a/fl, JjF), то А' приводится парой Доказательство. Мы докажем только первое утверждение; из него очевидным образом следует второе. Сначала заметим, что для любых линейных операторов Е, F = 1 — Е и А справедливо тождество FAF — FA — ЕАЕ — АЕ. (1) (Сравнить с доказательством теоремы 2 § 43.) Пусть Е— какой-нибудь проектор на oi; по теореме 1 § 43 правая часть тождества (1) обращается в нуль, а потому и левая часть равна нулю. Переходя к сопряженным, получаем F'A'F' = A'F'\ так как по теореме 1 этого параграфа F' = 1 — Е' является проектором на М°, теорема 2 тем самым доказана. (Вот другое доказательство первого утверждения теоремы 2, не использующее того, что У есть прямая сумма с каким-то еще подпространством. Если у принадлежит <у#°, то [я, А'у] = [Ах, у] = 0 для всех х из е#, и потому А'у принадлежит &fl°. Единственное преимущество данного выше алгебраического доказатель- ства перед этим простым геометрическим состоит в том, что первое подготавливает почву для будущей работы с проекторами.)
§ 45] СОПРЯЖЕННЫЕ ПРОЕКТОРЫ Ш Мы заключим рассмотрение сопряженных операто- ров изучением их матриц, с целью пояснить теорию в це- лом и дать возможность читателю строить различные примеры. Нам потребуется следующий факт: если {х±, .. . . . xv } — какой-нибудь базис в /г-мерном векторном про- странстве = {ylf . .., у — сопряженный базис в V и (ai3) — матрица линейного оператора А в коорди- натной системе то % = [Ахр z/J. (2) Это следует из определения матрицы линейного опера- тора: так как Axj = У akjXh, то k [Ахр уг] = 2 ahj [ж/г, yt] = ai;. Чтобы не сбиться в применении формулы (2), приведем еще ее словесную формулировку: чтобы найти элемент с индексом (i, /) матрицы [Л] оператора А в базисе Я7, следует применить А к /-му элементу базиса .Ж", а затем найти значение i-го линейного функционала (из &') на полученном таким образом векторе. А теперь очень легко найти матрицу (оц3) = [Л'] в координатной системе мы просто последуем только что данному рецепту. Другими словами, рассмотрим Л'у3 и найдем значение г-го линейного функционала из SE" (т. е. xL, рассматри- ваемого как линейный функционал на Я’) на этом векторе; в результате получим ац = Ьч, А’У1\- Поскольку [xt, А'У1] = [Axit z/Д = a;i, так что a(j = ayi, матрицу [Л'] называют транспонированной к матрице [Л]. Заметим, что наши результаты о связи между Е и Е' (где Е проектор) можно было бы получить также, соеди- няя сведения о матричном представлении проекторов с последним результатом о матрицах сопряженных опера- торов.
112 ОПЕРАТОРЫ [ГЛ. II § 46. Изменение базиса То, что делалось с линейными операторами до сих пор, даже когда могло показаться сложным, было в значительной степени автоматическим. Введя новое понятие линейного оператора, мы просто выявляли его связи с некоторыми ранее введенными понятиями. Теперь мы переходим к изу- чению самих линейных операторов. В качестве первого при- ложения теории мы займемся разрешением задач, возникаю- щих при изменении базиса. Эти задачи могут быть сфор- мулированы без упоминания линейных операторов, но наиболее эффективным образом они решаются в терми- нах линейных операторов. Пусть &= {хг, хп} и У = {уг, у„}_— два ба- зиса в и-мерном векторном пространстве ТУ. Можно задаться следующими двумя вопросами. Вопрос I. Если х — вектор из Т', £ = 2=А=: I = 2Ht-Vt то какова связь между его координатами г (|15 ..., £„) в базисе и его координатами (гц, ..., т]„) в базисе У? Вопрос II. Если (gp ..., |п) — упорядоченное мно- жество из п скаляров, то какова связь между векторами х = 2 kxi и у = 2 i i На оба эти вопроса легко ответить на языке линейных операторов. А именно, рассмотрим линейный оператор А, определенный равенствами Ахг = у^ i =1,...,п. Под- робнее: ^(2 £а) = 2^- i г Пусть (ai7) — матрица оператора А в базисе т. е. у < = AXj = 2 aijxv Заметим, что А обратим, поскольку г 2 liVi = 0 влечет .. = с„ = 0. г Ответ на вопрос I. Так как 2 Л = 2 UjAXj = 2 Л; 2 = 2(2 Ъ, j 3 3 i i 3
§ 46] ИЗМЕНЕНИЕ БАЗИСА 113 ТО Bi=S«iA- (1) Ответ на вопрос II. р = Аг. (2) Грубо говоря, обратимый линейный оператор А (или, точнее, матрицу (ai;)) можно рассматривать как преобра- зование координат (как в (1)), а можно рассматривать (как мы обычно рассматриваем его, в (2)) как преобразо- вание векторов. В классических руководствах по векторным простран- ствам принято трактовать векторы не как абстрактные объекты, а как упорядоченные системы из п чисел; это делает необходимым введение громоздкой терминологии. Мы дадим сейчас краткий словарь некоторых наиболее затрудняющих терминов и обозначений, возникающих в связи с сопряженными пространствами и- операторами. Вектор х «-мерного векторного пространства задает- ся своими координатами в некоторой привилегированной, абсолютной координатной системе; эти координаты обра- зуют упорядоченное множество из п скаляров. Принято выписывать это множество скаляров в столбец, Элементы сопряженного пространства Т' записывают в виде строк, х — (£', Если считать х (прямо- угольной) матрицей из п строк и одного столбца, ах' — матрицей из одной строки и п столбцов, то матричное произведение х'х есть матрица из одной строки и одного столбца, т. е. скаляр. В наших обозначениях этот скаляр есть [ж, x'] = ^15{+. ..+5Л». Прием с представлением векторов в виде тонких матриц действует даже при рас- смотрении полноценных матриц линейных операторов. Так, произведение матрицы (ai?) и столбца (£;) есть стол- бец, i-м элементом которого служит T]i = Sai^r Вместо i 8 П. Халмош
114 ОПЁРАТОРЫ [ГЛ. II возни с сопряженными базисами и операторами, мы ма- жем аналогичным способом образовать произведение строки (£$) с матрицей (ai;) в порядке (£,') (ai;); в резуль- тате получится строка, которую мы раньше обозначали у' = А'х'. Выражение [Ах,х'[ сокращенно записывается теперь в виде х'-А-х, где обе точки означают обычное матричное умножение. Векторы i из F называют кова- риантными, а векторы х из У — контравариантными. Так как понятие произведения х'-х (т. е. [г, #']) с этой точки зрения зависит от координат векторов х и х , умест- но задаться следующим вопросом: при изменении базиса • в У с помощью обратимого линейного оператора А что следует сделать в У', чтобы сохранить произведение х'-х? В наших обозначениях: если [я, х'] = [у, у'], где у = Ах, то как связано у' с x"i Ответ: у' = (Л')-1х'. Для выраже- ния всего этого клубка идей классическая терминология говорит: векторы х изменяются когредиентно, ах' — контрагредиентно. § 47. Подобие Следующие два вопроса тесно связаны с вопросами предыдущего параграфа. Вопрос III. Пусть В — линейный оператор на ТА; какова связь между его матрицами ) и (у;.) в базисах SC и 2/?] Вопрос IV. Дана матрица (ptj); какова связь меж- ду линейными операторами В и С, определенными соот- ветственно равенствами Bxj = 2 Р^ и Су-, = 2 Р, i I Вопросы III и IV представляют собой точные форму- лировки поставленной ранее проблемы: одному оператору соответствует (в различных координатных системах) много матриц (вопрос III) и одной матрице — много опе- раторов (вопрос IV). Ответ на вопрос III. Имеем Bxi = 2 Рг,^ (1) И (2)
ПОДОБИЕ 115 § 47] С помощью линейного оператора А, определенного в пре- дыдущем параграфе, можем записать Byi = BAxj = В (2 akJa:ft) = h — 2 ‘ 2 akj 2 Pi/A = 2(2 Pifcabj) Xi (3) k hi i k И 2YbjJ/fe= 2 = 2 Nkj 2 а4Ь^ ~ 2 (2 aifeYfcj) xi- (4) l< k hi г k Сравнивая (2), (3) и (4), видим, что 2 ^ihNhj 2 Pifc®fcp Л k С помощью матричного умножения это записывается в опасно простой форме [Л][С] = [Б][Л]. (5) Опасность заключена в том, что три из четырех матриц в равенстве (5) соответствуют своим линейным операторам в базисе А, четвертая же — а именно обозначенная нами через [С] — соответствует оператору В в базисе 2Л Однако, если понимать это, формула (5) корректна. Более употребительна следующая форма равенства (5), приспо- собленная в принципе к вычислению [С], когда [Л] и [5] известны: [С] = [ЛГ[5] [Л]. (6) Ответ на вопрос IV. Для выявления суще- ственно геометрического характера как этого вопроса, так и ответа на него, заметим, что Cy^CAXj и 2 = 2 = ^(2 Pi а) = 45а> i i i Следовательно, С таково, что CAxj = ABxj, или, окончательно, С = АВА-\ (7) С равенством (7) не связаны затруднения, подобные 8*
116 ОПЕРАТОРЫ [ГЛ. II заставившему нас сделать оговорку насчет истолкования соотношения (6); чтобы найти линейный оператор (не матрицу) С, мы перемножаем операторы А, В и Л"1, и незачем говорить что бы то ни было о координатных системах. Однако, сравнение формул (6) и (7) еще раз обнаруживает прирожденное своенравие математических символов. Это лишь другой аспект фактов, уже отмечен- ных в §§ 37 и 38. Матрицы [5] и [С] называют подобными, если суще- ствует обратимая матрица [Л], удовлетворяющая соот- ношению (6); линейные операторы В и С называют подоб- ными, если существует обратимый оператор Л, удовлетво- ряющий соотношению (7). На этом языке ответы на вопросы III и IV могут быть выражены очень кратко; в обоих слу- чаях ответ состоит в том, что данные матрицы или опера- торы должны быть подобны. Получив ответ на вопрос IV, мы видим теперь, что фор- мулировка этого вопроса содержит слишком много индек- сов. Справедливость соотношения (7) есть геометрический факт, совершенно не зависящий от линейности, конечно- мерности или любого другого случайного свойства, кото- рым могут обладать Л, В и С-, ответ на вопрос IV является также ответом на гораздо более общий вопрос. Этот гео- метрический вопрос, перефразирующий аналитическую формулировку вопроса IV, таков: если В преобразует У, а С таким же способом преобразует AV, то как связаны между собой В и С? Выражение «таким же способом» не так неопределенно, как оно звучит; оно означает, что если В переводит х, скажем, в и, то С переводит Ах в Аи. Разумеется, ответ таков же, как раньше: так как Вх = и и Су = v (где у = Ах и v = Ли), то АВх = Au = v = Cy = САх. Рассматриваемая ситуация удобно резюмируется следую- щей мнемонической диаграммой: В X----> и А А У---->v С
3 47] ПОДОБИЕ 117 Мы можем идти от у к и, используя короткий отрезок С или же обходя весь блок; иными словами, С = АВА1. Напомним, что АВА 1 должно применяться к у справа налево: сначала А'1, затем В, потом С. Мы уже видели, что теория изменения базисов парал- лельна теории обратимых линейных операторов. Обрати- мый линейный оператор есть автоморфизм, где под авто- морфизмом мы понимаем изоморфизм векторного про- странства с самим собою. (См. § 9.) Заметим, что, обрат- но, всякий автоморфизм является обратимым линейным оператором. Надеемся, что связь между линейными операторами и матрицами теперь достаточно выяснена, так что чита- тель не будет возражать, если в дальнейшем, желая дать примеры линейных операторов с различными свойствами, мы будем довольствоваться выписыванием матрицы. В таких случаях всегда будет иметься в виду конкретное векторное пространство ё11 (или одна из его обобщенных версий А'1) и конкретный базис Ж = {ж,, ..., х. }, обра- зованный векторами = (йп, ..., 6jT). Разумеется, при этих условиях матрица (ai;) определяет единственный линейный оператор А, заданный обычной формулой А (25л) = 2(2а»Д;)а:г- г i j Упражнения 1. Если Л — линейное отображение векторного пространства 41 в векторное пространство то для каждого фиксированного у из V существует вектор из®', который и в этом случае можно обозначить А'у, такой, что [Ах, у] — [х, А'у] для всех х из 41. Доказать, что Л.' есть линейное отображение Т3' в 41'. (Отображение А' называется сопряженным к Л.) Истолковать и доказать все, что возможно, из равенств (2) — (8) § 44 для этого понятия сопряженности. 2. а) Доказать, что подобие линейных операторов является отношением эквивалентности (т. е. что оно рефлексивно, симметрично и транзитивно). Ъ) Если Л подобно скаляру а, то Л=а. с) Если А и В подобны, то то же верно и для Л2 и В2, А' и В', а в случае, когда Л и В обратимы,— для Л"1 и В~2,
118 ОПЕРАТОРЫ 1ГЛ. II d) Обобщить понятие подобия на операторы, определенные на различных векторных пространствах. Какие из предыдущих результатов останутся справедливыми для этого обобщенного понятия? 3. а) Если А л В — линейные операторы на одном и том же век- торном пространстве и хотя бы один из них обратим, то АВ и ВА подобны. Ь) Останется ли верным заключение а), если ни А, ни В не обратимо? /1 4. Если ( । । )—матрица линейного операторах на в базисе {(1, 0), (0, 1)}, какова будет матрица А в базисе {(1, 1), (1, —1)}? А в базисе {(1, 0), (1, 1)}? / 0 1 1\ 5. Если I 1 0—1 I—матрица линейного оператора А \ — 1 —1 О/ на в базисе {(1, 0, 0), (0, 1, 0), (0, 0 1)}, какова будет матрица А в базисе {(0, 1, —1), (1, —1, 1), (—1, 1, 0)}? 6. а) Построение матрицы, ассоциированной с линейным опера- тором, зависит от двух базисов, а не от одного. Действительно, если = {х1, ...,хп} и = {xi, ...,хп] — базисы пространства Т3 иА—линейный оператор на Т3, то матрица [А; %', оператора А в базисах и -Ж" должна определяться формулами Axj =’2 ctijXj. i Определение, принятое в тексте, соответствует тому специальному случаю, когда Этот случай приводит к определению подо- бия (В и С подобны, если существуют базисы .Ж и '^ такие, что [В; = 2^]). Аналогичное отношение, подсказываемое общим случаем, называется эквивалентностью; В и С- эквивалентны, если существуют пары базисов (•%", %-) л (ГУ, 2/) такие, что [В; %, — У, •У]. Доказать, что это действительно есть отношение эквивалентности. Ь) Два линейных оператора В л С эквивалентны тогда и только тогда, когда существуют обратимые линейные операторы Р и Q такие, что PB = CQ. с) Если А и В эквивалентны, то А' и В' также эквивалентны. d) Существует ли линейный оператор А, эквивалентный ска- ляру а и такой, что А а? е) Существуют ли эквивалентные линейные операторы А и В, для которых А2 и В2 не эквивалентны? f) Обобщить понятие эквивалентности на операторы, определен- ные на различных векторных пространствах. Какие из предыдущих результатов останутся справедливыми для этого обобщенного ПОНЯТИЯ?
I 48] ФАКТОРОПЕРАТОРЫ 119 § 48. Фактороператоры Пусть А — линейный оператор на векторном про- странстве V и <М — подпространство последнего, инва- риантное относительно А. При таких обстоятельствах существует естественный способ определения линейного оператора (который мы будем обозначать A/a/ft) на про- странстве T'l&ll', этот «фактороператор» находится почти в таком же отношении к А, как факторпространство к У*. Нам будет удобно (в этом параграфе) обозначать Ч^М более компактным символом ЧА~ и использовать соответ- ствующие символы для векторов и линейных операторов, которые нам встретятся. Так, например, для любого век- тора х из Чг мы будем обозначать смежный класс х-±М через а:*; эти элементы х~ и образуют пространство Ч^~. Фактороператор Afo/fl (обозначаемый иначе Л') мы определим, положив А~ х~ — (Ах)~ для каждого вектора х из Т'. Другими словами, чтобы найти, во что переводит А/М смежный класс x-\-o/ft, находим сначала, во что переводит А вектор х, а затем образуем смежный класс по <М, определяемый этим пре- образованным вектором. Это определение должно быть подкреплено доказательством однозначности: мы должны быть уверены, что если два вектора определяют один и тот же смежный класс, то то же верно для их образов при отображении А. Ключевым фактом здесь служит инвариантность а/11. Действительно, если х= у<М, ю х —у принадлежит &Ж, так что (инвариантность) Ах — Ау также принадлежит &#, и потому Ax~\-tM = Ау + <Л. Что будет, если<М не только инвариантно относительно А, но и, вместе с соответствующим подпространством приводит Л? В этом случае А является прямой суммой, скажем, А — В @ С, двух линейных операторов, опре- деленных соответственно на подпространствах и возникает вопрос: как связаны между собой Л' и С? Оба эти оператора можно рассматривать как дополни- тельные к Л; оператор В описывает, как действует Л на <М. а Л и С различным образом описывают, как действуют Л вне М.
120 ОПЕРАТОРЫ [ГЛ. И Пусть Т — соответствие, относящее каждому вектору а: из jp‘ смежный класс х~ ( = х 4- М). Как мы уже знаем, Т есть изоморфизм между и У[М (см. теорему 1 §22); мы покажем сейчас, что этот изоморфизм переводит опе- ратор С в оператор А~. Если Сх = у (где, конечно, х принадлежит ^’), то А~х~ = (Ах\ = (Сх)~ = у; отсюда следует, что ТСх = Ту = А Тх. Значит, ТС — А~Т, как и было обещано. Допуская вольность (см. § 47), можно сказать, что А~ действует на У' таким же образом, цак С на JA. Другими словами, линейные операторы .-Г и С абстрактно тождественны (изоморфны). Этот факт имеет большое значение в приложениях понятия факторпро- странства. § 49. Область значений и нуль-пространство Определение. Пусть А — линейный оператор на векторном пространстве У и е# — подпространство последнего. Образом М относительно А, символически AM, называется множество всех векторов вида Ах, где х принадлежит М. Областью значений оператора А назы- вается множество 31 (Л) = Л У; нуль-пространством опе- ратора Л называется множество (Л) всех векторов х, для которых Ах = 0. Легко проверить, что AM и jfA (Л) — подпространства. Обозначая, как обычно, через О подпространство, со- стоящее из единственного вектора 0, нетрудно опи- сать часть известных нам понятий на языке только что введенной терминологии; перечислим некоторые ре- зультаты. (I) Оператор Л обратим тогда и только тогда, когда ^(Л) = У и Ж(А) = О. (II) Если У конечномерно, то Л обратим тогда и только тогда, когда 31 (Л) — V или АГ (Л) = О.. (III) Подпространство М инвариантно относительно Л тогда и только тогда, когда AM (~ М. (IV) Пара взаимно дополнительных подпространств М и приводит Л тогда и только тогда, когда Ле# CZ М И AJP ez J3. (V) Если Е—проектор на М параллельно jfA, то 31(Е)=М и j!r{E) = jfr.
5'49] ОБЛАСТЬ ЗНАЧЕНИЙ И НУЛЬ-ПРОСТРАНСТВО 121 Все эти утверждения легко доказываются; покажем, например, как доказать (V). Из теоремы 2 § 41 мы знаем, что jV' есть множество всех решений уравнения Ех = 0; это совпадаете нашим определением jV’[E). Известно также, что <М есть множество всех решений уравнения Ех = х. Если х принадлежит <y/Z, то х принадлежит также М[Е), поскольку х является образом какого-то вектора (а именно, самого х) относительно Е. Обратно, если вектор х является чьим-то образом относительно Е, скажем, х = Еу (так что х принадлежит ТЯ{Е)), то Ех = Е2у = — Еу—х, так что х принадлежит аЕ. Предупреждение: то, что для проекторов 5?© — ТА— случайность. В общем случае не обязательно даже, чтобы = и jfA = (А) были дизъюнктны. Может случиться, например, что для некоторого вектора х Ах 0, но А2х = 0; для такого вектора, очевидно, Ах принадлежит одновременно и области значений, и нуль- пространству оператора А. Теорема. Пусть А — линейный оператор на век- торном пространстве ТА. Тогда WWr-jfriA1), (1) а если V конечномерно, то (Х(Л))° = ^(Л'). (2) Доказательство. Если у принадлежит (52(Л))°, то для всех х из ТА 0 = [Ах, у] = [х, А'у], так что А'у = 0 и у принадлежит JE (А’). С другой сто- роны, если у принадлежит .A (Л'), то для всех х из ТА 0 = [х, А'у] = [Ах, у], так что у принадлежит (^?(Л))°. Применяя (1) к Л' вместо А, получаем (^(A'))° = JT(A"). (3) Если ТА конечномерно (и, значит, рефлексивно), в равен- стве (3) можно заменить А" на Л, а затем образовать анну- лятор от обеих частей; утверждаемое заключение (2) будет следовать из теоремы 2 §17.
122 ОПЕРАТОРЫ ГЛ. II Упражнения 1. С помощью оператора дифференцирования на т°п показать, что область значений и нуль-пространство линейного оператора не обязательно должны быть дизъюнктны. 2. а) Привести пример линейного оператора на трехмерном пространстве, имеющего двумерную область значений. Ь) Привести пример линейного оператора на трехмерном про- странстве, имеющего двумерное нуль-пространство. 3. Найти квадратную матрицу четвертого порядка, область значений которой натянута на векторы (1, 0, 1, 0) и (0, 1, 0, 1). 4. а) Проекторы Е и F имеют одну и ту же область значений тогда и только тогда, когда EF = F и FE — E. Ь) Проекторы EnF имеют одно и то же нуль-пространство тогда и только тогда, когда EF = E W.FE — F. 5. Если Ег, ..., Еь — проекторы с одной и той же областью значений ис^, ..., —скаляры, удовлетворяющие условию = 1, I то есть проектор, t § 50. Ранг и дефект Мы сосредоточим сейчас внимание на конечномерном случае и извлечем некоторые простые следствия из тео- ремы предыдущего параграфа. Определение. Рангом р (X) линейного опера- тора А па конечномерном векторном пространстве назы- вается размерность его области значений (Л), а дефектом v (X) — размерность его нуль-пространства ^‘(А). Теорема 1. Если А — линейный оператор на п-мерном векторном пространстве, то р(Л) = р(Л') и у(Л) = п — р(Л). Доказательство. Из теоремы предыдущего параграфа и теоремы 1 § 17 вытекает, что у(Л') = п-р(Л). (1) Пусть = {xt, . .., хп} — любой базис, в которому, . . . ,xv принадлежат jjA (И); тогда для любого х — 2 имеем i i i=v-|-l Иначе говоря, Ия: есть линейная комбинация п — v век- торов Axv+l, ...,Ахп; поэтому р(Л)<п —у(Л). При-
J.60) РАНГ И ДЕФЕКТ 123 меняя этот результат к Л' и используя (1), получаем е(Л')<п-г(Л') = е(Л). (2) Так как в (2) А можно заменить на А', то имеем тогда е(4) = е(л")<е(л'). (3) В совокупности (2) и (3) показывают, что е(л) = е(л'), (4) а (1) и (4) — что у(Л') = п-р(Л'). (5) Наконец, замена в (5) А на А' дает г(л)=п-е(л), (6) что и завершает доказательство теоремы. Эти результаты обычно рассматривают с несколько другой точки зрения. Пусть А — линейный оператор на n-мерном векторном пространстве, .%" = {хг, ...,хг} — базис пространства и [Л] = (ai;) — матрица А в коорди- натной системе 3', так что Axj — S anxi- i Если то Ах— поэтому каждый век- j i тор из (Л) является линейной комбинацией векторов Ах} и, значит, любого максимального линейно независимого множества этих векторов. Следовательно, максимальное число линейно независимых векторов Axj есть не что иное, как р(Л). В терминах координат (aip ..., а„,) век- торов Ах^ можно выразить это, сказав, что р (Л) есть максимальное число линейно независимых столбцов мат- рицы [Л]. Так как (§ 45) столбцы матрицы [Л'] (выражен- ной в базисе, сопряженном к J2T) являются строками мат- рицы [Л], то из теоремы 1 следует, что р (Л) есть также мак- симальное число линейно независимых строк матрицы [Л]. Таким образом, «ранг матрицы [Л] по строкам=рангу матрицы [Л] по столбцам—рангу матрицы [Л]». Теорема 2. Если А — линейный оператор на п-мер- ном векторном пространстве ТС и Зв—любое h-мерное под- пространство в Т, то размерность А 33 будет h — у (А).
124 ОПЕРАТОРЫ [ГЛ. II Доказательство. Пусть Л — произвольное подпро- странство, для которого У* — др ft Л, так что, обозначая через к размерность Л, имеем k = 'n — h. Применяя А, получаем АГ = Аде + АЛ. (Эта сумма не обязательно прямая; см. § И.)Так как раз- мерность АТ = &(А) равна n — v(A), далее, размер- ность АЛ, очевидно, д к = п — h и, наконец, размерность суммы < суммы размерностей, мы и приходим к утверж- даемому результату. Теорема 3. Если А и В —линейные операторы на конечномерном векторном пространстве, то е(Л+В)<е(Л) + е(В), (7) р(ЛВ)<тш{р(Л), е(В)} (8) и v (ЛВ) < v (Л) + v (В). (9) Если В обратим, то q (ЛВ) = Q (ВЛ) = р (Л). (10) Доказательство. Так как (АВ)х = А(Вх), то Л?(ЛВ) содержится в J?(A), так что р (АВ) < q(^4), или, другими словами, ранг произведения не больше ранга первого сомножителя. Применим этот вспомогательный результат к В'А'; в соединении с тем, что мы уже узнали, это даст (8). Если В обратим, то q(A) = q(AB-B^)<q(AB) и q(A) = q(B-1-BA)^q(BA)- вместе с (8) это дает (10). Равенство (7) есть непосредствен- ное следствие рассуждения, уже использованного при доказательстве теоремы 2. Доказательство (9) мы предо- ставим в качестве упражнения читателю. (Указание: применить теорему 2, взяв де' = ВТ = (В).) Форму- ды (8) и (9) вместе известны как закон Сильвестра.
§ 51] ОПЕРАТОРЫ РАНГА ОДИН 125 § 51. Операторы ранга один Мы закончим наше рассмотрение ранга оператора описанием матриц линейных операторов ранга < 1. Теорема 1. Если А — линейный оператор на ко- нечномерном векторном пространстве V, такой, что р(Л)<1(т. е. р(Л) = О или р(Л) = 1), то элементы его матрицы [Л] = (а;з) в любой координатной системе имеют вид а;. = р^; обратно, если матрица оператора А в какой-нибудь координатной системе имеет указанный вид, то р(Л)<1. Доказательство. Если q (Л) = 0, то А = 0, и утверждение теоремы тривиально. Если q (Л) = 1, т. е. 31 (Л) одномерно, то в Лг?(Л) существует ненулевой век- тор хй (базис в 31 (Л)) такой, что каждый вектор из 31 (Л) кратен хй. Следовательно, для каждого х, Ах = уйхй, где скалярный коэффициент г/0( = г/0 (х)), конечно, зависит от х. Из линейности Л следует, что у0 есть линейный функ- ционал на Е'- Пусть ЕЕ = {хг, .. ., х, } — базис в ТГ и (ai;) — соответствующая ему матрица оператора Л, так что Лж,- = 2j а^хх. i Если ЕЕ’ == {.Уц . .., уп} — сопряженный базис в У", то (см. § 45, (2)) ац = [АхР Уг\- В данном случае «ij = [Уо (Ж3) Ж0> Уг\ = Уо (*]) К- Уг] = ко- Уг1 [ХР УоЬ другими словами, мы можем взять = [х0, г/J и = = кр УоЬ Обратно, предположим, что в некоторой координатной системе ЕЕ — {хг, ...,х, } матрица (оц,) оператора Л такова, что ai3- = Мы можем найти такой линейный функционал у0, что у7 —[ж;, у0], и определить вектор х0 равенством х0 = X Phxk- Линейный оператор Л, опреде-
126 ОПЕРАТОРЫ |ГЛ. I ляемый формулой Ах = у0(х)х0, есть, очевидно, оператор ранга 1 (конечно, за исключением того случая, когда = О для всех i и/), и его матрица (ai;) в координатной системе ЛТ задается равенствами = [Axjf yt] (где = {г/п .. ., г/п} —базис, сопряженный к ^). Значит, «ij = [Уо (*,) ^0, У А = [^0- У г] К-. Уо\ = PiYj > и так как А и А обладают одинаковой матрицей в одной координатной системе, то А=А. Теорема полностью доказана. Следующая теорема позволяет в некоторых случаях применить теорему 1 для получения результатов, касаю- щихся произвольного линейного оператора. Теорема 2. Линейный оператор А ранга р на конечномерном векторном пространстве ТА может быть записан в виде суммы р операторов ранга один. Доказательство. Поскольку АТА = ^?(Л) имеет размерность р, можно найти р векторов .. ., ж0, образующих в J? (X) базис. Следовательно, для каждого вектора х из ТА имеем <? лж= 2 i=l причем gj, конечно, зависит от х\ положим = ух (х). Легко видеть, что yt является линейным функционалом. С по- мощью найденных yt определим для каждого i = 1, .. ., р линейный оператор равенством (х) = yt (х) xv Тогда о каждый оператор А} имеет ранг один и А = 2^i- (Срав- 1 нить этот результат с примером 2) § 32.) Небольшое усовершенствование изложенного доказа- тельства приводит к следующему результату. Теорема 3. Для любого линейного оператора А на конечномерном векторном пространстве ТА существует такой обратимый линейный оператор Р, что РА является проектором.
i 51J ОПЕРАТОРЫ РАНГА ОДИН 127 Доказательство. Пусть и соответственно область значений и нуль-пространство оператора А и {#!, ..., ®0} — базис в J2. Пусть хо+(, ..., хп такие векторы, что^, ... ,2:^} есть базис в 7'\ Поскольку^ для i = l,..., q принадлежит3?, можно найти векторы yt такие, что Ayt = = xt. Наконец, выберем базис в его можно обозначить {Уо+1, . . Мы утверждаем, что {уг, ...,у„} является базисом в У*. Разумеется, требует доказательства лишь то, что векторы у линейно независимы. Для этого пред- п положим, что 2 а^4 = 0; тогда будем иметь (учитывая, г=1 что для i = Q +1, ..., п векторы yt принадлежат П Q = 2 <ХЛ = О, <=1 г=1 п откуда аг == . . . = ае = 0. Следовательно, 2 aU/i = 0, а ли- i=Q+l. нейная независимость векторов y0_|_t, ..., уп показывает тогда, что и остальные коэффициенты должны обращаться в нуль. Линейный оператор Р, существование которого мы утверждаем, определяется теперь равенствами Рхг = yv i = l, .. ., п. Действительно, если i = i, ...,р, то РАyi = Pxt — yv а если i — q -j-1, ..., п, то РАуг = Р0 = 0. Рассмотрение оператора, сопряженного к Л, в соеди- нении с рефлексивностью 5^*, показывает, что можно найти также обратимый оператор Q, для которого AQ является проектором. В случае, когда А сам обратим, необходимо P — Q = A'1. Упражнения 1. Каков ранг оператора дифференцирования на J°n? Каков его дефект? 2. Найти ранг следующих матриц: /1 1 1\ /0 0 1\ a) I 1 1 1 , с) I 0 1 0 I , \1 11/ \1 0 0/ /1 1 1\ /01 0\ ь) I 1 1 a , d) ( 1 о 1 ). \ 1 о о/ \о 1 о/
128 ОПЕРАТОРЫ [ГЛ. II 3. Пусть А есть умножение слева на Р в пространстве линейных операторов (см. упражнение 5 § 38). Каков будет ранг А, если Р имеет ранг т? 4. Ранг прямой суммы двух линейных операторов (на конечно- мерных векторных пространствах) равен сумме их рангов. 5. а) Если А и/? —линейные операторы на n-мерном векторном пространстве и АВ=0, то q (4) -|-q (В) п. Ь) Для каждого линейного оператора А на n-мерном векторном пространстве существует такой линейный оператор В, что АЁ=А) и Q (4)4 6 (В) = п. 6. Если А, В я. С—линейные операторы на конечномерном векторном пространстве, то е (Ав) +6 (вс) < е (B)+q (Авс\. 7. Доказать, что два линейных оператора (на одном и том же конечномерном векторном пространстве) эквивалентны тогда и только тогда, когда они имеют одинаковый ранг. 8) а) Пусть А и В — линейные операторы (на одном и том же конечномерном векторном пространстве) такие, что42 = 4 и/?2 =В. Верно ли, что А и В подобны тогда и только тогда, когда q (4) = =е(5)? Ь) Пусть А и В — линейные операторы (на одном и том же конеч- номерном векторном пространстве) такие, что 4#=0, В =р() и А2 =В2 = 0. Верно ли, что А и В подобны тогда и только тогда, когда q(4) = q(B)? 9. а) Если А— линейный оператор ранга один, то существует однозначно определенный скаляр а такой, что 42 = а4. Ь) Если то i-А обратим. § 52. Тензорные произведения операторов Установим теперь связь между линейными оператора- ми и теорией тензорных произведений. Пусть 41 и Т/'— конечномерные векторные пространства (над одним и тем же полем), а А и В—два произвольных линейных опе- ратора соответственно на 41 и “7*. Определим линейный оператор С на пространстве Ж всех билинейных форм на 41 С&Т формулой {Cw) {х, у) ~~w {Ах, By). По определению, тензорным произведением С = А®В операторов А и В будет называться оператор, сопряжен- ный к С, так что (Cz) {w) = z {Cw)
52] ТЕНЗОРНЫЕ ПРОИЗВЕДЕНИЯ ОПЕРАТОРОВ 129 для любых z из ® Ги® из У. Применив С к элементу z0 вида z0= х0 ® У о (напомним, что это означает, что z0 (w) = w (х0, уд) для всех w из Ж), получим (Cz0) (щ) = z0 (Cw) = (x0 ® y0) (Cw) = (Cw) (x0, y0) = = w (Ax0, By0) = (Ax0 ® By0) (w). Отсюда заключаем, что Cz0 = Ax0 ® Вуй. (1) Поскольку в 'Т/ ® Т имеется отнюдь не малое количество элементов вида х ® у, во всяком случае, достаточное для образования базиса (см. § 25), это соотношение характе- ризует С. Вот формальные правила оперирования с тензорными произведениями: Л®0 = 0®В = 0, (2) 1®1 = 1, (3) (Лх + Л2)® В = (ЛХ® В) + (Л2® В), (4) Л® (ВХ + В2) = (Л® ВХ) + (Л®В2), (5) аА ® рВ = ар (Л ® В), (6) (Л ®В)"1 = Л~1® В'1, (7) (ЛХЛ2) ® (ВХВ2) = (Лх ® Вх) (Л2 ® В2). (8) Доказательства всех этих соотношений, за исключением, возможно, двух последних, просты. Формула (7), как все формулы, включающие обрат- ные операторы, требует дополнительного пояснения. Она должна означать, что если и Л и В обратимы, то Л ® В также обратим, и имеет место указанное равенство; обратно, если Л ® В обратим, то обратимы также Л и В. Мы будем доказывать (7) и (8) в обратном порядке. Формула (8) следует из характеристического свой- ства (1) тензорных произведений и следующих выкладок: (Л]Л2 ® ВХВ2) (х ® у) = АгА2х ® В^В^у — = (Лх ® Вх) (А2х ® В2у) = (Лх ® Вх) (Л2 ® В2) (х ® у). 9 п. Халмош
13d ОПЕРАТОРЫ [ГЛ. II В качестве непосредственного следствия из (8) получаем А ® В = (Л 0 1) (1 0 В) = (1 0 В) (Л 0 1). (9) Для доказательства формулы (7) предположим, что А и В обратимы, и образуем А 0 В и Л'1 0 В"1. Так как, по (8), произведение этих двух операторов, в любом порядке, равно 1, то Л0В обратим, и справедлива формула (7). Обратно, предположим, что Л 0 В обратим. Учитывая, что тензорные произведения были определены нами только для конечномерных пространств, мы можем призвать на помощь теорему 2 § 36; достаточно дока- зать, что Ах = 0 влечет х = 0, а By = 0 влечет у — 0. Воспользуемся соотношением (1): Ах 0 By = (Л 0 В) (х 0 у). Если один из сомножителей слева равен нулю, то (Л 0 В) (х ® у) = 0, откуда х 0 у = 0, так что или z = 0, или у = 0. Поскольку (в силу (2)) равенство В = 0 невозможно, существует вектор у, для которого By #= 0. Применяя только что использованное соображение к этому у и любому х, для которого Ах = 0, заключаем, что х =0. То же самое рассуждение, если в нем поменять Л и В ролями, доказывает обратимость В. Интересной (и сложной) стороной теории тензорных- произведений операторов является теория кронекеров- ских произведений матриц. Пусть % = {хг, ..., хп} и = {l/i> •••> Ут} — базисы в 7/ и Г, а [Л] = [Л; ] — = (ai;) и [Bj = [B; (У] = фм) — матрицы операторов Л и В. Какова будет матрица оператора Л 0В в ко- ординатной системе {хх 0 ур}? Чтобы ответить на этот вопрос, мы должны напомнить проведенное в § 37 обсуждение вопроса о расположении базиса в линейном порядке. Так как, к сожалению, невоз- можно выписать матрицу, не приняв какого-то порядка следования строк и столбцов, мы сознательно восполь- зуемся этим: расположим п х т векторов х40ур в так называемом лексикографическом порядке, а именно сле- дующим образом: 21® У1> xi ® Уа> • • •. 21® Ут> 22 0 ух, .. ., х20 ут,.,. • • • > хп 0 у у, .. ., хп 0 ут.
§ 52] ТЕНЗОРНЫЕ ПРОИЗВЕДЕНИЯ ОПЕРАТОРОВ 131 Произведем также следующие выкладки: (Л ® В) (Xj ® yq) = Axi ® Byq = (У а^) ® (2 ₽Р9УР) = i Р = S2«»₽₽4 (*г® Ур)- i р Этот способ точно указывает, до каких пор можно обхо- диться без упорядочения базисных элементов; если, на- пример, договориться индексировать элементы матрицы не парой целых чисел, а парой пар, скажем, (i, р) и (j, q), то мы знаем теперь, что элементом (Z, р)-3 строки и (/, д)-го столбца будет <х^Рра. Если воспользоваться лексикографи- ческим упорядочением, матрица оператора А ® В примет вид апрн • а11Р1т • • CCinPn . • а1гф1т а11Рт1 • • • • al«Pml CtnlPn • CtnlPlm . • CtnnPu • . OmiPim anlPml • • anlPmm • • • annPmi • • ClnnPmm В сжатом обозначении, имеющем очевидный смысл, можно записать эту матрицу следующим образом: "ап [В] . . . а1п[В] ' _ а„1 [В] ... аПп [В] Эта матрица известна под названием кронекеровского произведения матриц [Л] и [В], в этом их порядке. Правило ее образования легко описать словами: заменить каждый элемент aij квадратной матрицы гг-го порядка [Л] 9*
132 ОПЕРАТОРЫ [ГЛ. II квадратной матрицей m-го порядка [5]. Если в этом правиле поменять ролями А и В (и, следовательно, также п и т), то получится определение кронекеровского про- изведения матриц [5] и [Л]. Упражнения 1. Как мы знаем, тензорное произведение пространств ,Фп и Фт отождествимо с пространством т полиномов от двух переменных (см. упражнение 2 § 25). Доказать, что если А и В •— операторы дифференцирования соответственно на и dJm, то С = А(&В есть смешанное частное Дифференцирование, т. е. Cz = для каж- дого z из .^п, т. 2. При лексикографическом упорядочении произведения бази- сов матрица оператора А^В оказывается кронекеровским произведением матриц операторов А и В. Существует ли такое упо- рядочение этих базисных векторов, чтобы матрица оператора A0B в так упорядоченной координатной системе была кронекеровским произведением матриц операторов В и А (в этом же порядке)? 3. Каковы бы ни были линейные операторы А и В, е(Л®в)=е(Л)е(В). § 53. Определители Конечно, рассмотрения предыдущего параграфа воз- можно обобщить на полилинейные формы и кратные тензорные произведения. Но вместо углубления в эту часть полилинейной алгебры, мы пойдем в другом направ- лении: займемся непосредственно определителями. Пусть А — линейный оператор и ш — знакоперемен- ная n-линейная форма на n-мерном векторном простран- стве ТА. Функция Aw, определяемая формулой (Aw) (xlt . . ., xn) = w (Axlt ..Axn), есть знакопеременная n-линейная форма на причем А есть линейный оператор на пространстве таких форм. Поскольку (см. § 31) это пространство одномерно, отсюда следует, что А есть умножение на надлежащий скаляр. Другими словами, существует такой скаляр S, что Aw=dw для каждой знакопеременной n-линейной формы w. Таким несколько окольным путем (от А через А к &) мы связали
S 53] ОПРЕДЕЛИТЕЛИ 133 с каждым линейным оператором А на Т однозначно опре- деленный скаляр б; назовем б определителем оператора А и будем писать б = det А. Заметим, что det не есть ни ска- ляр, ни оператор; это — функция, связывающая с каждым линейным оператором некий скаляр. Нашей непосредственной целью является изучение функции det. Начнем с нахождения определителей про- стейших линейных операторов, а именно, умножений на скаляры. Если Ах = ах для каждого х из Т*, то (Aw) (х1г . . ., хп) = w (axlt . .., ax„) = a"w (^.хп) для каждой знакопеременной п-линейной формы w, отсю- да следует, что det А = а”. Отметим, в частности, что det 0 = 0 и det 1 = 1. Далее, нас интересуют мультипликативные свойства функции det. Предположим, что А и В —линейные опе- раторы на 7’, и пусть С = АВ. Если w — знакоперемен- ная п-липейная форма, то (Cw) (хг, ..., хп) = w(ABxr, .... АВх^) = = (Aw) (Bxlt .. ., Вхп) = (В Aw) (a:x, . . ., хп), так что С = В А. Поскольку Cw = (det С) w, а В Aw = (det В) Aw = (det В) (det 4) w, заключаем, что det (АВ) — (det 4) (det В). (Значения функции det —скаляры, и потому перестано- вочны друг с другом.) Линейный оператор А называют вырожденным, если det А =0, и невырожденным в противном случае. Следую- щий наш результат состоит в том, что оператор А обратим тогда и только тогда, когда он невырожден. Действи- тельно, если А обратим, то 1 = det 1 = det (44-1) = (det 4) (det 4-1), и потому det 4 =# 0. С другой стороны, предположим, что
134 ОПЕРАТОРЫ [ГЛ. II detX #= 0. Если {zj, жГ1} —базис в Т и w — ненуле- вая знакопеременная и-линейная форма на то, по теореме 3 § 30, (detX) w (ху, ..., х„) #=0. Отсюда, по тео- реме 2 § 30, следует, что множество {Axlt Ахп} линей- но независимо (а потому есть базис); из него, в свою оче- редь, заключаем, что А обратим. В классической литературе определитель определяется как функция матриц (а не линейных операторов); теперь мы в состоянии установить связь с таким подходом. Мы получим выражение для detX в терминах элементов (а^) матрицы, соответствующей А в некоторой координатной системе {х1У ..., хп}. Пусть w — ненулевая знакоперемен- ная n-линейная форма; как мы знаем, (det A) w (^....хп) = ш(Ах1У . .Ахп). (1) Заменив каждое Ах^ в правой части формулы (1) на 2 i и развернув полученное выражение, пользуясь поли- линейностью, мы получим длинную линейную комбина- цию членов вида w (zp ..., z„), где каждое z есть один из векторов х. (Сравните эту часть рассуждения с доказа- тельством теоремы 3 § 30.) Если в таком члене два вектора z совпадают, то, поскольку w знакопеременна, этот член должен обращаться в нуль. С другой стороны, если все z различны, то w (zr, ..., zn) — aw (ж1, ..., xn) для некото- рой перестановки л, и, более того, каждая перестановка л может встретиться в такой роли. Коэффициент при члене aw (х1У ..., хп) равен произведению аЛ(д).1---аЛ(П),п’ По- скольку w кососимметрична (теорема 1 § 30), то det А = 2 (sgn л) ая(1), i .. . ая(п)> п, (2) л где суммирование распространяется на все перестановки л из afn- (Напомним, что. по теореме 3 § 30, w(xly ...,хп) #= 0, так что деление на w (х1У ..., хп) законно.) Из этого классического равенства (2) можно было бы прямым вычислением получить многие специальные свой- ства определителей. Вот один пример. Если ст и л — пере- становки (из то (поскольку лст —также перестанов- ка) произведения 0^(1),ал(п), п И ала(1). а(1) ••• ала(п), а (п) отличаются только порядком сомножителей. Если для
5 53] ОПРЕДЕЛИТЕЛИ 135 каждого л взять а = л 1 и соответственно изменить в (2) каждое слагаемое, то получим det А = 3 (sgn л) сх 1, Я(1 j ... ап, я(п). Л (Заметим, что sgn л = sgn л-1 и что сумма по всем л та же, что и сумма по всем л'1.) Так как последняя сумма точно такая же, как и сумма в (2), за исключением того, что вместо аЯ(г), { стоит а;, я{,), то, применив (2) к А', получаем det А = det Л'. Вот еще одно полезное свойство определителей. Если оМ- — подпространство, инвариантное относительно А, В — оператор А, рассматриваемый только на в#, и С — фак- тороператор Afa/tl, ТО det А = det В det С. Это мультипликативное соотношение выполняется, в ча- стности, если А есть прямая сумма двух операторов В и С. Доказательство может быть основано как непосредственно на определении определителей, так и на разложении, полученном выше. Если для фиксированного линейного оператора А положить р (X) = det (А — X), то р будет функцией от скаляра X; мы утверждаем, что это в действительности полином от X степени п и коэффициент при Хп равен (—I)11. Для доказательства воспользуемся обозначением, при- нятым в (1). Легко видеть, что щ ((Л — X) а^, ..., (Л — X) х„) есть сумма членов вида ^w^y-^, ..., у(1), где yl = xi ровно для к значений i и yl = Ах: для оставшихся п— к зна- чений г (к — 0, 1, . . ., п). Полином р называют харак- теристическим полиномом, а уравнение р = 0, т. е. det (Л — X) = 0, — характеристическим уравнением опе- ратора Л. Корни Этого уравнения называют характери- стическими корнями оператора Л. Упражнения 1. С помощью определителей получить новое доказательство того факта, что если А и В — линейные операторы па конечномер- ном векторном пространстве и АВ = 1, то А и В обратимы. 2. Если А и В — такие линейные операторы, что АВ = 0, Л=#0, £=#0, то det Л =det£ = O.
136 ОПЕРАТОРЫ [ГЛ. II 3. Пусть (а,у) — невырожденная квадратная матрица га-го порядка и Alt ..., Ап — линейные операторы (на одном и том же векторном пространстве). Доказать, что если линейные операторы aijAj, i = l, п, перестановочны друг с другом, то то же верно з для А1, ..., Ап. 4. Если {а?!, ..., хп} и {ух, ..., уп}—базисы одного и того же векторного пространства и А — линейный оператор такой, что Axi= yi, i = l, п, то с1е1;.4=#О. 5. Пусть {Xj, ..., хп} — базис конечномерного векторного про- странства 7^. Для любых векторов у1( ..., уп из 'V0 обозначим через w (ух, ..., уп) определитель линейного оператора А, определяемого условиями AXj = уj, ] — 1, ..., га. Доказать, что w—знакопеременная га-линейная форма. 6. Если, в соответствии с формулой (2) этого параграфа, за определитель матрицы (а^) (а не линейного оператора) принять 2(sgnn)ajT(1)il ...«я(п)1„, л то для каждого линейного оператора А определители всех матриц [А .Ж ] будут равны между собой. (Здесь %— произвольный базис.) 7. Если (a;j) — квадратная матрица га-го порядка такая, что а^ = 0 для более чем га2—га пар значений i и /, то det (сц?) = 0. 8. Если А и В — линейные операторы соответственно на век- торных пространствах размерностей га и т, то det (Л ® В) = (det А)т-(det В)п. 9. Если А, В, Си D—матрицы, такие, что С и D перестановоч- ны, а D обратима, то (см. упражнение 19 § 38) det Сс р) =det 'еС)' (Указание: умножить справа на .) Что, если D не обра- тима? Что, если С и D не перестановочны? 10. Всегда ли Л и А' имеют один и тот же характеристический полином? И. а) Если А и В подобны, то det4=detB. Ь) Если А и В подобны, то они имеют одинаковый характери- стический полином. с) Если А и В обладают одним и тем же характеристическим полиномом, то det А — det 5. d) Справедливыми утверждения, обратные этим?
§ 54] СОБСТВЕННЫЕ ЗНАЧЕНИЯ 137 12. Найти характеристический полином матрицы (или, лучше, линейного оператора, определяемого этой матрицей) О 1 0 ... О О 0 1 ... О О 0 0 ... 1 . «п-1 ап-2 ап-3 • • • ССо и сделать вывод, что каждый полином есть характеристический полином некоторого линейного оператора. 13. Пусть А иВ — линейные операторы на оТцгом и том же конеч- номерном векторном пространстве. а) Доказать, что если А — проектор, то АВ и ВА имеют один и тот же характеристический полином. (Указание: выбрать базис, в котором матрица оператора А принимает наиболее простой воз- можный вид, и затем оперировать непосредственно с матрицами.) Ь) Доказать, что АВ и В А всегда имеют один и тот же харак- теристический полипом. (Указание: найти такое обратимое Р, чтобы РА было проектором, и применить а) к РА и BP~L.) § 54. Собственные значения Скаляр X называют собственным значением, а нену- левой вектор х — собственным вектором линейного опе- ратора А, если Ах = кх. Почти все комбинации прилага- тельных собственный, характеристический, вековой и т. п. с существительными корень, число и значение были ис- пользованы в литературе для наименования того, что мы называем собственным значением. Важно ясно понимать смысл определения: X есть собственное значение оператора А, если существует ненулевой вектор х, для которого Ах = кх, а ненулевой вектор х есть собственный вектор оператора А, если существует скаляр X, для которого Ах -- кх. Пусть X — собственное значение линейного оператора А и — семейство всех векторов х, являющихся собст- венными векторами оператора А, принадлежащими этому собственному значению, т. е. для которых Ах = кх. Поскольку 0, по нашему определению, не является соб- ственным вектором, М не содержит 0; если, однако, расширить присоединив к нему начало, то all
138 ОПЕРАТОРЫ [ГЛ. П станет подпространством. Кратностью собственного значе- ния X назовем размерность этого подпространства собственное значение назовем простым, если его крат- ность равна 1. Путем очевидного расширения этой терми- нологии можно выразить тот факт, что скаляр X вовсе не является собственным значением оператора А, сказав, что X есть собственное значение нулевой кратности. Мно- жество всех собственных значений оператора А иногда называют спектром этого оператора. Заметим, что спектр оператора А есть не что иное как множество всех скаля- ров X, для которых А — X не обратим. Если размерность рассматриваемого нами простран- ства равна п, то скаляр 0 является собственным значением кратности п линейного оператора 0 и, аналогично, ска- ляр 1 — собственным значением кратности п линейного оператора 1. Поскольку Ах = far тогда и только тогда, когда (А — Х)х = 0, т. е. тогда и только тогда, когда х принадлежит нуль-пространству оператора А — X, за- ключаем, что кратность X как собственного значения опе- ратора А совпадает с дефектом линейного оператора А — X. Отсюда в свою очередь следует (см. теорему 1 § 50), что собственные значения оператора А' вместе с соответ- ствующими им кратностями—точно те же, что и у опе- ратора А. Заметим, что если В—любой обратимый оператор, то 5ЛВ"1 —Х = 5(А — X) В1, так что (А—X) х = 0 тогда и только тогда, когда (ВАВ 1 — X) х — 0. Отсюда следует, что все спектраль- ные понятия (например, спектр и кратности собствен- ных значений) инвариантны относительно замены А на ВАВ 1. .Отметим также, что если Ах — far, то А2х — А (Ах) = А (Хх) = X (Ах) = X (Хх) — Х2х. Более общим образом, каков бы ни был полином р, всегда р (X) х = р (X) х, так что каждый Собственный вектор оператора А, принадлежащий собственному значению X, служит также собственным вектором для р (X), принад- лежащим собственному значению р (X). Следовательно, если оператор А удовлетворяет некоторому уравнению
8 55] КРАТНОСТЬ 139 вида р (Л) = 0, то р (X) = 0 для каждого собственного значения X этого оператора. Поскольку оператор А — X имеет нетривиальное нуль- пространство тогда и только тогда, когда он вырожден, т. е. когда det (А — X) = 0, заключаем, что число X является собственным значением оператора А тогда и только тогда, когда оно является характеристическим корнем этого оператора. На этом факте и основывается важность определителей для линейной алгебры. Понятие собственного значения является полезным геометрическим понятием. Однако геометрия вопроса не дает возможности доказать существование хотя бы одного собственного значения. С помощью определителей мы сводим задачу к алгебраической: оказывается, что собственные значения— это не что иное как корни некоторого алгебраического урав- нения. Трудность доказательства того, что собственные значения всегда существуют, теперь неудивительна: алге- браические уравнения не всегда имеют корни, и в соответ- ствии с этим существуют простые примеры линейных операторов, не имеющих собственных значений. § 55. Кратность Рассмотрения предыдущего параграфа указывают одну из причин, побуждающих нас к изучению комплексных векторных пространств. По так называемой основной теореме алгебры алгебраическое уравнение над полем комплексных чисел всегда имеет по крайней мере один корень; значит, линейный оператор на комплексном векторном пространстве всегда имеет по крайней мере одно собственное значение. Кроме поля комплексных чисел, существуют и другие поля, над которыми каждое алгебраическое уравнение разрешимо; они называются алгебраически замкнутыми полями. Наиболее общий ре- зультат интересующего нас рода заключается в том, что каждый линейный оператор на конечномерном вектор- ном пространстве над алгебраически замкнутым полем имеет по крайней мере одно собственное значение. Во всей остающейся части этой главы (т. е. на протяжении ближайших четырех параграфов) мы будем предполагать, что наше поле скаляров алгебраически замкнуто. Польза,
140 ОПЕРАТОРЫ [ГЛ. и которую можно извлечь из этого предположения, была только что отмечена, а именно, при нем можно утвер- ждать, что собственные значения всегда существуют. Алгебраическая точка зрения на собственные значения подсказывает другое возможное определение кратности. Пусть А — линейный оператор на конечномерном вектор- ном пространстве и X — собственное значение этого опера- тора. Можно было бы счесть желательным рассмотрение кратности X как корня характеристического уравнения оператора А. Это — полезное понятие; мы будем называть его алгебраической кратностью X, в отличие от прежнего геометрического понятия кратности. Как показывает следующий пример, эти два понятия кратности не совпадают. Пусть D — оператор дифферен- цирования на пространстве <3\ всех полиномов степени <тг —1; вектор х из будет собственным вектором оператора D тогда и только тогда, когда — =Xx(i) для некоторого комплексного числа X. Позаимствуем из элементарной теории дифференциальных уравнений тот факт, что каждое решение этого уравнения отличается от еи лишь постоянным множителем. Поскольку при X =# О лишь нулевое кратное функции ем является полиномом (каковым оно должно быть, чтобы принадлежать <^п), мы должны иметь Х = 0 и x(Z) = l. Другими словами, этот специальный оператор имеет только одно собственное значение (которое должно поэтому обладать алгебраиче- ской кратностью п), а именно X = 0; но — и это как раз озадачивает — размерность линейного многообразия ре- шений равна точно единице. Значит, при п > 1 два опре- деления кратности дают различные значения. (В этом рассуждении мы использовали тот простой факт, что алгебраическое уравнение тг-й степени над алгебраически замкнутым полем имеет ровно п корней, если засчиты- вать каждый соответственно его кратности. Отсюда следует, что линейный оператор на тг-мерном векторном простран- стве над таким полем имеет ровно п собственных значений с учетом их алгебраических кратностей.) Совсем нетрудно видеть, что геометрическая кратность собственного значения X никогда не превосходит его алгебраической кратности. Действительно, если А —
§ 55] КРАТНОСТЬ 141 любой линейный оператор, Хо — любое его собственное значение и — подпространство решений уравнения Ах = "кйх, то ясно, что инвариантно относительно А. Пусть Ао — линейный оператор А, рассматриваемый только на а/#; тогда ясно, что det (Ло —X) входит множи- телем в det (Л — ?-). Если размерность оЛ ( = геометриче- ская кратность Хо) равна т, то det (Ло — X) = (Хо — X)"1, и утверждаемый результат следует из определения алгебраи- ческой кратности. Отсюда вытекает также, что если . ., Хр — различные собственные значения оператора А с соответствующими геометрическими кратностями р тг, ..., тр и если 2 mi = п> то mt равно алгебраической г—1 кратности значения для каждого i = 1, . . ., р. С помощью собственных значений и их алгебраических кратностей можно охарактеризовать две интересные функ- ции от линейных операторов; одна из них — определи- тель, а другая — нечто новое. (Предупреждение: эти характеризации справедливы только при принятом нами здесь предположении, что поле скаляров алгебраически замкнуто.) Пусть А — произвольный линейный оператор на тг-мер- ном векторном пространстве, a — его различные собственные значения. Обозначим через т7- алгебраи- ческую кратность kj, у = 1, .. ., р, так что т1А- ... -}-тр = п. Для любого алгебраического уравнения а0 + ajX + . .. + anXn = О произведение корней равно , а их сумма равна ctn . Так как старшим коэффициентом ( = а„) характеристического полинома det (Л — X) служит (— 1)п, а свободным членом ( = а0) служит det (Л — 0) — det Л, то имеем р det Л = IJ Х7’ . 7=1 Эта характеризация определителя оператора мотивирует определение р ЬгЛ = 2 >=1
142 ОПЕРАТОРЫ [ГЛ. II так определенная функция называется следом оператора А. В дальнейшем мы не будем иметь случая использовать понятие следа; вывод его основных свойств предоставим интересующемуся читателю. Упражнения 1. Найти все (комплексные) собственные значения и собствен- ные векторы следующих матриц: - GO » G °) '> G 0 /1 1 1\ d) 1111. \1 1 1/ /1 1 1\ е) 0 11. \0 0 1/ 2. Пусть л — перестановка целых чисел {1, ..., п}; для каж- дого вектора x = (£i, ..., £п) из положим Найти спектр оператора А. 3. Доказать, что каждое собственное значение проектора равно 0 или 1 и что каждое собственное значение инволюции равно +1 или — 1. (Этот результат не зависит от конечномерности векторного пространства.) 4. Пусть А — линейный оператор и р — полином. Как мы зна- ем, если X есть собственное значение оператора А, то р (X) есть соб- ственное значение оператора р(Л). Что можно сказать об обратном утверждении? 5. Доказать, что оператор дифференцирования D па простран- стве , 'п (п > 1) неприводим (т. е. не приводится никакой нетривиаль- ной парой взаимно дополнительных подпространств М и Ji' ). 6. Если А — линейный оператор на конечномерном векторном пространстве и X — собственное значение этого оператора, то алге- браическая кратность X равна его алгебраической кратности как собственного значения оператора ВАВ~1. (Здесь В — произволь- ный обратимый линейный оператор.) 7. Всегда ли АВ и ВА имеют одинаковый спектр? 8. Пусть А и В — линейные операторы на конечномерном век- торном пространстве. a) tr (Л ! В) = tr X-|-tr В. b) tr(X® В) = (1гЛ) (tr В). с) Спектр А С В есть объединение спектров А и В. d) Спектр A В состоит из всех скаляров вида a(J, где а и 3 принадлежат соответственно спектрам А и В.
§ 56J ТРЕУГОЛЬНЫЙ ВИД 143 § 56. Треугольный вид Теперь совсем нетрудно доказать наиболее легкую из так называемых теорем о приведении к каноническому виду. Наше предположение относительно поля скаляров (а именно, что оно алгебраически замкнуто) все еще в силе. Теорема 1. Для любого линейного оператора А на n-мерном векторном пространстве У ‘ существуют п + 1 подпространств , . . ., е.<пЛ, <Лп со следующими свойствами'. (I) каждое Л j (/ = 0, 1, . .., п— 1, п) инвариантно относительно А, (II) размерность М. равна j, (III) (0 = ) а#0 cz с .. . CZ з#пЛ CZ (= Г). Доказательство. При п = 0 и п = 1 резуль- тат тривиален; применим индукцию, приняв, что утвер- ждение верно для и—1. Рассмотрим сопряженный опера- тор А' на Д"; поскольку у него есть по крайней мере один собственный вектор, скажем, х , существует одномерное под- пространство &/Z, инвариантное относительно А', а именно множество всех кратных этого вектора х . Обозначим через аннулятор (в Т"=Т} подпространства М, оЛ1п^ = Л°\ тогда есть (п — 1)-мерное подпространство простран- ства Т‘, инвариантное относительно А. Следовательно, можно рассматривать А и как линейный оператор только на и найти &#0, , в^п_2, а//пЛ, удовлетворяю- щие условиям (I), (II) и (III). Положив еще a/Zn = ^, получим все, что нам было нужно. Эта теорема интересна главным образом своей матрич- ной интерпретацией. Так как одномерно, в нем можно найти вектор #= 0. Так как то xt принад- лежит также е//1г, и поскольку <Л2 двумерно, можно найти в нем вектор х2, вместе с х± порождающий <Л2. Продолжим этот процесс по индукции, выбирая векторы х. для / = 1, . .., п так, чтобы хи .. Xj принадлежали подпро- странству и порождали его. В итоге мы получим базис 3? = {хг, , z„} пространства Д'; вычислим матрицу оператора А в этой координатной системе. Так как х- принадлежит Л а инвариантно относительно А, то AXj должно быть линейной комбинацией векторов
144 ОПЕРАТОРЫ [ГЛ. II Хп Значит, в выражении Axj = 2 anxi коэффициент при xt должен быть равен нулю для всех i > j; другими словами, i > / влечет ai? = 0. Следователь- но, матрица оператора А имеет треугольный вид «11 «12 «13 • • «1П О а22 а23 . . . а2п М] = ООО ООО • • «п-1, п • • • «пп Из этого представления ясно, что det (И — ан) — 0 для г = 1, ...,п, так что ai; являются собственными значе- ниями оператора А, и каждое из них встречается на глав- ной диагонали матрицы [Л] столько раз, какова его крат- ность. Мы подытожим сказанное следующим образом. Т е о р е м а 2. Если А — линейный оператор на п-мерном векторном пространстве Е', то в V существует базис SIS такой. что матрица [Л; .2^’] треугольна; или, что равносильно этому, для любой матрицы [Л ] существует невырожденная матрица [2?] такая, что [2?]'1 [Л] [.£?] треугольна. Треугольный вид полезен при доказательстве многих результатов относительно линейных операторов. Напри- мер, из него следует, что для любого полинома р собствен- ные значения оператора р (Л), с учетом их алгебраической кратности, совпадают с числами р(Х), где X пробегает собственные значения оператора Л. Значительная часть теории линейных операторов по- священа усовершенствованию только что полученного результата о приведении к треугольному виду (триангу- ляризации). Наилучший возможный вид, который может иметь матрица,— не треугольный, а диагональный (т. е. = 0, если i =# /); линейный оператор, имеющий в надле- жащей координатной системе диагональную матрицу, мы будем называть диагонализируемым.
9 56] треугольный вид 145 Упражнения 1. Рассматривая следующие матрицы как линейные операторы на g2, в каждом случае найти в g2 базис, в котором матрица этого оператора треугольна. а) < 1 П /° 1 °\ '<0 1/ е) 00 1 . \1 0 о/ ' <1 0> /0 1 1\ . <1 о\ 0 ро1. с) (^1 1) • \1 о о/ * G О'- 2. Два перестановочных линейных оператора на конечномер- ном векторном пространстве ?/э над алгебраически замкнутым полем могут быть одновременно триангуляризированы. Другими словами, если АВ=ВА, то существует такой базис что и [4; и [В; ЛГ]—треугольные. (Указание: чтобы следовать ходу дока- зательства, проведенного в § 56, желательно найти подпростран- ство <М пространства сУа, инвариантное относительно и А и В. Имея это в виду, рассмотреть произвольное собственное значение X оператора А и испробовать в роли <М множество всех решений уравнения Ах=‘кх.) 3. Сформулировать и доказать аналоги результатов § 56 для треугольных матриц, в которых нули стоят над главной диагональю (а не под ней). 4. Пусть А — линейный оператор на n-мерном векторном про- странстве. Для каждой знакопеременной n-линейной формы w обозначим через Aw функцию, определенную формулой (Xw)(zi...xn)=w(Axlt х2, ...,хп)-\- -|~И (alt Ах2.*п)+- ••+^(11, Х2, ..., Ахп). Так как Aw—знакопеременная га-липейная форма, причем в дей- ствительности А есть линейный оператор на (одномерном) простран- стве таких форм, то Aw = r(A)-w, где т(Л)— скаляр. а) т(0)=0. Ь) т(1)=п. с) т(Л+В) = т(И)+т(В). d) т (аЛ)=ат (Л). е) Если поле скаляров имеет характеристику 0 и А — проек- тор, то т(Л) = р(Л). f) Если (flij) — матрица оператора А в некоторой координатной системе, то т(Л) = 2ан- Т 10 п. Халмош
14б ОПЕРАТОРЫ (ГЛ. п g) т(4') = т(4). h) х(АВ)~х(ВА). i) Для каких перестановок л целых чисел 1, .к справед- ливо, что т (А ... Ah) = x (Arid) • • • ^л(й)) для всех упорядочен- ных наборов (Xi, Ah) из к линейных операторов? j) Если поле скаляров алгебраически замкнуто, то т (Л) = И А. (По этой причине под следом обычно понимают т; наиболее распро- страненным способом является использование f) в качестве опре- деления.) 5. а) Предположим, что поле скаляров имеет характеристику 0. Доказать, что если Et, ...,Еь и Ег-\-.. .-^-Е^ — проекторы, то EiEj = Q всякий раз как i 4= /. (Указание: из того, что tr (£’1+ ... -f-£/i) = tr (Ei)4- ... -j-tr(£fe), заключить, что область значений проектора Ег-\-.. ,-\-Еь равна прямой сумме областей значений проекторов Elt ..., Ek.) Ь) Если Alt ..., Ak — линейные операторы на n-мерном вектор- ном пространстве, Л1-|-• • •+^h = 1 и g (Лх)-]-••• + (> (.4^) <4 п, то каждый оператор 4; является проектором и = 0 всякий раз как !=#/• (Провести индукцию, начиная с к = 2; использовать рас- смотрение прямой суммы, как в а).) 6. а) Если А — линейный оператор на конечномерном вектор- ном пространстве над полем характеристики 0 и tr Л = 0, то суще- ствует такой базис что в матрице [Л; ^,] = (aij) все ajj = O. (Указание: используя то, что А не есть скаляр, доказать сначала существование такого вектора х, что х п Ах линейно независимы. Отсюда будет следовать, что ах1 можно сделать равным нулю; далее по индукции.) Ь) Показать, что если характеристика поля скаляров не равна нулю, то заключение а) неверно. (Указание: если характеристика равна 2, вычислить ВС — СВ, где В = И C=G о) § 57. Нильпотентность В качестве вспомогательного средства для получения теоремы представления более содержательной, чем тео- рема о приведении к треугольному виду, мы введем и изу- чим, хотя и весьма специальный, но полезный класс опера- торов. Линейный оператор А называют нильпотентным, если существует строго положительное целое q, для кото- рого й9 = 0; наименьшее такое целое q называется индек- сом нильпотентности. Теорема 1. Если А — нильпотентный линейный оператор индекса q на конечномерном векторном простран- стве Т' и х0 — вектор, для которого А'11х0 =4 0, то век- торы х0, Ах0, .... Л''-1;г0 линейно независимы, Подпро-
НИЛЬПОТЕНТНОСТЬ 147 § 57] странство ЗС, натянутое на эти векторы, обладает дополнительным подпространством ей, таким, что пара (, ел,) приводит А. Доказательство. Для доказательства утвер- ждаемой линейной независимости предположим, что q—1 2 а/Г;г0 = 0, и пусть j — наименьший индекс, для кото- г=0 рого aj 0. (Мы не исключаем возможности / = 0.) Деля на — а; и изменяя очевидным образом обозначения, получаем соотношение вида q-l 9-1 = 2 МЧ=^+1( S 0^-%) = ^. i=j+l i=H-1 Из определения <q следует, что = А^А ’х0 = Aq~J~lA,+1y = А9у = 0; поскольку это противоречит выбору х0, мы .должны иметь а?=0 для каждого у. Очевидно, (Sft) инвариантно относительно А; построе- ние ей мы проведем индукцией по индексу нильпотентно- сти q. При </ = 1 результат тривиален; предположим теперь, что утверждение теоремы верно для <? — 1. Область значений оператора А есть подпространство, инвариант- ное относительно Л; сужение А на ей является ниль- потентным оператором индекса q — 1. Положим ей0 = = Sb и У о — Т0ГДа &@о порождается линейно не- зависимыми векторами у0, Ау0. .. ., Aq' 2у0. Поэтому можно воспользоваться предположением индукции и заключить, что 5? есть прямая сумма и некоторого другого инвариантного подпространства ей'о. Обозначим через множество всех векторов х, для которых Ах принадлежит ей0\ очевидно, что ейг — подпро- странство. Возникает большой соблазн положить ей = ейг и попытаться доказать, что ей обладает требуемыми свой- ствами. К сожалению, это не всегда верно: и не обязательно дизъюнктны. (Можно показать, что пересе- чение <~й и ейг содержится в нуль-пространстве операто- ра А,- но мы не будем пользоваться этим фактом.) То, что, несмотря на это, ейх окажется полезным, основывается на том обстоятельстве, что + = Для доказательства 10*
148 ОПЕРАТОРЫ [ГЛ. 11 этого заметим, что Ах принадлежит для каждого х и, следовательно, Ax — y^\-z с у из и z из Ло. Так как всякий элемент подпространства S3a является линей- ной комбинацией векторов Ах0, .. ., Aq~1x0, то имеем д-1 д-2 У = 2 МЧ = А ( 2 а«+1ЛЧ) = АУ1> i=l i=0 где yt—элемент из S3- Следовательно, Ax = Ay1-j-z'или A(x — y1) = z, так что А(х~ уг) принадлежит е/£0. Это означает, что х — у± принадлежит Лг, так что х есть сумма элемента (а именно ух) из S3 и элемента (а именно х — г© из л\. Что же касается дизъюнктности, то можно во всяком случае утверждать, что е%?Грг-'о = 0. Для доказательства предположим, что х принадлежит St П ^о’ и заметим сначала, что Ах принадлежит S30 (так как х принадлежит S3)- Поскольку ^'0 также инвариантно относительно А, вектор Ах принадлежит е^'о вместе с х, и потому Ах = 0. Но отсюда вытекает, что х принадлежит S3Q- (Поскольку х 9-1 принадлежит имеем z= 2 ai^l;ro> а потому 0 = Ах = 1=0 g-l = 2 ai-i^l;ro’ но Т0ГДа из линейной независимости векто- 1=1 ров А’х0 следует, что а0 = ... = aq_2 = 0, так что х = Од^А^ ^0.) Мы доказали, что если х принадлежит S3 П Ло, то он принадлежит также ^?0 (”] е/£’о, а значит х — 0. Теперь положение таково: S3 и Лх вместе поро- ждают а е© содержит два дизъюнктных подпростран- ства у© и S3 Г) ^’1- Пусть у©—произвольное дополнение К (е^? П '^1) в 1’ Тф 3^0 © © {.S3 П ®^1) = Положим Л — Л'а © е^0; мы утверждаем, что это Л обла- дает требуемыми свойствами. Во-первых, yZ' содержится в у© и Л дизъюнктно с S3 П Л\‘, значит, = Во-вторых, S3 ©Л} содержит и S3 и л\, так что 33©л' = Т'- Наконец, Л инвариантно относительно А, поскольку из того, что следует, что АЛ GZ CZs^oCZ^- Доказательство теоремы закончено.
f 57) НИЛ ЬП ОТЕНТН ость 149 Позже нам понадобится следующее замечание. Если х0 — любой другой вектор, для которого =/= 0, далее — подпространство, натянутое на векторы х0, Ах0,... ...,Aq~*Xg, и, наконец, а/£‘ — любое подпространство, вместе с приводящее А, то поведение А на of и точно такое, как, соответственно, на и ert. (Другими словами, несмотря на кажущуюся неединственность в формулировке теоремы 1, на самом деле всё однозначно определено с точ- ностью до изоморфизма.) Справедливость этого замечания следует из того, что индекс нильпотентности оператора А на <^‘ (скажем, г) таков же, как индекс нильпотентности А на ort (скажем, г). Этот факт в свою очередь доказывается следующим образом. Так как /VTA — АгArt @ Arart и также АТТ' = rt’AjC OfA'art (справедливость этих результатов сле- дует из инвариантности всех входящих в них подпро- странств), то размерности правых частей этих соотношений равный, значит, (7 — г)+0=(^— г)-Ч-(г-—г). С помощью теоремы 1 можно получить полную геомет- рическую характеристику нильпотентных операторов. Теорема 2. Если А — нильпотентный линейный оператор индекса q на конечномерном векторном простран- стве V, то существуют положительные целые числа г, qr, .... qr и векторы xt,..., хг такие, что (I) qtrt '> qr, (II) векторы xlt Ах1, ..., AQ1 ix1, х2, Ах2, . . ., A<!2~ix2, хг, Ахг, ..., АЧг ixr образуют базис пространства ТА и (III) А91х1=А9гх2= е=... =Л?га:г=0. Целые числа г, qr, . . ., qr образуют пол- ную систему инвариантов оператора А относительно изоморфизмов пространства ТА. Другими словами, если В — какой-нибудь нильпотентный линейный оператор на конечномерном векторном пространстве ТЕ, то для суще- ствования изоморфизма Т между ТА и ТА, такого, что ТАТ~1=В, необходимо и достаточно, чтобы целые числа
150 ОПЕРАТОРЫ [ГЛ. II г, qlt qr, соответствующие оператору В, были теми же, что и целые числа, соответствующие оператору А. Доказательство. Положим qy=q, и примем за х± любой вектор, для которого А #= 0. Подпростран- ство, натянутое на xY, Ахг, ..., инвариантно отно- сительно А, и, по теореме 1, обладает инвариантным до- полнением, размерность которого, естественно, строго меньше размерности пространства На этом дополнитель- ном подпространстве А нильпотентен, с индексом, равным, скажем, д2; применим к этому подпространству тот же способ приведения (начиная с вектора х2, для которого A42~ix2 #= 0). Продолжая так по индукции, мы, наконец, исчерпаем пространство. Это доказывает часть теоремы, содержащую утверждение существования; остающаяся часть следует из единственности (с точностью до изомор- физма) разложения, установленного теоремой 1. В базисе {Агх3}, описанном в теореме 2, матрица опе- ратора А принимает особенно простой вид. Все элементы, не лежащие непосредственно под главной диагональю, рав- ны нулю (т. е. ai3=£0 влечет j=i—1), а диагональ, лежащая непосредственно под главной, начинается (если смотреть сверху) с цепочки единиц, заканчивающейся единственным нулем, затем идет новая цепочка единиц, заканчивающаяся нулем, и так до конца, причем длины этих цепочек моно- тонно убывают (или, во всяком случае, не возрастают). Заметим, что в этом параграфе наше постоянное пред- положение об алгебраической замкнутости поля скаляров не использовалось. Упражнения 1. Существует ли на двумерном пространстве нильпотентный оператор индекса. 3? 2. а) Доказать, что нильпотентный линейный оператор на конечномерном векторном пространстве имеет нулевой след. Ь) Доказать, что если А и В — линейные операторы (на одном и том же конечномерном векторном пространстве) и С = АВ — В А, то оператор 1 — С не нильпотентен. 3. Доказать, что если А — нильпотентный линейный оператор индекса д на конечномерном векторном пространстве, то v (Afl+1)4-v (А'1'1) < 2v (Ak) для Л=1...... — 1.
S 58] ЖОРДАНОВА ФОРМА 151 4. Пусть А — линейный оператор (на конечномерном вектор- ном пространстве над алгебраически замкнутым полем). Доказать существование линейных операторов Ви С таких, что А = В+ С, где В диагонализируем, С нильпотентен и ВС = СВ\ операторы В и С однозначно определяются этими условиями. § 58. Жорданова форма Здравая геометрическая интуиция побуждает боль- шинство из нас предполагать, что для линейного операто- ра быть обратимым и быть, в некотором смысле, нулем — совершенно противоположные понятия. Наше разочаро- вание при обнаружении того, что область значений и нуль- пространство не обязательно дизъюнктны, связано с этим предположением. Положение может быть выправлено ослаб- лением смысла, в котором понимается выражение «быть нулем»; для большинства практических случаев линейный оператор, некоторая степень которого равна нулю (т. е. нильпотентный оператор) является настолько нулеобраз- ным, насколько можно этого от него ожйдать. И хотя нельзя утверждать, что линейный оператор либо обра- тим, либо есть «нуль» даже в этом расширенном смысле, мы можем сказать, что любой оператор составлен из опе- раторов этих двух крайних типов. Теорема 1. Каждый линейный оператор А на конечномерном векторном пространстве ТА является прямой суммой нильпотентного и обратимого опера- торов. Доказательство. Рассмотрим нуль-простран- ство /с-й степени А; это — некоторое подпространство Очевидно, ^CZbfsCZ... Мы утверждаем сначала, что если где-нибудь то для всех положительных целых j. Действительно, если Ah*1x=0, то Лк+Ы'-1а:=0, откуда (поскольку следует, что AhAi'1x=0, т. е. A/i+w;r=0. Другими словами, содержится в (и потому равняется) справедливость нашего утверждения устанавливается теперь индукцией по /. Поскольку У конечномерно, подпространства не могут неограниченно возрастать; пусть q — наименьшее положительное целое число,для которого jKq=A^qa- Ясно, что инвариантно относительно А (на самом деле
152 ОПЕРАТОРЫ [ГЛ. II каждое jf/\ таково). Обозначим через Як=Я(Ак) об- ласть значений оператора Ak (так что снова ясно, что инвариантно относительно Л); мы докажем, что ТАи что А на q нильпотентен, а на обратим. Если х — общий вектор подпространств и $lq, то Aqx=0 и x=Aqy для некоторого у. Отсюда Аму =0 и значит, по определению q, x=Aqy=0. Тем самым мы показали, что область значений и нуль-прострапство оператора Aq дизъюнктны; из размерностных соображений (см. теорему 1 § 50) следует, что они порождают ТА, так что Т' есть их прямая сумма. Из определений q и j[r‘q следует, что А на jfAq нильпотентен индекса q. Наконец, если х принадлежит (так что x—Aqy для некоторого у) и Ах=0, то Aq*1y=0, откуда x=Aqy=0; это показывает, что А на Яч обратим. Теорема полностью доказана. Разложение А на нильпотентную и обратимую части однозначно. Действительно, предположим, что и Л на нильпотентен, а на обратим. Из того, что <^?С2^Г(Лk) для некоторого к, следует, что а из того, что (Лк) для всех к, следует, что но вместе эти факты могут иметь место, лишь если —jfAq и А теперь мы можем воспользоваться нашими резуль- татами о нильпотентных операторах для изучения струк- туры произвольных линейных операторов. Метод получе- ния нильпотентного оператора из произвольного может показаться похожим на фокус, но это полезный фокус, который часто применяется. Важно, чтобы было обеспе- чено существование собственных значений; по этой при- чине мы продолжаем предполагать, что поле скаляров алгебраически замкнуто (см. § 55). Теорема 2. Если А — линейный оператор на ко- нечномерном векторном пространстве ТА и Х1( ..., — его различные собственные значения с алгебраическими кратностями соответственно т1, .... тр, то ТА есть прямая сумма р подпространств ..., а/'р раз- мерностей соответственно тх, ..., тр, где каждое инвариантно относительно А и А — kj нильпотентен на а/fl,.
S 68] ЖОРДАНОВА ФОРМА 153 Доказательство. Возьмем любое фиксирован- ное / = 1, ..., р и рассмотрим линейный оператор А^=А — К можно применить разложение теоремы 1 и получить подпространства и jfAj такие, что Л?- нильпотентён на e/H j и обратим на JfAj. Поскольку инвариантно отно- сительно Aj, оно инвариантно также относительно Aj -j- kj=A. Следовательно, определитель оператора Л —Xj для каждого есть произведение соответствующих опре- делителей для тех двух линейных операторов, в которые превращается А, если рассматривать его отдельно на и jfAj. Поскольку единственным собственным значением А на является и оно не является собственным значе- нием А па jfAj (т. е. А — X, обратим на jfAj), заключаем, что размерность Mj равна точно т- и каждое из подпро- странств a/Hj дизъюнктно с линейной оболочкой всех дру- гих. Из размерностных соображений следует тогда, что = что и завершает доказательство тео- ремы. Перейдем к описанию основных результатов этого и предыдущего параграфов на языке матриц. Пусть А — линейный оператор на конечномерном векторном пространстве У; при надлежащем выборе базиса в ТА матрица оператора А принимает следующий вид. Все элементы, не стоящие на главной диагонали или непосред- ственно под ней, равны нулю. На главной диагонали нахо- дятся различные собственные значения оператора А, каждое столько раз, какова его алгебраическая кратность. Ниже каждого отдельного собственного значения стоят только единицы и нули и именно следующим образом: это цепочки из единиц, заканчивающиеся единственным нулем, причем длины цепочек убывают, если читать сверху вниз. Эта матрица есть жорданова форма или классический канони- ческий вид оператора А; при этом!? = ТАТ~1 тогда и только тогда, когда А и В имеют одинаковую жорданову форму, с точностью до порядка следования собственных значе- ний. (Так, в частности, линейный оператор диагонализи- руем тогда и только тогда, когда его классический кано- нический вид уже диагоналей, т. е. когда каждая цепочка из единиц имеет пулевую длину.) Введем некоторые обозначения. Пусть А имеет р раз- личных собственных значений .... Хр, как прежде,
154 ОПЕРАТОРЫ [ГЛ. II с алгебраическими кратностями т±, ..., тр; пусть число цепочек из единиц под А, есть г3, а длины этих цепочек будут -1, Qi2~ 1, .... 9jr. — 1. Полином e3i, опре- деляемый равенством e;i (к) = (к — kj)qji, называется элементарным делителем кратности qji оператора А принадлежащим собственному значению kj. Элементар- ный делитель называется простым, если его кратность равна 1 (так что соответствующая цепочка имеет нулевую длину); мы видим, что линейный оператор диагонализируем тогда и только тогда, когда все его элементарные делители простые. Для иллюстрации силы теоремы 2 приведем одно ее применение. Тот факт, что оператор А —kj на а#3- ниль- потентен индекса д31, можно выразить, сказав, что А на aflj аннулируется полиномом е31. Отсюда следует, что А на 7* аннулируется произведением этих полиномов (т. е. произведением элементарных делителей высших кратностей); это произведение называют минимальным полиномом оператора А. Совсем легко видеть (поскольку индекс нильпотентности А —kj на е#3 равен точно д„), что этот полином однозначно определен (с точностью до числового множителя) как полином наименьшей сте- пени, аннулирующий А. Поскольку характеристический полином оператора А есть произведение всех элементарных делителей и, значит, кратен минимальному полиному, мы получили уравнение Гамильтона — Кели'. каждый линей- ный оператор аннулируется своим характеристическим полиномом. Упражнения (1 0 1\ 0 0 0 1. О 0 —1/ 2. Каково максимальное число попарно не подобных линейных операторов на трехмерном векторном пространстве, каждый из которых ' имеет характеристический полином (к — I)3? 3. Каждый ли обратимый линейный оператор обладает квад- ратным корнем? (Под утверждением, что А есть квадратный корень из В, конечно, понимается, что А2=В.)
§ 58] ЖОРДАНОВА ФОРМА 155 4. а) Доказать, что если со есть кубичный корень из 1 (со =£1), то матрицы /0 1 0\ /1 0 0\ 0 0 1 1 и 1 0 со 0 j \1 0 0/ \0 0 со2/ подобны. Ь) Найти и доказать обобщение а) на матрицы высших порядков. /0 1 а\ /0 5. а) Доказать, что матрицы ( 0 0 1 1 и ( 0 \о 0 0/ \о 1 0\ О 1 I подобны. О О/ Ь) Найти и доказать обобщение а) на матрицы высших порядков. 6. а) Показать, что матрицы ,1 1 1\ /3 0 0\ 11 1 1 | и I 0 0 0 j \1 1 1/ \0 0 0/ подобны (скажем, над полем комплексных чисел)-. Ь) Найти и доказать обобщение а) на матрицы высших по- рядков. 7. Если две вещественные матрицы подобны над g, то они подобны над ,9?. 8. Доказать, что каждая матрица подобна своей транспониро- ванной. 9. Если А а В— квадратные матрицы п-го порядка такие, что квадратные матрицы 2га-го порядка л) И 5 J подоб- ны, то А и В подобны. 10. Какие из нижеследующих матриц диагонализируемы (над полем комплексных чисел)? (0 0 1\ /0 0 1\ 10 0), d) (ООО , 010/ \1 О о/ /О О 1\ /10 0\ Ь) ( 0 0 0 ], е) (ООО). \0 00/ \0 0 1/ (0 0 1\ 0 0 0 1, —1 о о/ А над полем вещественных чисел? 38
156 ОПЕРАТОРЫ [ГЛ. II 11. Показать, что матрица /0100 0 0 10 0 0 0 1 \1 0 0 0 диагонализируема над полем комплексных чисел, но не диагонали- зируема над полем вещественных чисел. 12. Пусть л —перестановка целых чисел {1, ..., п}; для каж- дого вектора х = {£ь ..., |п}из положим Ах = (|я{1), .... £Я(П)). Доказать, что оператор А диагонализируем, и найти базис, в кото- ром матрица этого оператора диагональна. 13. Пусть А—линейный оператор и М—подпространство, инвариантное относительно А. Доказать, что если А диагонализи- руем, то то же верно и для его сужения на <М. 14. Каким условиям должны удовлетворять комплексные числа «J, ..., ап, чтобы матрица (О ... О ал О ... а2 О I ап ... О 0 / была диагонализируема (над полем комплексных чисел)? 15. Верны или нет следующие утверждения? а) Вещественная квадратная матрица второго порядка с отри- цательным определителем подобна диагональной матрице. Ь) Линейный оператор А па комплексном векторном пространстве, удовлетворяющий условию Ah = l для некоторого положительного целого к, диагонализируем. с) Нильпотентный линейный оператор на конечномерном вектор- ном пространстве диагонализируем. 16. Если А — линейный оператор на конечномерном вектор- ном пространстве над алгебраически замкнутым полем и алгебраи- ческая кратность каждого собственного значения оператора А равна 1, то Л диагонализируем. 17. Если минимальный полином линейного оператора А на re-мерном векторном пространстве имеет степень п, то А диагона- лизируем. 18. Найти минимальные полиномы всех проекторов и инво- люций. 19. Каков минимальный полином матрицы 0 0 ... 0\ О о ... о \ О О Хз ... 0 1? 0 0 0... лп/
i 6») Жорданова форма 15? 20. а) Каков минимальный полином оператора дифференци- рования на ./Jn? Ь) Каков минимальный полином оператора А на ZPn, опреде- ленного равенством (Лх) (Z) = z( t + 1)? 21. Если А — линейный оператор с минимальным полиномом р, то всякий полином q, для которого q{A)=O, делится на р. 22. а) Если А и В — линейные операторы, р — такой полином, что р(АВ)=0, и q(l) = tp(t), то q(BA) = 0. b) Что можно вывести из а) относительно связи между мини- мальными полиномами произведений А В и В А? 23. Линейный оператор обратим тогда и только тогда, когда свободный член его минимального полинома отличен от нуля.
ГЛАВА III ОРТОГОНАЛЬНОСТЬ § 59. Скалярные произведения Обратимся вновь к исходному пункту наших рассмот- рений. В начале главы I мы указали, что хотим обобщить некоторые элементарные свойства некоторых элементар- ных пространств, как Л2. Во всем предшествующем мы это и делали, но притом совсем исключили из рассмотрения один аспект 312. Изучив качественное понятие линей- ности, мы совершенно игнорировали обычные количест- венные понятия угла и длины. В настоящей главе этот пробел будет восполнен; мы наложим на изучаемые векторные пространства некоторые числовые функции, соответствующие обычным понятиям угла и длины, и ис- следуем полученную так новую структуру (векторное пространство плюс данная числовая функция). За выиг- рываемое таким путем углубление в геометрию простран- ства придется пожертвовать некоторой степенью общности; во всем последующем тексте книги мы должны будем предполагать, что основным полем скаляров служит либо поле вещественных чисел, либо поле ® комплексных чисел. Для получения ключа к дальнейшему рассмотрим сначала J22. Пусть х — (£lt |2) и у = (т^, ц2) — любые две точки из J?2; расстояние между х и у, или длина отрезка, соединяющего х и у, выражается обычной формулой (Bi — Л1)2 (Вг — Лг)2- Для расстояния от х до начала О = (0, 0) удобно ввести обозначение 1И1 = ;
§ 59] СКАЛЯРНЫЕ ПРОИЗВЕДЕНИЯ 159 с помощью этого обозначения расстояние между х и у запишется в виде Ца: — у ||. Сказанного про длины и расстояния пока достаточно; а как насчет углов? Оказывается, в общем случае вместо какой-нибудь обычной меры углов гораздо удобнее рас- сматривать их косинусы. (Грубо говоря, причина этого заключается в том, что угол, при обычном изображении с помощью единичной окружности,— это длина некото- рой дуги окружности, тогда как косинус угла — это длина прямолинейного отрезка; последнюю гораздо легче связать с нашим предшествующим изучением линейных функций.) Пусть теперь а есть угол между отрезком, соединяющим 0 с х, и положительной осью а р — угол между отрезком, соединяющим 0 с у, и той же осью; углом между векторами хи у будет а — р, так что его коси- нусом служит cos (а — Р) = cos а cos Р 4 sin а sin Р = • v r r II x 1141У l| Рассмотрим выражение + с его помощью можно выразить очень простыми формулами и угол, и длину. Мы уже видели, что если для всех х известно рас- стояние между 0 и х, то можно вычислить расстояние между любыми х и у, мы утверждаем теперь, что если для каждой пары векторов хи у нам задано значение 4- £2ц2, то в терминах этого значения можно вычислять все рас- стояния и все углы. Действительно, если взять х = у, то ^Лх 4- |2т]2 превращается в 4- Н2 — || х ||2, и это решает вопрос о длинах, а приведенная выше формула косинуса дает нам угол в терминах ВхЛх + ВгЛг и ДВУХ длин ||а:|| и || у||. Чтобы иметь сжатое обозначение, положим для а: = (^, |2) и у = (rij, т]2) £1Л1 + ^гЛг = (*’ У)- Сказанное выше подытоживается следующими соотноше- ниями: расстояние от 0 до г равно ЦгЦ = ^(х, х), расстояние от х до у равно ||х — у\\, (х, у) косинус угла между х и у равен ц д ц.|^у •
160 ОРТОГОНАЛЬНОСТЬ 1ГЛ. Ill Вот важнейшие свойства (х, у), рассматриваемого как числовая функция пары векторов хлу: она симметрична относительно хну, линейно зависит от каждого из своих двух аргументов и значение (х, х) (за исключением случая х = 0) всегда строго положительно. (Противоречие в обо- значениях, возникающее при использовании круглых скобок в (х, у) и в (£t, J-Д, только кажущееся. Оно может появиться лишь в двумерном случае, и даже здесь легко избежать путаницы.) Представим себе на минуту наиболее тривиальный случай пространства 31х. Для х = (£J и у = (тц) будем иметь в этом случае (ж, у) = (по этой именно причине (х, у) и называют скалярным или внутренним произведе- нием х и у.) Угол между любыми двумя векторами равен 0 или л, так что его косинус есть +1 или —1. Это подчеркивает значительно большую чувствительность функции (х, у), принимающей всевозможные числовые значения. § 60. Комплексные скалярные произведения Что будет, если вместо J?2 мы захотим рассматривать ®2? Обобщение как будто напрашивается само собой: для х = (£п |2) и у = (т^, ц2) (где g и ц — теперь комп- лексные числа) положим (х, у) = + в надежде, что выражения || х || = (я, х} п || х — у || могут быть испольг зованы как разумные меры расстояний. Отметим, однако, следующее странное явление (здесь i = ]/ — 1): || ix ||2 = (ix, ix) = i(x, ix)—-i2(x, x) = — || x ||2. Это означает, что если ЦжЦ положительно, т. е. если х на- ходится на положительном расстоянии от начала, то для ix это уже неверно, а именно, расстояние от 0 до ix от- рицательно. Это очень неприятно; несомненно, разумно требовать, чтобы, каково бы ни было то, что должно играть роль (ж, у) в этом случае, оно никогда не станови- лось бы отрицательным при х = у. Формальное средство излечения у нас под рукой: можно попытаться положить (я, г/) = £1П1 + ВгТП
§ 60] КОМПЛЕКСНЫЕ СКАЛЯРНЫЕ ПРОИЗВЕДЕНИЯ 161 (где черточка означает переход к сопряженному комплекс- ному числу). При этом определении выражение (х, у) теряет значительную часть своего былого изящества; оно больше не симметрично относительно х и у и не линей- но по каждому из своих аргументов. Но — и это-то по- буждает нас ввести повое определение,— (х, ^=и1+а2=1^12+1^12 действительно никогда не отрицательно. На первый взгляд сомнительно, можно ли построить полезную и изящную теорию на основе функции, у которой отсутствуют столь многие из свойств, рекомендовавших ее нашему вниманию вначале; кажущееся неизящество будет оправдано до- стигающимся в дальнейшем успехом. Вот обнадеживаю- щее предзнаменование. Рассмотрим пространство 'ё1 (т. е. множество всех комплексных чисел). Невозможно пред- ставить себе какую-нибудь конфигурацию в этом про- странстве, о которой можно было бы говорить не как о конфигурации в однако по идее это, очевидно, другое пространство. Аналогом (х, у) в этом пространстве, при х = и у = (Пг), служит (х, у) = gpij, и это выра- жение действительно допускает простое геометрическое истолкование. Если соединить х и у с началом прямоли- нейными отрезками, (х, у) не будет, конечно, косинусом угла между ними; по оказывается, что при ||о:|| — ||у|| = 1 вещественной частью этого выражения служит как раз указанный косинус. Комплексная сопряженность, которую мы вынуждены были ввести, еще не раз будет досаждать нам; а теперь мы от этого эвристического введения обратимся к формаль- ной работе, сделав еще одно замечание относительно обго- значений. Сходство символов ( , ) и [ , ], первый из которых использован здесь для обозначения скалярного произведения, а второй, ранее, для обозначения линейных функционалов, не случайно. Действительно, позже будет показано, что только наличие комплексной сопряжен-1 ности в ( , ) делает необходимым употребление для не- го символа, отличного от [ , ]. Однако пока мы не можем позволить себе роскошь смешивать эти два символа. И П. Халмою
162 ОРТОГОНАЛЬНОСТЬ [ГЛ. ш § 61. Пространства со скалярным произведением Определение. Скалярным произведением в (ве- щественном или комплексном) векторном пространстве называется (соответственно вещественная или комплекс- ная) числовая функция упорядоченной пары векторов х и у такая, что (я, ?/) = (?/. х) (а^ а2х2, у) = (хх, у) + а2 (х2, у), (х, х) 0; (х, х) = 0 лишь когда х = 0. (О (2) (3) Векторное пространство, в котором задана такая функ- ция, называется пространством со скалярным произве- дением. Заметим, что в случае вещественного векторного про- странства черточку в (1) можно игнорировать. Однако, в любом случае, вещественном или комплексном, (1) озна- чает, что (х, х) всегда вещественно, так что неравенство в (3) имеет смысл. В пространстве со скалярным произве- дением мы будем пользоваться обозначением ]Л(х, х) = ||х||; число || х || называется нормой или длиной вектора х. Вещественное пространство со скалярным произведением иногда называют евклидовым пространством, а его комплек- сный аналог — унитарным пространством. Примерами унитарных пространств могут служить или в первом случае для х=(£1т . . ., £п) и У — = (т)х, ..., т]п) полагаем (я, У) = S 1=1 а во втором, т. е. в &3,
ОРТОГОНАЛЬНОСТЬ 163 § 62] Модификации, превращающие эти примеры в евклидовы пространства (т. е. вещественные пространства со ска- лярным произведением), очевидны. В унитарном пространстве мы имеем U, а1У1 + а2у2) = ах (х, ?/1)-|-а2(х, у2). (2') (Для преобразования левой части формулы (2') в правую используем (1), раскрываем полученное выражение соглас- но формуле (2) и снова применяем (1).) Это свойство вме- сте с определением скалярного произведения оправдывает терминологию, употребляемую иногда для описания свойств (1), (2), (3) (и их следствия (2')). Согласно этой термино- логии, (х, у) есть эрмитово симметричная ((1)), сопря- женно билинейная ((2) и (2')) и положительно определен- ная ((3)) форма. В евклидовом пространстве знаки сопря- женности в (2'), как и в (1), можно игнорировать; в этом случае (х, у) называется симметричной, билинейной и положительно определенной формой. Заметим, что в обо- их случаях условия, наложенные на (х, у), влекут для || х || свойство однородности ||ах|| = |а|-||х||. (Доказательство: || ах||2 = (ах, ах) = аа (х, х).) § 62. Ортогональность Наиболее важным отношением между векторами про- странства со скалярным произведением является орто- гональность. По определению, векторы х и у называются ортогональными, если (х, у) = 0. Заметим, что это отно- шение симметрично: из того, что (х: у) — (у, х), следует, что (х, у) и (у, х) обращаются в нуль одновременно. Если вспомнить мотивы, руководившие нами при введе- нии (х, у), эта терминология объяснится сама собой; два вектора ортогональны (или перпендикулярны), если угол между ними равен 90°, т. е. если косинус угла между ними равен 0. Два подпространства называются ортого- нальными, если всякий вектор каждого из этих подпро- странств ортогонален ко всякому вектору другого. И*
164 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill Множество векторов называется ортонормальным, если, каковы бы ни были х и у из 3?, (х, у) = 0 или (х, у) = 1 соответственно тому, будет ли х ф у или х = у. (Если % конечно, скажем, ~ {х15 ...,хп}, имеем (х;, Xj) = Мы называем ортонормальное множество полным, если оно не содержится ни в каком большем орто- нормальном множестве. Прежде чем сформулировать наше последнее в этом ряду определение, заметим, что ортонормальное множе- ство линейно независимо. Действительно, пусть {xj,... ...,xh} — любое конечное подмножество ортонормаль- ного множества 3?; тогда равенство У, aixi = 0 влечет i равенства О = (2 х3-) = 2 «4 fo, *,) = 2 а А,- = «,•; г i i другими словами, линейная комбинация векторов х может обращаться в нуль, только когда все коэффициенты равны нулю. Отсюда заключаем, что в конечномерном пространстве со скалярным произведением число векто- ров ортонормального множества всегда конечно и притом не превышает линейной размерности пространства. В этом случае мы определим ортогональную размерность про- странства как наибольшее число векторов, которое может содержать ортонормальное множество. Предупреждение: на данной ступени наших знаний понятия ортогональности и ортонормальных множеств еще висят в воздухе. С помощью тривиальных примеров можно показать, что все же дело обстоит не столь уж плохо; так, например, вектор 0 всегда ортогонален к любому вектору; если пространство содержит ненулевой вектор х, то множество, состоящее только из X , ортонормально. Мы согласны, что это — не очень вдохновляющие примеры. Однако пока мы удовольствуемся ими; вскоре мы увидим, что всегда существует «достаточно» ортогональных век- торов для свободного оперирования ими. Заметим также, что мы не вправе полагать, что число элементов всякого полного ортонормального множества равно ортогональной размерности. Конечно, ортонормаль- ное множество, содержащее такое количество элементов,
§ «2} ОРТОГОНАЛЬНОСТЬ 165 очевидно было бы полным; однако мыслимо, что некото- рое другое множество содержит меньше элементов и все же полно из-за своего скверного устройства, предотвра- щающего возможность его расширения. Эти трудности — чисто умозрительные; они исчезнут, как только мы перей- дем к доказательствам; они возникли только потому, что среди нескольких возможных определений полноты нам надо было выбрать какое-то одно, и мы должны доказать его равносильность другим. Нам понадобятся некоторые обозначения. Для всякого множества § векторов пространства У’ со скалярным произведением мы будем обозначать через g-^ множество всех векторов из , ортогональных к каждому вектору из g. Ясно, что g-1- есть подпространство пространства Т (независимо от того, является ли таковым само g) и что g содержится в g1-1- — (g^)-1. Отсюда следует, что под- пространство, натянутое на g, содержится в g-1--1-. В слу- чае, когда g — подпространство, мы будем называть g-1- ортогоналъным дополнением к g. Мы употребляем зна- чок _L для напоминания об ортогональности (или перпен- дикулярности). (В непринужденных обсуждениях g-1- можно былд бы произносить «g перп.».) Упражнения 1. Задавшись четырьмя комплексными числами а, р, у и б, попробуем определить скалярное произведение в g2, положив (*, у) = а£1Щ4-Р£2щ+у£1р24 Sg2Th для любых х = (51, 5г) и у = (щ, th)- Каким условиям должны удовлетворять скаляры а, Р, у и б, чтобы это равенство действитель- но определяло скалярное произведение? 2. Доказать, что если х и у — векторы унитарного простран- ства, то 4 (х, ’/)=1Г'^+’/||2- II г/||2~Н II *-H?/l|a—i \\x-iy ||3- 3. Пусть скалярное произведение в 5эп+1 определено формулой 1 (х, у) = х (Z) у («) dt и Xj(t) = ti, i = 0, . . . , п—1; найти поли- о ном степени п, ортогональный к хо,~х1, ..., хп^.
66 ОРТОГОНАЛЬНОСТЬ [ГЛ. ш 4. а) Два вектора х и у вещественного пространства со скаляр- ным произведением ортогональны тогда и только тогда, когда ii+<=i№+:+i2. Ь) Показать, что а) становится неверным при замене «веществен- ного» на «комплексного». с) Два вектора х и у комплексного пространства со скаляр- ным произведением ортогональны тогда и только тогда, когда |[ аг+0у || = || ах |3 + || 0у1|2 для всех пар скаляров а и 0. d) Пусть х и у — векторы вещественного пространства со скаляр- ным произведением; если || х || = || у ||, то х — у и х -\-у ортого- нальны. (Геометрический смысл?). Обсудить соответствующее утверждение для комплексных пространств. е) Если х и у — векторы пространства со скалярным произве- дением, то II *+У Н2 + 11 X--у II2 = 2 II X ||3+2 II у II3. Геометрический смысл? § 63. Полнота Теорема 1. Пусть ST = {хг, ..., хГ1} — любое ко- нечное ортонормальное множество в пространстве со скалярным произведением, х — любой вектор и аг = (х, хг). Тогда (неравенство Бесселя) 2 |«г|2<||ж||2. i Вектор х' = х — 2 а£о\ ортогонален к каждому Xj и, i следовательно, к подпространству, натянутому на ST. Доказательство. Для первого утверждения: 0< || я' ||2 = (х ,х') = (х — 2 ++, х— 2 a3-aj) = i i = (ж. ж) - 2 ai (Ж{, ж) - У a;. (х, Xj) + 32 aiaj (хг, Xj) = г j г з = II ж ||2—2 I ai I2 — 2 I ai I2 + 2 I ai I2 = II ж ||2- Siad2; i i i i для второго утверждения: (х’, Xj) = (х, Xj) — 2 ai (жг, ж3) = а, - a; = 0. i Теорема 2. Пусть ST — любое конечное ортонор- мальное множество в пространстве со скалярным произ-
S 63] ПОЛНОТА 167 ведением. Следующие шесть условий относительно % равносильны: 1) Ортонормальное множество % полно. 2) Если {х, xt) = 0 для i = 1, .. ,, п, то х = 0. 3) Подпространством, натянутым на %, служит всё ‘Ё'. 4) х = 2 (я. Х])хг для всякого х из ТЕ. i 5) Каковы бы ни были х и у из ТЕ, (х, у) = 2 (*, ^i) У) г {неравенство Парсеваля). 6) Каково бы ни было х из II X ||2 = 2 I (х, |2. i Доказательство. Мы докажем импликации 1) ==> 2) => 3) =>4) ==> 5)==>6)=г>1). Т. е., предпола- гая сначала 1), докажем 2), затем, предполагая 2), дока- жем 3), и так далее, пока, наконец, не докажем 1). предпо- лагая 6). 1) ==> 2). Если {х, хг) = 0 для всех i и х =# 0, то к ЗЕ можно присоединить - , получив тем самым ортонор- мальное множество, большее, чем ЗЕ. 2) ==> 3). Если существует х, не являющееся линейной комбинацией векторов х£, то, по второй части теоремы 1, х' = х — 2 (ж> хд xi отлично от 0 и ортогонально к каж- дому хг. 3) ==> 4). Если каждое х имеет вид х~ 2 а,<Гр т° (х, х4) = 2 aj (Жр ж<) = а4. 3 4) => 5). Если х = 2 aixi и у = 2 РрСр где а4 = (х, х{) i 3 и ру = {у, Xj), то (р-, у) = (2 «А> 2 ₽л) = 2 aj] (*ч, х}) = 2 “Ji- » j i i 5) ==> 6). Положить x — y.
168 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill 6) r=> 1). Если бы Ж содержалось в большем орто- нормальном множестве, скажем, х0 было ортогонально к каждому х{, то мы имели бы IIM2 = Sl(^i)l2 = o, откуда х0 = 0. § 64. Неравенство Шварца Теорема. Для любых двух векторов х и у простран- ства со скалярным произведением справедливо неравенство 1(х, у)|<|И|-1Ы1 (неравенство Шварца). Доказательство. При у = 0 обе части равны нулю. Если у 0, то множество, состоящее из вектора у II У II ’ ортонормально, и, следовательно, по неравенству Бесселя, IfSimOR*11'- Неравенство Шварца влечет важные арифметические, геометрические и аналитические следствия. 1) Определим расстояние между векторами х и у в любом пространстве со скалярным произведением фор- мулой в (ж, У) = || х~ y\\ = V(x — у, х — у). Чтобы 6 заслуженно называлось расстоянием, оно должно обладать следующими тремя свойствами: (I) б (х, у) —6 (у, х), (II) б (х, у) > 0; б (х, у) = 0 тогда и только тогда, когда х = у, (III) б (х, у) < б (х, z) + б (z, у). (В векторном пространстве приятно также быть уве- ренным в том, что расстояние инвариантно относительно переносов: (IV) б (х, y) = 6(x + z, y + z).) Определенное нами б очевидным образом обладает свойствами (I), (II) и (IV); под знаком вопроса стоит только
j 64] НЕРАВЕНСТВО ШВАРЦА 169 справедливость «неравенства треугольника» (III). Чтобы доказать (III), заметим, что II ж + у II2 = (* + у, X + у) = II х ||2 + (х, у) + (у, х) + || у ||2 = = II X II2 + (х, у) + (х, у)+ || у ||2 = = || X ||2 + 2Re (х, у) + II у II2 < || X ||2 + 21 (х, у) | + || у ||2 < < II х ||2 + 21| х || • || у || + [| у ||2 = (|| х К + || у || )2; заменяя х на х — z и у на z — у, получаем || ж — г/1| < || z — z || + || z — !/1|, а это и есть (III). (Мы обозначаем через Re £ вещественную часть комплексного числа если £ = £+гт] с веществен- ными и г], то Re £ = £. Мнимая часть £, т. е. веществен- ное число г;, обозначается Im £ ) 2) В евклидовом пространстве выражение (г. у) Цг||-||У|| дает косинус угла между х и у. Неравенство Шварца в этом случае просто равносильно утверждению, что косинус вещественного угла по абсолютной величине < 1. 3) В унитарном пространстве неравенство Шварца превращается в так называемое неравенство Коши; оно утверждает, что для любых двух последовательностей (£i> ... > Еп) и ОЪ’ • • •» Л,.) комплексных чисел IS S Ш1- г=1 г=1 г=1 4) В пространстве неравенство Шварца превра- щается в неравенство *) 1 1 1 | х (i) у (t) dt j < | х (i) |2 dt • ( | у (t} \2dt. о о о Полезно заметить, что соотношения, упомянутые вы- ше в 1) —4), являются не только аналогами общего *) Впервые установленное в вещественном случае (и не только для полиномов) В. Я. Буняковским.—Перед.
170 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill неравенства Шварца, но и действительно его следствиями или частными случаями. 5) Упомянем попутно, что между двумя понятиями (общего векторного пространства и пространства со ска- лярным произведением) есть место для промежуточного понятия, представляющего немалый интерес. Это —поня- тие нормированного векторного пространства, т. е. век- торного пространства, в котором есть приемлемое опреде- ление длины, но ничего не сказано об углах. Норма в (вещественном или комплексном) векторном пространстве есть числовая функция || х || вектора х такая, что | х > 0 за исключением того случая, когда х = 0, || ах|| = а 14x11 и || x-j- у || < || х || + [j у ||. Наше предшествующее рас- смотрение показывает, что пространство со скалярным произведением есть нормированное векторное простран- ство; обратное вообще неверно. Другими словами, если всё, что нам задано, это норма, удовлетворяющая трём приведенным только что условиям, то может оказаться, что нельзя найти скалярное произведение, для кото- рого бы (х, х) тождественно равнялось ||х||2. Пользуясь несколько неопределенным, но образным термином, можно сказать, что норма в пространстве со скалярным произве- дением носит существенно «квадратический» характер, которым нормы в общем случае не обладают. § 65. Полные ортонормальные множества Теорема. В п-мерном пространстве V' со скаляр- ным произведением существуют полные ортонормальные множества, и каждое полное ортонормальное множество в V содержит ровно п элементов. Ортогональная размер- ность пространства ТГ совпадает с его линейной размер- ностью. Доказательство. Для тех, кого не может обеспокоить выбор элемента из, возможно, несчетного множества, существование полных ортонормальных мно- жеств очевидно. Действительно, мы уже видели, что орто- нормальные множества существуют, а потому выбираем одно из них; если опо не полно, мы можем расширить его, и если полученное ортонормальное множество всё еще не полно, мы снова расширим его и продолжим этот про-
§ 65] ПОЛНЫЕ ОРТОНОРМАЛЬНЫЕ МНОЖЕСТВА 171 цесс по индукции. Так как ортонормальное множество может содержать самое большее п элементов, то самое боль- шее на n-м шаге мы получим полное ортонормальное мно- жество. Это множество порождает всё пространство (см. теорему 2 § 63, 1) ==> 3)) и, будучи к тому же линейно независимым, служит базисом, а потому содержит ровно п элементов. Этим доказано первое утверждение теоремы; второе очевидным образом следует теперь из определений. Существует конструктивный метод обхода этой грубой индукции, и поскольку он проливает дополнительный свет на рассматриваемые понятия, мы воспроизведем его здесь в качестве другого доказательства теоремы. Пусть Ж = {хп .. ., хг } — любой базис пространства Т*. Мы построим полное ортонормальное множество 2/ — {г/р .. . ,г/,), обладающее тем свойством, что каждое г/у есть линейная комбинация векторов хг, ..., х,- . Чтобы начать построение, заметим, что хх =# О (поскольку Я? линейно независимо), и положим г/х ^1 теперь, что уже найдены г/р ..., уг, образующие ортонор- мальное множество и такие, что каждое щ (j = 1, .. ., г) есть линейная комбинация векторов хп .. ., х3-. Положим Предположим z = жг+1 — (а1У1 + • •• +<4/r). где значения скаляров ах, ..., аг еще должны быть опре- делены. Так как (z, у} = (хг+1 - 2 ^гУг, Уз} = (*г+1. Уз) - а3 для / = 1, .. ., г, то заключаем, что, выбрав а, — (хг+1, у,), мы будем иметь (z, j/j) = 0 для j — 1, . . ., г. Далее, будучи линейной комбинацией векторов хг+1 и г/р . .., ут, z есть также линейная комбинация векторов хг+1 и Хр . .., хг. Наконец, z отлично от нуля, поскольку хп ...,хг, хг+1 линейно независимы, а коэффициент при хг+1 в выражении для z отличен от нуля. Положим Ут+1 = ; очевидно, {yv ..., уг, yrtl} есть снова ортонор- мальное множество со всеми требуемыми свойствами, и этим индукция закончена. Нам потребуется тот факт, что не только каждое у, есть линейная комбинация векторов Хр . . ,, х/, но и, обратно, каждое х,- есть линейная
172 вРТОГОНАЛЬНОСТЬ [ГЛ. ш комбинация векторов уг, ..., у3-. Только что описанный ме- тод превращения линейного базиса в полное ортонормаль- ное множество известен под названием процесса ортогона- лизации Грама — Шмидта. В пространствах со скалярным произведением будет удобно и естественно работать исключительно с такими базисами, которые являются также полными ортонормаль- ными множествами. Мы будем называть такой базис ортонормальным базисом или ортонормальной коорди- натной системой; в дальнейшем, рассматривая базисы, не обязательно являющиеся ортонормальными, мы будем подчеркивать это, называя их линейпыми базисами. Упражнения 1. Превратить в пространство со скалярным произведением, 1 положив (х, у) = x(t) у (t)dt для любых г и у из и найти пол- б ное ортонормальное множество в этом пространстве. 2. Пусть х и у — ортогональные единичные векторы (т. »е. {х, у}— ортонормальное множество); чему равно расстояние между хну? 3. Доказать, что если | (х, у) | = || х'|-|| У II (т. е. если неравенство Шварца превращается в равенство), то х и у линейно зависимы. 4. а) Доказать, что неравенство Шварца останется справедли- вым, если в определении скалярного произведения «строго положи- тельно» заменить на «неотрицательно». Ь) Доказать, что для упомянутого в а) «неотрицательного» скалярного произведения множество всех тех векторов х, для кото- рых (х, х) = 0, есть подпространство. с) Образовать факторпространство по указанному в Ь) под- пространству и показать, что заданное «скалярное произведение» естественным образом индуцирует на этом факторпространстве настоящее (строго положительное) скалярное произведение. d) Можно ли рассмотрения из а), Ь) и с) распространить на нормированные пространства (возможно без скалярного произ- ведения)? 5. а) Задавшись строго положительным числом а, попытаемся определить норму в Я? формулой 1 для любого х=(51, ?s). Каким условиям должно удовлетворять а, чтобы это равенство действительно определяло норму?
§ 66j ТЕОРЕМА ОБ ОРТОГОНАЛЬНОМ РАЗЛОЖЕНИИ 173 Ь) Доказать, что формула || х ||=тах{ | |, |g2|J определяет норму в ,®2. с) Какой из норм, определенных в а), Ь), соответствует в .'7?2 такое скалярное произведение, что ||х||2 = (х, х) для всех х из .Э?2? 6. а) Доказать, что для того чтобы в вещественном нормиро- ванном пространстве существовало скалярное произведение, удов- летворяющее равенству ||х||2 = (х, х) для всех х, необходимо и до- статочно, чтобы II *+у 112+П х-у ||2 = 2 || г||2-|-2|| у||2 для всех хну. Ь) Рассмотреть соответствующее утверждение для комплексных пространств. с) Доказать, что для того чтобы в 5?2 существовало скалярное произведение, удовлетворяющее равенству ||х||2=(х, х) для всех х из с‘%2, необходимо и достаточно, чтобы геометрическое место точек, удовлетворяющих уравнению ||z|| = l, было эллипсом. 7. Пусть {г1, ...,хп]—полное ортонормальное множество в i пространстве со скалярным произведением и у3 = / = !>• • • г=1 Выразить векторы, получаемые в результате применения к векто- рам у процесса ортогонализации Грама—Шмидта, через векторы г. § 66. Теорема об ортогональном разложении Поскольку подпространство пространства со скаляр- ным произведением само может рассматриваться как пространство со скалярным произведением, к нему приме- нима теорема предыдущего параграфа. Следующий ре- зультат, называемый теоремой, об ортогональном разложе- нии, является наиболее важным ее применением. Теорема. Если aft есть подпространство конечно- мерного пространства ТЕ со скалярным произведением, то есть прямая сумма и <М\ a = М. Доказательство. Пусть % = {л^, ..., хт} — полное ортонормальное множество в ail и z — любой век- тор из ТЕ. Положим гДе а, = (г, по те°- i реме 1 § 63, y — z — х принадлежит а#-1-, так что z есть сумма двух векторов, z = x + y, с х из е# и у из Дизъюнктность s# и а^-1- очевидна: если бы х принадлежало
114 ОРТОГОНАЛЬНОСТЬ [ГЛ. ш одновременно М и aJftA-, то мы имели бы ||х||2 = (х, х) = 0. По теореме § 18, У' = Заметим, что в разложении z = x-\-y мы имеем (z, х) = (х + у, х) = || х ||2 + (у, х) = || х ||2, • и аналогично (z, У) = II УII2- Значит, если z принадлежит так что (z, у) = 0, то |' у ||2 = 0, и тем самым z (= х) принадлежит ; другими словами, содержится в <М. Поскольку мы уже знаем, что содержится в теорема полностью доказана. Этот вид разложения пространства со скалярным про- изведением в прямую сумму (а именно, на подпространство и его ортогональное дополнение) представляет значитель- ный геометрический интерес. Связанные с ним проекторы мы изучим немного позже; окажется, что они образуют интересный и важный подкласс класса всех проекторов. А пока сделаем лишь замечание о связи с теоремой Пи- фагора; так как (z, х) = || х||2 и (z, у) — ||y||2, то II z ||2 = (г, z) = (z, х) + (г, у) = || х ||2 + || у ||2. Другими словами, квадрат гипотенузы равен сумме квад- ратов катетов. Более общим образом, если ..., — попарно ортогональные подпространства пространства ТС со скалярным произведением и д: = х1 + ... +яй, где каждое х- принадлежит (/= 1, ..., к), то 1И12 = Ы12 + + 1Ы12- § 67. Линейные функционалы Теперь мы в состоянии изучать линейные функционалы на пространствах со скалярным произведением. Для обще- го «-мерного пространства сопряженное пространство также n-мерно, а потому изоморфно первоначальному пространству. Однако, между ними не существует какого- либо очевидного естественного изоморфизма; а следовало бы еще ожидать, что переход ко второму сопряженному пространству должен возвращать к исходному пункту. Основной смысл теоремы, которую мы сейчас докажем,
S 67] ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ 175 заключается в том, что для пространств со скалярным произведением существует «естественное» соответствие между У и У'; единственное, что омрачает горизонт — то, что в общем случае это вовсе не изоморфизм. Теорема. Каждому линейному функционалу у' на конечномерном пространстве ТС со скалярным произведе- нием соответствует однозначно определенный вектор у из Т такой, что у' (х) = (х, у) для всех х. Доказательство. Если у' = 0, можно взять у — 0; будем предполагать далее, что у' (х) не равно тож- дественно нулю. Пусть олЬ — подпространство, состоящее из всех векторов х, для которых у' (х) = 0, и JV* = — его ортогональное дополнение. Подпространство содержит ненулевой вектор у0; умножая на надлежащую постоян- ную, можно добиться того, чтобы || у01| = 1. Положим у = у' (у0) • у0. (Как обычно, черточка означает переход к сопряженному комплексному числу; в случае, когда У — вещественное пространство со скалярным произве- дением, а не унитарное, черточку можно опустить.) Тогда мы действительно имеем требуемое соотношение У' (*) = (ж, у) (1) по крайней мере для х = у0 и всех х из Для произ- вольного х из У положим х0 = х —Ху0, где у'(х) . ’/'(’/о) ’ тогда у' (х0) = 0 и х = х0 -|- Ху0 есть линейная комбинация двух векторов, для каждого из которых верно соотноше- ние (1). Из линейности обеих частей равенства (1) следует, что оно верно для х, что и требовалось доказать. Для доказательства единственности предположим, что (х, У1) = Уг) Для всех х. Тогда (х, у± — у2) = 0 для всех х и потому, в частности, для х = у1 — у2, откуда II У1 - Уг II2 = 0 и г/! = у2. Соответствие у' 7» у есть взаимно однозначное соот- ветствие между У и У', обладающее тем свойством, что сумме у' у'2 соответствует сумма уг + у2, тогда как про- изведению ау' — произведение ау; по этой причине мы называем его сопряженным изоморфизмом. Несмотря на то, что сопряженный изоморфизм делает У' практически
ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill 176 неотличимым от У, есть смысл сохранять их теоретическое различие. Одним из оснований для этого является то, что нам было бы желательно, чтобы вместе с У также V было пространством со скалярным произведением; однако, если последовать тому, что подсказывается сопряженным изоморфизмом между У и У', то сопряженность снова вызовет затруднение. Пусть у'х и у' —любые два элемента из У'; если у'х (х) = (х, yj и у'(х) = (х, у2), то возникает большой соблазн положить (^. Уд = (У1’ Уг)- Но минутное размышление показывает, что это выражение не может удовлетворять условию (2) § 61 и потому не годится для скалярного произведения. Это затруднение возникает только в комплексных (т. е. унитарных) про- странствах; например, мы имеем Уг) = (аУи Уг) = а(.У1> y'J. Выход очевиден: полагаем (у'к уд = (У1> Уг) = (У2> г/i); (2) предоставляем читателю проверить, что при таком опре- делении У' становится пространством со скалярным про- изведением во всех случаях. Это пространство со скаляр- ным произведением мы будем обозначать У*. Заметим, что наши затруднения (если их можно так назвать) с комплексной сопряженностью проявлялись до сих пор больше в обозначениях, чем в понятиях; един- ственное различие между теорией евклидовых пространств и теорией унитарных пространств всё еще заключается в том, что в последней появляется какая-то случайная черточка. Более глубокие различия между двумя теориями проявятся, когда мы перейдем к изучению линейных операторов. § 68. Круглые скобки против квадратных Возникает необходимость выяснить связь между общими векторными пространствами и пространствами со ска- лярным произведением. Теорема предыдущего параграфа показывает, что если аккуратно обращаться с комплекс-
§ 68] КРУГЛЫЕ СКОБКИ ПРОТИВ КВАДРАТНЫХ 177 ной сопряженностью, (х, у) может вполне заменить [х, у}. Могло бы показаться желательным построить всю теорию общих векторных пространств таким образом, чтобы поня- тие ортогональности в унитарном пространстве стало не просто аналогом, но и частным случаем какого-то предва- рительно рассмотренного общего отношения между век- торами и функционалами. Например, один из способов избежания неприятностей с комплексной сопряженностью (или, скорее, перенесения их в менее бросающееся в глаза место) мог бы состоять в определении пространства, со- пряженного к комплексному векторному пространству, как множества сопряженных линейных функционалов, т. е. множества числовых функций у, для которых у (ад + а2х2) = аху (хх) + а2у (х2). Поскольку введение этого усложнения в общую теорию представляется нецелесообразным (и противоречащим общепринятому обычаю), мы выбрали окольный путь, которым только что шли. А так как с этого момента нам придется иметь дело только с пространствами со скаляр- ным произведением, мы просим читателя мысленно ис- править все предыдущее изложение, заменив всюду квад- ратные скобки [х, у] круглыми (х, у). Посмотрим, как скажется эта замена на теоремах и определениях первых двух глав. Замена Т' на ТГ* есть просто изменение обозначения; имеется в виду, что новый символ должен напоминать нам, что к У' добавилось нечто новое (а именно скалярное произведение). Несколько более интересен (сопряженный) изоморфизм между У и У*; с его помощью теоремы § 15, утверждающие существование линейных функционалов с различными свойствами, могут быть теперь истолкованы как теоремы о существовании некоторых векторов в самом Так, например, существование базиса, сопряженного к произвольно заданному базису % — {х15 . .., хп}, вле- чет теперь существование базиса У = {уг, ..., уп} (в У), обладающего тем свойством, что (xt, у;) = 6^-. Еще интересней напрашивающаяся замена аннуля- тора а^° подпространства а/// (который принадлежит У' 12 П. Халмош
178 ОРТОГОНАЛЬНОСТЬ 1гл. ш илиТ’*) ортогональным дополнением а#-1- (принадлежащим, как и пространству /‘). Однако, наиболее радикальное нововведение связано с сопряженным к линейному опе- ратору. Так, мы можем написать аналог соотношения (1) § 44 и для каждого линейного оператора А на У' опре- делить линейный оператор А*, положив (Ах, у) = (х, А*у) для каждого х. Из этого определения следует, что А* есть снова линейный оператор, определенный на том же векторном пространствеТ', но из-за эрмитовой симметрии (х, у) отношение между А и Л* не совсем такое, как между А и Л'. Наиболее значительное различие состоит в том, что (в унитарном пространстве) (аЛ)* = аЛ* (а не (аЛ)* = аЛ*). С этим явлением связано то, что если матрица оператора Л, в некотором фиксированном базисе, есть (ад), то матрицей оператора Л* в сопряженном базисе служит не (ад), а (ад). Для определителей вместо det А* — — det А мы имеем det Л* = det Л, и, следовательно, собственные значения оператора А* совпадают не с соб- ственными значениями оператора Л, а с числами, сопря- женными к ним. Однако здесь различия кончаются. Все остальные результаты § 44 об антиизоморфном харак- тере соответствия Л А* сохраняются; тождество Л = Л** по-прежнему истинно и для своего истолкования не нуж- дается в помощи изоморфизма. Вскоре мы рассмотрим линейные операторы на про- странствах со скалярным произведением и увидим, что принципиально новые черты, отличающие их изучение от рассмотрений главы II, заключаются в возможности срав- нения Л и Л* как линейных операторов на одном и том же пространстве и в исследовании классов тех линейных операторов, которые находятся в особенно простом отно- шении со своим сопряженным. § * § 69. Естественные изоморфизмы Теперь у читателя может (или во всяком случае должно) возникнуть еще только одно сомнение. Многие из наших предыдущих результатов были следствиями таких соот-
8 «9] ЕСТЕСТВЕННЫЕ ИЗОМОРФИЗМЫ 179 ношений рефлексивности, как Л**=Л; останутся ли они справедливыми при замене квадратных скобок круглыми? Ещё уместнее следующая форма постановки вопроса. Всё, что было сказано об унитарном пространстве °У‘, должно быть также верно для унитарного пространства в частности, оно также находится в естественном сопря- женном изоморфном отношении к своему сопряженному пространству У**. Если теперь каждому вектору из У поставить в соответствие вектор из У**, применив сна- чала естественный сопряженный изоморфизм между У и У*, а затем проделав тот же путь от У* к У**, то это отображение будет претендентом на звание естественного отображения У на У**, — звание, уже присвоенное в гла- ве I другому на вид соответствию. Какова связь между этими двумя естественными соответствиями? Наши ут- верждения о совпадении, с точностью до тривиальных модификаций, теорий круглых и квадратных скобок дей- ствительно оправдываются тем, что, как мы; сейчас дока- жем, эти два отображения тождественно совпадают. (Поскольку а — а, едва ли следует удивляться, что после двух применений докучливая сопряженность исчезнет.) Доказательство короче, чем введение к нему. Пусть г/0 —любой элемент из У; ему соответствует линейный функционал у о из У*, определяемый формулой Уа(г) = (х, у0), а этому уо, в свою очередь, — линейный функционал у о* из у**, определяемый формулой Уо* (У*) = (У*, Уо)• Оба эти соответствия задаются ото- бражением, введенным в этой главе. Ранее (см. § 16) элемент у о* из У**, соответствующий элементу у0, опре- делялся формулой уо*(у*) = у* (у0) для всех у* из У*; мы должны показать, что уо*, как оно было определено нами здесь, удовлетворяет этому тождеству. Пусть у*— любой линейный функционал на У (т. е. любой элемент из У*); имеем Уо* (у*) = (у*> yt) = (y0, у) = уЧу0). (Среднее равенство вытекает из определения скаляр- ного произведения в У*.) Этим разрешены все наши вопросы. 12’
180 ОРТОГОНАЛЬНОСТЬ [ГЛ. П1 Упражнения 1. Если М и —подпространства конечномерного простран- ства со скалярным произведением, то И+JO1= и 1 2. Пусть у' (я)=у Й1+^+5з) Для каждого ж=(£1. 5г. Ь) из g3; найти вектор у в g3 такой, что у' (х) = (х, у). 3. Если у — вектор пространства со скалярным произведением, А —линейный оператор на этом пространстве и f(x)~ (у, Ах) для всех векторов х, то f есть линейный функционал; найти такой вектор у*, что /(х) = (г, у*) для каждого х. i. а) Если А — линейный оператор на конечномерном про- странстве со скалярным произведением, то tr (4*4) 5э0; tr (4*4) =0 тогда и только тогда, когда 4=0. (Указание: перейти к матри- цам.) Это свойство следов может часто использоваться для полу- чения ускользающих от других способов алгебраических фактов о произведениях операторов и их сопряженных. Ь) Доказать с помощью следов, а также непосредственно, что если 4j, ..., 4^—линейные операторы на конечномерном про- странстве со скалярным произведением такие, что k 2 A*Aj=O, то 41== ... =4fe=0. 1=1 с) Если А*А=В*В—ВВ*, то 4=0. d) Если 4* перестановочно с 4 и 4 перестановочно с В, то 4* перестановочное/?. (Указание: если С — А*В — BA* nD = AB—ВА, то tr (C*Q =tr (D*D)-|-tr f(4*4 — 44*) (В*В—ВВ*)].) 5. а) Пусть <ffd— унитарное пространство; образуем множество всех упорядоченных пар {х, у) с х и у из Sd (т. е. прямую сумму пространства 3d с самим собою). Доказать, что равенство «г,, Vs), <х2> У2,» = (х1, x2)+(ylt у2) определяет в прямой сумме ей? Фай? скалярное произведение. Ь) Если U определено формулой U {х, у} = (у, —х),то /7*17=1. с) Графиком линейного оператора 4 на ей? называется множе- ство всех тех элементов (г, у) из ей? ф <гй£, для которых у = Ах. Доказать, что график любого линейного оператора на 3d есть под- пространство пространства 3d ф 3d. d) Если 4 —линейный оператор на 3d с графиком Jr, то гра- фиком сопряженного оператора 4* служит ортогональное допол- нение (в 3d(p3d) к образу $ относительно U (см. Ъ)). 6. а) Положим для каждого линейного оператора 4 на конечномерном пространстве со скалярным произведением
8 70] САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 181 N (4) = ]/Чг {А*А)', показать, что N есть норма (в пространстве всех линейных операторов). Ь) Индуцируется ли норма jV скалярным произведением? 7. а) Два линейных оператора А и В на пространстве со ска- лярным произведением называются конгруентными, если существу- ет такой обратимый линейный оператор Р, что В =Р*АР. (Это понятие часто определяется не для самих линейных операторов, а для «квадратичных форм», ассоциированных с ними; в значитель- ной степени это дело вкуса. Заметим, что если а(х)=(Лх, х) и Р (х) — (Вх, х), то В = Р*АР влечет 0 (х) = а (Рх).) Доказать, что конгруентность является отношением эквивалентности. Ь) Если А и В конгруентны, то А* и В* также конгру- ентны. с) Существует ли линейный оператор А, конгруентный скаля- ру а, но пе равный ему? d) Существуют ли конгруентные линейные операторы А и В, квадраты которых Л2 и В2 не конгруентны? е) Если два обратимых оператора конгруентны, то обратные к ним операторы также конгруентны. § 70. Самосопряженные операторы Займемся теперь изучением алгебраической струк- туры класса всех линейных операторов на пространстве V со скалярным произведением. Во многих важных отноше- ниях этот класс походит на класс всех комплексных чисел. В обеих системах определены понятия сложения, умноже- ния, 0 и 1, обладающие похожими свойствами, и в обеих системах существует инволютивный антиавтоморфизм си- стемы на себя (а именно, А —> 4* и £—>£). Используем эту аналогию как эвристический принцип и попытаемся перенести на линейные операторы некоторые общеизвест- ные понятия из комплексной области. Мы столкнемся при этом с двумя трудностями теории линейных операторов, из которых, как это, быть может, ни покажется неожидан- ным, вторая будет значительно серьезней первой: это — невозможность неограниченного деления и неперестано- вочность общих линейных операторов. Наиболее важными подмножествами комплексной пло- скости являются множество вещественных чисел, множе- ство положительных вещественных чисел и множество чисел-, равных по абсолютной величине единице. При- ступая к систематическому проведению нашей эвристиче- ской аналогии между операторами и комплексными
182 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill числами, попытаемся открыть в области операторов ана- логи этих общеизвестных числовых понятий. Когда комплексное число вещественно? Очевидно, необходимым и достаточным условием вещественности £ является выполнение равенства £, = £,. По аналогии с этим можно было бы (вспомнив, что аналогом комплексной сопряженности для линейных операторов является со- пряженность) назвать линейный оператор А вещественным, если А=А*. Но более принято линейный оператор А, для которого А=А*, называть самосопряженным; в слу- чае евклидовых пространств обычно говорят симметрич- ный, а в случае унитарных пространств — эрмитов. Мы увидим, что самосопряженные операторы действи- тельно играют такую же роль, как вещественные числа. Матрицы самосопряженных операторов в ортонормаль- ном базисе характеризуются очень просто. Пусть (ау) — матрица оператора А; как мы знаем, тогда матрицей сопряженного оператора А* в сопряженном базисе будет (а*), где ау = ад ; так как ортонормальный базис само- сопряжен, то при А = А* получаем Clij == Предоставляем читателю проверить обратное: если А — линейный оператор, определенный с помощью матрицы (ау) и произвольной ортонормальной координатной си- стемы обычными равенствами j i T]i = S j и если матрица (ay) такова, что ay = ад, то А самосо- пряжен. Алгебраические правила действий с самосопряженными операторами легко запомнить, если рассматривать такие операторы как аналоги вещественных чисел. Так, если А и В — самосопряженные, то и А + В — самосопря- женный; если А — самосопряженный оператор, отличный от 0, и a — ненулевой скаляр, то аА — самосопряженный оператор тогда и только тогда, когда а вещественно;
§ 70] САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ ]83 и если А обратим, то Л и А'1 будут самосопряженными либо несамосопряженными одновременно. Но есть пункт, в котором всегда что-нибудь не так: умножение; произ- ведение двух самосопряженных операторов может не быть самосопряженным оператором. Положительные факты о произведениях содержатся в следующих двух теоремах. Теорема 1. Если А и В -— самосопряженные опе- раторы, то АВ (или ВА) будет самосопряженным тогда и только тогда, когда АВ = ВА (т. е. когда А и В пере- становочны). Доказательство. Если АВ = В А, то (АВ)* — — В* А* = В А = АВ. Если (АВ)* = АВ, то АВ = (АВ)* = =В*А* = ВА. Теорема 2. Если А — самосопряженный опера- тор, то В*А В будет самосопряженным для любого В', если В обратим и В*АВ самосопряжен, то А самосо- пряжен. Доказательство. Если А = А*, то (В* АВ)* — —В*А*В**—В*АВ. Если В обратим и В* АВ = (В* АВ)* = — В*А*В, то (по умножении слева на В*~г и справа на В~х) А = А*. Комплексное число t, чисто мнимо тогда и только тогда, когда £= —£,. Соответствующее понятие для линейных операторов описывается словом «косой»; если линейный оператор А на пространстве со скалярным произведением таков, что А* = — А, то А называется кососимметричным или косоэрмитовым соответственно тому, вещественно пространство или комплексно. Вот одно из доказательств глубокого характера нашей аналогии между комплекс- ными числами и линейными операторами; произвольный линейный оператор А может быть представлен, притом единственным способом, в виде А=В-\-С, где В — самосопряженный, а С — косой. (Представление А в таком виде иногда называется декартовым разложением опе- ратора А.) Действительно, если положить В = ^, (1) С = (2) &
184 ОРТОГОНАЛЬНОСТЬ (ГЛ. Ill то В* = А = В и С* = — -А = — С и, конечно, и и А=В-\-С. Из этого доказательства существования де- картова разложения ясна также единственность послед- него; если Л =7? +С —декартово разложение, то А* = В — С, и, значит, А, В и С вновь связаны соот- ношениями (1) и (2). В комплексном случае имеется простой способ получе- ния косоэрмитовых операторов из эрмитовых и обратно, именно — умножение на (( = ]/ — 1). Отсюда следует, что, в комплексном случае, каждый линейный оператор А допускает однозначно определенное представление в виде где В и С эрмитовы. Мы будем рассматри- вать В тлС как вещественную и мнимую части оператора А. Упражнения 1. Привести пример двух самосопряженных операторов, про- изведение которых не было бы самосопряженным. 2. Рассмотрим пространство ,7ЧП со скалярным произведением, 1 задаваемым формулой (х, у) = х (t) у (t) dt. b а) Самосопряжен ли оператор умножения Т (определенный формулой (Тх) (/) —tx (t))? b) Самосопряжен ли оператор дифференцирования D? п ______ 3. а) Доказать, что равенство (х, у) = з=0 определяет в пространстве скалярное произведение. Ь) Самосопряжен ли оператор умножения Т (определенный формулой (Тх) (t) = tx(t)) при определении скалярного произве- дения, данном в а)? с) Самосопряжен ли оператор дифференцирования D? 4. Если А и В — такие линейные операторы, что А и АВ— самосопряженные и .A" (A)dA^(B), то существует самосопряжен- ный оператор С такой, что СА—В. 5. Пусть А и В конгруентны и А косой; следует ли отсюда, что В косой? 6. Если А косой, то влечет ли это, что А2 косой? Как насчет А3? 7. Если операторы А я В оба самосопряженные или оба косые, то АВ + ВА — самосопряженный оператор, а АВ — ВА косой. Что будет, если один из операторов, А или В, самосопряженный, а другой косой?
8 71J ПОЛЯРИЗАЦИЯ 185 8. Если А — кососимметричный оператор на евклидовом про- странстве, то (Ах, х) = 0 для каждого вектора х. Обратно? 9. Если 4 — самосопряженный или косой и42х = 0, то Ах=0. 10. а) Если А — кососимметричный оператор на евклидовом пространстве нечетной размерности, то det 4=0. b) Если 4 — кососимметричный оператор на конечномерном евклидовом пространстве, то g (4) четно. § 71. Поляризация Прежде чем продолжить программу исследования ана- логий между комплексными числами и линейными опе- раторами, уделим время ознакомлению с некоторыми важными вспомогательными результатами, относящимися к пространствам со скалярным произведением. Теорема 1. Для того чтобы линейный оператор А на пространстве со скалярным произведением был равен 0, необходимо и достаточно, чтобы {Ах, у) = 0 для всех х и у. Доказательство. Необходимость условия оче- видна; достаточность получим, взяв у равным Ах. Теорема 2. Для того чтобы самосопряженный линейный оператор А на пространстве со скалярным про- изведением был равен 0, необходимо и достаточно, чтобы {Ах, х) = 0 для всех х. Доказательство. Необходимость очевидна. Доказательство достаточности начнем с проверки тожде- ства (Ла:, у} + {Ау, х) = {А{х + у), х + у)-{Ах, х)-{Ау, у). (1) (Разложить первый член правой части.) Поскольку А самосопряжен, левая часть этой формулы равна 2Re (Ах, у). Из принятого нами условия следует, что правая часть равна нулю; значит, Re {Ах, у) = 0. С этого места дока- зательство расщепляется на два случая. Если рассматри- ваемое пространство со скалярным произведением веще- ственное (так что оператор Л симметричен), то {Ах, у) ве- щественно и потому {Ах, у) = 0. Если же пространство комплексное (т. е. Л эрмитов), то находим комплексное число .6 такое, что | 0 | = 1 и 0 {Ах, у) = | {Ах, у) |. (Здесь хну временно зафиксированы.) Уже имеющийся у нас результат, примененный к 0а: вместо х, дает
186 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill 0 = Re (Л (0х), у) = Re 0 (Ах, y) = Re 1(Лх, г/)| = |(Лл:, у)\. Поэтому в любом случае (Ах, у) = 0 для всех х и у, и справедливость утверждения теоремы следует из тео- ремы 1. Небесполезно задаться вопросом, насколько важна в теореме 2 самосопряженность оператора А; ответ заклю- чается в том, что в комплексном случае она совсем не важна. Теорема 3. Для того чтобы линейный оператор А на унитарном пространстве был равен 0, необходимо и достаточно, чтобы (Ах, х) = 0 для всех х. Доказательство. Как и прежде, необходи- мость очевидна. Для доказательства достаточности ис- пользуем так называемое поляризационное тождество: сф (Ах, у) + сф (Ау, х) = =-- (А (ах А- ру), ах+ $у) - | а |2 (Ах, х) - | Р |2 (Ау, у). (2) (Так же как в случае формулы (1), доказательство со- стоит в разложении первого члена правой части.) Если (Ах, х) тождественно равно нулю, то, беря сначала а = р = 1, а затем а = i( = У — 1), Р = 1, получаем (Лгг, у) + (Ау, х) = О, i (Ах, у) — i (Ау, х) = 0. Деля второе из этих равенств на i и затем образуя их среднее арифметическое, видим, что (Ах, у) = 0 для всех х и у, так что, по теореме 1, А = 0. Этот процесс поляризации часто используется для получения информации о «билинейной форме» (Ах, у), когда предполагается лишь знание «квадратичной формы» (Ах, х). Важно заметить, что, несмотря на кажущуюся про- стоту, в теореме 3 существенно используется система комп- лексных чисел; эта теорема и многие ее следствия оказы- ваются уже неверными для вещественных пространств со скалярным произведением. Конечно, и доказательство отказывает в том месте, где мы берем а = ]/ — 1. Для при- мера рассмотрим вращение плоскости на 90°; очевидно, оно обладает свойством переводить каждый вектор х в ортогональный к нему вектор.
S 72] ПОЛОЖИТЕЛЬНЫЕ ОПЕРАТОРЫ 187 Мы видели, что эрмитовы операторы играют такую же роль, как вещественные числа; следующая теорема показывает, что они связаны с понятием вещественности более глубоким образом, чем формальной аналогией, подсказавшей их определение. Теорема 4. Для того чтобы линейный оператор А на унитарном пространстве был эрмитовым, необходимо и достаточно, чтобы (Ах, х) было вещественно для всех х. Доказательство. Если А — А*, то (Ах, х) = (х, А*х) = (х, Ах) = (Ах, х), так что (Ах, х), совпадая со своим сопряженным, вещест- венно. Обратно, если (Ах, х) всегда вещественно, то (Ах, х) = (Ах, х) = (х, А*х) = (А*х, х), так что ([Л — Л*] х, х) = 0 для всех х, и, по теиреме 3, Л =Л*. Теорема 4 не верна для вещественных пространств со скалярным произведением. Это и следовало ожидать, поскольку, во-первых, ее доказательство опирается на теорему, справедливую только для унитарных пространств, и, во-вторых, в вещественном пространстве число (Ах, х) автоматически вещественное, в то время как тождество (Ах, у) — (х, Ау) не всегда выполнено. § 72. Положительные операторы Когда комплексное число £ положительно (т. е. >0)? Два, в равной степени естественных, необходимых и до- статочных условия состоят в том, что £ может быть запи- сано или в виде £ = V с некоторым вещественным £ или в виде £ = а<т с некоторым (вообще комплексным) о. Вспомнив еще тот факт, что (по крайней мере для унитар- ных пространств), эрмитовость оператора Л может быть описана в терминах скалярных произведений (Лх. х), можно попытаться использовать в качестве определения положительности операторов любое из следующих трех условий: 1) Л = В2 для некоторого самосопряженного В, 2) Л = С*С для некоторого С, 3) А самосопряжен и (Лл:, х)>0 для всех х.
188 ОРТ ОГОНАЛЬНОСТЬ [ГЛ. III Прежде чем решить, какое из этих трех условий исполь- зовать в качестве определения, заметим, что 1)=^2)=^3). Действительно, если А = В2 и В = В*, то А = В В = В* В, и если А = С*С, то А* — С*С = А и (Ах, х) = (С*Сх, х) = = (Сх, Сх) = ||С;г||2>0. В действительности верно и то, что 3) влечет 1), так что указанные три условия равно- сильны; но мы сможем доказать это лишь позже. Мы при- мем в качестве определения третье условие. Определение. Линейный оператор А на про- странстве со скалярным произведением назовем положи- тельным, для обозначения чего будем писать Л>0, если он самосопряжен и (Ах, я) > О для всех х. Более общим образом, мы будем писать Л >7? (или В^А), если Л—7?>0. Хотя, конечно, вполне воз- можно, что разность двух даже несамосопряженных опе- раторов может оказаться положительной, мы будем обыч- но писать неравенства только для самосопряженных опе- раторов. Заметим, что в случае комплексного простран- ства со скалярным произведением часть определения по- ложительности излишня: если (Ах, х)>0 для всех х, то, в частности, (Ах, х) вещественно для всех х, и, по теореме 4 предыдущего параграфа, А должен быть положительным. Положительные операторы принято называть также неотрицательно полуопределенными. Если Л > О и (Ах, х) = 0 влечет х = 0, мы будем говорить, что Л строго положителен; принятый термин — положительно опре- деленный. Так как, по неравенству Шварца, | (Ла:, х) |< || Лж||-|| х||, мы видим, что если Л — строго положительный оператор и Ах = 0, то х = 0, так что в конечномерном пространстве со скалярным произведением строго положительный опе- ратор обратим. Позже мы увидим, что верно и обратное: если Л >0 и Л обратим, то Л строго положителен. Иног- да бывает удобно выражать факт строгой положительности оператора Л записью Л > 0; если Л—7?>0, мы будем также писать Л > В (или В < Л). Можно дать и матричную характеризацию положитель- ных операторов; но пока отложим это рассмотрение. Тем временем мы будем иметь случай говорить о положи- тельных матрицах, понимая под этим эрмитово симметрия-
S 72) ПОЛОЖИТЕЛЬНЫЕ ОПЕРАТОРЫ 189 ные матрицы (ау) (т. е. такие, что ац = ац), обладающие тем свойством, что У 2 ау^^}- > 0 для каждой последо- i j вательности п скаляров (£п ... , £п). (В вещественном случае черточки можно опустить; в комплексном случае второе условие уже влечет эрмитову симметрию.) Ясно, что эти условия равносильны условию, что (ау) есть мат- рица положительного оператора в некоторой ортогональ- ной координатной системе. Алгебраические правила действий над положительными операторами, в том, что касается сложения, умножения на скаляры и обращения, подобны правилам для само- сопряженных операторов; даже теорема 2 § 70 сохраняет силу, если всюду заменить «самосопряженный» на «поло- жительный». Верно также, что если А и В положительные, то для положительности их произведения АВ (или ВА) необходимо и достаточно, чтобы АВ = ВА (т. е. чтобы А и В были перестановочны), но доказательство этого утверждения нам придется на время отложить. Упражнения 1. Каким условиям должен удовлетворять линейный оператор А, чтобы функция (Ах, у) переменных хну обладала свойствами скалярного произведения? 2. Какие из следующих матриц положительны? Р 1 Л1 a) 111. d) о J . \1 1 1 / ill о 1 1 0 0 1 3. Для каких значений а матрица /а 1 1 \ | 1 0 0 1 \1 0 0 J положительна? 4. а) Если А — самосопряженный оператор, то число tr А вещественно.
190 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill Ь) Если 4>0, то tr4>0. 5. а) Привести пример положительной матрицы, некоторые элементы которой были бы отрицательны. Ь) Привести пример неположительной матрицы, все элементы которой были бы положительны. ( а Р \ 6. Квадратная матрица второго порядка ( & ) (рассматри- ваемая как линейный оператор па 4S") положительна тогда и только тогда, когда она эрмитово симметрична (т. е. а и 6 вещественны, а у = Р), а)>0, б)>0 и аб—Ру)>0. 7. В пространстве со скалярным произведением с каждой после- довательностью к векторов ..., Xfr) ассоциируется квадратная матрица к-то порядка (не лилейный оператор), называемая грами- аном последовательности (ij, ..., z,,) и обозначаемая G (хг, ..., х^); элементом, стоящим на пересечении i-й строки и /-го столбца в G (х^, ..., хк), служит скалярное произведение (z;, Xj). Доказать, что каждый грамиан является положительной матрицей. 8. Пусть хну — ненулевые векторы (конечномерного простран- ства со скалярным произведением); для существования такого поло- жительного оператора А, что Ах = у, необходимо и достаточно, чтобы (х, у) > 0. 9. а) Если матрицы А = ^д д') и^=(^о РассматРивать как линейные операторы на !ig'i и С — эрмитова матрица (эрмитов линейный оператор на g2), такая, что 4 С и В С, то c=f1+-s’e V < е i+dj’ где g и б — положительные вещественные числа и 1012 < min {е (l-j-б), 6(1-|-е)}. Ь) Если, кроме того, С 1, то е = б = 0 = О. В современной терминологии эти факты в совокупности показывают, что эрмитовы матрицы с упорядочением, индуцированным понятием положитель- ности, не образуют решетки («структуры»), В вещественном слу- чае, если трактовать матрицу как точку (а, р, у) трехмер- ного пространства, упорядочение и его нерешеточность приоб- ретают любопытный геометрический смысл. § 73. Изометрии Продолжим нашу программу исследования аналогии между числами и операторами. Когда модуль комплекс- ного числа равен единице? Очевидно, необходимое и до- - 1 статочное условие состоит в том, чтобы £ = —; руково- димые нашим эвристическим принципом, мы приходим
§ 13] ИЗОМЕТРИЙ 191 к рассмотрению линейных операторов U, для которых U* = U1 или, что равносильно-этому, для которых UU* = = U*U=l. (Заметим, что в конечномерном векторном пространстве каждое из двух условий UU* = 1 и U*U — 1 влечет другое; см. теоремы 1 и 2 § 36.) Такие операторы называются ортогональными или унитарными соответ- ственно тому, вещественно рассматриваемое пространство со скалярным произведением или комплексно. Перейдем к выводу пары других полезных характеризаций этих операторов. Теорема. Следующие три условия относительно линейного оператора U на пространстве со скалярным произведением равносильны'. U*U = 1, (1) (Ux, Uy) = (x, у) для всех х и у, (2) || Ux || = || х || для всех х. (3) Доказательство. Если выполнено условие (1), то (Ux, Uy) = (U*Ux, у) = (х, у) для всех х и у, и, в частности, II Ux ||* = ||* II2 для всех х; это доказывает сразу импликации (1) (2) и (2) => (3). Для завершения доказательства покажем, что (3) влечет (1). Если выполнено условие (3), так что (U*Ux, х) = (х, х) для всех х, то к (самосопряженному) оператору U*U — 1 применима теорема 2 § 71; в резуль- тате получаем, что U*U = 1 (что и требовалось). Поскольку (3) влечет ||С/я:-С7г/|| = ||х-у|| (4) для всех х и у (обратная импликация (4) => (3) также верна и тривиальна), мы видим, что операторы, рассматри- ваемые в теореме, характеризуются тем, что они сохраняют расстояния. По этой причине мы будем называть такой оператор изометрией. Поскольку, как уже было замечено, изометрия на конечномерном пространстве обязательно является ортогональным или унитарным оператором
192 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill (соответственно тому, вещественно или комплексно рас- сматриваемое пространство), использование этой терми- нологии даст нам возможность трактовать вещественный и комплексный случаи одновременно. Отметим, что (в ко- нечномерном пространстве) изометрия всегда обратима, причем t/-1 ( = U*) есть изометрия вместе с U. В любой алгебраической системе, и, в частности, в об- щих векторных пространствах и пространствах со ска- лярным произведением, представляет интерес рассмотре- ние автоморфизмов этой системы, т. е. тех взаимно одно- значных отображений системы на себя, которые сохра- няют все структурные отношения между его элементами. Мы уже видели, что автоморфизмы общего векторного пространства — это обратимые линейные операторы. В пространстве со скалярным произведением от авто- морфизма требуется большее, а именно, чтобы он сохра- нял также скалярные произведения (а следовательно, длины и расстояния). Последняя теорема показывает, что это требование равносильно условию, чтобы оператор, осуществляющий автоморфизм, являлся изометрией. (Здесь мы предполагаем конечномерность; в бесконечно- мерных пространствах область значений изометрии не обязательно совпадает со всем пространством. Эта несу- щественная для нас жертва в общности принесена ради терминологического удобства; в случае бесконечномерных пространств нет общепринятого термина, одновременно описывающего ортогональные и унитарные операторы.) Таким образом, на два вопроса: «Какие линейные опера- торы являются аналогами комплексных чисел, равных по абсолютной величине единице?» и «Каковы наиболее общие автоморфизмы конечномерного пространства со скалярным . произведением?» — один ответ: изометрии. В следующем параграфе мы покажем, что изометрии дают ответ также на третий важный вопрос. § 74. Изменение ортогонального базиса Мы видели, что теорию перехода от одного линейного базиса векторного пространства к другому лучше всего изучать с помощью ассоциированного линейного опера- тора Л (§§ 46, 47); возникает вопрос, какими специальными
§ 74] ИЗМЕНЕНИЕ ОРТОГОНАЛЬНОГО БАЗИСА Щ3 свойствами обладает оператор А перехода от одного орто- нормального базиса пространства со скалярным произве- дением к другому. На этот вопрос легко ответить. Теорема 1. Если Л- — {xY, х.}— ортонор- мальный базис п-мерного пространства V со скалярным произведением и U — изометрия на ТЕ, то USE — — {Uхх, . . . ,Uxv} — также ортонормальный базис прост- ранства 1". Обратно, если U — линейный оператор и SE — ор- тонормальный базис, обладающие тем свойством, что USE тоже есть ортонормальный базис, то U — изометрия. Доказательство. Так как {Ux^ Ux}) = — (xt, Xj) = 6i7, то USE, как и SE, — ортонормальное множество; оно полно вместе с SE, поскольку (х, UxL)=0 для i = l , ... , п влечет (U*x, хг) = 0, и, значит, U*x = = х = 0. Обратно, если U.E есть вместе с SE полное орто- нормальное множество, то (Ux, Uy) — (х, у) для любых х и у из SE, а отсюда по линейности очевидно следует, что (Ux, Uy) = (х, у) для всех х и у. Заметим, что матрица (иц) изометрии в произвольном ортонормальном базисе удовлетворяет условиям 2 2 Uki 113 k = k и что, обратно, любая такая матрица, вместе с ортонор- мальным базисом, определяет изометрию. (Доказатель- ство: U*U=1. В вещественном случае черточки можно опустить.) Для краткости мы будем матрицу, удовлетво- ряющую этим условиям, называть изометрической ма- трицей. Одним из интересных и простых результатов наших рассмотрений, относящихся к изометриям, является такое следствие теоремы 1 § 56: Теорема 2. Для любого линейного оператора А на n-мерном пространстве Т со скалярным произведением существует ортонормальный базис SE в V такой, что матрица [Л; .Е] треугольна', или, равносильно этому, для любой матрицы [Л ] существует изометрическая матрица [{/] такая, что матрица [С/]'1 [Л] [C7J тре- угольна. Доказательство. При выводе теоремы 2 § 56 из теоремы 1 был построен (линейный) базис SE = {х1г ..., хп}, 13 П. Халмош
194 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill обладающий тем свойством, что xr. ...,Xj принадлежат и порождают для 7 = 1,..., п, и мы показали, что в этом базисе матрица оператора А треугольна. Если бы мы знали, что этот базис к тому же является ортонормальным, мы могли бы получить утверждаемый результат, применив теорему 1 этого параграфа. Если & не является ортонормальным базисом, легко превратить его в таковой; это как раз то, что можно делать с помощью процесса ортогонализации Грама —Шмидта (§ 65). Здесь мы используем специальное свойство процесса Грама — Шмидта, а именно то, что у-й элемент доставляемого им ортонормального базиса является линейной комбинацией векторов xlf ... , Xj и потому принадлежит Упражнения 1. Пусть (4а:) (i)=x (—I) на (со скалярным произведением, 1 задаваемым формулой (а:, у) = х (t)y(t)dt). Будет ли линейный о оператор А изометрическим? Самосопряженным? 2. При каких значениях а будут изометрическими следующие матрицы: (_1_\ “ 2 1 1 ’ 2 “/ 3. Найти изометрическую матрицу третьего порядка, первая строка которой кратна (1, 1, 1). 4. Если линейный оператор обладает любыми двумя из свойств быть самосопряженным, изометрическим или инволютивным, то он обладает и третьим. (Напомним, что инволюция — это линейный оператор 4, для которого 4а=1.) 5. Е ели изометрическая матрица треугольна, то она диагопальна. 6. Пусть (xj, ..., Xk) и (j/u уь) — две последовательности векторов одного и того же пространства со скалярным произведени- ем. Для существования изометрии U такой, что Ux^yt, i = l, ..., k, необходимо и достаточно, чтобы fo, ..., х^) и (щ, ..., у^) обладали одним и тем же грамианом. |±1 В-1 7. Отображение | взаимно однозначно отображает мнимую ось комплексной плоскости на единичную окружность с удаленной точкой 1; обратное отображение (этой окружности без точки 1 на мнимую ось) задается той же формулой. Операторные аналоги этих геометрических фактов таковы:
§ 751 ПЕРПЕНДИКУЛЯРНЫЕ ПРОЕКТОРЫ 195 а) Если оператор А —косой, то А—1 обратим. b) U = (А + 1) (-4 — I)-1 ~ изометрия. (Указание: || (А4-1) у ||2 = = || (А — 1) у ||2 для каждого у.) с) оператор U — 1 обратим. d) Если 17 —изометрия и оператор U—1 обратим, то 4 = — (174-1) (77 — I)'1 — косой. Каждый из операторов А и U называется преобразованием Кели другого. 8. Пусть U—оператор (не предполагаемый линейным), ото- бражающий пространство '7° со скалярным произведением на себя (так что Ux принадлежит V1 для всех х из 7/4 и если у принадлежит ?/э, то y=Ux для некоторого х из Vе) итакой, что (77 а:, Uy) = (x, у) для всех х и у. а) Доказать, что U взаимно однозначен и, если обозначить через U~l обратный оператор, что (и~гх, U~1y) = (x, у) и (Ux, у) — = (х, и~гу) для всех хну. Ь) Доказать, что U линеен. (Указание: (х, U^1y) линейно зави- сит от х.) 9. Назовем сопряжением оператор J (не предполагаемый ли- нейным), отображающий унитарное пространство на себя так, что 72 = 1 и (Jx, Jy} = (y, х) для всех хну. а) Дать пример сопряжения. Ъ) Доказать, что (Jx, y) = (Jy, х). с) Доказать, что J (x-\-y)t=Jx-{-jy. d) Доказать, что J (ах) =а-Jx. 10. Назовем линейный оператор А вещественным относительно сопряжения J, если AJ — JA. а) Дать пример эрмитова оператора, не являющегося веществен- ным, и вещественного оператора, не являющегося эрмитовым. Ь) Спектр вещественного оператора симметричен относительно вещественной оси. с) Если А — вещественный оператор, то и А*— вещественный. 11. Теорема 2 § 74 показывает, что треугольная формаможет быть достигнута с помощью ортонормального базиса; верно ли то же для жордановой формы? 12. Если tr4=0, то существует изометрическая матрица U такая, что все диагональные элементы матрицы [Т/]"1 [4] [77] равны нулю. (Указание: см. упражнение 6 § 56.) § 75. Перпендикулярные проекторы Теперь мы в состоянии выполнить данное нами ранее обещание исследовать проекторы, связанные со специаль- ным разложением в прямую сумму ТС = вИ @ а/ИЛ. Мы будем называть их перпендикулярными проекторами. Так как а/ИА- однозначно определяется подпространством <М, нет необходимости указывать оба прямых слагаемых, ассо- циированных с проектором, если уже известно, что он — 13*
196 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill перпендикулярный. Мы будем называть (перпендику- лярный) проектор Е на параллельно просто проек- тором на s/ii и писать Е — Р^. Теорема 1. Линейный оператор Е есть перпенди- кулярный проектор тогда и только тогда, когда Е = Е2 — Е*. Перпендикулярные проекторы являются по- ложительными линейными операторами и обладают тем свойством, что || Ех || <' || х || для всех х. Доказательство. Если Е — перпендикуляр- ный проектор, то теорема 1 § 45 и теорема § 20 показы- вают (разумеется, после обычных замен, вроде замены на а А на А*), что Е = Е*. Обратно, если Е = Е2 = = Е*, то идемпотентность Е обеспечивает, что Е есть проектор на М параллельно , где, конечно, Л1 — Л{Е) ъ {Е) — соответственно область значений и нуль- пространство оператора Е. Следовательно, нам нужно только показать, что Л1 и ,/f ортогональны. Для этой цели пусть х— любой элемент из Л1 и у— любой элемент из jfT‘, требуемый результат следует из соотношений (я. у) = {Ех, у) = {х, Е*у) = {х, Еу) = 0. Положительность оператора Е, удовлетворяющего равен- ствам Е = Е2 = Е*,. следует из соотношений {Ех, х) = {Е2х, х) = {Ex, Е*х) — {Ex, Ex') = || Ех ||2 > 0. Применяя этот результат к перпендикулярному проекто- ру 1— Е, видим, что II х ]|2 - II Ex ||2 = {х, X) - {Ех, х) = ([1 - Е] X, х) > 0, что и завершает доказательство теоремы. Для некоторых обобщений нашей теории полезно знать, что идемпотентность и последнее свойство, упомя- нутое в теореме 1, также характеризуют перпендикуляр- ные проекторы. Теорема 2. Если линейный оператор Е таков, что Е~ Е2 и || Ех || < || х || для всех х, то Е — Е*. Доказательство. Нам нужно показать, что область значений Л? и нуль-пространство оператора Е ортогональны. Пусть’х принадлежит у — Ех — х при-
§ 75] ПЕРПЕНДИКУЛЯРНЫЕ ПРОЕКТОРЫ 197 надлежит jfF, поскольку Еу — Е2х — Ех = Ех — Ех = 0. Поэтому Ех = х-\-у, причем (х, у) = 0, так что 1ИМММИМФ Н2 > 1И2. и, значит, у = 0. Следовательно, Ех = х, так что х при- надлежит этим доказано, что ‘-1- CZ ^2. Обратно, пусть z принадлежит J2, так что Ez = z. Имеем z = x--y с х из .#'-!• и у из ДР. Тогда z = Ez = Ex + Еу = Ex ~ х. (Последнее равенство основывается на том, что х принадле- жит jIF-L, а значит, и ^2.) Следовательно, z принадлежит ^’1, так что и, значит., = Нам нужен будет также тот факт, что теорема § 42 остается верной, если под словом «проектор» понимать всюду «перпендикулярный проектор». Это непосредствен- но следует из последней характеризации перпендикуляр- ных проекторов и того факта, что суммы и разности само- сопряженных операторов являются самосопряженными операторами, в то время как произведение двух самосо- пряженных операторов будет самосопряженным тогда и только тогда, когда они перестановочны. С помощью наших теперешних геометрических методов совсем нетруд- но обобщить также часть указанной теоремы, относящуюся к суммам, с двух на любое конечное число слагаемых. Обобщение наиболее удобно формулируется в терминах понятия ортогональности проекторов; мы будем говорить, что два (перпендикулярных) проектора Е и F ортого- нальны друг к другу, если EF = 0. (Рассмотрение сопря- женных операторов показывает, что это равносильно требованию, чтобы FE = 0.) Следующая теорема оправ- дывает этот геометрический язык. Теорема 3. Два перпендикулярных проектора Е = Р,л и F = Рjy* ортогональны друг к другу тог- да и только тогда, когда подпространства и иУ (т. е. области значений проекторов Е на F) ортого- нальны. Доказательство. Если EF = 0 и векторы х и у принадлежат соответственно областям значений проекто- ров Е и F, то (х, у) = (Ex, Fy) = (х, E*Fy) = (х, EFy) = 0.
198 ОРТОГОНАЛЬНОСТЬ ГЛ. Ill Обратно, если aft и ортогональны (так что то из того, что 2?ж = 0 для всех х из следует, что EFx = 0 для всех х (поскольку Fx принадлежит JfF и тем самым § 76. Комбинации перпендикулярных проекторов Теперь легко доказать теорему о сумме перпендику- лярных проекторов. Теорема 1. Если Ех, . . Ev — (перпендикуляр- ные) проекторы, то для того, чтобы Е = Ех-\- Еп было (перпендикулярным) проектором, необходимо и до- статочно, чтобы EiEj = Q при i =F j (т. е. чтобы Ei были попарно ортогональны). Д о к а з а т е л ь с т в о. Доказательство достаточно- сти условия тривиально; требует доказательства лишь его необходимость, для чего мы предположим теперь, что Е — перпендикулярный проектор. Если х принадле- жит области значений некоторого Ev то || х ||2 > || Ех ||2 = (Ех, х) = (2 EjX, ж) = = 2 {EjX, х) = 2 II EjX ||2 >\\Е,х ||2 = || х ||2, i i так что всюду должно иметь место равенство. Так как, в частности, должно выполняться равенство 2II ад2=11 ад2. то заключаем, что Е}х = 0 для всех j #= i. Другими сло- вами, каждый вектор х из области значений проектора принадлежит нуль-пространству (и, следовательно, орто- гонален к области значений) любого Ej с j =F и, исполь- зуя теорему 3 § 75, приходим к требуемому результату. Заключим наше ознакомление с проекторами беглым рассмотрением отношений порядка. Соблазнительно пи- сать Е < F для двух перпендикулярных проекторов Е = Рам и F=P^, когда Однако ранее мы пони- мали знак С в выражении, содержащем линейные опе- раторы Е и F (например, F), в том смысле, что F — Е есть положительный оператор. Существуют также другие
$ 76] КОМБИНАЦИИ ПЕРПЕНДИКУЛЯРНЫХ ПРОЕКТОРОВ 199 возможные основания считать Е меньшим, чем F: мы могли бы иметь ||Ея:||< ||Ея:|| для всех х, или FE=EF=Е (см. § 42, (II)). Ситуация разрешается следующей теоре- мой, играющей здесь роль, подобную роли теоремы 3 § 75, т. е. устанавливающей совпадение нескольких на вид различных понятий, касающихся проекторов, частью определенных алгебраически, а частью относящихся к основным геометрическим объектам. Теорема 2. Для перпендикулярных проекторов Е = Р и F — Рjy* следующие условия равносильны: (I) E^F. (II) || Ех || < II Fx || для всех х. (Ill) MCZ.JT. (IVa) FE — E. (IVb) EF = E. Доказательство. Мы докажем импликации (I) => (II) => (III) =» (IVa) =Ф (IVb) => (I). (I) =Ф (II). Если Е<Е, то, для всех х, О < ([Е — Е] х, х) = (Fx, х) — (Ex, х) = || Fx ||2 — || Ех ||2 (поскольку Е я. F — перпендикулярные проекторы). (II) =Ф(Ш). Предположим, что ||Ея:||< || Ея:|| для всех х. Возьмем теперь любое х из М', тогда || яг|] > || Еяг|| >|| Еяг| = ||| я:||, так что || Ея: || = || я: ||, или (х, х) — (Fx, х) = 0, откуда ([1-Е] х, х) = || (1-Е) я:||2 = 0, и, следовательно, x = Fx. Другими словами, принадлеж- ность х подпространству влечет принадлежность х подпространству , что и требовалось. (III) => (IVa). Если alt CZ ЛГ, то Ех принадлежит JF для всех х, так что FEx = Ех для всех х, что и требовалось. То, что (IVa) влечет (IVb) и даже равносильно ему, доказывается переходом к сопряженным операторам. (IV) =Ф (I). Если EF = FE = Е, то, для всех х, (Fx, х) — (Ex, х) = (Fx, х) — (FEx, х) = (Е [1 — Е] х, х). Поскольку Е и Е — перестановочные проекторы, то же верно для 1 — Е и Е, и, значит, G = F (1 — Е) есть
200 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill проектор. Следовательно, (Fx, х} — (Ex, х) = (Gx, х) = || Gx ||2 > 0, и теорема 2 полностью доказана. В терминах введенных к настоящему моменту понятий можно дать следующую интуитивно звучащую формули- ровку теоремы § 42 (поскольку она применяется к пер- пендикулярным проекторам). Если Е и F — два перпен- дикулярных проектора, то их сумма, произведение или разность также является перпендикулярным проектором тогда и только тогда, когда F соответственно ортогонально к Е, перестановочно с Е или больше, чем Е. Упражнения 1. а) Привести пример не перпендикулярного проектора. Ь) Привести пример двух проекторов Е и F (они не могут быть оба перпендикулярными), таких, что EF = 0, a FE=pO. 2. Найти (перпендикулярную) проекцию вектора (1, 1, 1) на одномерное подпространство пространства g3, порожденное векто- ром (1, —1, 1). (Другими словами, найти образ данного вектора относительно проектора на данное подпространство.) 3. Найти матрицы всех перпендикулярных проекторов в ^2. 4. Пусть U — 2E — 1; для того, чтобы U был инволютивной изометрией, необходимо и достаточно, чтобы Е был перпендикуляр- ным проектором. 5. Линейный оператор U называется частично изометрическим, если существует такое подпространство а№, что ||17ж =||ж;|, когда х принадлежит М, и Ux = Q, когда х принадлежит <Ж L. а) Оператор, сопряженный к частично изометрическому, яв- ляется частично изометрическим. Ь) Если U — частично изометрический оператор и М — такое подпространство, что || Ux || = 1| х |. или 0 соответственно тому, при- надлежит ли х ему или его ортогональному дополнению то U* V есть перпендикулярный проектор па а/И,. с) Каждое из следующих четырех условий необходимо и доста- точно для частичной изометричности линейного оператора U'. (1) UU*U = U, (II) U* U есть проектор, (III) U*UU*= U*, (IV) UU* есть проектор. d) Если X есть собственное значение частично изометрического оператора, то | А. |< 1. е) Привести пример частично изометрического оператора, имею- 1 щего собственное значение, равное у 6. Пусть М — подпространство конечномерного векторного пространства Т3 со скалярным произведением и 4 — линейный
5 77] КОМПЛЕКСИФИКАЦИЯ 201 оператор на Т3. Доказать, что если dim М < dim <М^~, то на Т3 существуют линейные операторы В и С такие, что Ах = (ВС — СВ)х для всех х из М. (Указание: пусть В — частично изометрический оператор, такой, что .|Bz| = ,|zi или 0, смотря по тому, принадле- жит ли х подпространству <М или <М^-, и 31 (В)а<МД-.) § 77. Комплексификация В нескольких последних параграфах мы изучали веще- ственные и комплексные векторные пространства одно- временно. Иногда это невозможно: система комплексных чисел богаче системы вещественных. Имеются теоремы, справедливые и для вещественного и для комплексного пространств, но доказательство которых гораздо легче в комплексном случае, и имеются теоремы, справедливые для комплексных пространств и несправедливые для вещественных. (Примером последнего рода теорем может служить утверждение, что каждый линейный оператор на конечномерном пространстве имеет собственное значе- ние.) По этим причинам часто бывает удобным «комплек- сифицировать» вещественное векторное пространство, т. е. ассоциировать с ним комплексное векторное простран- ство с существенно теми же свойствами. Цель этого пара- графа — описать -такой процесс комплексификации. Йусть ТГ — вещественное векторное пространство и У’—множество всех упорядоченных пар (х, г/) элемен- тов х и у из У*. Определим сумму двух элементов из формулой <31, у2') = {х1 + х2, У! + у2}, а произведение элемента из на комплексное число а + ф (а и р вещественны, £ = ]/ — 1) формулой (а-Ц г'0) (яг, у} = {ах-$у, $х + ау). (Чтобы запомнить эти формулы, представьте себе, что {х, у) означает x+iy.) Йрямое и не слишком трудо- емкое вычисление показывает, что множество Т”’ при так определенных линейных операциях становится ком- плексным векторным пространством. Множество тех элементов (х, у) из У**, для которых у = 0, находится в естественном взаимно однозначном соответствии с пространством Т. Будучи комплексным
202 ОРТОГОНАЛЬНОСТЬ ГЛ. Ill векторным пространством, У* может также рассматри- ваться как вещественное векторное пространство; если отождествить каждый элемент г из Г с его дубликатом {х, 0) в У+ (а сделать так чрезвычайно удобно), то можно сказать, что (как вещественное векторное простран- ство) содержит У. Поскольку (0, у) = Цу, 0), так что (х, у') = = (х, 0)-\-i{y, 0), наше отождествительное соглашение позволяет нам сказать, что каждый вектор из У+ имеет вид х + iy с х и у из У. Так как У и гУ (где гУ означает множество всех элементов (а:, у} из У+ с х = 0) являются подпространствами пространства У+ с единственным об- щим вектором 0 (т. е. (0, 0)), то отсюда следует, что представление вектора из У+ в виде х iy (с х и у из У) единственно. Таким образом, мы построили комплексное векторное пространство У+, обладающее тем свойством, что, рассматриваемое как вещественное пространство, оно содержит У как подпространство, причем является прямой суммой У и гУ. (Здесь гУ означает множество всех тех элементов из У+, которые имеют вид iy с некоторым у из У.) Мы будем называть У* комплексифизщцией про- странства У. Если {xlf .. ., хп} — линейно независимое множество в У (вещественные коэффициенты), то .оно также — ли- нейно независимое множество в У+ (комплексные коэф- фициенты). Действительно, если av ..., а.и Рх, ..., Рп — такие вещественные числа, что 3 (a^ + i0 ) x.j = 0, то з (3 + i(2 Р,^) = 0 и, следовательно, единствен- з з ность представления векторов из У* с помощью векторов из У влечет равенства = 2 р?а:;- = 0; требуемый з з результат вытекает теперь из предположенной (веще- ственной) линейной независимости множества {xj, .. ., хп) в У. Более того, если {хг, ..., хп} — базис в У (веществен- ные коэффициенты), то {а:,, ..., хг} есть также базис в У+ (комплексные коэффициенты). Действительно, для любых векторов х тау из У существуют такие вещественные чис- ла ar, ..., an, рп ..., Рп, что аЛ и У = 2Рл; з з отсюда x+iy = '^i(aj + i^j)xj, так что {хг, .. ., хп}
$ 77) КОМПЛЕКСИФИКАЦИЯ 203 порождает У+. Эти результаты показывают, что комплекс- ное векторное пространство имеет ту же размерность, что и вещественное векторное пространство 5^. Имеется естественный способ распространения любого линейного оператора А, действующего на ТС, до линейного оператора на ТС*'. полагаем А+ (х + iy) = Ах + iAy, каковы бы ни были х и у из (Проверка того, что А* — действительно линейный оператор на '^+, шаблонна.) Подобное же распространение годится для линейных и даже полилинейных функционалов. Например, если w — (вещественный) билинейный функционал на У, то его рас- пространением на V служит (комплексный) билинейный функционал, определяемый формулой (xj + iyY, Х2+ iy2) = = w(xlt хг) - w (ylt y2) + i (w (xv y2) + w (ylt x2)). При этом, если w — знакопеременная форма, то и — знакопеременная форма. Действительно, вещественной и мнимой частями щ+(хЦ-гг/, х-|-гу) являются соответ- ственно w (х, x) — w(y, у) и w (х, y)-\-w(y, х); если форма w знакопеременна, то она кососимметрична (тео- рема 1 § 30) и потому щ+ знакопеременна. Такое же доказательство устанавливает соответствующий резуль- тат и для /с-линейных функционалов, при всех значениях к. Отсюда и из определения определителей следует, что detA = detA+ для каждого линейного оператора А на У. Метод распространения билинейных функционалов годится и для сопряженных билинейных функционалов. А именно, если У* есть (вещественное) пространство со ска- лярным произведением, то имеется естественный способ введения (комплексного) скалярного произведения в У+: полагаем по определению (xj + iyr, х2 + iy2) = (х1( х2) + (t/1f у2) - i ((хх, у2) - (7/lt х2)). Заметим, что если х и у — ортогональные векторы из У*, то II х+ iy II2 = II Х||’ + II l/||a.
204 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill Соответствие А —сохраняет все алгебраические свойства операторов. Так, если В = аА (с веществен- ным а), то В' = аА'; если С = А-‘ГВ, то С* = А* + В*', и если С = АВ, то С* = А'В*. Более того, если 5^ — пространство со скалярным произведением и В = А*, то В* = (А*)*. (Доказательство: вычислить скалярные произ- ведения (Л+ (xt + iyj, (x2+iy2)) и (x1+iyl, В* (x2+iy2)).) Если А — линейный оператор на F и Л* имеет соб- ственный вектор х + iy с собственным значением а + г'0 (где х и у — векторы из Г, а а и Р — вещественные числа), так что Ах = ах — |3г/, Лг/ = Ра: + аг/, то подпространство в Т’, натянутое на векторы х и у, инвариантно относительно А. (Поскольку каждый линей- ный оператор на комплексном векторном пространстве имеет собственный вектор, заключаем, что каждый линей- ный оператор на вещественном векторном пространстве оставляет инвариантным подпространство размерности 1 или 2.) Если, в частности, случится, что А* имеет веще- ственное собственное значение (т. е. [3 = 0), то А имеет то же самое собственное значение (поскольку Ах = ах, Ау — ау и оба вектора х и у не могут обра- титься в нуль). Мы уже видели, что каждый (вещественный) базис в ТА есть в то же время (комплексный) базис в ТА*. Отсюда следует, что матрица линейного оператора А, действую- щего на ТА, в некотором базисе ЯТ пространства ТА совпа- дает с матрицей оператора Л+ (на ТА*} в том же базисе ТА в ТА*. Это замечание лежит в основе всей теории комплек- сификации; наивная точка зрения состоит в том, что веще- ственные матрицы составляют частный случай комплекс- ных. Упражнения 1. Что будет, если процесс комплексификации, описанный в § 77, применить к векторному пространству, уже являющемуся комплексным? 2. Доказать, что между комплексификациями, описанными в § 77 и в упражнении 5 § 25, существует однозначно определен-
§ 78] ХАРАКТЕРИЗАЦИЯ СПЕКТРА 205 ный изоморфизм, обладающий тем свойством, что каждый «веще- ственный» вектор (т. е. каждый вектор исходного вещественного векторного пространства) соответствует самому себе. 3. а) Какова комплексификация пространства J?1? Ь) Если 'Х3 —п-мерное вещественное векторное пространство, то какова размерность его комплексификации Vй*, рассматри- ваемой как вещественное векторное пространство? 4. Пусть -V* —комплексное пространство со скалярным про- изведением, полученное путем комплексификации вещественного пространства со скалярным произведением. а) Доказать, что если A (x^-iy) =х — iy для любых х и у из Т3, то Л—линейный оператор на рассматриваемом как вещественное векторное пространство. Ь) Будет ли А самосопряженным? Изометрическим? Идем- потентным? Инволютивным? с) А если рассматривать т/,+ как комплексное пространство? 5. Исследовать связь между сопряженностью и комплек- сификацией и, в частности, связь между сопряженным к ли- нейному оператору на вещественном векторном пространстве и сопряженным к комплексификации того же оператора. 6. Если А — линейный оператор на вещественном векторном пространстве 7-'э и подпространство М комплексификации ЧА1* по- следнего инвариантно относительно то Г) ‘X3 инвариантно относительно А. § 78. Характеризация спектра Следующие результаты более, чем все рассмотренное до сих пор, подкрепляют аналогию между числами и опе- раторами; в них утверждается, что свойства, побудившие выделить рассматривавшиеся нами специальные классы операторов, отражаются на спектрах операторов этих классов. Теорема 1. Если А — самосопряженный оператор на пространстве со скалярным произведением, то каждое собственное значение этого оператора вещественно; если А положителен или строго положителен, то каждое его собственное значение соответственно положительно или строго положительно. Доказательство. Тривиальность первого утверждения в вещественном случае можно игнорировать; одно и то же доказательство годится для обоснования обоих утверждений и в вещественном, и в комплексном случае. Действительно, если Ах = Хх , где х =£ 0, то (Ах, х)_X (х. х) _, II г № ~ II* II2 — ’
206 ОРТОГОНАЛЬНОСТЬ [ГЛ. ш следовательно, если (Ах, х) вещественно (см. теорему 4 § 71), то и X вещественно, и если (Ах, х) положительно (или строго положительно), то и X положительно (или строго положительно). Теорема 2. Все корни характеристического урав- нения самосопряженного оператора на конечномерном пространстве со скалярным произведением вещественны. Доказательство. В комплексном случае кор- ни характеристического уравнения совпадают с собст- венными значениями, так что утверждаемый результат следует из теоремы 1. Если А — симметричный оператор на евклидовом пространстве, то его комплексификация А* есть эрмитов оператор, и наш результат следует из того, что А и А* имеют одно и то же характеристическое урав- нение. Заметим, что из теоремы 2 непосредственно следует, что самосопряженный оператор на конечномерном про- странстве со скалярным произведением всегда имеет соб- ственное значение. Теорема 3. Каждое собственное значение изомет- рии равно по абсолютной величине единице. Доказательство. Если U — изометрия и Ux — kx, где х Ф 0, то || х || = || Ux || = | X | • || х ][. Теорема 4. Если U — самосопряженный либо изо- метрический оператор, то его собственные векторы, соответствующие различным собственным значениям, ортогональны. Доказательство. Пусть Ахг = Х.^, Ах2 = = Х2х2 и Xj^= Х2. Если А — самосопряженный оператор, то (^т> ^2) = (Ах±, х2) — (xlt Ла:2) = Х2 (х^, х^). (1) (В среднем шаге используется самосопряженность опера- тора А, а в последнем — вещественность Х2.) В случае, когда А — изометрия, (1) заменяется на (*^i, ^2) (Ах1г Ах2) (х^, х2), (2) напомним, что здесь Х2 = -т— . В обоих случаях (х., х2) Ф О А» влекло бы Х! = Х2, так что мы должны иметь (xlf х2) = 0.
§ 78) ХАРАКТЕРИЗАЦИЯ СПЕКТРА 207 Теорема 5. Если подпространство <М конечно- мерного пространства со скалярным произведением ин- вариантно относительно изометрии U, то и е/ИА- инва- риантно относительно U. Доказательство. Рассматриваемый на ко- нечномерном подпространстве аЛ1 оператор U по-прежнему является изометрией и, следовательно, обратим. Отсюда вытекает, что каждое х из а# может быть записано в виде х= Uy с у из а#; другими словами, если х принадлежит ait и у = U'vx, то у принадлежит Значит, инвариантно относительно U~X = U*. Из теоремы 2 § 45 вытекает, что тогда инвариантно относительно (tZ*)* = U. Заметим, что тот же результат для самосопряженных операторов (даже на необязательно конечномерных про- странствах) тривиален, поскольку инвариантность ail от- носительно А влечет инвариантность &/1^ относительно А* = А. Теорема 6. Если А — самосопряженный оператор на конечномерном пространстве со скалярным произведе- нием, то алгебраическая кратность каждого собственного значения Хо этого оператора равна геометрической крат- ности, т. е. размерности подпространства <М всех реше- ний уравнения Ах = Хох. Доказательство. Ясно, что a/ft, а значит и a/fl^~, инвариантно относительно А; обозначим через В и С линейный оператор А, рассматриваемый соответственно только на и а#-1-. Имеем det (А — X) = det (В — X) • det (С — X) для всех X. Так как В — самосопряженный оператор на конечномерном пространстве, имеющий единственное соб- ственное значение, а именно Хо, то Хо должно иметь как собственное значение оператора В алгебраическую крат- ность, равную размерности подпространства <М. Если т — эта размерность, то det (5 —X) = (Хо —X)m. С дру- гой стороны, поскольку Хо не является уже собственным значением оператора С и, следовательно, det (С — Хо) =£ 0, мы видим, что det (А — X) содержит Хо — X сомножите- лем точно т раз, что и требовалось доказать.
208 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill Это доказательство основывалось на инвариантности подпространства и том факте, что каждый корень характеристического уравнения оператора А является собственным значением этого оператора. Последнее утвер- ждение верно для любого линейного оператора на унитар- ном пространстве; следующий результат есть следствие этих замечаний и теоремы 5. Теорема 7. Алгебраическая, кратность каждого собственного значения унитарного оператора на конечно- мерном унитарном пространстве равна геометрической кратности. У пр ажнения 1. Привести пример линейного оператора с двумя неортого- нальными собственными векторами, принадлежащими различным собственным значениям. 2. Привести пример неположительного линейного оператора (на конечномерном унитарном пространстве), все собственные зна- чения которого положительны. 3. а) Если А — самосопряженный оператор, то det А веще- ственно. Ь) Если А —унитарный оператор, то | det А 1 = 1. с) Что можно сказать об определителе частично изометрического оператора? § 79. Спектральная теорема Теперь мы подготовлены к доказательству основной теоремы этой книги, теоремы, непосредственными след- ствиями которой являются многие другие результаты на- стоящей главы. Всё, что мы делали до сих пор, представ- ляло до некоторой степени спортивный интерес (способ- ствуя, однако, обобщениям); мы хотели показать, как много полезного можно извлечь из спектральной тео- рии, не доказывая спектральной теоремы. Между прочим, в комплексном случае спектральную теорему можно полу- чить из уже описанного нами процесса триангулизации; учитывая важность этой теоремы, мы предпочитаем при- вести ниже ее (совсем легкое) прямое доказательство. Читателю, быть может, было бы полезно применить метод доказательства (не результат) теоремы 2 § 56, чтобы до- казать то, что он сможет, из спектральной теоремы и ее следствий.
§ 79] СПЕКТРАЛЬНАЯ ТЕОРЕМА 209 Теорема 1. Каждому самосопряженному линей- ному оператору А на конечномерном пространстве со скалярным произведением соответствуют такие вещест- венные числа а15 ..., аг и перпендикулярные проекторы Ег, Ег (где г — строго положительное целое, не пре- восходящее размерности пространства), что 1) а; попарно различны, 2) Ej взаимно ортогональны и отличны от 0, з) S^ = i. j 4) 2 a,Ej — А. i Доказательство. Пусть а,, аг— различ- ные собственные значения оператора А и Ej — перпенди- кулярный проектор на подпространство, состоящее из всех решений уравнения Ах = а3х (j = 1, г). Усло- вие 1) тогда выполнено по определению; вещественность всех а следует из теоремы 1 § 78. Условие 2) вытекает из теоремы 4 § 78. Из ортогональности проекторов Ej заклю- чаем, что Е = 2 Ej есть перпендикулярный проектор. з Размерность области значений этого проектора равна сумме размерностей областей значений проекторов Ej и, следовательно, по теореме 6 § 78, равна размерности всего пространства; это дает 3). (Другое доказательство: если Е Ф 1, то А, рассматриваемое на области значений проектора 1 — 2?, было бы самосопряженным оператором, не имеющим ни одного собственного значения.) Чтобы доказать 4), возьмем любой вектор х и положим Xj = EjX', тогда Axj — UjXj, откуда Ах = А ( 2 Ejx) = 2^ж; = азхз = 2 ajEjX. з ззз Тем самым спектральная теорема полностью доказана. Представление А = 2 ajEj (где скаляры а и проек- з торы Е удовлетворяют условиям 1)—3) теоремы 1) назы- вается спектральным разложением оператора А; основ- ная цель следующего результата — доказательство един- ственности спектрального разложения. 14 П. Халмош
210 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill Теорема 2. Если У, ajEj — спектральное разложе- j=i ние самосопряженного оператора А на конечномерном пространстве со скалярным произведением, то коэффи- циенты а — это все различные собственные значения опе- ратора А. Далее, существуют полиномы ph (!<&<?•) с вещественными коэффициентами такие, что ph (щ) = 0 при j Ф к и pk(ak) = 1; для каждого такого полинома pk(A) — Eh. Доказательство. Поскольку Ej ф 0, суще- ствует вектор хфО, принадлежащий области значений этого проектора. Так как Ejx = x и Е,х = 0 для всех 1ф], то Ах — У фЕф = a-E-jX = ape, i так что каждое является собственным значением опе- ратора А. Обратно, если к — какое-нибудь собственное значение оператора А, скажем, Ах = кх с х Ф 0, то, положив х,--Е\х, видим, что Ах = кх = к У Xj з и Ах = А У Xj = У ajXj, 3 3 так что У (к — щ) Xj = 0. Поскольку векторы взаимно з ортогональны, те из них, которые отличны от нуля, образуют линейно независимое множество. Отсюда сле- дует, что, для каждого /, либо Xj — 0, либо к = ctj. По- скольку х Ф 0, мы должны иметь Xj Ф 0 для некоторого /, и, значит, к действительно равно одному из коэффици- ентов а. Поскольку ElEj = 0 при i Ф j, a Е2 = Ej, имеем Л2 = (У «iEj (У ajEj) = У У амЕЛ = У а;%. i 3 г j j Аналогично Ап = У a^Ej 3
СПЕКТРАЛЬНАЯ ТЕОРЕМА 211 § 19] для каждого положительного целого п (в случае п = О использовать 3)), откуда Р И) = 2 Р («з) Ej з для каждого полинома р. Для завершения доказательства теоремы остается только указать (вещественный) поли- ном ph, для которого бы pk (oj) = 0 при всех j Ф к и Pk (аь) == 1 • Этими свойствами обладает полином 3¥* г Теорем аЗ. Если У, a.jEj — спектральное разложе- э=1 ние самосопряженного оператора А на конечномерном про- странстве со скалярным произведением, то линейный опера- тор В перестановочен с А тогда и только тогда, когда он перестановочен с каждым из проекторов Ej. Доказательство. Достаточность условия оче- видна: если А — У ajEj и EjB = BEj для всех /, то АВ — з = В А. Необходимость следует из теоремы 2: если В пере- становочен с А, то В перестановочен с каждым полиномом от А, а потому В перестановочен с каждым Ej. Прежде чем продолжить эксплуатацию спектральной теоремы, сделаем замечание относительно матричной ин- терпретации этой теоремы. Если в области значений каж- дого Ej выбрать ортонормальный базис, то совокупность векторов этих частичных базисов составит базис всего пространства; выраженная в этом базисе матрица опера- тора А будет диагональной. Тот факт, что при надлежа- щем выборе ортонормального базиса матрица самосопря- женного оператора может быть сделана диагональной, или, равносильно этому, что любая самосопряженная матрица может быть изометрично преобразована (т. е. заменена на [J7]’1 [Л ] [[/], где U — изометрия) в диагональную матрицу, следует уже (в комплексном случае) из теории треугольной формы. Мы дали алгебраический вариант по двум причинам. Во-первых, именно он легко обобщает- ся на бесконечномерный случай, и, во-вторых, даже 14*
212 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill в конечномерном случае запись 2 ajEj часто имеет боль- i шие формальные и типографские преимущества перед за- писью в матричном виде. Мы будем использовать тот факт, что, не обязательно самосопряженный, оператор А изометрично диагонали- зируем (т. е. имеет в надлежащем ортонормальном базисе диагональную матрицу) тогда и только тогда, когда для него выполнены условия 1)—4) теоремы 1. Действительно, если выполнены эти условия, то доказательство диагона- лизируемости, данное для самосопряженных операторов, применимо; обратное предоставляем в качестве упражне- ния читателю. Упражнения 1. Пусть А — линейный оператор на комплексном пространстве со скалярным произведением. Доказать, что если А — эрмитов, то линейные сомножители его минимального полинома различны. Верно ли обратное? 2. а) Линейные операторы Л и В на унитарном пространстве называют унитарно эквивалентными, если существует унитарный оператор U такой, что A — IJ^BU. (Соответствующее понятие в вещественном случае называют ортогональной эквивалентностью.) Доказать, что унитарная эквивалентность есть отношение экви- валентности. Ъ) Всегда ли А*А и АА* унитарно эквивалентны? с) Всегда ли Л и Л* унитарно эквивалентны? 3. Какие из следующих пар матриц унитарно эквивалентны? /01 0\ /—1 о о\ с) I —10 0 1 и I 0 i 0 I . \ 0 0 —1/ \ 0 0 ij /01 0\ /О 1 0\ d) I —10 0 I и I 1 0 0 I . \ 0 0 — 1/ \0 О 1/
§ 80] НОРМАЛЬНЫЕ ОПЕРАТОРЫ 213 4. Если два линейных оператора унитарно эквивалентны, то они подобны и конгруентны; если два линейных оператора подобны или конгруентны, то они эквивалентны. Показать на примерах, что это — единственные отношения импликации, связывающие указанные понятия. § 80. Нормальные операторы Наиболее легкие (и вместе с тем полезные) обобщения спектральной теоремы относятся к комплексным про- странствам со скалярным произведением (т. е. унитарным пространствам). Чтобы избежать ненужных усложнений, исключим в этом параграфе вещественный случай и сосредоточим внимание на одних унитарных простран- ствах. Мы уже видели, что каждый эрмитов оператор диаго- нализируем и что любой оператор А может быть записан в виде В + 1С, где В и С эрмитовы; почему нельзя было бы диагонализировать А, диагонализируя по отдельности В и С? Разумеется, ответ состоит в том, что диагонализация включает выбор надлежащего ортонормального бдзиса, и нет оснований ожидать, что базис, диагонализирую- щий В, будет давать тот же эффект и для С. Весьма важно знать точно весь класс операторов, для которых спра- ведлива спектральная теорема, и, к счастью, этот класс легко описать. Мы будем называть линейный оператор А нормальным, если он перестановочен со своим сопряженным, А*А — = АА*. (Это определение имеет смысл и используется и в вещественных и в комплексных пространствах со ска- лярным произведением; однако мы будем продолжать пользоваться техникой, неразрывно связанной с комплекс- ным случаем.) Покажем сначала, что А нормален тогда и только тогда, когда его вещественная и мнимая части перестановочны. Действительно, пусть А нормален и j А — В 4- iC, где 2? и С эрмитовы; поскольку В = — (А + Л*) и С = -^- (Л — Л*), ясно, что тогда ВС = СВ.Обрат- но, если ВС = СВ, то из соотношений Л = В + 1С и Л* = В — iC следует, что Л нормален. Заметим, что эрмитовы и унитарные операторы нормальны.
214 ОРТОГОНАЛЬНОСТЬ [ГЛ. JII Класс операторов, обладающих спектральным разло- жением в смысле § 79, есть не что иное как класс нормаль- ных операторов. Половина этого утверждения легко дока- зывается: если А = J щЕ,, то А* = 2 UjEj, и простое i i вычисление показывает, что = АА* = V | а3-12 Ej. i Для доказательства обратного, т. е. того, что нормальность влечет существование спектрального разложения, имеют- ся две возможности. Мы могли бы получить этот резуль- тат из спектральной теоремы для эрмитовых операторов, используя вещественную и мнимую части оператора, или мы могли бы доказать, что основные подготовительные результаты § 78, на которые опирается доказательство для эрмитова случая, в такой же мере верны и для произ- вольных нормальных операторов. Из-за некоторого ин- тереса, который представляют его методы, мы выберем второй путь. Заметим, что техника, необходимая для доказательства нижеследующих теорем, имелась в нашем распоряжении уже в § 78, так что можно было бы уста- новить спектральную теорему сразу для нормальных операторов; мы пошли другим путем главным образом затем, чтобы мотивировать определение нормальности. Теорема 1. Если А — нормальный оператор, то х будет его собственным вектором тогда и только тогда, когда он является собственным вектором сопряженного оператора А*', если Ах — Кх, то А*х = \х. Доказательство. Заметим, что из нормаль- ности оператора А следует, что || Ах ||2 = (Ах, Ах) = (А*Ах, х) = (АА*х, х) = = (А*х, А*х) = || А*х ||2. Поскольку оператор А — X нормален одновременно с А и (А — X)* = А* —X, получаем соотношение || Ах — Хж || = || А*х — Хх ||, из которого сразу следуют утверждения теоремы. Теорема 2. Если А нормален, то собственные векторы, соответствующие различным собственным зна- чениям, ортогональны,.
§ 80] НОРМАЛЬНЫЕ ОПЕРАТОРЫ 215 Доказательство, Если Ах1 = Х1х1 и Ахг = = А2х2, то Ах (хх, х2) = (Axlt х2) = (xlt А*х2) = А2 (xlt х2). Эта теорема обобщает теорему 4 § 78. При доказатель- стве спектральной теоремы для эрмитовых операторов нам понадобились также теоремы 5 и 6 § 78. Следующий ре- зультат заменяет первую из них. Теорема 3. Если А —нормальный оператор, А — его собственное значение и <М — множество всех ре- шений уравнения Ах = кх, то как М, так и инвариант- но относительно А. Доказательство. То, что инвариантно относительно А, мы видели уже раньше; нормальность А не играет здесь никакой роли. Для доказательства того, что а#-1- также инвариантно относительно А, достаточно показать, что At инвариантно относительно. А*. Это не- трудно: если х принадлежит AL, то А (А*х) = А* (Аг) = А (А*х), так что и А*х принадлежит аЖ. Эта теорема гораздо слабее соответствующей теоремы § 78. Однако важно заметить, что доказательство теоремы 6 § 78 опиралось только на соответственно ослабленный вариант теоремы 5; единственные подпространства, кото- рые нам нужно рассматривать, это подпространства того типа, с какими имеет дело наша последняя теорема 3. На этом заканчивается подготовительная работа; спектральная теорема для нормальных операторов полу- чается теперь совершенно так же, как ранее для эрмитова случая. Если в теоремах § 79 заменить слово «самосопря- женный» на «нормальный», убрать все ссылки на веще- ственность и потребовать комплексности рассматриваемого пространства со скалярным произведением, то оставшиеся части утверждений и все доказательства останутся теми же самыми. Именно теория нормальных операторов представляет главный интерес при изучении унитарных пространств. Одним из наиболее полезных свойств нормальных опе- раторов является то, что спектральные условия типа
216 ОРТОГОНАЛЬНОСТЬ [ГЛ. ш установленных в теоремах 1 и 3 § 78 необходимых усло- вий самосопряженности, положительности и изометрич- ности оператора, оказываются в случае нормальных опера- торов также достаточными. Теорема 4. Нормальный оператор на конечно- мерном унитарном пространстве является 1) эрмитовым, 2) положительным, 3) строго положительным, 4) унитар- ным, 5) обратимым, 6) идемпотентным тогда и только тогда, когда все его собственные значения 1') вещественны, 2') положительны, 3') строго положительны, 4') равны по абсолютной величине единице, 5') отличны от нуля, 6') равны нулю или единице. Доказательство. То, что 1), 2), 3) и 4) влекут соответственно Г), 2'), 3') и 4'), следует из §78. Если Л обратим и Ах~Кх с х =# 0, то х — А~1Ах = ХА ~гх и потому Л Ф 0; этим доказано, что 5) влечет 5'). Если А идемпотентен и Ах = 1.x с х -=р 0, то 'кх = Ах=^А2х = ~7Ах, так что (А — А2)а: = 0 и потому А = А2; этим" до- казано, что 6) влечет 6'). Заметим, что эти доказательства верны для произвольного пространства со скалярным произведением (даже не обязательно конечномерного) и что добавочное предположение нормальности операто- ра А также излишне. Предположим теперь,‘что А имеет спектральное раз- ложение 2 Поскольку А* = мы видим, что i i 1') влечет 1). Поскольку (Ах, х) = У а, (Е^х, х) = J а,- || Е,х ||2, з i заключаем, что 2') влечет 2). Если а7 > 0 для всех / и (Ах, х) — 0, то мы должны иметь EjX — О для всех j и потому х = 2 EjX = 0; этим доказано, что 3') влечет 3). з Импликация 4') =£ 4) вытекает из соотношения ИМ = 3 | а. |2Е3, Если а7 Ф 0 для всех /, то можно образовать линей- 1 ный оператор 2? = — Еу ; поскольку = = 1) j 7
§ 80] НОРМАЛЬНЫЕ ОПЕРАТОРЫ 217 заключаем, что 5') влечет 5). Наконец, Л2 = 2а^-Ё,Д отсюда заключаем, что 6') влечет 6). Отметим, что импликациями 5)=^5'), 2)=>2') и 3')=>3) в совокупности выполнено обещание, данное в § 72: если оператор А положителен и обратим, то он строго поло- жителен. Упражнения 1. Привести пример нормального оператора, не являющегося ни эрмитовым, ни унитарным. 2. а) Если А— произвольный линейный оператор (на конечно- мерном унитарном пространстве), а а и 0 — комплексные числа, для которых |а| = ||}| = 1, то аЛ-|-рЛ*— нормальный оператор. Ь) Если || Лх|| = || А *х || для всех х, то А—нормальный опе- ратор. с) Всегда ли сумма двух нормальных операторов является нор- мальным оператором? 3. Если А — нормальный оператор на конечномерном унитар- ном пространстве и — подпространство, инвариантное относитель- но А, то сужение А на <М также является нормальным оператором. 4. Линейный оператор А на конечномерном унитарном про- странстве нормален тогда и только тогда, когда АеМ СТ М влечет AeM^-deAl^-, каково бы ни было подпространство <М простран- ства 7/л. 5. а) Идемпотентный нормальный оператор самосопряжен. Ь) Нильпотентный нормальный оператор равен нулю. с) Нормальный оператор А, для которого Л3=Л2, идемпотен- тен. Останется ли верным заключение, если опустить предположе- ние нормальности? d) Если Л самосопряжен Hdfe = l для некоторого строго поло- жительного целого к, то Л2 = 1. 6. Пусть Л и В— нормальные операторы и ЛВ = 0; следует ли отсюда, что 7?Л—О? 7. Пусть %i, ..., — собственные значения линейного операто- ра Л на n-мерном унитарном пространстве (взятые каждое столько раз, какова его алгебраическая кратность). Доказать, что 2 IM2<tr (Л*Л) г и что Л нормален тогда и только тогда, когда имеет место равенство. 8. Числовой областью значений линейного оператора Л на ко- нечномерном унитарном пространстве назовем множество W (Л) всех комплексных чисел вида (Ах, х) с ||х|| = 1. а) Если Л нормален, то W (Л) выпукло. (Это означает, что если | и т] принадлежат W (Л) и0<а<1, то также «$-|-(1—а) ц при- надлежит W (Л).)
218 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill b) Если А —нормальный оператор, то каждая экстремальная точка множества W (А) является собственным значением этого опера- тора. (Экстремальная точка — это точка, не представимая в виде а^ + (1 — а)1! ни для каких g и т] из ТЕ (А) и а, заключенных строго между 0 и 1.) с) Известно, что заключение пункта а) остается верным, если даже не предполагать нормальности. Этот факт можно выразить следующим образом: если А! и А2—эрмитовы операторы, то множе- ство всех точек вида ((AiX, х), (Агх, х)) в вещественной координат- ной плоскости (с || я || = 1) выпукло. Показать, что обобщение этого утверждения на более чем два эрмитовых оператора неверно. d) Доказать, что для операторов, не являющихся нормаль- ными, заключение пункта Ь) может быть неверным. § 81. Ортогональные операторы Поскольку унитарный оператор на унитарном про- странстве нормален, результаты предыдущего параграфа включают теорию унитарных операторов как частный случай. Так как, однако, ортогональный оператор на веще- ственном пространстве со скалярным произведением может вовсе не иметь собственных значений, то спек- тральная теорема, в том виде, как мы пока ее знаем, не дает нам никакой информации об ортогональных операторах. Но добраться до фактов нетрудно; теория ком- плексификации и сделана на заказ для этой цели. Пусть U— ортогональный оператор на конечномер- ном вещественном пространстве 5^ со скалярным произве- дением и С7+ - распространение оператора U на комплекси- фикацию У* пространства бУ'. Из того, что U*U = 1 (на ^), следует, что (Z7+)*t7+ = 1 (на Т^+), т. е. U* — унитар- ный оператор. Пусть X = а + ф — комплексное число (аир веще- ственны) и М — подпространство, состоящее из всех решений уравнения ?7+z = Xz в пространстве 'Х"+. (Если X не является собственным значением оператора С7+, то ®$ = 0.) Пусть z — элемент из а#; запишем его в виде z = х-|- iy, где х л у принадлежат Т‘. Уравнение Ux + iUy = (a+ifr) (x+iy) влечет (см. § 77), U х = ах — fry и Uy = (kr + ay.
§ 81] ОРТОГОНАЛЬНЫЕ ОПЕРАТОРЫ 219 Если мы умножим второе из этих двух уравнений на I и затем вычтем результат из первого, то получим Ux — iUy = (а — i0) (х — iy). Это означает, что Z7+z = Az, где образным и удобным символом z обозначен, конечно, вектор х— iy. Поскольку рассуждение (т. е. переход от U*z = Kz к U*z~\z) обратимо; мы доказали, что отображение z—»z является взаимно однозначным соответствием между и подпро- странством <М, состоящим из всех решений z уравнения ?7+z = Az. Из этого результата следует, среди прочего, что комплексные собственные значения, оператора U* встречаются парами: если К — собственное значение, то и А. —тоже. (Одно это замечание можно было бы быстрее вывести из того факта, что коэффициенты характеристического полинома оператора Е/+ вещест- венны.) Мы еще не использовали унитарность оператора Z7+. Один из способов, каким можно сделать это, таков. Если А — комплексное (и притом не вещественное) собствен- ное значение оператора U*, то А ф А; следовательно, если СЛг = Аг, так что t/+z = Az, то z и z ортогональны. Это означает, что 0= (ж iy, х — гу) = || z ||2 —1| г/1|2+i ((ж, у) + (у, х)), откуда || х]|2 = || у ||2 и (х, у) = — (г/, х). Поскольку веще- ственное скалярное произведение симметрично ((ж, у) = = (г/, х)), заключаем, что (х, у) — 0. В свою очередь, от- сюда вытекает, что || z ||2 = || ж||2 + || у ||2 и, следовательно, IMMI у 11 = -7=Н< Если Aj и А2 — собственные значения оператора U*, причем Аг А2 и Aj А2, и если z1 = x1-j-ij/1 и z2 = х.2 iy2 — соответствующие собственные векторы (xt, х2, yv у2 — векторы из ^*), то zt и z2 ортогональны
220 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill и (поскольку z2 — собственный вектор, принадлежащий собственному значению Х2), также zx и z2 ортогональны. Используя снова выражение комплексного скалярного произведения в 9А+ через вещественное скалярное произведение в У, видим, что (*1> х2) -г (г/ь г/2) = (тп у2) - (ylt х2) = 0 и (^, т2) - (г/!, р2) = (х1г у2) + (У1, х2) = 0. Значит, векторы х1, т2, у±, у2 попарно ортогональны. Уни- тарный оператор U* может иметь также вещественные собственные значения. Поскольку, однако, собственные значения оператора Е/+, как мы знаем, равны по абсолют- ной величине единице, единственными возможными веще- ственными собственными значениями оператора U* яв- ляются +1 и —1. Если U* (х+ iy) = ± {хiy), то Ux=±x и Uy = ±y, так что собственные векторы оператора U* с вещественными собственными значениями получаются путем очевидного комбинирования собствен- ных векторов оператора U. Мы теперь подготовлены к последнему шагу. При за- данном U выберем ортонормальный базис, скажем, в линейном многообразии решений уравнения Ux~x (в %") и, аналогично, ортонормальный базис, скажем, %_lf в линейном многообразии решений уравнения Ux= —х (в Т’). (Множества и могут быть пустыми.) Далее, для каждой пары сопряженных комплексных собственных значений X и X оператора Z7+ выберем ортонормальный базис {zj, ...,zr} в линейном многообразии решений уравнения Z7+z = Xz (в У)- Если z?= х3 4 (с Xj и г/3- из Т), то пусть будет множество векторов {У 2 xlt V2ylt ... ,У~2хг,У2уг} из У. Из полученных результа- тов следует, что, объединив множества и Для всех собственных значений X оператора U*, мы получим орто- нормальный базис пространства Т’. В случае, когда содержит три элемента, — четыре элемента и имеются две пары сопряженных комплексных собственных значе- ний (Хр Хх) и (Х2, Х2), матрица оператора U в построенном
ФУНКЦИЙ ОТ ОПЕРАТОРОВ 221 § 82] таким образом базисе выглядит так: - 1 -1 -1 «1—Pi Pi ai а2 ?2 ?2 а2 (Все не выписанные члены равны нулю.) В общем случае, на главной диагонали имеется цепочка плюс единиц, за ней следует цепочка минус единиц, а затем идет цепочка клеток размером два на два, каждая из которых имеет вид Ср — а)’ где “2 + Р2 = 1- Из последнего равенства следует, что можно найти вещественное число 0 такое, что а — — cos В и P = sin0; при записи канонической формы матрицы ортогонального оператора принято пользовать- ся этим тригонометрическим представлением. Упражнения 1. Каждое собственное значение ортогонального оператора равно по абсолютной величине 1. 2. Пусть ; для скольких (вещественных) ортого- нальных матриц Р матрица Р ГАР диагональна? 3. Сформулировать и доказать разумный аналог спектральной теоремы для нормальных операторов на вещественном пространстве со скалярным произведением. § 82. Функции от операторов Одним из наиболее полезных понятий теории нормаль- ных операторов на унитарных пространствах является понятие функции от оператора. Если Л—нормальный
222 Ортогойальйость (гл. tit оператор со спектральным разложением У a^Ej (в этом з рассмотрении мы временно считаем наше векторное про- странство унитарным) и / — произвольная комплексная функция, определенная по крайней мере в точках а); то мы определяем линейный оператор /(4) формулой /(4) = 2/(ау)^. з Поскольку мы уже видели, что для полиномов р (и даже для рациональных. функций) наше прежнее определение р(А), в случае нормального А, дает р (4) = 2Р («,) Ej, з ясно, что наше новое понятие есть обобщение старого. Рассмотрение / (4) для произвольных функций / имеет для нас, главным образом, формальное преимущество; оно не дает ничего идейно нового. Действительно, какова бы ни была функция /, можно положить /(а;) = и затем найти полином р, принимающий на конечном множестве различных комплексных чисел щ соответственно значения [3,. Для такого полинома р имеем /(4) = /?(4), так что класс операторов, определенных путем образования про- извольных функций, не представляет ничего существенно нового; он только избавляет от возни с построением полинома для каждого отдельного случая. Так, например, если для каждого комплексного числа X положить А (0 = 0, если AW = 1, то А (4) будет ортогональным проектором на подпро- странство решений уравнения Ах = Хх. j Отметим, что если / (£) = у то (предполагая, конеч- но, что / определено для всех а;, т. е. что а;=#0) /(4) = = 4"1, а если /(0 = £, то /(4) = 4*. Из этих утвержде- ний следует, что если / — произвольная рациональная функция От £ и £, то для получения / (4) нужно произ- вести замены £ —> 4, £ —» 4* и 1_ С —>4 х. Однако символ
S 82] ФУНКЦИЙ ОТ ОПЕРАТОРОВ 223 f(A) определен для значительно более общих функций, и позже мы будем свободно пользоваться такими выраже- ниями, как еА и А. Особенно важной функцией является квадратный ко- рень положительного оператора. Мы рассматриваем /(£) = = ]/£, определенное для всех вещественных £>0, как положительный квадратный корень из £, и для каждого положительного А = 2 пишем i Ул = 2 У^е,. i (Напомним, что а;>0 для всех j. Дальнейшее рассмотре- ние применимо и к вещественным, и к комплексным про- странствам со скалярным произведением.) Очевидно, что фЛЛ>0и(]/А)2 = А; было бы желательно исследовать, до какой степени эти свойства характеризуют '|/ А. На первый взгляд может показаться безнадежным ожидать какой-либо единственности, поскольку, взяв В = = 2 ± V aj Ej с произвольно выбранным знаком на каж- i дом месте, мы снова получим А = В2. Однако построен- ный нами оператор У А был положительным, и можно показать, что это дополнительное свойство обеспечивает единственность. Другими словами, если А = В2 и В >0, то В = У А. Для доказательства, пусть В = 2 ₽Л — h спектральное разложение оператора В; тогда 2₽№ = В! = А = 2аЛ к i Поскольку все числа ph различны и положительны, то же верно и для их квадратов; из единственности спектраль- ного разложения оператора А вытекает, что каждое Р1 равно некоторому а;. (и обратно), причем соответствую- щие Е и F равны. Перестановкой индексов можно поэтому добиться, чтобы Ру = а}- для всех /, так что тогда Ру = ]Ла., что и требовалось. Имеется несколько важных применений существова- ния квадратного корня из положительного оператора; мы дадим сейчас два из них.
224 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill Во-первых, напомним, что в § 72 мы привели три возможных определения положительного оператора А и приняли самое слабое из них, а именно, что А самосо- пряжен и (Ах, х)>0 для всех х. Самым сильным из этих трех возможных определений было, что А можно записать в виде А = В2 с некоторым самосопряжен- ным В. Отмечаем, что из результата этого параграфа относительно квадратных корней следует, что слабейшее (на вид) из наших определений влечет сильнейшее и по- тому равносильно ему. (Действительно, мы можем даже получить единственный положительный квадратный ко- рень.) Во-вторых, в § 72 установлено также, что если А и В положительны и перестановочны, то АВ тоже положи- тельно; мы можем теперь дать этому утверждению про- стое доказательство. Поскольку |/Яи|/В являются функ- циями (полиномами) соответственно от Л и В, перестано- вочность А и В влечет перестановочность ]/А и|/В; сле- довательно, ав = У А у А у в ув = У А у в У а Ув = (Уа У в)2. Так как У А и У В — самосопряженные перестано- вочные операторы, их произведение будет самосопряжен- ным и потому его квадрат положителен. Спектральная теория позволяет также очень легко охарактеризовать матрицу (в произвольной ортонор- мальной координатной системе) положительного опера- тора Л. Так как det Л является произведением собствен- ных значений оператора А, ясно, что Л > О влечет det Л > 0. (Рассуждения § 55 применимы непосредственно только к комплексным пространствам со скалярным произведе- нием; однако соответствующая модификация, которую необходимо сделать при переходе к самосопряженным операторам на, возможно, вещественных пространствах, не представляет труда.) Рассмотрение определяющего свойства положительности, выраженного в терминах мат- рицы (ai3) оператора А, т. е. J показывает, i i что последнее выражение останется положительным, если потребовать, чтобы определенная часть координат
§ 82] ФУНКЦИИ ОТ ОПЕРАТОРОВ 225 (£п ...,5П) равнялась нулю. В матричных терминах это означает, что если вычеркнуть столбцы, скажем, с но- мерами Д, ..., jh, а также строки с теми же номерами, то оставшаяся частичная матрица опять будет положитель- ной, а следовательно, положительным будет и ее опре- делитель. Этот факт обычно выражают, говоря, что главные миноры определителя положительной матрицы положительны. Верно и обратное. Коэффициентом j-й степени X в характеристическом полиноме det (Л — X) оператора А (с точностью до знака) служит сумма всех главных миноров (п — /)-го порядка. Эти коэффициенты имеют попеременно положительный и отрицательный знаки. Отсюда следует, что если А имеет положительные главные миноры и самосопряжен (а потому известно, что корни det (Л — X) вещественны), то собственные значе- ния оператора А положительны. Поскольку самосопря- женность матрицы устанавливается проверкой того, яв- ляется она или нет (эрмитово) симметричной (ai;- = ayi), наши замечания сводят задачу выяснения того, положи- тельна матрица или нет, к конечному числу элементар- ных вычислений. Упражнения 1. Для каждого унитарного оператора U существует эрмитов оператор А такой, что U = elA. 2. Обсудить теорию функций от нормальных операторов на вещественном пространстве со скалярным произведением. 3. Если Д <', В и С — положительный оператор, перестановоч- ный с А и В, то АС<СВС. Самосопряженный оператор обладает единственным само- сопряженным кубическим корнем. 5. Найти все эрмитовы кубические корни матрицы /1 0 0\ 0 -1 0 . \0 0 8/ 6. а) Привести пример линейного оператора А на конечномер ном унитарном пространстве, не имеющего квадратного корня. Ь) Доказать, что каждый эрмитов оператор на конечномерном унитарном пространстве имеет квадратный корень. с) Каждый ли самосопряженный оператор на конечномерном евклидовом пространстве имеет квадратный корень? 15 п. Халмош
226 ОРТОГОНАЛЬНОСТЬ [Гл. tit 7. а) Доказать, что если А — положительный линейный опера- тор на конечномерном пространстве со скалярным произведением, то с(/Л)=е (Л). Ь) Пусть А — линейный оператор на конечномерном про- странстве со скалярным произведением; верно ли, что р(Л*Л) = = 6 И)? 8. Если Л О и (Ах, х) = 0 для некоторого х, то Ах = 0. 9. Если Л ^>0, то | (Л х, у) |2 (Ах, х) (Ау, у) для всех х и у. 10. Если векторы ц, ..., xk линейно независимы, то их грамиан невырожден. 11. Каждая положительная матрица является грамианом. 12. Если А и В — линейные операторы на конечномерном про- странстве со скалярным произведением и 0<:Л<Б, то detn <С det В. (Указание: при det В = 0 утверждение тривиально; если же det В^=0, то УВ — обратимый оператор.) 13. Если Л — строго положительный линейный оператор на конечномерном пространстве со скалярным произведением и Л <В, то Б’1^Л"1. (Указание: рассмотреть сначала Л = 1.) 14. а) Если В — эрмитов оператор на конечномерном унитарном пространстве, то оператор 1 + iB обратим. Ь) Если Л — положительный и обратимый оператор, а В — эрмитов оператор, то Л + iB обратим. 15. Если 0 <f. Л <С 71,__то у^А^уАв. (Указание: вычислить (/Б + /Л-]-е)(/Б-/Л-]-е) и доказать с помощью этого, что второй сомножитель обратим для каждого е>0.) 16. Пусть А — самосопряженный оператор на конечномер- ном пространстве со скалярным произведением; положим |Л| = /Л^, Л+=1(|Л|+Л) и Л_ = 1(|Л|-Л). а) Доказать, что |Л [есть наименьший эрмитов оператор, пере- становочный с Л и удовлетворяющий обоим неравенствам Л Л и —Л | Л |. («Наименьший» относится, конечно, к упорядочению эрмитовых операторов.) Ь) Доказать, что Л+ есть наименьший положительный опе- ратор, перестановочный с Л й удовлетворяющий неравенству Л < Л+. с) Доказать, что Л. есть наименьший положительный опе- ратор, перестановочный с Л и удовлетворяющий неравенству — Л <Л_. d) Доказать, что если Л и В — перестановочные самосопряжен- ные операторы, то существует наименьший самосопряженный опе- ратор С, перестановочный с Л и В и удовлетворяющий неравенст- вам Л < С и В < С. 17. а) Если А и В — положительные линейные операторы па конечномерном унитарном пространстве, причем А2 и В2 унитарно эквивалентны, то Л и В унитарно эквивалентны. Ь) Справедлив ли вещественный аналог утверждения а)?
§ 83] ПОЛЯРНОЕ РАЗЛОЖЕНИЕ 227 § 83. Полярное разложение Имеется еще одно полезное следствие теории квадрат- ных корней, а именно, аналог полярного представления £ = pei0 комплексного числа. Теорема 1. Для произвольного линейного операто- ра А на конечномерном пространстве со скалярным произ- ведением существуют {однозначно определенный) положи- тельный оператор Р и изометрия U такие, что А — UP. Если А обратим, то U также однозначно определяется оператором А. Доказательство. Хотя для этого и нет логи- ческой необходимости, мы дадим сначала доказательство для случая, когда А обратим; общее доказательство будет очевидной модификацией доказательства для этого специального случая, а последнее позволит лучше про- никнуть в геометрическое строение оператора А. Так как оператор А*А положителен, можно найти его (единственный) положительный квадратный корень, Р=]/А*А. Положим V = РА1; поскольку VA = Р, теорема будет доказана, если мы сможем доказать, что V есть изометрия, так как тогда будет U = V1. Но так как V* = (Л*1)* Р* = (А*)ДР, то мы видим, что V*V = (Л*)-1 РРА'1 = (Л*)-1 А*АА~1 = 1, так что V есть изометрия, что и было нам нужно. Для доказательства единственности заметим, что UP = U0P0 влечет PU* = PJJ*, откуда £2 = PU*UP = P0U*U0P0 = Р20. Так как положительный оператор Р2 = Р2 имеет только один положительный квадратный корень, то Р = Ро. (В этой части доказательства мы не использовали обра- тимости оператора Л.) Если А обратим, то Р тоже обратим (поскольку Р = и~ЛА), откуда получаем (умножая соотношение UP = UQPi} справа на Р 1 = Р'1), что U = Z70. 15*
228 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill Обратимся теперь к общему случаю, когда не предпо- лагается, что А обратим. Р строим точно так, как выше, так что Р2 = Д*Д, а тогда замечаем, что для каждого вектора х || Рх ||2 = (Рх, Рх) = (Р2х, х) = (А* Ах, х) = || Ах ||2. Если для каждого вектора у = Рх из области значений 3i (Р) оператора Р положить Uy = Ах, то U всюду, где он определен, будет оператором, сохраняющим длины. Мы должны показать, что U определен однозначно, т. е. что Рх± = Рх2 влечет Axt = Ах2. Но это верно, посколь- ку Р (хг — х2) = 0 означает || Р (хг — х2) || = 0, а послед- нее влечет ||Д (жх — х2) || = 0. Областью значений опера- тора U, определенного пока лишь на подпространстве ^(Р), служит 31 (Д). Так как U линеен, (Д) и 31 (Р) имеют одинаковую размерность, а потому также (3?(А))^~ и (31 (P))L имеют одинаковую размерность. Если принять за U на (,.$$ (Р))'1' любое линейное и изометрическое отобра- жение (3%(РУ)^ на (&(A)\L, то оператор U, определенный посредством этого на всем У, будет изометрией, обладаю- щей тем свойством, что UPx = Ах для всех х. Тем самым всё доказано. Применяя только что доказанную теорему к Д* вместо А и переходя к сопряженным, получаем также тот дуаль- ный факт, что каждое А может быть записано в виде А = = PU с изометрическим U и положительным Р. По кон- трасту с декартовым разложением (§ 70) мы назовем представление А = UP полярным разложением операто- ра А. В терминах полярных разложений мы получаем новую характеризацию нормальности. Теорема 2. Если А = UP — полярное разложе- ние линейного оператора А, то для нормальности этого оператора необходимо и достаточно, чтобы PU — UP. Доказательство. Поскольку U не обязатель- но однозначно определяется оператором Д, утверждение нужно понимать следующим образом: если А — нормаль- ный оператор, то Р перестановочен с каждым U, а если Р перестановочен с некоторым U, то оператор А — нор- мальный. Так как ДД* = UP2U* = UP2U~r и Д*Д = Р2,
§ 84] ПЕРЕСТАНОВОЧНОСТЬ 229 то ясно, что А нормален тогда и только тогда, когда U перестановочен с Р2. Поскольку, однако, Р2 есть функция от Р и, обратно, Р есть функция от Р2 (Р = Р2), пере- становочность с Р2 равносильна перестановочности с Р. Упражнения 1. Линейный оператор на конечномерном пространстве со ска- лярным произведением, имеющий только одно полярное разложе- ние, обратим. 2. Использовать для получения полярного разложения нор- мального оператора функциональное исчисление. 3. а) Для произвольного линейного оператора А на конечно- мерном пространстве со скалярным произведением существуют ча- стично изометрический оператор U и положительный оператор Р такие, что jfP(U) = J^‘(P) и А = UP. Операторы U и Р однозначно определяются этими условиями. Ь) Оператор А нормален тогда и только тогда, когда операто- ры U и Р, описанные в а), перестановочны. § 84. Перестановочность Спектральная теорема для самосопряженных и для нормальных операторов и функциональное исчисление могут быть также использованы для решения некоторых проблем, относящихся к перестановочности операторов. Это — глубокая и обширная область; мы рассмотрим две теоремы из нее- скорее для иллюстрации некоторых методов, чем для самих результатов. Теорема 1. Самосопряженные операторы А и В на конечномерном пространстве со скалярным произведе- нием перестановочны тогда и только тогда, когда сущест- вуют самосопряженный оператор С и вещественные функ- ции fug вещественной переменной такие, что А = / (С) и В = g (С). Если такой оператор С существует, то его можно взять даже в форме С = h(A, В), где h — надле- жащим образом выбранная вещественная функция двух веще- ственных переменных. Доказательство. Достаточность условия оче- видна; мы докажем только необходимость. Пусть А = 2 и В = 2 — спектральные i j разложения операторов А и В; поскольку А и В переста- новочны, из теоремы 3 § 79 следует, что каждое ЕЛ
230 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill перестановочно с каждым Fj. Пусть h — любая функция двух вещественных переменных такая, что числа h{ai, рр=у.. попарно различны; положим C = h(A, В) = 22Л(а1; Wj- i j (Ясно, что в качестве h можно взять даже полином, и то же верно относительно функций / и g, которые мы сейчас опишем.) Пусть fug таковы, что /(у{?)=а£ и g(yi3)=P3- для всех i и у. Тогда /(С) = А и g(C) = В, и всё доказано. Теорема 2. Если А — нормальный оператор на конечномерном унитарном пространстве, а В — произ- вольный оператор, перестановочный с Л, то В перестано- вочен с А*. Доказательство. Пусть А = 2 — спек- г тральное разложение оператора А; тогда A* = '^1aiEi. г Пусть, далее, / — такая функция (полином) от комплекс- ной переменной, что / (aj = a4 для всех г. Поскольку А* — f (Л), теорема доказана. У пражнения 1. а) Доказать следующее обобщение теоремы 2: если Аг и Я2— нормальные операторы (на конечномерном унитарном пространстве) и Л1В = ВД2, то А?В = ВА%. Ь) Теорема 2 утверждает, что отношение перестановочности иногда транзитивно: если А* перестановочен с А и А перестано- вочен с В, то А* перестановочен с В. Останется ли верной эта формулировка, если заменить А* произвольным оператором С? 2. а) Следует ли из перестановочности А с А*А, что А нор- мален? Ь) Следует ли из перестановочности Л* А с АА*, что А нор- мален? 3. а) Линейный оператор А нормален тогда и только тогда, когда существует полином р такой, что А* = р(А). Ь) Если А нормален и перестановочен с В, то Л перестано- вочен с В*. с) Если А и В нормальны и перестановочны, то АВ нормален. 4. Если А и В нормальны и подобны, то они унитарно экви- валентны. 5. а) Если Л — эрмитов, каждое его собственное значение имеет кратность 1 и АВ = ВА, то существует полином р такой, что Д=?(Л).
§ 85] САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ РАНГА ОДИН 231 Ь) Если А — эрмитов, то для существования такого полинома р, что В = р(А), необходимо и достаточно, чтобы В был перестано- вочен с каждым линейным оператором, перестановочным с А. 6. Показать, что множество попарно перестановочных нор- мальных операторов на конечномерном унитарном пространстве можно одновременно диагонализировать. § 85. Самосопряженные операторы ранга один Мы уже видели (теорема 2 § 51), что каждый линейный оператор А ранга Q есть сумма g линейных операторов ранга один. Легко видеть (используя спектральную теорему), что если А самосопряжен или положителен, то и все слагаемые можно взять соответственно самосопря- женными или положительными. Нам известно (теорема 1 § 51), какой должна быть матрица оператора ранга один; что можно сказать дополнительно, если оператор самосо- пряжен или положителен? Теорема 1. Если А — самосопряженный (или поло- жительный) оператор ранга один, то его матрица (ai;) в каждой ортонормальной координатной системе задается формулой а;.; = с вещественным х (или формулой с*. = у.у.). Обратно, если [Л] имеет в некоторой ортонор- мальной координатной системе такой вид, то А — само- сопряженный (или положительный) оператор ранга один. Доказательство. Как мы знаем, матрица (ai}) оператора А ранга один в любой ортонормальной системе SE = {хг, ...,хп} задается формулой = ₽iYj. Если А самосопряжен, мы должны также иметь aij=aii, откуда р.у; = Если Pt = 0 и Yi =# 0 для некоторого i, то р. = р.у,/у. =0 для всех /, откуда А = 0. Поскольку мы предположили ранг оператора А равным единице (а не нулю), это невозможно. Аналогично, невозможно, чтобы Р4 =# 0 и Yt = 0. Таким образом, можно найти i, для которого PiYi =# 0. Используя это i, получаем Р,- = Д у, = xYj Yi с некоторой ненулевой постоянной х, не зависящей от у. Поскольку диагональные элементы = (AxJt х ) = Р;у,
232 ОРТОГОНАЛЬНОСТЬ [ГЛ. Ill матрицы самосопряженного оператора вещественны, мы можем даже заключить, что = xPJJ с вещественным х. Если А, кроме того, положителен, то, как мы знаем, хРД- — obj] = (AXj, Xj) тоже положительно, а потому и х положительно. В этом случае положим Х = ]/х ; соот- ношение х^Р7- = (Хр;) (Хр;.) показывает, что задается формулой aij = yiyj. Легко видеть, что эти необходимые условия также доста- точны. Если ai3-= хРгР;, где х вещественно, то А само- сопряжен. Если %—YiYp то для любого х = 2 имеем г (Ах, х) = 2 3 Д& = 23 ViVjl&j = i 3 i 3 = ( 3 Yili) (3 Yjlj) = I 3 Yili Г > 0, i j i так что А положителен. В качестве следствия теоремы 1 весьма легко доказать замечательную теорему о положительных матрицах. Теорема 2. Если А и В — положительные линей- ные операторы, матрицами которых в некоторой ортонор- мальной координатной системе служат соответственно (ai?) и (Pi,), то линейный оператор С, матрица которого (yi3) в той же координатной системе задается формулой Уц ~ ацPu $ля всех * и В тоже положителен. Доказательство. Поскольку А и В можно записать в виде сумм положительных операторов ранга один, так что aij = 3 и?и? р и Pi> = 3 РШ Q ТО Yi) = 3 3a?P?(«. р ч (Верхние индексы здесь — не показатели степеней.) Поскольку сумма цолощцтельных матриц положительна,
§ 85] САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ РАНГА ОДИН 233 достаточно будет доказать, что матрица ((afPi) («Т₽;)) при любых фиксированных р и q положительна, а это сле- дует из теоремы 1. Между прочим, из 'этого доказательства видно, что теорема 2 останется верной, если заменить как в условии, так и в заключении «положительный» на «самосопря- женный»; однако в большинстве приложений применяется лишь данная нами редакция теоремы. Матрица (yi;), описанная в теореме 2, называется адамаровским произ- ведением матриц (ai?) и (Pi7). Упражнения 1. Пусть й и Т3 — конечномерные пространства со скалярным произведением (оба вещественные или оба комплексные). а) На векторном пространстве всех билинейных форм на 41 существует единственное скалярное произведение такое, что если ^1 у) = (х, хд(.у, уд и w2(x, у) = (х, х2) (у, у2\, то w2) = = (х2, Хг) (у2, У1). Ь) На тензорном произведении ® существует единственное скалярное произведение такое, что если z1 = x10y1 и z2 = x20y2, то (Zj, z2) = (x1, х2) (ylt у2). с) Если {х^ и {г/р} — ортонормальные базисы соответственно в 41 и ’Vs, то векторы х; ® уъ образуют ортонормальный базис 2. Всегда ли тензорное произведение двух эрмитовых операторов эрмитово? То же — для унитарных операторов? То же — для нор- мальных операторов?
ГЛАВА IV АНАЛИЗ § 86. Сходимость векторов До сих пор мы использовали существование скаляр- ного произведения в пространстве по существу только для введения понятия нормального оператора с некото- рыми его важными специальными случаями. Гораздо более очевидный круг идей заключен в изучении проблем сходи- мости, возникающих в пространстве со скалярным произ- ведением. Посмотрим, что можно понимать под утверждением, что последовательность векторов (хп) из У сходится к век- тору х из У*. Здесь сами собой напрашиваются две возмож- ности: , (I) ||жп-ж||—^0 при /г—»оо; (II) (хп — х, у) —> О при п —» оо для каждого фик- сированного у. Если верно (I) , то для каждого у имеем \(хп-х, г/) | с [| —а; |[. || г/1| —» О, так что верно и (II). В конечномерном пространстве спра- ведлива обратная импликация: (II) =Ф (I). Докажем это. Пусть {г,, . . ., zN} — ортонормальный базис в У. (В этой главе мы будем часто обозначать размерность конечно- мерного пространства буквой N, чтобы сохранить п для немой переменной в предельных процессах.) Если пред- положить (II) верным, то (жп — х, zj —> 0 для каждого i = l, .. .,7V. Поскольку (теорема 2 § 63) II Хп — X ||2 = 2 [ («п — X, zj |2, i тогда || хп — х || —>0, нто и требовалось доказать.
§ 87] НОРМА 235 Мы будем пользоваться без доказательства следую- щими фактами относительно сходимости векторов (в том или другом из двух равносильных смыслов). (Все они лег- ко вытекают из наших определений и свойств сходимости в обычной области комплексных чисел; мы предполагаем, что читатель имеет некоторое знакомство с этими поня- тиями.) Выражение аж-|-Ру определяет непрерывную функцию от совокупности всех его аргументов, т. е. если (ап) и (рп) — последовательности чисел, а (хп) и (уп)— последовательности векторов, то соотношения ап—> а, ₽п —* ₽, хпх, уп—*у влекут соотношение ипхп + $пУп—> -ч>ах+рг/. Если {z4} — ортонормальный базис в У и хп = 3 “inZj, а х -~2 аЛ’ то хп—> х тогда и только тогда, i i когда ain—>а£ (при п —» оо) для каждого i — 1, ..., N. (Таким образом, определенное здесь понятие сходимости совпадает с обычным понятием сходимости в TV-мерном вещественном или комплексном координатном простран- стве.) Наконец, мы будем считать известным тот факт, что конечномерное пространство со скалярным произведе- нием, наделенное метрикой, определяемой нормой, полно; т. е. если (хп) — последовательность векторов, для кото- рой || хп — хт || —0 при п, т-^со, то существует (един- ственный) вектор х такой, что хп—при п—» оо. § 87. Норма Из метрических свойств векторов вытекают некоторые важные метрические свойства линейных операторов, к изучению которых мы теперь приступаем. Определение. Линейный оператор А на про- странстве У со скалярным произведением называется ограниченным, если существует постоянная К такая, что || Ах || < К || х || для каждого вектора х из У. Нижняя грань множества всех постоянных К, обладающих этим свойством (границ оператора А), называется нормой оператора А и обозначается ||Л||. Ясно, что если А ограничен, то || Лх||< || А || • ||о:|| для всех х. Примерами могут служить случаи, когда А — (ненулевой) перпендикулярный проектор или изометрия; как следует из теоремы 1 § 75 или, соответственно,
236 АНАЛИЗ [ГЛ. IV теоремы §73, в обоих случаях || А || = 1. Рассмотрение векторов xn(t) — из аР показывает, что оператор диффе- ренцирования на не ограничен. Так как в дальнейшем нам придется рассматривать немало верхних и нижних граней, подобных || А |[, введем удобное обозначение. Если Р — какое-нибудь возможное свойство вещественных чисел t, мы будем обозначать множество всех вещественных чисел t, обладающих свой- ством Р, символом {£: Р}; нижняя же и верхняя грани множества будут обозначаться соответственно inf (вместо infimum) и sup (вместо supremum). В этих обозначениях имеем, например, || А || = inf {К: ||||<2? || ж || для всех х}. Понятие ограниченности тесно связано с понятием непрерывности. Если А ограничен и е — любое поло- жительное число, то, положив б = . II л II чены, что || я: — z/Ц < б влечет , мы будем обеспе- || Лх - Ау || = || А (х - у) || < || А || • || х - у || < е; другими словами, ограниченность влечет (равномерную) непрерывность. (В этом доказательстве мы неявно пред- положили, что || Л || 0; случай ||Л|| = 0 тривиален.) Принимая во внимание этот факт, можно приветствовать следующий результат. Теорема. Каждый линейный оператор на конеч- номерном пространстве со скалярным произведением огра- ничен. Доказательство. Пусть Л — линейный опе- ратор на Т’. Взяв какой-нибудь ортонормальный базис {#!, Xjv} в Т’, положим KQ = max {|| Ахх ||.|| AxN ||}. Так как произвольный вектор х может быть записан в виде х =2 (^, #i) хр то, применяя неравенство Шварца и
§ 87] НОРМА 237 ПОМНЯ, ЧТО || Ж* ]| — 1, получим II = || А (2 (ж, ^)жЛ| = г = || 2 С7’’ Жг) II < 2 I С7’ Xi) I ’ II Axi II < г г < 2 || х IHI Хг II • 1| || < к0 2 || Ж || = =WolMI- Другими словами, К = NK0 есть граница оператора А, и доказательство закончено. То, что в нашу оценку вошла размерность N простран- ства У, — не случайно: мы уже видели, что в бесконеч- номерных пространствах теорема не верна. Упражнения 1. а) Доказать, что скалярное произведение (а потому и норма) является непрерывной функцией,!, е. еслихп->жи уп->у, то (яп,уп) -» -* (х, у). Ь) Каждый ли линейный функционал непрерывен? А полилиней- ные формы? 2. Линейный оператор А на пространстве со скалярным про- изведением называют ограниченным снизу, если существует такая (строго) положительная постоянная К, что || Ах || > У||х|| Для каж- дого х. Доказать, что (на конечномерном пространстве) оператор А ограничен снизу тогда и только тогда, когда он обратим. 3. Если линейный оператор на пространстве со скалярным произведением (не обязательно конечномерном) непрерывен в одной точке, то он ограничен (и, следовательно, непрерывен на всем про- странстве). 4. Для каждого положительного целого п построить такой (не перпендикулярный) проектор Еп, что || Еп || > п. 5. а) Если U — ненулевой частично изометрический оператор, то II и || = 1. Ь) Если U —.изометрия, то ||КА|| = ||А 77|| = ||А|| для каж- дого линейного оператора А. 6. Если Е и F — перпендикулярные проекторы соответственно с областями значений <М и АА и если \\Е — F|| < 1, то dim 'М = = dim 7. а) Если А —нормальный оператор, то ||АП|| = ||А||П для каждого положительного целого п. Ь) Линейный оператор А на двумерном унитарном пространстве, такой, что ||А2|| = ||А||2, нормален. с) Верно ли утверждение пункта Ь) для операторов на трехмер- ном пространстве?
238 ЛЙАЛЙЗ [ГЛ. IV § 88. Выражения для нормы Для облегчения работы с нормой оператора, рассмо- трим следующие четыре выражения: р = sup {|| Ах ||/|| х ||: х #=0}, q = sup {|| Ах ||: ||ж|| = 1}, г = sup {| (Аж, у) |/(|| х |Н1 У ||): ж =# 0, у=#0}, s = sup{|(4x, у)|: || х || = || у || == 1}. В соответствии с определением, принятым в предыдущем параграфе, выражение {||Лх||: ||о:|| = 1}, например, озна- чает множество всех вещественных чисел вида ||Аж|), рас- сматриваемых для всех х с ||х|| = 1. Поскольку при х = 0 неравенство || Ах || < А|| х || вы- полнено тривиальным образом с любым К, из определе- ния верхней грани следует, что р = ||Л||; мы докажем, что на самом деле р — q — г = s =||Л||. Так как верх- няя грань в выражении для q берется по подмножеству соответствующего множества для р (если ||а:|| — 1, то || Ах ||/|| х|| =|| Ля |j), мы видим, что <?< р\ из аналогичных соображений s<r. Для каждого х =р 0 рассмотрим у= (такчто ||у|| = 1); имеем ||Лж||/||ж|| = ||Лу||. Другими словами, каждое число из множества, верхней гранью которого служит />, со- держится также в соответствующем множестве для q\ значит, /><<?, и, следовательно, р = q = ||Л||. Аналогично, если х Ф 0 и у =f= 0, рассмотрим х' = ц и у' = У ; имеем 1Ш1 |(Лж, у) |/(|| ж || || ?/1|) = | (Лж', у')\, и потому, на основании только что использованного сооб- ражения, r<s, так что г = s. Чтобы закрепить достигнутое, отметим, что пока мы доказали равенства Р = 9 = |1ЛИ И Г = 8.
§ 88] ЁЫРАЖЁНИЯ ДЛЯ ЙОРМЫ 239 Поскольку 1 (Ах, у) I II Лж II - Я у II II/М II* 11-11 У\\ IIх II • II У II Н*Н имеем г< р; для завершения доказательства остается по- казать, что /><г. Для этой цели рассмотрим любой век- тор х, для которого Ах =£ 0 (так что х 0); положив у — Ах для этого х, будем иметь ||Лж||/||ж|| = |(Лх, у) |/(|| я |Н|?/ID- Другими словами, мы доказали, что каждое число, со- держащееся в множестве, определяющем р, и отличное от нуля, входит также в множество, верхней гранью которого служит г; из этого очевидно следует требуемый результат. Числовая функция ||Л|| оператора А удовлетворяет следующим четырем условиям: И+5||<Р||-Н1М ||ЛВ||<||Л||.р||, 11аА|| = [а|.|]Л ||, Р*|| = НН- (1) (2) (3) (4) Доказательство первых трех из них непосредственно сле- дует из определения нормы оператора; для доказатель- ства условия (4) используем следующим образом равен- ство ||Л|| = г. Поскольку |(Лж, у)\ = \(х, А*у) |< || ж||-|| Л*г/|| < || А* ||.|| х ||-|| у\\,- мы видим, что || А || < ||Л*||; заменяя А на А* и А* на А** = = А, получаем обратное неравенство. Упражнения 1. Если В — обратимый оператор, то || АВ ||>-1| А ||/||.В~1|| для каждого А. 2. Верно ли, что ||Л *Л || = ||ЛЛ*]| Для каждого линейного опера- тора Л? 3. а) Если А — эрмитов и а>0, то ||Л ||<а тогда и только тогда, когда — а<Л <а. Ь) Если Л — эрмитов, а<;Л<Р и р — полином такой, что ,p(t)> О 'при а -С 1 -СР, то р(Л)>0. с) Если Л — эрмитов, а<СЛ<Р и р — полином такой, что р (г) ¥= 0 при а Р, то р (Л) обратим.
240 АНАЛИЗ [ГЛ. IV § 89. Нормы самосопряженных операторов Как обычно, о частном случае самосопряженных опе- раторов можно сказать несколько больше, чем в общем случае. Рассмотрим для любого самосопряженного опе- ратора А множество вещественных чисел Ф = {(Ля:, ж)/|| х ||2:' х =# 0} и Т = {(Лж, ж):’|| ж || = 1}. Очевидно, ТсФ- С другой стороны, если для каждого х =f= 0 положить у = * , то || у || = 1 и (Ах, х)/\\ х ||2 = = (Ау, у), так что каждое число из Ф входит также в Т. Следовательно, Ф = Y. Мы положим а = inf Ф = inf Y, Р = sup Ф = sup Y и будем называть а нижней границей, ар — верхней гра- ницей самосопряженного оператора А. Вспоминая опре- деление положительного оператора, видим, что а — наи- большее вещественное число, для которого А — а>0, ар — наименьшее вещественное число, для которого р — Л > 0. Относительно этих чисел мы утверждаем, что у = шах{|<х|, | Р|} = ||Л||. Половина доказательства проста. Поскольку | (Ах, х) |< || Ах || • || х || < || А || • ||Ж ||2, ясно, что | а | и | р | не превосходят ||Л||, так что у< || А || Чтобы доказать обратное неравенство, заметим, что из положительности линейных операторов у — А и у-}-Л следует, что (у + Л)* (у - Л) (у + Л) = (у + Л) (у — Л) (у + Л) и (Y —Л)*(у + Л) (у —Л) = (у—Л) (у +Л) (у — п) положительны, а потому положительна и их сумма 2у (у2 — Л2). Поскольку у = 0 влечет || Л|| = 0, утвержде-
§ 90] ПРИНЦИП МИНИМАКСА 241 ние в этом случае тривиально; в любом другом случае можно поделить на 2у и получить в результате, что у2-Л2>0. Другими словами, у21| х ||2 = у2 (х, х) > (А2х, х) = || Ах ||2, откуда у>|| А ||, что и завершает доказательство. Обращаем внимание читателя на то, что ядро доказа- тельства можно было бы совершенно освободить от вы- числений. Поскольку у — А и у А положительны и перестановочны, можно сразу же заключить (§ 82), что их произведение у2 — А2 положительно. Мы предпочли окольный путь в соответствии с принципом, что для целей обобщений теории лучше, когда это возможно, обойтись без использования спектральной теоремы. Наше доказа- тельство того, что положительность и перестановочность операторов А и В влекут положительность оператора АВ, основывалось на существовании у положительных операторов квадратных корней. Конечно, этот факт можно получить так называемыми «элементарными» методами, т. е. методами, не использующими спектральную теорему; но -даже простейшее элементарное доказательство содер- жит усложнения чисто технического характера, не очень удобные для наших целей. § 90. Принцип минимакса Весьма изящным и полезным фактом о самосопряжен- ных операторах является следующий принцип минимакса. Теорема. Пусть А — самосопряженный оператор на n-мерном пространстве ТА со скалярным произведением и ..., %п — его (не обязательно различные) собственные значения, занумерованные так, что > ... >%п. Если для каждого подпространства &И пространства ТА ц (еЛ1) = sup {(Ах, х): х из е/И, || х || = 1} и если, для к — 1, ..., п, ц(, = inf{ц (ojK): dim aiH = п — к + 1}, то = kh для к «= 1, ..., п. 16 II. Халмош
242 АНАЛИЗ [ГЛ. IV Д о к а 3 а т е л ь с т в о. Пусть {а^, хп} — орто- нормальный базис в У, для которого Axi—kixi, i = = 1, п (§ 79); пусть — подпространство, натя- нутое на xlt xh (к = 1, п). Поскольку размерность равна к, не может быть дизъюнктно ни с каким (и — к + 1)-мерным подпространством М пространства У; для любого такого подпространства можно найти вектор х, принадлежащий одновременно и и такой, k что ||а:|| = 1. Для этого х =2 ^х{ имеем г=1 k k (Ах,х)=^ О = = г=1 г=1 так ЧТО p(e$)>Xfe. С другой стороны, если рассмотреть то (п — к +1)- мерное подпространство а#0, которое натянуто на векторы п xh, xh+1, . .., хп, то для каждого х= У ^хг из этого под- i=h пространства имеем (предполагая ||’ж || = 1) (Ах,х) = % |^|2=М< = Ч, i—h i=k так что р (а/#0)С кк. Другими словами, когда пробегает все (п — к -|- 1)- мерные подпространства, р(э<) всегда и по крайней мере один раз < кк; это показывает, что pfe = Кк, как и утверждалось. В частности, при Zc=l, мы видим (используя резуль- таты § 89), что если А — самосопряженный оператор, то J А || равна максимуму модулей его собственных значений. Упражнения 1. Если X — собственное значение линейного оператора А на конечномерном пространстве со скалярным произведением, то |Х|<||4||. 2. Если А и В — линейные операторы на конечномерном унитар- ном пространстве и С = АВ —ВА, то || 1 — С||>1. (Указание: рассмотреть собственные значения оператора С.) 3. Если А и В — линейные операторы на конечномерном уни- тарном пространстве и С = АВ—ВА перестановочен с А, то С
§ 9t] СХОДИМОСТЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ 243 необратим. (Указание: если С обратим, то 2 || В ||-|| A || > 4. а) Если А — нормальный линеиныи оператор на конечно- мерном унитарном пространстве, то || А || равна максимальному из модулей собственных значений оператора А. Ь) Останется ли верным утверждение а), если опустить пред- положение нормальности? 5. Спектральным радиусом г (Л) линейного оператора А на конечномерном унитарном пространстве называется максималь- ный из модулей собственных значений этого оператора. а) / (А) = ((1 — АЛ)-1а:, у) есть аналитическая функция от А, 1 в круге | А, | < (для любых фиксированных х и у). f (ут-) Ь) Существует такая постоянная К, что | Mn II Ап II ПРИ |11<—— для n — Q, 1, 2, ... (Указание: для каждой пары некто- г (А) ров х, у существует постоянная К такая, что | А.п (Апх, у) | К для всех п.) 1 с) lim sup || Av г (Л). d) (r(4))n<r(An), n — 0, 1, 2, ... £ e) г (Л) = lim || An ||” . 6. Если A — линейный оператор на конечномерном унитарном пространстве, то с(Л) = || А || тогда и только тогда, когда || Ап || = = || Л ||п для п = 0, 1, 2, ... 7. а) Если А — положительный линейный оператор на конеч- номерном пространстве со скалярным произведением и оператор АВ самосопряжен, то | (АВх, х) | < |] В || • (Ах, х) для каждого вектора х. Ь) Будет ли верным утверждение а), если заменить ||5|| на г (В)? § 91. Сходимость линейных операторов Возвратимся теперь к проблемам сходимости. Напра- шиваются три смысла, в которых можно попытаться опре- делить сходимость последовательности линейных опера- торов (Ап) к фиксированному линейному оператору А: (I) || Лп — Л||—>'0 при п—>со. (II) || Апх - Ах || —> 0 при п —> оо для любого фиксиро- ванного х. (III) | (Апх, у) — (Ах, у) | —» 0 при /?. -—> со для любых фиксированных х и у. 16*
244 АНАЛИЗ [ГЛ. IV Если верно (I), то для каждого х ||Апх — Ах || = || (Ап —А)х||<||Ап—А||-||х||—>0, так что (1)=Ф(П). Мы уже видели (§ 86), что (П)=£(Ш) и что в конечномерных пространствах (Ш)=>(П). Но в ко- нечномерных пространствах верно и то, что (И) => (I), так что все три условия равносильны. Докажем это. Пусть {xj, ..., xjy} —ортонормальный базис в У*. Если допустить, что (II) верно, то для каждого е > 0 можно найти т?0 = и0(е) такое, что || Апх4 — Ахч )| < е для г = = 1, ...,2V и всех тг>7?0. Значит, для произвольного х = 2 имеем i (An - А) X || = || 2 (z, (An - A) Xt || < г <£1ИН1(Дг-Л)М< 1И1, г а это влечет (I). Легко также доказать, что если с помощью нормы опре- делить расстояние между операторами, то полученное метрическое пространство будет полным, т. е. если [| Ап — А’т|| —» 0 при п, т—> со, то существует опера- тор А такой, что ||АП — А || —->0. Доказательство этого факта сводится к соответствующему факту для векторов. Если || Ап — А т ||—» 0, то || Апх — Атх || —» 0 для каждого х, так что каждому х отвечает такой вектор, — обозначим его, скажем, Ах,— что |) Апх — Ах ||—>0. Ясно, что опера- тор А, задающий переход от х к Ах, линеен; доказанная выше импликация (II) =Ф (I) завершает доказательство. Теперь, когда мы знаем, что понимать под сходимостью линейных операторов, следует рассмотреть некоторые про- стые функции от этих операторов на предмет проверки их непрерывности. Мы утверждаем, что ||А ||, ||Ах||, (Ах, у), Ах, А-(-В, аА, АВ и А* определяют непрерывные функ- ции от совокупности их аргументов. (Заметим, что первые три — числовые функции, следующая — векторная, а по- следние четыре — операторные.) Доказательства всех этих утверждений очень просты и похожи друг на друга; чтобы дать представление о них, рассмотрим ||А ||, Ах и А*.
§ 91] СХОДИМОСТЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ 245 1) Если Ап—>А, т. е. ]) Ап — А ||—>0, то, поскольку неравенства || Ап|| <||АП-А |Н|| А || и ||А ||< ||А-АП|Ц ||АП|| влекут неравенство IIIAJHM НК ||А„-л !|, мы видим, что ||АП || —> || А ||. 2) Если АП-^А и хп —->х, то И Апхп - Ах IK II Апхп - Ахп II + II Ахп - Ах || -> 0, так что Апхп-^-Ах. 3) Если Ап-ч>А, то для любых хну (А*.г, у) = (х, Апу) = (Апу, х) (Ау, х) = (у, А*х) = (А*х, у), откуда Ап —> А*. У пражнения 1. Последовательность линейных операторов (А„) сходится к линейному оператор)- А тогда и только тогда, когда в любой коор- динатной системе каждый элемент матрицы оператора Ап сходится при п -> со к соответствующему элементу матрицы оператора 4. 2. Для каждого линейного оператора А существует последо- вательность обратимых линейных операторов (Ап) такая, что Ап-> А . 3. Если Е и F — перпендикулярные проекторы, то (EFE)n сходится при п -+ со к проектору, областью значений которого служит пересечение областей значений проекторов Е и F. 4. Если А — линейный оператор на конечномерном унитар- ном пространстве, то для того чтобы Ап -► 0, необходимо и достаточ- но, чтобы все собственные значения оператора А были по абсолют- ной величине (строго) меньше 1. 5. Доказать, что если А — квадратная матрица я-го порядка "0 1 о ... о' 0 0 1 ... о О О О ... 1 1 1 £ £ п п п га то Ak сходится при к -> со к проектору с одномерной областью зна- чений; найти последнюю. 6. Доказа ть, что det и tr непрерывны.
240 АНАЛИЗ [ГЛ. IV § 92. Эргодическая теорема Вся шаблонная работа позади; мы переходим к рас- смотрению, в качестве иллюстраций общей теории, неко- торых весьма специальных, но очень важных проблем сходимости. Теорема. Если U — изометрия на конечномерном пространстве со скалярным произведением и е/Е — под- пространство всех решений уравнения Ux — x, то последо- вательность операторов В„=4(П и + . .. + t/”"1) сходится при п — -со к перпендикулярному проектору Доказательство. Пусть JT — область значе- ний линейного оператора 1 — U. Если x = y — Uy, т. е. х принадлежит jU, то УпЖ=4 (y—UyUUy—U^y-U... 4-£7—1?/— = А (у-//11?/), так что II Vnx II =4 й - ипУ II < 4 (й II -г II Uny II) = | II у ||. Это показывает, что Vnx сходится к нулю, когда х принад- лежит . С другой стороны, если х принадлежит еЖ, т. е. Ux = х, то Vnx = x, так что в этом случае Vnx, разумеется, сходит- ся 'к х. Для завершения доказательства покажем, что = &Е. (Из этого будет следовать, что каждый вектор является суммой двух векторов, для которых (Уп) сходится, так что (Vn) сходится всюду. Доказанное уже нами относительно предела (Vn) на аЕ и ,// * покажет'тогда, что (Vnx) всегда сходится к проекции х на о/Z.) Чтобы показать, что = заметим, что х принадлежит ортогональному дополнению к JT тогда и только тогда, когда (х, у — Uy) = 0 для всех у. Из этого в свою очередь вытекает, что 0 = (х, у - Uy) = (ж, у) -(х, Uy) = = (ж, y) — (U*x, y) = (x—U*x, у),
§ 93] СТЕПЕННЫЕ РЯДЫ 247 т. е. что х—U*x = x—и~гх ортогонально к каждому вектору у, так что х — U~1x = 0, x-—LT1x, или Ux — x. Чтение последних выкладок справа налево показывает, что это необходимое условие также достаточно; теперь нужно лишь вспомнить определение оУ/, чтобы увидеть, что M = Это очень остроумное доказательство, работающее, с весьма небольшими модификациями, в большинстве важных бесконечномерных случаев, принадлежит Ф. Риссу. § 93. Степенные ряды Рассмотрим теперь так называемые ряды Неймана 2 Ап, где А — линейный оператор с нормой < 1 на ко- п— О нечномерном векторном пространстве. Положим р Sp= 2 Ап, п=0 тогда' (1-Л)5р = <5р-Л5г) = 1-Лр^. (1) Для доказательства того, что S стремится к пределу при р—>со, рассмотрим (для любых двух индексов р и q с р > q) неравенства l|Sp-*sg||< 2 И”||< 2 ИГ п=g-|-l n=q-|~l Поскольку || Л || < 1, последняя величина стремится к нулю при р, q—>оо; значит, Sp стремится к некоторому пре- делу S при р—>со. Для вычисления этого предела заме- тим, что оператор 1—А обратим. (Доказательство; (1 — A')x = Q влечет Ах = х, и при х 0 это означало бы, что || Ах || = Ц® || > || А || -|| х ||, в противоречие с определением ||Л||.) Следовательно, (1) можно записать в виде Sv = (1 - Лр+1) (1 -Л)-1 = (1 - Л)’1 (1 - Лр+1); (2)
АНАЛИЗ [ГЛ. IV так как Л'^' -О при р—>оо, то заключаем, что 5 = = (1-Л)-\ В качестве другого примера бесконечного ряда опера- торов рассмотрим экспоненциальный ряд. Для произволь- ного линейного оператора А (не. обязательно с ||Л|| < 1) положим jj = У ~Ап. v ^-1 пл п=0 Так как hs.-s.ik 2 ’»=«+! а правая часть этого неравенства, являясь отрезком сте- пенного ряда для ехр ||Л|| = еИАП, сходится к 0 при р, q~>со, то мы видим, что существует линейный оператор S такой, что Sp—»5. Будем пользоваться обозначением 5 = ехрА; мы упомянем лишь некоторые элементарные свойства этой функции от А. Рассмотрение треугольных форм операторов А и показывает, что Собственные значения оператора ехрЛ, вместе с их алгебраическими кратностями, равны экспо- ненциалам собственных значений оператора А. (Это доказательство, также, как и некоторые следующие, не- посредственно применимо только к комплексному слу- чаю; вывод для вещественного случая — посредством ком- плексификации.) Из рассмотрения треугольной формы следует также, что определитель оператора ехрЛ, т. е. N expXj , где Лц . . ., %^ — (не обязательно различные) i=l собственные значения оператора Л, есть не что иное как ехр (Xj . . . -f- Xjy) = ехр (tr Л). Поскольку ехр £ =# О, это, попутно, показывает, что оператор ехрЛ всегда обратим. Рассматриваемый как функция линейных операторов, экспоненциал сохраняет многие простые свойства обыкно- венной числовой показательной функции. Возьмем, на- пример, любые два перестановочных линейных оператора Л и В. Так как ехр (Л + В) — ехр Л ехр В есть предел
93] СТЕПЕННЫЕ РЯДЫ 249 (при р —> со) выражения 2 + % i.4". 2 п~0 т~0 к~0 р п р Р = 2 4г 2 (?)А‘в"‘- 2 2 Хп A"Bk- п=0 з—0 т=0 k=0 То мы докажем правило умножения для экспоненциалов, если докажем, что это выражение стремится к нулю. ^Здесь Qy- J означает биномиальный коэффициент Простая проверка показывает, что для к-{-т^.р про- изведение AmBh встречается в обоих выражениях правой части с коэффициентами, отличающимися лишь знаком. Члены, не уничтожающиеся при вычитании, принадлежат все вычитаемому и составляют вместе У У,4г,лтв\ т\к\ 1 т h где суммирование распространяется на все те значения т и к, не превосходящие р,' для которых т-^к^р. По- скольку последнее неравенство влечет, что хотя бы одно из двух целых тик больше целой части норма этого остатка не превосходит 2 2 йтйИл1Г1в11|'+2 2 мИГ!1в«“ = "(2 4г11л»”Х 2 4г»ви‘)+ +(24rW)( 2 *-• = (ехР МII) ар + (exp (| В |() Рр, где ар—»0 и ₽р—>0 при р—»оо. 17 П- Халмош
250 АНАЛИЗ [ГЛ. IV Аналогичными методами изучается f(A), где / — лю- бая функция, представимая степенным рядом, /(£)=§ п=0 а || А || (строго) меньше радиуса сходимости этого ряда. Предоставляем читателю проверить, что намеченное здесь функциональное исчисление согласуется с функцио- нальным исчислением для нормальных операторов. Так, например, оператор ехрА, как он определен в этом пара- графе, есть тот же линейный оператор, что и определен- ный соответственно нашему прежнему пониманию функции ехр А для случая нормального оператора А. Упражнения 1. Дать другое доказательство эргодической теоремы, основан- ное на спектральной теореме для унитарных операторов. 2. Рассматривая формальное степенное разложение для (1 —(1—Л))-1, доказать, что если || 1—А || < 1, то А обратим.
ПРИЛОЖЕНИЕ ГИЛЬБЕРТОВО ПРОСТРАНСТВО Вероятно, наиболее полезным и, во всяком случае, наиболее полно разработанным обобщением теории ко- нечномерных пространств со скалярным произведением является теория гильбертова пространства. Не вдаваясь в детали и совершенно не приводя доказательств, мы попытаемся теперь описать, как строится это обобщение и каковы основные трудности, которые приходится прео- долевать. Определение гильбертова пространства просто: это пространство со скалярным произведением, удовлетво- ряющее одному дополнительному условию. То, что это условие (а именно полнота) автоматически выполняется в конечномерном случае, доказывается в элементарном анализе. В бесконечномерном случае оказывается возмож- ным, что последовательность векторов (хп) такова, что II хп — хт II О ПРИ п> и тем не менее нет такого вектора х, для которого бы || хп — ®]| —> 0; единственный эффективный способ исключения этой возможности со- стоит в явном принятии противоположного предположе- ния. Другими словами, гильбертово пространство есть полное пространство со скалярным произведением. (Ино- гда понятие гильбертова пространства. сужается допол- нительными условиями, назначение которых — ограни- чить габариты пространства и снизу, и сверху. Наибо- лее распространенные среди этих условий требуют, чтобы пространство было бесконечномерным и сепарабельным. В последние годы, с тех пор как выяснилось, что такие дополнительные ограничения не окупаются результа- тами, стало принятым называть «гильбертовым простран- ством» определенное нами понятие.) 17*
252 ПРИЛОЖЕНИЕ. ГИЛЬБЕРТОВО ПРОСТРАНСТВО Легко видеть, что пространство г?5 полиномов со ска- лярным произведением, определенным формулой (я, у) = 1 = х (f) у (t) dt, неполно. По вопросу о полноте тех о или иных специальных гильбертовых пространств имеет- ся довольно обширная математическая литература. Так, например, основное утверждение знаменитой теоремы Рисса — Фишера состоит в том, что гильбертово про- странство, составленное из всех тех функций х, для 1 которых | х (/) | '‘dt < оо (в смысле лебеговского интегри- 0 рования), есть гильбертово пространство (с формально тем же определением скалярного произведения, как для полиномов). Другим популярным гильбертовым простран- ством, напоминающим по виду конечномерное координат- ное пространство, является пространство всех тех после- довательностей (£п) (смотря по надобности, вещественных или комплексных) чисел, для которых 2 I |2 сходится. п Используя полноту для разумного рассмотрения сходимости некоторых бесконечных сумм, можно в течение некоторого времени строить теорию гильбертова про- странства, не сталкиваясь ни с какими трудностями, вызываемыми бесконечномерностыо. Так, например, по- нятия ортогональности и полных ортонормальных мно- жеств могут быть определены в общем случае совершенно так, как мы их определили. Наши доказательства нера- венства Бесселя и равносильности различных возможных формулировок полноты ортонормального множества сле- дует подвергнуть только небольшим изменениям словес- ного характера. (Сходимость различных встречающихся при этом бесконечных сумм автоматически следует из не- равенства Бесселя.) Наше доказательство неравенства Шварца верно без изменений в наиболее общем случае. Наконец, доказательство существования полных ортонор- мальных множеств близко следует доказательству того же для конечного случая. При неконструктивном доказа- тельстве обычная индукция заменяется леммой Цорна
ПРИЛОЖЕНИЕ. ГИЛЬБЕРТОВО ПРОСТРАНСТВО 253 (или трансфинитной индукцией), и даже конструктивные шаги процесса Грама — Шмидта легко выполняются. При рассмотрении многообразий, функционалов и опе- раторов положение окажется затруднительным, если мы не пойдем на уступки топологии гильбертова пространства. Хорошие обобщения всех наших утверждений, сделанных в конечномерном случае, можно будет доказать, если рассматривать замкнутые линейные многообразия, непре- рывные линейные функционалы и ограниченные линейные операторы. (В конечномерном случае каждое линейное многообразие замкнуто, каждый линейный функционал непрерывен и каждый линейный оператор ограничен.) Если, однако, мы согласимся пойти на эти уступки, то снова сможем воспользоваться нашими конечномерными доказательствами в основном без всяких изменений и лишь в некоторых случаях вводя е. Так, мы снова получим, что = что М = и что каждый линейный функционал от х представим в виде (ж, у); наши определения самосопряженных и положительных операторов по-прежнему имеют смысл, и все наши теоремы о перпендикулярных проекторах (как и их доказательства) переносятся без изменения. Первый намек на возможные неблагополучия встре- чается при изучении ортогональных и унитарных опера- торов. Мы по-прежнему называем оператор U ортогональ- ным или унитарным (соответственно тому, вещественно или комплексно пространство), если UU* = U*U = 1, и по-прежнему верно, что такой оператор является изо- метрией, т. е. || Ux || = || х || для всех х, или, что равносильно этому, (Ux, Uy) = (х, у) для всех х и у. Однако легко построить изометрический оператор, который не будет унитарным; ввиду важной роли, которую он играет при построении контрпримеров, мы опишем один такой опе- ратор. Рассмотрим гильбертово пространство, содержа- щее счетное полное ортонормальное множество, скажем, {.г0, х±, х2, ...}. Условия Uxn = xn^ для п = 0, 1, 2, ... однозначно определяют ограниченный линейный опера- тор U. Этот оператор U является изометрией (U*U = 1), но, поскольку UU*x0 = 0, уже неверно, что UU* = 1. Но при переходе к спектральной теории радикально меняется весь ход развития теории. Определение собст-
254 ПРИЛОЖЕНИЕ. ГИЛЬБЕРТОВО ПРОСТРАНСТВО венного значения как числа X, для которого уравнение Ах — Хх имеет ненулевое решение, по-прежнему имеет смысл, и наша теорема о вещественности собственных значений самосопряженного оператора по-прежнему вер- на. Однако понятие собственного значения в значитель- ной мере теряет свою ценность. Собственные значения столь полезны в конечномерном случае тем, что они дают удобный способ описания того, что что-то не в порядке с оператором, обратным к Л — X, а единственное, что может быть не в порядке, состоит в том, что этот обратный перестает существовать. В бесконечномерном случае могут происходить существенно другие вещи; только чтобы проиллюстрировать имеющиеся возможности, укажем, например, что оператор, обратный к А — %, может суще- ствовать, но быть неограниченным. То, что не существует никакого полезного обобщения определителя, а следо- вательно, и характеристического уравнения, есть наи- меньшая из наших печалей. В самом деле, вся теория до- стигла своей полной красоты и законченности, лишь когда отказались от рабского подражания таким конеч- номерным методам. После того, как мы почти примирились с мыслью, что бесконечномерный случай связан с преодолением больших трудностей, приятным сюрпризом является тот факт, что спектральная теорема для самосопряженных операторов (а в комплексном случае даже для нормальных) все же допускает весьма красивое и мощное обобщение. (Хотя при описании теоремы мы говорим только об ограниченных операторах, теорема справедлива и для широкого класса неограниченных операторов.) Чтобы быть в состоянии понять аналогию, переформулируем конечномерный случай. Пусть А — самосопряженный линейный оператор на конечномерном пространстве со скалярным произведением иА = ^Ц — его спектральное разложение. Для каж- з дого интервала М вещественной оси обозначим через Е(М) сумму всех тех для которых X,- принадлежит М. Ясно, что Е(М) для каждого М есть перпендикулярный проек- тор. Решающее значение имеют следующие свойства проекторной функции интервала Е'- если М есть объеди-
ПРИЛОЖЕНИЕ. ГИЛЬБЕРТОВО ПРОСТРАНСТВО 255 пение счетного семейства {Afn} дизъюнктных интерва- лов, то Е(М) = ^Е(Мп), (1) п и если М — несобственный интервал, состоящий из всех вещественных чисел, то Е (М) = 1. Связь между А и Е описывается равенством А = ^Е({1}}), i где, разумеется, {%3} — вырожденный интервал, состоя- щий из одного числа Те, кто знаком с интегралом Лебега — Стилтьеса, узнает в последней сумме ти- пичную интегральную сумму для интеграла вида KdE (X) и потому усмотрит, в каком направлении сле- дует ожидать обобщения. Алгебраическое понятие сум- мирования следует заменить аналитическим понятием интегрирования; обобщенная связь между А и Е описы- вается равенством A — J KdE(k). (2) При этом формальном изменении спектральная теорема для самосопряженных операторов остается справедливой и в гильбертовом пространстве. Мы должны, конечно, пра- вильно истолковывать предельные переходы, содержащие- ся в формулах (1) и (2). И снова перед нами возникают три возможности, упомянутые в § 91. Они называются соот- ветственно равномерной, сильной и слабой сходимостями. И оказывается, что и формула (1), и формула (2) могут быть интерпретированы в смысле сильной сходимости. (Читатель, конечно, понял из сказанного, что в бесконеч- номерном гильбертовом пространстве эти три возможности действительно различны.) Мы видели, что проекторы Fj, входящие в спектраль- ное разложение оператора А в конечномерном случае, являются очень простыми функциями от А (§ 82). Посколь- ку Е (М) получаются из F} суммированием, они также являются функциями от А, и очень легко описать, какими функциями. Положим gw (?) = 1, если £ принадлежит М,
256 ПРИЛОЖЕНИЕ. ГИЛЬБЕРТОВО ПРОСТРАНСТВО и gu (С) — О в противном случае; тогда Е (М) = gM (Л). Этот факт дает главный ключ к возможному доказа- тельству общей спектральной теоремы. Обычный путь состоит в рассмотрении функционального исчисления для полиномов и распространения его с помощью предельных переходов на класс функций, включающий все функции gM. Раз это сделано, мы можем определить функцию интер- вала Е, положив Е (М) = gM (А)-, не составляет особого труда установить, что Е и А удовлетворяют соотноше- ниям (1) и (2). После того, как спектральная теорема доказана, легко вывести из нее обобщенные варианты наших теорем о квад- ратных корнях, функциональном исчислении, полярном разложении и свойствах перестановочности и, по существу, ответить практически на любой разумный вопрос об ограниченных нормальных операторах. Остаются две основные трудности: рассмотрение не нормальных и рассмотрение неограниченных операторов. Что касается общих не нормальных операторов, состояние наших знаний здесь весьма легко описать: их не сущест- вует. Не имеется даже удовлетворительного обобщения треугольной формы или канонической жордановой формы и теории элементарных делителей. Совершенно иначе обстоит дело с нормальными (и особенно самосопряжен- ными) неограниченными операторами. (Читателю будет понятно наше желание заниматься такими операторами, если он вспомнит, что первой и наиболее важной функцио- нальной операцией, которую изучает большинство из нас, является дифференцирование.) В этой связи мы только едва наметим главные препятствия, стоящие на пути этой теории. Нетрудно показать, что самосопряженный линейный оператор, определенный для всех векторов гильбертова пространства, ограничен. Другими словами, первое требование, предъявляемое к операторам, от которого мы вынуждены отказаться, — это требование, чтобы они были определены всюду. Точное описание области, на которой может быть определен самосо- пряженный оператор, и границ, до которых эта 'область может быть расширена, — главная новая трудность, с которой сталкивается изучение неограниченных опе- раторов,
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА Следующий очень краткий список не претендует на полноту; он просто содержит по два представителя каждого из нескольких направлений, которые, возможно, заинтересуют читателя. В направлении общей (но обычно конечномерной) линейной и полилинейной алгебры: 1. N. В о п г b a k i, Algebre, Chap. II (Algebre lineaire), Paris, 1947, и Chap. Ill (Algebre multilinea- ire), Paris, 1948. [Выходит в свет русский пе- ревод.] 2. В. L. van der Waerden, Modern algebra, New York, 1953. [Русский перевод немецкого издания: Б. Л. Ван-дер-Варден, Современная алгеб- ра, часть I, М.—Л., 1947; часть II, М.—Л., 1947.] В направлении связей с классическим п современным анализом: 1. S. Banach, Theorie des operations lineaires, War- szawa, 1932. [Украинский перевод: С. С. Б а н a x, Курс функционального ananisy, КиТв, 1948.1 2. F. R iesz and В. S z.-N a g у, Functional analysis, New York, 1955. [Русский перевод с венгерского издания: Ф. Рисе и Б. Секефальви-Надь, Лекции по функциональному анализу, Москва, 1954.] В направлении геометрии гильбертова пространства и теории операторов на нем: 1. Р. R. Н а 1 m о s, Introduction to Hilbert space, New York, 1951. 2. M. H. S t о n e, Linear transformations in Hilbert space, New York, 1932.
258 РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА В направлении связей с классической и современной физикой: 1. R. Courant and D. Hilbert, Methods of mathe- matical physics, New York, 1953. [Русский перевод с немецкого издания: Р. Курант и Д. Гиль- берт, Методы математической физики, том I, М.— Л., 1951; том II, М.—Л., 1951.] 2. J. von Neumann, Mathematicalfoundation of quan- tum mechanics, Princeton, 1955.
предметный указатель Автоморфизм 117 Адамаровское произведение матриц 233 Алгебраическая кратность 140 Алгебраически замкнутое поле 139 Аннулятор 41 Базис 20 — ортонормальный 172 — сопряженный 37 Билинейная форма 54 — — вырожденная 56 — — невырожденная 56 — — положительно определенная 163 — — симметричная 57 — — эрмитово симметричная 163 Билинейный функционал 35, 54 Вектор 11 — собственный 137 Векторное пространство 11 — — вещественное 12 — — комплексное 12 — — конечномерное 21 — — нормированное <70 — — рациональное 12 — — сопряженное 34 — — со скалярным произведением 162 — — унитарное 162 Векторы ковариантные 114 — контравариантные 114 — ортогональные 163 — сравнимые по модулю 53 Верхняя граница 240 Вещественная часть оператора 184 Вещественное векторное простран- ство 12 Внешняя прямая сумма 46 Внутреннее произведение 160 Внутренняя прямая сумма 46 Выпуклость 217 Вырожденная билинейная форма 56 Вырожденный линейный оператор Геометрическая кратность 140 Гильбертово пространство 251 Главный минор 225 Грамиан 190 Граница верхняя 240 — нижняя 240 График линейного оператора 180 Группа 64 Декартово разложение 183 Делитель нуля 85 — элементарный 154 Дефект 122 Диагонализируемый линейный опе- ратор 144 Диагональная матрица 144 Дизъюнктные пространства 29 Длина вектора 162 Дополнение к подпространству 31 — — — ортогональное 165 Евклидово пространство 162 Жорданова форма 153 Закон Сильвеотра 124 Идемпотентный линейный оператор 101 Инвариантность 98 Инволюция 106 Индекс нильпотентности 146 Изометрическая матрица 193 Изометрия 191 Изоморфизм 26 — сопряженный 175 Канонический вид оператора 153 Квадратичная форма 57 fc-линейная форма 70 — — кососимметричная 72 — — Симметричная 71 Ковариантные векторы 114 Когредиентность 114 Комбинация линейная 19 Комплексификация 61, 202 Комплексное векторное простран- ство 12 Конгруентные линейные операторы 181 Конечномерное векторное простран- ство 21 Контравариантные векторы 114 Контраградиентность 114
260 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Координатная система 20 ---ортонормальная 172 Координатное пространство 13, 14 — — п-мерное вещественное 14 — — — комплексное 13 Корень характеристический 135 Кососимметричная k-линейная фор- ма 72 Кососимметричный линейный опе- ратор 183 Косоэрмитов линейный оператор 183 Кратность 137 — алгебраическая 140 — геометрическая 140 — элементарного делителя 154 Кронекеровское произведение ма- триц 132 Левый обратный оператора 89 Лемма Цорна 24 Линейная зависимость 17 — комбинация 19 — независимость 17 — оболочка 30 Линейное многообразие 28 Линейные операторы конгруентные 181 Линейный оператор 78 — — вырожденный 133 — — диагонализируемый 144 — — идемпотентный 101 — — кососимметричный 183 — — косоэрмитов 183 — — невырожденный 133 — — неотрицательно полуопрсде- ленный 188 — — нильпотентный 146 — — нормальный 213 — — обратимый 86 — — ограниченный 235 — — ортогональный 191 — — положительно определенный 188 — — положительный 188 — — самосопряженный 182 — — симметричный 182 — — сопряженный 107 — — строго положительный 188 — — унитарный 191 — — частично изометрический 200 — — эрмитов 182 Линейное отображение 78, 81 — — сопряженное 117 Линейный функционал 33 — — однородный 33 Матрица 90 — диагональная 144 — изометрическая 193 — положительная 188 — транспонированная 111 — треугольная 144 Матрицы подобные 116 Метрическое пространство полное 235, 251 Минимальный полином 154 Минор главный 225 Мнимая часть оператора 184 Многообразие линейное 28 Множество векторов ортонормаль- ное 164 Модуль 15 Натянутое на множество векторов подпространство 30 Начало 12 Невырожденная билинейная форма 56 Невырожденный линейный опера- тор 133 Независимые подпространства 49 — циклы 65 Неотрицательно полуопределенный линейный оператор 188 Неравенство Бесселя 166 — Шварца 168 Нечетная перестановка 68 Нечетный полином 33 Нижняя граница 240 Нильпотентный линейный оператор 146 п-мерное вещественное координат- ное пространство 14 — комплексное координатное про- странство 13 Норма 162 — линейного оператора 235 Нормальный линейный оператор 213 Нормированное векторное простран- ство 170 Нуль-пространство 120 Область значений 120 Оболочка линейная 30 Образ подпространства 120 Обратимый линейный оператор 86 Обратная перестановка 64 Обратный линейный оператор 86 Ограниченный линейный оператор 78 Однородный линейный оператор 78 — — функционал 33 Оператор левый обратный 89 Оператор линейный — см. Линей- ный оператор Определитель 133 Ортогональная размерность 164 Ортогональная эквивалентность 212 Ортогональное дополнение к под- пространству 165 Ортогональные векторы 163 — проекторы 197 Ортогональный линейный оператор 191 Ортонормальная координатная си- стема 172 Ортонормальное множество векто- ров 164 — — _ полное 164 Ортонормальный базис 172 Отношение эквивалентности 53 Отображение линейное 78, 81 — — сопряженное 117
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 261 Пересечение подпространств 29 Перестановка 62 — нечетная 68 — обратная 64 — сопряженная 67 — тождественная 63 — четная 68 Перпендикулярный проектор 195 Подгруппа 69 Подобные матрицы 116 Подпространства дизъюнктные 29 — независимые 49 Подпространство 28 — натянутое на множество векто- ров 30 — порожденное множеством векто- ров 30 Поле 10 — алгебраически замкнутое 139 Полилинейная форма 70 Полином минимальный 154 — нечетный 33 — характеристический 135 — четный 33 Полное метрическое пространство 235, 251 — ортонормальное множество век- торов 164 — упорядочение 24 Положительная матрица 188 Положительно определенная били- нейная форма 163 — определенный линейный опера- тор 188 Положительное число 10 Положительный линейный опера- тор 188 Поляризационное тождество 186 Поляризация 185 Полярное разложение 228 Порожденное множеством векторов подпространство 30 Порядок перестановки 67 Правый обратный оператора 89 Преобразование Кели 195 Простой элементарный делитель 154 Приводимость 99 Принцип минимакса 241 Проектор 101 — перпендикулярный 195 Проекторы ортогональные 197 Произведение внутреннее 160 — конечномерных векторных про- странств тензорное 59 — линейных операторов 82 — — — тензорное 128 — матриц адамаровское 233 — — кронекеровское 132 — перестановок 63 — скалярное 160, 162 Простое собственное значение 138 Простой элементарный делитель 154 Пространство векторное — см. Век- торное пространство — гильбертово 251 — евклидово 162 — координатное 13, 14 Процесс ортогонализации Грама — Шмидта 172 Прямая сумма 44 — — внешняя 46 — — внутренняя 46 Равенство Парсеваля 167 Радиус спектральный 243 Разложение декартово 183 — полярное 228 — спектральное линейного опера- тора 209 Размерность 25 — ортогональная 164 Ранг линейного оператора 122 — матрицы 123 — — по столбцам 123 — — по строкам 123 Рациональное векторное простран- ство 12 Решетка 190 Рефлексивность 40, 44 Ряды Неймана 247 Самосопряженный линейный опера- тор 182 Симметрическая группа степени k 64 Симметричная билинейная форма 57 — А-липейпая форма 71 Симметричный линейный оператор 182 Скаляр 9 Скалярное произведение 160, 162 След 142, 145 Смежный класс 50 Собственное значение 137 — — простое 138 Собственный вектор 137 Сопряжение 195 Сопряженная перестановка 67 Сопряженное векторное простран- ство 34 — линейное отображение 117 Сопряженный базис 37 — изоморфизм 175 — линейный оператор 107 Спектр 138 Спектральная теорема 209 Спектральное разложение линейного оператора 209 Спектральный радиус 243 Столбец матрицы 91 Строго положительный линейный оператор 188 Строка матрицы 91 Сумма векторов 12 — линейных операторов 80 — прямая 44 — — внешняя 46 — — внутренняя 46 Сходимость векторов 234 — линейных операторов 243 Тензорное произведение конечно- мерных векторных пространств 59
262 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Тензорное произведение линейных операторов 128 Теорема Рисса — Фишера 252 — спектральная 209 — эргодическая 246 Тождественная перестановка 63 Тождество поляризационное 186 Транспозиция 65 Транспонированная матрица 111 Треугольная матрица 144 Унитарная эквивалентность 212 Унитарное векторное пространство 162 Унитарный линейный оператор 191 Упорядочение полное 24 Уравнение Гамильтона — Кели 154 — характеристическое 135 Факторпространство 51 Форма билинейная — см. Билиней- ная форма — жорданова 153 7 8 — квадратичная 57 — fc-линейная 70 • — /г-линейная кососимметричная 72 — fc-линейная симметричная 71 — полилинейная 70 — сопряженно билинейная 163 Функционал билинейный 35, 54 — линейный 33 — — однородный 33 Характеристика поля 11 Характеристический корень 135 — полином 135 Характеристическое уравнение 135 Цикл 65 Циклы независимые 65 Частично изометрический линей- ный оператор 200 Четная перестановка 68 Четность 67 Четный полином 33 Число положительное 10 Числовая область значений опера- тора 217 Элементарный делитель 154 — — простой 154 Эргодическая теорема 246 Эрмитов линейный оператор 182 Эрмитово симметричная билинейная форма 163
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ 69 [А], 90 ®//00, 42 tr, 141 Л-i, 86 А', 107 JT (A), 120 v(4), 122 T3', 34 C1A>", 39 [А, ^], 90 T3/^, 51 А*, 178 А+, 203 0, 14 T3*, 61, 201 T3*, 176 II А ||, 235 &>, 13 g, ю свп, 13 Л-1, 64 PM, 196 .^n, 13 (/>, <?), 65 [ж, у], 35 <ж, у), Ц %?', 37 б, 21 Х-\-<М, 50 det, 133 (ж, у), 159, 162 dim, 32 31, 10 II х ||, 158, 162 «J-, 165 g 63 31 (A), 120 r(A), 243 exp A, 248 3-n, 14 Re, 169 q(4), 122 $13, 13 С, 29 П, 29 <%> + <Ж, 31 41 44 ®, 59, 128 sgn, 68 ЕЕ, 53 Im, 169 <5%, 64 >, 188 inf, 236 sup, 236 236
Пауль Халмош Конечномерные векторные пространства М., Физматгиз, 1963 г., 264 стр. Редактор И. Е. Морозова Техн, редактор Е. А. Ермакова Корректор О. А. Бутусова Сдано в набор 3/IX 1962 г. Подписано к печати 4/1 1963 г. Бумага 84х108/зг. Физ. печ. л. 8,25. Условн. печ. л. 13,53. Уч.-изд. л. 13,81. Тираж 9000. Цена _______книги 89 коп. Заказ У» 407._____ Государственное издательство физико-математической литературы.5 Москва, В-71, Ленинский проспект, 15 Московская типография .У 5 Мосгорсовнархоза. Москва, Трехпрудный пер., 9.