/
Автор: Воеводин В.В.
Теги: вычислительная математика численный анализ математика линейная алгебра алгебра естественные науки
Год: 1980
Текст
В. В. ВОЕВОДИН
ЛИНЕЙНАЯ
АЛГЕБРА
Издание второе,
переработанное и дополненное
Допущено Министерством
высшего и среднего специального образования СССР
в качестве учебного пособия для студентов вузов,
обучающихся по специальности «Прикладная математика»
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1980
22.19
В 63
УДК 519.6
Линейная алгебра. Воеводин В. В. М.: Наука. Главная
редакция физико-математической литературы, 1980.
Настоящее учебное пособие представляет собой объединенный
курс линейной алгебры и аналитической геометрии и предназнача-
предназначается студентам университетов и втузов по специальности «При-
«Прикладная математика»,
Книга отличается от прежних руководств уклоном изложения
в сторону прикладных задач и изменением аппарата исследования
с целью большего приближения его к вычислительному аппарату.
Наибольшему изменению в новом издании подверглась часть
книги, касающаяся вычислительных аспектов линейной алгебры,
Первое издание выходило в 1974 году.
Валентин Васильевич Воеводин
ЛИНЕЙНАЯ АЛГЕБРА
М., 1980 г., 400 стр. с илл.
Редактор Т. Я. Кузнецова
Техн. редакторы Н. В. Кошелева, В. Я. Кондакова
Корректор Т. С. Ёайсберг
ИБ 11654
Сдано в набор 20.12.79. Подписано к печати 22.10.80. Бумага 60x907i6> тип. № 2.
Гарнитура тайме. Высокая печать. Условн. печ. л. 25. Уч.-изд. л. 26,16.
Тираж 35000 экз. Заказ № 1071. Цена книги 1 р. 10 к.
Издательство «Наука»
Главная редакция физико-математической литературы
117071, Москва, В-71, Ленинский проспект, 15
Ордена Октябрьской Революции, ордена Трудового Красного Знамени Ленинградское
производственно-техническое объединение «Печатный Двор» имени А. М. Горького
Союзполиграфпрома при Государственном комитете СССР по делам издательств,
полиграфии и книжной торговли. 197136, Ленинград, П-136, Чкаловский пр., 15.
20204 —И2 ® Издательство «Наука». Главная редакция
*\j_v ±??_5-80, 1702070000 Физико-математической литературы, 1974;
053@2)-80 с изменениями, 1980
ОГЛАВЛЕНИЕ
Предисловие , ь . . 6
ЧАСТЬ I. ЛИНЕЙНЫЕ ПРОСТРАНСТВА 7
Глава 1. Множества, элементы, операции 7
§ L Множества и элементы 7
§ 2. Алгебраическая операция 9
§ 3. Обратная операция 13
§ 4. Отношение эквивалентности 15
§ 5. Направленные отрезки 18
§ 6. Сложение направленных отрезков 20
§ 7. Группы 23
§ 8. Кольца и поля ....'. 27
§ 9. Умножение направленного отрезка на число 30
§ 10. Линейные пространства 33
§ 11. Конечные суммы и произведения 37
§ 12. Приближенные вычисления 40
Глава 2. Строение линейного пространства 42
§ 13. Линейные комбинации и оболочки 42
§ 14. Линейная зависимость 44
§ 15. Эквивалентные системы векторой 47
§ 16. Базис 50
§ 17. Простые примеры линейных пространств 52
§ 18. Линейные пространства направленных отрезков 54
§ 19. Сумма и пересечение подпространств 57
§ 20. Прямая ?умма подпространств 61
§ 21. Изоморфизм линейных пространств 63
§ 22. Линейная зависимость и системы линейных уравнений .... 67
Глава 3. Измерения в линейном пространстве 72
§ 23. Аффинные системы координат 72
§ 24. Другие системы координат 77
§ 25. Некоторые задачи 79
§ 26. Скалярное произведение 85
§ 27. Евклидово пространство 88
§ 28. Ортогональность 92
§ 29. Длины, углы, расстояния 96
§ 30. Наклонная, перпендикуляр, проекция 99
§ 31. Евклидов изоморфизм 103
§ 32. Унитарное пространство 104
§ 33. Линейная зависимость и ортонормированные системы ... 106
Г л а в а 4. Объем системы векторов в линейном пространстве 108
§ 34. Векторное и смешанное произведения , , 108
4 ОГЛАВЛЕНИЕ
§ 35. Объем и ориентированный объем системы векторов ...» 113
§ 36. Геометрические и алгебраические свойства объема 116
§ 37. Алгебраические свойства ориентированного объема ..... 120
§ 38. Перестановки ...... 122
§ 39. Существование ориентированного объема , s 124
§ 40. Определители: ........ , , 126
§ 41. Линейная зависимость и определители , 131
§ 42. Вычисление определителей, . , 134
Г Л а в а 5. Прямая линия и плоскость в линейном пространстве . . . . , 136
§ 43. Уравнения прямой линии и плоскости 136
§ 44. Совместное расположение . , , . ¦ . . 142
§ 45. Плоскость в линейном пространстве ......... 145
§ 46. Прямая линия и гиперплоскость , . . , • 149
§ 47. Полупространство 154
§ 48. Системы линейных уравнений . . . ¦ 156
Глава 6. Предел в линейном пространстве ¦ 161
§ 49. Метрическое пространство 161
§ 50. Полное пространство. ...» 163
§ 51. Вспомогательные неравенства 166
§ 52. Нормированное пространство * 168
§ 53. Сходимость по норме и координатная сходимость 171
§- 54. Прлнота нормированных пространств 174
§ 55. Предел и вычислительные процессы 176
ЧАСТЬ II, ЛИНЕЙНЫЕ ОПЕРАТОРЫ f J79
Глава 7Г Матрицы и линейные операторы * > 179
§ 56. Операторы ....,.,.., 179
§ 57. Линейное пространство операторов . 182
§ 58. Кольцо операторов ..»,,,,. 185
§ 59. Группа невырожденных операторов 186
§ 60. Матрица оператора ,...,., 190
§ E1. Операции над матрицами * . , 194
§ 62. Матрицы и определители 198
§ 63. Переход к другому базису . 202
§ 64. Эквивалентные и подобные матрицы * 204
Глава 8. Характеристический многочлен , 207
§ 65. Собственные значения и собственные векторы 207
§ 66. Характеристический многочлен .¦ 210
§ 67. Кольцо многочленов 212
§ 68. Основная теорема алгебры , 216
§ 69. Следствия из основной теоремы 221
Глава 9. Строение линейного оператора » 226
§ 70. Инвариантные подпространства 226
§ 71. Операторный многочлен 229
§ 72. Треугольная форма 231
§ 73. Прямая сумма операторов 233
§ 74. Жорданова форма 237
§ 75. Сопряженный оператор 241
§ 76. Нормальный оператор 246
§ 77. Унитарный и эрмитов операторы ¦ » . 248
§ 78. Операторы А*А и АА* ¦*...*. * 252
§ 79. Разложения произвольного оператора 255
ОГЛАВЛЕНИЕ 5
§ 80. Операторы в вещественном пространстве 257
§ 8L Матрицы специального вида . . , 260
Глава 10. Метрические свойства оператора 263
§ 82. Непрерывность и ограниченность оператора 263
§ 83. Норма оператора 265
§ 84. Матричные нормы оператора 269
§ 85. Операторные уравнения 272
§ 86. Псевдорешения и псевдообратный оператор 274
§ 87. Возмущение и невырожденность оператора 278
§ 88. Устойчивое решение уравнений 282
§ 89. Возмущение и собственные значения ,.. . . 287
ЧАСТЬ Ш. БИЛИНЕЙНЫЕ ФОРМЫ 291
Глава 11, Билинейные и квадратичные формы 291
§ 90. Общие свойства билинейных и квадратичных форм .... 291
§ 91. Матрицы билинейных и квадратичных форм 298
§ 92. Приведение к каноническому виду 304
§ 93. Конгруэнтность и матричные разложения 312
§ 94. Симметричные билинейные формы 318
§ 95. Гиперповерхности второго порядка 325
§ 96. Линии второго порядка 330
§ 97. Поверхности второго порядка . ¦ . . ? 338
Глав? 12. Билинейно метрические пространства 344
§ 98. Матрица и определитель Грама 344
§ 99. Невырожденные подпространства 351
§ 100. Ортогональность в базисах 355
§ 101. Операторы и билинейные формы 362
§ 102. Билинейно метрический изоморфизм 367
Глава 13. Билинейные формы в вычислительных процессах 370
§ 103. Процессы ортогонализации 370
| 104. Ортогонализация степенной последовательности 376
§ 105. Методы сопряженных направлений 381
§ 106. Основные варианты 387
§ 107. Операторные уравнения и псевдодвойственность 390
Заключение , . • ¦ , 395
Предметный указатель 397
ПРЕДИСЛОВИЕ
Настоящее учебное пособие представляет собой расширенный объ-
объединенный курс линейной алгебры и аналитической геометрии. Напи-
Написано оно на основе лекций, которые в течение нескольких лет чи-
читались автором на факультете вычислительной математики и кибер-
кибернетики Московского государственного университета им. М. В. Ломо-
Ломоносова.
Несколько слов об этой книге. Она предназначена, в основном, для
лиц, у которых вычислительная математика как предмет должна занять
существенное место в образовании. Во многом обучение по этой
специальности связано с традиционными математическими курсами.
Тем не менее приходится вносить изменения^как в методику их из-
изложения, так и в содержание.
С линейной алгеброй и аналитической геометрией студенты-вычис-
студенты-вычислители начинают знакомиться с первых же лекций. С первых же лекций
должно начинаться и формирование их научного мировоззрения. По-
Поэтому от того, что и как читается в данном курсе, во многом
зависит и будущее восприятие студентами всей вычислительной ма-
математики.
Существует немало хороших книг по линейной алгебре и аналити-
аналитической геометрии. Однако их прямое использование для обучения
оказывается затруднительным. Основная причина этого заключается,
на наш взгляд, в том, что будущим вычислителям требуется знать,
гораздо больше сведений из линейной алгебры, чем обычно дается
в имеющихся книгах. Они должны не только получить строгое и
систематическое изложение всех основ алгебры и геометрии, но уже
на первом курсе прикоснуться к тому огромному богатству, которое
накопила вычислительная алгебра.
Прикосновение к проблемам вычислений позволяет эффективно рас-
расставить необходимые для интересов вычислительной математики ак-
акценты в лекционном курсе и установить тесную связь между теорией
и численными методами в линейной алгебре. Основным материалом
для этого служат простейшие факты из таких разделов, как ошибки
округления, неустойчивость к возмущениям многих основных понятий
линейной алгебры, устойчивость ортонормированных систем, метриче-
метрические и нормированные пространства, сингулярное разложение, били-
билинейные формы и их связь с вычислительными процессами и т. д.
Конечно, включение нового и достаточно обширного материала
невозможно без существенной перестройки традиционного курса. По-
Попытка такой перестройки и предпринята в настоящей книге.
В. Воеводин
ЧАСТЬ I
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
ГЛАВА I
МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ
§ 1. Множества и элементы
В любой области деятельности нам постоянно приходится рас-
рассматривать различные совокупности объектов, объединенных некоторым
общим признаком.
Так, изучая конструкцию какого-либо механизма, мы можем рас-
рассматривать совокупность всех его деталей. При этом отдельным объ-
объектом данной совокупности может быть любая деталь, а признаком,
объединяющим эти объекты, — тот факт, что все они принадлежат
зполне определенному механизму.
Говоря о совокупности точек некоторой окружности на плоскости,
мы, по существу, говорим об объектах — точках плоскости, которые
объединены тем свойством, что все они равноудалены от некоторой
фиксированной точки.
Совокупность объектов, объединенных некоторым общим признаком,
принято называть в математике множеством, а сами объекты —
элементами множества. Понятию множества нельзя дать строгого
определения. Конечно, можно сказать (как мы это и сделали!), что
множество — это «совокупность», «система», «класс» и т. д. Однако
все это скорее похоже на формальное использование словарного бо-
богатства русского языка.
Для того чтобы определить какое-либо понятие, прежде всего
необходимо указать, каким образом оно связано с более общими
понятиями. Для понятия множества сделать это невозможно, так как
для него более общего понятия в математике нет. Поэтому вместо
определения понятия множества мы и вынуждены прибегать к его
иллюстрации на примерах.
Один из самых простых способов описания множества состоит в
том, что дается полный список элементов, входящих в само множест-
множество. Например, множество всех книг, доступных читателю библиотеки,
полностью определено их списками в библиотечных каталогах, множе-
множество всех цен на товары полностью определено прейскурантом цен
и т. д. Однако этот способ применим лишь к конечным множествам,
8 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. 1
т. е. таким, которые содержат конечное число элементов. Бесконечные
же множества, т. е. содержащие бесконечно много элементов, опреде-
определять с помощью списка нельзя. Как, например, составить список
всех вещественных чисел?
В тех случаях, когда множество нельзя или неудобно задавать при
помощи списка, его задают путем указания характеристического
свойства, т. е. такого свойства, которым обладают элементы множества
и только они. Например, в задачах на определение геометрических
мест характеристическим свойством множества точек, являющегося
решением самой задачи, является не что- иное, как совокупность усло-
условий, которым эти точки должны удовлетворять согласно требованиям
задачи.
Описание множества может быть очень простым и не вызывать
никаких трудностей. Например, если мы говорим о множестве, состоя-
состоящем из двух чисел 1 и 2, то ясно, что ни число 3, ни школьная тетрадь,
ни автомобиль не входят в это множество. В общем же случае
задание множеств их характеристическими свойствами иногда приводит
к осложнениям. Причин, из-за которых они возникают, довольно много.
Одна из причин может заключаться в недостаточной определенности
тех понятий, которые используются в описании множества. Пусть мы
рассматриваем множество всех планет Солнечной системы. О чем идет
речь? Известно 9 больших планет. Но вокруг Солнца обращается и
более тысячи милых планет, ийи астероидов. Диаметры некоторых
из этих планет измеряются сотнями километров, но есть и такие,
диаметры которых "не превышает 1 км. По мере совершенствования
методов наблюдения будут открываться все более и более мелкие пла-
планеты и, наконец, возникнет вопрос^ где же кончаются малые планеты
и начинаются метеориты и звездная пыль?
Не всегда затруднения с определением состава множества зависят
только от подобных причин. Иногда множества, на первый взгляд
вполне определенные, оказываются определенными очень плохо, а то
и совсем неопределенными. Пусть, например, некоторое множество
состоит из одного числа. Определим это число, как «наименьшее целое
число, которое нельзя определить при помощи фразы, имеющей менее
ста русских слов». Будем считать, что используются лишь слова,
взятые из некоторого словаря, и их грамматические формы, и что
при этом в словаре имеются такие слова, как «один», «два» и т. д.
Заметим, что, с одной стороны, такое число не должно сущест-
существовать, ибо оно определяется фразой менее чем из ста слов, выделен-
выделенной выше курсивом, а по смыслу этой фразы оно не может быть
определено подобным образом. Но с другой стороны, так как число
используемых русских слов конечно, то значит, есть числа, которые
нельзя определить фразой, имеющей менее ста слов, и следовательно,
среди этих чисел есть наименьшее.
В области математики, называемой теорией множеств, накопилось
немало примеров, когда определение самого множества внутренне про-
§ 2] АЛГЕБРАИЧЕСКАЯ ОПЕРАЦИЯ 9
тиворечиво. Изучение вопроса, диж каких условиях это может иметь
место, привело к глубоким исследованиям в области логики, однако
мы оставим эти исследования в стороне. Всюду в дальнейшем мы
будем считать, что рассматривается лишь множества, которые опре-
определены точно и без противоречий и состав которых не вызывает
никаких сомнений.
Как правило, мы будем обозначать множества прописными латин-
латинскими буквами А, В, ..., а их элементы — малыми а, Ь, ... Мы будем
писать хеА, если элемент х принадлежит множеству А, и хфА, если
элемент х не принадлежит множеству А.
Иногда мы будем вводить в рассмотрение так называемое пустое
множество, т. е. множество, которое не содержит ни одного элемента.
Использование пустого множества удобно там, где заранее неизвестно,
существует ли хотя бы один элемент в рассматриваемой совокуп-
совокупности
Упражнения.
1. Постройте примеры конечных и бесконечных множеств. Какие свойства
являются для них характеристическими?
2. Постройте примеры множеств, в описании которых содержится про-
противоречие.
3. Будет ли пустым множество .вещественных корней многочлена
3 4
4. Постройте примеры множеств, элементами которых являются мно-
множества.
5. Постройте примеры множеств, которые содержат себя в качестве одного
из своих элементов.
§ 2. Алгебраическая операция
Среди всевозможных множеств можно выделить такие множества,
над элементами которых допускается выполнение некоторых операций.
Пусть, например, мы рассматриваем множество всех вещественных
чисел. Тогда для каждого его элемента определены такие опера-
операции, как вычисление модуля этого элемента, вычисление синуса
этого элемента, для каждой пары элементов определены операции
их сложения и умножения.
В рассмотренном примере обратим особое внимание на следующие
особенности перечисленных операций. Во-первых, это определенность
всех операций для любых элементов из заданного множества, во-
вторых,— однозначность всех операций и, наконец, — принадлежность
результата выполнения любой операции к элементам того же мно-
множества. Такое положение имеет место далеко не всегда.
Операция может быть определенной не для всех элементов мно-
множества; например, вычисление логарифма не определенр для отри-
отрицательных чисел. Извлечение квадратного корня из положительных
чисел определено, но неоднозначно. Однако даже если операция
10 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл* 1
однозначно определена для всех элементов, результат ее выполнения
может не быть элементом заданного множества. Рассмотрим опера-
операцию деление на множестве целых положительных чисел. Ясно, что
для любых двух чисел из этого множества операция деления осу-
осуществима, но результат ее выполнения не обязательно будет целым
числом.
Пусть дано некоторое множество А, содержащее хотя бы один
элемент. Будем говорить, что в множестве А определена алгебраиче-
алгебраическая операция, если указан закон, по которому любой паре элементов
а и Ь, взятых из этого множества в определенном порядке, одно-
однозначным образом ставится в соответствие некоторый третий элемент с>
также принадлежащий этому множеству.
Эта операция может быть названа сложением, и тогда с будет
называться суммой элементов а и Ь и обозначаться символом
с = а + Ь; эта операция может быть названа умножением, и тогда
с будет называться произведением элементов а и Ъ и обозначаться
символом с = аЪ.
Вообще терминология и символика для операции, определенной
в множестве А, не будет играть в дальнейшем какой-либо суще-
существенной роли. Как правило, мы будем пользоваться символикой
суммы и произведения независимо от того, каким образом определена
операция в действительности. Если же нам потребуется подчеркнуть
некоторые общие свойства алгебраической операции, то будем обо-
обозначать операцию символом*.
Посмотрим на простых примерах, какими особенностями может
обладать алгебраическая операция. Пусть множество А представляет
собой совокупность всех положительных рациональных чисел. Введем
для элементов этого множества обычные операции умножения и де-
деления чисел и будем пользоваться общепринятой символикой. Не-
Нетрудно проверить, что обе операции на множестве А являются
алгебраическими. Однако, если для операции умножения ab = Ъа для
всех элементов из А, т. е. указание порядка элементов несуществен-
несущественно, то для операции деления, наоборот, порядок элементов весьма
существен, ибо равенство a:b = b;a возможно лишь в случае а = Ъ.
Таким образом, хотя алгебраическая операция и определена для
упорядоченной пары элементов, иногда упорядоченность элементов
бывает несущественной.
Алгебраическая операция называется коммутативной, если резуль-
результат ее применения не зависит от порядка выбора элементов, т. е.
для любых двух элементов а и Ъ из заданного множества имеет
место равенство а*Ъ — Ь*а. Очевидно, что среди общепринятых
арифметических операций над числами сложение и умножение яв-
являются коммутативными операциями, а вычитание и деление —
некоммутативными,
Пусть теперь взяты три произвольных элемента а, &, с. Тогда
естественно возникает вопрос, какой смысл придать выражению
§ 2] АЛГЕБРАИЧЕСКАЯ ОПЕРАЦИЯ 11
c? Как применить алгебраическую операцию, определенную
для двух элементов, к трем элементам?
Так как мы можем применять алгебраическую операцию лишь.
к паре элементов, то можно придать определенное значение вы-
выражению a*Z>*c, заключив в скобки либо два первых, либо два
последних элемента. В первом случае выражение примет вид (#*Ь)*с,
во втором — а * (Ь * с). Рассмотрим элементы d = a*b и е = Ь*с.
В силу того, что они являются элементами исходного множества,
(а*Ь)*с и а*(&*с) можно рассматривать как результат применения
алгебраической операции соответственно к элементам d, с и а, е.
Вообще говоря, элементы d*c и а*е могут оказаться различны-
различными. Рассмотрим снова множество положительных рациональных чи-
чисел с алгебраической операцией деления чисел. Легко убедиться,
что, как правило, (а\Ъ):сФ а:(Ь: с). Например, (C/2) : 3): C/4) =
-2/3, но C/2) :C: C/4)) = 3/8.
Алгебраическая операция называется ассоциативной, если для лю-
любых трех элементов а, Ь, с исходного множества а * (Ь * с) = (а * Ъ) * с.
Ассоциативность операции позволяет, говорить об однозначно оп-
определенном результате применения алгебраической операции к трем
элементам а, Ь, с, понимая под ним любое из равных выраже-
выражений а*(&*с) и (#*&)* с, и писать а*Ь*с без скобок.
В случае ассоциативной операции можно говорить и об одно-
однозначности выражения а± *а2*...*ап, содержащего любое конечное число
элементов аи а2, ..., ап. Под значением at*a2* ... *Оц. будем по-
понимать следующее. Расставим в этом выражении произвольным,
образом скобки, лишь бы его можно было определить путем
последовательного применения алгебраической операций к парам эле-
элементов. Например, для пяти элементов аь а2, аъ, а4, а5 скобки
можно расставить или так: а1*((а2*аъ)*(а4*а5)), или так: ((^*а2)*
*аз)*(а4*а5) и еще многими другими способами.
Докажем, что для: ассоциативной операции результат вычисления
не зависит от распределения скобок. В самом деле, дли п = 3
это утверждение вытекает из определения ассоциативной операции.
Поэтому полагаем л>3 и будем считать, что для всех чисел,
меньших п, наше утверждение уже доказанр.
Пусть даны элементы аи а2, ..., ап и некоторым образом рас-
распределены скобки, указывающие на порядок, в котором должна
выполняться операция. Заметим, что последним шагом будет всегда
выполнение операции над двумя элементами ai*a2*.***ak и ак + 1*
*ak + 2*... * ап для некоторого к, удовлетворяющего условию 1<Ки-1.
Так как оба выражения содержат меньше чем п элементов, то по
предположению они определяются однозначно и нам остается дока-
доказать, что для любых целых и положительных к, \ I ^ 1#
*а2 *.
= («1 ¦ 02 *••• *«л + д *(«* + /+1* ^ + /+2 *-
МНОЖЕСТВА. ЭЛЕМЕНТЫ, ОПЕРАЦИИ
12
Обозначив
мы получаем на основании ассоциативности: операции, что
рГл. X
и наше утверждение доказано.
Если операция не только ассоциативна, но и коммутативна, то
выражение а^аз* —*я« не зависит и от порядка элементов. До-
Доказательство этого утверждения мы предлагаем провести читателю
в качестве упражнения.
Не следует думать, что коммутативность и ассоциативность ода-
рации каким-то образом связаны между собой. Можно построить
операции с самыми различными сочетаниями этих свойств. Мы уже
видели на примерах умножения и деления чисел, что операций
может быть коммутативной и ассоциативной или некоммутативной
и неассоциативной. Рассмотрим еще два примера. Пусть множество
состоит из трех элементов at b, с. Зададим алгебраические операции
такими таблицами:
*
а
Ь
с
а
а
с
Ъ
b
с
Ъ
а
с
Ъ
а
с
*
а
b
с
а
а
Ъ
G
Ъ
а
Ъ
с
с
а
Ъ
с
B.1)
и пусть первым всегда выбирается элемент по столбцу, вторым —
элемент по строке, а результат операции берется на месте пересе-
пересечения соответствующих строки и столбца. В первом случае опера-
операция, очевидно, коммутативна, но не ассоциативна, так как, например,
(а * Ь) * с = с * с = с,
а * (Ь * с) = а *а = а.
Во втором случае операция не коммутативна, но ассоциативна,
в чем легко убедиться непосредственной проверкой.
Упражнения.
1. Будет ли алгебраической операция вычисления tgx на множестве,
всех вещественных чисел xl
2. Рассмотрим множество вещественных чисел х9 удовлетворяющих не-
неравенству \х\< 1. Будут ли на этом множестве алгебраическими операций
умножения, сложения, деления и вычитания чисел?
3. Будет ли коммутативной и ассоциативной алгебраическая операция
х2 + у на множестве всех вещественных чисел х, у?
§ 3] ОБРАТНАЯ ОПЕРАЦИЯ 13
4. Пусть множество состоит только из одного элемента. Как опреде-
определить на этой* множестве алгебраическую операцию?
5. Постройте примеры алгебраических операций на множестве, элемента-*
ми которого также являются множества. Являются ли эти операции ком-»
мутативныш, ассоциативными?
§ 3. Обратная операция
Пусть в множестве А задана некоторая алгебраическая операция.
Как мы знаем, она ставит в соответствие любым двум элементам
а, Ъ из А некоторый третий элемент с = а*Ь. Рассмотрим сово-
совокупность С тех элементов из А, которые Moryt быть представлены
как результат выполнения заданной алгебраической операции. Ясно,
что какова бы ни была алгебраическая операция, все элементы
из С являются одновременно и элементами из А, Однако совсем
необязательно, *ггобы все элементы из А входили в С.
Действительно, зафиксируем в множестве А некоторый элемент
/ и поставим его в соответствие любой паре элементов а, Ъ из
А. Очевидно, что построенное таким образом соответствие есть
алгебраическая операция, причем коммутативная и ассоциативная.
Множество С будет Содержать всего лишь один элемент /, незави*
симо от того, сколько элементов содержит множество А.
Какие именно элементы из А входят в С, определяется ал-
алгебраической операцией. Пусть она такова, что С совпадает с А,
т. е. оба множества содержат одни и те же элементы. Тогда ка-
каждый элемент из А может быть представлен как результат вы-
выполнения заданной алгебраической операции над какими-то двумя
элементами того же множества А. Конечно, подобное представление
может быть неединственным.. Тем не менее, мы заключаем, что
каждому элементу из А можно поставить в соответствие определен-
определенные пары элементов из А,
Таким образом, исходная алгебраическая операция порождает на
множестве А некоторую другую операцию. Эта операция может не
быть однозначной, так как одному элементу может ставиться в
соответствие более одной пары. Но даже в случае ее однозначнос-
однозначности она не будет алгебраической, так как определена не для любой
пары элементов, а лишь для одного элемента, хотя он и может
быть произвольным. По отношению к заданной алгебраической опе-
операции новую операцию естественно было бы назвать «обратной»
операцией. Однако в действительности под обратной операцией мы
будем понимать нечто иное, более близкое к понятию алгебраической
операции.
Заметим, что исследование «обратной» операции эквивалентно
исследованию тех элементов и, v, которые удовлетворяют равенству
b C.1)
14 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. 1
при различных элементах Ь. Исследование данного уравнения отно-
относительно двух элементов и, v легко сводится к исследованию двух
уравнений относительно одного элемента. Для этого достаточно-
зафиксировать один из них, а из уравнения C.1) определять другой.
Итак, исследование «обратной» операции математически эквивалентно
решению уравнений
~Ъ, у*а — Ъ C.2)
относительно элементов х, у из А при различных фиксированных
элементах а, Ъ из А,
Предположим, что уравнения C.2) имеют, и притом единственные,
решения при любых а, Ь. Тогда каждой упорядоченной паре эле-
элементов а, Ъ из А мы можем поставить в соответствие одно-
однозначно определенные элементы х, у из А, т. с ввести две ал-
алгебраические операции. Эти операции называются соответственно
правой и левой обратными операциями по отношению к основной
операции. В случае их существования мы будем говорить, что
основная операция имеет обратную операцию. Отметим, что рас-
рассмотренный выше пример показывает, что алгебраическая операция,
даже коммутативная и ассоциативная, может и не иметь ни правой,
ни левой обратных операций.
Наличие обратной операции в действительности означает наличие
двух, вообще говоря, различных алгебраических операций — правой
и левой обратных. Поэтому мы вынуждены говорить о различных
элементах х, у. Если же алгебраическая операция коммутативна
и обратная операция для нее существует, to очевидно, что х = у
и правая обратная операция совпадает с левой.
Рассмотрим некоторые примеры. Пусть множество А представ-
представляет собой всю вещественную ось и алгебраической операцией яв-
является обычное умножение чисел. Эта операция на данном множестве
не имеет обратной, так как, например, при а = О, Ь — \ равенства
C.2) не могут иметь место ни при каких числах х и у. Если
же мы рассмотрим операцию умножения, заданную лишь на множе-
множестве положительных чисел, то теперь эта операция уже будет
иметь обратную.
В самом деле, при любых положительных числах а и Ъ суще-
существуют, и при этом единственные, положительные числа х, у, удо-
удовлетворяющие равенствам C.2). Обратная операция в данном случае
является не чем иным, как делением чисел. Тот факт, что в действи-
действительности х = у, сейчас для нас не представляет никакого интереса.
Операция сложения чисел не имеет обратной, если она задана
на множестве положительных чисел, так как, например, равенства
C.2) не могут выполняться ни при каких положительных числах
х, у, если а = 2, Ь = 1. Если же операция сложения чисел задана
на всей вещественной оси, то обратная операция существует и есть
не что иное, как вычитание чисел.
§ 4] ОТНОШЕНИЕ ЭКВИВАЛЕНТНОСТИ 15
Пример операций умножения и сложения чисел показывает, что
прямая и обратная операции могут иметь самые различные свойства.
Из ассоциативности или коммутативности алгебраической операции
совсем не обязательно должна следовать ассоциативность или ком-
коммутативность обратной операции, даже если обратная операция су-
существует. Более того, как мы уже отмечали выше, коммутативная
и ассоциативная алгебраическая операция может просто не иметь
ни правой, ни левой обратных операций.
Эти простые примеры показывают и еще одно важное обстоя-
обстоятельство. Рассмотрим снова операцию умножения на множестве
положительных чисел. Для этой операции правая и левая обратные
операции совпадают и представляют собой Деление чисел. На первый
взгляд может показаться, 'что теперь для операции деления чисел
обратной операцией будет умножение чисел. Однако это не совсем так.
Действительно, напишем соответствующие уравнения C.2)
Тогда очевидно, что
х — а:Ь, у = а-Ь.
Следовательно, правая обратная операция для деления чисел есть
снова деление чисел, а левая обратная операция есть умножение
чисел. Таким образом, операция, обратная к обратной, не обяза-
обязательно совпадает с исходной алгебраической операцией.
Упражнения.
1. Существуют ли правые и левые обратные операции для алгебраических
операций, заданный таблицами B.1)?
2. Что представляют собой правая и левая обратные операций для
алгебраической операции х*у~ху9 определенной на множестве положитель-
положительных чисел х, у?
3. Доказать, что если правая и левая обратные операции совпадают,
то исходная алгебраическая операция коммутативна.
4. Доказать, что если алгебраическая операция имеет обратную, то
правая и левая обратные операции также имеют обратные. Что представляют
собой эти операции?
5. Постройте пример алгебраической операции, для которой все четыре
обратные к обратным операции совпадают с исходной.
§ 4. Отношение эквивалентности
Заметим, что в проведенном обсуждении свойств алгебраической
операции мы неявно предполагали возможность проверки любых двух
элементов множества на их совпадение или несовпадение между собой.
Более того, с совпадающими элементами мы обращались довольно
свободно, не делая между ними различия в каких бы то ни было
случаях. Мы нигде не предполагали, что совпадающие элементы
действительно представляют собой один элемент, а не являются
16 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ {Гл. 1
различными объектами. По существу же мы лишь исдользовали то, что
некоторая группа элементов, которые мы называли равными, в опре-
определенных ситуациях проявляет себя одинаково,
С таким положением мы встречаемся довольно часто. Исследуя
общие свойства подобных треугольников, мы в действительности
не делаем никакого различия между любыми треугольниками, которые
имеют одинаковые углы. С точки зрения свойств, сохраняющихся при
подобном преобразовании, эти треугольники неотличимы и могли бы
быть названы «равными». Исследуя признаки равенства треугольников,
мы не делаем никакого различия между треугольниками, которые рас-
расположены в разных местах плоскости, но могут быть совмещены при
их перемещении.
В самых различных вопросах мы будем сталкиваться с необходи-
необходимостью разбиения того или иного множества на группы элементов,
объединенных по некоторому признаку. Если при этом ви один элемент
не принадлежит двум различным группам, то мы будем говорить.
О разбиении множества на непересекающиеся группы или на классы.
Признаки, по которым элементы множества разбиваются на классы,
хотя и могут быть самыми различными, но все же они не совсем
произвольны. Предположим, например, что мы захотели бы разбить
ни классы все вещественные числа, включая числа а и Ь в один
и тот же класс тогда и только тогда, когда Ь > а. Тогда ни одно
шсло а не может попасть в один класс с самим собой, так как
а не больше, чем само а. Следовательно, никакого разбиения на
классы по данному признаку быть не может.
Пусть задан некоторый признак. Будем считать, что в отношении
любой пары элементов а,.Ь из множества А можно сказать, что либо
элемент а связан с элементом Ъ данным признаком, либо не связан
с ним. Если элемент а связан с Ъ9 то будем писать а~Ь и говорить,
что а эквивалентен Ъ,
Уже анализ простейших примеров подсказывает те условия, которым
должен удовлетворять признак для того, чтобы можно былр до нему
осуществить разбиение множества А на классы. Именно:
1. Рефлексивность: а о* а для всех аеА.
2. Симметричность: если а ~ 6, то Ъ ~ а:
3. Транзитивность: если а~Ь и b ~ с, то а~ с.
Признак, удовлетворяющий этим условиям, называется отношением
эквивалентности.
Докажем, что любое отношение эквивалентности дозволяет разбить
множество на классы. Действительно, пусть Ка — группа элементов
из А9 эквивалентных фиксированному элементу а. В силу свойства
рефлексивности аеКа. Покажем, что две группы Ка и Къ либо совпа-
совпадают, либо не имеют общих элементов.
Пусть некоторый элемент с принадлежит Ка и Къ, т.е. с~а
и C'vft. В силу свойства симметрии имеем а~ с, а в силу свойства
транзитивности а^Ьи, конечно, Ъ ~ а. Если теперь хеКф то х ~ а и,
§ 4] ОТНОШЕНИЕ ЭКВИВАЛЕНТНОСТИ 17
следовательно, х ~ Ь, т.е. хеКъ. Аналогично, если хеКъ, то отсюда
вытекает, что хеКа. Таким образом, две группы, имеющие хотя бы
один общий элемент, полностью совпадают, и мы действительно
получили разбиение множества А на классы.
Любые два элемента с точки зрения рассматриваемого признака
могут быть либо эквивалентными, либо неэквивалентными. Ничто не
изменится, если эквивалентные элементы мы назовем равными (в отно-
отношении данного признака!)? а неэквивалентные — неравными (в отношении
того же признака!).
Может показаться, что при этом мы пренебрегаем смыслом слова
«равнш», ведь теперь элементы, равные при одном признаке, могут
оказаться неравными при другом признаке. Однако в этом нет ничего
неестественного. В каждой конкретной задаче мы различаем или не раз-
различаем элементы лишь в отношении тех их свойств, которыми интере-
интересуемся именно в данной задаче. А в разных задачах мы можем
интересоваться различными свойствами одних и тех же элементов.
В дальнейшем мы будем считать, что всюду, где это необходимо,
для элементов множества должен быть определен признак равенства,
позволяющий сказать, что элемент а равен элементу Ъ или не равен
ему. Если элемент а равен элементу Ь, то будем писать а = Ъ и
а ф Ъ — в противном случае. Будем предполагать также, что признак
равенства является отношением эквивалентности. При этом условия
рефлексивности, симметричности и транзитивности можно рассматри-
рассматривать как отражение наиболее общих свойств обычного отношения
равенства чисел.
Введение отношения равенства позволяет разбить все множество
на классы элементов, которые по тем или иным причинам мы решили
считать равными. Это означает, что различие между элементами,
входящими в один класс, не имеет для нас никакого значения. Следо-
Следовательно, во всех ситуациях, которые мы будем в дальнейшем рассмат-
рассматривать, элементы, названные равными, должны проявлять себя оди-
одинаково.
Если отношение равенства мы будрм вводить аксиоматически, т. е* без
ссылок на конкретную природу элементов, условимся считать, что
употребление знака равенства означает лишь то, что элементы, стоящие
по обе его стороны,, просто совпадают, — это один и тот же элемент.
В случае такого употребления знака равенства свойства рефлексивности,
симметричности и транзитивности не нуждаются в особом соглашении.
При разбиении множества на классы равных элементов каждый класс
будет состоять лишь из одного элемента.
В случае, когда отношение равенства мы будем вводить, опираясь
на конкретную природу элементов, может случиться, что некоторые
или все классы равных элементов будут состоять более чем из одного
элемента. Это заставляет нас при введении тех или иных операций
над элементами накладывать на сами операции дополнительное тре-
требование.
18 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. 1
В самом деле, как мы договорились, равные элементы должны
проявлять себя одинаково. Поэтому каждая вводимая операция, при-
примененная к равным элементам, обязана теперь давать равные резуль-
результаты. В действительности мы нигде не будем останавливаться на про-
проверке выполнения этого требования, а предоставляем читателю самому
убедиться в справедливости данного свойства у вводимых операций.
Упражнения.
1. Можно ли разбить все страны земного шара на классы, помещая две
страны в один класс тогда и только тогда, когда они имеют общую границу?
Если нельзя, то почему?
2. Рассмотрим множество городов, имеющих автомобильное сообщение.
Назовем два города А и В связанными; если из А можно по автодороге
проехать в В. Можно ли разбить города по этому признаку на классы?
Если можно, то что представляют собой классы?
3. Назовем два комплексных числа а и Ь равными по модулю, если
[a| = |b|. Будет ли этот признак отношением эквивалентности? Что пред-
представляет собой разбиение на классы?
4. Рассмотрим алгебраические операции сложения и умножения комплексных
чисел. Как они действуют на классах равных по модулю элементов?
5. Постройте примеры алгебраических операций на множестве, определенном
в упражнении 2. Как эти операции действуют на классах?
§ 5. Направленные отрезки
Рассмотренные выше примеры могут создать впечатление, что все
разговоры об операциях над элементами множеств имеют отношение
лишь к операциям над различными числовыми множествами. Однако
это не так. В дальнейшем мы построим немало примеров нечисловых
множеств с операциями, но пока рассмотрим лишь один пример,
к которому будем постоянно обращаться на протяжении всего курса.
Фундаментальнейшими понятиями физики являются такие понятия,
как сила, перемещение, скорость, ускорение. Все эти понятия характери-
характеризуются не только числом, определяющим их величину, но и некоторым,
направлением. Мы построим сейчас геометрический аналог подобных
понятий.
Пусть даны две различные точки А и В в пространстве. На прямой
линии, проходящей через них, эти точки естественным образом опре-
определяют некоторый отрезок. Будем считать, что сами точки всегда
даются в определенном порядке, например, А — первой, а В — второй.
Теперь мы можем на построенном отрезке определить направление,
а именно, направление от первой точки А ко второй точке В.
Отрезок вместе с заданным на нем направлением называется на-
направленным отрезком с началом А и концом В. Направленный отрезок
мы будем называть иначе вектором, а точку А — точкой приложения
вектора. Вектор с точкой приложения А мы будем называть закреп-
закрепленным в точке А.
§ 5\ НАПРАВЛЕННЫЕ ОТРЕЗКИ 19
Для направленных отрезков или векторов мы будем применять,
двоякое обозначение. Если мы должны подчеркнуть, что речь идет
о направленном отрезке с началом в точке А и концом в точке В,
то будем писать символ АЁ. Если же нас не будет интересовать, какие
конкретно точки направленного отрезка являются граничными, то в этом
случае будем применять более простые обозначения, например, малые
латинские буквы. На чертежах направленные отрезки мы будем обозна-
обозначать стрелками, причем острие стрелки всегда будем рисовать в конеч-
конечной точке отрезка.
В направленном отрезке существенно, какая из граничных точек
является началом, а какая — концом. Поэтому направленные отрезки
АЁ и ВА мы будем считать различными.
Итак, мы можем построить различные множества, элементами кото-
которых являются направленные отрезки. Прежде чем вводить операции
над элементами, определим, какие направленные отрезки мы будем
считать равными.
Рассмотрим сначала параллельный перенос направленного отрезка
АЁ в точку С. Пусть точка С не лежит на прямой, проходящей
через А и В (рис. 5.1). Тогда проведем прямую, проходящую через
точки А и С, затем прямую, проходящую через точку С и параллельную
прямой АВ, и наконец, прямую, проходящую через точку В и парал-
параллельную прямой АС. Точку пересечения двух последних прямых обозна-
обозначим через D. Направленный отрезок Си и будем считать полученным
в результате параллельного переноса от-
отрезка АИ в точку С. Если же точка С "я
лежит на прямой, проходящей через А и В,
то отрезок сб получается путем сдвига
отрезка АЁ вдоль содержащей его прямой
до совпадения точки А с точкой С.
Теперь мы можем дать определение
равенства векторов. Два вектора назы- —
ваются равными, если они могут быть ' р
совмещены друг с другом при параллель- ис" ' *
ном переносе. Нетрудно видеть* что это определение равенства явля-
является отношением эквивалентности, т. е. обладает свойствами рефлексив-
рефлексивности, симметричности и транзитивности.
Таким образом, совокупность всех векторов естественным образом
разбивается на классы равных векторов. Достаточно просто описать
каждый из этих классов. Он получается путем параллельного переноса
любого из векторов класса во все точки пространства.
Заметим, что в любой точке пространства закреплен один и только
один вектор из каждого класса равных векторов. Поэтому при срав-
сравнении векторов а, Ъ можно пользоваться следующим приемом. Зафикси-
Зафиксировав некоторую точку, перенесем параллельно в нее векторы а, Ь.
Если при этом они полностью совпадут, то а — Ь и афЬ в про-
противном случае.
20 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. !
Кроме множества, состоящего из всех векторов пространства, мы
часто будем иметь дело и с другими множествами. В основном
это будут множества векторов, либо параллельных некоторой прямой
линии или лежащих на ней, либо параллельных некоторой плоскости
или лежащих на ней. Такие векторы мы будем называть соответственно
коллинеарными и компланарными. Конечно, на множествах коллинеарных
и компланарных векторов мы сохраняем данное выше определение
равенства векторов.
Мы будем рассматривать и так называемые нулевые направленные
отрезки, у которых начало и конец совпадают. Направление нулевых
векторов не определено и все они по определению считаются рав-
равными. Если указание граничных точек нулевого вектора не является
обязательным, то этот вектор мы будем обозначать символом 0.
Опять же по определению мы будем считать, что любой нулевой
вектор параллелен любой прямой линии и любой плоскости. Поэтому
всюду в дальнейшем, если не сделано особой оговорки, мы будем
предполагать, что множество векторов пространства, а также любое
множество коллинеарных или компланарных векторов включает в
себя и множество всех нулевых векторов. Об этом не следует
забывать.
Упражнения.
1. Доказать, что ненулевые векторы пространства можно разбить на классы
ненулевых коллинеарных векторов.
2. Доказать, что любой класс ненулевых коллинеарных векторов можно
разбить на классы ненулевых равных векторов.
3. Доказать, что любой класс ненулевых равных векторов целиком входит
в один и только один класс ненулевых коллинеарных векторов.
4. Можно ли разбить ненулевые векторы пространства на классы компла-
компланарных векторов? Если нельзя, то почему?
5. Доказать, что любое множество ненулевых компланарных векторов-
Можно разбить на классы ненулевых коллинеарных векторов.
6. Доказать, что любая пара различных классов ненулевых коллинеарных
векторов целиком входит в одно и только одно множество ненулевых компла-
компланарных векторов.
§ б. Сложение направленных отрезков
Как уже отмечалось, сила, перемещение, скорость, ускорение являются
прообразами построенных нами направленных отрезков. Чтобы эти
отрезки оказались полезными при решении различных физических
задач, мы должны и при введении операций над ними учитывать
соответствующие физические аналогии.
Хорошо известна операция сложения сил, осуществляемая по так
называемому правилу параллелограмма. По такому же правилу склады-
складываются и перемещения, скорости, ускорения. Согласно введенной терми-
терминологии эта операция является алгебраической, коммутативной и ассо-
СЛОЖЕНИЕ НАПРАВЛЕННЫХ ОТРЕЗКОВ
21
р р
Ь мы будем называть
циативной. Наша ближайшая задача будет заключаться в построении
подобной операции над направленными отрезками.
Операцию сложения векторов определим следующим образом. Пусть
нужно сложить векторы а и Ъ. Перенесем вектор Ъ параллельно
в конец вектора а (рис. 6.1). Тогда суммой а
вектор, начало которого совпадает с началом а,
а конец — с концом Ь. Это правило выпол-
выполнения операции обычно называется «правилом
треугольника».
Очевидно, что операция сложения векторов
является алгебраической. Докажем, что она
коммутативна и ассоциативна.
Для доказательства коммутативности операции предположим сна-
сначала, что векторы а и Ъ не коллинеарны. Приложим их к общему
началу О (рис. 6.2). Обозначим буквами А и В концы векторов а и Ъ
соответственно и рассмотрим параллелограмм ОВСА. Из определения
равенства векторов следует, что
Рис. 6.1.
Но тогда одна и та же диагональ ОС параллелограмма ОВСА есть
^ О
Рис. 6.3,
одновременно а + Ь и Ъ + а. Случай коллинеарности векторов а и Ъ
очевиден.
Заметим, что попутно мы получили другой способ построения
суммы векторов. Именно, если на векторах а, Ь, закрепленных в одной
точке, построен параллелограмм, то его диагональ, закрепленная в той
же точке, будет суммой а + Ь.
Для доказательства ассоциативности операции сложения приложим
вектор а к произвольной точке О, вектор Ъ — к концу вектора а
и вектор с — к концу вектора Ъ (рис. 6.3). Обозначим буквами А, В, С
концы векторов а, Ь, с. Тогда
22 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. 1
В силу транзитивности отношения равенства векторов заключаем, что
ассоциативность операции тоже имеет место.
Доказанные свойства операции сложения векторов позволяют вы-
вычислять сумму любого числа векторов. Если приложить вектор а2
к концу вектора аи вектор аъ — к концу вектора а2 и т. д. и, наконец,
вектор ап — к концу вектора аи_ь то сумма ах + а2 + ... + ап будет
представлять собой вектор, начало которого совпадает с началом аъ
а конец — с концом ап. Это правило построения суммы векторов
называется «правилом замыкания ломаной до многоугольника».
Поставим теперь вопрос о существовании обратной операции для
сложения векторов. Как известно, для ответа на него необходимо
исследовать существование и единственность решения уравнений
а + х = Ь, у + а = Ь
при произвольных векторах а, Ъ. В силу коммутативности основной
операции, очевидно, достаточно исследовать лишь одно из этих урав-
уравнений. ?
Возьмем произвольный направленный отрезок АВ. С помощью эле-
элементарного геометрического построения устанавливаем, что всегда
имеют место соотношения
Поэтому уравнение , > >
AB + x = CD F.2)
при любых векторах АВ и CD заведомо будет иметь хотя бы одно
решение, например,
х = ВА + (Й. F.3)
Предположим, что уравнению F.2) удовлетворяет и некоторый
другой вектор z, т. е.
ЛВ + х = СД AB + z = CD.
Тогда, прибавляя к обеим частям этих равенств В А, мы получим с уче-
учетом F.1), что х = В А + CD, z — ВАЛ- CD, и следовательно, х = z.
Таким образом, для введенной нами операции сложения существует
обратная операция. Эта операция называется вычитанием векторов.
Если для векторов а, Ь, с имеет место равенство а + с = Ь, то будем
символически писать, что с = b — а. Вектор Ь — а, однозначно определяе-
определяемый векторами Ь и а, называется разностью этих векторов. Обоснование
для такого обозначения и названия мы приведем несколько позднее.
Легко указать правило для построения разности двух заданных
векторов а, Ъ. Приложим эти векторы к общей точке и построим на них
параллелограмм (рис. 6.4). Мы уже показали выше, что одна диагональ
параллелограмма есть сумма заданных векторов. Другая диагональ,
как легко видеть, есть разность тех же векторов. Описанное правило
§ 71 ГРУППЫ 23
построения суммы и разности векторов обычно называется «правилом
параллелограмма».
Заметим, что мы могли бы определить операцию сложения не для
множества всех векторов пространства, а лишь для одного из мно-
множеств коллинеарных или компланарных векто-
векторов. Сумма двух векторов из любого такого
множества снова будет принадлежать тому
же множеству. Поэтому операция сложения
векторов остается алгебраической и в этом
случае. Более того, она сохраняет и теперь
все свои свойства и. что особенно важно, р
по-прежнему обладает обратной операцией. ис' ' '
Справедливость последнего утверждения вытекает из формулы F.3).
Если векторы АВ и CD параллельны некоторой прямой линии или
плоскости, то очевидно, что таким же будет вектор В А + CD или, что
то же самое, вектор разности CD — АВ.
Таким образом, операция сложения векторов является алгебраи-
алгебраической, коммутативной, ассоциативной и имеет обратную на множествах
трех типов: на множестве векторов пространства, множестве коллине-
коллинеарных векторов и множестве компланарных векторов.
Упражнения.
1. К одной из вершин куба приложены три равные по величине силы,
направленные вдоль ребер. Как направлена сумма этих сил?
2. Пусть даны три различных класса коллинеарных векторов. В каком
случае любой вектор пространства может быть представлен как сумма трех
векторов из этих классов?
3. К вершинам правильного многоугольника приложены равные по величине
силы, направленные к центру. Чему равна сумма этих сил?
4. Что представляет собой множество сумм векторов, взятых из двух
различных классов коллинеарных векторов?
§ 7, Группы
Множества с одной алгебраической операцией в некотором смысле
являются самыми простыми, и поэтому естественно начать наши
исследования именно с таких множеств. Мы будем считать свойства
операции аксиомами и затем выводить из них следствия. Это позволит
в дальнейшем сразу применить результаты наших исследований ко всем
множествам, в которых операции имеют аналогичные свойства, незави-
независимо от конкретных особенностей.
Группой называется множество G с одной алгебраической операцией,
ассоциативной (хотя не обязательно коммутативной), причем для этой
операции должна существовать обратная операция.
Заметим, что обратную операцию нельзя считать второй независимой
операцией в группе, так как она определяется через основную. Назовем,
24 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. i
так это принято в теории групп, операцию, заданную в G, умножением
И условимся употреблять соответствующую символику. Прежде чем
начинать рассмотрение различных примеров групп, выведем простейшие
следствия из самого определения.
Возьмем произвольный элемент а группы G. Из существования
обратной операции в группе вытекает существование единственного эле-
элемента еа такого, что аеа = а. Следовательно, этот элемент играет такую
же роль при умножении на него* элемента а справа, как и единица
при умножении чисел. Пусть далее Ъ -* любой другой элемент группы.
Очевидно, что существует элемент у9 удовлетворяющий равенству
уа = Ъ. Теперь получаем
Ъ = У а = у (ае^ = (у а) еа = Ьеа.
Итак, еа играет роль правой единицы по отношению ко всем
элементам группы G, а не только по отношению к а. Элемент,
обладающий подобным свойством, должен быть единственным. В самом
деле, все такие элементы удовлетворяют уравнению ах = а, но, согласно
определению обратной операции, это уравнение имеет единственное
решение. Обозначим полученный элемент через ег.
Аналогичным путем можно доказать существование и единствен-
единственность в группе G элемента е", удовлетворяющего равенству е"Ъ = Ъ для
всех элементов Ь из G. В действительности элементы е' и е" совпа-
совпадают, что вытекает из равенств. е"е' = е" и е"е' = е\
Таким образом, мы получили первое важное следствие: во всякой
группе G существует, и притом единственный, элемент е, удовлетворяю-
удовлетворяющий равенствам
ае = еа = а
для всех а из G. Этот элемент называется единицей группы G.
Из определения обратной операции вытекает далее существование
н единственность для любого элемента а таких элементов а' и а", что
ad = е, а" а = е.
Эти элементы называются соответственно правым и левым обратными
элементами. Легко показать, что в данном случае они совпадают
между собой. Действительно, рассмотрим элемент d'ad и вычислим
его двумя разными способами. Имеем
d'ad = a"{ad) = a"e = a",
a"ad = {a"a)d = ed = d.
Следовательно, а" = d. Этот элемент называется обратным элементом
к элементу а и обозначается через а".
Теперь мы получили второе важное следствие: во всякой группе
G любой элемент а обладает единственным обратным элементом а~\
для которого
аа-^а^а^е. G.1)
§ 7] ГРУППЫ 25
На основании ассоциативности групповой операции можно говорить
об однозначности произведения Любого конечного числа элементов
группы, заданных (ввиду возможной некоммутативности групповой
операции) в определенном порядке. Учитывая соотношения G.1), не-
нетрудно указать общую формулу для элемента, обратного к произве-
произведению. Именно
аух = ^ Ч~Л*Г *
Из соотношения G.1) вытекает, что элементом, обратным к аГх9
будет сам элемент а, а обратным элементом для единицы будет
сама единица, т. е.
(а-1)-1-* е~* = е. G.3)
Проверка того факта, является ли группой множество с одной
ассоциативной операцией, весьма облегчается тем, что в определении
группы требование выполнимости обратной операции можно заменить
предположением о существовании единицы и обратных элементов,
причем лишь с одной стороны (например, правой) и без предположения
об их единственности. Точнее, справедлива следующая
Теорема 7.1. Множество G с одной ассоциативной операцией
будет группой, если в G существует хотя бы один элемент е, обладаю-
обладающий свойством ае = а для всех а из G, и по отношению к нему
всякий элемент а из G обладает хотя бы одним правым обратным
элементом а~1, т. е. ааГ1 — е.
Доказательство. Пусть а~х — один из правых обратных эле-
элементов для а. Имеем
аа~х — е~ее — еааГх.
Умножим обе части этого равенства справа на один из элементов,
правых обратных для а~х. Тогда получим, что ае = еае9 откуда вытекает
равенство а = еа, так как е есть правая единица для G. Таким образом,
элемент е оказывается и левой единицей для G.
Если теперь е' — произвольная правая единица, е" — произвольная
левая единица, то из равенств е"ег — е' и е"е' — е" следует, что е' = е'\
т. е. любая правая единица равна любой левой. Этим доказаны существо-
существование и единственность в множестве G единичного элемента, который
мы снова обозначим через е.
Имеем, далее, для любого правого обратного элемента а следую-
следующие соотношения:
Умножим обе части этого равенства справа на один из элементов,
правых обратных для а. Тогда получим, что е — а~ха, т.е. элемент
а является одновременно и левым обратным элементом для а.
Если теперь а~ v — произвольный правый обратный элемент для сц а"Ха —
26 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. 1
произвольный левый обратный элемент, то из равенств
a~vaa~v = {a~vd)a~r = ea~v = a~v9
a~v'aa~v = a~v(aa~v) = a~v'e = a~v'
вытекает, что a~v — a~v>. Это означает существование и единственность
для всякого элемента а из G обратного элемента а.
Теперь легко показать, что множество G будет группой. Действи-
Действительно, уравнениям ах — Ъ, уа = Ь будут заведомо удовлетворять эле-
элементы _± .
Предположим, что существуют и другие решения, например, элемент z
для первого уравнения. Тогда из равенств ах — Ъ и az = b следует,
что ах = az. Умножая обе части слева на элемент а~ *, получим, что
х — z. Итак, множество G есть группа.
Группа называется коммутативной или абелевой, если групповая
операция коммутативна. В этом случае операция, как правило, называется
сложением и вместо символа произведения аЪ пишут символ суммы
а + Ъ. Единицу абелевой группы называют нулевым элементом и обозна-
обозначают символом 0. Обратную операцию называют вычитанием, а обрат-
обратный элемент — противоположным. Обозначают его символом — а. Мы
будем считать, что по определению символ разности а — Ъ означает
сумму а + ( — Ь).
Если все же по каким-либо причинам операцию в коммутативной
группе мы будем называть умножением, то тогда обратную опера-
операцию будем считать делением. Равные в этом случае произведения
а~хЪ и Ьа~х будем обозначать через Ь/а и называть частным от
деления Ъ на а.
Упражнения.
Докажите, что следующие множества являются абелевыми группами. Всюду
название операции отражает не символику, а содержание.
1. Множество: целые числа; операция: сложение чисел.
2. Множество: комплексные числа, кроме нуля; операция: умножение чисел.
3. Множество: целые числа, кратные числу 3; операция: сложение чисел.
4. Множество: положительные рациональные числа; операция: умножение
чисел.
5. Множество: числа вида а + Ъ]/2, где а, Ь — положительные рациональ-
рациональные числа; операция: умножение чисел.
6. Множество: один элемент а; операция называется сложением и опреде-
определяется равенством а + а — а.
7. Множество: целые числа 0, 1, 2, ..., и —1; операция называется
«сложением по модулю п» и заключается в вычислении неотрицательного
остатка, меньшего и, от деления суммы двух чисел на число п.
8. Множество: целые числа 1, 2, 3, ..., п — 1, где п — простое число; опера-
операция называется «умножением по модулю п» и заключается в вычислении
неотрицательного остатка, меньшего п, от деления произведения двух чисел
на число п.
§ 8] КОЛЬЦА И ПОЛЯ 27
9. Множество: коллинеарные направленные отрезки; операция: сложение
направленных отрезков.
10. Множество: компланарные направленные отрезки; операция: сложение
направленных отрезков.
11. Множество: направленные отрезки пространства; операция: сложение
направленных отрезков.
В отношении последних трех примеров заметим, что нулевым элементом
абелевой группы направленных отрезков будет нулевой^ направленный отрезок,
а противоположным отрезком для ЛИ будет отрезок вХ. Из доказанного выше
следует их единственность. Примеры некоммутативных групп мы приведем
позднее.
§ 8. Кольца и поля
Рассмотрим множество К, в котором введены две операции. Назовем
одну из них сложением, а другую — умножением и будем использо-
использовать соответствующую символику. Будем предполагать, что обе опера-
операции связаны законом дистрибутивности, т. е. для любых трех элементов
a, Ъ, с из К имеют место соотношения
(a + b)c = ac + be, a(b + с) — ab + ас.
Множество К называется кольцом, если в нем определены две
операции — сложение и умножение, обе ассоциативные, а также свя-
связанные законом дистрибутивности, причем сложение коммутативно
и обладает обратной операцией. Кольцо называется коммутативным,
если умножение коммутативно, и некоммутативным — в противном
случае.
Заметим, что любое кольцо является абелевой группой по сложе-
сложению. Следовательно, в нем существует единственный нулевой элемент 0.
Этот элемент обладает тем свойством, что для всякого элемента а
из кольца имеет место равенство
а + 0 - а.
Определение нулевого элемента было дано нами лишь по отноше-
отношению к операции сложения. Однако и по отношению к умножению
этот элемент играет особую роль. Именно, во всяком кольце произ-
произведение любого элемента на нулевой элемент есть нулевой элемент.
В самом деле, пусть а ~ любой элемент из кольца К, тогда
Прибавляя к обеим частям этого равенства по элементу — а • 0, полу-
получим, что а-0 = 0. Аналогично доказывается, что и 0-а = 0.
Пользуясь этим свойством нулевого элемента, можно доказать, что
во всяком кольце для любых элементов a, b справедливо равенство
(-«)Ь =-(<*)•
Действительно. ,
28 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. 1
т.е. элемент (~а)Ь является противоположным для элемента ab.
Согласно нашим обозначениям мы можем его записать в виде — (ab).
Теперь легко показать, что закон дистрибутивности справедлив
и для разности элементов. Имеем
(а - Ъ)с = (а + (- Ъ))с = ac + (-b)c = ac + (- (be)) = ac- be,
а(Ь - с) = a(b + (- с)) = ab + а(- с) = аЪ + (- (ас)) = аЬ - ас.
Закон дистрибутивности, т. е. обычное правило раскрытия скобок,
является единственным требованием в определении кольца, связываю-
связывающим сложение и умножение. Лишь благодаря этому закону совместное
изучение двух указанных операций дает больше, чем можно было бы
получить при их раздельном изучении.
Мы только что доказали, что алгебраические операции в кольце
обладают многими привычными для нас свойствами операций над
числами. Не следует думать, однако, что любое свойство сложения
и умножения чисел сохраняется во всяком кольце, пусть даже и комму-
коммутативном. Так, умножение чисел обладает свойством, обратным свойству
умножения на нулевой элемент. Именно, если произведение двух чисел
равно нулю, то хотя бы один из множителей равен нулю. Это свойство
3 произвольном коммутативном кольце уже не обязательно имеет
место, т. е. произведение элементов, не равных нулевому, может быть
и нулевым.
Ненулевые элементы, произведение которых есть нулевой элемент,
называются делителями нуля. Их наличие в кольце существенно
усложняет исследование и не позволяет провести глубокой аналогии
между числами и элементами коммутативного кольца. Эту аналогию
дает рассмотрение таких колец, в которых делители нуля отсутст-
отсутствуют.
Предположим, что по отношению к операции умножения в ком-
коммутативном кольце есть единичный элемент е и каждый ненулевой
элемент а имеет обратный элемент аГ1. Нетрудно доказать, что
и единичный и обратный элементы единственны, однако самым важным
обстоятельством является то, что теперь кольцо не имеет делителей
нуля. Действительно, пусть ab — О, но а Ф 0. Умножая обе части этого
равенства слева на элемент а, получим, что
а~х ab = (а~1 a)b ~eb = b
и, конечно, а~10 = 0. Следовательно, b = 0.
Из отсутствия делителей нуля вытекает, что любое равенство
можно сократить на ненулевой общий множитель. Если са = cb и с Ф 0,
то с(а — Ь) = 0, откуда заключаем, что а — b = 0, т. е. а = Ь.
Коммутативное кольцо Р, в котором есть единичный элемент и каж-
каждый ненулевой элемент имеет обратный, называется полем.
Используя запись частного а/b в виде произведения аЬ", легко
показать, что во всяком поле сохраняются все обычные правила обра-*
щения с дробями с точки зрения операций сложения, вычитания.
§ 8] КОЛЬЦА И ПОЛЯ 29
деления и умножения. Именно,
ас ad ±bc ас ас — а а
±
Кроме Этого, а/Ь = c/d тогда и только тогда, когда ad = be, если,
конечно, Ъ Ф О и d Ф 0. Проверку справедливости этих утверждений
мы предоставляем читателю в качестве упражнений.
Итак, все поля с точки зрения обычных правил обращения с дро-
дробями неотличимы от множества чисел. По этой причине мы элементы
любого поля будем называть числами, если, конечно, такое название
не будет приводить к какой-либо двусмысленности. Как правило, нулевой
элемент любого поля мы будем обозначать символом 0, а единичный
элемент — символом 1.
Перечислим теперь все нужные нам в дальнейшем общие факты
об элементах любого поля.
A. Каждой паре элементов а, Ъ отвечает элемент а + Ь, называемый
суммой а и Ь, причем:
1) сложение коммутативно, a + b = b + а,
2) сложение ассоциативно, а + (Ь + с) = (а + Ь) + с,
3) существует единственный нулевой элемент 0 такой, что а + 0 = а
для любого элемеща а,
4) для каждого элемента а существует единственный противополож-
противоположный элемент — а такой, что а + (— а) = 0.
B. Каждой паре элементов а, Ъ отвечает элемент аЪ, называемый
Произведением а и Ь, причем:
1), умножение коммутативно, аЪ = Ьа,
2) умножение ассоциативно, a(bc) — (ab)c9
3) существует единственный единичный элемент 1 такой, что
п* 1 = 1 • а = а для любого элемента а,
4) для каждого ненулевого элемента а существует единственный
обратный элемент а такой, что аа~х = а~х а = 1.
C. Операции сложения и умножения связаны между собой следую-
следующим соотношением: умножение дистрибутивно относительно сложения,
(а + Ь) с = ас + be.
Перечисленные факты не претендуют на логическую независимость,
а являются лишь удобной характеристикой элементов. Свойства А опи-
описывают поле с точки зрения операции сложения и говорят о том, что
по отношению к этой операции поле является абелевой группой.
Свойства В описывают поле с точки зрения операции умножения
и говорят о том, что по отношению к этой операции поле становится
абелевой группой, если из него исключить нулевой элемент. Свойство С
описывает связь двух операций между собой.
Упражнения.
Докажите, что множества 1—7 являются кольцами, но не полями, а мно-
множества 8 — 13 являются полями. Всюду название операции отражает не сим-
символику, а содержание.
30 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. I
1. Множество: целые числа; операции: сложение и умножение чисел.
2. Множество: целые числа, кратные некоторому числу п; операции: сло-
сложение и умножение чисел.
3. Множество: действительные числа вида а + Ьу2, где а и Ъ — целые
числа; операции: сложение и умножение чисел.
4. Множество: многочлены с действительными коэффициентами от одной
переменной t9 в том числе константы; операции: сложение и умножение
многочленов.
5. Множество: один элемент а; операции определяются равенствами
а + а = а и а- а~ а.
6. Множество: целые числа 0, 1, 2, ..., п — 1, где п•— составное число;
операции: сложение и умножение по модулю п.
7. Множество: пары (а, Ь) целых чисел; операции определяются форму-
(а, Ь) + (с, d) = (а + с, Ь + d); (а, Ь) • (с, d) = (ас, bd).
8. Множество: рациональные числа; операции: сложение и умножение
чисел.
9. Множество: действительные числа; операции: сложение и умножение
чисел.
10. Множество:* комплексные числа; операции: сложение и умножение
чисел.
11. Множество: действительные числа вида a + bj/2, где а и Ъ — рацио-
рациональные числа; операции: сложение и умножение чисел.
12. Множество: два элемента а, Ь\ операции определяются равенствами
a + a = b + b — a, a + b — b + a = b,
a-a — a-b — b-a^a, b-b — b.
13. Множество: целые числа 0, 1, 2, ..., п — 1, где п — простое число;
операции: сложение и умножение по модулю п.
Обращаем внимание читателя на то, чтр в одном из примеров приведено
кольцо с делителями нуля. Что это за пример? Каков общий вид делителей
нуля?
§ 9. Умножение направленного отрезка на число
Подчеркнем еще раз, что алгебраическая операция была определена
нами как операция над двумя элементами, принадлежащими одному
и тому же множеству. Однако многочисленные примеры из физики
подсказывают, что иногда бывает разумным рассмотрение и операций
над элементами, принадлежащими разным множествам. Одна из таких
операций подсказывается понятиями силы, перемещения, скорости,
ускорения, и мы рассмотрим ее опять на примере направленных
отрезков.
В физике уже давно принято пользоваться отрезками. И если
говорят, что, например, сила увеличилась в 5 раз, то при этом
изображающий ее отрезок «растягивают» в 5 раз, не изменяя общего
направления. Если же говорят об изменении направления действия
силы, то в соответствующем отрезке начальную и конечную точку
§ 9] УМНОЖЕНИЕ НАПРАВЛЕННОГО ОТРЕЗКА НА ЧИСЛО 31
меняют местами. Исходя из этих соображений, мы введем операцию,
называемую умножением направленного отрезка на вещественное число.
Рассмотрим сначала некоторые общие вопросы. Пусть на плоскости
или в пространстве задана произвольная прямая линия. Условимся
считать одно из направлений на ней положительным, а противопо-
противоположное — отрицательным. Прямую, на которой определено направление,
мы будем называть осью.
Предположим теперь, что дана какая-нибудь ось и, кроме этого,
указан масштабный отрезок, с помощью которого может быть измерен
любой другой отрезок и тем самым определена его длина. С каждым
направленным отрезком на оси свяжем его числовую характеристику,
так называемую величину направленного отрезка.
Величиной {АВ} направленного отрезка АВ называется число, рав-
равное длине отрезка АВ, взятой со знаком плюс, если направление АВ
совпадает с положительным направлением оси, и взятой со знаком
минус, если направление АВ совпадает с отрицательным направлением
оси. Величины всех нулевых направленных отрезков считаются равными
нулю, т.е.
{АА} = 0.
Независимо от того, какое направление на оси принято положи-
положительным, направление АВ противоположно направлению ВА, а длины
направленных отрезков АВ и ВА равны, следовательно,
{АВ} = - {ВА}. (9.1)
Величина направленного отрезка, в отличие от его длины, может
иметь любой знак. Так как длина направленного отрезка АВ есть
модуль его величины, то для ее обозначения мы будем употреблять
символ \АВ\. Ясно, что в отличие от (9.1)
Пусть на оси заданы три любые точки А, В, С, которые определяют
три направленных отрезка АВ, ВС и АС. При любом расположении
точек величины этих направленных от-
отрезков удовлетворяют соотношению • • • ^
Щ + {ВС} = {АС}. (9.2) ° А В
ъ Рис. 9.1.
В самом деле, предположим, что
направление оси и расположение точек таково, как, например, на
рис.. 9.1. Тогда очевидно, что
\СА\ + \АВ\ = \СВ\. (9.3)
Согласно определению величины направленного отрезка и равенству
32 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИЙ [Гл 1
(9.1) имеем
-» -> ~> (9.4)
Поэтому из (9.3) следует
что совпадает по существу с (9.2).
При доказательстве мы использовали только соотношения (9.3)
И (9.4), которые зависят лишь от взаимного расположения точек А,
Ву С на оси, но не зависят от их совпадения или несовпадения друг
с другом. Ясно, что при любом другом расположении точек дока-
доказательство проводится аналогично.
Тождество (9.2) называется основным тождеством. С точки зрения
операции сложения векторов, лежащих на оси, оно означает, что
{АВ + ВС} = {АВ} + {ВС}. (9.5)
Величина направленного отрезка определяет сам отрезок на оса
с точностью до параллельного переноса. Но если учесть, что и равные
направленные отрезки определены с точностью до параллельного
переноса, то это означает, что величина направленного отрезка одно-
однозначно определяет на заданной оси всю совокупность равных направ-
направленных отрезков. ^
Пусть теперь задан направленный отрезок АВ и число ос. Произ-
Произведением у-АВ направленного отрезка АВ на вещественное число а
называется направленный отрезок, лежащий на оси, проходящей через
точки А, В, и имеющий величину,, равную а • {АВ}, Таким образом,
ио определению
(м ЛТ}Л ж# f Л 1У\ /ft /Л
\ОС • AD г == 06 * \/xJj (» \У .01
Для любых чисел ос, C и любых направленных отрезков а, Ь Опе-
Операция умножения направленного отрезка на число обладает следую-
следующими свойствами:
аа/ Ж^У*.
(ос + Р)а = оса -f Ра, ос(а + Ъ) •
Первые три свойства весьма простые. Для
их доказательства достаточно заметить, что
в левых и правых частях равенств стоят
рис <J2 векторы, лежащие на одной оси„ и восполь-
воспользоваться соотношениями (9.5), (9.6). Дока-
Докажем четвертое свойство. Предположим для простоты, что а > 0. Прило-
Приложим векторы а, Ъ к общей точке и построим на них параллелограмм,
диагональ которого будет равна а + Ь (рис. 9.2). При умножении
§ 10] ЛИНЕЙНЫЕ ПРОСТРАНСТВА 33
векторов а, Ъ на а диагональ параллелограмма в силу подобия фигур
также умножится на а. Но это и означает, что аа + ocb = а(а + Ь).
Отметим в заключение, что введение величины направленного
отрезка можно трактовать как введение некоторой «функции»
$ = {*}, (9.7)
«аргументом» которой являются векторы х одной и той же оси,
а «значением» — вещественные числа !;. При этом
(9>8)
для любых векторов х и у на оси и любого числа X.
Упражнения.
1. Доказать, что результат выполнения операции умножения на число
не зависит от того, каким образом определено положительное направление
на оси.
2. Доказать, что результат выполнения операции умножения на число
не зависит от того, каким образом определен масштабный отрезок на оси.
3. Доказать, что операция умножения на число* определенная на любом
множестве коллинеарных отрезков, не будет выводить из этого множества.
4. Доказать, что операция умножения на число, определенная на любом
множестве коллинеарных отрезков, не будет выводить из этого множества.
5. Что представляют собой нулевой и противоположный направленные
отрезки с точки зрения операции умножения на число?
§ 10. Линейные пространства
Решение любых задач сводится, в конце концов, к изучению
некоторых множеств и, в первую очередь, к изучению строения этих
множеств. Строение множеств может изучаться самыми различными
способами. Например, исходя из характеристического свойства, кото-
которым обладают элементы, как это делается в задачах на построение
геометрических мест, или исходя из свойств операций, если они
определены для элементов.
Последний способ представляется особенно заманчивым в силу
своей общности. Действительно, мы уже видели неоднократно, что
в самых различных множествах могут быть введены самые различные
операции, но обладающие, тем не менее, одинаковыми свойствами.
Поэтому очевидно, что если при исследовании множеств мы получаем
некоторый результат, опираясь лишь на свойства операции, то этот
результат будет иметь место во всех множествах, где операции
обладают такими же свойствами. При этом конкретная природа как
самих элементов, так и операций над ними может быть совсем
различной.
Несколько ранее мы ввели в рассмотрение новые математические
объекты, названные направленными отрезками или векторами, и
2 В. В. Воеводин
U МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ \Гж I
определили: операции над ними. Известно, что в дейстштельноетй за век-
векторами стоят вполне реальные физические объекты. Поэтому деталь-
детальное исследование строения множеств векторов представляет интерес
по крайней мере для физики.
Уже сейчас мы имеем три типа множеств, в которых операции
имеют одни и те же свойства. Это — множество коллинеарных векторов,
множество компланарных векторов и множество векторов во всем,
пространстве. Несмотря на то, что в этих множествах введены одни
и те же операции, мы вправе ожидать, что строение самих множеств
должно быть различным.
Есть некоторый соблазн в простоте указанных множеств, приво-
приводящий к желанию изучать их, опираясь лишь на конкретные особен-
особенности элементов. Однако нельзя не замечать и того, что эти мно-
множества имеют очень много общего. Поэтому целесообразно щжступить
к их изучению с некоторых общих позиций, надеясь хотя бы на то,
что нам удастся избежать нудных и однообразных повторений при
переходе от исследования одного множества к другому. Но, кро-
кроме этого, мы надеемся, конечно, и на то, что если у нас поя-
появится какое-либо множество с аналогичными свойствами, на нега
сразу же можно будет перенести все результаты выполненных иссле-
исследований.
Перечислим все известные нам общие факты относительно векто-
векторов, образующих любое из трех рассматриваемых множеств.
A. Каждой паре векторов х, у отвечает вектор х + у, называемый
суммой х и у, причем:
1) сложение коммутативно, х + у = у 4- х,
2) сложение ассоциативно, х + (у + z) — (х + у) + z,
3) существует единственный нулевой вектор 0 такой, что х -f 0 **= х
для любого вектора х,
4) для каждого вектора х существует единственный противополож-
противоположный вектор —х такой, что х + (—х) = 0.
B. Каждой паре ос, х, где а — число, ах — вектор, отвечает вектор otx,
называемый произведением а и х, причем:
1) умножение на числа ассоциативно, а($х)~ (оф)х,
2) 1 • х = х для любого вектора х.
C. Операции сложения и умножения связаны между собой следую-
следующими соотношениями:
1) умножение на число дистрибутивно относительно сложения
векторов, ос(х + у) — ах + <ху,
2) умножение на вектор дистрибутивно относительно сложения
чисел, (а + Р) х = ах + Рх.
Как и в случае поля, перечисленные факты не претендуют на логи-
логическую независимость. Свойства А описывают множество векторов
с точки зрения операции сложения и говорят о том, что оно по
отношению к этой операции является абелевой группой. Свойства В
описывают множество векторов с точки зрения отерадии умножения
I 10] ЛИНЕЙНЫЕ ПРОСТРАНСТВА 35
вектора на число. Свойства С описывают связь двух операций между
собой.
Рассмотрим теперь множество К и поле Р произвольной природы.
Множество К будем называть линейным пространством над полем Р,
если для всех элементов из К определены операции сложения и ум-
умножения на числа из Р, причем выполнены аксиомы А, В, С. Согласно
этой терминологии мы можем Сказать, что множество коллинеарных
векторов, множество компланарных векторов и множество векторов
во всем пространстве являются линейными пространствами над полем
вещественных чисел.
Элементы любого линейного пространства мы будем называть
векторами, несмотря на то, что по своей конкретной природе они
могут быть совсем не похожи на направленные отрезки. Геометри-
Геометрические представления, связанные с названием «векторы», помогут нам
уяснить и часто предвидеть нужные результаты, а также помогут
находить не всегда очевидный геометрический смысл в различных
фактах.
Векторы линейного пространства мы по-прежнему будем обозна-
обозначать малыми латинскими буквами, числа —малыми греческими бук-
буквами. Мы будем называть линейное пространство рациональным,
вещественным или комплексным в зависимости от того, является ли
поле Р полем рациональных, вещественных или комплексных чисел,
и обозначать соответственно через D, R и С. Тот факт, что в назва-
названии и обозначении отсутствует какая-либо ссылка на элементы самого
пространства, имеет глубокий смысл, но о нем мы будем говорить
существенно позднее.
Прежде чем переходить к детальному исследованию линейных
пространств, приведем простейшие следствия из существования опера-
операций сложения и умножения на число. Они будут касаться в основном
нулевого и противоположного векторов.
В любом линейном пространстве для каждого элемента х имеет
место равенство
где в правой части 0 означает нулевой вектор, а в левой 0 — число
нуль. Для доказательства этого соотношения рассмотрим элемент
О • х + х. Имеем
Следовательно,
х = 0 • х + х.
Прибавляя к обеим частям равенства элемент — хь находим
2**
36 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. 1
Теперь легко указать явное выражение для противоположного
элемента — х через сам элемент х. Именно,
Справедливость этой формулы вытекает из простых соотношений
х + (-1)х = 1-х + (-1)х = A-1)х = 0-х = 0.
Это в свою очередь позволяет доказать справедливость соотношений
-(ах) = (-°0х = а(-х),
так как
- (осх) = (-1)(ах) = (-а)х = ос((-1)х) * ос(-х).
Напомним, что по определению операции вычитания х — у = х + (—у)
для любых векторов х и у. Явное выражение для противоположного
вектора позволяет показать справедливость дистрибутивных законов
и для разности. В самом деле, каковы бы ни были числа а, р и век-
векторы х, у, будем иметь
(а - Р)х = ах + (-Р)х = ах + (- (Рх)) = ах - рх,
а(х - j/) = а(х + (-1)у) = ах + (-а) j/ = ах + (- (сну)) = ах - ау.
Отсюда, в частности, следует, что для любого числа а
а-0 = 0,
так как
а • 0 = а (х — х) = ах — ах = ах + (—ах) = 0.
И наконец, последнее следствие. Если для какого-нибудь числа а
и вектора х имеет место соотношение
ах = 0, A0.1)
то либо а = 0, либо х = 0. Действительно, если равенство A0.1) имеет
место, то может быть одна из двух возможностей: либо а = 0, либо
а Ф 0. Случай а = 0 подтверждает наше утверждение. Пусть теперь
а ф 0, тогда
х = 1. х = (— . а Ах = — (ах) = — • 0 = €.
\а ) а а
Отсюда, в частности, вытекает, что в любом линейном простран-
пространстве любое равенство формально можно сокращать на общий ненуле-
ненулевой множитель независимо от того, является ли этот множитель чис-
числом или вектором. В самом деле, если ах = рх и х Ф 0, то (а — р) х = 0,
и тогда а — р = 0, т. е. а = р. Если же ах = ау и а Ф 0, то а (х — у) = 0
и тогда х — у = 0, т. е. х = у.
Итак, с точки зрения операций умножения, сложения и вычитания
формально имеют место все правила эквивалентных преобразований
§ 11] КОНЕЧНЫЕ СУММЫ И ПРОИЗВЕДЕНИЯ 37
алгебраических выражений. В дальнейшем мы эти правила уже НО будем
оговаривать особо.
На этом мы заканчиваем наше первое знакомство с линейными
пространствами. Отметим лишь только, что мы не случайно записали
свойства операций в поле и в линейном пространстве в единой форме.
Существуют черты разительного сходства (и в равной мере различия)
между аксиомами поля и линейного пространства над полем. Читателю
следует над ними задуматься..
Упражнения.
Докажите, что следующие множества являются линейными пространствами.
Всюду название операции отражает не символику, а содержание.
1. Поле: вещественные числа; множество: вещественные числа! сложение:
сложение вещественных чисел; умножение на число: умножение вещественного
числа на вещественное число.
2. Поле: вещественные числа; множество: комплексные числа; сложение:
сложение комплексных чисел; умножение на число: умножение комплексного
числа на вещественное число.
3. Поле: рациональные числа; множество: вещественные числа; сложение:
сложение вещественных чисел; умножение на число: умножение вещественного
числа на рациональное число.
4. Поле: любое число; множество: один вектор а; сложение: сложение
определяется правилом а + а = а; умножение на число: умножение вектора а
на любое число а определяется правилом оса = а.
5. Поле: вещественные числа; множество: многочлены с действительными
коэффициентами от одной переменной ?, в том числе константы: сложение:
сложение многочленов; умножение на число: умножение многочлена на ве-
вещественное число.
6. Поле: рациональные числа; множество: числа вида а + b]/l + cj/3 +
/5, где а, Ь, с, d — рациональные числа; сложение: сложение чисел ука-
указанного вида; умножение на число: умножение числа указанного вида на ра-
рациональное число.
7. Поле: любое поле; множество: то же самое поле; сложение: сложение
элементов (векторов!) поля; умножение на число: умножение элемента (век-
(вектора!) поля на элемент (число!) поля.
§ 11. Конечные суммы и произведения
Поля и линейные пространства будут основными множествами,
с которыми нам придется иметь дело в дальнейшем. В этих мно-
множествах введены две операции — сложение и умножение. Если выпол-
выполняется большое число операций над элементами, то появляются вы-
выражения, содержащие значительное число слагаемых и сомножителей.
Для удобства их записи мы введем соответствующую символику. При
этом будем предполагать, что сложение и умножение являются ком-
коммутативными и ассоциативными операциями.
Пусть дано конечное число не обязательно различных элементов.
Будем считать, что все элементы перенумерованы каким-то образом
38 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИЙ [Гл. 1
й имеют номера, меняющиеся подряд от некоторого числа к до
какого-то числа р. Обозначать элементы будем одной буквой с ука*
ЗанйеМ номера. Сам номер, который в дальнейшем будем называть
индексом, может в обозначении занимать произвольное место. Индекс
*^ежет стоять рйдом с буквой в скобках, внизу около буквы, вверху
около буквы и т.д. Это не имеет никакого значения. Чище всего мы
будем писать его рядом с буквой справа внизу.
Будем обозначать сумму элементов аь ак+1, ¦.*, ар символом
следующего вида:
v
ак + fl*+i +... + ар - ? аг. A1.1)
Ивдекд i в этой формуле называется индексом суммирования. Конечно,
ничего не изменится, если мы обозначим его любой другой буквсщ.
Иногда под знаком суммы будет явно указываться та совокупность
индексов, по которым осуществляется суммирование. Например,
сматриваемую сумму мы могли бы записать и так:
Очевидно, что если каждый элемент щ равен произведению элемента
и элемента а, где а не зависит от индекса суммирования i, то
** = ex ? h
i = k i = k
т. е. множитель, не зависящий от индекса суммирования, можйо Шйо-
сить за знак суммы.
Предположим теперь, что элементы отмечены двумя индексами,
каждый из которых меняется независимо. Примем для этих элшентрв
общее обозначите а^ и пусть, ндпрцмер, k^i^p, m^j^n. Распо-
Расположу элементы в виде прямоугольной таблицы
акт ак,т+1 •• • акю
ак+1,т ак+1,т-\-{ ••• ак+1,п>
Ясно, что в каком бы порядке мы ни производили суммирование,
результат будет одним и тем же. Поэтрму с учетом
обозначения для суммы получаем
(акм + ак> ш+1 + ... + ак1^ + (ак+1> т 4- ak+it ж+1 + ... + ak+i> „)
• • • + (ат + ар, m+i + .., + арп) =
j—m j=m j~m i = k\j—m
§• II! КОНЕЧНЫЕ СУММЫ И ПГОИЗВДЩНЯ
С другой стороны, эта же сумма равна
|+ х + ••' + #? m+1) -К ..-
р р
Следовательно,
р п / р \
•• • • "Г" L, пШ — 2^ I la aU J
i=k\j=m J j=m\i=k
шы усяоймися, что буд€м всегда производите
йоследошательво по индексам сумм, расположенных справа вддерр* то
скобки можно ойуетить ж окончательно получаем
р П П р
Это (ШШйег, что йрй суммировании йо двум индексам мозкно
шш&ять порядок суммирования. Если, напршлер,, Рц^шф^ гдр дц
Же З>амш1 ot ШЕд^кса j, то
р п р п
результаты имеют место для сумм цо любому
йндё&со®.
аь ак+и..,%яр будем
акак+х...ар= flat.
Теперь, еоли at « ab,-, ад
Как и в сяучде суммирования, при вычислении прризведения по двум
индексам можно изменять порядок вычисления прсяМеДейда, т. е.
П П"« = ПП%
Все эти факты доказываются пр тш жф рамой рхем& чтр и в случае
суммирования чисел.
40 МНОЖЕСТВА, ЭЛЕМЕНТЫ, ОПЕРАЦИИ [Гл. 1
Упражнения.
Вычислить следующие выражения:
п п п п
п т
Е 1
п
i=l
и
1,
п
Е
т
ЕA' +5-
s=l
« rt
X1 *2 X
= 1 1=1
п
s), X
eg-ix
m p
j=lfe=l
п т р
ft 2, ftio», ПП2-Ч ПП f[2i+J+k.
§ 12. Приближенные вычисления
Рассмотренные нами множества весьма широко используются
в самых различных теоретических исследованиях. При этом Для полу-
получения результата почти всегда приходится выполнять какие-либо опе-
операции над элементами самих множеств. Особенно часто возникает
необходимость в проведении вычислений с элементами числовых полей.
Мы хотим обратить внимание на очень важную особенность практи-
практической реализации таких вычислений.
Пусть для определенности мы имеем дело с полем вещественных
чисел. Предположим, что каждое число представлено в виде бесконеч-
бесконечной десятичной дроби. Ни человек, ни самая современная вычисли-
вычислительная машина не могут оперировать с бесконечными дробями.
Поэтому на практике каждую такую дробь заменяют близкой к ней
конечной десятичной дробью или подходящим рациональным числом.
Итак, точное вещественное число заменяется приближенным. В тео-
теоретических исследованиях, подразумевающих точное задание чисел,
довольно часто то или иное выражение заменяется равным ему, хотя
и записанным, может быть, в другой форме. Конечно, в этом случае
такая замена не может вызывать ни возражений, ни даже сомнений.
Если же мы хотим вычислить некоторое выражение с помощью
приближенно заданных чисел, то уже совсем не безразлично, в какой
форме задано выражение.
Рассмотрим простой пример. Легко проверить, что в случае точ-
точного задания числа |/2
/ Д A2.1)
Так как |/2 = 1,4142..., то числа 7/5 = 1,4 и 17/12 = 1,4166... можно
считать приближенными значениями для ]/2. Но подставляя 7/5 в левую
и правую часть A2.1), мы получаем 0,00509 ... и 1,0 соответственно.
Для 17/12 имеем 0,00523 ... и —0,1666 ... Результаты подстановки зна-
значительно отличаются друг от друга, и не сразу видно, какой из них
ближе к верному. Это показывает, с какой осторожностью нужно
обращаться с приближенными числами.
§ 12] ПРИБЛИЖЕННЫЕ ВЫЧИСЛЕНИЯ 41
Мы остановились лишь на одном источнике появления приближен-
приближенных чисел — округлении точно заданных чисел. В действительности
есть немало и других источников. Например, исходные данные для
вычислений часто получаются из эксперимента, а каждый эксперимент
может дать результат лишь с ограниченной точностью. Уже при таких
простейших операциях, как умножение и деление, может сильно возрасти
количество разрядов в дробях. Поэтому мы будем вынуждены отбро-
отбросить часть разрядов в результатах промежуточных вычислений, т.е.
опять вынуждены заменить некоторые числа приближенными и т.д.
Детальное исследование действий с приближенными числами выхо-
выходит за рамки нашего курса. Однако к обсуждению различия между
теоретическими и практическими вычислениями мы будем возвращаться
довольно часто. Необходимость такого обсуждения вызвана тем, что
теоретические вычисления, как правило, нельзя реализовать в точном
виде.
Упражнения.
1. Какой конечной десятичной дробью надо приблизить ]/2, чтобы
в результатах вычисления левой и правой частей A2.1) совпадали первые
шесть разрядов?
2. Пусть результат выполнения каждой операции над двумя веществен-
вещественными числами округляется по любому известному Вам правилу до t разрядов
после запятой. Сохраняются ли при этом свойства коммутативности и ассо-
ассоциативности операций?
3. Будут ли в условиях предыдущего упражнения выполняться дистрибу-
дистрибутивные законы?
4. К какому выводу Вы приходите, если в упражнениях 2 и 3 получены
отрицательные ответы?
ГЛАВА 1
СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА
§ 13. Линейные комбинации и оболочки
® линейном пространстве К, заданном над полем Р,
выбрана конечное чшсло произвольных не обязательно различных
векторов е±9 е2, ». *, еп. Будем называть эти векторы системой векторов.
Одну систему векторов будем называть подсистемой второй системы,
если первая система содержит лишь какие-то векторы второй системы
и не содержит никаких, других векторов.
Над векторами заданной системы и векторами, получающимися
из йих, будш выполнять операции сложения и умножения на числа.
Ясно, что любой вектор х вида
+ a&z + . -. + оде* A3.1)
где ось ос2, ..., ап — некоторые числа из поля F, получается из векто-
роэ заданной сиртемы ей е2* •*•> ^« ПРИ яомрщд этих рд^радий.
Более того, в каком бы порядке ни выполнялись эти опердции, мы
§утч иояучать м&теры вида A3.1),
В отношении вектора х из A3.1) говорят, что он линейно виража*
ется через векторы еи е2, ..., ten. Правую часть A3.1) называют
линейной комбинацией этих векторов, числа ос17 а2} ..., ып называют
коэффициентами линейной комбинации.
Зафиксируем систему векторов еъ е2, ..., е„ и позволим коэффи-
коэффициентам линейных комбинаций принимать любые значений из поля Р.
Тогда будет определено некоторое множество векторов из К. Это
множество называется линейной оболочкой векторов еъ еъ ..., еп и
обозначается L(eu e2, ..., еп).
Наш интерес к линейным оболочкам объясняется двумя обстоя-
обстоятельствами. Во-первых, любая линейная оболочка устроена просто —
это совокупность всех линейных комбинаций векторов заданной сис-
системы. Во-вторых, линейная оболочка любой системы векторов из
любого линейного пространства сама является линейным простран-
пространством.
В самом деле, выполнение всех аксиом линейного пространства
почти очевидно. Некоторого пояснения требуют, может быть, лишь
аксиомы, относящиеся к нулевому и противоположному вектору.
Нулевой вектор заведомо принадлежит любой линейной оболочке
и соответствует нулевым значениям коэффициентов линейной комби-
§ 13] линлйнш КФМёШШдеи и оболочки 43
нации, т.е.
0==0.^ + 0.^ + ... + 0-en.
Вектор, противоположный для вектора A3.1), будет таким:
-х = (~осх) ех + (-а2) е2 +,.> + (-од <?,,
Единственность нулевого и противоположного векторов cMffytf й§ их
единственности как векторов линейного пространства К.
Заметим, что линейная оболочка векторов ех, е2, ..., еп есть
«наименьшее» линейное пространство, содержащее эти векторы. В самом
деле, сама линейная оболочка состоит лишь из линейных комбинаций
векторов еи еъ ...* eh, а всякое линейцое пространство^ содержащее
еи еъ ,..* eh, обязано содержать и все их линейные комбинации.
Итак, любое линейное пространство содержит в себе в общем
случае бесчйсленйое множество других линейных пространств * линей-
линейных оболочек. Теперь возникают такие вопросы:
При каких условиях линейные оболочки двух различных систем
векторов состоят из одних и тех же векторов исходного пространства?
Какое минимальное число векторов определяет одну и ту же линей-
линейную оболочку?
Является ли исходное линейное пространство линейной оболочкой
каких-либо своих векторов?
На эти и другие вопросы мы получим ответы р ближдйщее Вр#мя.
При этом будет весьма широко использоваться понятие л*шейшш
комбинации, в особенности свойство ее транзитивности. Им&щю> если
некоторый вектор z есть линейная комбинация векторов %и х2,- ,*,-, xf9
а каждый из них, в свою очередь, есть линейная комбинация врктороэ
Уъ Уъ ¦••? У&-> то и вектор z может быть представлен к#к линейная
комбинация векторов yl9 уъ ..., ys. Докажем эт^
-кроме ^тфго, для всех номеров i, i^i^r9
где pf и jij =~ ^а^ие-то числа из поля Р.
Подставляя выражение для хь в правую наст? A3,2) Ш
соответствующие свойства конечных сумм, йолучаем
* = ? рл * i ^ ? ууу, * ? ?
1 ^
jl
44. СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА [Гл. 2
где коэффициенты |; означают такие выражения:
Итак, транзитивность понятия линейной комбинации действительно
имеет место.
Упражнения.
1. Что представляют собой в пространстве направленных отрезков линей-
линейные оболочки систем из одного, двух, трех и большего числа направленных
отрезков?
2. Рассмотрим линейное пространство многочленов, зависящих от перемен-
переменной t и заданных над полем вещественных чисел. Что представляет собой
линейная оболочка системы векторов t2 + i, t2 + t, 1 ?
3* В каком пространстве все линейные оболочки совпадают с самим
пространством?
4. Доказать, что линейное пространство всех направленных отрезков
не может быть линейной оболочкой никаких двух направленных отрезков.
§ 14. Линейная зависимость
Снова рассмотрим произвольные векторы ei9 е2, .. ¦, е„ в линейном
пространстве. Может случиться, что один из них линейно выражается
через остальные. Пусть, например, это будет е±. Тогда каждый вектор
из еи еъ ..., еп линейно выражается через гъ еъ, ..., еп. Поэтому
любая линейная комбинация векторов еи е2, *.., еп является линейной
комбинацией и векторов е2, е3, ».., еп. Следовательно, линейные обо-
оболочки векторов еи еъ ..., еп и еъ ег, ..., еп совпадают.
Предположим далее, что среди векторов еъ еъ, ..., еп некоторый
вектор, например, е2, тоже линейно выражается через остальные.
Повторяя наши рассуждения, мы заключаем, что теперь любая линей-
линейная комбинация векторов еи еъ ..., еп является и линейной комбина-
комбинацией векторов е2, е4, ..., еп. Продолжая этот процесс, мы перейдем
в конце концов от системы ех, е2,. »¦., еп к системе векторов, из
которой уже нельзя исключить ни одного из них. Линейная оболочка
новой системы векторов, очевидно, совпадает с линейной оболочкой
векторов ех, е2, ..., еп. Кроме этого, мы можем сказать, что если
среди еъ еъ ..., еп был хотя бы один ненулевой вектор, то новая
система векторов либо состоит только из одного ненулевого вектора,
либо никакой из ее векторов не выражается линейно через остальные.
Такая системаг векторов называется линейно независимой.
Если система векторов не является линейно независимой, то она
называется линейно зависимой. В частности,} как следует из определе-
определения, система, состоящая только из нулевого вектора, будет линейно
зависимой. Линейная зависимость и независимость — свойства системы
векторов. Тем не менее весьма часто соответствующие прилагательные
отно.сят и к самим векторам. Поэтому вместо «линейно независимая
§ 14] ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 45
система векторов» будем говорить иногда «система линейно независи-
независимых векторов» и т.д.
С точки зрения введенных понятий проведенное, выше рассуждение
означает, что нами была доказана
Лемма 14.1. Если не все из векторов еи еъ ..., еп —нулевые и эта
система линейно зависима, то в ней молено найти линейно незави-
независимую подсистему векторов, через которые линейно выражается любой
из лекторов еъ еъ ..., еп.
Является ли система векторов el9 еъ ..., еп линейно зависимой или
линейно независимой, определяется одним, на первый взгляд неожи-
неожиданным, обстоятельством. Мы уже отмечали, что нулевой вектор при-
наддежит линейной оболочке и заведомо представляется линейной
комбинацией A3.1) с нулевыми значениями коэффициентов. Несмотря
на это, он может линейно выражаться через векторы еи е2, ..., еп
и другим способом, т. е. определяться другим набором коэффициентов
линейной комбинации. Линейная независимость векторов еи еъ ..., еп
очень тесно связана с единственностью представления через них ну-
нулевого элемента. Именно, справедлива
Теорема 14.1. Система векторов е1} е2, ..., еп линейно незави-
независима тогда и только тогда, когда из равенства
0 A4.1)
следует равенство нулю всех коэффициентов линейной комбинации.
Доказательство. Пусть п = 1. Если е± Ф 0, то, Как уже отме-
отмечалось ранее, из соотношения ос^ =0 должно следовать, что ах = 0.
Если же из равенства ос^ = 0 вытекает равенство нулю коэффициента
ось то очевидно, ех не может быть нулевым.
Рассмотрим теперь случай п ^ 2. Пусть система векторов линейно
независима. Предположим, что равенство A4.1) справедливо при неко-
некотором наборе коэффициентов, среди которых есть хотя бы один
отличный от нуля. Пусть, например, о^ Ф 0. Тогда из A4.1) получаем
т.е. вектор ех линейно выражается через остальные векторы системы.
Это противоречит условию линейной независимости системы, поэтому
ненулевых коэффициентов среди тех, которые удовлетворяют A4.1)
быть не может.
Если из равенства A4.1) следует равенство нулю всех коэффици-
коэффициентов, то система векторов не может быть линейно зависимой. Дей-
Действительно, предположим противное и пусть, например, вектор ех
линейно выражается через остальные, т. е.
Тогда равенству A4.1) заведомо будут- удовлетворять коэффициенты
46 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА [Гл. 2
ocjl — — 1, ос2 =* р2? • • • > ^и — Рл> среди которых по крайней мере один
не равен нулю. Теорема доказана.
Эта теорема настолько широко используется в различных исследо-
исследованиях, что чаще всего ее утверждение просто считают определением
линейной независимости.
Отметим два простых свойства систем векторов, связанных с ли-
линейной зависимостью..
Лемма 14.2. Если некоторые из векторов elf e2, ..., еп линейно за-
зависимы, то и вся система еу, е2, ..., еп линейно зависима.
Доказательство. Не ограничивая общности можно считать^
что линейна зависимыми являются первые векторы еи еъ ..., е&
Следовательно, существуют такие числа аъ а2, ... ? ocfc, среди которьй
есть не равные нудю, что
- О,
Отсюда вытекает справедливость равенства
а2е2 + ... + щек + 0 • ек+х + ... + 0 • еп = 0.
Но это равенство означает линейную зависимость векторов еи еъ ..., еп9
так как среди чисел аь а2> ..., аь 0, ..., 0 есть не равные нулю.
Лемма 14.3. Если среди векторов еи еъ ..., еп есть хотя бы один
нулевой вектор, то вся система elt е2> ..., еп линейно зависима.
Доказательство. Действительно, система из одного нулевой
вектора линейно зависима. Поэтому из только что доказанного свой-
свойства вытекает линейная зависимость и всей системы.
Следующая теорема представляет наиболее важный результат, от-
относящийся к линейной зависимости,
Теорема 14.2. Векторы еъ еъ ..., еп линейно зависимы тогда
и только тогда, когда либо е± = 0, либо некоторый вектор ek, 2 < к < п,
является линейной комбинацией предшествующих векторов^
Доказательство. Предположим, что векторы еи е29 .,., еп
линейно зависимы. Тогда в равенстве A4.1) не все коэффициенты равны
нулю. Пусть последний ненулевой коэффициент есть afe. Если к = 1,
то это означает, что et == 0. Пусть теперь к > 1, Тогда из равенства
<*хех + а2е2 + ... + икек = 0
находим, что
Этим доказана необходимость утверждения, сформулированного
в теореме. Достаточность очевидна, поскольку и случай, когда ех = 0,
и случай, когда вектор ек линейно выражается через предшествующие
векторы, означает линейную зависимость первых векторов из еь еъ ...
..., еп. Но отсюда следует линейная зависимость и всей системы
векторов»
§ 15] ЭКВИВАЛЕНТНЫЕ СИСТЕМЫ ВЕКТОРОВ 47
Упражнения.
1. Доказать, что если какой-либо вектор линейного пространства един-
единственным образом представляется в виде линейной -комбинации векторов
^i» ^2> • • • > ет то эта система векторов линейно независима.
2. Доказать, что если система векторов еи е2, ..., еп линейно независима,
то любой вектор линейной оболочки этих векторов единственным образом
представляется в виде их линейной комбинации.
3. Доказать, что система векторов еъ е2, ..., <?„ линейно зависима тогда
и только тогда, когда либо еп = 0, либо некоторый вектор ек, 1 ^ к < Н — 1,
является линейной комбинацией последующих векторов.
4. Рассмотрим линейное пространство многочленов, зависящих от перемен-
переменной t и заданных над полем вещественных чисел. Доказать, что система
векторов 1, t, t2, ..., f линейно независима при любом п.
5. Доказать, что система из двух неколлинеарных направленных отрезков
линейно независима.
§ 15. Эквивалентные системы векторов
Рассмотрим две системы векторов линейного пространства К.
Предположим, что линейные оболочки этих систем совпадают и состав-
составляют некоторое множество L. Множеству L заведомо принадлежит
любой из векторов обеих систем и, кроме этого, каждый из векторов
L может быть представлен в данном случае в виде линейной ком-
комбинации как векторов одной системы, так и векторов другой системы.
Следовательно:
Две системы векторов обладают тем свойством, что любой вектор
каждой системы линейно выражается через векторы другой системы.
Такие системы называются эквивалентными.
Из сказанного вытекает, что, если линейные оболочки двух систем
векторов совпадают, то' эти системы эквивалентны. Пусть теперь
заданы любые две эквивалентные системы. Тогда в силу транзитив-
транзитивности понятия линейной комбинации всякая линейная комбинация
векторов одной системы может быть представлена как линейная ком-
комбинация векторов другой системы, т, е. линейные оболочки обеих
систем совпадают. Итак, справедлива
Лемма 15.1. Для того чтобы линейные оболочки двух систем
векторов совпадали, необходимо и достаточно, чтобы эти системы
были эквивалентны.
Заметим, что понятие эквивалентности двух систем векторов явля-
является отношением эквивалентности. Рефлексивность очевидна, так как
любая система эквивалентна самой себе, симметричность вытекает
из определения эквивалентных систем, а транзитивность этого поня-
понятия следует из транзитивности понятия линейной комбинации. Поэ-
Поэтому множество всех систем векторов любого линейного пространства
можно разбить на классы эквивалентных систем. Важно подчеркнуть,
что всем системам каждого класса соответствует одна и только одна
линейная оболочка,
48 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА ^Гл. 2,
О соотношении числа векторов эквивалентных систем в общем
случае ничего сказать нельзя. Если же из двух эквивалентных систем
хотя бы одна линейно независима, то о количестве векторов мож-
можно сделать вполне определенные выводы. В основе этих выводов
лежит.
Теорема 15.1. Если каждый из векторов линейно независимой
системы et, е2, ...,' еп линейно выражается через векторы yif у2, ... > ут,
то п < т.
Доказательство. По условию теоремы вектор еп линейно
выражается через векторы уи у2, ..., уш следовательно, система
е«, У и Уг> ---> Ум A5.1)
Линейно зависима. Вектор еп не равен нулю, поэтому, согласно теореме
14.2, некоторый вектор yt из A5.1) является линейной комбинацией
предшествующих векторов. Исключив этот вектор, мы получим такую
систему:
е„, Уи ..., л-ь yJ+i, ..., у». A5.2)
Теперь, используя транзитивность понятия линейной комбинации, легко
показать, что каждый из векторов. еъ еъ ..., еп линейно выражается
через векторы A5.2).
Присоединим к векторам A5.2) слева вектор еп-±. Снова заключаем,
что система
en-i> е» У и ••¦> У t-u tt+ь •>•> Ут A5.3)
линейно зависима. Вектор еп-± не равен нулю, поэтому, согласно
теореме 14.2, один из остальных векторов A5.3) является линейной
комбинацией предшествующих векторов. Этим вектором не может
быть еп, так как тогда была бы линейно зависимой система из двух
векторов en-i, еп и, следовательно, вся система векторов еъ е2, ..-., еп.
Таким образом, некоторый вектор j^ из A5.3) линейно выражается
через предшествующие. Если мы исключим его, то опять получим
систему, через которую линейно выражается каждый из векторов
ех, е2, ..., еп.
Продолжая этот процесс, заметим, что векторы уъ у2, ..,, у^
не могут быть исчерпаны раньше, чем мы присоединим все векторы
el9 e2, ..., еп. В противном случае окажется, что каждый из векторов
е1} е2, ..., еп линейно выражается через часть векторов этой же сис-
системы, т.е. вся система должна быть линейно зависима. Так как это
противоречит условию теоремы, то отсюда вытекает, что п^т.
Рассмотрим следствия из этой теоремы. Пусть заданы две экви-
эквивалентные линейно независимые системы векторов. Согласно доказан-
доказанной теореме, каждая из этих систем содержит не больше векторов,
чем другая. Следовательно:
Эквивалентные линейно независимые системы состоят из одного
ц щого же числа векторов.
§ 15] ЭКВИВАЛЕНТНЫЕ СИСТЕМЫ ВЕКТОРОВ 49
Возьмем, далее, произвольные п векторов, построим на них линей-
линейную оболочку и выберем в ней любые п + 1 векторов. Так как число
этих векторов больше, чем число заданных векторов, то они не могут
быть линейно независимыми. Поэтому;
Любые п + 1 векторов из линейной оболочки системы п векторов
линейно зависимы.
Утверждение леммы 14.1 в терминах эквивалентных систем озна-
означает, что, какова бы ни была система одновременно не равных нулю
векторов, в ней существует эквивалентная ей линейно независимая
подсистема. Эта подсистема называется базой исходной системы..
Конечно, каждая система может иметь и более одной базы. Все
базы эквивалентных систем сами представляют эквивалентные системы.
Из первого следствия теоремы 15.1 вытекает, Что они состоят из од-
одного и того же числа векторов. Это число является характеристикой
всех эквивалентных систем и называется их рангом. По определению
ранг систем нулевых векторов считается равным нулю.
Рассмотрим теперь две линейно независимые системы, состоящие
из одного и того же числа векторов. Заменим какой-либо вектор пер-
первой системы некоторым вектором второй системы. Затем в получен-
полученной системе снова заменим один из векторов первой системы каким-
либо из оставшихся векторов второй системы и т.д. Процесс замены
будем осуществлять до тех пор, пока первая система не будет
заменеца второй системой. Если замену рсуществлять произвольным
образом, то промежуточные системы могут оказаться линейно зави-
зависимыми. Однако справедлива
Теорема 15.2. Процесс последовательной замены можно осу-
осуществить так, что все- промежуточные системы будут линейно не-
независимыми.
Доказательство. Пусть даны две линейно независимые сис-
системы векторов уи у2, ..., уп и zl9 z2, ..., zn. Предположим, что
проведено к шагов процесса,, где к ^ 0. Не ограничивая: общности,
будем считать, что векторы уи ..., ук заменены векторами zl9 ..., zk
и все полученные системы, включая систему
zl, •••> zk> Ук+U •••> Уп,
линейно независимы. Это предположение заведомо имеет место при
fc = 0.
Предположим, далее, что при замене вектора ук+1 любым из
векторов zk+l9 ..., zn все системы
Zl9 . ¦., Zk, Zh ук + 2, ..., Уп
линейно зависимы при i = к + 1, ..., п. Так как система
Zl, ..., zk, Ук+2, .", Уп A5.4)
линейно независима, то отсюда вытекает, что векторы z{ при i =
?= к + 1? ..., п линейно через нее выражаются. Но через нее линейно
50 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА [Гл. 2
выражаются и векторы zt при i = 1, 2, . ., к. Следовательно, через
систему A5.4) должны линейно выражаться все векторы zl9 ..., zn. Это
невозможно в силу теоремы 15.1. Поэтому процесс замены, указанный
в формулировке теоремы, действительно имеет место.
Упражнения.
Доказать, что следующие преобразования системы векторов, называемые
элементарными, приводят к эквивалентной системе.
1. Присоединение к системе векторов любой линейной комбинации этих
векторов.
2. Исключение из системы векторов любого вектора, являющегося линей-
линейной комбинацией остальных векторов.
3* Умножение любого вектора системы на число, отличное от нуля.
4. Прибавление к любому вектору системы любой линейной комбинации
остальных векторов.
5. Перестановка двух векторов.
§ 16. Базис
Пусть дано произвольное линейное пространство, состоящее не
только из нулевого вектора. В таком пространстве заведомо имеется
хотя бы один ненулевой вектор и, следовательно, существует линейно
независимая система по крайней мере из одного вектора. Теперь
возможны два случая: либо существует линейно независимая Система,
содержащая сколь угодно большое число векторов, либо существует
линейно независимая система, содержащая максимальное чжл© векто-
векторов. В первом случае линейное пространство называется бесконечно-
бесконечномерным, во втором случае — конечномерным.
За исключением эпизодических примеров, наше внимание на протя-
протяжении всего курса будет направлено исключительно на конечномерные
пространства. В частности, конечномерным линейным пространством
будет любая линейная оболочка, построенная на конечном числе
векторов произвольного (не обязательно конечномерного) простран-
пространства.
Итак, пусть в конечномерном линейном пространстве К векторы
еъ е2, ..., еп составляют линейно независимую систему с максималь-
максимальным числом векторов. Это означает, что для любого вектора хизК
система el9 е2, .. , еп9 х будет линейно зависимой. Согласно тео-
теореме 14.2 вектор х линейно выражается через еъ е29 , еп- Так как
вектор х — произвольный, а векторы е±, е2, • , еп фиксированы, то
можно сказать, что:
Любое конечномерное линейное пространство есть линейная оболочка
конечного числа своих векторов.
Теперь при исследовании конечномерных линейных пространств мы
можем пользоваться любыми сведениями, относящимися к линей-
линейным оболочкам и эквивалентным системам векторов. Введем следу-
следующее определение.
§ Щ БАЗИС $1
Линейно независимая система векторов, через которые линейно
выражается каждый вектор пространства, называется-базисом простран-
пространства.
Понятие базиса у нас связано с линейно независимой системой,
содержащей максимальное число векторов. Однако очевидно, что все
базисы одного и того же конечномерного линейного пространства
представляют эквивалентные линейно независимые системы. Как мы
знаем, такие системы содержат одинаковое число векторов. Следова-
Следовательно, число векторов базиса является характеристикой конечномер-
конечномерного линейного пространства. Это число называется размерностью
линейного пространства К и обозначается dim К. Если dim K = n, то
само пространство К называется n-мерным. Ясно, что:
В п-мерном линейном пространстве любая линейно независимая
система из п векторов образует базис, а любая система из п + 1
векторов линейно зависима.
Заметим, что всюду выше мы предполагали, что линейное про-
пространство состоит не только из нулевого вектора. Пространство,
содержащее лишь нулевой вектор, не имеет базиса в нашем смысле,
и мы будем считать по определению его размерность равной нулю.
Базис имеет огромное значение при изучении конечномерных
линейных пространств, и мы постоянно будем использовать его в на-
наших исследованиях. Он позволяет очень легко описать строение
любого линейного пространства, заданного над произвольным полем Р.
Кроме этого, с его помощью можно построить весьма эффективный
аппарат, сводящий выполнение операций над элементами пространства
к соответствующим операциям над числами из поля Р.
Как было показано выше, любой вектор х из линейного простран-
пространства К может быть представлен в виде линейной комбинации
х = а1е1 + а2е2 + ... 4- ипеп, A6.1)
где ось ос2, ..., а„ — некоторые числа из Р, а еи е2, .., еп — базис
К. Линейная комбинация A6.1) называется разложением вектора х
по базису, а сами числа аь а2, ..., а„ называются координатами
вектора х относительно этого базиса. Тот факт, что вектор х задан
своими координатами ос1? а2, ..., а„, мы будем записывать следующим
образом:
х = (осг, ос2, ..., ос„).
Как правило, мы не будем указывать, к какому базису относятся
данные координаты, если это не будет приводить к двусмысленности.
Легко показать, что для любого вектора х из К его разложение
по базису единственно. Это доказывается приемом, весьма часто
используемым при решении задач, касающихся линейной зависимости.
Предположим, что существует другое разложение
... + |W A6.2)
52 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА [Гл. 2
Вычитая почленно A6.2) из A6.1), получим
(*i - Pi)*i + (а2 ~ Р2)в2 + ... + (аи - §п)еп = 0.
В силу того, что векторы еи еъ ..., ен линейно независимы, отсюда
вытекает равенство нулю всех коэффициентов линейной комбинации
и, следовательно, совпадение разложений A6.1) и A6.2).
Таким образом, при фиксированном базисе линейного пространства
К каждый вектор из К однозначно определяется совокупностью своих
координат относительно этого базиса.
Пусть теперь любые два вектора х и у из К заданы своими
координатами относительно одного и того же базиса еъ е2, ..., ею т. е.
х = ос^ + а2е2 + ... + апеп9
У = Yi*i + У2е2 +... + Упеп,
тогда
х + У = (oci 4- yO в! + (а2 + у2) в2 + ... + (осл + ул) еп.
Далее, для любого числа X из поля Р имеем
Отсюда следует, что при сложении двух векторов линейного прост-
пространства их координаты относительно любого базиса складываются,
а при умножении вектора на число все его координаты умножаются
на это число.
Упражнения.
1. Доказать, что ранг системы векторов совпадает с размерностью ее
линейной оболочки.
2. Доказать, что эквивалентные системы векторов имеют один и тот же
ранг.
3. Доказать, что если линейная оболочка Lt построена на векторах
линейной оболочки L2, то dim Lt ^ dim L2.
4. Доказать, что если линейная оболочка L1 построена на векторах
линейной оболочки L2 и dim L± = dim L2, то сами линейные оболочки совпа-
совпадают.
5. Доказать, что линейное пространство многочленов с вещественными
коэффициентами, заданное над полем вещественных чисел, является бесконечно-
бесконечномерным.
§ 17. Простые примеры линейных пространств
Фундаментальные понятия линейной зависимости и базиса можно
проиллюстрировать на очень простых, но поучительных примерах,
гели взять в качестве линейных пространств числовые множества
с обычными операциями сложения и умножения. Выполнение аксиом
линейного пространства для таких множеств вполне очевидно, поэтому
на их проверке мы останавливаться не будем. По-прежнему элементы
пространства мы будем называть векторами.
§ 17] ПРОСТЫЕ ПРИМЕРЫ ЛИНЕЙНЫХ ПРОСТРАНСТВ 53
Рассмотрим комплексное линейное пространство, представляющее
собой группу по сложению всех комплексных чисел с умножением
над полем комплексных чисел. Ясно, что любое не равное нулю
число zi представляет собой линейно независимый вектор. Однако уже
любые два ненулевых вектора z1 и z2 всегда линейно зависимы. Для
того чтобы это доказать, достаточно найти такие два комплексных
числа а! и а2, не равных нулю одновременно, что ос^ + oc2z2 = 0.
Но выполнение этого равенства очевидно при ol1 — —z2, ос2 = z±.
Следовательно, рассмотренное линейное пространство одномерно.
Несколько иначе выглядит вещественное линейное пространство,
представляющее собой группу по сложению всех комплексных чисел
с умножением над полем вещественных чисел. Теперь в качестве
коэффициентов линейных комбинаций могут использоваться лишь
вещественные числа, поэтому это линейное пространство не может
быть одномерным. В самом деле, не существует таких вещественных
чисел <Xi и ос2, одновременно отличных от нуля, для которых линей-
линейная комбинация ос^! + а2г2 обратилась бы в нуль, например, при
z1 = 1, z2 = i. Читателю предлагается в качестве упражнения доказать,
что данное линейное пространство является двумерным.
Важно подчеркнуть, что хотя оба рассмотренных пространства
состоят из одних и тех dice элементов, они принципиально отличаются
друг от друга.
Теперь уже ясно, что вещественное линейное пространство, пред-
представляющие собой группу по сложению всех вещественных чисел
с умножением над полем вещественных чисел, является одномерным
пространством. Рассмотрим далее рациональное линейное пространство,
представляющее собой группу по сложению всех вещественных чисел
с умножением над полем рациональных чисел.
Как и раньше, постараемся построить систему, содержащую макси-
максимальное число линейно независимых векторов гь г2, г3, Ясно, что
можно взять, например, гх = 1. Так как в качестве коэффициентов
линейных комбинаций ось &2> аз> • • • допускаются лишь рациональные
числа, то понятно, что числом вида о^ • 1 нельзя представить, напри-
например, ]/2. Следовательно, пространство не может быть одномерным.
Поэтому в качестве второго вектора, линейно независимого с едини-
единицей, можно взять именно ]/2. Однако числом вида ах • 1 + а2 • |/2
4 г-
нельзя представить, например, ]/2.
В самом деле, пусть для некоторых рациональных а! и а2 выпол-
выполняется равенство у 2 = о^ 4- ос2 ]/2. Возводя обе его части в квадрат,
мы получим, что
/
или
2A-2а1а2)
54 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА [Гл. 2
Это невозможно, так как в левой части стоит рациональное число,
а в правой — иррациональное.
Итак, рассматриваемое пространство не может быть и двумерным.
Но тогда какое же оно? Как это ни удивительно, оно бесконечно*
мерное. Однако доказательство этого факта выходит за пределы
нашего курса.
Особое внимание, которое уделено примерам линейных пространств
малой размерности, объясняется тем, что с их помощью можно
конструировать линейные пространства любой размерности. Но об этом
мы будем говорить позднее.
Упражнения.
1. Какую размерность имеет линейное пространство рациональных чисел,
заданное над полем рациональных чисел?
2. Постройте линейно независимые системы векторов в пространстве
комплексных чисел, заданном над полем рациональных чисел.
3. Будет ли линейным пространством группа по сложению рациональных
чисел, заданная над полем вещественных чисел? Если нет, то почему?
§ 18. Линейные пространства направленных отрезков
Мы уже отмечали раньше, что множества коллинеарных направ-
направленных отрезков, компланарных направленных отрезков и направленных
отрезков во всем пространстве образуют линейные пространства над
полем вещественных чисел. Нашей ближайшей задачей является выяв-
выявление их размерности и построение базиса.
Лемма 18.1. Необходимым и достаточным условием линейной
зависимости двух векторов является их коллинеарность.
Доказательство. Заметим, что утверждение леммы очевидно,
если среди двух векторов есть хотя бы один нулевой. Поэтому будем
предполагать, что оба вектора — ненулевые.
Пусть векторы а и Ъ линейно зависимы. Тогда найдутся такие
числа аир, что
оса + РЬ = 0.
Так как по предположению а Ф 0, Ь ф 0, то а Ф 0, р Ф 0, поэтому
Следовательно, по определению операции умножения направленного
отрезка на число, векторы а и Ъ коллинеарны.
Предположим теперь, что векторы а и Ъ коллинеарны. Приложим
их к общей точке О. Эти векторы расположатся на некоторой прямой,
которую мы превратим в ось, задав на ней направление. Векторы
а и Ъ — ненулевые, поэтому существует такое вещественное число X,
что величина направленного отрезка а равна произведению величины
направленного отрезка Ъ на число X, т. е. {а} = X {Ь}. Но по определению
§ 18] ЛИНЕЙНЫЕ ПРОСТРАНСТВА НАПРАВЛЕННЫХ ОТРЕЗКОВ 55
операции умножения направленного отрезка на число это означает,
что а = ХЬ. Итак, векторы а и Ь линейно зависимы. *
Из доказанной леммы вытекает, что линейное пространство кеЯли-
неарных направленных отрезков — одномерное пространств©, а его
базисом может служить любой ненулевой вектор.
Лемма 18.1 позволяет вывести одно полезное следствие. Именно,
если векторы а, Ь коллинеариы и а ф О, то существует такое *шсж) X,
что Ь **Xa. Действительно, эти векторы линейно зависимы, т. е. для
некоторых чисел а, р, не равных нулю одновременно, аа -f pfe = 0.
Если предположить, что р = 0, то отсюда вытекает, что а = 0. Следо*
вательно, р Ф 0 и в качестве числа X можно взять % = (— ос)/р.
Лемма 18.2. Необходимым и достаточным условием линейной
зависимости трех векторов является их компланарность.
Доказательство. Не ограничивая общности, предположим, что
никакая ляра из указанных трех шекторов не коллинеарна, так как
в противном случае утверждение леммы сразу же вытекает из леммы 1&1.
Итак, пусть три вектора а, Ь, с линейно зависимы. Следовательно,
найдутся такие вещественные числа ос, р, у, не все равные нудю, что
аа + |Й> + ус = 0.
Если, например, у Ф 0, тр из этого уравнения находим
Приложим векторы а, Ь, с к общей точке О. Тогда из последнего
равенства вытекает, что вектор с равен диагонали параллелограмма,
построенного на векторах (—ос/у) а и (—р/у)Ь. Это означает, что после
параллельного переноса в общую точ-
точку векторы а, Ь, с оказываются лежа-
лежащими в одной плоскости и, следователь-
следовательно, они являются компланарными.
Предположим теперь, что векторы
а, Ь, с компланарны. Перенесем их на
одну плоскость к приложим к общей
точке О (рис. 18.1). Проведем через
концы вектора с прямые, параллель-
параллельные векторам а и Ь, и рассмотрим параллелограмм ОЛСВ. Век*
торы а, ОА и b, OB коллинеарны по построению и ненулевые,
поэтому найдутся такие числа X, \i9 что
ОА = Ха, ОВ = |ife.
Нб ОС а 014- 6%, Следовательно, с - Ха + \ib или
56
СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА
[Гл. 2
Так как числа X, \х, — 1 заведомо отличны от нуля, то последнее
равенство означает линейную зависимость векторов а,.Ь, с.
Теперь мы можем решить вопрос о размерности линейного прост-
пространства компланарных направленных отрезков. Согласно только что
доказанной лемме размерность этого пространства должна быть
меньше трех. Но любые два неколлинеарных направленных отрезка
из этого пространства линейно независимы. Поэтому линейное про-
пространство компланарных направленных отрезков есть двумерное про-
пространство, а его базисом могут служить любые два неколлинеарных
вектора.
Лемма 18.3. Любые четыре вектора линейно зависимы.
Доказательство. Не ограничивая общности, предположим, что
никакая тройка из четырех векторов не компланарна, так как в про-
2) тивном случае утверждение леммы сразу же
вытекает из леммы 18.2. Приложим векторы
а, Ь, с, d к общему началу О и проведем
через конец D вектора d плоскости, парал-
параллельные плоскостям, определяемым соответ-
соответственно парами векторов Ь, с; а, с и а, Ъ
(рис. 18.2), Из правила параллелограмма для
сложения векторов следует, что
6d = oc + 6e, ое = 6а+6в,
поэтому
db = OA + OB + ОС. A8.1)
Векторы а, ОА, а также b9 OB и с, ОС
коллинеарны по построению, причем а, Ь, с — ненулевые. Следователь-
Следовательно, найдутся такие числа A,, ji, v, что
ОА = Ха9 ОВ = \хЪ9 ОС = vc.
С учетом A8.1) это дает соотношение
d = Ха + \xb + vc,
откуда и вытекает линейная зависимость векторов а, Ь, с, d.
Из доказанной леммы заключаем, что размерность линейного
пространства всех направленных отрезков должна быть меньше четы-
четырех. Но она не может быть меньше трех, так как, согласно лемме 18.2,
любые три некомпланарных направленных отрезка линейно независимы.
Поэтому линейное пространство всех направленных отрезков есть
трехмерное пространство, а его базисом могут служить любые три
некомпланарных вектора.
Рассмотренные линейные пространства не очень наглядны с гео-
геометрической точки зрения, так как в них допускается существование
бесконечно большого числа равных между собой векторов. Они станут
гораздо нагляднее, если из каждого класса равных векторов зафикси-
§ 19] СУММА И ПЕРЕСЕЧЕНИЕ ПОДПРОСТРАНСТВ 57
ровать по одному представителю и под словом «вектор» всегда
понимать направленный отрезок из совокупности лишь этих представи-
представителей.
Одним из самых удобных способов фиксации является рассмотре-
рассмотрение множеств направленных отрезков, закрепленных в некоторой
точке О. Теперь вместо линейного пространства коллинеарных направ-
направленных отрезков мы получаем пространство коллинеарных отрезков,
закрепленных в точке О и лежащих на прямой, проходящей через
эту точку; вместо линейного пространства компланарных направлен-
направленных отрезков — пространство направленных отрезков, закрепленных
в точке О и лежащих на плоскости, проходящей через эту точку;
и, наконец, вместо линейного пространства всех направленных отрез-
отрезков — пространство направленных отрезков, закрепленных в точке О.
В дальнейшем мы будем иметь дело в основном лишь с закреп-
закрепленными векторами. Соответствующие линейные пространства обозна-
обозначим через Vu V2 и Уъ, где индекс внизу .означает размерность.
Линейное пространство, состоящее лишь из нулевого направленного
отрезка, обозначим через Vo.
Введение этих пространств позволяет установить взаимно одно-
однозначное соответствие между точками и направленными отрезками.
Для этого достаточно каждому вектору сопоставить его конечную
точку. Имея в виду такую геометрическую интерпретацию, мы иногда
и элементы абстрактного линейного пространства будем называть
не векторами, а точками.
Упражнения.
В пространствах Vl9 V2, V3 установите геометрический смысл таких
понятий, как:
1. Линейная оболочка.
2. Линейная зависимость и независимость.
3. Эквивалентные системы векторов.
4. Элементарные эквивалентные преобразования системы векторов.
5. Ранг системы векторов
§ 19. Сумма и пересечение подпространств
Введение линейных оболочек показало, что каждое линейное прост-
пространство содержит в себе бесчисленное множество других линейных
пространств. Значение этих пространств не ограничивается лишь рас-
рассмотренными выше вопросами.
Линейные оболочки задавались нами с помощью непосредственного
указания их строения. Можно было бы пойти и другим путем,
определяя «меньшие» пространства через свойства векторов. Пусть
в линейном пространстве К задано множество векторов L. Если при
тех же операциях, что и в пространстве К, множество L само
является линейным пространством, то мы будем называть его линей-
линейным подпространством, подчеркнув в названии тот факт, что под-
51 строение линейного пространства DTjt. г
пространств© состоит из векторов некоторого пространства. Ясно, что
наименьшим подпространством является подпространство, состоящее
лишь из нулевого вектора. Такое подпространство мы будем называть
нулевым и обозначать его символом 0. Наибольшим подпростран-
подпространством является пространство К. Эти два подпространства называются
тривиальными, остальные — нетривиальным**. Очевидао далее, что лю-
любое подпространство вместе с каждой нарой своих элементов xf у
содержит и все их линейные комбинации ах + fiy. Верно и обртоюе.
Именно:
Если множество L векторов линейного пространства К вместе
с каждой парой своих элементов ж, у содержит и все их линейные
комбинации ах 4- Ру, то оно является подпространством.
Действительно, из всех аксиом линейного пространства йеобзеодим©
проверить лишь аксиомы о нулевом и противоположном векторах.
Выполнение остальных аксиом очевидно. Возьмем а — О, Э = & Согласно
следствиям из свойств операций для векторов пространства К заклю-
заключаем, что 0 • х + 0 • у = @, т. е. нулевой вектор принадлежит множеству
L. Возьмем теперь а = — 1, р = 0. Имеем (— 1)х + 0-у — ( — 1)$, поэтому
в L вместе с каждым вектором х входит и противоположный к нему.
Итак, множество L есть подпространство.
Наличие базиса позволяет высказать утверждение, что в любом
койе^яомермом пространстве всякое подпространство является лшей-
вой оболочкой* Поэтому в конечномерных линейных пространствах
линейная оболочка является наиболее обпщм способом задания линей-
линейных подпространств. В бесконечномерном пространстве это уже не так.
Тем не менее, не следует забывать, что существует очень много
общего между понятиями и фактами в конечномерных пространствах
и соответствующими аналогиями в бесконечномерных пространствах.
Желая подчеркнуть это, мы даже в конечномерных пространствах
чаще будем пользоваться ^термином линейное подпространство, чем
термином линейная оболочка.
Пусть К есть w-мерное пространство. Каж и в самом: пространстве
К, в любом его подпространстве L можно построить базис. Если
в пространстве К выбран базис el9 е2, <.., е„, то в общем случае
нельзя выбрать базисные векторы подпространства L прямо из числа
векторов еъ е2, .., еп хотя бы потому, что в подпространство L
может не входить ни один из них. Однако справедлива в некотором
смысле обратная
Лемма 19.1. Если в каком-либо подпространстве L размерности s
выбран произвольный бпзис tlf . , ts, то всегда можно так выбрать
векторы ts+1, , tn в пространстве К размерности п, что система
векторов ti, .., ts, ts+x, .., tn будет базисом во всем К.
Доказательство. Рассмотрим лишь те линейно независимые
системы векторов из К, которые содержат в себе векторы tu ..., ts.
Ясно, что среди этих систем есть, система tl9 ..., tSi ta+1, ,.., tp,
имеющая максимальнее число векторов. Но тогда, каков бы ни быд
§ 19] СУММА И ПЕРЕСЕЧЕНИЕ ПОДПРОСТРАНСТВ 59
вектор х из К, система t±9 ..., tpi х должна оыть линейно зависимой.
Следовательно, вектор х должен линейно выражаться через векторы
tl9 ..., tp. Это означает, что векторы tu ..., ts, ts+u ..», tp образуют
базис К ир = н.
Рассмотрим снова произвольное линейное пространство К. Это
пространство порождает множество всех своих подпространств, ко-
которое мы обозначим через U. На множестве U можно определить
две алгебраические операции, позволяющие из одних подпространств
строить другие подпространства.
Суммой Lx + L2 линейных подпространств Lu L2 называется мно-
множество всех векторов вида z — x + y, где xeLl9 yeL2.
Пересечением L1f]L2 линейных подпространств Lb L2 называется
множество всех векторов, одновременно принадлежащих как Ьь
так и L2.
Заметим, что и сумма подпространств и их пересечение всегда
являются непустыми множествами, так как им заведомо принадлежит
нулевой вектор пространства К. Докажем, что эти множества являются
подпространствами.
В самом деле, возьмем два произвольных вектора zu z2 из суммы
L1 -Ь L2. Это означает, что ^i^Xi + ^i, z2 = x2 + у2> гДе *i> x2eL^
и уъ y2eL2. Рассмотрим теперь произвольную линейную комбинацию
GtZi + P^2- Имеем az1 + Pz2 = (axt + fbc2) + {ayг -f (Зу2).Таккак оо^ + px2 6
eLx и cx}^ + py2eL2, то azt + ^z2eL1 4- L2. Следовательно, Lx + L2 есть
подпространство. Пусть теперь zl9 z2eL1[\L2i т.е. zl9 z2eL1 и
zl5 z2gL2. Ясно, что az1-\-^z7ieL1 и az1 + Pz2eL2, т.е. az1-\-^z2e
eL1\\L2. Следовательно, Lxf]L2 также является подпространством.
Таким образом, операции сложения подпространств и их пересечения
являются алгебраическими. Эти операции, очевидно, коммутативны и
ассоциативны* Кроме этого, для любого подпространства L из К
Дистрибутивные законы, связывающие обе операции, отсутствуют.
Как легко заметить уже на самых простых примерах, размерность
суммы двух произвольных подпространств зависит не только от раз-
размерностей самих подпространств, но и от того, как велика их общая
часть. Справедлива
Теорема 19.1. Для любых двух конечномерных подпространств
Lif L2 имеет место равенстве
dim (Lx p) L2) + dim AХ + Lz) = dim U + dim L2, A9.1)
Доказательство. Обозначим размерности подпространств Ll9
L2, h\ f] L2 соответственно через rXi r2, m, Выберем в пересечении
Lx f] L2 какой-либо базис ci9. <., cm. Эти, векторы линейно независимы
и лежат в Lv Согласно лемме 19.1, в Lx найдутея такие векторы
аи ..., аь что система аг, ..., a^, e%9 .t сщ будет базисом в L^
60 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА [Гл. 2
Аналогично, в подпространстве L2 найдутся такие векторы bl9b29 ...9 bp,
что система bl9 ..., bp, cu ..., ст будет базисом в L2. При этом
гх = к + т, г2=р + т.
Если мы докажем, что систему векторов
аи ..., ак, си ..., ст, Ъъ ..., Ьр A9.2)
является базисом подпространства Ьх + L2, то тогда утверждение
теоремы будет иметь место, так как
т + (к + т + р) = (к + т) + (р + т).
Всякий вектор из подпространств Ll5 L2 линейно выражается через
векторы своего базиса и тем более линейно выражается через векторы
A9.2). Поэтому через эти векторы будет линейно выражаться и любой
вектор из суммы Lx + L2. Нам остается показать, что система A9.2)
линейно независима. Пусть
0^+... +akafc + y1c1+... + ywcw + P1b1 + ... + Pp^ = O. A9.3)
Обозначим
Ясно,- что beL2. Но из A9.3) вытекает, что beLit Следовательно,
^, т.е. b = vC +... + vmcM A9.5)
для некоторых чисел vl9 ..., vm. Сравнивая A9.4), A9.5), получаем
Pibi + • • • + РА + (-vi) ci + ... + (-vj cm = 0.
Система векторов bl9 ..., bp, cu ..., ст линейно независима по
построению, поэтому
В силу линейной независимости системы векторов аи ..., ак, сх, ..., ст
из A9.3) теперь вытекает, что
ОС! = ... = ОС* = Yi = .,. = Jm = 0.
Теорема доказана.
Упражнения.
1. На примере линейного пространства F3 установите геометрический смысл
операций суммы и пересечения подпространств.
2. Что является суммой подпространств Vi и F2?
3. Что является пересечением подпространств V± и К2?
4. Доказать, что размерность пересечения любого числа подпространств
не превосходит минимальной из размерностей этих подпространств.
5. Доказать, что размерность суммы любого числа подпространств
не меньше? чем максимальная из размерностей этих подпространств,.
§ 20] ПРЯМАЯ СУММА ПОДПРОСТРАНСТВ 61
§ 20. Прямая сумма подпространств
Пусть даны подпространства Lb L2, ..., Lm некоторого линейного
пространства. Согласно определению операции сложения, всякий век-
вектор х, принадлежащий сумме
K = L1+L2 + ... + Lm, B0.1)
может 6ь1ть представлен в виде
x = xt+x2 + ... + xm B0.2)
где XieLi для всех г. Это представление, вообще говоря, не будет
единственным. Если же каждый вектор из К допускает единственное
представление B0.2), то сумма B0.1) называется прямой суммой и
обозначается следующим образом:
K = L1+L2 + ...4-Lw. B03)
Прямые суммы обладают многими специальными свойствами.
Однако нас будут интересовать не столько эти свойства, сколько
общность между разложением B0.2) и разложением по базису. Пред-
Предположим, что некоторое пространство К может быть разложено
в прямую сумму B0.3) своих подпространств Ll9 L2, ..., Lm. Тогда
в силу единственности разложения B0.2) систему подпространств
Ll9 L2, ..., Lm можно рассматривать как некоторый «обобщенный
базис» пространства К, а разложение B0.2) как разложение по
«обобщенному базису». Такая трактовка прямой суммы особенно
полезна при изучении линейных пространств большой размерности,
так как в этих пространствах, как правило, приходится изучать не все
компоненты в разложении по базису, а лишь небольшую их часть.
Использование прямой суммы позволяет избежать как громоздких
разложений, так и исследования ненужных деталей.
Пусть К — n-мерное линейное пространство. Возьмем произвольный
его базис еи е2, ..., еп и построим совокупность линейных оболочек
L1=L1(e1), L2=L2(e2), ..., Ln = Ln(en). Тогда очевидно, что К будет
прямой суммой этих п одномерных подпространств. Но пространство
К можно представить разными способами в форме прямой суммы
подпространств и другой размерности. Основой такого представления
является
Теорема 20.1. Для того чтобы пространство К было прямой
суммой своих подпространств Lx, ..., Lm, необходимо и достаточно,
чтобы объединение базисов этих подпространств составляло базис всего
пространства.
Доказательство. Пусть К есть прямая сумма подпространств
Ll5 ..., Lm и векторы еи ..., eSl; ...; eSm_l + u ..., eSfn составляют
базисы этих подпространств. Тогда для любого вектора х из К имеет
место разложение B0.2). Представив каждый из векторов xt в виде
разложения по базису соответствующего подпространства Lh получим,
62 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА 1Гл. 2
ЧТО
х = a^i + ... + ачеп + ... + aSw_1 + 1eSm_1 + 1 + ... + aSffeSm B0.4)
для некоторых чисел al5 ..., <xs .
Таким образом, каждый вектор из К можно представить в виде
линейной комбинации векторов el9 ..., es , Для того чтобы утверждать,
что Эти векторы составляют базис пространства К, остается доказать
их линейную независимость. Рассмотрим равенство
с числовыми коэффициентами |il5 ..», p5m и обозначим
... + psieSl - уи
B0.6)
Очевидно, что у\$1<ь а из B0.5) следует такое равенство:
Все подпространства содержат нулевой вектор, поэтому заведомо
справедливо соотношение
о = о +... + о.
В силу единственности разложения нулевого вектора из If по под-
подпространствам Ьъ ..., Lm заключаем, что
УХ = • • • = Ут = 0.
Отсюда вытекает равенство нулю - всех коэффициентов линейных
комбинаций B0.6), т.е. линейная независимость векторов ех, ..., eSnC
Предположим теперь, что векторы еъ ...., eSl; ...; е5щ_1 + х, ..., еы
составляющие базисы подпространств Ьъ ..., Lm, образуют базис К.
Тогда для любого вектора х из К имеет место единственное разло-
разложение B0.4). Обозначив
a^i + ... + ocsleSl = xl9
B0.7)
мы получим, что для х существует по крайней iftepe одно разложение
B0.2). Каждый вектор xt из B0.7) есть линейная комбинация базисных
векторов Ц. В силу единственности разложения B0.4) для вектора х
заключаем и о единственности для него разложения B0.2). Теорема
доказана.
Упражнения.
1» При каких условиях пространство F3 будет прямой суммой своих
пбдпространств Vt и V^.
2. При каких условиях пространство Уг будет прямой суммой двух Своих
Яддпрйстранетв типа У{1
§ 21] ИЗОМОРФИЗМ ЛИНЕЙНЫХ ПРОСТРАНСТВ 63
3. Может ли V3 быть прямой суммой двух своих подпроагр&йсш тиа F2?
Если нет, то почему?
4. Доказать, что для того, чтобы сумма B0.1) была прямой, необходимо
и достаточно, чтобы разложение B0.2) было единственным для нулевого
вектора.
5. Доказать, что для того, чтобы сутла B0.1) #ыла пршой, «еб#во$имо
й достаточно, чтобы пересечение каждого из n€№p#ei$&iK?fB. Lt, i*&lf ,.,, Щ
с суммой остальных содержало лишь нулевой вектор.
§ 21. Изоморфизм линейных пространств
Рассмотрим множество всех линейных пространств, - заданных над
одним и тем же полем Р. Естественно спросить, чем же похожи и
чем различаются между собой все эти пространства?
Каждое линейное пространство в своем описании содержит две
существенно различные части. Во-первых, линейное пространство есть
совокупность конкретных объектов, называемых векторами. Во-вторых,
над этими конкретными объектами определены операции сложения
и умножения на число, обладающие некоторыми свойствами. Поэтому
можно интересоваться либо природой векторов и их свойствами,
либо свойствами указанных операций независимо от природы эле-
элементов.
Природой векторов мы интересовались только при изучении на-
направленных отрезков, да и то лишь в той мере, которая: была
необходима для введения операций и установления их свойств.
После этого дальнейшее исследование направленных отрезков опи-
опиралось исключительно на свойства операций. Аналогично мы будем
поступать и в каждом конкретном случае. Поэтому два пространства,
устроенные одинаково по отношению к операциям сложения и умно-
умножения на число, мы будем считать обладающими одинаковыми свой-
свойствами или изоморфными. Точнее:
Два линейных пространства, заданных над одним и тем лее полем,
называются изоморфными, если между их векторами можно установить
такое взаимно однозначное соответствие, при котором сумме любых
двух векторов первого пространства будет отвечать сумма соответ-
соответствующих векторов второго пространства, а произведению какого^
либо числа на вектор первого пространства будет отвечать произ-
произведение того же числа на соответствующий вектор второго про-
пространства.
Пусть пространства К и К! изоморфны. Тот факт, что каждому
вектору х из К поставлен в соответствие определенный вектор хг
из К', можно понимать как введение некоторой «функции»
х' = оо(х), B1.1)
«аргументом» которой является вектор х пространства К, а «зна-
«значением» — вектор хг пространства К'. Теперь оба свойства этой функции
можно записать следующим образом. Для любых х, у из К и
64 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА [Гл. 2
любого числа X
ю(х + у) = со(х) + со(Д
B1.2)
Взаимная однозначность соответствия между ХиК' означает, что
любым разным аргументам функции B1.1) отвечают разные значения,
т'е'если хфу, B1.3)
то (й(х)*(о(у). B1.4)
Следовательно, из равенства или неравенства значений функции
вытекает соответственно равенство или неравенство аргументов.
В изоморфных пространствах есть много общего. В частности, нуле-
нулевому вектору соответствует нулевой вектор, ибо
ю@) = со(О-х) = 0-со(х) = Ох' = 0'.
Однако наиболее важным следствием является то, что линейно
независимой системе векторов соответствует снова линейно независимая
система.
Действительно, пусть линейно независимы п векторов хь х2, ...-, х„.
Рассмотрим теперь линейную комбинацию о^ю (хх) + ос2ш (х2) + ...
... + ип(д(хп) и приравняем ее нулю. В силу свойств изоморфного соот-
соответствия имеем
0' = а1со(х1) + ос2со(х2) + „, + апю(хп) =
= (dfaxi + а2х2 + ... 4- <хпхп) = со@)у
откуда следует, что
Так как векторы х1? х2, ..., хп линейно независимы, то все коэффи-
коэффициенты должны быть нулевыми.
Доказанное следствие позволяет утверждать, что если два конечно-
конечномерных линейных пространства изоморфны, то они имеют одинаковую
размерность. Верно и обратное утверждение. Именно, справедлива
Теорема 21.1. Любые два конечномерные линейные пространства,
имеющие одинаковую размерность и заданные над одним и тем же
полем, изоморфны.
Доказательство. Пусть К и К' — два линейных пространства
размерности п. Выберем какой-либо базис еъ е2, ..., еп в пространстве
К и базис е'ъ е'2,..., е'п в пространстве К'. С помощью этих систем векторов
построим следующим образом изоморфизм со. Каждому вектору
пространства К поставим в соответствие вектор
ш(х)
§ an изоморфизм линейных пространств 65
пространства К'. Установленное соответствие будет взаимно однознач-
однозначным, так как разложение по базису единственно.
Возьмем, далее, два любых вектора х и у из К и произвольное
число X и предположим, что
Имеем
со(х + у) = а>((ая + pjei + (а2 + ЫЧ + ... + (а» + Р„
= (oil + Pi) el + (а2 + P2)ei + ... + (<*„ + Р„К =
+ ... + 0^+ (Pi*i + p2ei + ... + PX) = a>(x)
со (Ъс) = со ((taj e1 + (^a2) e, + ... + (XaJ en) =
= (Лд i) el + (Щ) ei + ... +
... + ane'n) =
Полученные равенства и доказывают справедливость утверждения
теоремы.
Значение этой теоремы весьма велико. Именно она позволяет теперь
с полной уверенностью говорить о том, что с точки зрения всех
следствий из аксиом любые два линейные npocTpaHCtea? -имеющие
одинаковую размерность и заданные над одним и тем же полем,
неразличимы. Следовательно, можно было бы построить какое-либо одно
номерное линейное пространство над данным полем и выяснять законо-
закономерности, общие для всех конечномерных пространств, лишь на основе его
исследования.
Пусть задано некоторое поле Р. Рассмотрим множество, элементами
которого являются всевозможные упорядоченные наборы из п чисел
ось ос2, ..., а„ поля Р. Если х — элемент этого множества, то мы
будем писать
* = (<*ь ос2, ..., ая). B1.5)
Действия сложения и умножения на число X из поля Р определим
следующим образом:
(ось а2, ..., oJ + СРь Р2, ..,, Р„) »(<*!+?!, я2 + р2,...,ай + рй), B1.6)
а2, ..., ап)
Легко проверить, что аксиомы линейного пространства выполнены.
В частности, нулевой вектор определяется набором из одних нулей,
т*е* о = (о,о, ...,о),
а вектор, противоположный для вектора B1.5Х будет таким:
-* = (-аь -а2, ..., ~ап).
3 В. В. Воеводин
66 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА [Гл. 2
Это пространство является n-мерным и один из его базисов легко
сразу же указать. Именно,
^ = A,0, ...,0,0),
е2 = @, 1, ..., 0, 0),
е„ = @, 0, ...,0, 1).
Так как для элемента B1.5) имеет место разложение
то числа oci, ос2; ..., ос„ мы будем называть координатами вектора х
Пространство подобного типа мы назовем арифметическим про-
пространством и будем обозначать его через Рю подчеркивая тем^ самым
связь с полем Р. Если же Р есть поле комплексных, вещественных
или рациональных чисел, то такие и-мерные пространства будем обозна-
обозначать соответственно через Си, Rn или D«,
Теперь может показаться, что нет никакой необходимости в изу-
изучении произвольных n-мерных линейных пространств. Действительно, мы
знаем, что с точки зрения следствий из аксиом изоморфные линей-
линейные пространства неотличимы, а цоэтому можно всегда с успехом
изучать, например, лишь Рп. Однако проведение общих рассуждений
позволяет выявить важнейшие свойства линейных пространств, т. е.
те из них, которые не зависят от базисных систем или, другими
словами, инвариантны при изоморфизмах.
Изучая лишь пространства РП9 мы были бы все время привязаны
к конкретному базису, и поэтому не всегда было бы легко увидеть
инвариантность тех или иных выводов. К тому же необходимо
следить за тем, чтобы к общим свойствам линейных пространств
не отнести частные свойства пространства Рп. Далеко не всегда
это сделать достаточно просто.
В заключение обратим внимание еще на одно обстоятельство.
По аналогии с пространством Рп рассмотрим пространство Р^, эле-
элементами которого являются всевозможные упорядоченные бесконечно
большие наборы из чисел ось ос2, ... поля Р. Элемент х этого множества
будем обозначать по аналогии с B1.5)
x = («i, а2> ¦¦•)
и по аналогии с B1.6) введем операции над элементами.
Пространство Р^ уже будет бесконечномерным. Если предположить,
что бесконечномерные пространства изоморфны пространству Р^ь то
нетрудно понять, что между бесконечномерными и конечномерными
пространствами должно быть много общего. Этот пример не следует
забывать»
§ 22] ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 67
Упражнения.
1. Построить изоморфное соответствие между пространством Fx и прост-
пространством вещественных чисел, заданным над полем вещественных чисел.
2. Построить изоморфное соответствие между пространством V2 и про-
пространством комплексных чисел, заданным над полем вещественных чисел.
3. Доказать, что в изоморфных пространствах эквивалентные системы векто-
векторов переходят в эквивалентные.
4. Доказать, что в изоморфных пространствах пересечение подпространств
переходит в пересечение подпространств.
5. Доказать, что в изоморфных пространствах прямая сумма подпространств
переходит в прямую сумму подпространств»
§ 22. Линейная зависимость и системы линейных уравнений
Исследование многих вопросов, так или иначе связанных с линей-
линейной зависимостью, сводится к решению следующей задачи.
Пусть дана система векторов al9 а2, ..., ат и вектор Ь. Требуется
установить, является ли вектор Ъ линейной комбинацией данной
системы векторов, и найти коэффициенты линейной комбинации.
Если вектор Ь является линейной комбинацией векторов al9 а2, ...
..., ат, то существуют такие числа zl9 z2, ..., zmi что
z2a2 + ... + zmam = Ь. B2.1)
Следовательно, поставленная задача сводится к исследованию векторно-
векторного уравнения B2.1) относительно чисел zl9 z2, ..., zm,
Предположим, что векторы заданы своими координатами относи-
относительно некоторого базиса el9 еъ ..., ек, т. е.
21, ..., ак1\
= (а12, а22, ..., ак2\
1ю •••> акт),
Приравняв соответствующие координаты векторов левой и правой
частей уравнения B2.1), получим
^12*2 + -. + almzm = Ъи
a22z2 + ... + a2mzm = Ъъ 022)
... + akmzm = Ьк.
Эта система уравнений, отражающая покоординатную запись урав-
уравнения B2.1) называется системой линейных алгебраических уравнений.
Числа bu b2, ..., Ьк называются правыми частями, zl9 z2, ..., zm —
неизвестными системы уравнений. Упорядоченная совокупность значений
3*
68 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА [Гл. 2
неизвестных, удовлетворяющая каждому из уравнений B2.2), называется
решением системы. Если система линейных алгебраических уравнений
имеет хотя бы одно решение, то она называется совместной; в про-
тирном случае система называется несовместной.
Таким образом, ответ на вопрос, является ли вектор Ъ линейной
комбинацией векторов аи а2, ..., ат, определяется совместностью
или несовместностью системы B2.2). Если система совместна, то любое
ее решение дает коэффициенты разложения вектора Ъ по системе
векторов аи аъ ..., ат.
х Две системы линейных алгебраических уравнений относительно одних
и тех же неизвестных называются эквивалентными, если каждое решение
одной системы является решением другой системы или обе они
несовместны.
Общий способ решения систем может быть основан на последователь-
последовательном преобразовании исходной системы B2.2) к такой эквивалентной
системе, для которой решение находится достаточно просто. Мы
опишем сейчас один из этих способов, называемый методом исклю-
исключения или методом Гаусса.
Процесс решения состоит в общем случае не более чем из k — 1
этапов. Чтобы отличать коэффициенты при неизвестных и правые
части, получаемые в процессе преобразования на разных этапах, мы
будем ставить у них вверху дополнительный индекс, означающий
номер выполненного этапа. Согласно этому замечанию, исходная
система B2.2) будет иметь такой вид:
B2.3)
Рассмотрим первое уравнение. Если все коэффициенты при неиз-
неизвестных и правая часть равны нулю, то этому уравнению будет
удовлетворять любая совокупность чисел zl9 z29 .., zm. Следовательно,
мы получим эквивалентную систему, если первое уравнение вообще
исключим из рассмотрения. Может оказаться, что равны нулю все
коэффициенты при неизвестных в первом уравнении, но правая часть
не равна нулю. Тогда такому уравнению не может удовлетворять
ни одна совокупность чисел zl9 z29 ..., zm. В этом случае система
будет несовместной, и ее исследование закончено.
Предположим, что среди коэффициентов при неизвестных в первом
уравнении есть хотя бы один отличный- от нуля. Не ограничивая
общности, можно считать, что affeO, так как в противном случае
этого можно добиться перестановкой неизвестных. Назовем элемент
aft ведущим элементом. Выразим из первого уравнения неизвестное zx
через остальные неизвестные и правую часть и затем подставим
полученное выражение вместо zt во все уравнения, кроме первого.
§ 22] ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 69
Приводя всюду подобные члены, мы получим новую систему
e$z3+ ... + <#>*. = #>,
B2.4)
Коэффициенты этой системы связаны с коэффициентами старой системы
такими соотношениями:
для всех i, j.
Системы B2.3) и B2.4) эквивалентны. В самом деле, пусть система
B2.3) совместна. Тогда любое ее решение zl9 z2, ..., zm обращает все
уравнения системы B2.3) в тождества. Повторяя снова с любым из
решений процесс исключения, мы убеждаемся, что оно является и
решением системы B2.4). Предположим далее, что некоторое решение
системы B2.4) не является решением системы B2.3). Оно заведомо
удовлетворяет первому уравнению из B2.3). Пусть оно не удовлетворяет
какому-то уравнению с номером i ^ 2. Тогда, повторяя опять процесс
исключения, мы заключаем, что выбранное решение не должно удовлет-
удовлетворять i-му уравнению системы B2.4). Но это противоречит условию.
Теперь ясно, что если одна из "систем несовместна, то несовместной
будет и другая система.
Мы описали лишь первый этап преобразования системы. Все осталь-
остальные этапы осуществляются аналогичным способом. На втором этапе
исключим неизвестное z2 из всех уравнений, кроме первых двух, на
третьем — неизвестное z3 из всех уравнений, кроме первых трех, и т. д.
Если в процессе преобразований мы не встретим уравнений, в
которых все коэффициенты при неизвестных равны нулю, то после
к — 1 этапов придем к системе
B2.5)
эквивалентной системе B2.4). Если же в процессе преобразования
нам встретятся уравнения, удовлетворяющиеся тождественно, то система
B2.5) будет состоять из меньшего числа уравнений.
70 СТРОЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА [Гл. 2
Неизвестные zk+i, ..., zn называются свободными неизвестными.
Очевидно, что какие бы значения ни приписывать этим неизвестным,
можно последовательно определить и все остальные неизвестные из
системы B2.5), начиная с zk. Коэффициенты afl аЩ, .'.., 41"Ч на
которые придется делить, являются ведущими элементами отдельных
этапов и поэтому все они отличны от нуля.
Итак, с теоретической точки зрения понятие линейной зависимости
исследовано достаточно полно. Однако в практическом отношении оно
может приводить к очень серьезным трудностям. Рассмотрим, напри-
например, в пространстве Rfc систему векторов
а1==( 1, -2, 0,..., 0, 0),
а2=( 0, 1, -2, ..., 0, 0),
........... \ .... B2,6)
afe_1=( 0, 0, 0, ..., 1, -2),
flt = (-2-<*-»i 0, 0,..., 0, 1).
Она линейно зависима, так как
2~Ч 4- 2-(fc" % 4- ... 4- 2" Ч = 0.
Заметим, что 2~(^1} < 102 для к > 40, поэтому при практических
вычислениях, естественно, возникает желание пренебречь столь малым
значением координаты. К тому же все числа, как правило, бывают
известны неточно и почти всегда содержат значительно большие ошибки.
Но даже если бы координаты были известны точно, уже первые
вычисления над ними приведут к неточным результатам, если сами
вычисления выполнялись приближенно. К этому стоит добавить, что
большинство современных вычислительных машин не воспринимает
столь малые числа, как 2~{к~г) для к> 64, и оперирует с ними, как с
нулями. Поэтому реально вместо системы векторов B2.6) мы можем
на практике иметь дело с такой системой:
в1=A, -2, 0, ..., 0, 0),
а2 = @, 1, -2, ...,0, 0),
B2.7)
afe-i=@, 0, 0, ..., 1, -2),
afe = @, 0, 0, ..., 0, 1).
Но эта система линейно независима.
Таким образом, малые изменения в координатах векторов могут
привести к тому, что в условиях приближенного задания самих
координат и приближенных вычислений над ними линейно зависимая
система может стать линейно независимой и, наоборот, линейно неза-
независимая — линейно зависимой. Но тогда естественно спросить, какое же
практическое значение имеют такие понятия, как линейная зависимость,
§ 22] ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 71
ранг, базис, совместная и несовместная система и вообще все то, что
было исследовано нами до сих пор? На этот вопрос нельзя дать
простой ответ, так как он связан с глубоким пониманием решаемых
задач. С этого вопроса начинаются те различия, которые отличают
математику «точную» от математики «приближенной».
Упражнения.
1. Доказать, что если система B2.2) совместна, то она имеет единст-
единственное решение тогда и только тогда, когда система векторов аь а29 ...
..., ат линейно независима.
2. Доказать, что если система векторов аи а2, ..., ат имеет ранг г,
то система B2.5) будет состоять из г уравнений.
3. Будем считать решения системы векторами пространства Рт. Пусть
Ъ = 0 и система векторов аъ а2> ..., ат имеет ранг г. Доказать, что мно-
множество всех решений системы B2.2) в этом случае образует (т — 7')-мерное
подпространство пространства Рт.
4. Найти все решения системы линейных алгебраических уравнений
Решить эту же систему, задавая ]/2, ]/з, ]/б с различной точностью.
Сравнить результаты между собой.
5. Установить связь между методом Гаусса и элементарными преобразо-
преобразованиями системы векторов.
ГЛАВА 3
ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ
§ 23. Аффинные системы координат
Огромное количество научно-технических задач требует точного
описания положения в пространстве различных геометрических объектов,
таких, как точки, фигуры, линии, поверхности и т. п. При этом
для сложного объекта очень важно знание не только общей характе-
характеристики положения, как, например, указание центра тяжести, но и
положения каждой его отдельной точки.
В качестве примера напомним, что предсказание лунных и солнечных
затмений возможно потому, что известно положение небесных тел в каж-
каждый момент времени. Передача телевизионных изображений на большие
расстояния возможна потому, что определено положение каждой точки
передаваемого изображения.
Очевидно, что необходимо дать способ описания положения лишь
отдельной точки, так как любой геометрический объект может быть задан
как некоторая совокупность точек. При этом, по-видимому, имеет смысл
рассмотреть независимо положение точки на прямой линии, на плоскости
или в пространстве, потому что пространственное описание объекта
далеко не всегда бывает целесообразным. Например, фотографию
заведомо можно рассматривать лишь на плоскости, а движение ма-
материальной точки при отсутствии действующих на нее сил — на прямой
яинии.
Одно из наиболее распространенных описаний положения точки
основано на весьма простой идее. Мы уже отмечали, что между всеми
точками и закрепленными направленными отрезками можно установить
взаимно однозначное соответствие. Поэтому описание положения точки
можно заменить описанием положения соответствующего направленного
отрезка. Положение же этого 'отрезка полностью определяется его
координатами относительно любого базиса, т. е. некоторыми упоря-
упорядоченными наборами чисел. Следовательно, положение точки также
должно определяться упорядоченными наборами чисел. К исследованию
этой идец мы и переходим.
Пусть дана некоторая прямая линия. Зафиксируем нацией произ-
произвольную точку О и рассмотрим линейное пространство V1 векторов,
лежащих на данной прямой и закрепленных в точке О. Выберем в
этом пространстве какой-либо базисный вектор а. Превратим теперь
§ 23] АФФИННЫЕ СИСТЕМЫ КООРДИНАТ 73
прямую линию в ось, задав на ней направление таким образом,
чтобы величина отрезка а была положительной (рис. 23.1).
Ось с заданными на ней точкой О и базисным вектором а
образует аффинную систему координат на прямой линии. Точка О
называется началом системы коорди-
координат, длина вектора а — масштабной • "^ ^ ^*~
ч и CL M
единицей.
Положение любой точки М на рис# 23.1.
прямой однозначно определяется по-
положением вектора ОМ. Векторы а, ОМ коллинеарны и а Ф О, поэ-
поэтому, согласно следствию из леммы 18.1, существует такое вещественное
число а, что
ОМ = оса. B3.1)
Это число называется аффинной координатой точки М на прямой.
Тот факт, что точка М имеет координату а, обозначается символом
()
Заметим, что при фиксированной аффинной системе координат
на прямой соотношение B3Л) однозначно определяет аффинную ко-
координату а любой точки М этой прямой. Очевидно, верно и обратное.
Именно, каждое число а однозначно определяет соотношением B3.1)
некоторую точку М прямой линии. Таким образом, при фиксирован-
фиксированной аффинной системе координат существует взаимно однозначное
соответствие между всеми вещественными числами и точками прямой
. линии.
Задание точек своими координатами позволяет вычислять величины
направленных отрезков й расстояния между точками. Пусть заданы
точки Af^ftJ и М2(ос2), Имеем
{МХМ2} = {ОМ2 - OMi) = {ос2а -
= {(а2 - ах)а} = (а2 - аА) {а} = (а2 - ах) \а\. B3.2)
Если через р(Мь М2) обозначим расстояние между точками Mi
и М29 to
р(Мь М2) = |{МЖ} | = \а2 - а,| \а\. B3.3)
Формулы становятся особенно простыми, если длина базисного вектора
равна единице. В этом случае
{МХМ2} = ос2 - <хь
M) = |aa| B3*4)
Пусть теперь дана некоторая плоскость. Зафиксируем на ней про-
произвольную точку О и рассмотрим линейное пространство V2 векторов,
лежащих на данной плоскости и закрепленных в точке О. Выберем
в этом пространстве какую-либо пару базисных векторов а, Ъ. На
74
ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ
[Гл. 3
прямых линиях, содержащих эти векторы, зададим направления таким
образом, чтобы величины отрезков а, Ъ были положительными (рис. 23.2).
Две оси на плоскости, пересекающиеся в одной точке О и с заданными
на них базисными векторами а, Ъ, образуют' аффинную систему
координат на плоскости. Ось, содержа-
содержащая первый базисный вектор, называ-
называется осью Ох или осью абсцисс; ось,
содержащая второй базисный вектор,—
осью Оу или осью ординат.
Снова положение любой точки М на
плоскости однозначно определяется век-
вектором ОМ, а для него, в свою очередь,
существует единственное разложение
вида >
Рис. 23.2. ОМ = аа+рЬ. B3.5)
Вещественные числа а, р опять называются аффинными координатами
точки М. Первая координата называется абсциссой, вторая — ординатой
М. Тот факт, что точка М имеет координаты а, р, обозначается
символом М(а, Р).
На координатных осях Ох, Оу существуют единственные точки Мх,
Му такие, что
«27
ОМ = ОМХ + OMV
B3.6)
Эти точки лежат на пересечении координатных осей с прямыми,
параллельными осям и проходящими через точку М. Называются они
аффинными проекциями точки М на оси координат. Векторы
ОМХ, ОМУ называются аффинными проекциями вектора ОМ. В силу
единственности разложений B3.5), B3.6) заключаем, что
ОМХ = оса, ОМУ =
B3.7)
Таким образом, если точка М имеет координаты М(ос, Р), то
точки Мх, Му как точки плоскости имеют координаты Мх(ос, 0),
Му@, Р). Кроме того, если
ОМ = (ос, р),
то
ОМ, = (ос, 0),
= @, р).
Каждый базисный вектор на своей оси образует собственную
систему координат. Поэтому точки Мх, Му можно рассматривать и
как точки осей Ох, Оу, заданные в этих собственных системах
координат. Однако из B3.7) следует, что координата точки Мх
на оси Ох равна абсциссе точки М. Аналогично, координата точки
Му на оси Оу равна ординате точки М. При всей очевидности
123]
АФФИННЫЕ СИСТЕМЫ КООРДИНАТ
75
Рис. 23.3.
этих утверждений они являются весьма важными, так как дают
право пользоваться формулами B3.2) — B3.4).
Задание упорядоченной пары чисел а, C однозначно определяет
некоторую точку. Действительно, соотношения B3.7) позволяют одно-
однозначно построить аффинные проекции точ-
точки, которые однозначно определяют и
точку плоскости. Следовательно, при фик-
фиксированной аффинной системе координат
существует взаимно однозначное соответ-
соответствие между всеми упорядоченными пара-
парами вещественных чисел и точками пло-
плоскости.
Аналогично вводится аффинная система
координат в пространстве. Зафиксируем
точку О и рассмотрим линейное простран-
пространство V3 векторов, закрепленных в точке О.
Выберем в этом пространстве какую-либо
тройку базисных векторов а, Ъ, с. На пря-
мых линиях, содержащих эти векторы, за-
зададим направления таким образом, чтобы величины отрезков а, Ь, с
были положительными (рис. 23.3).
Три оси в пространстве, пересекающиеся в одной точке О, С)
заданными на них базисными векторами а, Ъ, с,; образуют аффинную
систему координат в пространстве. Ось, содержащая первый базисный
вектор, называется осью Ох или осью абсцисс, ось, содержащая второй
базисный вектор, — осью Оу или осью ординат, третья ось — осью Oz
или осью аппликат. Попарно взятые координатные оси определяют
так называемые координатные плоскости, которые мы будем обозначать
Оху, Oyz и Oxz.
Положение любой точки М пространства снова однозначно опреде-
определяется вектором ОМ, для которого существует единственное разло-
разложение JTT* , П7 ,
ОМ = оса + (ЗЬ + ус.
Вещественные числа а, C, у называются аффинными координатами
точки М в пространстве. Первая координата называется абсциссой, вто-
вторая — ординатой, третья — аппликатой точки М. Тот факт, что точка М
имеет координаты а, C, у, обозначается символом. М(ос, C, у)-
Проведем через точку М плоскости, параллельные координатным
плоскостям. Точки пересечения этих плоскостей с осями координат
Ох, Оу, Oz обозначим через Мх, Му, Mz и назовем аффинными
проекциями точки М на оси координат. Пересечение координатных
плоскостей с парами плоскостей, проходящих через точку М, опре-
определяет точки Myz, Mxz, M-xy, которые назовем аффинными про-
проекциями точки М на координатные плоскости. Соответственно векторы
OMyz, ОМХ и т. д. назовем аффинными проекциями вектора ОМ .
76 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
Очевидно, что > > >
ОМ = ОМХ + ОМ у + OMZ,
OMXZ =
ОМху = .
Как и в случае плоскости, заключаем, что если точка М имеет
координаты
М(ос, р, у),
то аффинные проекции этой точки будут иметь такие координаты:
Мх (а, 0, 0), Му@, р, 0), М2@, 0, у), B38)
Myz@, р, у), МХ2(а, 0, у), М^(а, р, 0).
Аналогично, если —-> , л ч
ОМ = (а, р, у),
Т° ОМХ = (а, 0, 0), ОМУ = @, р, 0), 0М2 * @,0, у),
OMyz = @, р, у), 0МХ2 = (а, 0, у), ОМХУ = (а, р, 0).
Сынова каждый базисный вектор и каждая пара базисных векторов
образуют собственные аффинные системы на координатных осях и
координатных плоскостях. И опять координаты точек в этих системах
совпадают с аффинными координатами тех же точек, рассматриваемых
как точки пространства. Теперь при фиксированной аффинной системе
координат существует взаимно однозначное соответствие между всеми
упорядоченными тройками вещественных чисел и точками простран-
пространства.
Среди аффинных систем координат на прямой, на плоскости и в
пространстве наибольшее применение находят так называемые декартовы
прямоугольные системы координат. Они характеризуются тем, что все
базисные векторы имеют длину, равную единице, и 'оси координат
в случае плоскости и пространства попарно перпендикулярны. Ба-
Базисные векторы в декартовой системе координат обычно обозначают
буквами i, j, k. Как правило, в дальнейшем мы будем пользоваться
лишь этими системами.
Упражнения.
1. Какая из точек A (a), J5 (- а) лежит правее на координатной оси,
изображенной на рис. 23.1?
2. Что представляет собой геометрическое место точек М(а,р, у), для
которых аффинные проекции Мху имеют координаты Мху(—3, 2, 0)?
3. Зависят ли координаты точек от выбора направления на координатных
осях?
§ 24] ДРУГИЕ СИСТЕМЫ КООРДИНАТ 77
4. Как изменятся координаты точек, если изменить длину базисных век-
векторов?
5. .Какие координаты имеет центр параллелепипеда, если начало коорди-
координат совпадает с одной- из его вершин, а базисные векторы — с ребрами?
§ 24. Другие системы координат
Системы координат, используемые в математике, позволяют зада-
задавать с помощью чисел положение любой точки пространства, пло-
плоскости или прямой линии. Это дает возможность производить над
координатами любые вычисления и, что очень важно, позволяет
применять современные вычислительные машины не только к различного
рода числовым расчетам, но и к решению геометрических задач, к
исследованию любых геометрических объектов и соотношений. Кроме
рассмотренных аффинных систем координат, нередко употребляются
и другие системы.
Полярная система координат. Выберем' на плоскости какую-либо
прямую линию и зафиксируем на ней
декартову систему координат. Начало О
этой системы назовем полюсом, & коорди-
координатную ось — полярной осью. Будем счи-
считать далее, что,масштабный отрезок сис-
системы координат на прямой используется
для измерения длин любых отрезков на
плоскости. Рассмотрим произвольную точ-
точку М плоскости. Очевидно, что ее поло- О
жение будет полностью определено, если
задать расстояние р между точками М, О Рис. 24.1.
и угол ф, на который нужно повернуть
луч Ох вокруг точки О против часовой стрелки до совмещения
его направления с направлением отрезка ОМ (рис. 24.1).
Полярными координатами точки М на плоскости называются два
числа р и ф. Число р называется полярным 'радиусом, число ф —
полярным углом. Обычно предполагают, что
О ^ р < + оо, 0 ^ ф < 2%. B4.1)
Если точка М совпадает с полюсом О, то полярный угол считается
неопределенным.
С каждой полярной системой координат естественным образом
связывается некоторая декартова прямоугольная система координат.
В этой системе начало координат совпадает с полюсом, ось
абсцисс — с полярной осью, а ось ординат получается с помощью
поворота полярной оси вокруг точки О на угол тс/2.
Обозначим координаты точки М в декартовой прямоугольной сис-
системе координат Оху через а, C. Имеем очевидные формулы
а = р cos ф, C = р sin ф.
х
78
ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ
[Гл. 3
Отсюда получаем и обратные соотношения
22 + P2 i
Эти формулы позволяют по декартовым координатам точки вычислять
ее полярные координаты и наоборот.
Цилиндрические координаты. Выберем в пространстве какую-либо
плоскость п и зафиксируем на ней полярную систему координат.
Через полюс О проведем ось Oz
перпендикулярно к плоскости п (рис.
24.2). Будем считать снова, что для
измерения длин любых отрезков в
пространстве используется один и
ч А тот же масштабный отрезок. Введем в
плоскости к декартову прямоуголь-
_ ную систему координат, соответст-
^п вующую полярной системе. Вместе с
осью Oz она будет образовывать
декартову систему координат в про-
пространстве.
Рассмотрим проекции М2 и Мху
точки М на ось Oz и плоскость
Оху. Точка Мху как точка плоскости к имеет полярные координаты
рэ ф. Точка Mz как точка оси Oz имеет координату z.
Цилиндрическими координатами точки М в пространстве называ-
называются три числа р, ф, z. При этом сно-
снова предполагают, что
О ^ р < + оо, 0 ^ ф < 2л.
Рис. 24.2.
И
Угол ф для точек оси Oz не определен.
Связь декартовых координат в си-
системе Oxyz и цилиндрических коорди-
координат определяется соотношениями
У
Сферические координаты. Рассмот-
Рис. 24.3. рим в пространстве декартову прямо-
прямоугольную систему координат Oxyz и
соответствующую ей полярную/ систему координат в плоскости Оху
(рис. 24.3). Пусть М — любая отличная от О точка пространства,
Мху — ее проекция на плоскость Оху. Обозначим через р расстояние
от точки М до точки О, через 9 — угол между вектором ОМ
и базисным вектором оси Oz и, наконец, через ф — полярный угол
проекции Мху.
Сферическими координатами точки М в пространстве называются
три числа р, ф, 9. Число р называется радиусом, число ф —
§ 25] НЕКОТОРЫЕ ЗАДАЧИ 79
долготой, число 0 — широтой. При этом предполагают, что
О < р < + оо, 0 < ф < 2я, 0 < 0 < п.
Долгота не определена для всех точек оси Oz, широта — для точки О.
Связь декартовых координат в системе Oxyz и сферических коорди-
координат определяется соотношениями
х = р sin 0 cos ер, у = р sin 0 sin cp, z = p cos 0.
Упражнения.
1. Построить линию, координаты точек которой в полярной системе
удовлетворяют соотношению р = cos Зф.
2. Построить линию, координаты точек которой в цилиндрической системе
удовлетворяют соотношениям р = ф, z = ф.
3. Построить поверхность, координаты точек которой в сферической системе
координат удовлетворяют соотношениям
О ^ р < 1, <р = я/2, 0 < 9 ^ я/2.
§ 25. Некоторые задачи
Рассмотрим несколько простых задач на применение декартовых
прямоугольных систем координат. Для определенности мы будем
рассматривать задачи в пространстве. Аналогичные задачи на плоскости
отличаются от этих задач лишь незначительными деталями. Будем
считать всюду, что фиксирована некоторая система координат, начало
которой есть точка О, а базисные векторы — /, j, к.
Координаты вектора. Пусть в пространстве заданы две точки
Mxfax, рь Yi)> M2(oc2, р2, у2). Эти точки определяют вектор
М1М2, который относительно базиса i, j, к имеет какие-то координаты.
Установим связь между координатами вектора МХМ2 и координатами
точек Мъ М2. Имеем
М1Мг = 0М2 - OMV
Далее, по определению аффинных координат точек Мь М2
0М1 = с*!* + Pj +~Yi*> 0М2 = u2i + Р^' + у2к.
Поэтому отсюда следует, что
М1М2 = (ос2 - ai)i + (Р2 - Pi); + (у2 - у±)К
или, согласно принятым обозначениям,
WJd2 = (a2 - a1? p2 - рь Y2 - Yi)- B5.1)
Координатные проекции вектора. Снова рассмотрим направленный
отрезок MiM^ в пространстве. Спроектировав точки Мх, М2 на одну
и ту же координатную плоскость или координатную ось, мы получим
новый направленный отрезок. Он называется координатной проекцией
вектора MXMZ.
80
ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ
[Гл. 3
Каждый вектор пространства имеет шесть координатных проекций —
три проекции на координатные оси и три проекции на координатные
плоскости. Легко вычислить координаты проекций в базисе i, j, к по
координатам точек М1{аъ р1? ух)9 М2(а2) Р2? Уг)- Для этого достаточно
воспользоваться формулами B3.8)) B5.1).
Пусть, например, мы вычисляем координаты проекции
М1хМ2х. Учитывая, что точки М1х, М2х имеют координаты
М1л(аь0,0), M2jc(oc2,O,O),
находим, что
Аналогично
= (ос2-аь О, 0).
B5.2)
и т. д. для всех остальных проекций;
Сравнивая первую из формул B3.4) с формулами типа B5.2),
заключаем, что
{М1хМ2х} = ос2 - аь {MlyM2y} s P2 - Рь {MlzMiz} - У2 - У1-
Поэтому величины проекций вектора на координатные оси совпадают с
координатами этого вектора.
Вторая из формул B3.4) позволяет по крординатам точек М1? М2
вычислить длины проекций вектора Ы\М2 на координатные оси.
Именно,
Длина вектора. Установим формулу для.вычисления длины вектора
в пространстве. Очевидно, что длина \МгМ2\ вектора М1М2 равна
Рис. 25.1.
расстоянию р{Ми М2) между точками Ми М2 и равна также длине
диагонали прямоугольного параллелепипеда, грани которогд парал-
параллельны координатным плоскостям и проходят через точки Ми М2
§ 25] НЕКОТОРЫЕ ЗАДАЧИ 81
(рис. 25.1). Длина любого ребра параллелепипеда равна длине проек-
проекции вектора MtM2 на координатную ось, параллельную ребру. Поэтому
используя теорему Пифагора, заключаем, что
\M\~M.\ = (|MljcM2x|2 + \ЩМ2у\2 + [Mjt2z\2)m.
Если теперь точки Ми М2 заданы своими координатами Мх (аь рь ух),
М2(а2, р2,у2), то
р (Мь М2) = ((а2 - а1J + (Р2 - piJ + (у2 - YlJI/2. B5.3)
Если своими координатами х, у, z относительно базиса \ j, к задан
вектор Шг> то —^ ш {х2 + f + z2I/2_ ^ ,}
Аналогичный вид имеют формулу и в случае плоскости. Если
заданы своими координатами точки Мх (ось $х), М2 (а2, р2) или вектор
Щм1 = (х, у), то
р(М1? М2) = ((а2 - ахJ + (р2 - PiJI/2, |М7М21 = (х2 + /I/2.
Угол между векторами. Рассмотрим в пространстве ненулевые век-
векторы а, Ъ. Приложим их к точке О. Обозначим через п плоскость,
проходящую через точку О и" содержащую
оба вектора. Углом между векторами а, Ь
называется наименьший угол, на который
надо повернуть вокруг точки О один из век-
векторов в плоскости я, чтобы его направле-
направление совпало с направлением другого вектора.
Если хотя бы один из векторов нулевой, то
угол неопределен. Наша задача будет заклю- Рис, 25.2.
чатьсй в вычислении косинуса угла между
векторами по координатам этих векторов. Для косинуса мы примем
обозначение cos {а, Ь}.
Обозначим через А, В концы векторов а, Ъ в плоскости тт.
Очевидно^ что угол между векторами а, Ъ есть не что иное, как угол
ЛОВ треугольника ЛОВ, сторонами которого являются векторы ах Ь
и Ъ-а (рис. 25,2).
Предположим, что векторы аь Ъ заданы своими координатами
я = (*ь У и 'zii Ь = (х2, уъ z2).
Тогда b-a = (x2-xl9y2-yx,z2-zx).
Как известно из элементарной геометрии, квадрат длины стороны
треугольника равен сумме квадратов длин двух других его сторон
без удвоенного произведения длин этих сторон на косинус угла
между ними. Поэтому
82
ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ.
[Гл. 3
2?
иди, учитывая формулу B5.4),
(*2 - ХХJ + (уг - УхJ + (*2 - Z,J « х?
+ xl + A + zl - 2(х| +
Выполняя элементарные преобразования, находим
Изменения в формуле для случая плоскости очевидны.
Деление отрезка в данном отношении. Пусть в пространстве даны
прямая и две несовпадающие точки Мг и М2 на ней. Выберем на этой
прямой положительное направление. На полученной оси точки Мх и М2
определяют направленный отрезок М1М2.. Пусть М — любая, отличная
от М2 точка оси. Число
{мм\}
B5.6)
называется отношением, в котором точка М делит направленный
отрезок МХМ2. у ^
При изменении направления на оси числа {М^М} и {ММ2} одно-
одновременно меняют знак. Следовательно, отношение BУ6) не зависит
от выбранного на оси положительного
направления. Далее, при изменении
масштаба измерения длин отрезков на
оси числа {М±М} и {ММ2} умножают-
умножаются на одно и то же число. Следо-
Следовательно, отношение B5.6) не зависит
от выбранной единицы измерения длин.
Отсюда вытекает, что отношение B5.6)
не зависит от выбора на оси системы
координат.
Задача состоит в вычислении коор-
координат точки М, делящей отрезок
М1М2 в отношении X, если известны координаты точек Мь М2 и
число X, причем X Ф — 1. Итак, пусть даны Мх (аь рь ух), М2 (а2, Р2> Уг)
и неизвестна М(а, р, у). Спроектируем эти точки на оси координат,
например, ось Ох (рис. 25.3). Из соображений подобия ясно, что точка Мх
делит направленный отрезок М1хМ2х. также в отношении X. Поэтому
Рис. 25.3.
= {MixMx}
B5.7)
Согласно формуле B3.4), {М1хМх} = а - а}, {МхМ2х} = а2 - а. Теперь
§25]
НЕКОТОРЫЕ ЗАДАЧИ
83
с учетом B5.7) находим, что а = (ах + Х.а2)/A + X). Аналогично вычис-
вычисляются координаты р и у. Итак,
ос = -
1 + Х
р=-
1+Х
Y =
Yi
Заметим, что А, > 0, если точка М находится внутри отрезка М^М^
X < О, если точка М находится вне отрезка MiM2, и X = 0, если точка
М совпадает с точкой Мх. При перемещении точки М от точки Мг
до точки М2 (исключая совпадение с М2) отношение X принимает
сначала нулевое значение, а затем последовательно все возможные
положительные значения в порядке возрастания. Если точка М пере-
перемещается от точки Мх в положительном направлении оси (см. рис. 25.3),
то отношение X принимает сначала нулевое значение, а затем отри-
отрицательные значения в порядке убывания, приближаясь сколь угодно
близко к значению -X = — 1, но оставаясь все время больше него.,.
Если точка М перемещается в отрицательном направлении от точки
М2, то отношение X принимает все возможные отрицательные зна-
значения в порядке возрастания, но оставаясь все время меньше, чем
Х« -1.
Таким образом, между всеми действительными числами и точками
прямой можно было бы установить взаимно однозначное соответствие,
если бы на прямой была точка М, делящая отрезок МХМ2 в отно-
отношении Х= — 1, и если бы точке М, совпадающей с М2? можно было бы
поставить в соответствие какое-либо число. Обычно решают этот
вопрос, пополняя прямую условной
дополнительной «точкой», а числа —
условным дополнительным «числом».
Такая точка называется «бесконечно
удаленной», а число — «бесконечно
большим».
Ортогональные проекции вектора.
Пусть в пространстве задана неко-
некоторая ось и и направленный отрезок
АВ. Проведем через точки А, В
плоскости, перпендикулярные к оси и
(рис. 25.4). Пересечение этих плоскостей с осью определяет точки
Ат Ви9 из которых Аи лежит в одной плоскости с А, а Ви — в
одной плоскости с В. Направленный отрезок АиВи называется ортого-
ортогональной проекцией отрезка АВ на ось w. Для его обозначения
используется следующая символика:
Рис. 25.4.
ливи.
¦ ртиАВ.
При фиксированной оси и каждый вектор х пространства одно-
однозначно определяет свою ортогональную проекцию х'. Поэтому можно
84 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
считать, что задана некоторая «функция»
х' = ргЛ B5.8)
«аргументом» которой может быть любой вектор пространства,
а «значением» — вектор на оси и. Мы докажем сейчас, что эта функция
обладает следующими свойствами:
ргм (х ± у) = ргмх + рад 9)
pru(lx) = Xprux,
справедливыми для любых векторов хи.уи любого числа X.
В самом деле, зафиксируем какую-либо декартову прямоугольную
систему координат, в которой ось и совпадает с координатной осью
абсцисс. Пусть в этой системе
* = (аь Рь Ух),
У = (а2> Р2> Уг)>
тогда
х + у = (ос* + ос2, Pi + p2, Yi + Y2), "
В выбранной системе координат ортогональная проекция вектора
на ось и совпадает с его координатной проекцией на ось абсцисс.
Как уже отмечалось раньше, проекция любого вектора на ось абсцисс
имеет первую координату, совпадающую с первой координатой самого
вектора, а остальные координаты равны нулю. Поэтому
prM(* + y) = (ai+a2, 0, 0),
b 0, 0),
PVC = <аь 0, 0),
ргму = (а2, 0, 0).
Согласно правилам сложения векторов и умножения их на число
из последних двух равенств B5.10) заключаем, что
ргмх + prMy = (ax + а2, 0, 0),
= (Хаь 0, 0).
Сравнивая правые части полученных равенств с правыми частями
первых двух равенств B5.10), убеждаемся в справедливости
обоих свойств B5.9).
* Пусть теперь в пространстве задана некоторая плоскость тг и
направленный отрезок АВ. Опустив из точек А и В перпендикуляры
на плоскость п, мы получим в данной плоскости две точки Ап и Bft,
которые определяют направленный отрезок АпВп. Этот отрезок назы-
называется ортогональной проекцией направленного отрезка АВ на плоскость
§ 26] СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ 85
я. Для его обозначения используется та же символика, т. е.
Конечно, для ортогональных проекций на одну и ту же плоскость
имеют место соотношения, аналогичные B5.9). Для доказательства
можно зафиксировать какую-либо декартову прямоугольную систему
координат, в которой плоскость п является координатной плоскостью,
и снова воспользоваться соответствующими свойствами проекций на
координатную плоскость.
Мы рассмотрели ортогональные проекции векторов в пространстве.
Безусловно, полная аналогия имеет место и для векторов в плоскости.
Упражнения.
1. Два ненулевых вектора заданы своими декартовыми координатами.
При каком условии они перпендикулярны?
2. Найти координаты центра тяжести тре* материальных точек, если
известны их декартовы координаты и массы.
3. Найти площадь треугольника, если известны декартовы координаты
трех его вершин.
4. В пространстве заданы ненулевые векторы х, я, b, с, причем а, Ь, с —
попарно перпендикулярны. Доказать, что
cos2 {х, а} + cos2 {х, Ь] + cos2 {x, с} — 1.
5. Обозначим через п любую координатную плоскость, через и — любую
координатную ось в плоскости п. Доказать, что для любого вектора х
§ 26. Скалярное произведение
Использование направленных отрезков для изображения сил и пере-
перемещений приводит к очень важному понятию скалярного произведения
векторов.
Из физики известно, что если вектор а изображает силу, точка
приложения которой перемещается из начала вектора Ъ в его конец,
то работа со такой силы определяется равенством
B6.1)
Правая часть этого равенства и называется скалярным произведением
векторов а, Ъ. Обозначать его принято символом (а, Ь). Итак,
(а, Ь) = \а\\Ъ\ cos {а, Ъ}. B6.2)
Строго говоря, данное определение скалярного произведения отно-
относится лишь к ненулевым векторам а, Ь, так как только для таких
векторов определен угол. Однако, принимая во внимание прообраз
скалярного произведения, легко понять, как его нужно доопределить
в том случае, когда хотя бы один из векторов равен нулю. Если либо
сила, либо перемещение задается нулевым вектором, то выполняемая
86 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
работа равна нулю. Поэтому мы будем считать, что (а, Ъ) = 0, если
хотя бы один из векторов а, Ъ равен нулю.
Из формулы B6.2) вытекают некоторые геометрические свойства
скалярного произведения. Например, угол между двумя ненулевыми
векторами будет острым (тупым) тогда и только тогда, когда скаляр-
скалярное произведение этих векторов положительно (отрицательно).
Если угол между векторами прямой или хотя бы один из векторов
является нулевым, то скалярное произведение векторов равно нулю;
Такие векторы мы будем называть ортогональными.
Ортогональные векторы единичной длины мы будем называть
ортонормированными векторами. В частности, ортонормированными
являются базисное векторы г, j, к декартовой прямоугольной системы
координат. Из формулы B6.2) следует, что
ft 0 = 1, ft/) = 0, ft fc) = 0,
U, 0 = 0, (j,j) = l, a*) = 0, B6.3)
(fe, z) = 0, (k, j) = 0, (к, к) = 1.
Рассмотрим ненулевые векторы a, b. Проведем через вектор а ось и,
установив на ней такое направление, чтобы величина вектора а была
положительной. Тогда очевидно, что
{ргм Ъ} = | Ъ | cos {a, b}.
Проекцию вектора Ъ на ось, построенную таким образом, мы будем
называть проекцией вектора Ь на вектор а и будем обозначать ее
символом рглЬ. Конечно, проекция одного вектора на другой сохраняет
свойства B5.9). В новых обозначениях
(а, Ь) = |а|{рглЬ} = |Ы{ргьа}. B6.4)
Эти формулы позволяют установить очень важные алгебраические
свойства скалярного произведения. Именно, для любых векторов а, Ьъ с
и любого вещественного числа а справедливы соотношения:
1) (а, Ъ) = (Ь, а),
2) (оса, Ь) = оф, Ъ\
3) (а + Ъ, с) = (а, с) + (Ъ, с),
4) (а, а) > 0 при а Ф 0; @, 0) = 0.
Заметим, что соотношения B6.5) заведомо выполняются, если хотя
бы один из векторов нулевой. В общем, случае справедливость свойств
1, 4 сразу же следует из формулы B6.2). Для установления свойств 2, 3
воспользуемся формулами B6.4) и свойствами проекций. Имеем
(оса, Ъ) = | Ъ | {ргь (оса)} = | Ъ \ {а • ргьа} = а | Ъ\ {ргь а} = а (а, Ь),
(а + Ь, с) = |с|{ргДя + Ъ)} = |с\{ргса + ргсЬ} =
= |с|{ргса} + |с|{ргсЬ}=(а, с) + (Ь, с).
§ 26] СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ 87
Свойства 2, 3 связаны лишь с первым сомножителем скалярного
произведения. Аналогичные свойства имеют место и в отношении
второго сомножителя. Действительно,
(а; осЬ) = (осЬ, а) = ос (Ь, а) = а (а, Ъ\
(а, 6 + с) = (Ь + с, а) = (Ь, а) + (с, а) = (а, Ь) 4- (а, с).
Кроме этого, в силу равенства а-Ь = а + (-1)Ь будут справедливы
и такие соотношения:
(а - Ь, с) = (а, с) - (Ь, с),
(а, Ь - с) = (а, Ь) - (а, с),
так как
(а - Ь, с) = (а + (-1N, с) - (а, с) + ((-1N, с) =
= (а, с) + (-1)F, с) = (а, с)-F, с).
Теорема 26.1. Если два вектора а, Ь заданы своими декартовыми
прямоугольными координатами, то скалярное произведение этих векто-
векторов равно сумме попарных произведений соответствующих координат.
Доказательство. Предположим для определенности, что век-
векторы заданы в пространстве, т. е. а = (хи уъ z±), Ъ = (х2, у г, z2). Так как
а = Xli + yd + zxk9
b = х2г + у г] Л z2k,
то, выполняя алгебраические преобразования скалярного произведения,
находим
(а, 6) = xix2 ft 0 + *iJ>2 ft j) + X!Z2 ft k) + ухх2 у, 0 +
+уф а л+y^2 a *)+z±x2 (*, о + zl3/2 (fc, j) + ZiZ2 (fc, k):
Теперь согласно B6.3) имеем
(a, 6) = XiX2 + y1y2 + ZiZ2, B6.6)
и теорема доказана.
Формула B6.6) позволяет записать полученные ранее выражения
B5.4), B5.5) для длины вектора и угла между векторами через скаляр-
скалярные произведения.
Именно,
N = (a, aI/2,
Может показаться, что эти формулы тривиальны, так как они
сразу же вытекают из B6.2) без всяких ссылок на формулы B5.4), B5.5).
Однако не будем торопиться,с этим выводом, а обратим внимание
на бдно очень важное обстоятельство.
gg ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
Заметим, что в действительности все наше исследование проходило
в три этапа. Сначала, опираясь на формулу B6.2), мы доказали
справедливость свойств B6.5). Затем, опираясь только на эти свойства
и ортонормированность базисных векторов системы координат, мы
установили формулу B6.6). И наконец, используя формулы "B5.4), B5.5),
которые были выведены без понятия скалярного произведения векто-
векторов, мы получили формулы B6.7).
Исходя из этого мы могли бы теперь ввести скалярное произве-
произведение не заданием его явного вида, а аксиоматически, как некоторую
числовую функцию, определенную для каждой пары векторов, потре-
потребовав при этом -обязательное выполнение свойств B6.5). Тогда для
любых систем координат, в которых базисные векторы ортонормиро-
ваны в смысле аксиоматического скалярного произведения, снова будет
иметь место соотношение B6.6). Следовательно, имея в виду модель
декартовой прямоугольной системы координат, мы могли бы аксио-
аксиоматически считать, что длины векторов и углы между ними вычисля-
вычисляются по формулам B6.7). Конечно, при этом нужно было бы убе-
убедиться, что введенные подобным образом длины и углы обладают'1
йеобходимыми свойствами.
Упражнения.
1. Заданы два вектора а и Ъ. При каких условиях на число а векто-
векторы а и Ъ -Коса ортогональны? Какова геометрическая интерпретация этой
задачи?
2. Вектор а задан в пространстве V3 своими декартовыми координатами.
Найти два линейно независимых вектора, ортогональных вектору а.
3. Линейно независимые векторы а, Ъ заданы в пространстве Уъ своими
декартовыми координатами. Найти ненулевой вектор, ортогональный к обоим
векторам.
4. Что представляет собой геометрическое место векторов, ортогональных
к заданному вектору?
§ 27. Евклидово пространство
Изучавшиеся ранее абстрактные линейные пространства в некото-
некотором смысле беднее своими понятиями и свойствами, чем пространства
направленных отрезков. Беднее прежде всего потому, что в йих не
нашли отражения важнейшие факты, связанные с измерениями длин,
углов, площадей, объемов и т. д. Распространять метрические понятия
на абстрактные линейные пространства можно различным образом.
Однако самым эффективным способом задания возможности измерений
является аксиоматическое введение скалярного произведения векто-
векторов. Мы начнем наши исследования с вещественных линейных про-
пространств.
Вещественное линейное пространство Е называется евклидовым, если
каждой паре векторов х, у из Е поставлено в соответствие веще-
вещественное число (х9 у), называемое скалярным произведением, причем
$ 27] ЕВКЛИДОВО ПРОСТРАНСТВО 89
выполнены следующие аксиомы:
1) (х, у) = (у, х),
2) {Хх, у) = Х(х, у),
3)(x + J,z)~(x, z) + (y, z\
4) (х, х)>0 при х'Ф 0; @, 0) = 0
для произвольных векторов х; у, z из Е и произвольного веществен-
вещественного числа X.
Как мы уже знаем, из этих аксиом следует, что со скалярным
произведением можно выполнять формальные алгебраические преобра-
преобразования, т.е.
для любых векторов xi9 yj9 чисел af, pj и любого числа г, s слагаемых.
Всякое линейное подпространство L евклидова пространства Е само
становится евклидовым пространством, если в ней* сохранить скаляр
ное произведение, введенное в Е.
Легко указать общий способ введения скалярного произведения
в произвольном вещественном пространстве К. Пусть еъ е.2, ..., еп —
некоторый базис этого пространства. Возьмем два произвольных век-
вектора х, у из К и предположим, что
3? =
Скалярное произведение векторов теперь можно ввести, например,
следующим образом:
(х, у) = ^тц + ^Л2 + ... + 5»Ли. B7.2)
Проверка выполнения всех аксиом не представляет труда. Следова-
Следовательно, линейное пространство К со скалярным произведением B7.2)
является евклидовым.
Заметим, что скалярное произведение в пространстве К может
быть введено и другими способами. Например, в этом пространстве
скалярным произведением будет и такое выражение:
(х, у) =
при любых фиксированных положительных числах ось. а2? ..., аи.
Подобная неоднозначность никак не должна нас смущать. Нбт же
ничего удивительного в том, что длины можно измерять в метрах
и в дюймах, углы — в градусах и радианах и- т. п. Именно эта
неоднозначность позволяет наиболее полно учитывать свойства
конкретных пространств при введении в них скалярного произве-
произведения. ч
90 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
При введении скалярного произведения в пространствах направлен-
направленных отрезков нам пришлось отдельно определять его, когда хотя бы
один из отрезков был нулевым. В этом случае мы скалярное произ-
произведение полагали равным нулю. Теперь данный факт становится
свойством, вытекающим из аксиом B7.1), Если х — произвольный
вектор из Е, то ,_ ч ,_ ч .. . л
@, х) = (Ох, х) = 0(х, х) = 0.
Конечно, в силу первой аксиомы B7.1) (х, 0) = 0.
Вектор х евклидова пространства называется нормированным, если
(х, х) = 1. Любой ненулевой вектор у можно нормировать, умножив
его на некоторое число X. Действительно, по условию
(Ху, Ху) = Х2(у, у) = 1,
поэтому в качестве нормирующего множителя можно взять
Система векторов называется нормированной, если нормированы все
ее векторы. Как следует из сказанного выше, любую систему нену-
ненулевых векторов можно нормировать.
Одно из важнейших свойств скалярного произведения формулирует
следующая
Теорема 27.1 (неравенство Коши — Буняковского). Для любых
двух векторов х, у евклидова пространства справедливо неравенство
(х, #^(х, х)(у, у).
Доказательство. Теорема заведомо имеет место, если у = 0,
поэтому будем считать, что у Ф 0, Рассмотрим вектор х — Ху, где
X — произвольное вещественное число. Имеем
(х-Ху, x-ty) = fo x)~2X(x, у) + Х2(у, у).
В левой части равенства стоит скалярное произведение равных
векторов. Поэтому квадратный трехчлен в правой части неотрицателен
при любых X, в частности, при
г-ш: B73)
Таким образом,
откуда и вытекает утверждение теоремы.
По аналогии с пространствами направленных отрезков назовем
два вектора х, у любого линейного пространства коллинеарными,
если либо х = Ху, либо у = \ix для некоторых чисел X, ц. В силу
равенства 0 = Ох заключаем, что два вектора заведомо коллинеарны,
§ 27] ЕВКЛИДОВО ПРОСТРАНСТВО 91
если среди них имеется хотя бы один нулевой. Весьма удобным
средством проверки векторов на коллинеарность является неравенство
Коши — Буняковского. Именно, справедлива
Теорема 27.2. Неравенство КЬши — Буняковского обращается
в равенство тогда и только тогда, когда векторы х, у коллинеарны.
Доказательство. Пусть векторы х9 у коллинеарны. Предполо-
Предположим для определенности, что х — Ху. Находим
(*, .VJ = №, У? - ^ (у, УJ,' (*, *)(у, У) = №, Ьу)(у, у) = X2(у, уJ.
Сравнение этих равенств показывает, что достаточность утверждения
теоремы имеет место.
Пусть теперь для некоторых векторов х, у выполняется такое
равенство:
(х,уJ = (х,х)(у,у). B7 А)
Если у = 0, то векторы коллинеарны. Если же у Ф 0,. то, беря X
согласно B7,3) и учитывая B7.4), получаем, что
(х — Ху, х — Ху) = 0.
В силу последней аксиомы B7.1) это означает, что х — Ху = 0 или
х — Ху, т. е. коллинеарность векторов х, у. Необходимость утверждения
теоремы также имеет место.
В качестве примера рассмотрим пространство Rn. Это простран-
пространство можно сделать евклидовым, если для векторов
х = (аь а2, ..., а„),
У = (Рь Р2, ¦-., PJ
скалярное произведение ввести следующим образом:.
(*У)-= t«ifc- B7.5)
Очевидно, что аксиомы B7.1) выполняются. Неравенство Коши — Буня-
Буняковского в данном случае означает, что
для любых вещественных чисел OLt, рг.
Упражнения.
1. Как ввести скалярное произведение в -пространстве многочленов с ве-
вещественными коэффициентами от одной переменной?
2. Станет ли пространство Rn евклидовым, если скалярное произведение
в нем ввести следующим образом:
92 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
3. Каков геометрический смысл неравенства Коши - Буняковского в про-
пространствах направленных отрезков?
4. Доказать, что х = у тогда и только тогда, когда (х, d) = (у, d) при всех
векторах d,
§ 28, Ортогональность
Наиболее важным отношением между векторами евклидова про-
пространства является ортогональность.
По определению, векторы х, у называются ортогональными, если
(х, у) = 0. В силу первой аксиомы B7.1) отношение ортогональности
двух векторов симметрично. В пространстве направленных отрезков
понятие ортогональности совпадает, в основном, с понятием перпен-
перпендикулярности. Поэтому ортогональность можно рассматривать как
обобщение понятия перпендикулярности на абстрактные евклидовы
пространства.
Система векторов евклидова пространства называется ортогональ-
ортогональной, если либо она состоит из одного вектора, либо ее векторы
попарно ортогональны. Если ортогональная система состоит из нену-
ненулевых векторов, то ее можно нормировать. Нормированная ортого-
ортогональная система называется ортонормированной.
Интерес к ортогональным и ортонормированным системам объяс-
объясняется теми преимуществами, которые они дают при исследовании
евклидовых пространств.
Так, например, любая ортогональная система ненулевых векторов
и, конечно, ортонормированная система линейно независима. В самом
деле, пусть система хь х2, ..., хк ортогональна и xt Ф 0 для всех L
Это означает, что (xh Xj) = 0 для i Ф j, но (xh х3) ф 0 для i — j. Напишем
равенство
O + ОС2Х2 + . . . + OLkXk = 0.
Умножив его скалярно на любой из векторов хь находим
<*i fa, *i) + oc2 (xh x2) + ... + afc (xh хк) = 0.
Следовательно, . /л« ^
щ{хь хд = 0 B8.1)
и^ конечно, cti = 0. Таким образом, система векторов хь х2, ..., хк
линейно независима.
Из равенства B8.1), в частности, получаем, что если сумма попарно
ортогональных векторов равна нулю, то все векторы — нулевые.
Особенно много полезных следствий вытекает из предположения,
что некоторая ортонормированная система еъ е2, ..., es может обра-
образовывать базис евклидова пространства Е. В этом случае каждый
вектор х из ? должен единственным образом представляться в виде
линейной комбинации
х - a^i 4- а2е2 + .., + ccses.
§ 28] ОРТОГОНАЛЬНОСТЬ 93
Но, умножив данное равенство скалярно^на еь мы получаем явное
выражение для коэффициентов разложения по базису. Именно,
Щ = (х, е(). B8.2)
Если для другого вектора у имеет место разложение
то, выполнив простые преобразования, находим, что
(х, у) = otiPi + ос2р2 + ... + oc5ps. B8.3)
В частности, (х, х) = а? + <х2 + ... + а,2. B8.4)
Прежде чем продолжать подобные исследования, выясним, суще-
существует ли базис, состоящий из ортонормированных векторов.
Базис, векторы которого образуют ортонормированную систему,
называется ортонормированным. Существование такого базиса в, евкли-
евклидовом пространстве доказывает
Теорема 28.1. В любом конечномерном евклидовом пространстве
Е существует ортонормированный базис.
Доказательство. Пусть dim E = п. Ортонормированная система
линейно независима, поэтому она не может содержать более чем
п векторов. Предположим, что система еи еъ • • •, es содержит макси-
максимальное число ортонормированных векторов. Это означает, что в про-
пространстве Е не существует ни одного ненулевого вектора, ортогональ-
ортогонального ко всем векторам еи еъ ..., es. Если некоторый вектор орто-
ортогонален к этим векторам, то он должен быть нулевым.
Возьмем произвольный вектор х из Е. Если бы ортонормированная
система еи еъ .. «, es была базисом, то вектор х должен был бы
совпадать с вектором у, где
у = (х, е±) et + (х, е2) е2 +'... + (х, es) es.
Рассмотрим поэтому вектор х — у. Имеем
(х - у, ед = { х - X (*» ер) ер> ei =
\ р=1 /
S
= (х, et) - ? (ху ep)ieP> ей = (х' ei) ^ (х' еЬ - 0.
р=х
Вектор х — у оказывается ортогональным ко всем векторам ех> е29..., es.
Следовательно, х — у = 0 или х = у.
Итак, линейно независимая система еи еъ ..., es обладает тем
свойством, что через ее векторы линейно выражается любой вектор
пространства Е, т.е. она образует базис.
Следствие. Любую ортонормированную систему векторов el9
е2ь ..., ек можно дополнить до ортонормированного базиса.
94 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
В самом деле, среди ортонормированных систем, содержащих
заданную систему, возьмем ту, которая имеет максимальное число
векторов. Пусть это будет система еь ..., eh ек\ъ ..., es. Повторяя
далее дословно доказательство теоремы 28.1, устанавливаем, что новая
система является базисом.
Кроме ортогональных векторов в евклидовом пространстве, мы
будем рассматривать и ортогональные множества векторов. Два мно-
множества F и G векторов евклидова пространства Е называются орто-
ортогональными, если каждый вектор из F ортогонален к каждому век-
вектору из G. Ортогональность J7 и G обозначается символом F1 G.
Конечно, множество может состоять и из одного вектора. Если
некоторый вектор множества ортогонален ко всему множеству, то он,
в частности, ортогонален и к самому себе. Следовательно, он может
быть только нулевым.
Лемма 28.1. Для того чтобы вектор х был ортогонален к под-
подпространству L, необходимо и достаточно, чтобы он был ортогонален
ко всем векторам какого-либо базиса подпространства L.
Доказательство. Зафиксируем базис уи у2, ..., у к подпростран-
подпространства L. Если х JL L, то х ортогонален ко всем векторам из L и,
в частности, к векторам уъ у2? ..., ук. Пусть теперь (х, yt) = 0 для
всех L Возьмем произвольный вектор z из L и разложим его по
векторам базиса. Если
для некоторых чисел а1? а2, ..., <х^ то
(х, z) = (х, а^! + а2у2.+ ... + икУк) =
= <*i fa h) + а2 (х, у2) + ... + ocfc (х, ук) = 0.
Это означает, что х _L L.
Следствие. Для того чтобы два подпространства были орто-
ортогональны, необходимо и достаточно, чтобы каждый вектор какого-либо
базиса одного подпространства был ортогонален ко всем векторам
какого-либо базиса другого подпространства.
Сумма К линейных подпространств Lu L2, ..., Lm называется
ортогональной, если подпространства попарно ортогональны. Для
обозначения ортогональной суммы мы будем применять следующую
символику.
K LeL©ei
Лемма 28.2. Ортогональная сумма ненулевых подпространств
всегда является прямой суммой.
Доказательство. Выберем в каждом подпространстве орто-
нормированный базис и рассмотрим систему векторов, представляю-
представляющую собой объединение базисов всех подпространств. Ясно, что
каждый вектор из ортогональной суммы линейно выражается через
векторы построенной системы. Но эта система линейно независима,
§ 28] ОРТОГОНАЛЬНОСТЬ 95
так как состоит из ненулевых попарно ортогональных векторов. Теперь
утверждение леммы вытекает из теоремы 20.1.
Пусть евклидово пространство К представлено в виде ортогональ-
ортогональной суммы своих подпространств Lu L2, ... > Lm, тогда совокупность
этих подпространств можно рассматривать как обобщенный ортого-
ортогональный базис. В частности, если для любых векторов х, у из К мы
напишем их разложения по подпространствам Lx L2, .. •» Lm, т. е.
представим в виде
х = Xi + х2 + ... + хт,
где х;, У(€Ц, то легко установить, что
(X, У) = (XU У!) + (*2, Уг) + • • • + (*т> УтУ B8.5)
Полученная формула аналогична формуле B8.3).
Рассмотрим произвольное непустое множество F векторов евкли-
евклидова пространства Е. Совокупность всех векторов, ортогональных
множеству F, называется ортогональным дополнением множества F
и обозначается i71-. Ортогональное дополнение есть подпространство.
В самом деле, если векторы х, yeF\ то х, y^F. Но тогда
ах + Pj_L F для любых чисел а, Р? т.е. ах + fiyeF1.
Теорема 28.2. Евклидово пространство Е есть ортогональная
сумма любого своего линейного подпространства L и его ортогональ-
ортогонального дополнения L1, т.е.
Доказательство. Пусть dimL = s, dimL1 =m. Выберем какой-
либо ортонормированный базис еи ..., es подпространства L и какой-
либо ортонормированный базис rl9..., гт подпространства IA. Система
векторов еи ..., es> rl9\\., rm - ортонормированная и, следовательно,
линейно независимая.
Если эта система не является базисом Е, то ее можно дополнить
до ортонормированного базиса Е. Пусть е — один из дополнительных
векторов. Он ортогонален к векторам е±, ..., eS9 поэтому eJLL,- т.е.
eeLL. Но, с другой стороны, вектор е ортогонален к векторам
rl9 ..., rm, поэтому el L1. Итак, вектор е одновременно и принадлежит
L1 и ортогонален к L1. Следовательно, е = 0, что и доказывает
справедливость утверждения теоремы.
Разложение пространства в ортогональную сумму своих под-
подпространств позволяет эффективно проводить многие исследования.
Проиллюстрируем это на следующем примере.
Рассмотрим евклидово пространство ? и в нем некоторую фик-
фиксированную систему векторов хх х2, ..., хк. Если ранг этой системы
равен размерности Е, то очевидно, что единственным вектором из Е,
ортогональным ко всем векторам данной системы, будет нулевой
вектор. Имеет место и обратная
% ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
Лемма 28.3. Если в евклидовом пространстве Е задана некоторая
система векторов xif х2, ..., xk и единственным вектором из Е,
ортогональным к этим векторам, является нулевой вектор, то ранг
системы равен размерности Е.
Доказательство. Обозначим через L линейную оболочку сис-
системы векторов х1? х2, ..., хк. Любой вектор, ортогональный к данным
векторам, ортогонален к L, т. е. принадлежит ортогональному допол-
дополнению L1. Согласно условию леммы, подпространство ZA состоит
только из нулевого вектора. Так как E = L® L1, то отсюда вытекает,
что размерность L совпадает с размерностью Е. Но размерность L
равна рангу системы векторов хъ х2, ..., xk. Лемма доказана.
Упражнения.
1. Доказать, что если скалярное произведение любых двух векторов
евклидова пространства выражается равенством B8.3), то базис, относительно
которого взяты координаты, является ортонормированным.
2. Доказать, что если скалярное произведение любого вектора евклидова
пространства с самим собой выражается равенством B8.4), то базис, отно-
относительно которого взяты координаты, является ортонормированным,
3. Доказать, что если два множества, состоящие из конечного числа
векторов; ортогональны, то ортогональны и линейные оболочки, построенные
на этих множествах.
4. Доказать, что пересечение двух ортогональных подпространств состоит
лишь из нулевого вектора.
5. Доказать, что если евклидово пространство есть прямая сумма своих
подпространств и для любых дэух векторов имеет место равенство B8.5), то
подпространства попарно ортогональны.
6. Доказать, что для любых подпространств L, М евклидова пространства
Е справедливы соотношения
dim L 4- dim L1 = dim E,
(Lf]M)^L'^^M^.
§ 29. Длины, углы, расстояния
Распространим теперь на элементы евклидова пространства такие
понятия, как длина, угол и расстояние. При этом будем исходить
из аналогии с пространствами направленных,отрезков.
Длиной \х\ вектора х евклидова пространства Е называется вели-
У каждого вектора существует длина. Причем, согласно последней
аксиоме B7.1), она положительна для ненулевых векторов и равна нулю
§ 29] ДЛИНЫ, УГЛЫ, РАССТОЯНИЕ 97
для нулевого вектора. Далее, равенство
| Хх | = (кх, ХхI'2 = (X2 (х, х.)I'2 = | X 11 х |
показывает возможность вынесения абсолютной величины числового
множителя X за знак длины вектора. Как мы уже отмечали, ненулевой
вектор можно нормировать, т. е. умножить на т,акое число, чтобы
длина получаемого вектора стала равной единице.
Углом {х} у} между ненулевыми векторами х, у евклидова про-
пространства Е называется угол, определяемый соотношениями
Если среди векторов х, у есть хотя "бы один нулевой, то угол между
такими векторами считается неопределенным.
Неравенство Коши — Буняковского позволяет утверждать, что выра-
выражение, которое мы назвали косирусом угла между векторами, по
модулю не превосходит единицы. Поэтому угол между любыми
ненулевыми векторами всегда определен и притом однозначно. Он
не меняется от умножения векторов на любые положительные числа
и, согласно теореме 27.2, равен 0 или п тогда и только тогда, когда
ненулевые векторы коллинеарны. Все это полностью согласуется с по-
понятием угла между направленными отрезками.
Возьмем два ненулевых вектора х, у. Имея в виду аналогию
с направленными отрезками, будем считать их двумя сторонами
некоторого треугольника. Третьей стороной треугольника естественно
взять вектор х — у. Используя определение длины вектора и угла между
векторами, находим
\х-у\2 = (х-у, х->') = (х, х)-2(х, у) + (у9 >') =
= M2 + |y|2-2|x||y|cos{x,y}. B9.1)
Итак, мы показали, что в евклидовом пространстве квадрат длины
любой стороны треугольника равен сумме квадратов длин двух других
его сторон без удвоенного произведения длин этих сторон на: косинус
угла между ними.
Если треугольник прямоугольный, т.е. угол между векторами х, у
прямой, то, очевидно,
|х-у|2-|х|2 + |у|2. B9.2)
Это есть не что иное, как формульное выражение известной теоремы
Пифагора.
Снова рассмотрим произвольный треугольник. Так как косинус угла
между векторами не превосходит по модулю единицы, то из B9.1)
следует, что
4 В. В. Воеводин
98 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
ИЛИ
1*-уК1*| + М,
\х-у\>\\х\-\у\\. 1 ш)
Таким образом, в евклидовом пространстве длина стороны тре-
треугольника не превосходит суммы длин Двух других сторон, но не
меньше разности их длин.
Расстоянием р (х, у) между векторами х, у евклидова пространства
называется величина
p{x9y) = \x-yU B9.4)
Она удовлетворяет трем естественным свойствам расстояния между
векторами (в точечной интерпретации!) в пространствах направленных
отрезков. Именно, для любых векторов х, у, z евклидова пространства
1) Р (х, у) = р (у, х),
2) Р (х, у) > 0, если х Ф у, р (х, у) = 0, если х = у, B9.5)
3) р(х, уКр(х, z) + p(z9 у).
Первые два свойства очевидны. Последнее свойство есть не что
иное, как обобщение известного «неравенства треугольника». Его
справедливость вытекает из первого неравенства B9.3), если заменить
х на х — z и j> на у — z.
Расстоянием р(Л, В) межЪу множествами А, В векторов одного
и того же пространства называется величина
р(Л, Б)= inf p(x, у).
хеА>уеВ
В заключение отметим следующее обстоятельство. Пусть в евк-
евклидовом пространстве Е фиксирован ортонормированный базис
еъ е2, ..., es. Для любых двух векторов х, у, заданных своими коор-
координатами , ч
х = (аь ос2, ..., а,), у = фи C2? ..., ps)
относительно этого базиса, мы будем иметь, согласно B8.3),
Следовательно,
cos
COS
Полная аналогия с формулами B5.4), B5.5) очевидна.
Таким образом, введенные нами понятия длины, угла и расстояния
полностью согласуются с аналогичными понятиями в пространствах
направленных отрезков.
§ 30J НАКЛОННАЯ, ПЕРПЕНДИКУЛЯР, ПРОЕКЦИЯ 99
Упражнения.
1. Доказать, что длина суммы любого числа векторов не превосходит
суммы длин этих векторов.
2. Доказать, что квадрат длины суммы любого числа ортогональных
векторов равен сумме квадратов длин этих векторов.
3. В евклидовом пространстве многочленов, зависящих от одной перемен-
переменной t, найти углы в треугольнике, образованном векторами 1, t29 I — t2.
4. Каково расстояние между многочленами 3t2 + 6 и 2t3 -+• t + 1 ?
5. Доказать, что треугольник в-евклидовом пространстве является прямо-
прямоугольным тогда и только тогда, когда длина одной стороны равна произве-
произведению длины другой стороны на косинус угла между ними.
§ 30. Наклонная, перпендикуляр, проекция
Прежде чем распространять на абстрактные евклидовы пространства
понятия наклонной, перпендикуляра и проекции, рассмотрим эти
понятия в пространстве направленных отрезков.
Пусть задана плоскость L. Опустим на нее из некоторой точки М
перпендикуляр и обозначим его основание через ML (рис. 30.1). Чтобы
дать этой задаче векторную трактовку, выберем на плоскости L
точку О и рассмотрим пространство V3 направленных отрезков, за-
закрепленных в О. Плоскость L образует
подпространство. Поэтому достроение
перпендикуляра, опущенного из точки М на
плоскость L, сводится к разложению век-
вектора ОМ пространства в сумму
ОМ = OML + М]~М, C0.1)
где OMLeL, a MLM1L Из геометриче-
геометрических соображений ясно, что разложение рис 30 i
C0.1) всегда существует и единственно.
Рассмотренный пример подсказывает, как надо ставить задачу
о перпендикуляре в общем случае. Предположим, что в евклидовом
пространстве Е фиксировано некоторое подпространство L. Возыйем
произвольный вектор / из Е и будем исследовать возможность его
разложения в сумму
/ = 0 + й, C0.2)
где д е L, a h I L.
С этой задачей мы уже встречались. В' самом деле, условие h I L
эквивалентно условию heL1. Согласно теореме 28.2, евклидово про-
пространство Е — прямая сумма подпространств L и L1. Поэтому разло-
разложение C0.2) всегда существует и притом единственно.
Имея в виду аналогию с разложением C0.1), вектор д в разложении
C0.2) будем называть проекцией вектора f на подпространство L,
h — перпендикуляром, опущенным из вектора f на L, а сам ректор
/ — наклонной к подпространству L,
4*
100 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
Известно, что в элементарной геометрии длина перпендикуляра
никогда не превосходит длины наклонной. Аналогичная ситуация имеет
место и в евклидовом пространстве. Векторы д, h в разложении C0.2)
ортогональны. Поэтому, согласно теореме Пифагора,
откуда и вытекает, что
I h I ^ 1/1 •
Ясно, что длина перпендикуляра h к подпространству L равна длине
наклонной / к тому же продпространству тогда и только тогда, когда
fJLL.
Задаче о перпендикуляре можно дать и другую трактовку. Снова
рассмотрим произвольный вектор / из Е. Этот вектор не обязательно
принадлежит подпространству L. Следовательно, можно ставить воп-
вопрос о нахождении в L такого вектора, который ближе всего располо-
расположен к / в смысле введенного ранее расстояния.
Возьмем произвольный вектор z из L. Вычитая его из обеих частей
равенства C0.2), получим
Так как вектор h ортогонален к вектору д — z, то, согласно теореме
Пифагора, имеем
П°ЭТОМУ \f-z\>\h\,
причем равенство возможно тогда и только тогда, когда z =• д.
Итак, среди всех векторов из подпространства L проекция вектора
/ на L ближе всего расположена к вектору /. Это означает, что
По аналогии с направленными отрезками назовем углом между
вектором f и подпространством L наименьший из углов между век-
вектором/и векторами z из L. Учитывая неравенство Коши — Буняков-
ского и разложение C0.2), находим
m.ffr] (/»*) _(g + Kz)_ (g,z) \g\
Очевидно, что это неравенство обращается в равенство тогда и только
тогда, когда вектор z образует нулевой угол с вектором д.
Таким образом, угол между вектором / и подпространством L
совпадает с углом между вектором / и его проекцией на подпростран-
подпространство L.
§ ЭО] НАКЛОННАЯ, ПЕРПЕНДИКУЛЯР, ПРОЕКЦИЯ 101
Отмеченные свойства перпендикуляра и проекции отражают гео-
геометрическую сторону этих понятий. Теперь мы рассмотрим их с ал-
алгебраической точки зрения. При фиксированном подпространстве L
каждый вектор / евклидова пространства Е однозначно определяет
по отношению к L две своих составляющих. Следовательно, можно
считать, что разложение C0.2) задает две функции
9 =
h =
«Аргументом» функции может быть любой вектор из ?, «значением»
функции prt/ — вектор из L, «значением» функции ortj/ — вектор из LL.
В силу соотношения (LJ-)J = L перпендикуляр и проекция связаны
между собой такими равенствами:
ortLl/,
ortj/=prLl/.
Поэтому изучение этих функций в действительности всегда сводится
к изучению одной из них.
Возьмем два произвольных вектора х, у из Е. Согласно разло-
разложению C0.2), имеем
х = prLx + ortLx,
C0.4)
У = pry + ortjj;.
Складывая почленно эти равенства и умножая первое из них на про-
произвольное вещественное число X, получим
х + У = (prLx + ртьу) + (ortLx + ortLy\
Хх = (X prLx) + (X ortLx).
Непосредственной проверкой убеждаемся, что векторы в первых скоб-
скобках принадлежат L, а во вторых скобках — перпендикулярны к L.
Согласно единственности разложений типа C0.2), это означает спра-
справедливость таких соотношений
= A,prLx
для функции prL и, конечно, аналогичных соотношений
OrtL(.X + 'y) = OYtLX
ortL(^.\) = X ortLx
для функции ortL. Имеет место полное совпадение формул B5.9) и C0.5).
Заметим, что ortL? = 0 для любого вектора z из L. Поэтому из
первого равенства C0.6) вытекает, что
ortL(x + z) — ortL(x).
102 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
Следовательно, значение функции ortL не меняется, если к аргументу
прибавить любой вектор из подпространства L. В частности, если
взять z.= — prLx, то, учитывая C0.4), получим
ortL(ortLx) = ortLx. C0.7)
Аналогичное соотношение имеет место и для проекции. Именно,
prL(prLx) = prLx. C0.8)
Пусть теперь подпространство L — ортогональная сумма подпро-
подпространств Lj и Ln. Возьмем произвольный вектор х из Е и представим
его в виде суммы
* = (prLl х + prL2 x) + (х - prLix - рг^х).
Вектор в первых скобках, очевидно, принадлежит подпространству
Li ® L2. Вектор во вторых скобках ортогонален L1 ф L2, в чем легко
убедиться, преобразовав его с помощью соотношений C0.4) следующим
образом:
х - prLl х - prL2 x = ortLl x -,prL2 x = ortL2 x - prLjL x. C0.9)
Поэтому заключаем, что
Перпендикуляр, опущенный из вектора х на подпространство Lx ф L2,
равен одному из выражений C0.9). Если, в частности, х 1 Li9 то
ortL1eL23C = ort/.2X C0Л°)
Упражнения.
1. Имеет ли место в евклидовом пространстве аналог теоремы о трех
перпендикулярах ?
2. Доказать, что сумма двух углов .между вектором / и подпространствами
L и L- равны те/2.
3. Найти перпендикуляр и проекцию вектора / на тривиальные под-
подпространства.
4. Доказать, что если для фиксированных подпространств Ll9 L2 и любого
вектора х справедливо равенство
P^L, +L2 х = Pr/.i х + prL2 х,
то сумма Ll + L2 является ортогональной.
5. Доказать, что если подпространства Lb L2, ..., Lm попарно орто-
ортогональны, то для любого вектора х из Е
§ 31] ЕВКЛИДОВ ИЗОМОРФИЗМ 103
§ 31. Евклидов изоморфизм
Выполняя наши исследования, мы уже неоднократно отмечали
совпадение свойств абстрактного евклидова пространства и пространств
направленных отрезков. Можно было бы и далее переносить на
евклидово пространство остальные факты и теоремы элементарной
геометрии. Однако в этом нет никакой необходимости.
Введем понятие евклидова изоморфизма. Мы будем говорить, что
евклидовы пространства Е и Е евклидово изоморфны, если они изо-
изоморфны как вещественные линейные пространства и, кроме этого, для
любой пары векторов х, у из Е и соответствующих векторов х'9 / из Е
выполняется равенство
(х, у) = (*', /).
Теорема 31.1. Для того чтобы два евклидовых пространства
были евклидово изоморфны, необходимо и достаточно, чтобы были
равны их размерности.
Доказательство. Если два евклидовых пространства Е и ЕТ
евклидово изоморфны, то они изоморфны и как линейные веществен-
вещественные пространства. Но такие линейные пространства имеют одинаковую
размерность.
Рассмотрим теперь два евклидовых пространства Е и Е! одинако-
одинаковой размерности п. Пусть еи е2, ..., е„ — ортонормированный базис
в Е, а е\9 е'ъ ..., е'п — ортонормированный базис в Е. Каждому век-
Т°РУ х = ахех + <х2е2 + ... + ад,
пространства Е поставим в соответствие вектор
пространства Е. Это соответствие, как было доказано ранее, есть
изоморфизм. Возьмем теперь другую пару соответствующих векторов
из Е и Е
Согласно B8.3) имеем
(х9 у) = otiPi + ос2р2 + ... + алря = (х\ у).
Теорема доказана.
Мы всюду интересуемся лишь такими свойствами линейных про-
пространств, которые являются следствиями основных операций, действую-
действующих в пространствах. С этой точки зрения евклидово изоморфные
пространства имеют одинаковые свойства. Поэтому любая геометри-
геометрическая теорема, доказанная в пространстве F3, будет справедлива
и в любом трехмерном подпространстве евклидова пространства.
104 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ (Гл. 3
Следовательно, она будет справедлива и в любом евклидовом простран-
пространстве. Конечно, типовым евклидовым пространством может служить
арифметическое пространство Rw со скалярным произведением, введен-
введенным согласно B7.2).
Упражнения.
1. Построить евклидов изоморфизм между пространствами V2 и R2.
2. Доказать, что в евклидово изоморфных пространствах ортонормиро-
ванная система векторов переходит также в ортонормированную систему.
3. Доказать, что в евклидово изоморфных пространствах углы между
парами соответствующих векторов равны.
4. Доказать, что в евклидово изоморфных пространствах перпендикуляр
и проекция переходят соответственно в перпендикуляр и проекцию.
§ 32. Унитарное пространство
Мы распространили основные метрические понятия лишь на ве-
вещественные линейные пространства. Аналогичные результаты имеют
место и в комплексном линейном пространстве.
Комплексное линейное пространство U называется унитарным, если
каждой паре векторов х, у из U поставлено в соответствие комплекс-
комплексное число (х, у), называемое скалярным произведением, причем выпол-
выполнены следующие аксиомы:
1) (*, У) = (уГх),
3) (х + у, z) = (х, z) + (у, z),
4) (х, х) > О при х Ф 0; @, 0) = 0
для произвольных векторов х, у, z из U и произвольного комплекс-
комплексного числа X.
Черта в первой аксиоме означает комплексное сопряжение. Это
единственное отличие от аксиом евклидова пространства не влечет
за собой никаких' глубоких различий, но забывать о нем все же
не следует. Так, например, если в евклидовом пространстве имеет
место равенство (х, Ху) — X (х, у), то в унитарном пространстве (х, Ху) =
= Цх,у).
В унитарном пространстве U можно ввести некоторые метрические
понятия. Как и в вещественном случае, длиной вектора будем называть
величинУ \x\=+(xxyi2
У каждого ненулевого вектора длина положительна, длина нулевого
вектора равна нулю. При любом комплексном X справедливо соот-
соотношение
\Хх\ = \Х\.\х\.
§ 32] УНИТАРНОЕ ПРОСТРАНСТВО 105
Справедливо и неравенство Коши — Буняковского
\(х,у)\Ы(х,х)(у,у).
Доказательство проводится по той же схеме, что и в вещественном
случае.
В унитарном пространстве, как правило, не вводят понятие угла
между векторами. Рассматривают лишь случай, когда векторы х я у
ортогональны. Под этим, как и в вещественном случае, понимают
выполнение равенства , ч Л
(х, у) = 0.
Очевидно, что (у, х) = (х, у) = 0.
По существу вся теория евклидова пространства, рассмотренная
выше, без изменения определений и общих схем доказательств пере-
переносится на унитарное пространство.
Типовым унитарным пространством может служить арифметическое
пространство С„, если для векторов
х = (ось ос2, ..., а„),
скалярное произведение ввести следующим образом:
(х, у) = ? а&. C2.1)
i=i
На этом пространстве легко показать значение комплексного сопря-
сопряжения в первой аксиоме. Если бы в пространстве С„ мы ввели ска-
скалярное произведение согласно формуле B7.2), то, например, в простран-
пространстве С3 для вектора
/, = C,4,50
мы бы имели
(х, х) = 9 + 16 + 25/2 = 0.
Важная четвертая аксиома оказалась бы невыполненной.
Упражнения.
1. Сравните между собой евклидово пространство R2 и унитарное прост-
пространство С\.
2. Напишите неравенство Коши — Буняковского в пространстве С„.
3. Если в комплексном пространстве скалярное произведение вводится
согласно аксиомам B7.1), то может ли в таком пространстве выполняться
неравенство Коши - Буняковского?
4. Если в комплексном пространстве скалярное произведение вводится
согласно аксиомам B7.1), то может ли в таком пространстве существовать
ортототпьццц ?азис?
106 ИЗМЕРЕНИЯ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 3
§ 33. Линейная зависимость и ортонормированные системы
Мы уже отмечали в § 22, что линейная независимость системы
векторов базиса может быть нарушена при малом изменении самих
векторов. Это явление приводит к большим затруднениям в исполь-
использовании понятия базиса при решении практических задач. Однако
важно отметить, что не все базисы обладают столь неприятной
особенностью. В частности, ее не имеет любой ортонормированный
базис.
Пусть в евклидовом или унитарном пространстве выбран произ-
произвольный ортонормированный базис еи е2, ..., еп. Если для некоторого
вектора Ь имеет место разложение
Ъ = ? щеь
то, согласно B8.4),
|Ь|2
133.1)
Рассмотрим теперь систему векторов ех +еи е2 + в2, ..., е„ + е„ и
предположим, что она линейно зависима. Это означает, что существуют
такие числа рь р2, ..., Рто не равные нулю одновременно, что
Отсюда следует
1=1
Используя равенство C3.1) и неравенство B7.6), получаем
Е1Р.1:
ft
Е1Рг|2 =
i=i
и
Z Ра
i= 1
2
п
Е Pi8*
i= 1
Сравнивая левую и правую части полученных соотношений, заклю-
заключаем, что п
Таким образом, полученное неравенство означает, что при выпол-
выполнении условия
1Ш2<1 C3.2)
§ 33] ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И ОРТОНОРМИРОВАННЫЕ СИСТЕМЫ 107
система векторов
<?i + ги е2 + 82, ..., еп + гп •
будет заведомо линейно независимой.
Отмеченная особенность ортонормированных систем определила их
широкое использование при построении самых различных вычислитель-
вычислительных алгоритмов, связанных с разложением по базису.
Упражнения.
1. Пусть еи еъ ..., е„ — ортогональный базис евклидова пространства.
Доказать, что система векторов хи х2, ..., х„ линейно независима, если
" 1
X cos {eb xt} > п - —.
i=i z
2. Пусть векторы xt = (xiU xi2, ..., xin) для i — 1, 2, ..., n заданы своими
координатами в произвольном базисе. Доказать, что если
для всех i, то система хи х2, ..., хп линейно независима.
ГЛАВА4
ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ
ПРОСТРАНСТВЕ
§ 34. Векторное и смешанное произведения
Наши исследования снова начинаются с пространства направлен-
направленных отрезков. Как всегда, мы предполагаем, что фиксирована
некоторая декартова прямоугольная система координат с началом О
и базисом /, j9 к.
Три вектора называются тройкой, если указано, какой из этих
векторов является первым, какой — вторым и какой — третьим. При
записи тройки векторов мы будем располагать сами векторы слева
направо в порядке их следования.
Тройка некомпланарных векторов а, Ъ, с называется правой (левой),
если эти векторы располагаются так, как могут быть расположены
соответственно большой, несогнутый указательный и средний пальцы
правой (левой) руки.
Из любых трех некомпланарных векторов а, Ъ9 с можно составить
следующие шесть троек:
abc, bca, cab, Ъас, асЪ, cba.
Первые три тройки — того же наименования, что и тройка abc, осталь-
остальные тройки — противоположного наименования. Заметим, что если
в любой тройке поменять местами любые два вектора, то тройка
изменит свое наименование.
Аффинная или декартова система координат называется правой
(левой), если базисные векторы образуют правую (левую) тройку.
До настоящего момента наши исследования не зависели от того,
какое наименование имел базис системы координат. Сейчас в иссле-
исследованиях появятся некоторые различия. Поэтому для определенности
мы будем рассматривать в дальнейшем только правые системы
координат.
Пусть даны два неколлинеарных вектора а, Ь. Поставим им в со-
соответствие третий вектор с, удовлетворяющий следующим условиям:
1) вектор с ортогонален каждому из векторов а, Ь,
2) тройка abc — правая,
3) длина вектора с равна площади S параллелограмма, построен-
построенного на приведенных к общему началу векторах а, Ь. Если векторы
a, b коллинеарны, то такой паре векторов поставим в соответствие
нулевой вектор.
§ 34] ВЕКТОРНОЕ И СМЕШАННОЕ ПРОИЗВЕДЕНИЯ 109
Построенное соответствие есть алгебраическая операция в простран*
стве V3. Называется она векторным умножением векторов а, Ъ и
обозначается символом с — [а Ъ~\
Рассмотрим базисные векторы i, j, k. Согласно определению век-
векторного произведения, будем иметь
С/, 0 = -*> С/'Л = о, [/, k] = f, C4.1)
ftd-i ft Я = -*>[*>*] = о.
Из этих соотношений, в частности, вытекает, что операция векторного
произведения некоммутативна.
Каждая тройка аЪс некомпланарных векторов, приложенных к оф-
щей точке О, определяет некоторый параллелепипед. Точка О является
одной из вершин, векторы а, Ь, с — ребрами. Будем обозначать объем
этого параллелепипеда символом V(a, b, с), подчеркивая тем самым
его зависимость от векторов а, Ь, с. Если тройка а, Ь, с комплаг
нарна, то будем считать объем равным нулю. Припишем теперь
объему знак плюс, если некомпланарная тройка аЪс — правая, и знак
минус, если она левая. Определенное таким образом новое понятие
назовем ориентированным объемом параллелепипеда и обозначим его
символом V± (a, b, с).
Объем и ориентированный объем можно рассматривать как неко-
некоторые числовые функции от трех векторных аргументов, принимающие
определенные вещественные значения для каждой тройки векторов аЪс.
Объем всегда неотрицателен, ориентированный объем может иметь
любой знак. В разделении этих понятий мы обнаружим в дальнейшем
определенный смысл.
Пусть даны три произвольных вектора а, Ь, с. Если а умножается
справа векторно на Ь, а затем вектор [а, Ъ~\ умножается скалярно на с,
то полученное число ([а, Ь], с) называется смешанным произведением
векторов а, Ь, с.
Теорема 34.1. Смешанное произведение ([а, Ь\ с) равно ориенти-
ориентированному объему параллелепипеда, построенного на приведенных к об-
общему началу векторах а, Ь, с.
Доказательство. Не ограничивая общности можно считать,
что векторы а, Ъ неколлинеарны, так как в противном случае [а, Ь] = 0
и утверждение теоремы очевидно. Пусть по-прежнему S — площадь
параллелограмма, построенного на векторах а, Ъ. Согласно B6.4) имеем
([а, Ь], с) = | [а, Ь] | {pr[tfi bf} = S {pr[flf ь]с}. C4.2)
Предположим, что векторы а, Ь, с некомпланарны. Тогда {рГг „с}
с точностью до знака равна высоте h параллелепипеда, построенного
на приведенных к общему началу векторах а, Ъ, с9 при условии, что
ПО ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
основанием служит параллелограмм, построенный на векторах а, Ъ
(рис. 34.1). Таким образом, правая часть C4.2) с точностью до знака
равна объему построенного на* векторах а, Ь, с параллелепипеда.
Очевидно, что {рг^ h-,c} = +h, если векторы [а, Ъ~\ и с лежат по
одну сторону от плоскости, определяемой векторами а, Ь. Но в этом
случае и тройка abc — правая. В противном
случае {рГг hlc} = — h. Если векторы abc ком-
компланарны, то с лежит в плоскости, опре-
определяемой векторами а, Ь, и поэтому
{рГг hnc} = 0. Теорема доказана.
Следствие. Для любых трех векторов
а, Ъ, с справедливо соотношение
([о,Ь], с) = (а, [Ь, с]). 34.3)
Рис. 34.1.
Действительно, из симметрии скалярного
произведения следует, что (а, [Ь, с]) = ([Ь, с], а), поэтому достаточно
показать, что (\_а, Ь], с) = ([Ь, с], а). Но последнее равенство очевидно,
так как тройки abc и Ъса одного наименования и им соответствует один
и тот же параллелепипед.
Соотношение C4.3) позволяет эффективно проводить алгебраические
исследования. Мы докажем сначала, что для любых векторов а, Ь, с
и любого вещественного числа а имеют место следующие свойства
векторного умножения:
1) h Ч = - [Ь, а],
2) [щ Ь] = а[а, Ь],
3) [а + Ъ,с] = [а, с] + [Ь, с],
4) [а, а] = 0.
Свойство 4 очевидным образом следует из'"определения. Для дока-
доказательства остальных свойств мы воспользуемся тем фактом, что
векторы х и у равны между собой тогда и только тогда, когда
(х, d) = (у, d)
для любого вектора d.
Пусть d — произвольный вектор, Тройки abd и bad различного
наименования, Следовательно, на основании теоремы 34.1 и свойств
скалярного произведения заключаем, что
([a, b], d)=-db, 4^) = (-[M],4
Так как d - произвольный вектор, то это означает, что [а, Ь] = — [Ь, а]
и первое ^свойство доказано.
Для доказательства второго и третьего свойств поступаем анало-
аналогичным образом, но учитываем, кроме этого, соотношение C4.3). Имеем
([оса, Ы d) = (оса, [Ь, d]) = а (а, [Ь, d]) = а([аЬ], d) = (ос [а, Ь], d),
§ 34] ВЕКТОРНОЕ И СМЕШАННОЕ ПРОИЗВЕДЕНИЯ 111
что означает справедливость свойства 2. Далее,
([а + Ь, с], d) = (а + Ъ, [с, d]) = (а, [с, d]) + (Ъ, [с, d]) =
= ([а, с], d) + ([>, с], d) = ([а, с] + [Ь, с], <Q
и свойство 3 также справедливо. По отношению ко второму сомно-
сомножителю имеют место соответствующие равенства:
[а, а&] = - [ab, а] = -ос [&, а] = ос [а, Ь],
[а, fe + с] = - [6 + с, а~\ = - [6, а] - [с, а] = [а, Ь] + [а, с].
Теперь мы можем исследовать алгебраические свойства ориенти-
ориентированного объема как функции, заданной на тройках векторов. Пусть,
например, вектор а есть линейная комбинация некоторых векторов
а', а". Тогда
([оса' + Ра", Ь], с) = (ос [а\ Ь] + р [^, Ь], с) = ос ([>', Ь], с) + р ([а^, Ь], с).
Следовательно,
F± (оса; + р< Ь, с) = ocF± (а', Ь, с) + PF± (а", Ь, с)
для любых векторов а!, а" и любых вещественных чисел а, р.
При перемене двух аргументов местами ориентированный объем
лишь меняет свой знак, поэтому аналогичное свойство в отношении
линейной комбинации справедливо для каждого аргумента. Имея
в виду именно это свойство, мы будем говорить, что ориентирован-
ориентированный объем представляет собой линейную функцию по каждому аргу-
аргументу.
Если векторы аЪс линейно зависимы, то они компланарны, "поэтому
ориентированный объем в данном случае равен нулю. Далее, учитывая
соотношения C4.1), находим, что
Итак, мы можем заключить, что ориентированный объем как функ-
функция обладает следующими свойствами:
A) ориентированный объем есть линейная функция по
каждому аргументу,
B) ориентированный объем равен нулю на всех линейно
зависимых системах, C4.4)
C) ориентированный объем равен единице по крайней
мере на одной фиксированной ортонормированной
системе векторов.
Конечно, мы сформулировали далеко не все свойства ориентиро-
ориентированного объема. Как выделенные в C4.4), так и другие свойства
можно легко установить, зная явное выражение векторного и смешан-
смешанного произведений через координаты векторов а, Ь, с,
112 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
Теорема 34.2. Если векторы а, Ъ заданы своими декартовыми
прямоугольными координатами
<*> = (*ь Уъ zx),
Ъ = (х2, Уъ z2),
то векторное произведение будет иметь такие координаты:
[а, Ь] = (y1z2 - y2zl9 zxx2 - z2xx, xty2 - x2y1). C4.5)
Доказательство. Принимая во внимание, что задание коорди-
координат векторов определяет разложения
а = xxi + yxj + zxk,
b = x2i + y2j + z2/c,
и опираясь на алгебраические свойства векторного произведения, на-
находим.
[а, Ь] = ххх2 р, (j + xxy2 [i, j] + xxz2 р, /с] + у^г [/, i] + у^г [;, ;] +
+ ^1^2 [Л k] + zxx2 [/с, i] + z^ [/с, j] + ztz2 [/с, /с].
Справедливость утверждения теоремы вытекает теперь из соотноше-
соотношений C4.1).
Следствие. Если вектор с также задан координатами х3, уЪ9 z3
в той же декартовой системе, то
([а, Ь\ с) = х^ъ + х2};з^1 + x3j>iz2 - *\Уъ*г - x2yxz3 - x3y2^i. C4.6)
Введение ориентированного объема и исследование его алгебраи-
алгебраических свойств позволяет сделать важные выводы относительно длины,
площади и объема.
Заметим, что правые и левые базисы определяют разбиение мно-
множества всех базисов пространства на два класса. Само название
«правые и левые» не имеет глубокого смысла, а связано лишь
с удобным способом распознавания класса, к которому принадлежит
тот или иной базис. С этими двумя классами связано по существу
и понятие ориентированного объема.
С подобными фактами мы уже встречались. Все базисы на прямой
линии можно тоже разбить на два класса, объединяя в один класс
векторы, направленные в одну сторону. При этом оказывается, что
величина направленного отрезка является полным аналогом ориенти-
ориентированного объема, если оба эти понятия рассматривать как функции
на системах векторов. Свойство А имеет место согласно соотношениям
(9.8). Свойство В справедливо, так как величина нулевого отрезка
равна нулю. Выполнение свойства С очевидно.
Аналогичное исследование мы могли бы независимо провести и
в случае плоскости. Однако проще воспользоваться уже полученными
ранее результатами. Зафиксируемчкакую-либо декартову прямоугольную
систему координат Оху. Дополним ее до правой системы координат
§ 35] ОБЪЕМ И ОРИЕНТИРОВАННЫЙ ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ 113
Oxyz в пространстве. Обратим внимание на то, что в зависимости
от расположения осей Ох и Оу ось Oz может иметь одно из двух
возможных направлений. Это снова определяет разбиение множества
базисов плоскости на два класса. Ориентированную площадь S± (а, Ъ)
параллелограмма, построенного на векторах а, Ъ в плоскости Оху,
можно определить, например, равенством 5Ф (а, Ъ) = V± (а, Ь, к). Ко-
Конечно, свойства А, В, С опять имеют место.
Таким образом, приписывая длинам, площадям и объемам неко-
некоторые знаки и рассматривая их как функции, заданные на системах
векторов, мы можем добиться того, что все эти функции будут иметь
одни и те же алгебраические свойства А, В, С из C4.4).
Упражнения.
1. Доказать, что векторы а, Ь, с компланарны тогда и только тогда,
когда их смешанное произведение равно нулю.
2. Доказать, что для любых трех векторов а, Ъ, с справедливо соотно-
[а, \Ь, с]] = (а, с) Ъ - (а, Ъ) с.
3. Доказать, что векторное умножение не является ассоциативной опера-
операцией.
4. Найти выражение ориентированной площади параллелограмма через
декартовы координаты векторов на плоскости.
5. Изменятся ли формулы C4.5), C4.6), если система координат, отно-
относительно которой заданы векторы, будет левой?
§ 35. Объем и ориентированный объем системы векторов
В линейных пространствах направленных отрезков площадь и объем
являются производными понятиями от длины отрезка. Понятие длины
мы уже распространили на абстрактное
евклидово пространство. Теперь рассмотрим
аналогичную задачу в отношении площади
и объема.
Пусть на плоскости заданы два не кол-
линеарных вектора хи- х2. Построим на
этих векторах параллелограмм, приняв за
основание вектор х± (рис. 35.1). Опустим Рис. 35.1.
из конца вектора х2 на основание перпен-
перпендикуляр h. Площадь S(xl9 x2) параллелограмма будет определяться
формулой
о (xl9 х2) — I -Ч 11 « I- C5.1)
Обозначим через Lo нулевое подпространство, через Lt — линейную
оболочку, построенную на векторе хх. Так как
кг, I = lort/^Xt I,
114 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
то формулу C5.1) можно записать в следующем виде:
S (хь х2) = | ortLox111 ortAl х2 \. C5.2)
Возьмем, далее, три некомпланарных вектора хь х2, х3 в простран-
пространстве. Построим на этих векторах параллелепипед, приняв за основание
параллелограмм, образованный векторами хь х2 (рис. 35.2). Опустим
из конца вектора х3 на основание перпендикуляр h±. Объем V(xl9- х2, х3)
параллелепипеда будет определяться
формулой
V{xu х2, x3) = S(xi, x2)\h1\.
Если через L2 обозначить линейную
оболочку, построенную на векторах
хь х2, то, согласно C5.2), будем иметь
V(xu хъ х3) =
= | ort^x.! 11 ortLx211 ort/2x31.
Таким образом, длина вектора, площадь параллелограмма и объем
параллелепипеда в линейных пространствах Vl9 V2, V3 выражаются
формулами, в которых трудно не увидеть, определенной закономер-
закономерности: I v I - Inrt v I
I х± \ = I ortLo х± I,
S(xbx2) = |ortIox1 Mortal, C5.3)
V{xl9 х2, х3) = | ortLo Xi 11 ortjr x x2 11 ortL2 x3 |.
В частности, всюду число сомножителей совпадает с размерностью
пространства.
Эти формулы подсказывают, как надо вводить понятие объема
в евклидовом пространстве Еп размерности п. Пусть в Еп задана
произвольная система векторов хи х2, ..., хп. Обозначим через Lo
нулевое подпространство, через Ц — лигнейную оболочку, образованную
векторами хи ..., х^. Тогда по аналогии с пространствами направ-
направленных отрезков мы скажем, что:
Объемом V(xu х2, ..., хп) системы векторов хь х2, ..., хп евкли-
евклидова пространства Еп называется значение на этой системе веществен-
вещественной функции, зависящей от п векторных аргументов из Еп и опре-
определенной следующим равенством:
V(xl9 х2,..., хп) = П I ortL.xi+1\. C5.4)
i 0
Конечно, пока нельзя утверждать, что объем системы векторов
обладает всеми присущими именно объему свойствами при любых п.
Но для евклидовых пространств размерности 1, 2, 3 соответственно
в силу евклидова изоморфизма и соотношений C5.3) он заведомо
§ 35] ОБЪЕМ И ОРИЕНТИРОВАННЫЙ ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ 115
имеет те же свойства, что и длина отрезка, площадь параллелограмма
и объем параллелепипеда.
Попробуем теперь подойти к понятию объема системы векторов
евклидова пространства Еп с другой точки зрения. Как уже отмечалось,
приписывание определенных знаков превращает длину, площадь и
объем в алгебраические функции, обладающие некоторыми общими
свойствами. Поэтому можно надеяться, что соответствующая анало-
аналогия имеет место и в произвольном евклидовом пространстве. Имея
в вицу именно эту аналогию, мы дадим такое определение:
Ориентированным объемом V± (xl9 х2, ..., хп) системы векторов
хи х29 ..., хп евклидова пространства Еп называется значение на этой
системе вещественной функции, зависящей от п векторных аргументов
из Еп и обладающей свойствами C4.4).
С этим определением тоже много неясного^ Мы не знаем, суще-
существует ли ориентированный объем для любой системы векторов
в произвольном евклидовом пространстве при п ^ 4? Но даже если
он существует, то единственным ли образом его определяют свойства
C4.4)? И наконец, 1сакая же связь существует в общем случае между
объемом и ориентированным объемом? Пока мы можем ответить
лишь на последний вопрос, да и то в случае п = 1, 2, 3.
Иногда нам придется рассматривать объем и ориентированный
объем в пространстве Еп для систем, содержащих менее п векторов.
Это будет означать, что в действительности мы имеем дело не со всем
пространством, а с некоторым его подпространством, из которого
берется данная система. Соответственно и свойства C4.4) мы будем
рассматривать лишь по отношению к векторам из того же под-
подпространства. Может возникнуть необходимость рассмотреть объем
и ориентированйый объем для систем, содержащих боле© п векторов.
Согласно формуле C5.4) и свойству В из C4.4) обе функции на таких
системах должны быть равны нулю.
В заключение отметим, что использование двух различных понятий,
связанных с объемом, позволит существенно упростить их исследова-
исследование, так как одно понятие отражает геометрическую сторону решае-
решаемой задачи, а второе — алгебраическую. Мы очень скоро обнаружим
между ними самую тесную связь. Мы обнаружим, далее, что важность
введения этих понятий состоит еще и в том, что они порождают
некоторый математический аппарат, значение которого не ограничива-
ограничивается задачей об объеме.
Упражнения.
1. Доказать, что в пространствах направленных отрезков ориентированные
длина, площадь и объем определяются условиями C4.4) единственным образом.
2. Будут ли единственным образом определяться те же понятия, если
исключить одно из условий C4.4)?
3. Доказать, что в любом евклидовом пространстве V(xl9 х2) — \ хх | • | х2 |
тогда и только тогда, когда векторы хх и х2 ортогональны,
4. Доказать, что в любом евклидовом пространстве V(xl9 х2) = V(x2, xx).
116 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
§ 36. Геометрические и алгебраические свойства объема
Мы начинаем исследование понятия объема в евклидовом простран-
пространстве Еп с изучения его геометрических и алгебраических свойств,
вытекающих из определения.
Свойство 1. Всегда V(xu х2, ..., хп) > 0. Равенство V(xt, xl9 ...
..., х„) — 0 имеет место тогда и только тогда, когда система век-
векторов х1у х2, ..., хп линейно зависима.
Первая часть утвержения очевидным образом следует из C5.4),
поэтому доказательства требует лишь вторая его часть. Пусть система
х19 х2, ..., хп линейно зависима. Если х± = 0, то из определения
вытекает, что и объем равен нулю. Если же х± Ф 0, то некоторый
вгектор xk+1 линейно выражается через предшествующие векторы
xl9 ..., xk. Но тогда ottLkxk+l =0 и снова объем равен нулю.
Предположим теперь, что объем равен нулю. Согласно определе-
определению это означает,, что равен нулю один из множителей в правой
части C5.4). Пусть для этого множителя i — к. Если к = 0, то хх = 0.
Если же к Ф 0, то условие ortLfcxfc+1=0 означает, что вектор хк+1
принадлежит линейной оболочке, образованной векторами хъ ..., хк9
т.е. система xl9 ..., хк+1 линейно зависима. В обоих случаях будет
линейно зависимой и вся система векторов xl9 х2, ..., хп.
Свойство 2. Для любой системы векторов хъ х29 -.., хп спра-
справедливо неравенство Лдамара
Y
причем равенство имеет место тогда и только тогда, когда система
хх, х2, ..., х„ ортогональна или содержит нулевой вектор.
Согласно свойствам перпендикуляра и проекции заведомо справед-
справедливо неравенство
lrtKll C6.2)
причем оно обращается в равенство тогда и только тогда, когда
Xi+i-LLj или, что то же самое, когда вектор xi+1 ортогонален к век-
векторам х19 хъ ..., xt. Рассмотрим произведения левых и правых
частей неравенств вида C6.2) для всех z. Имеем
П "
Если все векторы системы хъ х29 ..., хп — ненулевые, то это нера-
неравенство обращается в равенство тогда и только тогда* когда система
ортогональна. Случай наличия нулевого вектора тривиален.
Из неравенства Адамара можно вывести несколько полезных след-
следствий. Пусть система хъ хъ ..., хп нормирована, тогда очевидно, что
V(xu x2, ..., хп)^1.
§ 36] ГЕОМЕТРИЧЕСКИЕ И АЛГЕБРАИЧЕСКИЕ СВОЙСТВА ОБЪЕМА 117
Верно и следующее утверждение. Если система хь хъ ..., хп норми-
нормирована и ее объем равен единице, то она ортонормирована. Поскольку
объем любой нормированной системы не превосходит единицы, то
это означает, что среди всех нормированных систем ортонормирован-
ная система имеет максимальный объем.
Свойство 3. Для любых двух ортогональных множеств векторов
хъ х2, ...> хр я у и Уг> •••> Уг справедливо равенство
V(xu хъ ..., хр, уъ у29 ..., yr) = V(xu xl9 ..., хр) V(yu y2, ..., УгУ
Обозначим через Lt линейную оболочку, образованную первыми
/ векторами объединенной системы хъ ..., х^ уъ ..., у„ через Kt -
линейную оболочку, образованную векторами уи ..., yt. По условию
каждый из векторов системы уъ ..., уг ортогонален ко всем векторам
системы хи ..., х^ Поэтому
для всех t от 0 до г. Теперь, учитывая равенство C0.10), имеем
Ц lorMi+i \)l П
) = V(xu ...9хр) V(yl9..., yr).
Прежде чем переходить к дальнейшим исследованиям, сделаем
одно замечание. Объем системы выражается лишь через перпендику-
перпендикуляры к линейным оболочкам, образованным предшествующими век-
векторами. Учитывая свойства перпендикуляров, можно поэтому сделать
вывод, что объем системы не изменится, если к любому вектору
добавить любую линейную комбинацию предшествующих векторов.
В-частности, объем не изменится, если любой вектор заменить пер-
перпендикуляром, опущенным из этого вектора на любую линейную)
оболочку, образованную предшествующими векторами.
Свойство 4. Объем системы векторов не меняется при любой
перестановке векторов системы.
Рассмотрим сначала случай, когда в системе векторов xl9 ...? хп
переставляются два соседние вектора xp+l9 xp+2. Согласно сделанному
выше замечанию объем не изменится, е?ли векторы хр+1, хр+2 мы
заменим векторами OTt'Lpxp+l9 ortL xp+2, а векторы хр+3, ..., хп —
векторами ortL +2pcp+3, ..., ortL +2xn. Но теперь три множества век-
векторов k p
Хх, ..., Хр9
ovtLxp+i9 ortLpxp+29
ortLp+P2xp+39 ..., ovtLp+2xn
118 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
попарно ортогональны и на основании свойства 3 мы будем иметь
V(xl9 ..., xp+l9 хр+2, ..., хп) = V(xu ..., хр) х
х V(oTtLpxp+l9 ovtLpxp+2)• V(ovtLp+2xp+3, ,.., ort^+2xM).
Ясно, что линейные оболочки векторов xl9 ..., хр, хр+1, хр+2 и
хи ..., хр, хр+2, хр+1 совпадают, следовательно
V{xu ..., хр+2, хр+1, ..., хп) = V(xu ..., хр) х
х V(ovtLpxp+2, ovtLpxp+1)' V(ovtLp+2xp+3, ..., ortLp+2xw).
В силу евклидова изоморфизма объем системы из двух векторов
обладает теми же свойствами, что и площадь параллелограмма.
В частности, он не зависит от порядка векторов системы. Сравнивая
правые части двух последних равенств, заключаем теперь, что
Несколько позднее мы докажем, что любая перестановка xjv
-Xj2, ..., Xjn векторов системы xl9 x2, ..., хп может быть получена
путем последовательной перестановки соседних векторов. Поэтому
свойство 4 для произвольной перестановки вытекает из рассмотренного
частного случая.
Свойство 5. Объем системы векторов является абсолютно одно-
однородной функцией, т. е.
V(xu ..., ахр, ..., xn) = \a\V(xb ..., хр, ..., хп)
для любого р.
Согласно свойству 4, мы не уменьшим общности, если будем
считать, что р = и. Но тогда, учитывая C0.6), получаем
/п-2 \
V(xb ..., *„_!, оос„) = I П I orti**J+ ill or4-i (ax«) I =
\i = 0 /
и-1
Свойство 6. Объем системы векторов не' меняется, если к ка-
какому-либо из векторов системы прибавить линейную комбинацию осталь-
остальных векторов.
Снова, согласно свойству 4, мы можем считать, что к последнему
вектору прибавляется линейная комбинация предшествующих векторов.
Но, как уже отмечалось, в данном случае объем не меняется.
Объем системы векторов является вещественной функцией. Эта
функция обладает некоторыми свойствами, часть из которых мы уже
установили. Они подтвердили наше предположение о том, что опре-
определенный нами объем системы векторов в евклидовом пространстве
обладает всеми присущими, именно объему свойствами при любых п.
Но самое важное, пожалуй, заключается в том, что установленные
§ 36] ГЕОМЕТРИЧЕСКИЕ И АЛГЕБРАИЧЕСКИЕ СВОЙСТВА ОБЪЕМА 119
свойства определяют объем единственным образом. Точнее, справед-
справедлива
Теорема 36.1. Если вещественная функция F(xb х2, ..., х„),
зависящая от п векторных аргументов из Еп, обладает следующими
свойствами:
A) не изменяется от прибавления к любому аргументу
любой линейной комбинации остальных аргументов, C6.3)
B) абсолютно однородна,
C) равна единице для всех ортонормированных систем,
то она совпадает с объемом системы векторов.
Доказательство. Если среди аргументов xl9..., хп есть хотя бы
один нулевой, то, согласно свойству В,
F (хи х2, ..., хп) = V(xl9 хъ ..., х„) = 0. C6.4)
Пусть теперь система хи х2, ..., хп — произвольная. Вычитая из
каждото вектора xt его проекцию на подпространство, образованное
векторами xl9 ..., x^-i, и принимая во внимание свойство А, заклю-
заключаем, что
F (х19 х2, ..., хп) = F (ortLoxb ortLl x2, . f., ortLnl xn). C6.5)
Если система хь х2, ..., хп линейно зависима, то среди векторов
oitLilXi есть хотя бы один нулевой вектор и равенство C6.4) снова
имеет место. Предположим, что система хи х2, ..., хп линейно не-
независима, тогда все векторы системы
ortLoxb or\.Lix2, ..., от\.Ьп^хп
будут ненулевыми. Так как эта система к тому же ортогональна, то
существует ортонормированная система еи еъ ..., еп, для которой
ortb._1 х? = | orti._1 x? | ef.
Согласно свойству С
F (е\, еъ ..., еп) = 1.
Поэтому из свойства В вытекает, что
F (х19 х2,...,х„)= П I ortt xi+11 F (el9 еъ ..., en) = V(xl9 x2,..., xn).
\i=o )
Доказанная теорема позволяет утверждать, что если мы каким-
либо образом построим функцию, обладающую свойствами C6.3), то
она и будет объемом системы векторов.
Упражнения.
1. Установить геометрический смысл свойств 2, 3, 6 в пространствах
направленных отрезков.
2. Установить геометрический смысл равенства C6.5) в пространствах
направленных отрезков.
120 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
3. Может ли функция, удовлетворяющая условиям C6.3), равняться нулю
на какой-либо линейно независимой системе векторов?
4. Пусть по отношению к ортонормированному базису еъ е2, ..., еп
система векторов хи х2, ..., хп обладает свойством
{хь ej) = 0
при i = 2, 3, ..., п и j < i (i = 1, 2, ..., п — 1 и j > i). Найти выражение для
объема V(xl9 хъ ..., хи) через координаты векторов хь х2, ..., хп в базисе
^i, еъ ..., еп.
5. Что изменится, если мы рассмотрим понятие объема в комплексном
пространстве?
§ 37. Алгебраические свойства ориентированного объема
Перейдем теперь к исследованию алгебраических свойств ориенти-
ориентированного объема, оставив пока в стороне вопрос о его существо-
существовании. В основу исследования положим условия А, В, С из C4.4).
Свойство 1. Ориентированный объем системы векторов равен
нулю, если какие-либо два вектора совпадают.
Это свойство является прямым следствием условия В. Нетрудно
Доказать, что при наличии условия А условие В и сформулированное
свойство 1 эквивалентны.
Свойство 2. Ориентированный объем системы векторов меняет
знак, если какие-либо два вектора переставить местами.
Доказательство проводится одинаково для любых векторов, поэтому
для простоты записи мы ограничимся рассмотрением случая, когда
меняются местами первый и второй векторы. Согласно свойству 1
V~ уХ^ "г •^'25 "^1 » Х29 Х$9 ... j Хц) ^ v.
Но, с другой стороны, согласно условию А
V± (*! + Х2, ХХ + ХЪ Х3, ... , Xj = V± (Xl5 ХЬ Х3, . . . , Х„) +
+ V± (х2, х2, х3, ..., х„) + V± (xlf х2, х3, ..., хJ + V± (х2, хь х3, ..., хн).
В правой части данного равенства первые два слагаемых равны
нулю, откуда и вытекает справедливость свойства 2. Снова нетрудно
доказать, что при наличии условия А условие В и сформулирован-
сформулированное свойство 2 эквивалентны.
Свойство 3. Ориентированный объем системы векторов не меняет-
меняется от прибавления к какому-либо вектору любой линейной комбинации
остальных векторов.
Снова для простоты рассмотрим только первый вектор. Согласно
условию А, имеем
F*^. ^ }
х2,
§ Щ АЛГЕБРАИЧЕСКИЕ СВОЙСТВА ОРИЕНТИРОВАННОГО ОБЪЕМА 121
В этом равенстве все слагаемые в правой части, кроме первого,
равны нулю, согласно свойству 1.
Свойство 4. Ориентированный объем является однородной функ-
функцией, т. е.
V±(XU ..., QLXp, ..., Х„) =
для любого р.
Это свойство является прямым следствием условия А.
Свойство 5. Равенство V±(хь х29 ..., хп) = О имеет место
тогда и только тогда, когда система векторов xlt х2, ..., хп
линейно зависима.
Очевидно, необходимо доказать лишь то, что из равенства
V± (xl9 х2, ..., хп) — 0 вытекает линейная зависимость векторов
хь х2, ..., хп. Предположим противное. Пусть ориентированный объем,
равен нулю для некоторой линейно независимой системы уъ у2, ..., уп.
Эта система является базисом Ею поэтому для любого вектора z
из Еп имеем
Заменим теперь в системе уи у2, ..., уИилюбой вектор, например,
уи вектором z. Последовательно используя свойства 3 и 4, находим, что
/ " \
V± (z, уъ ..., у,) = V± ахух + X *ЧУь Уъ • • •, Уп =
\ /
Ориентированный объем по определению не равен нулю хотя бы
на одной линейно независимой системе zl9 z2, .»., zn. Но заменяя
поочередно векторы уи у2, ..., уп векторами zl9 z2, ..., zm согласно
теореме 15.2, мы получим, что и на этой системе ориентированный
объем равен нулю. Полученное противоречие доказывает рассматри-
рассматриваемое свойство.
Свойство 6. Если два ориентированных объема совпадают хотя
бы на одной линейно независимой системе векторов, то они совпадают
тождественно.
Пусть известно, что ориентированные объемы Vf (хь х2, ..., х„)
и Ут С*ь ^25 • • • 5 х») совпадают на линейно независимой системе
zl9 z2i ..., zn. Рассмотрим разность F{xu x2, ..., xn) = V?{xu
х2, ..., хп) — V?(xl5 x2, ..., х„). Эта функция удовлетворяет свой-
свойствам 3 и 4 ориентированного объема. Кроме этого, она равна нулю
на всех линейно зависимых системах и по крайней мере на одной
линейно независимой системе zl9 z2, ..., zn. Повторяя рассуждения,
проведенные при доказательстве свойства 5, мы заключаем, что
F (хь х2, ..., х„) равна нулю на всех линейно независимых системах,
т. е. она равна нулю тождественно.
122 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
Из свойства 6 вытекает, что ориентированный объем определяется
условиями C4.4) единственным образом, если зафиксировать ту орто-
нормированную систему, на которой он должен равняться еди-
единице.
Свойство 7. Модуль ориентированного объема системы векторов
совпадает с объемом той же системы.
Пусть ориентированный объем равен единице на ортонормированной
системе zb z2, ..., zH. Рассмотрим функции \V±(xu х2, ..., х„)| и
V(xu х2, ..., хп). Обе они удовлетворяют условиям А, В из C6.3)
и совпадают на линейно независимой системе zl9 z2, ..., zn. Функция
Ф(хь х2, ..., x,,) = ||F±(x1, x2? ..., хи)|-К(хь х2,...., хл)|
также удовлетворяет условиям А, В из C6.3), равна нулю на всех
линейно зависимых системах и по крайней мере на одной линейно
независимой системе zl9 z2, ..., zn. Снова повторяя рассуждения,
проведенные при доказательстве свойства 5, мы заключаем, что
Ф (xl5 х2, ..., х„) равна нулю тождественно.
Последнее свойство является очень важным, так как позволяет
утверждать, что модуль ориентированного объема должен иметь все
те же свойства, что и объем. В частности, он должен равняться по
абсолютной величине единице на всех ортонормированных системах,
а не только на одной. Для него справедливо неравенство Адамара и
т. д. Это свойство дает окончательный ответ на все вопросы, поставлен-
поставленные нами в отношении объема и ориентированного объема. Единствен-
Единственное, чего нам не хватает,— доказательства существования ориентирован-
ориентированного объема.
Упражнения.
1. Доказать, что при наличии условия А из C4.4) условие В эквивалентно
и свойству 1, и свойству 2.
2. Доказать, что, каково бы ни было вещественное число а, существует
система векторов, для которой ориентированный объем равен а.
3. Предположим, что условие С из C4.4) заменено условием равенства
любому фиксированному числу на любой фиксированной линейно независимой
системе. Как изменится ориентированный объем?
4. Использовались ли при выводе свойств ориентированного объема наличие
скалярного произведения в линейном пространстве и вещественность ориенти-
ориентированного объема? Что изменится, если мы рассмотрим ориентированный объем
в комплексном пространстве?
§ 38. Перестановки
Рассмотрим систему хи х2, ..., хп и систему xjl9 Xj2, ..., xjn,
полученную из первой с помощью различных перестановок векторов.
Предположим, что эти системы могут быть переведены друг в друга
последовательными перестановками лишь пар элементов. Тогда объемы
этих систем будут одинаковыми, а ориентированные объемы либо
§ 38] ПЕРЕСТАНОВКИ 123
одинаковыми, либо отличаться знаками, в зависимости от того, сколько
потребуется выполнить перестановок.
В интересующих нас вопросах о перестановках индивидуальные
свойства векторов не будут играть никакой роли, но будет важен их
порядок. Поэтому вместо самих векторов мы будем рассматривать их
номера 1, 2, ..., п. Совокупность чисел
среди которых нет равных и каждое из которых есть одно из чисел
1,2,...,п, называется перестановкой этих чисел. Перестановка 1, 2,..., п
называется нормальной.
Легко показать, что в множестве из п чисел общее количество
всевозможных перестановок равно п!. Действительно, для п=1 это
очевидно. Пусть утверждение верно для любого множества из
п — 1 чисел. Все перестановки из п чисел можно разбить на п
классов, помещая в один класс лишь те перестановки, которые на
первом месте имеют одно и то же число. Число перестановок в
каждом классе совпадает с числом перестановок из п — 1 чисел, т. е.
равно (п — 1)!. Следовательно, число всех перестановок из п чисел
равно п\.
Говорят, что в данной перестановке числа I, j образуют инверсию,
если i > j, на г стоит в перестановке раньше j. Перестановку назовем
четной, если ее числа составляют четное количество инверсий, и
нечетной в противном случае. Если в некоторой перестановке мы
поменяем местами какие-либо два числа, не обязательно стоящие рядом,
а все остальные оставим на месте, то получим новую перестановку.
Это преобразование перестановки называется транспозицией.
Докажем, что всякая транспозиция меняет четность перестановки.
Для чисел, стоящих рядом, это утверждение очевидно. Их взаимное
расположение относительно других чисел осталось прежним, а пере-
перестановка самих чисел меняет общее число инверсий на единицу.
Пусть теперь между переставляемыми числами г и j находятся s
других чисел fcl5 k2, ..., кь, т. е. перестановка имеет вид
. . . , I, K>i, /С2, . . . , /Cs, J, . . .
Будем менять местами число i последовательно с рядом стоящими
числами ки к2, ..., К, j. Затем число j, стоящее уже перед i, пере-
переместим влево при помощи s транспозиций с числами fcs, fcs_b ..., fc1#
Таким образом, всего мы выполним 2s +1 транспозиций рядом
стоящих чисел. Следовательно, четность церестановки изменится.
Теорема 38.1. Все п\ перестановок из п чисел можно расположить
в таком порядке, что каждая следующая будет получаться из преды-
предыдущей при помощи одной транспозиции, причем начинать можно с
любой перестановки.
Доказательство. Это утверждение справедливо при п = 2.
Если требуется начинать с перестановки 1, 2, то искомое расположение
124 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
будет 1, 2, 2, 1; если же мы начинаем с перестановки 2, 1, то
искомое расположение будет 2, 1, 1, 2.
Предположим, что теорема уже доказана для любых перестановок,
содержащих не более п — 1 чисел. Рассмотрим перестановки из п
чисел. Пусть мы должны начать с перестановки il9 \ъ ..., /„. Располо-
Расположение перестановок будем осуществлять по следующему принципу.
Начнем с перестановок, у которых на первом месте стоит число i±.
Согласно предположению, все эти перестановки можно упорядочить
в соответствии с требованиями теоремы, так как фактически необ-
необходимо расположить в нужном порядке все перестановки из п — 1
чисел.
В последней полученной таким путем перестановке производим одну
транспозицию, переставляя на первое место число г2. Далее упорядо-
упорядочиваем, как и в предыдущем случае, все перестановки, у которых
на первом месте стоит данное число, и т. д. Этим способом можно
перебрать все перестановки из п чисел.
При такой системе расположения перестановок из п чисел сосед-
соседние перестановки будут иметь противоположные четности. Учитывая
четность числа п! для п ^ 2, можно заключить, что в этом случае
число четных перестановок из п чисел равно числу нечетных и
равно -уп!.
Упражнения.
1. Какова четность перестановки 5, 2, 3, 1, 4?
2. Доказать, что любую четную (нечетную) перестановку нельзя привести к
нормальной за нечетное (четное) число транспозиций.
3. Рассмотрим пару перестановок iu i2, ..., /„ и 1, 2, ..., п.
Будем приводить к нормальному виду первую перестановку с помощью
транспозиций, совершая при каждой из них одну транспозицию любых эле-
элементов во второй перестановке. Доказать, что после окончания процесса вторая
перестановка будет иметь ту же четность, что и перестановка il9 i2, . , in.
§ 39. Существование ориентированного объема
Рассмотрим теперь вопрос о существовании ориентированного объ-
объема системы векторов. Пусть в пространстве Еп выбрана ортонор-
мированная система zu z2, ..., zn> на которой ориентированный объем
должен быть равен единице согласно условию С из C4,4). Возьмем
произвольную систему хи х2, ..., хп векторов из Еп. Так как
система zl9 z2, ..., zn является базисом в Еп, то для каждого вектора
xt существует разложение
xt = aiizi + ai2z2 + ... + ainzn C9.1)
по этому базису, где а^ — некоторые числа.
Если ориентированный объем существует, то, согласно условию А
из C4.4), мы можем последовательно преобразовывать его, учитывая
§ 39] СУЩЕСТВОВАНИЕ ОРИЕНТИРОВАННОГО ОБЪЕМА 125
разложения C9.1). Именно,
V± (хи хъ ..., хп) = V± ( ? *i;A> t a^zh9 ..., t %-
¦¦¦' i i ¦¦¦? «ia,--«*>'i(v ',, ',> <»-2>
В последней п-кратной сумме большая часть слагаемых равна
нулю, так как, согласно свойству 1, ориентированный объем системы
векторов равен нулю, если какие-либо два вектора системы совпадают.
Поэтому среди систем zjv zj , ..., zin следует рассмотреть лишь те,
для которых набор индексов ;ь ";2, ."., ;„ представляет перестановку
из п чисел 1, 2, ..., п. Но в этом случае
в зависимости от четности или нечетности перестановки из индексов.
Таким образом, если ориентированный объем существует, то он
должен выражаться через координаты векторов xl9 x2, ..., хп в
базисе zl9 zl9 ..., zn следующей формулой:
V± (хь; х2, ..., хп) = ? ± alha2J2 • • • anjn. C9.3)
Здесь суммирование ведется по всем перестановкам индексов jl9
j2, -'-,jn из чисел 1, 2, ,.., п, а знак плюс или минус берется
в зависимости от четности или нечетности перестановки.
Докажем, что функция, заданная правой' частью равенства C9.3),
удовлетворяет всем условиям, определяющим ориентированный объем.
Пусть вектор хр есть линейная комбинация векторов х'р и х'р, т. е.
Хр = OLXp + рХр
для некоторых чисел а, р. Обозначим через a'pj и a"pi соответственно
координаты векторов х'р и х"р в базисе zl9 z2, ..., zn. Тогда очевидно, что
.для всех j от 1 до п. Далее находим
I ± alh ... apjp ... anjn = ? ± д^ч.. (оо^ + р^р :.. anjn
= <*Е ± Л1У1 ... ^Jp ....«„;„ + PZ ± fl
и условие А из C4.4) выполнено.
126 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
Предположим, что мы переставляем какие-либо два вектора системы
х19 х29 ..., хп. В этом случае функция C9.3) изменит знак, так как
изменится четность каждой перестановки. Как уже отмечалось ранее,
при наличии свойства линейности по каждому аргументу, доказанное
свойство эквивалентно выполнению условия В из C4.4).
И, наконец, рассмотрим значение построенной функции на системе
векторов zl9 z2y ..., zn. Для этой системы координаты ац имеют
такой вид:
'О, если \Ф]9
1, если i=j.
Следовательно, среди слагаемых C9.3) ненулевым будет только одно
слагаемое а1Ха22 ...апп. Перестановка 1, 2, ..., п — четная, элементы
й\ъ а2Ъ ..., ат равны единице, поэтому значение функции на орто-
нормированной системе zl9 zl9 ..., zn равно 1.
Итак, все условия C4.4) выполнены и функция C9.3) представляет
выражение ориентированного объема системы векторов через координа-
координаты. Это выражение единственно в силу единственности ориентирован-
ориентированного объема.
Упражнения.
1. Использовалась ли по существу ортонормированность системы zlt
z2, ..., zn при выводе формулы C9.3)?
2. Какие изменения произойдут в формуле C9.3), если в условии С из
C4.4) не считать ориентированный объем равным единице?
3. Насколько по существу использовалось условие В из C4.4) при выводе
формулы C9.3)?
4. Изменится ли вид формулы C9.3), если рассмотреть ориентированный
объем в комплексном пространстве?
§ 40. Определители
Пусть векторы xl9 х2, ..., ха евклидова пространства Rn заданы
своими координатами
в базисе B1.7). Расположим числа аи в виде таблицы А следующим
образом:
а1Х а\2 ... а1п
ап1 ап2 ... апп
Эта таблица называется квадратной матрицей порядка п, числа
dfj - элементами матрицы. Если нумеровать строки матрицы подряд,
сверху вниз, а столбцы - слева направо, то первый индекс элемента
§ 40} ОПРЕДЕЛИТЕЛИ 127
означает номер строки, в которой находится элемент, а второй
индекс —номер столбца. В отношении элементов а1и а22, •••> ат
говорят, что они образуют главную диагональ матрицы А.
Любые п2 чисел могут быть расположены в виде квадратной
матрицы порядка п. Если считать элементы строки матрицы коорди-
координатами вектора из Rw в базисе B1.7), то между всеми квадратными
матрицами порядка п и упорядоченными системами из п векторов
пространства Rw устанавливается взаимно однозначное соответствие.
В пространстве Rw, как и в любом другом пространстве, су-
существует ориентированный г объем. При этом он будет единственным,
если потребовать выполнение условия С из C4.4) на системе векто-
векторов B1.7). Принимая во внимание отмеченное взаимно однозначное
соответствие, заключаем, что'на множестве всех квадратных матриц
порождается вполне определенная функция. Учитывая C9.3), мы приходим
к следующему определению этой функции.
Определителем п-го порядка, соответствующим матрице А, называ-
называется алгебраическая сумма п! членов, составленная следующим образом.
Членами определителя служат всевозможные произведения па п эле-
элементов матрицы, взятых по одному в каждой строке и каждом столбце.
Член берется со знаком плюс, если индексы столбцов его элементов
образуют четную перестановку при условии, что сами элементы рас-
расположены в порядке возрастания номеров строк, и знак минус —
в противном случае.
Для обозначения определителя мы будем употреблять следующий
символ:
аХ1 а12 ... а1п
detj *"*»•"*>• | {401)
ап1 ап2 .., q
если необходимо указать явный вид элементов матрицы. Если же
этого не нужно, то будем пользоваться более простым символом
det.4,
указывая лишь обозначение матрицы А. Элементы матрицы опреде-
определителя мы будем называть также элементами определителя.
Определитель совпадает с ориентированным объемом системы
строк матрицы. Поэтому при его исследовании можно использовать
все известные факты, касающиеся объема и ориентированного объема.
В частности, определитель равен нулю тогда и только тогда, ког-
когда строки матрицы линейно зависимы, определитель меняет знак
при перестановке любых двух строк и т. д. Сейчас наши иссле-
исследования будут касаться тех его свойств, которые трудно дока-
доказать, не используя явное выражение определителя через элементы
матрицы.
128 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
Назовем транспонированием матрицы такое ее преобразование,
при котором строки становятся столбцами, а столбцы — строками с
теми же самыми номерами. Матрица, транспонированная по отношению
к матрице А, обозначается через А'. Соответственно говорят, что
определитель /aii U2i a^
ш а12 а22 ... ап2
det
а1п а2п ... ап
или det Л/ получен транспонированием определителя D0.1). По отно-
отношению к транспонированию определитель обладает следующим важным
свойством
Определитель любой матрицы не меняется при транспонировании.
Действительно, определитель матрицы А состоит из членов та-
КОГОВвда: а1НаУ2...^и, D0.2)
знак которых определяется четностью перестановки ju j2, ..., jn.
Все множители произведения D0.2) в транспонированной матрице А'
остаются в разных строках и разных столбцах, т. е. их произведение
является членом транспонированного определителя. Обозначим элементы
матрицы А' через а\у Ясно, что а\; = aji9 поэтому
aiha2j2 .. • anjn = a}lXafJ22 .: :^. D0.3)
Упорядочим элементы правой части D0.3) в порядке врзрастания
номеров строк. Тогда перестановка индексов столбцов будет иметь
ту же четность, что и перестановка jl9 j2, ..., jn. Но это означает,
что знак члена D0.2) в транспонированном определителе будет таким
же, что и в исходном определителе. Следовательно, оба определителя
состоят из одних и тех же членов с одинаковыми знаками, т. е.
они совпадают.
Из доказанного свойства вытекает, что в определителе строки и
столбцы равноправны. Поэтому все свойства, доказанные ранее в отно-
отношении строк, будут иметь место и в отношении столбцов.
Рассмотрим определитель d порядка п. Выберем в его матрице
произвольные к строк и к столбцов. Элементы, стоящие на пере-
пересечении выбранных строк и столбцов, образуют матрицу порядка к.
Определитель этой матрицы называется минором к-то порядка опреде-
определителя d. Минор, расположенный в первых к столбцах и первых к
строках, называется главным или угловым минором.
- Пусть теперь в определителе d порядка п взят минор М порядка к.
Если мы вычеркнем те строки и столбцы, на пересечении которых
стоит минор М, то останется минор N порядка п — к. Этот минор
называется дополнительным минором для минора М. Если же мы
I 40] ОПРЕДЕЛИТЕЛИ 129
вычеркнем, наоборот, те строки и столбцы, в которых расположены
элементы минора N, то останется, очевидно, минор М. Таким обра-
образом, можно говорить о паре взаимно дополнительных миноров.
Если минор М порядка к расположен4 в строках с номерами
*ь *2> •••? h и столбцах с номерами jl9 j2, ..., ]ь то число
к 4
I (iP+jP)
(_1)p=i jv D0.4)
мы будем называть алгебраическим дополнением минора М.
Теорема 40.1 (теорема Лапласа). Пусть в определителе d порядка
п произвольно выбраны к строк (столбцов), где 1 ^ к ^ п — 1.
Тогда сумма произведений всех миноров к-го порядка, содержащихся
в выбранных строках (столбцах), на их алгебраические дополнения
равна определителю d.
Доказательство. Будем считать столбцы матрицы определите-
определителя d векторами xl9 х2, ..., хп пространства Rn. Сумму произведений
всех миноров /с-го порядка, содержащихся в выбранных строках, на
их алгебраические дополнения можно рассматривать как некоторую
функцию F(xl9 xl9 ..., х„), зависящую от векторов хъ х2, ..., хп.
Эта функция заведомо линейна по каждому аргументу, так как
данным свойством обладают и миноры, и алгебраические дополнения.
Она равна единице на ортонормированной системе B1.7), в чем легко
убедиться непосредственной проверкой. Если мы докажем, что
F(xu X2> •••> хи) меняет знак при перестановке местами любых двух
векторов, то тогда она будет совпадать с ориентированным объемом
системы векторов xl9lx29 ..., хп. Но ориентированный объем совпадает
с определителем матрицы, в которой координаты векторов расположены
по строкам. Так как определитель матрицы совпадает с определителем
транспонированной матрицы, то доказательство теоремы Лапласа будет
закончено.
Очевидно, что достаточно рассмотреть лишь случай, когда пе-
переставляются два соседних вектора, ибо перестановка любых двух
векторов всегда сводится к нечетному числу перестановок соседних
векторов. Доказательство этого факта было приведено в § 38.
Пусть переставляются векторы х{ и xi+1. Установим взаимно
однозначное соответствие между минорами в выбранных строках ис-
исходного определителя и определителя с переставленными столбцами.
Обозначим через со совокупность номеров столбцов, определяющих
минор. Возможны следующие случаи:
1) i, i -f 1ею,
2) i, i + 1 ею,
3) ieco, i + 1еюД
4) i + 1 е со, / е со.
В случаях 1, 2 каждому минору поставим в соответствие минор,
расположенный йа столбцах с совокупностью номеров со, в случаях
5 В. В. Воеводин
130 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ р*л. 4
3, 4 — минор, расположенный на столбцах с совокупностью номеров,
полученной из © заменой соответственно i на i 4-1 и i + 1 на г.
Отметим, что во всех случаях соответствующие миноры определяют-
определяются одной и той же совокупностью элементов. Более того, в слу-
случаях 2—4 они совпадают,- а в случае 1 отличаются лишь знаком,
так как в одном из них по отношению к другому переставлены два
столбца. По аналогичным причинам в случае 2 соответствующие
дополнительные миноры отличаются знаком, в остальных случаях
они совпадают. Алгебраические дополнения отличаются от дополнитель-
дополнительных миноров только знаками, определяемыми четностью суммы номеров
строк и столбцов, на которых расположен минор. В случаях 1, 2
эти числа у соответствующих миноров одинаковы, а в случаях 3, 4
отличаются на единицу.
Сравнивая теперь соответствующие слагаемые функции F(xu
хъ ..., хп) и функции, полученной от перестановки векторов xt
и xi+u замечаем, что они отличаются только знаками. Следовательно,
при перестановке двух соседних векторов функция F(xu хъ ..., х„)
меняет знак.
Доказанная теорема часто применяется в том случае, когда выби-
выбирается лишь одна строка или один столбец. Определитель матрицы
первого порядка совпадает с единственным ее элементом. Поэтому
минор, расположенный на пересечении i-й строки и j-то столбца,
равен элементу aiy Обозначим через Atj алгебраическое дополнение
элемента atj. Согласно теореме Лапласа для всех i имеем
<kiAn + аиАи + ... + ainAin = d. D0.5)
Эта формула называется разложением определителя по i-й строке.
Аналогично для всех ]
ацАц + a2jA2j + .... + anjAnj = d, D0.6)
что дает разложение определителя по j-му столбцу.
Заменим в разложении D0.5) элементы i-й строки совокупностью п
произвольных чисел bl9 Ъъ ..., Ьп. Выражение
Ь\Ап + b2Ai2 + ... + bnAin
является разложением по i-й строке определителя
012
detf b, b2 ... bn h D0.7)
получающегося из определителя d заменой i-й строки строкой из
чисел bl9 Ьъ ..., Ь„. Возьмем теперь в качестве этих чисел элемен-
§ 41] ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И ОПРЕДЕЛИТЕЛИ 131
ты fe-й строки определителя d при к Ф i. Соответствующий определитель
D0.7) равен нулю, так как имеет две одинаковые строки. Следовательно,
akiAn + ak2Ai2 + ... + aknAin = 0, к Ф I D0.8)
Аналогично
ахьЛи + <*г%Ац + ... + ankAnj = 0, к Ф j. D0.9)
Итак, сумма произведений всех элементов любой строки (столбца)
определителя на алгебраические дополнения соответствующих элементов
другой строки (столбца) того же определителя равна нулю.
В заключение отметим, что вся теория определителей без какого-
либо изменения переносится и на случай комплексных матриц..
Единственное, что теряется, так это наглядность, связанная с понятием
объема.
Упражнения.
1. Написать выражения определителей второго и третьего порядков через
элементы матриц. Сравнить с выражением C4.6).
2. Написать неравенство Адамара для определителя матриц А и А'.
3. Определитель и-го порядка, все элементы которого по модулю равны
единице, равен п2. Доказать, что его строки (столбцы) образуют ортого-
ортогональный базис.
4. Чему равен определитель, если его элементы удовлетворяют условиям
аи = 0 для J > j (i < j, i ^ j, i < /)?
5» Элементы определителя удовлетворяют условиям atj = 0 для i > к и j < к.
Доказать, что определитель равен произведению главного минора порядка к
и его дополнительного минора.
6. Пусть элементы комплексной матрицы А удовлетворяют условиям
atj = uji для всех z, j. Доказать, что определитель такой матрицы есть
вещественное число.
§ 41. Линейная зависимость и определители
Одно из самых распространенных применений определители находят
в задачах, связанных с линейной зависимостью. Пусть в пространстве Кп
размерности п заданы т векторов хь х2, ..., хт и требуется определить
их базу. Выберем какой-либо базис в Кп и рассмотрим прямоуголь-
прямоугольную таблицу
А ~ 1 ~ ¦ D1.1)
«ml «w2 .- «,
строки которой представляют координаты заданных векторов в
выбранном базисе.
132 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл.4
Такая таблица называется прямоугольной матрицей. Как и раньше,
первый индекс элемента aV} означает номер строки матрицы, в которой
расположен этот элемент, второй индекс — номер столбца. Если мы
хотим подчеркнуть, какое количество строк и столбцов имеет матри-
матрица А, то будем писать А(т х п) или говорить о матрице А, как
т х n-матрице. Матрицу А(п х п) будем по-прежнему называть квад-
квадратной матрицей порядка п.. Наряду с матрицей А мы будем рас-
рассматривать и транспонированную матрицу А'. Если А имеет размеры
т х п, то А имеет размеры п х т.
В прямоугольной матрице А(т х п) снова можно указать различные
миноры, порядок которых, конечно, не превосходит наименьшее из
чисел т, и. ..Если матрица имеет не только нулевые элементы, то
наивысший порядок г отличных от нуля миноров называется рангом-
матрицы А. Любой отличный от нуля минор порядка г называется
базисным минором, а строки и столбцы, на которых он расположен,
называются базисными. Ясно, что базисный минор может быть не
один. Ранг нулевой матрицы по определению равен нулю.
Будем рассматривать строки матрицы А как векторы:" Очевидно,
что если мы найдем базу этих векторов-строк, то соответствующие
векторы из. пространства Кп будут образовывать базу векторов
ХЪ ~Х2> • • г 5 хт-
Теорема 41.1. Любые базисные строки образуют базу векторов-
строк матрицы.
Доказательство. Для того чтобы убедиться в справедливости
утверждения теоремы, необходимо показать, что базисные строки
линейно независимы и любая строка матрицы линейно через них
выражается.
Если бы базисные строки были линейно зависимы, то одна из этих
строк линейно выражалась бы через остальные базисные строки.
Но тогда базисный минор должен равняться нулю, что противоречит
условию.
Добавим теперь к базисным строкам любую другую строку мат-
матрицы А. Тогда по определению базисного минора все миноры порядка
г + 1, расположенные на этих строках, будут равны нулю. Предполо-
Предположим, что данные строки линейно независимы. Дополнив их до базиса,
мы построим некоторую квадратную матрицу, определитель которой
не должен равняться нулю. Но, с другой стороны, разлагая, этот
определитель по исходным г +1 строкам,, мы заключаем, что он
равен нулю. Полученное противоречие означает, что любая строка
матрицы А линейно выражается через базисные.
Доказанная теорема позволяет свести задачу отыскания базы системы
векторов к отысканию базисного минора матрицы. Так как определи-
определитель транспонированной матрицы совпадает с определителем исходной
матрицы, то ясно, что теорема 41.1 справедлива не только для
строк, но и для столбцов. Это означает, что для любой прямоуголь-
прямоугольной матрицы ранг ее системы векторов-строк равен рангу ее системы
§ 41] ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И ОПРЕДЕЛИТЕЛИ 133
векторов-столбцов. Данный факт не очевиден, если иметь в виду только
понятие рант системы векторов.
В пространстве со скалярным произведением линейную зависимость
или независимость системы векторов хь х2, ..., хт можно установить
и без разложения по базису. Рассмотрим определитель
[ (хи хх) (xl9 х2) ... (хи хт)\
(х2, хх) (х2, х2) ... (х2, хт)
G(xb х2, ..., xm) =
m, х±) (х„„ х2) ... (х„„ хт)
называемый определителем Г рама системы векторов хь х2, ¦.., хт.
Теорема 41.2. Система векторов линейно зависима тогда и только
тогда, когда ее определитель Грама равен нулю.
Доказательство. Пусть система Векторов хь х2,.. ¦ > хт линейно
зависима. Тогда существуют такие числа ось ос2? ..., ат, не все равные
нулю, что
Умножая это равенство скалярно на xt для всех f, мы заключаем,
что и столбцы определителя Грама линейно зависимы, т. е. сам опре-
определитель равен нулю.
Предположим теперь, что определитель Грама равен нулю. Тогда
его столбцы линейно зависимы, т. е. существуют такие числа
аь ос2, ..., осш, не все равные нулю, что
<*1 (X,, Xi) + бС2 (X,, Х2) + ... + Ojx,, Xj = О
для всех i. Перепишем эти равенства следующим образом:
(xh ocjlXjl + a2x2 + ... + amxw) = 0.
Умножая их почленно на ах, а2, ..., а,н и складывая, получим
Это означает, что
ос2х2 + ... + awxw = 0,
т. е. векторы хь х2, ..., хт линейно зависимы.
Упражнения.
1. Что представляет собой матрица, у которой все миноры равны нулю?
2. Являются ли базисные строки и базисные столбцы для квадратной
матрицы эквивалентными системами векторов?
3. Меняют ли ранг матрицы рассмотренные в § 15 элементарные преоб-.
разования строк и столбцов?
4. Доказать неравенство
п
0 ^ G(xu x2i ..., хп) < П (xb xt)L
В каких случаях достигаются равенства?
134 ОБЪЕМ СИСТЕМЫ ВЕКТОРОВ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 4
5. Очевидно, что
Доказать, что при любом приближении числа ]fl конечной десятичной дробью р
§ 42. Вычисление определителей
Прямое вычисление определителя, использующее его явное выражение
через элементы матрицы, редко применяется на практике из-за его
трудоемкости. Определитель n-го порядка состоит из п\ членов, а для
вычисления каждого члена и его сложения с другими нужно выпол-
выполнить п арифметических операций. Если все эти вычисления вести на
современной вычислительной машине, выполняющей 106 арифметических
операций в секунду, то и тогда для вычисления определителя, напри-
например, сотого порядка нам придется ждать результата в течение многих
миллионов лет.,
Один из самых эффективных способов вычисления определителей
основан на следующей идее. Пусть в матрице А отличен от нуля
элемент акр. Назовем его ведущим элементом. Если к любой i-й
строке, i Ф к, прибавим к-ю строку, умноженную на произвольное число
а*, то определитель от этого, как известно, не изменится. Возьмем
и выполним указанную процедуру для всех i Ф к. Тогда в новой
матрице все элементы р-го столбца, кроме ведущего, будут равны
нулю. Разлагая новый определитель по р-му столбцу, мы сведем
вычисление определителя и-го порядка к вычислению одного опреде-
определителя (п — 1)-го порядка. С этим определителем поступаем аналогичным
способом и т. д.
Описанный алгорифм называется методом Гаусса. Для вычисления
определителя п-го порядка по этому методу требуется выполнить
всего порядка —и3 арифметических операций. Теперь определитель
сотого порядка на вычислительной машине, выполняющей 106 арифмети-
арифметических операций в секунду, может быть вычислен быстрее чем за одну
секунду.
В заключение отметим, что в условиях приближенного выполнения
арифметических операций и приближенного задания информации к ре-
§ 42] ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ 135
зультатам вычисления определителей следует относиться с некоторой
осторожностью. Если делать выводы- о линейной зависимости или
независимости системы векторов лишь по равенству или не равенству
нулю определителя, то при наличии неустойчивости, отмеченной в § 22,
выводы могут оказаться неверными. Об этом следует помнить при
любом использовании определителя.
Упражнения.
1. В чем причина большей скорости вычисления определителя по методу
Гаусса но сравнению с прямым его вычислением?
2. Пусть все элементы определителя не превосходят по модулю единицы
и при вычислении каждого члена определителя мы совершаем ошибку порядка
?. При каких п прямое вычисление определителя имеет смысл с точки зрения
точности?
3. На основе метода Гаусса построить алгорифм для вычисления ранга
прямоугольной матрицы. Что означает применение этого алгорифма в условиях
приближенных вычислений?
ГЛАВА 5
ПРЯМАЯ ЛИНИЯ
И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ
§ 43. Уравнения прямой линии и плоскости
Основным предметом наших ближайших исследований будут прямая
линия и плоскость в пространствах направленных отрезков. Если Задана
некоторая система координат, то координаты точек, лежащих на прямой
линии или плоскости, уже не могут быть произвольны, а должны
удовлетворять определенным соотношениям. К выводу этих соотноше-
соотношений мы и переходим.
Пусть на плоскости фиксирована декартова прямоугольная система
координат Оху и задана прямая линия L. Рассмотрим какой-либо
ненулевой вектор
п = (А9В\ D3.1)
перпендикулярный к L. Очевидно, что все другие векторы, перпенди-
перпендикулярные к данной прямой, будут коллинеарны п.
Возьмем произвольную точку М0(х0, у о) на прямой линии. Все
точки М(х,- у) прямой L и только они обладают тем свойством, что
векторы М0М и п перпендикулярны, т. е.
{ЩМ, п) = 0. D32)
Так как
М0М = (х - х0, У - Уп\
то из D3.1), D3.2) следует, что
А(х-хо) + В(у-уо) = О.
Обозначив
- Ах0 - Ву0 = С,
мы заключаем, что в данной системе Оху координаты точек прямой
линии L и только они удовлетворяют уравнению
Ах + By + С = 0. D3.3)
Среди чисел А, В есть не равное нулю. Поэтому уравнение D3.3)
мы будем называть уравнением первой степени относительно пере-
переменных х, у.
Докажем теперь, что всякое уравнение первой степени D3.3) опре-
определяет относительно фиксированной системы координат Оху некоторую
прямую линию. Так как уравнение D3.3) есть уравнение первой сте-
§ 43J УРАВНЕНИЯ ПРЯМОЙ ЛИНИИ И ПЛОСКОСТИ 137
пени, то из постоянных А, В хотя бы одна отлична от нуля. Следо-
Следовательно, уравнение D3.3) имеет по крайней мере одно решение х0, у0,
например,
АС ВС
при атом
Ах0 + Ву0 + С = 0.
Вычитая из уравнения D3.3) данное тождество, мы получим
нение
эквивалентное уравнению D3.3). Но оно означает, что любая точка
М(х, у), координаты которой удовлетворяют заданному уравнению
D3.3), лежит на прямой, проходящей через точку М0(х0, Уо) и перпен-
перпендикулярной к вектору D3.1).
Итак, при фиксированной системе координат на плоскости любое
уравнение первой степени определяет прямую линию и координаты
точек любой прямой линии удовлетворяют уравнению первой степени.
Уравнение D3.3) называется общим уравнением прямой линии на плос-
плоскости, вектор п из D3.1) — нормальным вектором прямой.
Без какого-либо принципиального изменения проводится исследо-
исследование плоскости в пространстве. Зафиксируем декартову прямоугольную
систему координат Oxyz и рассмотрим плоскость тс. Снова возьмем
какой-либо ненулевой вектор
п = {А, В, С), D3.4)
перпендикулярный к тс. Повторяя проведенные выше рассуждения,
заключаем, что все точки М (х, у, z) плоскости тс и только они удовлет-
удовлетворяют уравнению
Ах + By + Cz + D = 0, D3.5)
которое мы также будем называть уравнением первой степени отно-
относительно переменных х, у, z.
Если мы опять рассмотрим произвольное уравнение первой сте-
степени D3.5), то оно также имеет по крайней мере одно решение
*о> Уо, z0, например
AD BD CD
Далее устанавливаем, что любая точка М(х, у, z), координаты которой
удовлетворяют заданному уравнению D3.5), лежит на плоскости, про-
проходящей через точку Мо (xOi y0, z0) и перпендикулярной к вектору D3.4);,
Таким образом, при фиксированной системе координат з прост-
пространстве любое уравнение первой степени определяет плоскость и коор-
138 ПРЯМАЯ ЛИНИЯ И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 5
динаты точек любой плоскости удовлетворяют уравнению первой сте-
степени. Уравнение D3.5) называется общим уравнением плоскости в прост-
пространстве, вектор п из D3.4) — нормальным вектором плоскости.
Посмотрим теперь, как связаны между собой два общих уравнения,
определяющих одну и ту же прямую линию или плоскость. Пусть
для определенности заданы два уравнения плоскости п
Atx + Bty + Cxz + D1 = О,
Л2х + В2у + C2z + D2 = 0. D3*6)
Векторы
пг = (Ли Ви СД п2 = (Л2, В2, С2)
перпендикулярны к одной и той же плоскости тг, поэтому они колли-
неарны. Так как они к тому же ненулевые, то существует такое
число % что, например,
или
Лх = Ui Вь = 1ВЪ Сх = tC2. D3.7)
Умножая второе уравнение D3.6) на t и вычитая из него первое
уравнение, в силу соотношений D3.7) получим, что
Dt - tD2.
Следовательно, коэффициенты общих уравнений, определяющих одну
и ту dice прямую линию или плоскость, пропорциональны.
Общее уравнение называется полным, если все его коэффициенты
отличны от нуля. Уравнение, не являющееся полным, называется
неполным. Рассмотрим полное уравнение прямой D3.3). Так как все
коэффициенты отличны от нуля, то это уравнение можно записать
в таком виде:
__ _
А В
Если обозначить
_ С С
то получим новое уравнение прямой
— + у -1
Это уравнение называется уравнением прямой «в отрезках». Числа
а, Ъ имеют простой геометрический смысл. Они равны величинам
отрезков, которые отсекает прямая линия на полуосях координат
(рис. 43.1). Конечно, полное уравнение плоскости можно привести к
? 43]
УРАВНЕНИЯ ПРЯМОЙ ЛИНИИ И ПЛОСКОСТИ*
139
аналогичному виду
х у z
\^ 1
a b с
Различные неполные уравнения определяют частные случаи рас-
прложения прямой и плоскости. Их полезно у
запомнить, так как они встречаются довольно
часто. Например, при С = О уравнение D3.3)
определяет прямую, проходящую через начало
координат, при В = С = 0 прямая совпадает с
осью Оу и т. д. При А = 0 уравнение D3.5)
определяет плоскость, параллельную оси Ьх9
при А = В = D — О плоскость совпадает с коорди-
координатной плоскостью Оху и т. д.
Любой ненулевой вектор, параллельный пря-
прямой линии, будем называть ее направляющим
вектором. Рассмотрим, например, случай про-
пространства и найдем уравнение прямой, проходящей через заданную
точку М0(хп, Vo> ^о) и имеющей заданный направляющий вектор
Рис. 43.1.
Очевидно, точка М(х, у, z) лежит на указанной прямой тогда и только
тогда, когда векторы М0М и q коллинеарны, т. е. тогда и только
тогда, когда координаты этих векторов пропорциональны, т. е.
х -*о У" У о z — Ч
I
т
D3.8)
Эти уравнения и являются искомыми уравнениями прямой. Обычно
они называются каноническими уравнениями прямой линии. Ясно, что
в случае прямой на плоскости уравнение будет таким:
х-х0 у-у0
I
т
D3.9)
если прямая проходит через точку М0(х0, у0) и имеет направляющий
вектор q — (/, т).
Из канонических уравнений легко получить уравнения прямой линии,
проходящей через две заданные точки Мо, Mv Для этого достаточно
в качестве направляющего вектора взять вектор МОМЬ выразить его
координаты через координаты точек Мо, Mt и подставить их в урав-
уравнения D3.8), D3.9). Например, в случае прямой на плоскости мы будем
иметь такое уравнение:
*-*о = У-Уо
*i - *о У1 - Уо '
140 ПРЯМАЯ ЛдаИЯ И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 5
а в случае пространства —
— х0
Заметим, что в канонических уравнениях прямой линии знаменатели
могут оказаться равными нулю. Поэтому всякую пропорцию a/b = c/d
мы будем понимать в дальнейшем как равенство ad = be. Следовательно,
обращение в нуль одной из координат направляющего вектора означает
обращение в нуль и соответствующего числителя в канонических
уравнениях.
Для аналитического представления прямой линии часто записывают
координаты ^ее точек как функции некоторого вспомогательного пара-
параметра t. Примем за параметр t каждое из равных отношений из D3.8)
и D3.9). Тогда в случае пространства будем иметь такие уравнения
прямой линии:
х = хо + **>
у = у0 + па, D3.10)
z = z0 + nt
и аналогичные уравнения в случае прямой на плоскости
х = х0 + к,
, , D3.11)
у = у о + mt. ч '
Эти уравнения называются параметрическими уравнениями прямой.
Давая параметру t различные значения, мы будем получать различные
точки прямой.
Большие возможности и удобства при написании различных урав-
уравнений прямой линии и плоскости предоставляет использование понятия
определителя. Выведем, например, уравнение плоскости, проходящей
через три различные точки, не лежащие на одной прямой. Итак,
пусть заданы точки М1(хи уъ гг)9 М2(х2, у2? z2\ Мг(х3, у3, z3). Так как
эти точки не лежат на одной прямой, то векторы
МлМ*2 = (*2 - Х19 У 2 ~ У U *2 - *l), ШЖъ = (^3 - Хи Уъ - У и Z3 ~ Zt)
не коллинеарны. Поэтому точка М(х, у, z) лежит в одной плоскости
с точками Мь М2, М3 тогда и только тогда, когда векторы
AfxAfa, МХМ\ и
МХМ = (х - хи у - у и z - zt)
компланарны, т. е. тогда и только тогда, когда определитель, состав-
составленный из их координат, равен нулю. Следовательно, уравнение
D3.12)
§ 43] Уравнения прямой линий и плоскости 141
есть уравнение искомой плоскости, проходящей через три заданные
точки.
Рассмотрим, наконец, уравнение прямой линии в пространстве,
перпендикулярной к двум непараллельным прямым и проходящей через
заданную точку. Предположим, что обе прямые линии заданы своими
каноническими уравнениями
х-х± =y-yi = z-z1
х-х2 ^у-у2 ^z-z2
l2 m2 n2
Направляющий вектор q искомой прямой должен быть перпенди-
перпендикулярен к двум векторам
4\ — 1/ь mU nlh 42 == 1*2? т2> п2/*
Эти векторы не коллинеарны, поэтому в качестве q можно взять,
например, векторное произведение \_qu q2"\. Вспоминая выражение коор-
координат векторного произведения через координаты сомножителей и
используя для записи определители второго порядка, мы получаем
q = \ det , det , det
V \m2 n2j \n2 12J \l2 m2j)
Если искомая прямая проходит через точку М0(х0, у0, z0), то канони-
канонические уравнения прямой будут такими:
х-х0 = У-Уо = z-z0
л (Шл пЛ , (пл {Л ' л (\л Шл
det х М det' х 1 * ^л+/ х х
t Л det .
Vn2 /2; V'
Конечно, с принципиальной точки зрения многие выводы в отноше-
отношении уравнений прямой линии и плоскости остаются в силе при исполь-
использовании любой аффинной системы координат. Наше стремление исполь-
использовать декартовы прямоугольные системы координат связано, в основ-
основном, с более простыми выкладками;
Упражнения.
1. Написать уравнение прямой на плоскости, проходящей через две заданные
точки, используя определитель второго порядка. Сравнить с D3.12).
2. Правильно ли утверждение, что уравнение D3U2) всегда представляет
уравнение плоскости?
3. По аналогии с уравнениями D3.10) написать параметрические уравнения
плоскости в пространстве. Сколько параметров должны содержать эти урав-
уравнения?
4. Найти координаты нормального вектора плоскости, проходящей через
три заданные точки, не лежащие на одной прямой.
5. Что представляет собой геометрическое место точек в пространстве,
координаты которых являются решениями системы из двух линейных алгебраи-
алгебраических уравнений с тремя неизвестными?
142 ПРЯМАЯ ЛИНИЯ И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 5
§ 44. Совместное расположение
При одновременном рассмотрении нескольких прямых линий и плос-
плоскостей возникают различные задачи, в первую очередь задачи опреде-
определения их расположения относительно друг друга.
Пусть в пространстве две пересекающиеся плоскости заданы своими
общими уравнениями
Ахх Л-В^у + Cxz + Di = 0,
А2х + В2у + C2z + D2 = 0.
Эти, плоскости образуют два смежных угла, в сумме равных двум
прямым. Найдем один из них. Векторы щ — (Аи Bl9 Сх) и^ п2 =
= \АЪ Въ С2) — нормальные, поэтому определение угла между плос-
плоскостями сводится к определению угла ф между векторами щ9 п2.
Согласно B5.5) имеем
А\А2 т" JJiJj2 ~г ^1*^2
В полной аналогии выводится формула для определения угла между
двумя прямыми линиями на плоскости, заданными своими общими
уравнениями
А±х + В1У + d = 0,
А2х + В2у + С2 == 0.
Один из углов ф, образуемых этими прямыми, вычисляется по фор-
формуле
Условие параллельности прямых, заданных общими уравнениями,
есть условие коллинеарности нормальных векторов, т. е. условие про-
пропорциональности их координат
Ai_^B±
А2 В2
Условие перпендикулярности прямых совпадает с условием cos ф = 0
или, что то же самое, с условием
А±А2 + ВгВ2 = 0.
Конечно, аналогичный вид имеет условие
А2 В2 С2
параллельности плоскостей и условие
А±А2 + ВХВ2 + СгС2 = 0
§ 44] СОВМЕСТНОЕ РАСПОЛОЖЕНИЕ 143
перпендикулярности плоскостей, заданных также общими уравне-
уравнениями.
Предположим теперь, что две прямые, например, в пространстве
заданы каноническими уравнениями
х - xi = У, - У1 == * - *i
х - х2 у-Уг z-zi
\2 ' т2 п2 •
Так как направляющими векторами этих прямых служат векторы
4i = (f ь ™ь иД q2 = (/2, тъ п2), то снова заключаем, что один из углов (р
между прямыми будет совпадать с углом между векторами qu q2.
Следовательно,
t1t2'
C0SФ " (H + ml +
Соответственно, пропорциональность координат
/2 т2 п2
есть условие параллельности прямых, а равенство
= О
есть условие Перпендикулярности прямых.
Ясно, что если прямые и плоскости задаются таким способом,
при котором явно указывается направляющий или нормальный вектор,
то определение угла между ними веегда сводится к определению
угла между этими векторами. Пусть, например, в пространстве задана
плоскость л; своим общим уравнением
Ах + By + Cz + D = О
и прямая L— каноническим уравнением
х-х0 у-у0 z-2Q
I m n
Поскольку угдл ср между прямой и плоскостью будет дополнитель-
дополнительным к углу \|/ между направляющим вектором прямой и нормальным
вектором плоскости (рис. 44.1), то
\Л1 + Вт + Сп |
sincp =
{А2 + В2 + С2I12 {I2 + т2 + и2I'2 '
Очевидным является условие
А1 + Вт 4- Сп = Q
144
ПРЯМАЯ ЛИНИЯ И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ
[Гл. 5
параллельности прямой и плоскости и условие
перпендикулярности прямой и плоскости.
Задание прямой линии и плоскости в форме общих уравнений
позволяет весьма эффективно решить важную задачу — вычисление
расстояния^ от точки до прямой линии
и от точки до плоскости. Вывод фор-
формул в обоих случаях полностью ана-
аналогичен и мы снова ограничимся под-
подробным рассмотрением лишь одного
из них.
Пусть плоскость к в пространстве
задана своим общим уравнением
D3.5). Возьмем произвольную точку
Mo(xo5 у о, z0). Опустим из точки Мо
перпендикуляр на плоскость и обозна-
его основание. Ясно, что расстояние
до плоскости равно длине вектора
чим
Рис. 44.1.
через Мх(хи уи
от точки
Мо
мом[. ^
Векторы п = (А, В, О) и МОМХ = (хх - х0, yt - у0, z1 - z0) перпенди-
перпендикулярны к одной и той же плоскости, следовательно, они коллине-
арны. Поэтому найдется такое число t, что М0М1 = tn, т. е.
zi ~~ zo — tC.
Точка Mi (xu -pu Zi) лежит на плоскости п. Выражая ее координаты
из полученных соотношений и подставляя их з уравнение плоскости,
находим
Лх0 + By о + Czo + D
г
Но длина вектора п раэна (А2 Л-В2 + С2I/2, поэтому \MQMX\ — \t\ x
х {А2 + В2 + С2I'2. Следовательно,
| Ах0 + ByQ + Cz0 + D I
р(М0, п)=*-
В частности,
Р(°>К) = ТТ:
(А2 +В2 + С2I12 '
Наряду с общим уравнение^ D3.5) плоскости мы рассмотрим такие
ее уравнения:
§ 45J ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ 145
Из двух возможных знаков в левой части выберем тот, который
противоположен знаку D. Если D = О, то выберем любой знак. Тогда
свободный член этого уравнения будет неположительным числом — р,
а коэффициенты при х, у, z — косинусами углов между нормальным
вектором и осями координат. Уравнение
х cos ос + у cos p -f zcosy — р = 0 D4.1)
называется нормированным уравнением плоскосщи. Очевидно, что
р (Мо, я) = | х0 cos а + у0 cos р + z0 cos у - р \,
Расстояние р (Мо, L) от точки Мо (х0, у0) до прямой линии L на
плоскости, заданной своим общим уравнением D3.3), определяется
по аналогичной формуле
г\ _ I ^Хо + ВУо + С |
Нормированное уравнение прямой линии такрво:
х cos ос + у sin а — р = 0. D4.2)
Здесь а — угол^ который образует нормальный вектор с осью Ох,
Упражнения.
1. При каком условии на координаты нормальных векторов две прямые
линии на плоскости (три плоскости в пространстве) пересекаются в одной
точке?
2. При каком условии прямая D3,8) принадлежит плоскости D3,5)?
3. При каком условии две прямые в пространстве, заданные каноническими
уравнениями, принадлежат одной плоскости?
4. Вычислить углы между диагональю куба и его гранями.
5» Вывести формулу для расстояния между точкой и прямой в пространстве,
заданной каноническими уравнениями..
§ 45. Плоскость в линейном пространстве
Мы уже неоднократно подчеркивали, что прямая линия и плоскость,
проходящие через начало координат, отождествляются в пространствах
направленных отрезков с геометрическим образом подпространства,
Но но своим свойствам они мало чем отличаются от любых других
прямых линий и плоскостей, полученных путем параллельного переноса
или сдвига этих подпространств. Желая обобщить данный факт на
произвольные линейные пространства, мы приходим к понятию плос-
плоскости в линейном пространстве.
Пусть L- некоторое подпространство линейного пространства К,
Зафиксируем в К произвольный вектор х0. И частности, этот вектор
может принадлежать L, Множество Я векторов z, получающихся по
146 Прямая линия и плоскость в линейном пространстве {Гл. 5
формуле
z = xo + y, D5Л)
где у — любой вектор из L, называется плоскостью в линейном прост-
пространстве К. Вектор х0 называется вектором сдвига, а подпространство L—
направляющим подпространством, В отношении плоскости Н мы бу-
будем говорить, что она образована сдвигом подпространства L на
вектор х0.
Формально понятие плоскости включает в себя понятия прямых
линий и плоскостей (в векторной интерпретации!) в пространствах
направленных отрезков. Но обладает ли оно аналогичными свойствами,
мы пока не знаем.
Каждый вектор плоскости Н единственным об.разом представляется
в виде суммы D5.1). Если z = xo + j/hz = xo + /, где у, y'eL, то отсюда
вытекает, что у — у'. Из формулы D5.1), кроме того, следует, что раз-
разность любых двух векторов из плоскости Н принадлежит подпрост-
подпространству L.
Выберем в плоскости Н произвольный вектор z0. Пусть z0 = х0 + Jfo-
Представим равенство D5.1) в таком виде:
z = z0 + (у - у0).
Множества векторов у и у — у0 описывают одно и то же под-
подпространство L. Поэтому последнее равенство означает, что плоскость Н
может- быть получена путем сдвига подпространства Ьна любой фикси-
фиксированный вектор самой плоскости.
Плоскость Н есть некоторое множество векторов из К, которое
порождается подпространством Ьи вектором сдвига х0 согласно D5.1).
Весьма важным обстоятельством является то, что любая плоскость
может порождаться лишь одним подпространством. Предположим, что
это не так, т> е. существуют еще одно направляющее подпространство L
и вектор сдвига х'о, образующие ту же плоскость Я. Тогда для любого
zgH имеем z = xo + y, где yeL, и в то же время z = х'о + /, где
y'eL. Отсюда следует, что подпространство L есть совокупность векто-
векторов из К, определяемых формулой
У = (*о - х'о) + У-
Так как нулевой вектор принадлежит L, то из последней формулы
следует, что вектор (х0 — х0) принадлежит L. Но это означает, что
подпространство L состоит из тех же векторов, что и подпространство L.
Мы уже отмечали, что вектор сдвига определяется плоскостью
заведомо неоднозначно. Однако и здесь вопрос об однозначности
можно решить вполне естественным "образом.
Будем считать, что в линейном пространстве К введено скалярное
произведение. Ясно, что мы получим ту же плоскость, если вместо
вектора х0 возьмем ortLx0. Поэтому, не ограничивая общности, можно
ечитать? что Xq-LL. Вектор xQ в этом случае будем называть ортого-
§ 45] ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ 147
налъным вектором сдвига. Теперь можно доказать, что каждая плоскость
порождается лишь одним вектором сдвига.
В самом деле, предположим, что существуют два вектора сдвигд
х'о, х'о, ортогональных к подпространству L, но порождающих, тем
не менее, одну и ту же плоскость Я. Тогда для любого вектора
y'eL должен существовать такой вектор у"eL, что Хо 4- у' = х'о 4- у".
Отсюда вытекает, что х'о — XqeL. Но, согласно предположению,
х'о — х'о 1 L. Следовательно, х'о — х'о = 0, т. е. х'о = x'q.
Это означает, в частности, что в пространстве со скалярным
произведением любая плоскость имеет лишь один вектор, ортогональ-
ортогональный к направляющему подпространству.
Две плоскости называются параллельными, если направляющее под-
подпространство одной из них входит в направляющее подпространство
другой.
Легко оправдать это определение. Любые две параллельные плос-
плоскости Яь #2 либо не содержат ни одного общего вектора, либо
одна из них входит в другую. Предположим, что Яь Н2 имеют общий
вектор z0. Так как любая плоскость может быть получена путем
сдвига направляющего подпространства на любой свой вектор, то как
#ь так и #2 получаются путем сдвига соответствующих подпространств
на вектор z0. Но одно из подпространств входит в другое, поэтому
и одна из плоскостей будет входить в другую.
Подпространство является частным случаем плоскости. Очевидно,
что подпространство L параллельно любой плоскости Я, полученной
- путем сдвига L на некоторый вектор х0. Из доказанного свойства
параллельных плоскостей вытекает, что Я совпадает с L тогда и только
тогда, когда xoeL.
Рассмотрим теперь две непараллельные плоскости Яь Я2. Они либо
не имеют ни одного общего вектора, либо имеют общий вектор.
В первом случае плоскости Ни Н2 будем называть скрещивающимися,
во втором — пересекающимися.
Как и в случае подпространств, множество векторов, принадлежащих
одновременно Ях и Я2, назовем пересечением плоскостей и обозначим
его символом Ях f] Я2. Пусть плоскость Н1 образована сдвигом под-
подпространства Ll9 а плоскость Я2 — сдвигом подпространства" L2.
•Обозначим
H = H1f)H2,L=L1()L2.
Теорема 45.1. Если пересечение Н содержит вектор z0, то оно
представляет собой плоскость, образованную сдвигом пересечения L на
этот вектор.
Доказательство. Согласно условию теоремы, существует век-
вектор z0, принадлежащий пересечению Я. Предположим, что существует
еще некоторый вектор z^eH] Представим его в таком виде:
Z! == Z0 + (Z1 - Z0).
148 ПРЯМАЯ ЛИНИЯ И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 5
Теперь из последовательности соотношений
zl9 zoeH->zl9 zoeHx; zu z0eH2-> z1 - zoeLx; zx - zo<eL2-*z1 - zQeL
заключаем, что любой вектор пересечения Я может быть представлен
как сумма вектора z0 и некоторого вектора из пересечения L.
Возьмем, далее, произвольный вектор / из L. Имеем
feL-*feLx; feL2-*z0+feHx; z0+feH2->z0+feH,
т. е, любой вектор подпространства L, сдвинутый на вектор z0, принадле-
принадлежит пересечению Н. Теорема доказана.
Плоскость не обязательно является подпространством. Тем не менее,
ей можно приписать размерность, равную размерности направляющего
подпространства. Плоскость нулевой размерности содержит лишь один
вектор — вектор сдвига. При определении размерности пересечения
плоскостей является полезной теорема 19.1. Из теорем 19.1, 45.1 следует,
что размерность пересечения Н не превосходит минимальной из размер-
размерностей Нх, Н2.
Если в пространствах направленных отрезков заданы два (три)
вектора, то при некоторых дополнительных условиях можно построить
лишь одну плоскость размерности 1 B), которая содержит заданные
векторы. Эти дополнительные условия можно сформулировать следую-
следующим образом. Если заданы два вектора, то они не должны совпадать,
т. е. не должны принадлежать одной плоскости нулевой размерности.
Если заданы три вектора, то они не должны принадлежать одной
плоскости размерности один.
Диалогичные факты имеют место в произвольном линейном прост-
пространстве.
Пусть в линейном пространстве заданы векторы х0, хь...-, хк. Будем
говорить, что эти векторы находятся в общем положении, если они
не принадлежат одной плоскости размерности к — 1.
Теорема 45.2. Если векторы х0, xx,...,xk находятся в общем
положении, то существует единственная плоскость Н размерности к,
содержащая эти векторы.
Доказательство. Рассмотрим векторы хх — х0, х2 — х0,...
..., хк — х0. Если бы они были линейно зависимы, то они принадлежали
бы некоторому подпространству размерности не выше к — 1. Следова-
Следовательно, сами векторы х0, хх,..., хк принадлежали бы плоскости, полу-
полученной сдвигом этого подпространства на вектор х0, что противоречит
условию теоремы.
Итак, векторы хх — х0, х2 — х0, ..., хк — х0 линейно независимы.
Обозначим через L их линейную оболочку. Подпространство L
имеет размерность к. Сдвинув его на вектор х0, мы получим некото-
некоторую плоскость Н той же размерности, которой принадлежат все
заданные векторы х0, хх,..., хк.
Построенная плоскость Н — единственная. В самом деле, пусть
векторы х0, хх,...9 хк принадлежат двум плоскостям Нх, Н2 размер-
§ 46] ПРЯМАЯ ЛИНИЯ И ГИПЕРПЛОСКОСТЬ 149
ности fc. Плоскость не меняется, если вектор сдвига заменить любым
другим вектором плоскости. Поэтому, не ограничивая общности, можно
считать, что Ни Н2 получены сдвигом соответственно подпространств
Ll9 L2 на один и тот же вектор х0. Но тогда следует, что оба
подпространства совпадают, так как имеют размерность к и содержат
одну и ту же линейно независимую систему хх — х0, х2 — х0,..., хк — х0.
Упражнения.
1. Пусть Яь Н2 — любые две плоскости. Назовем суммой Н^ + Н2 плос-
плоскостей Ни Н2 множество всех векторов вида zx + zl9 где z^eH^ z2eH2.
Доказать, что сумма плоскостей есть плоскость.
2. Пусть Я — плоскость к X — число. Назовем произведением ХН плоскости
Н на число X множество всех векторов вида Xz, где zeH. Доказать, что это
произведение есть плоскость. ч
3. Будет ли множество всех плоскостей .одного и того же пространства
с введенными выше операциями над ними линейным пространством?
4. Доказать, что векторы х0, хи ..., хк находятся в общем положении
тогда и только тогда, когда векторы хх -х0, х2-х09 ..., хк-х0 линейно
независимы.
5. Доказать, что плоскость размерности fc, содержащая векторы общего
положения х0, хь..., хь является подпространством тогда и только тогда,
когда эти векторы линейно зависимы.
§ 46. Прямая линия и гиперплоскость
В линейном пространстве К размерности т два класса плоскостей
занимают особое положение. Это плоскости размерности 1 и плоскости
размерности т — 1. В соответствий с геометрическим образом в прост-
пространствах направленных отрезков любая плоскость размерности 1 назы-
называется прямой линией. Плоскость размерности m — 1 называется гипер-
гиперплоскостью.
Рассмотрим произвольную прямую линию Н в линейном прост-
пространстве К. Обозначим через х0 вектор сдвига, через q — базисный
вектор одномерного направляющего подпространства. Пусть эти век-
векторы заданы своими координатами
относительно некоторого базиса пространства К. Очевидно, что любой
вектор z прямой линии Н может быть задан в таком виде:
z = х0 + tq, D6.1)
где t — какое-то число. Поэтому соотношение D6.1) можно считать
векторным уравнением прямой линии Я 'В пространстве К. Если
вектор z в том же базисе имеет координаты
150 ПРЯМАЯ ЛИНИЯ И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ рГл. 5
то, записывая равенство D6.1) покоординатно, получим
г2 = х2 + q2t, D6.2)
г« = *„ + qmt.
Сравнивая теперь эти уравнения с D3.10), D3.11), естественно назвать
их параметрическими уравнениями прямой линии Я. Мы будем говорить,
что прямая линия Я проходит через вектор х0 и имеет направляю-
направляющий вектор q.
Согласно теореме 45.2 через любые два несовпадающих вектора
х0, Уо можно всегда провести прямую линию и притом только одну.
Пусть в некотором базисе пространства К векторы х0, Уо заданы
своими .координатами
Хо = (Хь Х2, *.., Хт),
Уо = (Уи Уъ ..., Ут).
Так как в качестве направляющего вектора можно взять, например,
вектор у0 — х0, то из уравнений D6.2) получаем параметрические
уравнения
zi=xi +{ух -xx)t,
z2 = x2 + (y2'-x2)t9 D6.3)
zm = xm + (ym-x,n)t
прямой, проходящей через два заданных вектора.
При t = 0 эти уравнения определяют вектор х0, при t = 1 — вектор у0.
Если пространство К — вещественное, то множество векторов, заданных
уравнениями D6.3) для 0 ^ t < 1, мы назовем отрезком, соединяющим
векторы х0, Уо- Конечно, это название связано с геометрическим
образом данного множества в пространствах направленных отрезков.
Предположим, что прямая линия Н пересекается с некоторой плос-
плоскостью. Тогда, согласно следствию из теоремы 45.1, пересечение будет
представлять собой либо прямую линию, либо. один вектор. Если
пересечение есть прямая линия, то она, конечно, совпадает с прямой
линией Я. Но это означает, что при пересечении прямой линии
с плоскостью прямая линия либо целиком содержится в плоскости,
либо имеет с ней общим только один вектор.
Понятие гиперплоскости имеет смысл в любом линейном прост-
пространстве, но мы будем использовать его лишь в^ пространствах со ска-
скалярным произведением.
Рассмотрим произвольную гиперплоскость Я. Пусть она образована
сдвигом (т — 1)-мерного подпространства L на вектор х0. Ортогональ-
Ортогональное дополнение L-L является в этом случае одномерным подпространст-
подпространством. Обозначим через п любой его базисный вектор. Вектор z при-
принадлежит гиперплоскости Я тогда и только тогда, когда вектор z — х0
§ 46] ПРЯМАЯ ЛИНИЯ И ГИПЕРПЛОСКОСТЬ 151
принадлежит подпространству L. В свою очередь это условие выпол-
выполняется тогда и только тогда, когда вектор z — х0 ортогонален к век-
т°Р^Т-е- (n,z-xo) = O. D6.4)
Таким образом, мы получили уравнение, которому удовлетворяют
все векторы гиперплоскости Н. Для задания гиперплоскости в виде
этого уравнения достаточно указать любой вектор п, ортогональный
к направляющему подпространству, и вектор сдвига х0.
Явный вид уравнения позволяет существенно проще проводить
различные исследования. Предположим, что заданы векторы пи п2,..., пк
и Xi, х2,..., хк. Исследуем плоскость R, являющуюся пересечением
гиперплоскостей
(иь z-xx) = О,
(",z:*2)=0) D65)
(nk9 z-xk) = 0.
Эту задачу можно рассматривать как решение системы уравнений
D6.5) относительно векторов z. Пусть пересечение гиперплоскостей
не пусто, т. е. система D6.5) имеет хотя бы одно решение z0. Тогда,
как мы знаем, искомая плоскость определяется и такой системой:
(иь z - zo)'= 0,
(п2, z - z0) = 0, .
(пк, z - z0) = 0
в силу того, что любая плоскость не меняется, если вектор сдвига
заменить любым другим вектором плоскости.
Вектор у = z — z0 является произвольным вектором пересечения L
направляющих подпространств всех к гиперплоскостей. Очевидно, что
векторы у подпространства L удовлетворяют следующей системе:
К У) = 0,
(, У) = 0, D6>7)
К у) = о.
Задание пересечения L в виде системы D6.7) позволяет легко решить
вопрос о размерности L. Как видно из самой системы, подпространство L
является ортогональным дополнением линейной оболочки системы век-
векторов пи п2,..., пк. Пусть г — ранг этой системы, тогда размерность L
и, следовательно, R будет равна т — г, где т — размерность прост-
пространства. В частности, если векторы ni9 n2,..., пк линейно независимы,
то размерность плоскости D6.5) равна т — к. При этом, конечно, пред-
предполагается, что плоскость существует, т. е. система D6.5) имеет хотя бы
одно решение. Чтобы задать подпространство L, определяемое системой
152. ПРЯМАЯ ЛИНИЯ И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл.5
D6.7), достаточно указать его базис, т, е. любую систему из т — г линейно
независимых векторов, ортогональных векторам nl9 п2,.,., пк.
Уравнение D6.4) гиперплоскости можно записать и несколько цначе.
Обозначим (п, х0) = Ъ, тогда уравнение
•{h,z) = b D6.8)
будет определять ту же гиперплоскость, что и уравнение D6.4). Отме-
Отметим, что общие уравнения D3.3), D3.5) прямой линии и плоскости
по существу являются такими же уравнениями. Важно подчеркнуть,
что любое уравнение вида D6.8) можно привести к виду D6.4), под-
подходящим образом выбрав вектор х0. Для этого, например, достаточно
взять х0 в такой форме:
х0 = от.
Подставляя это выражение в D6.4) и сраднивая с D6.8), заключаем,
что должно быть
Ъ
а " (п, п)'
Теперь мы можем сделать вывод, что если система вида D6,5)
определяет некоторую плоскость, то ту же плоскость может опреде-
определять и система следующего вида:
(щ, z) = Ъи
(и2> z) = b2, D6.9)
(wfc, z) = Ьк
при соответствующих числах Ъъ Ь2,...,Ьк. Очевидно, верно и обратное
утверждение. Система D6.9) определяет ту же плоскость, что и система
D6.5) при соответствующих векторах хх, х2,..., хк.
Прямая линия и плоскость являются гиперплоскостями соот-
соответственно в пространствах V2 и F3. Мы установили ранее связь
между расстоянием от точки до этих гиперплоскостей и результатом
подстановки координат точки в общие уравнения. Аналогичная ?вязь
имеет место и в случае произвольной гиперплоскости.
Пусть Н есть гиперплоскость, заданная уравнением D6.4). Как и
"прежде, обозначим через р (v, H) расстояние между вектором v и Я.
Учитывая уравнение D6.4), получаем, что
(n, v - Хо) = (и, v - х0) - (и, z - х0) = (л, v-z)
оши
D6.10)
(n, v - Хо) = (и, v - х0) - (и, z - х0) = (л, v-z)
для любого вектора, z из Я. Согласно неравенству Коши-Буня-
ковского
S 46] ПРЯМАЯ ЛИНИЯ И ГИПЕРПЛОСКОСТЬ 153
Поэтому
Если мы покажем, что в гиперплоскости Я существует* й притом
только один, вектор z*, для которого неравенство D6.10) обращается
в равенство, то это будет означать, во-первых, что
Р(9,Я)-Щ^1 D6.11)
й, во-вторых, что значение р(у, Я) достигается лйШь йа одном век-
векторе г*.
Обозначим через L направляющее подпространство гиперплоско-
гиперплоскости Я, Ясно, что любой вектор, ортогональный к L, будет коллинеарен и,
и наоборот. Неравенство D6.10) обращается в равенство тогда и только
тогда, когда векторы п и v — z коллинеарны, т. е. v — 2 ** от для
некоторого числа а. Пусть равенство имеет место для двух векторов
zb z2 из Я, т. е.
1? — 2 2 — 0С2И.
Отсюда вытекает, что
Следовательно, z1 — z2lL. Ho z^ — z^eL как разность даух
векторов гиперплоскости. Поэтому z± — z2 — 0 или Zi = z2.
Обозначим через z0 вектор из Я, ортогональный к L. Как мы
знаем, этот вектор существует, и притом только один. Запишем вектор t
в виде суммы
где yeL, Вектор v представим в виде
v=f+s,
где/eL, s±L. Теперь
Если возьмем z = z0 + /, то
V- 2 = S-Z0.
Вектор h = s - z0 ортогонален к L, и формула D6.11) установлена.
Попутно мы доказали, что любой вектор v пространства может 6Ы1&
представлен единственным образом в виде суммы
v = z + h,
где вектор z принадлежит гиперплоскости Я, а вектор h ортогонален
154 ПРЯМАЯ ЛИНИЯ И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ {Гл. 5
к направляющему подпространству L. По аналогии с пространствами
направленных отрезков вектор z в этом разложении называется, проек-
проекцией вектора v на гиперплоскость Н, h — перпендикуляром, опущенным
из вектора v на Я. Процесс получения вектора z из v называется
проектированием v на Я. Если гиперплоскость задана уравнением D6.4),
то вектор п называется нормальным вектором гиперплоскости. Для
заданных векторов х0 и п существует лишь одна гиперплоскость,
содержащая вектор х0 и ортогональная к вектору п.
Упражнения.
1. Доказать, что любая плоскость, отличная от всего пространства, может
быть задана как пересечение гиперплоскостей D6.9).
2. Доказать, что сумма гиперплоскостей будет гиперплоскостью тогда и
только тогда, когда складываемые гиперплоскости параллельны.
3. Доказать, что произведение гиперплоскости на ненулевое число есть
гиперплоскость.
4. Каковы условия параллельности прямой и гиперплоскости?
5. Вывести формулу для расстояния между вектором и прямой, заданной
уравнением D6.1).
§ 47. Полупространство
С понятиями прямой линии и гиперплоскости тела связано понятие
так называемых выпуклых множеств. Поскольку эти множества широко
используются в самь!х различных областях математики, мы остано-
остановимся на исследовании некоторых из них.
Множество векторов вещественного линейного пространства называ-
называется выпуклым, если вместе с каждыми двумя векторами оно содержит
и весь отрезок, соединяющий их.
Выпуклыми множествами являются, например, один вектор, отрезок,
прямая линия, подпространство, плоскость, гиперплоскость и многие
другие.
Предположим, что гиперплоскость в вещественном пространстве
задана уравнением
(n, z) - Ъ = 0.
Множество векторов z9 удовлетворяющих неравенству
(и, z) - Ъ < 0 D7.1)
(n,z)-b>0, D7.2)
называется открытым полупространством. Полупространство D7.1)
называется отрицательным, полупространство D7.2) — положительным.
Теорема 47.1. Полупространство является выпуклым множеством.
Доказательство. Возьмем два вектора х0, у0 и обозначим
*i •= (и, х0) - Ъ, Ф2 = (п, уо) - Ь.
§ 47] ПОЛУПРОСТРАНСТВО 155
Если z есть любой вектор прямой линии, проходящей через. Хо, Уо> то
z = х0 + t(y0 - х0).
При 0< ? < 1 мы получаем векторы отрезка, соединяющего х0, у0.
Имеем.
(и, z) - Ъ = Ф! A - t) + O2t. D7.3)
Если Фх и Ф2 имеют одинаковые знаки, т. е.' векторы х0, у0 при-
принадлежат одному полупространству, то тот же знак для всех значений ?,-
удовлетворяющих неравенствам 0 ^ t < 1, будет иметь и правая часть
соотношения D7.3).
Таким образом, любая гиперплоскость делит линейное пространство
на три "непересекающихся выпуклых множества •*- саму гиперплоскость
и два открытых полупространства.
Предположим, что векторы х0, у0 принадлежат различным полу-
полупространствам, т. е. Фх и Ф2 имеют различные знаки. Формальное
преобразование соотношения D7.3) приводит к такому равенству:
Отсюда следует, что прямая линия, проходящая через векторы х0, fa9
пересекает гиперплоскость. Пересечение определяется значением
1
1- 1-Ф2/Фх'
которое удовлетворяет неравенствам 0 < t < 1. Итак,
Если два вектора принадлежат различным полупространствам, то
отрезок, соединяющий эти векторы, пересекает гиперплоскость, опреде-
определяющую полупространства.
Учитывая сформулированное свойство, легко понять, что пред-
представляют собой полупространства в пространствах направленных отрез-
отрезков. На плоскости концы векторов полупространства лежат по одну
сторону от прямой линии, в пространстве — по одну сторону от плоскости.
Наряду с открытыми полупространствами нередко рассматривают
и замкнутые полупространства. Они определяются как множества
векторов z, удовлетворяющих неравенству
(л, z) - Ъ < 0 D7.4)
или
(n, z) - Ъ > 0. D7.5)
Полупространство D7.4) называется неположительным, тюлупространг
ство Д47.5) — неотрицательным. Конечно, замкнутыр полупространства
также являются выпуклыми множествами.
Теорема 47.2. Пересечение выпуклых множеств является выпук-
выпуклым множеством.
156 ПРЯМАЯ ЛИНИЯ И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 5
Доказательство. Очевидно, что достаточно рассмотреть случай
двух множеств Ul9 U2. Пусть U = U1 f] U2 — их пересечение. Возьмем
любые два вектора х0, у0 из U и обозначим через S соединяющий
их отрезок. Векторы х0, у о принадлежат как 1/ь так чи U2. Поэтому
в силу выпуклости множеств Ul9 U2 отрезок S принадлежит целиком
как Uи так и U29 т. е. он принадлежит пересечению U.
Доказанная теорема имеет большое значение при изучении выпуклых
множеств. В частности, она позволяет утверждать, что непустое
множество векторов z9 одновременно удовлетворяющих системе нера-
неравенств
("i,*)-/i^0,
(, Z) ~f2 ^ О,
{пь z) -fk ^ О
выпукло. Подобные системы неравенств являются основным элементом
описания многих задач планирования производства, управления и т. п.
Упражнения.
1. Доказать, что множество векторов г, удовлетворяющих условию (z, z) < a,
является выпуклым.
2. Доказать, что если вектор z принадлежит гиперплоскости D6.8), то вектор
z + n лежит в положительном полупространстве.
3. Доказать, что если гиперплоскости заданы нормированными уравне-
уравнениями D4.1), D4.2), то начало координат всегда лежит в неположительном
полупространстве.
§ 48. Системы линейных уравнений
Мы снова возвращаемся к исследованию систем линейных алгебра-
алгебраических уравнений, но на этот раз в связи с задачей о пересечении
гиперплоскостей.
Рассмотрим вещественное или комплексное пространство К раз-
размерности т. Предположим, что в нем введено скалярное произведение.
Выберем какой-либо ортонормированный базис и пусть нормальные
векторы пъ пъ ..., пк гиперплоскостей Ни Я2, ..., Нк из D6.9)
заданы своими координатами
^12, •••> aim),
#22> •••> а2т\
D8.1)
относительно этого базиса. Будем считать, что и векторы
§ 48] СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 157
принадлежащие пересечению гиперплоскостей, также определяются
своими координатами в том же базисе.
В случае вещественного пространства скалярное произведение век-
векторов в ортонормированием базисе равно сумме попарных произвел
дений координат. Поэтому в координатной записи система D6.9)
будет иметь следующий вид:
2mm 2,
D8.2)
... + Clkmzm = h.
В случае комплексного пространства мы снова получим аналогичную
систему, лишь коэффициенты при неизвестных и правые части заменятся
на комплексно сопряженные числа.
Итак, задача о пересечении гиперплоскостей сводится к известной
нам по § 22 задаче решения системы линейных алгебраических урав-
уравнений. Очевидно, что и любая система уравнений с комплексными или
вещественными коэффициентами может исследоваться с точки зрения
пересечения гиперплоскостей в комплексном или вещественном про-
пространстве Рт.
Одним из основных моментов является исследование системы линей-
линейных алгебраических уравнений на совместность. Именно с этим момен-
моментом связан ответ на вопрос, является ли пересечение гиперплос-
гиперплоскостей пустым множеством или не пустым. Конечно, для выполнения
данного исследования можно воспользоваться методом Гаусса. Однако
это не „всегда удобно.
При изучении систем линейных алгебраических уравнений прихо-
приходится иметь дело с двумя матрицами. Одна из них составляется из
коэффициентов при неизвестных и называется матрицей системы. Эта
матрица такова:
1 tfii а12 ... а1т
a2i а22 ...'Яг»!
ак2 ... щ
Другая получается из нее добавлением столбца правых частей
ai2 ... aim bi
а22 ... а2т Ъ2
ак2 ••• tffc
и называется расширенной матрицей системы. Отметим, в частности,
158 ПРЯМАЯ ЛИНИЯ И ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 5
что ранг матрицы системы совпадает с рангом системы векторов
D8.1).
Теорема 48.1 (теорема Кронекера — Капеллы). Для того чтобы
система линейных алгебраических уравнений была совместной, необходимо
и достаточно, чтобы ранг расширенной матрицы системы равнялся
рангу матрицы системы.
Доказательство. Воспользуемся обозначениями § 22. С точ-
точностью до расположения векторы аъ аъ ..., а,ю Ъ представляют
собой столбцы рассматриваемых матриц. Так как ранг матрицы совпа-
совпадает с рангом системы ее векторов-столбцов, то, для доказательства
теоремы достаточно показать, _что система будет совместной тогда и
только тогда, когда ранг системы аъ аъ ..., ат совпадает с рангом
системы аъ а2, ..., ат, Ъ.
Предположим, что система D8.2) совместна. Это означает, что ра-
равенство B2.1) выполняется для некоторого набора чисел zb z2, ...
..., zm, т. е. вектор Ъ является линейной комбинацией векторов
аь а2, ..., ат. Но отсюда следует, что любая база системы al9 аъ ...
..., ат'будет одновременно и базой системы аъ аъ ..., ат, Ь, т. е. ранги
обеих систем совпадают.
Пусть теперь совладают ранги этих систем. Выберем какую-либо
базу из аъ аъ ..., ат. Она же будет и базой системы аъ аъ ...
..., ат, Ъ. Следовательно, вектор Ъ линейно выражается через часть
векторов системы аи аъ ..., ат. Так как он может быть представлен
в виде линейной комбинации и всех векторов аъ а2, ..., ат9 то это
означает совместность системы D8.2). Теорема доказана.
Система линейных алгебраических уравнений D8.2) называется
неоднородной, если не все-правые части равны нулю. В противном
случае система называется однородной. Любая однородная система всегда
совместна, так как одним из ее решений является zt = z2 =± ... = zm = 0.
Система, полученная из системы D8.2) заменой всех правых частей
нулями, называется приведенной однородной системой. Если система
D8.2) совместна, то каждое ее решение будем называть частным решением.
Совокупность всех частных решений назовем обЩим решением системы.
Используя полученные ранее сведения о плоскостях и, системах
D6.6), D6.7), D6.9), описывающих пересечение гиперплоскостей, мы можем
сделать ряд выводов в отношении общего решения системы линейных
алгебраических уравнений. Именно,
Общее решение приведенной однородной системы образует в про-
пространстве Рт подпространство размерности т — г, где г — ранг матрицы
системы. Любой базис этого подпространства называется фундамен-
фундаментальной системой решений.
Общее решение неоднородной системы есть плоскость в пространстве
Рт, полученная путем сдвига общего решения приведенной однородной
системы на любое частное решение неоднородной системы.
Разность любых двух частных решений неоднородной системы есть
частное решение приведенной однородной системы.
§ 48] СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 159
Среди частных решений неоднородной системы есть .лишь одно
решение, которое ортогонально ко всем решениям приведенной однородной
системы. Это решение называется нормальным.
Для того чтобы совместная система имела единственное решение,
необходимо и достаточно, чтобы ранг матрицы системы был равен
числу неизвестных.
Для того чтобы однородная система имела ненулевое решение,
необходимо и достаточно, чтобы ранг матрицы системы был меньше
числа неизвестных.
В проведенном исследовании систем линейных алгебраических урав-
уравнений мы лишь косвенно использовали понятие определителя, в ос-
основном через понятие ранга матрицы. Однако в теории систем урав-
уравнений определитель играет существенно большую роль.
Пусть матрица системы — квадратная. Для хого чтобы ранг матрицы
системы был меньше числа неизвестных, необходимо и достаточно, чтобы
определитель системы был равен нулю. Поэтому
Однородная система имеет ненулевое решение тогда и только тогда,
когда определитель системы равен нулю.
Предположим теперь, что определитель системы отличен от нуля.
Это означает, что ранг матрицы системы равен т. Ранг расширенной
матрицы не может быть меньше т. Но он не может быть и больше
т, так как нет миноров порядка т + 1. Следовательно, ранги обеих матриц
равны, т. е. система в этом случае обязательно совместна. Более
того, она имеет единственное решение. Таким образом,
Если определитель системы отличен от^нуля, то система всегда
имеет, и притом единственное решение.
С точки зрения исследования пересечения гиперплоскостей этому
факту можно придать такую форму:
Если нормальные векторы гиперплоскостей образуют базис
пространства, то пересечение гиперплоскостей не пусто и содержит
лишь один вектор.
Обозначим через d определитель системы, через dj — определитель,
отличающийся -от d лишь тем, что в нем jf-й столбец заменен
столбцом правых частей Ъъ Ь2, ..., Ьт. Тогда единственное реше-
решение системы может быть вычислено по формулам
-*/ = -^-, J = l, 2, ..., л. D83)
Действительно, обозначим через Atj алгебраическое дополнение
элемента atj определителя системы. Раскладывая dj по элементам j-ro
столбца, получим
Подставим теперь выражения D8.3) в произвольное fe-e уравнение
16Й ПРЯМАЯ ЛИНИЯ Я ПЛОСКОСТЬ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл, 5
системы
п п п п п
n n n
1 V V4 , 1
Внутренняя сумма в последнем равенстве согласно D0,5), D0.8) равна
либо d, либо нулю в зависимости от того, i = к или i Ф к.
Таким образом, формулы D83) дают явное выражение решения
системы через ее элементы. В силу единственности никакого другого
решения не существует. Эти формулы называются формулами Крамера.
С формальной точки зрения на основе вычисления определителей
можно решать любые системы уравнений вида D8.2). Сначала, вычисляя
различные миноры матрицы системы и расширенной матрицы, мы
проверяем систему на совместность. Пусть она оказалась совместной
и ранг обеих матриц равен г. Не ограничивая общности, можно
считать, что главный минор порядка г матрицы системы отличен
от нуля. Согласно теореме 4L1 последние к — г строк - расширенной
матрицы, являются линейными комбинациями первых г ее строк.
Следовательно, система
J an^i + ..* -f alrZfl+ ai^+iZf+i + ... 4- almzm =* Ьъ
la11z1 + ... + alYz,\+ a2)r+1zr+1 + ... + almzm « 52, ^щ
r} r+ l*
= К
эквивалентна системе D8.2),
Неизвестные zr+l9 ,.., z^ по-прежнему будем называть свободными
неизвестными. Приписывая им любые значения,, можно определить
и все остальные неизвестные, решая систему с матрицей главного
минора, например, по формулам Крамера.
Этот способ решения системы имеет некоторую ценность лишь при
теоретических исследованиях. В практическом же отношении гораздо
выгоднее пользоваться методом Гаусса, описанным в § 22.
Упражнения.
1. Доказать, что общее решение есть выпуклое множество.
2. Доказать, что среди всех частных решений неоднородной системы
нормальное решение имеет наименьшую длину.
3. Доказать, что фундаментальной системой является совокупность любых
т — г решений приведенной однородной системы, для которых определитель,
доставленный из значений свободных неизвестных, отличен от нуля.
4. В § 22 отмечалось, что малые изменения координат могут приводить
к нарушению линейной зависимости или независимости векторов. Какие выводы
можно отсюда сделать в отношении задачи о пересечении гиперплоскостей?
ГЛАВА 6
ПРЕДЕЛ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ
§ 49. Метрическое пространство
Одним из основных понятий математического анализа является
понятие предела. Оно основано на том, что для точек числовой оси
определено понятие «близости» или, точнее, расстояния между точками.
Сравнение на «близость» можно ввести и в множествах совсем иной
природы. Мы уже определили в § 29 расстояние между векторами ли-
линейных пространств со скалярным произведением. При этом было обна-
обнаружено, что оно обладает теми же свойствами B9.5), что и расстояние
между точками числовой оси. Расстояние между векторами определялось
через скалярное произведение, которое, в свою очередь, вводилось аксио-
аксиоматически.
Естественно попытаться ввести аксиоматически и само расстояние,
потребовав обязательное выполнение свойств B9.5).
Заметим, что многие фундаментальные факты теории предела в
математическом анализе не связаны с тем, что для чисел определены
алгебраические операции. Поэтому мы начнем с того, что распространим
понятие расстояния на произвольные множества элементов, не обя-
обязательно являющихся векторами линейного пространства.
Множество называется метрическим пространством, если каждой паре
его элементов поставлено в соответствие неотрицательное вещественное
число, называемое расстоянием, причем выполнены следующие аксиомы:
J) р(*, У) = р(у, х),
2) p(.Y, v) > 0, если л- Ф v; p(.v, v) = 0, если х = у,
3) Р(л% .v)<P(.y, г) + р(г, v)
для любых элементов х9 у, г. Эти аксиомы называются аксиомами
метрики, причем первая из них называется аксиомой симметрии,
третья — аксиомой треугольника.
Формально любое множество элементов, в котором определено
отношение равенства, можно превратить в метрическое пространство,
если положить
"* D9.1)
J если хФу. '
Легко проверить, что все аксиомы метрики выполнены.
Вектор л'о метрического пространства X называется пределом
последовательности {хп} элементов хи .y2, ..., хп9 ... из X, если после-
последовательность расстояний р(л-0, xt), p(.v0, л'2), ,.., p(.v0, xn\ ... сходится
6 В. В. Вреводин
162 ПРЕДЕЛ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 6
к нулю. Будем писать в этом случае
или
lim хп = х0
п-у со
и называть последовательность {хп} сходягцейся в X или просто
сходящейся.
Заметим, что одна и та же последовательность элементов одного
и того же множества X может быть и сходящейся, и несходя-
несходящейся в зависимости от того, какая метрика введена в X. Пусть,
например, в метрическом пространстве X выбрана какая-либо сходящаяся
последовательность [хп], состоящая из попарно различных элементов.
Изменим метрику в X, введя ее согласно D9.1). Теперь последо-
последовательность {.\'„} уже не будет сходящейся. В самом деле, предположим/
что л'„->л'о, т. е. р(л*„, Уо)-»0. При новой метрике это возможно
только тогда, когда все элементы [л„], за исключением их конечного
числа, совпадают с х'о. Полученное противоречие подтверждает вы-
высказанное утверждение.
Следующие два свойства являются общими для любых сходящихся
последовательностей.
Если последовательность [хп] сходится, то сходится и имеет тот
же предел любая ее подпоследовательность. Последовательность может
иметь не более одного предела.
Первое свойство очевидно. Предположим, что последовательность
{л'„} имеет два предела х0 и у0. Тогда для любого сколь угодно
малого числа е > 0 можно выбрать такое N, что
при всех п > N. Но отсюда, используя аксиому треугольника, находим
Р (*о> У о) < Р (*о> Л"п) + Р (*и, У о) < е.
В силу произвольности s это означает, что р (л:0, у0) = 0, т. е. х0 = у0.
Шаром S(a, r) в метрическом пространстве X мы будем называть
множество всех элементов хеХ, удовлетворяющих условию
р(а,х)<г. D9.2)
Элемент о назовем центром шара, число г — радиусом. Любой шар
с центром в а назовем окрестностью элемента а. Множество элементов
называется ограниченным, если оно целиком принадлежит некоторому
шару.
Легко видеть, что элемент х0 является пределом последовательности
{хп) тогда и только тогда, когда любая окрестность элемента л0
содержит все элементы рассматриваемой последовательности, начиная
с некоторого номера.
§ 50] ПОЛНОЕ ПРОСТРАНСТВО 163
В метрическом пространстве могут быть введены и многие дру-
другие важнейшие понятия, с которыми имеют дело в числовых множест-
множествах. Так, если дано множество М а X, то элемент хеХ называется
предельной точкой этого множества, если любая окрестность элемента х
содержит хотя бы один элемент множества М, не совпадающий с л*.
Множество, полученное присоединением к М всех его предельных
точек, называется замыканием множества М и^ обозначается М<
Множество М называется замкнутым, если М = М.
Рассмотрим предельные точки шара D9.2). Покажем, что все
они удовлетворяют условию
Р (*,*)< г. D9.3)
В самом деле, предположим, что есть хотя бы одна предельная
точка л*' для шара D9.2), для которой р {а, хг) > г. Согласно определению
предельной точки, любая окрестность элемента х' должна содержать
по крайней мере один элемент шара D9.2), не совпадающий с ,\*V
Но окрестность с радиусом 0,5 (р (а, л') — г) заведомо не содержит
ни одного такого элемента. Согласно этому:
Множество S (а, г) всех элементов х, удовлетворяющих условию
D9.3), называется замкнутым шаром.
Упражнения.
1. Доказать, что если хн->х, то р(л'„, z)-+p(x, г) для любого элемента z.
2. Будет ли множество всех вещественных чисел метрическим пространством,
если для чисел х, у положить
p(.\\y) = arctg|.v -y|.
3. Может ли множество, состоящее из конечного числа элементов, иметь
предельные точки?
§ 50. Полное пространство
Последовательность {хп} элементов метрического пространства
называется фундаментальной или сходягцепся в себе, если для любого
числа 8 > 0 найдется такое N, что р (л*,„ л,„) < s при н9 т > N.
Любая фундаментальная последовательность ограничена. Действи-'
тельно, по заданному 8 выберем N9 согласно определению, и возьмем
произвольное число 7?0 > N. Все элементы последовательности, начиная
с л* , заведомо принадлежат шару с центром хп и радиусом 8. Все
же элементы принадлежат шару с центром хп й радиусом, равным
максимальному из чисел
Если последовательность — сходящаяся, то она — фундаментальная*
Пусть последовательность [л*,,] сходится к х0. Тогда для любого
6*
164 ПРЕДЕЛ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 6
e > 0 найдется такое 2V, что
при п > N. Согласно аксиоме треугольника,
Р (*ю * J < Р (Хю Х0) + р (Л'о, -Vm) < 8
при п, m>N9 чю и означает фундаментальность последовательности
{*.)¦
Для множества всех вещественных чисел справедливо и обратное
утверждение. Именно, любая фундаментальная последовательность
является сходящейся. Однако в общем случае это уже не верно, что
подтверждается примером метрического пространства, из которого
исключена хотя бы одна предельная точка.
Метрическое пространство называется полным, если любая фундамен-
фундаментальная последовательность в нем является сходящейся.
В полных метрических пространствах имеет место теорема, являюща-
являющаяся аналогом теоремы о вложенных отрезках для действительных
чисел. Пусть дана некоторая последовательность шаров. Мы будем назы-
называть эти шары вложенными друг в друга, если каждый последующий
шар содержится внутри предыдущего.
Теорема 50.1. Пусть в полном метрическом пространстве X
задана последовательность [S(am eB)} замкнутых шаров, вложенных
друг в друга. Если последовательность радиусов стремится к нулю,
то существует единственный элемент из X, принадлежащий всем этим
шарам.
_ Доказат ?л ь с т в о. Рассмотрим последовательность {ап). Так как
S{an+p, гп+р)с S(am г„) при любом р ^ 0, то an+peS(am en). Следовательно,
откуда вытекает, что последовательность {ап} — фундаментальная.
Пространство X — полное, поэтому последовательность {ап} сходится
к некоторому пределу а из X. Возьмем любой шар S(ah ek). Этому
шару принадлежат все члены последовательности {я,,}, начиная с ак.
В силу замкнутости шаров предел данной последовательности
также принадлежит S(ah гк). Таким образом, а принадлежит всем
шарам.
Допустим, далее, что существует другой элемент Ь, также принадлежа-
принадлежащий всем шарам. Согласно аксиоме треугольника
р(а, Ъ) < р{а, а„) + р(ат Ъ) < 2е„.
Так как еп может быть взято как угодно малым, то это означает, что'
р (а, Ь) = 0, т. е. а = Ъ.
Важнейшими примерами полных пространств являются множества
вещественных и комплексных чисел. При этом мы предполагаем, что
расстояние между числами совпадает с модулем их разности. Полнота
§50] БОЛ НОЕ, ПРОСТРАНСТВО 165
множества вещественных чисел доказывается в курсе математического
анализа. Покажем полноту множества комплексных чисел.
Будем считать, что комплексные числа заданы в алгебраической
форме. Расстояние между числами
z = a + ib, v — c + id
введем согласно правилу
где
\z - v\2 = (а - сJ + (Ь - ф E0.2)
Очевидно, что аксиомы метрики выполнены.
Рассмотрим последовательность {zk = ак 4- ibk} комплексных чисел.
Пусть эта последовательность — фундаментальная. По заданному е > 0
найдем такое N, что для всех и, т > N
Из E0.2) следует, что при этом
Iап - ат| < s, |Ьп -Ът\< s, E0.3)
т. е. последовательности {ак} и {Ьк} также являются фундаменталь-
фундаментальными. В силу полноты множества вещественных чисел существуют
такие числа а, Ь, что
я* -* а,, К -> Ъ.
Переходя к пределу в неравенствах E0.3), получим
\ап-а\<г, |ЬВ-Ь|<е.
Обозначив
z = а + ib,
находим, что
при всех п > i\L Но это означает, что фундаментальная последова-
последовательность \zk) является сходящейся.
В качестве следствия отметим, что последовательность {zk = ак +
4- ibk) сходится к числу z — а + ib тогда и только - тогда, когда
последовательности {ак} и {Ьк} сходятся соответственно к числам
а и Ь.
Полное пространство комплексных чисел имеет много общего с
пространством вещественных чисел. В частности, всякая ограниченная
последовательность комплексных чисел имеет сходящуюся подпоследова-
подпоследовательность. Действительно, это утверждение справедливо для любой
ограниченной последовательности вещественных чисел. Очевидно, далее,
166
ПРЕДЕЛ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ
[Гл. б
что из ограниченности последовательности [zk = ак + ihk) вытекает
ограниченность последовательностей {ак} и {/?*]. Так как последователь-
последовательность [ак] ограничена, то она имеет сходящуюся подпоследовательность
{av}. Рассмотрим последовательность [bv]. Она ограничена и поэтому
{fo } Я
также имеет сходящуюся подпоследовательность {
{fov
v
Ясно, что
{ау } будет сходящейся. Следовательно, сходящейся является и подпо-
подпоследовательность {zy }.
В комплексном пространстве по аналогии с вещественным вводится
понятие бесконечно большой последовательности. Именно, последова-
последовательность {zk} называется бесконечно большой, если для сколь угодно
большого числа Л можно указать такое JV, что для всех k>N
выполняетсянеравенство | zk \ > А. Очевидно, что из любой неограниченной
последовательности можно всегда выбрать бесконечно большую подпо-
подпоследовательность.
Упражнения.
1. Будет ли множество всех вещественных чисел полным пространством,
если для чисел л% у положить
р(.\%у) = arctg|.v- y|?
2. Доказать, что любое замкнутое множество полного пространства само
является полным пространством.
3. Будет ли любое замкнутое множество произвольного метрического
пространства обязательно полным пространством?
4. Постройте пример метрики, при которой множество всех комплексных
чисел не будет полным пространством Л
У
§ 51. Вспомогательные неравенства
Установим некоторые неравенства, которые мы будем использовать
в ближайших исследованиях. Возьмем произвольное положительное чис-
число а и рассмотрим показательную функ-
функцию у = ос* (рис. 51.1). Пусть хи х2 —
два различных вещественных числа. Про-
Проведем прямую линию через точки с ко-
координатами (хь ocAl), (x2, аЛ2)- Принимая
во внимание свойства показательной функ-
функции, заключаем, что при изменении аргу-
аргумента на сегменте [хи л*2] все ее точки
будут лежать не выше точек построен-
построенной прямой линии.
Пусть теперь .^=0, х2 = 1. Тогда
уравнение рассматриваемой прямой линии будет v = ах + A — л). Сле-
Следовательно
а*<осл- + A -л) EU)
для 0 < х < 1*
рпс> 51#1#
§51] ВСПОМОГАТЕЛЬНЫЕ НЕРАВЕНСТВА 167
Назовем положительные числа р, q сопряженными, если они удовлет-
удовлетворяют соотношению
—+ —=1. E1.2)
р q v
Ясно, что р, q > 1.
Для любых положительных чисел а, Ь число apfr~e будет также
положительным и его можно взять в качестве а из E1.1). Если
считать, что х = р~*9 то 1— x = q~x. Теперь из E1.1) следует спра-
справедливость такого неравенства:
аЬ«—+ — E1.3)
Р Я.
для любых положительных а, Ь и сопряженных р, q. Очевидно,
что в действительности это неравенство имеет место для всех неотри-
неотрицательных а9 Ь.
Рассмотрим два произвольных вектора х9 у9 принадлежащих про-
пространству R,, или С„. Пусть эти векторы заданы своими координатами
х = (хъ х2, ..., хД
У = (Уи У'2, ••> Уп)-
Установим так называемое неравенство ГельЬера
. E1.4)
Заметим, что если среди векторов л*, у есть хотя бы один нулевой
вектор, то неравенство Гельдера, очевидно, справедливо. Поэтому
можно считать, что х ф 0, у Ф 0. Пусть неравенство выполняется
для каких-либо ненулевых векторов х, у. Тогда оно выполняется
и для векторов Ъс, \iy при любых л, \i. Поэтому его достаточно
доказать для того случая, когда
ЁЫ'=1Ыв=1. E1.5)
к=1 к=1
Полагая теперь a = \xk\, h = \yk\ в неравенстве E1.3) и суммируя по
к от 1 до п, получим, учитывая E1.2), E1.5), что
Но это и есть неравенство Гельдера для случая E1.5).
Перей/дем теперь к доказательству неравенства Минковского, озна-
означающего, что для любых векторов л*, у из Rn или Си
при всех р ^ I.
168 ПРЕДЕЛ В ЛИНЕЙНОМ ПРОСТРАНСПВЕ [Гл. 6
Неравенство Минковского очевидно при р = 1, так как модуль
суммы двух чисел не превосходит суммы их модулей. Кроме этого,
оно заведомо выполняется, если хотя бы один из векторов х9 у равен
нулю. Поэтому мы можем ограничиться рассмотрением случая р> I к
х ф 0. Напишем тождество
Полагая в нем а = xk, Ъ = у\ и суммируя по /с от I до п3 получим
t Ы + \ун\У- = IЫ + 1л1Г * М + t Ы + W1 Ы.
kl fcl fcl
Применим к каждой из двух сумм, стоящих в правой части этого
соотношения,неравенство Гельдера. Учитывая, что (р — l)q = p, получим
Разделив обе части неравенства на
находим, что
откуда сразу следует неравенство E1.6).
Упражнения.
1. Вывести неравенство Коши — Буняковского из неравенства Гельдера.
2. Изучить неравенство Гельдера при р -> оо.
3. Изучить неравенство Минковского при р ->• оо.
§ 52. Нормированное пространство
К понятию метрического пространства мы пришли, сосредоточив
наше внимание лишь на одном свойстве множества — наличии расстояния!
в нем. Аналогичным образом, сосредоточив внимание на операциях
в множестве, мы пришли к понятию линейного пространства. Теперь
мы рассмотрим линейные пространства с метрикой.
Очевидно, что если понятие расстояния никак не связано с опе-
операциями над элементами, то нельзя построить содержательной теории,
факты которой соединяли бы вместе алгебраические и метрические
понятия. Поэтому мы будем накладывать на метрику, введенную в
линейном пространстве, дополнительные условия.
§ 52] НОРМИРОВАННОЕ ПРОСТРАНСТВО 169
В действительности мы уже встречались с метрическими линей-
линейными пространствами. Ими являются, например, евклидово и унитарное
пространства с метрикой B9.4). Однако необходимость в такой метрике
возникает далеко не всегда. Введение скалярного произведения означает
по существу введение не только расстояния между элементами, но и
углов между ними. Чаще же всего в линейном пространстве требуется
дать приемлемое определение лишь расстояния. Важнейшими линейными
пространствами такого рода являются так называемые нормированные
пространства.
Вещественное или комплексное линейное пространство X называется
нормированным пространством, если каждому вектору хеХ поставлено
в соответствие вещественное число || х ||, называемое нормой вектора х,
причем выполнены следующие аксиомы:
1) ||х||>0, если х^ О, }|0||=0,
2) ||te||
3) Il* + J
для любых векторов х, у и любого числа X. Вторая аксиома называ-
называется аксиомой абсолютной однородности нормы, третья аксиома — ак-
аксиомой неравенства треугольника.
Из аксиомы абсолютной однородности нормы следует, что для любого
ненулевого вектора х можно найти такое число X, что норма "вектора
Хх будет равна единице. Для этого достаточно взять X = |( х \\ ~1.
Вектор, норма которого равна единице, мы будем называть норми-
нормированным вектором.
Из неравенства треугольника для норм вытекает одно полезное
соотношение. Имеем || х || ^ || у || + || х — у || при любых х, у. Следова-
Следовательно, ||х|| - || у || < || х — у\\. Меняя х, у местами, находим ||;у||—
- 1И1 <ll*-.vll- Поэтому
IIMI~llv1IKII*-jl|. E2.1)
Нормированное пространство легко превратить в метрическое, если
положить
P(*»J')=ll*-yll. E2.2)
Действительно, р (х, у) = 0 означает || л* — у || = 0, что, согласно аксиоме 3,
означает х = у. Симметрия введенного расстояния очевидна. Наконец,
неравенство треугольника для расстояния является простым следствием
неравенства треугольника для нормь!. Именно,
p(^30 = ll^-yll = ll(^-^) + (^-v)IK
< ||х - z\\ + \\z ~ у\\ - р(х, z) + p(z, у).
Заметим, что
I|.v|| = P(a-, 0). E2.3)
170 ПРЕДЕЛ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 6
Метрика E2.2), определенная в линейном пространстве, обладает еще
следующими свойствами:
при любых х, у, zeX, т. е. расстояние не меняется при сдвиге
векторов, и
при любых векторах х, уеХ и любом числе X, т. е. расстояние
есть абсолютно однородная функция.
Если в метрическом линейном пространстве X какая-либо метрика
удовлетворяет этим двум дополнительным требованиям, то X хможно
рассматривать как нормированное пространство, если определить норму
равенством E2.3) для любого хеХ.
Учитывая соотношения § 29, легко установить, что линейное
пространство со скалярным произведением является нормированным
пространством. При этом нормой" вектора следует считать его длину.
Можно привести и другие примеры введения нормы. Пусть в линей-
линейном пространстве векторы заданы своими координатами относи-
относительно некоторого базиса. Если х = (xl9 хг, ..., хн), то положим
1М1,= Е 1**1' E2.4)
где р > 1. Выполнение первых двух аксиом для нормы очевидно,
выполнение третьей аксиомы следует из неравенства Минковского E1.6).
Наибольшее применение находят следующие нормы:
п / п \1/2
II*111 = EW, IMI2 = ЕЫ2 > II*H*= max \xk\. E2.5)
Вторая из этих норм часто называется евклидовой нормой и обозна-
обозначается ||.х||?.
В дальнейшем мы будем рассматривать только нормированные
пространства с метрикой E2.2). Сходимость последовательности век-
векторов в такой метрике мы будем называть сходимостью по норме,
ограниченность множества векторов — ограниченностью по-норме и т. д.
Упражнения.
1. Доказать, что существует последовательность векторов, нормы которых
образуют бесконечно большую последовательность.
2. Доказать, что для любых чисел Xt и векторов е%
It
lli=l II 1=1
3. Доказать, что если хп-*х9 у„-м;> К-+Х, то
В*. II-* 11*Ц, Хп + Уш-+х + у, Х
§ 53] СХОДИМОСТЬ ПО НОРМЕ И КООРДИНАТНАЯ СХОДИМОСТЬ 171
§ 53. Сходимость по норме и координатная сходимость
В вещественном или комплексном конечномерном линейном про-
пространстве, кроме сходимости по норме, можно ввести и другое по-
понятие сходимости. Рассмотрим пространство X и пусть еи е2, ..., еп —
его базис. Для любой последовательности {хт} векторов из X суще-
существуют разложения
хя= tUmW E3.1)
k=i
Если для вектора
*о = t &<Ч E3.2)
имеют место предельные соотношения
lim Um) = ^0) E3.3)
т -*¦ со
для всех /с = 1, 2, ..., п, то будем говорить, что имеет место коор-
координатная сходимость последовательности {хт} к вектору х0.
Координатная сходимость является вполне естественной. Если два
вектора «близки», то можно предположить, „что должны быть «близ-
«близкими» и соответствующие координаты в разложении по одному
и тому же базису. Конечномерные, нормированные пространства при-
примечательны тем, что в этих пространствах понятия сходимости по
норме и координатной сходимости эквивалентны.
Легко показать, что из координатной сходимости следует сходи-
мость по норме. Действительно, пусть имеют место предельные
соотношения E3.3). Используя аксиомы абсолютной однородности
нормы и неравенства треугольника, заключаем из E3.1), E3.2), что
Доказательство обратного утверждения существенно сложнее.
Лемма 53.1. Если в конечномерном нормированном пространстве
последовательность векторов ограничена но норме, то ограничены и
числовые последовательности всех координат в разложении векторов
по любому базису.
Доказательство. Пусть каждый вектор последовательности
{хт} представлен в виде E3.1). Введем обозначение
и докажем, что последовательность {-<?„*} ограничена.
172 ПРЕДЕЛ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. 6"
Предположим, что это не так. Тогда из нее можно выбрать бес-
бесконечно большую подпоследовательность {<тт}. Положим
1
Если
то, конечно,
» — 2-j Mk еЬ
k = l
при всех к = 1, 2, ,. •, п и всех mpi и мы получаем, что
"Zh*wl = l. E3.4)
к=Х
Последовательности {r[kip)} ограничены, так как согласно E3.4)
l*lk(p)l < 1. Следовательно, можно выбрать такую подпоследовательность
векторов {уРх}9 что подпоследовательность {г^1*} будет сходящейся,
lim лГ^тц
для некоторого числа гц. Из подпоследовательности {уР1} в свою
очередь можно выбрать подпоследовательность {уР2}, для которой
lim цр^ц2
р2-*00
для некоторого числа ri2. При этом по-прежнему
Продолжая этот процесс, мы выбираем из последовательности {ур}
такую подпоследовательность {уРп}, что будут существовать пределы
lim nf^TU E3.5)
для всех к = 1, 2, .. •, п. Согласно E3.4)
Из координатной сходимости следует сходимость по норме, поэтому
предельные соотношения E3.5) означают, что
lim ||уРп^у||= 0, E3,7)
где
§ 531 СХОДИМОСТЬ ПО НОРМЕ И КООРДИНАТНАЯ СХОДИМОСТЬ 173
Вектор у не должен равняться нулю в силу E3.6). С другой стороны^
мы имеем
II ||
так как последовательность {хт } ограничена по норме, а подпосле-
подпоследовательность {aw } — бесконечно большая. Следовательно, из E3.7)
вытекает, что || у || = 0, т. е. у есть нулевой вектор. Полученное против
воречие доказывает справедливость утверждения леммы.
Теорема 53.1. В конечномерном нормированном пространстве
из сходимости по норме вытекает координатная сходимость.
Доказательство. Пусть дана последовательность {хт} векторов,
сходящаяся по норме к вектору хо\ Очевидно, что достаточно рас-
рассмотреть случай, когда хо = 0ив последовательности {хт} нет нулевых
векторов. Представим векторы хт в виде разложений E3.1), Последова-
Последовательность векторов
1
Ут— и и хт
^ II хт II
будет ограниченной по норме и, согласно лемме 53.1, должны быть
ограничены последовательности чисел
для всех fc = 1, 2, ..., п. Так как || хт || -> 0, то это возможно только
тогда, когда ^т) -> 0 для всех к. Но это и означает, что имеет место
координатная сходимость последовательности {хт} к вектору х0.
Координатная сходимость эффективно используется в теоретических
исследованиях, в практических же приложениях удобнее пользоваться
сходимостью по норме. Это объясняется в основном тем, что при
исследовании линейных пространств большой размерности трудно
иметь дело с большим числом координатных последовательностей,
К тому же не всегда бывает известен хотя бы один базис. Но даже
если базис известен, его использование чаще всего приводит к не-
неоправданно громоздким вычислениям.
Упражнения.
1. Существенным ли является требование конечномерности пространства
при доказательстве эквивалентности двух видов сходимости?
2. Доказать, что если некоторое множество векторов конечномерного
пространства ограничено по одной норме, то оно будет ограниченным и
по любой другой норме.
3. Доказать, что если в конечномерном пространстве хп-*х по одной
норме, то хп^х по любой другой норме.
174 ПРЕДЕЛ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. б
§ 54. Полнота нормированных пространств
Конечномерные нормированные пространства являются простран-
пространствами, в которых имеют место многие аналоги утверждений, свя-
связанных с понятием предела в числовых множествах. Рассмотрим не-
некоторые из них.
Лемма 54.1. Из всякой ограниченной последовательности векторов
конечномерного нормированного пространства можно выбрать под-
подпоследовательность, сходящуюся в этом пространстве.
Доказательство. Пусть {хт} — произвольная ограниченная по
норме последовательность. Представим векторы хт в виде разложений
E3.1). Согласно лемме 53.1, будут ограничены последовательности {^т)}
для всех к — 1, 2, ..., п. Таким же способом, как при доказательстве
леммы 53.1, выберем из последовательности {хт} подпоследовательность
{х }> для которой существуют предельные соотношения yW/l) -> У0)
для всех к. Отсюда следует, что подпоследовательность {хт } сходится
по норме к вектору E3.2).
Доказанная лемма является аналогом известной леммы Больцано —
Вейерштрасса из курса математического анализа. Она имеет очень
важное значение при исследовании любых конечномерных нормирован-
нормированных пространств. Мы проиллюстрируем это доказательством некото-
некоторых утверждений.
Теорема 54.1. Любое конечномерное нормированное пространство
является полным.
Доказательство. Пусть {хт} - фундаментальная последова-
последовательность. Она ограничена. Выберем из нее сходящуюся подпоследо-
подпоследовательность {хт } и обозначим через х0 ее предел. Имеем
II *т ~ *0 II < II *т - *т„ II + || Хщ - Хо ||.
Возьмем произвольное число е > 0. Так как последовательность
{хт} — фундаментальная, то найдется такое Nl9 что || хт — хШп || < е/2
при m, mn> Nx, В силу того, что последовательность {xwj сходится
к х0, найдется такое N2, что || xw - х0 II < Ф при тп > N2. Если N
есть максимальное из чисел Nu JV2, то при т> N
Число s — произвольное. Следовательно, фундаментальная последова-
последовательность {хт} сходится по норме к вектору х0.
Лемма 54.2. Любое конечномерное подпространство Хо нормиро-
нормированного пространства X является замкнутым множеством.
Доказательство. Рассмотрим в нормированном пространстве
X конечномерное подпространство Хо. Пусть вектор хеХ является
предельной точкой для Хо. Это означает, что существует последо-
последовательность {хт} векторов из Х$, не совпадающих с х, такая, что
II хт — х || -> 0. Последовательность {хт} ограничена, следовательно, из
нее можно выбрать подпоследовательность {хт }, сходящуюся в силу
§ 54] ПОЛНОТА НОРМИРОВАННЫХ ПРОСТРАНСТВ 175
полноты Хо к некоторому вектору х0е10. Теперь имеем
|| X - Хо || < || X ~ Хтр II + II Хтр ~ *0 II ~> О,
т. е. х = х0.
Лемма 54.3. Пусть X — нормированное пространство и Хо — его
конечномерное подпространство, не совпадающее с X. Существует
нормированный вектор хфХ0 такой, что || х — х0 || > 1 для любого
вектора хоеХо.
Доказательство. Подпространство Хо не совпадает с X, по-
поэтому существует вектор х' ф Хо. Так как Хо замкнуто, то
inf || xf -xo\\=d> 0. E4.1)
Согласно определению точной нижней грани, в Хо найдется
I х хо И ^ ^ _ 2~к'
вектор x0(fc), Для которого
Последовательность {х?к)} - ограниченная. Выберем из нее подпоследова-
подпоследовательность {х0( р)}> сходящуюся в силу полноты Хо к некоторому
вектору х'оеХо. Для этого вектора, очевидно,
Их'-хЫНЛ E4.2)
.Положим
Ясно, что || х || = 1. Кроме этого, если х0 е Хо> то, согласно E4.1),
будем иметь
- х0 || =
1,1,
— х --7-XQ -
||'(' + i)||>
так как вектор х0 + dx0 принадлежит Хо.
Попутно мы доказали, что нижняя грань E4.1) достигается по
крайней мере на одном векторе х'а е Хо. В соотношении || х — х0 || > 1
равенство заведомо достигается при х0 = 0.
В заключение отметим, что лемма 54.1, играющая столь большую
роль в конечномерных пространствах, не имеет места ни в одном
бесконечномерном пространстве. Именно, справедлива
Лемма 54.4. Если из всякой ограниченной последовательности
векторов нормированного пространства X можно выбрать сходящуюся
подпоследовательность, то пространство X — конечномерное.
Доказательство. Предположим противное. Пусть пространство
X — бесконечномерное. Выберем произвольный нормированный вектор
X! и обозначим через Li его линейную оболочку. Согласно лемме 54.3,
найдется нормированный вектор х2 такой, что || хг — хх \\ > 1. Обозна-
Обозначим через L2 линейную оболочку векторов хи х2. Продолжая рассуж-
176 • ПРЕДЕЛ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ {Гл. б
дения, найдем последовательность {хп} нормированных векторов,
удовлетворяющих неравенствам || хп — хк || > 1 для всех к < п. Следова-
Следовательно, из этой последовательности нельзя выбрать ни одной сходя-
сходящейся подпоследовательности. Это противоречит условию леммы,
поэтому предположение о бесконечномерности пространства X было
неверным.
Упражнения.
1. Доказать, что плоскость в нормированном конечномерном пространстве
Является замкнутым множеством.
2. Доказать, что множество векторов х конечномерного пространства,
удовлетворяющих условию || х || < а, является замкнутым множеством.
3. Доказать, что в замкнутом ограниченном множестве векторов конечно-
конечномерного, пространства существуют векторы, на которых достигаются как
нижняя, так и верхняя грани значений любой нормы.
4. Доказать, что для любых двух норм || х || ь ||х||п в конечномерном
Пространстве существуют такие положительные числа а, р, что
для всех векторов х. Числа а, р не зависят от х.
§ 55. Предел и вычислительные процессы
В полном метрическом пространстве понятие предела широко
Используется при построении и обосновании самых различных вычис-
вычислительных процессов. Рассмотрим в качестве примера один метод
решения систем линейных алгебраиче-
алгебраических уравнений.
Пусть дана система из двух урав-
уравнений с двумя неизвестными. Будем
считать, что она совместна и имеет
единственное решение. Для простоты
изложения предположим, что все коэф-
коэффициенты — вещественные. Каждое из
уравнений
a12y=f1,
V
Рис. 55.1.
системы определяет на плоскости пря-
прямую линию. Точка М пересечения этих прямых определяет решение
системы (рис. 55.1).
Возьмем произвольную точку Мо, не лежащую ни на одной из этих
прямых на плоскости. Опустим из нее перпендикуляр на любую
прямую. Основание Мх перпендикуляра будет ближе к точке М, чем
точка Мо, так как проекция всегда меньше наклонной. Опустим затем
перпендикуляр из точки Мх на другую прямую линию. Основание Af2
этого перпендикуляра будет еще ближе к решению. Последовательно
$ 55] ПРЕДЕЛ И ВЫЧИСЛИТЕЛЬНЫЕ ПРОЦЕССЫ 177
осуществляя проектирование то на одну, то на другую прямую, мы
получим последовательность {Мк} точек плоскости, сходящуюся к точке
М. Важно отметить, что сходимость построенной последовательности
имеет место при любом выборе начальной точки Мо.
Этот пример подсказывает, как можно построить вычислительный
процесс для решения системы линейных алгебраических уравнений
общего вида D8.2). Заменим данную задачу эквивалентной задачей
нахождения векторов пересечения системы гиперплоскостей D6.9). Пред-
Предположим, что гиперплоскости содержат хотя бщ один общий вектор,
и будем считать для простоты, что линейное пространство — веще-
вещественное.
Выберем произвольный вектор v0 и спроектируем его на первую
гиперплоскость. Полученный вектор V\ спроектируем на вторую гипер-
гиперплоскость и т.д. Этот процесс определяет некоторую последователь-
последовательность {vp}. Исследуем ее.
Основным моментом вычислительного процесса является проекти-
проектирование некоторого вектора vp на гиперплоскость, заданную уравне-
уравнением D6.8). Ясно, что вектор vp+x удовлетворяет этому уравнению
и связан с вектором vp равенством
для некоторого числа t Подставив vp+i в уравнение D6.8), определим t.
Отсюда получаем, что
п.
Из этой формулы вытекает, что все векторы последовательности
{vp} лежат в плоскости, полученной путем сдвига линейной оболочки
L(nu п2, ..., /tfc) на вектор v0. Но все векторы, принадлежащие
пересечению гиперплоскостей D6.9), лежат в плоскости, полученной
путем сдвига ортогонального дополнения L1 (пи п2, ..., nfc). Существует
единственный вектор z0, принадлежащий обеим плоскостям.
Если мы докажем, что какая-нибудь подпоследовательность из {vp}
сходится к некоторому вектору, принадлежащему гиперплоскостям
D6.9), то в силу замкнутости плоскости она будет сходиться именно
к z0. При этом к вектору; z0 будет сходиться и вся последователь-
последовательность {vp}.
Для любого г векторы z0 — vr+l9 vr+x—vr ортогональны, поэтому
согласно теореме Пифагора
Р2 (*<>, vr) = р2 (z09 vr+1) + р2 (vn vr+1).
Суммируя полученные равенства по г от 0 до р — 1, находим
Р (*о> 1>о) = Р2 (^о, »р) + Z Р2 (Рп »r+i)-
178 ПРЕДЕЛ В ЛИНЕЙНОМ ПРОСТРАНСТВЕ [Гл. б
Следовательно,
р-1
? p2(vnvr+x)^p2(z0,v0l
г = 0
откуда заключаем, что
9 К ViH°- E5.1)
Обозначим через Нг гиперплоскость в r-й строке D6.9). Ясно, что
расстояние от вектора vp до Нг не больше, чем расстояние между vp
и любым вектором из Яг. Согласно построению {vp}, среди любых к
последовательных ее векторов обязательно есть вектор, принадлежащий
любой из гиперплоскостей. Используя неравенство треугольника и
предельное соотношение E5.1), получаем
р (vp, Я,) ^ р (vp, vp+1) + р (vp+u vp+2) + ... 4- р (vp+k-u vp+k)-> 0 E5.2)
для всех г = 1, 2, ..., fc.
Последовательность {ур}, очевидно, ограниченная. Выберем из нее
какую-нибудь сходящуюся подпоследовательность. Пусть она сходится
к вектору zf0. Переходя к пределу в E5.2), находим, что
p(z'o, Hr) = 0
ддя всех г = 1, 2, ..., fc. Но как уже отмечалось ранее, вектор z0
должен совпадать с z0. Следовательно, последовательность {vp} схо-
сходится к z0.
Упражнения.
1. Использовались ли по существу в проведенном исследовании понятия
полноты и замкнутости?
2. Как можно найти другие решения системы, если они существуют?
3. Как будет вести себя процесс, если система несовместна?
ЧАСТЬ II
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
ГЛАВА 7
МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
§ 56. Операторы
Важнейшим моментом в создании основ математического анализа
является введение понятия функции. Согласно определению для задания
функции необходимо указать два множества X, У вещественных чисел
и сформулировать правило, по которому каждому числу хеХ ставится
в соответствие единственное число yeY Это правило и представляет
собой однозначную функцию вещественного переменного х, заданную
на множестве X.
При реализации общей идеи функциональной зависимости совсем
не обязательно требовать, чтобы X, У были множествами веществен-
вещественных чисел. Понимая под X, Y самые различные множества элементов,
мы приходим к следующему определению, обобщающему понятие
«функции.
Правило, по которому каждому элементу х некоторого непустого
множества X ставится в соответствие единственный элемент у не-
непустого множества У, называется оператором. Результат у применения
оператора А к элементу х обозначают символами
у = А(х), у = Ах E6.1)
в говорят, что оператор А действует из X в Y или отображает X в Y.
Множество X называется областью определения оператора А. Эле-
Элемент у из E6.1) называется образом элемента х, а сам х — прообразом
элемента у. Совокупность ТЛ всех образов называется областью
значений (или образом) оператора А.. В том случае, когда каждый
элемент у е У имеет и притом только один прообраз, правило E6.1)
называется взаимно однозначным. Оператор называют также отобра-
отображением, преобразованием или операцией.
В дальнейшем мы будем рассматривать в основном лишь так
называемые линейные операторы. Их отличительные особенности
заключаются в следующем. Во-первых, областью определения линей-
линейного оператора всегда является некоторое линейное пространство или
подпространство. Во-вторых, свойства линейного опердтора тесно свя-
связаны с операциями над векторами линейного пространства. Как
180 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
правило, при изучении линейных операторов мы будем предполагать,
что пространства заданы над полем вещественных или комплексных
чисел. Если нет особой оговорки, то под словом оператор мы будем
понимать в дальнейшем именно линейный оператор. В общей теории
операторов линейные операторы играют столь же важную роль, как
прямая линия и плоскость в математическом анализе. Этим, собственно,
и определяется необходимость их подробного исследования.
Пусть заданы линейные пространства X, У над одним и тем же
полем Р. Рассмотрим оператор А, областью определения которого
является пространство X, а областью значения — некоторое множество
из У. Оператор А называется линейным, если
А (аи + ри) = аАи + $Av E6.2)
для любых векторов и, veX и любых чисел а, Ре Р.
Мы уже неоднократно встречались с линейными операторами.
Согласно (9.8) линейным оператором является величина направленного
отрезка. Его область определения представляет собой множество всех
направленных отрезков оси, область значений совпадает с множеством
всех вещественных чисел. Как следует из B1.2), линейным оператором
является изоморфное соответствие'между двумя линейными простран-
пространствами. Зафиксируем в линейном пространстве со скалярным произ-
произведением некоторое подпространство L. Мы получим два линейных
оператора, если каждому вектору пространства поставим в соответ-
соответствие либо его проекцию на подпространство L, либо перпендикуляр,
опущенный из этого вектора на L. Справедливость этого утверждения
вытекает из C0.5), C0.6).
Оператор, который каждому вектору х пространства X ставит
в соответствие нулевой вектор пространства У, является, очевидно,
линейным оператором. Он называется нулевым оператором и обозна-
обозначается символом 0. Итак,
0 = 0%.
Поставим в соответствие каждому вектору хеХ этот же вектор х.
Мы получим линейный оператор Е, действующий из X в X. Этот
оператор называется тождественным или единичным оператором.
По определению
Пусть имеется некоторый линейный оператор А, действующий
из пространства X в пространство У, Построим новый оператор В
согласно предписанию Вх = — Ах. Полученный оператор В также яв-
является линейным оператором, действующим из X в У. Он называется
оператором, противоположным Оператору А.
Зафиксируем, наконец, произвольное число а и каждому вектору
ХеХ поставим в соответствие вектор ахеХ. Построенный таким
способом оператор будет, конечно, линейным оператором. Он назы-
§ 56] ОПЕРАТОРЫ 181
вается скалярным оператором. При а = 0 мы получаем нулевой
оператор, при а = 1 - тождественный.
В ближайшее время мы укажем общий способ построения линейных
операторов, сейчас же отметим некоторые их характерные особенности*
Как следует из E6.2), имеет место соотношение
для любых векторов xt и чисел af. Отсюда, в частности, вытекает,,
что любой линейный оператор А переводит нулевой вектор в нуле*
вой, т.е.
Область значений ТА линейного оператора А есть подпространство-
пространства У. Если z = Аи, w = Av, то вектор ocz + Pw будет заведомо
образом вектора оси + fiv при любых числах а, р. Следовательно,,
вектор az + Pw принадлежит области значений оператора А. Размер-
Размерность подпространства ТА называется рангом оператора и обозначается
через гЛ.
Наряду с ТА рассмотрим множество NA векторов хеХ, удовлетво-
удовлетворяющих равенству
Ах = 0.
Это множество также является подпространством и называется ядром-
оператора А. Размерность пА ядра называется дефектом оператора А.
Ранг и дефект не являются независимыми характеристиками ли-
линейного оператора А. Пусть пространство X имеет размерность w-
Разложим его в прямую сумму
A, E6.3>
где NA — ядро оператора А, а МА — любое дополнительное под*
пространство. Возьмем произвольный вектор хеХ и представим его
в виде суммы
х = xN + хМ9
где xN e NA, хм е МА. Если у = Ах> то в силу линейности оператора А
и условия AxN — 0 получим, что
У = Ахм.
Следовательно, любой вектор из ТА имеет хотя бы один прообраз,
из МА. ^
В действительности этот прообраз в МА — единственный. Предпо-
Предположим, .что для какого-либо вектора уеТА мы имеем два прообраза
*Мэ *м е МА. Так как МА является подпространством, то х'м — х'м е МА.
Но в силу того, что х'м и х'м являются прообразами одного*
182 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
и того же вектора у, х'м — х'м е NA. Подпространства МА и NA имеют
общим лишь нулевой вектор. Поэтому х'м — х'м = 0, т. е. х'м = х'^.
Таким образом, оператор А устанавливает взаимно однозначное
соответствие между векторами подпространств ТА и МА. В силу
линейности оператора это соответствие есть изоморфизм. Поэтому
размерности ТА и МА совпадают и равны гА. Теперь из разложения
E6.3) вытекает, что
гА + пл = т. E6.4)
Отметим, что линейный оператор А устанавливает изоморфное
соответствие между подпространством ТА и любым подпространством
М4 из X, которое в прямой сумме с ядром оператора составляет
все пространство X. Поэтому можно считать, что каждый линейный
оператор А порождает целое семейство других линейных операторов.
Во-первых, это нулевой оператор, определенный на ядре NAi т. е.
действующий из NA в 0. Во-вторых, это множество линейных опе-
операторов, действующих из дополнительных к ядру подпространств МА
в подпространство ТА. Весьма важным обстоятельством является то,
что каждый из новых операторов на своей области определения
совпадает с оператором А. Если NA = 0, то МА = X и все второе
множество операторов совпадает с оператором А. Если же NA = X,
то А есть нулевой оператор. К этим вопросам мы еще вернемся.
Упражнения.
Доказать, что следующие операторы являются линейными.
1. В линейном пространстве X задан базис. Оператор А ставит в соот-
соответствие каждому вектору хеХ его координату с фиксированным номером.
2. В пространстве X со скалярным произведением фиксирован вектор х0.
Оператор А ставит в соответствие каждому вектору хеХ скалярное произ-
произведение (х, х0).
3. В пространстве V3 фиксирован вектор х0. Оператор А ставит в соот-
соответствие каждому вектору xeV3 векторное произведение [х, х0].
4. Пространство X образовано многочленами с вещественными коэффи-
коэффициентами. Оператор А ставит в соответствие каждому многочлену его к-ю про-
производную. Этот оператор называется оператором к-кратного дифференциро-
дифференцирования.
5. В пространстве многочленов, зависящих от переменной г, оператор А
ставит в соответствие каждому многочлену Р (t) многочлен t • Р (г).
6. Пространство X разложено в прямую сумму подпространств S и Т.
Представим каждый вектор хе X в виде суммы х = и + v9 где и еS, ve Т.
Оператор А ставит в соответствие вектору х вектор и. Этот оператор
называется оператором проектирования на подпространство 5 параллельно
лодпространству Т.
§ 57. Линейное пространство операторов
Зафиксируем два линейных пространства X, У над одним и тем же
полем Р и рассмотрим множество (оХу всех линейных операторов,
действующих из X в У. В множестве соху можно ввести операции
§ 57] ЛИНЕЙНОЕ ПРОСТРАНСТВО ОПЕРАТОРОВ 183
сложения операторов и умножения оператора на числа из Р, превратив
тем самым (oXY в линейное пространство.
Два оператора А, В, действующие из X в У, называются равными,
если выполняется равенство
Ах = Вх
для всех векторов хеХ. Легко проверить, что отношение равенства
операторов является отношением эквивалентности. Равенство опера-
операторов обозначают символом
А = В.
Оператор С называется суммой операторов А, В, действующих
из X в У, если выполняется равенство
Сх = Ах + Вх
для всех векторов хеХ. Сумму операторов обозначают символом
С = А + В.
Согласно определению, складывать можно любые операторы, дей-
действующие из X в У. Если А, В — линейные операторы из (oXY, то их
сумма будет также линейным .оператором из coXY. Для любых векторов
м, Del и любых чисел а, РеР мы имеем
С (оси + Pi?) = А (оси + ри) + В(ам + $v) = olAu + §Av + аВи + &Bv =
= а(Аи + Bu) + p (Av + Bv) = aCu + pCu.
Операция сложения операторов является алгебраической операцией.
Она к тому же и ассоциативная. В самом деле, пусть А, В, С —
три произвольных линейных оператора из Юуу. Тогда для любого
вектора хеХ справедливы такие равенства
((А + В) -4- С)х = (А + В)х + Сх = Ах + Вх + Сх =
= Ах + (Вх + Сх) = Ах + (В + С)х = (А + (В + С))х
Но это означает, что
(Л + В) + С = Л + (В + С).
Операция сложения операторов коммутативна. Если А, В — любые
операторы из юху, х — любой вектор из X, то
(А + В)х = Ах + Вх = Вх + Ах = (В + А) х,
т.е.
Л + В = В + А.
Теперь легко показать, что множество (oXY с введенной операцией
сложения операторов является абелевой группой. Это множество имеет
по крайней мере один нулевой элемент, например, нулевой оператор.
Каждый элемент из (oXY имеет по крайней мере один противополож-
184 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
лый, например, противоположный оператор. Все остальное следует
из теоремы 7.1.
Как вытекает из этой же теоремы, операция сложения операторов
имеет обратную операцию. Мы будем называть ее вычитанием
и пользоваться общепринятой символикой и свойствами.
Оператор С называется произведением оператора А, действующего
из X в У, на число X из поля Р, если выполняется равенство
Сх = X • Ах
.для всех векторов хеХ. Это произведение обозначают символом
С = ХА.
Произведение линейного оператора из (%у на число есть снова
линейный оператор из юхг. Действительно, для любых векторов и,
veX и любых чисел ос, fieP мы имеем
С (aw + ри) = ХА (аи + ри) = X (аАи + $Av) =
= а (Ыи) + р (XAv) = aCw + pCu.
Нетрудно убедиться, что для операций сложения операторов и
умножения оператора на число выполняются все те свойства, которые
определяют линейное пространство. Следовательно, множество (oXy
всех линейных операторов, действующих из линейного пространства X
в линейное пространство У, образует новое линейное пространство.
Отсюда вытекает, что с точки зрения операций умножения оператора
на число, сложения и вычитания операторов имеют место все правила
эквивалентных преобразований операторных алгебраических выражений.
В дальнейшем эти правила мы уже не будем оговаривать особо.
Отметим, что мы нигде не использовали связь линейных пространств
X, Y между собой. Они могут быть как различными, так и совпа-
совпадающими. Множество (оХх линейных операторов, действующих из
пространства X в то же пространство X, будет одним из основных
объектов наших исследований. Эти операторы мы будем называть
линейными операторами в X.
Упражнения.
1. Доказать, что при умножении оператора на ненулевое число его ранг
и дефект не меняются*
2. Доказать, что ранг суммы операторов не превосходит суммы рангов
слагаемых.
3. Доказать, что множество линейных операторов из со^-у, области зна-
значений которых принадлежат одному и тому же подпространству, само
образует линейное подпространство.
4. Доказать, что система двух ненулевых операторов из со^у, области
значений которых различны, линейно независима.
5. Доказать, что пространство линейных операторов, действующих в Vu
.лвляется одномерным.
§ 58] КОЛЬЦО ОПЕРАТОРОВ 185-
§ 58. Кольцо операторов
Рассмотрим три линейных пространства X, У, Z над одним и тем же
полем Р. Пусть А — оператор, действующий из X в Y, В — оператор,,
действующий из У в Z.
Оператор С, действующий из X в Z, называется произведением
оператора В на оператор А, если выполняется равенство
для всех векторов хеХ. Произведение операторов В и А обозначают
символом
Произведение линейных операторов есть снова линейный оператор.
Для любых векторов и, veX и любых чисел ос, реР мы имеем
С (ош + ри) = В (A (ош + Ри)) = В (иАи + $Av) =
= осВ (Ли) + рВ (Ли) = осСи + pCt?.
Операция умножения операторов не является алгебраической хотя
бы потому, что произведение определено не для любой пары опе-
операторов. Тем не менее, в случае выполнимости операция умножения
операторов обладает вполне естественными свойствами. Именно:
1) (АВ) С = А (ВС),
2) X (ВА) = (Щ А = В (ХА\
3) (А + В) С = АС + ВС, E8Л*
4) А (В + С) = АВ + АС
для любых операторов Л, В, С и любого числа X из Р, если,
конечно, соответствующие выражения определены.
Доказательство всех этих свойств осуществляется одинаково, по-
поэтому мы ограничимся изучением лишь первого свойства. Пусть X,
У, Z, U — фиксированные линейные пространства; А, В, С — любые
линейные операторы, где А действует из X в Y, В — из У в Z,
С-из Z в [/. Заметим прежде всего, что в равенстве 1 определены
оба оператора (АВ)С и А (ВС). Для любого вектора хеХ имеем
((АВ) С)х = АВ (Сх) = А(В (Сх)),
(А (ВС)) х = А (ВСх) = А(В (Сх)),
откуда и вытекает справедливость равенства 1.
Рассмотрим снова множество (дХх линейных операторов, действую-
действующих в пространстве X. Для любых двух операторов из (дХх опреде-
определены и сумма, и произведение. Согласно свойствам 3, 4 обе операции
связаны между собой дистрибутивным законом. Поэтому множество
(оХх линейных операторов представляет собой кольцо. Как мы покажем
186 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
в дальнейшем, кольцо операторов является некоммутативным. Ко-
Конечно, случайно может оказаться, что для какой-либо конкретной
пары операторов А, В соотношение ЛВ = В А все же выполняется.
Такие операторы мы будем называть перестановочными. В частности,
тождественный оператор перестановочен с любым оператором.
В кольце линейных операторов, как и в любом другом кольце,
произведение любого оператора на нулевой оператор есть снова
нулевой оператор. Дистрибутивным законом с умножением связана
не только сумма операторов, но и их разность. Кольцо линейных
операторов является одновременно и линейным пространством, поэтому
для разности операторов справедлива формула
Свойство 2 из E8.1) показывает связь операции умножения операто-
операторов в кольце с операцией умножения на число. Конечно, остаются
в силе и все соотношения, вытекающие из свойств линейных пространств.
Упражнения.
1. В пространстве многочленов, зависящих от переменной t, обозначим
через D оператор дифференцирования, через Т — оператор умножения на t.
Доказать, что DT^TD. Найти оператор DT-TD.
2. Зафиксируем некоторый оператор В из пространства ®хх- Доказать,
что множество операторов А, для которых В А = 0, образует подпространство
в &хх.
3. Доказать, что ранг произведения операторов не выше ранга каждого
из сомножителей.
4. Доказать, что дефект произведения операторов не меньше дефекта
^каждого из сомножителей.
5. Доказать, что в кольце соХх линейных операторов есть делители нуля.
§ 59. Группа невырожденных операторов
Линейные операторы, действующие в пространстве X, образуют
абелеву группу по сложению. Но среди таких операторов можно
указать множества, представляющие собой группы по умножению.
Эти группы связаны с так называемыми невырожденными операторами.
Оператор, действующий в линейном пространстве, называется не-
невырожденным, если его ядро состоит только из нулевого вектора.
Оператор, не являющийся невырожденным, называется вырожденным.
Невырожденными будут, например, тождественный одератор и ска-
скалярный оператор, если только он не является нулевым. Иногда
с оператором А, действующим в пространстве X, можно связать
некоторый невырожденный оператор даже в том случае, когда А —
вырожденный. Действительно, пусть ТА — область значений оператора
A, a NA — его ядро. Если ТА и NA не имеют общих ненулевых
.векторов, то, согласно E6.4), имеем
X = NA + Тл.
§ 59] ГРУППА НЕВЫРОЖДЕННЫХ ОПЕРАТОРОВ 187
Как уже отмечалось, оператор А порождает множество других опе-
операторов, действующих из любого подпространства, дополнительного
яе ядру NA, в подпространство значений ТА. В рассмотренном случае
оператор А порождает оператор, действующий из ТА в ТА. Этот
оператор будет невырожденным, так как он переводит в нуль лишь
нулевой вектор из ТА,
Невырожденные операторы обладают многими примечательными
особенностями. Для таких операторов дефект равен нулю, поэтому
из формулы E6.4) следует, что ранг невырожденного оператора
совпадает с размерностью пространства. Если невырожденный опера-
оператор А действует в пространстве X, то область значений ТА совпадает
с X, Таким образом, каждый вектор из X является образом некоторого
вектора из X. Это свойство невырожденного оператора эквивалентно
его определению.
Важным свойством невырожденного оператора является единствен-
единственность прообраза для любого вектора пространства. В самом деле,
предположим, что для некоторого вектора у существуют два прообраза
м, v. Это означает, что
Аи — у, Av = у.
Но тогда
А (и - v) = 0.
Согласно определению невырожденного оператора, ядро состоит только
из нулевого вектора. Поэтому и — v = О, т. е. и = v. Доказанное свойство
также эквивалентно определению невырожденного оператора. По су-
существу оно уже отмечалось в § 56.
Произведение любого конечного числа невырожденных операторов
есть также невырожденный оператор. Очевидно, что достаточно дока-
доказать это утверждение для двух операторов. Пусть А, В — любые
невырожденные операторы, действующие в одном и том же простран-
пространстве X. Рассмотрим уравнение
ВАх = 0. E9.1).
Согласно определению умножения операторов, это уравнение означает,
что
Оператор В — невырожденный, поэтому из последнего уравнения сле-
следует, что Ах = 0. Но А также является невырожденным оператором,
поэтому отсюда вытекает, что х = 0. Итак, уравнению E9.1) удовлет-
удовлетворяет только нулевой вектор, т. е. оператор В А — невырожденный.
Сумма невырожденных операторов уже не обязательно будет не-
невырожденным оператором. Если А — невырожденный оператор, то
невырожденным будет и оператор (— Х)А. Но сумма этих операторов
есть нулевой оператор, который является вырожденным.
188 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
Рассмотрим множество невырожденных операторов, действующих
в одном и том же линейном пространстве. На этом множестве
операция умножения операторов является алгебраической и к тому же
ассоциативной. К невырожденным операторам относится и тождествен-
тождественный оператор Е, который играет роль единицы. Действительно, легко
проверить, что для любого оператора А, действующего в простран-
пространстве X,
АЕ = ЕА = А.
Если мы покажем, что для любого невырожденного оператора А
существует такой невырожденный оператор, который в произведении
с А дает тождественный, то это будет означать, что множество всех
невырожденных операторов образует группу по умножению.
Пусть А — невырожденный оператор. Как мы знаем, для каждого
вектора уеХ существует один и только один вектор хеХ, связанный
с у соотношением
у = Ах. E9.2)
Следовательно, каждому вектору уеХ можно поставить в соответ-
соответствие единственный вектор хеХ, для которого у является его образом.
Построенное соответствие есть некоторый оператор. Он называется
оператором, обратным к оператору А, и обозначается символом Л.
Если имеет место равенство E9.2), то
х = А~ху. E9.3)
Докажем, что обратный оператор является линейным и невырожден-
невырожденным.
Произведение определено для любых операторов, а не только ли-
линейных. Поэтому из определения обратного оператора вытекает, что
А-1А = АА~1 = Е. ' E9.4)
Для доказательства этих равенств достаточно применить к обеим
частям E9.2) оператор Л, а к обеим частям E9.3) — оператор А.
Возьмем любые векторы и, veX и любые числа а, реР и рас-
рассмотрим вектор
z = А~х (aw + $v) - аА~хи - $А~Н.
Применим теперь к обеим частям равенства оператор А. Учитывая
линейность оператора А и соотношения E9.4), заключаем, что Az = 0.
Так как оператор А — невырожденный, то это означает, что z = 0,
Следовательно,
А (аи + ри) = аА~хи + §А~\
т.е. оператор А'1 —линейный.
Легко показать, что оператор Л — невырожденный. Для любого
вектора у из ядра оператора А имеем
$ 59] ГРУППА НЕВЫРОЖДЕННЫХ ОПЕРАТОРОВ 189
Применим к обеим частям этого равенства оператор А. Так как А —
линейный оператор, то АО = 0. Учитывая соотношения E9.4), мы
заключаем, что у = 0. Итак, ядро оператора А состоит только из
нулевого вектора, т.е. А'1 —невырожденный оператор.
Таким образом, множество невырожденных операторов представляет
собой группу по умножению. Несколько позднее мы покажем, что
эта группа — некоммутативная..
С помощью невырожденных операторов можно построить и ком-
коммутативные группы. Пусть Л— произвольный оператор, действующий
в пространстве X. Для любого целого положительного числа р опре-
определим р-ю степень оператора А равенством
АР=А-А ... Ау E9.5)
где в правой части содержится р сомножителей. В силу ассоциатив-
ассоциативности операции умножения оператор Ар определяется однозначно.
Конечно, этот оператор является линейным.
Для любых целых положительных чисел р, г из E9.5) следует, что
АрАг = Ар+Г. E9.6)
Если по определению считать, что
А0 = Е
для любого оператора А, то формула E9.6) будет иметь место для
любых целых неотрицательных чисел р, г.
Предположим, что А — невырожденный оператор, тогда для любого
неотрицательного г будет невырожденным и оператор А\ Следова-
Следовательно, для него существует обратный оператор. Согласно формулам
G.2), E9.5) имеем
л
(AT1 =(^Г = А~ХА^Х ... А~\ E9.7)
Будем также по определению считать, что
Принимая во внимание формулы E9.5), E9.7) и учитывая, что АА =
— А~1А, нетрудно доказать соотношение
АРА~Г = А~ГАР
для любых целых неотрицательных р, г. Это означает, что формула
{59.6) имеет место для любых целых чисел р, г.
Возьмем теперь невырожденный оператор А и составим множество
¦Фл операторов вида Ар для всех целых р. На этом множестве опера-
операция умножения операторов является алгебраической и, как следует
из E9.6),- коммутативной. Каждый оператор Ар имеет обратный,
равный А"р. В множестве (оА входит и тождественный оператор Е.
190 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
Следовательно, множество юА представляет собой коммутативную
группу по умножению. Эта группа называется циклической группой,,
порожденной оператором А.
Упражнения. -
1. Доказать, что если для двух линейных операторов А, В из ыхх
выполняется соотношение АВ =.Е, то оба оператора — невырожденные.
2. Доказать, что для того, чтобы операторы А, В из ыХх были невы-
невырожденными, необходимо и достаточно, чтобы были невырожденными опера*
торы АВ и В А.
3. Доказать, что если оператор А — невырожденный и число а^О, то-
оператор си А — также невырожденный и (а./!) = — А'1,
а
4. Доказать, что Тд с JV^ тогда и только тогда, когда А2 = 0.
5. Доказать, что для любого оператора А выполняются соотношения
6. Доказать, что оператор Р является оператором проектирования тогда
и только тогда, когда Р2 = Р. Что представляют собой подпространства
NP и 7>?
7. Доказать, что если Р есэгь оператор проектирования, то Е — Р также
является оператором проектирования.
8. Доказать, что если оператор А удовлетворяет равенству Ат = 0 для
какого-либо целого положительного числа т, то оператор аЕ — А является
невырожденным при любом числе ос Ф 0.
9. Доказать, что линейный оператор А, для которого Е + си^А + ol2A2 + ..»
... + апАп = 0, является невырожденным.
10. Доказать, что если А — невырожденный оператор, то либо все опера-
операторы в циклической группе (оА различны, либо некоторая степень оператора А
совпадает с тождественным оператором.
§ 60. Матрица оператора
Рассмотрим один общий способ построения линейного оператора,
действующего из m-мерного пространства X в n-мерное пространство У.
Пусть векторам базиса еи е2, ..., ет пространства X поставлены в
соответствие какие-то векторы fu /2, ..., fm пространства У.
Тогда существует и единствен линейный оператор А, действующий
из X в У, который переводит каждый вектор ек в соответствующий
вектор fk.
Предположим, что искомый оператор А существует. Возьмем
произвольный вектор хеХ и представим его в виде разложения
Тогда
Правая часть соотношений однозначно определяется вектором х и
§ 60] МАТРИЦА ОПЕРАТОРА 191
образами базиса. Поэтому полученное равенство доказывает единст-
единственность оператора А, если он существует. С другой стороны, мы можем
определить оператор А именно этим равенством, т. е. положить
Полученный оператор, как легко проверить, является линейным опера-
оператором, действующим из X в У и при этом переводящим каждый
вектор ек в соответствующий вектор fk. Область значений ТА опе-
оператора А совпадает с линейной оболочкой системы векторов/ь/2, ...
• • • j / m*
Теперь мы можем сделать важный вывод: линейный оператор А,
действующий из пространства X в пространство У, полностью опре-
определяется совокупностью образов
Аеи.Аеъ ..., Ает
любого фиксированного базиса
еи е29 ..., ем
пространства X.
Фиксируем в пространстве X базис еи еъ ..., ет и в пространстве
У базис qu q2, ..., qn. Вектор е± переводится оператором А в не-
некоторый вектор Ае± пространства У, который, как всякий вектор
этого пространства, можно разложить по базисным векторам
- Ле± = Яц^! 4- a2iq2 + ... + anlqn.
Аналогично
Ае2 = a12qi + a22q2 + ... + an2qn9
Коэффициенты atj этих соотношений определяют матрицу Aqe из п строк
м т столбцов,
!ait ai2 ... aim^
a2t a22 .»• aim
1 ^«2 •¦• «Ш
которая называется матрицей оператора А в выбранных базисах.
Столбцами матрицы оператора служат координаты векторов Аеи
Аеъ ..., Ает относительно базиса ql9 q2, ..., qn. Для того чтобы
определить элемент atJ матрицы оператора А, следует применить
«оператор к вектору ej и у образа Ае3 взять йю координату. Если
яерез {х}г обозначить для краткости ню координату вектора х, то
192 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
щ- = {Aej}i. Этим способом определения элементов матрицы оператора
мы в дальнейшем воспользуемся.
Рассмотрим произвольный вектор хеХ п его образ у — Ах. Выяс-
Выясним, как выражаются координаты вектора у через координаты вектора
х и элементы матрицы оператора. Пусть
F01)
Вычисляем
/ т \ т т п п / т
Ах = A Z 5а = Е %JAeJ = E 5j S <ад = Е ( Е
Сравнивая правую часть этих равенств с разложением F0.1) для вектора
у, мы заключаем, что должны выполняться равенства
m
Е
для i = I, 2, ..,, п, т. е.
Таким образом, каждый линейный оператор при фиксированных
базисах в пространствах X, У порождает соотношения F0.2), связываю-
связывающие координаты образа и прообраза. Для того чтобы по координатам
прообраза определить координаты образа, достаточно вычислить левые
части этих соотношений. Для определения координат прообраза по
известным координатам вектора у приходится решать систему линейных
алгебраических уравнений F0.2) относительно неизвестных ?ь ^2> •••> ?*•
Матрица этой системы совпадает с матрицей оператора.
Соотношения F0.2) устанавливают глубокую связь линейных опера-
операторов с системами линейных алгебраических уравнений. В частности,
из F0.2) следует, что ранг оператора совпадает с рангом матрицы
оператора, размерность ядра совпадает с числом фундаментальных
решений приведенной однородной системы. Из этого факта тривиально
вытекает формула E6.4) и ряд других.
К связи систем линейных алгебраических уравнений и линейных
операторов мы будем обращаться довольно часто. Но вначале докажем,
что между операторами и матрицами, которые, собственно, и определяют
системы вида F0.2), существует взаимно однозначное соответствие.
Мы уже показали, что каждый оператор А при фиксированных
базисах определяет некоторую матрицу Aqe. Возьмем теперь произ-
§ 60] МАТРИЦА ОПЕРАТОРА 193
вольную матрицу Аяе размеров п х т. При фиксированных базисах
в пространствах X, У соотношения F0.2) ставят в соответствие каж-
каждому вектору хеХ некоторый вектор yeY. Легко проверить, что это
соответствие есть линейный оператор. Построим матрицу данного опера-
оператора в тех же базисах. Все координаты вектора е-3 равны нулю,
за исключением j-й координаты, которая равна единице. Из F0.2)
вытекает, что координаты вектора Ае3- совпадают с элементами j-ro
столбца матрицы Aqe и поэтому {Ае3)г — aVy Следовательно, матрица
построенного оператора совпадает с исходной матрицей Aqe.
Итак, каждая п х m-матрица является матрицей некоторого линей-
линейного оператора, действующего из m-мерного цространства X в и-мерное
пространство У, при фиксированных базисах в этих пространствах.
Тем самым между линейными операторами и прямоугольными
матргщами устанавливается взаимно однозначное соответствие при
любых фиксированных базисах. При этом, конечно, и линейные про-
пространства, и матрицы рассматриваются над одним и тем же полем Р.
Рассмотрим некоторые примеры. Пусть 0 — нулевой оператор.
Имеем
Следовательно, все элементы матрицы нулевого оператора, равны нулю.
Такая матрица называется нулевой и обозначается символом 0.
Возьмем теперь тождественный оператор Е. Для этого оператора
находим
г'., если i = j,
[), если \ф].
Поэтому матрица тождественного оператора имеет следующий вид.
Это есть квадратная матрица, на главной диагонали которой стоят
единицы, а в остальных местах - нули. Матрица тождественного"
оператора называется единичной и обозначается буквой Е.
Мы будем довольно часто иметь дело с еще одним типом матриц.
Пусть ,Хи Х29 ..., Хп — произвольные числа из поля Р. Построим
квадратную матрицу Л, у которой эти числа стоят на главной
диагонали, а в остальных местах стоят нули, т. е.
о \
0 \/
Матрицы такого вида называются диагональными. Если все диагональные
элементы равны между собой, то матрица называется скалярной.
В частности, единичная матрица является скалярной. Диагональными мы
7 В. В. Воеводин '
194 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ . [Гл 7
будем называть и прямоугольные матрицы, построенные аналогичным
способом. Если обратиться к соотношениям F0.2), легко установить,
в чем заключается действие линейного оператора с матрицей Л. Этот
оператор «растягивает» i-ю координату любого вектора в Xt раз для всех L
Упражнения.
1. В пространстве многочленов степени не выше п фиксирован базис 1,
t, t2, ..., t". Какой вид имеет в этом базисе матрица оператора диффе-
дифференцирования?
2. В пространстве X задан оператор Р проектирования на подпространство
S параллельно подпространству Т. Фиксируем в X любой базис, составленный
как объединение базисов подпространств S и Т. Какой вид имеют в этом
базисе матрицы операторов Р и Е — Р?
3. Пусть линейный оператор А действует из X в У Обозначим через
МА подпространство в X, дополнительное к ядру NAi через RA — подпро-
подпространство в У, дополнительное к ТА. Как будет меняться матрица оператора А9
если при выборе базисов в X, У использовать базисы из некоторых или всех
указанных подпространств?
§ 61. Операции над матрицами
Как мы показали, каждый линейный оператор при фиксированных
базисах в пространствах однозначно определяется своей матрицей.
Поэтому рассмотренные ранее операции над операторами приводят
к вполне определенным операциям над матрицами. В интересую-
интересующих нас сейчас вопросах выбор базиса не играет никакой роли, поэтому
операторы и их матрицы мы будем обозначать одними и теми же
буквами без каких-либо индексов, относящихся к базисам.
Пусть из m-мерного пространства X в и-мерное пространство У
действуют два равных оператора. Так как равные операторы во всех
ситуациях проявляют себя одинаково, то они будут иметь одну и
ту же матрицу. Это дает основание для следующего определения.
Матрицы А9 В одинаковых размеров п х m с элементами aij9 btj
называются равными, если
<hj = hi
для i = l, 2, ..., и, j = 1, 2, ..., m. Равенство матриц обозначается
символом А = В
Предположим теперь, что из пространства X в пространство У
действуют два оператора А, В* Рассмотрим оператор С — А Л-В.
Обозначим элементы матриц этих операторов соответственно через
ctj, aij9 by. Согласно сказанному ранее, ctj = {Ce$t. Учитывая определение
суммы операторов и свойства координат векторов по отношению
к операциям над ними, получим
сц = {Cej}i = Р + B)ej)i = iAeJ
§ 61] ОПЕРАЦИИ НАД МАТРИЦАМИ 195
Поэтому:
Суммой двух матриц А9 В одинаковых размеров п х т с элементами
aij9 Ъц называется матрица С тех же размеров с элементами cij9 если
си = ац + Ьи
для z = l, 2, ..., и, j=l, 2, ...^ m. Сумма матриц обозначается
символом С = А + В
Разностью двух матриц А9 В одинаковых размеров n x тс элементами
aij9 btj называется матрица С тех же размеров с элементами cij9
если j
для i = 1, 2, ..., n9 j = 19 29 ..., m. Разность матриц обозначается
символом
С = А-В.
Рассмотрим оператор А9 действующий из X в У, и оператор
С = ХА для некоторого числа X. Если afj-, c^- суть элементы матриц
этих операторов, то
и мы приходим к такому определению:
Произведением матрицы А размеров n x m с элементами atj на
число X называется матрица С тех же размеров с элементами cij9 если
для i = l, 2, ..., п, j = l, 2, ..., т. Произведение матрицы на
число обозначается символом
Пусть заданы m-мерное пространство X и и-мерное пространство
Унад одним и тем же полем Р. Как было доказано ранее, при фиксиро-
фиксированных базисах в Х9 У между множеством <%у всех операторов, дей-
действующих из X в У, и множеством всех матриц размеров n x m
с элементами из поля Р имеет место взаимно однозначное соответствие.
Так как операции над матрицами вводились в соответствии с опера-
операциями над операторами, то множество n x m-матриц, как и множество
(oXY> представляет собой линейное пространство.
Легко указать один из базисов пространства матриц. Им будет,
например, система матриц А{кр) для /с = 1, 2, ...9 п9 р = 1, 2, ..., т9
где элементы a\jp) матрицы А{кр) определяются такими равенствами:
1' если i==zk>i = P>
0 в остальных случаях,
196 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
В пространстве соХу базисом будет служить система операторов с
матрицами А{кр\ Отсюда мы заключаем, что линейное пространство
операторов, действующих из X в Y, есть конечномерное пространство
и его размерность равна произведению тп.
Предположим, что заданы три линейных пространства X, У, Z
и оператор А действует из!в У, В — из У в Z. Пусть размерности
пространств равны соответственно т, п, р. Будем считать, что в
X, У, Z фиксированы базисы еи ..., ет, qu ..., qn, rb ..., гр.
Оператор А имеет п х m-матрицу с элементами aij9 при этом
п
Aej = Е а*Яв-
s=l
Оператор В имеет р х n-матрицу с элементами bij9 при этом
р
Bqs = S fofc/fc-
Исследуя матрицу оператора С = ВА, мы заключаем, что она должна
иметь размеры р х т, а ее элементы с^- будут такими:
= { Е <hjBqs\ = \ Е a,j Е Ъъ/\ = | Е ( Е Ьь^ К[ = Е *w
U=l Jf (.5=1 k=l J; (t=lV=l / Ji 4=1
Полученная формула подсказывает нам следующее определение.
Произведением матрицы В размеров р х п с элементами hVi и
матрицы А размеров пхт с элементами аи называется матрица С
размеров р х m с элементами cij9 если
п
<Ч/= Е bisasj F1-1)
s=l
для i = l, 2, ..., р, 7 = 1, 2, ..., т. Произведение матриц обозна-
обозначается символом г — ПА
Таким образом, произведение определено лишь для тех матриц,
у которых число столбцов левого сомножителя равно числу строк
правого сомножителя. Элемент матрицы произведения, стоящий на
пересечении i-й строки и ;-го столбца, равен сумме произведений
всех элементов i-й строки левого сомножителя на соответствующие
элементы ;-го столбца правого сомножителя.
Напомним еще раз, что между линейными операторами и матри-
матрицами имеет место взаимно однозначное соответствие. Операции над
матрицами вводились согласно операциям над операторами. Поэтому
§ 61] ОПЕРАЦИИ НАД МАТРИЦАМИ 197
операция умножения матриц связана соотношениями E8.1) с операциями
сложения матриц и умножения матрицы на число.
Мы уже отмечали, что кольцо операторов и группа всех невырож-
невырожденных операторов, действующих в линейном пространстве, являются
некоммутативными. Для доказательства этого утверждения, очевидно,
достаточно найти две квадратные матрицы А, В такие, что АВ Ф ВА.
Возьмем, например,
Вычисляем:
и некоммутативность умножения доказана.
Операция умножения матриц позволяет удобно записывать соотно-
шения типа F0.2). Обозначим через хе матрицу размеров т х 1, со-
составленную из координат вектора х, через yq — матрицу размеров nxl,
составленную из координат вектора у. Тогда соотношения F0.2)
будут эквивалентны одному матричному равенству
yr F1.2)
Оно называется координатным равенством, соответствующим оператор-
операторному равенству
А
и связывает в матричной форме координаты прообраза и образа
через матрицу оператора.
Важно отметить, что координатное и операторное равенство с
точки зрения символики выглядят совершенно аналогично, если, конечно,
опустить индексы и символ Ах понимать как произведение А на х.
Так как символика и свойства операций над матрицами и операторами
совпадают, то любое преобразование операторного равенства приводит
к такому же преобразованию координатного равенства. Поэтому с
формальной точки зрения безразлично, иметь ли дело с матричными
или операторными соотношениям^.
В дальнейшем мы по существу не будем делать различия между
операторными и координатными равенствами. Более того, все
новые понятия и факты, имеющие место в отношении операторов, мы
как правило, без особой оговорки будем распространять и на матрицы.
Упражнения.
J, Доказать, что операции над матрицами связаны с операцией транспо-
транспонирования следующими соотношениями:
= ей', (А + ВУ « 4' + В\
{AB)f « &А', (А1)' * А,
198 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
2. Доказать, что каждый линейный оператор ранга г можно представить
в виде суммы г линейных операторов и нельзя представить в виде суммы
меньшего числа операторов ранга 1.
3. Доказать, что матрица размеров п х т имеет ранг 1 тогда и только
тогда, когда она может быть представлена в виде произведения двух
ненулевых матриц размеров п х 1 и 1 х т.
4. Пусть для фиксированных матриц Л, В выполняется равенство
АС = ВС
для любой матрицы С. Доказать, что А = В.
5. Найти общий вид квадратной матрицы, перестановочной с заданной диаго-
диагональной матрицей.
6. Доказать, что для того, чтобы матрица была скалярной, необходимо
и достаточно, чтобы она была перестановочна со всеми квадратными мат-
матрицами.
7. Сумма диагональных элементов матрицы А называется следом матрицы
А и обозначается tr А. Доказать, что
tr Л = tr A', tr(a^) = oc-tr,4,
tr (А + В) = tr A + tr В, tr (ВА) = tr (AB).
8. Доказать, что вещественная матрица А равна нулю тогда и только
тогда, когда tv(AA') = 0.
§ 62. Матрицы и определители
Матрицы играют весьма существенную роль в исследовании
линейных операторов. При этом в качестве вспомогательного средства
исследования нередко используется определитель. Мы рассмотрим
сейчас некоторые вопросы, связанные с матрицами и определителями.
Пусть невырожденный оператор А действует в пространстве X.
Его ранг совпадает с размерностью X. Как вытекает из формул
F0.2), это означает, что ранг системы столбцов матрицы оператора
совпадает с их числом. Это возможно тогда и только тогда, когда
определитель матрицы оператора отличен от нуля. Итак,
Оператор, действующий в линейном пространстве будет невырожден-
невырожденным тогда и только тогда, когда определитель его матрицы отличен
от нуля.
Полученное свойство невырожденного оператора дает основание для
следующих определений.
Квадратная матрица называется невырожденной, если ее определитель
отличен от нуля, и вырожденной в противном случае.
Конечно, опираясь на соответствующие свойства невырожденных
операторов, мы можем сказать, что произведение невырожденных
матриц есть снова невырожденная матрица, все невырожденные матрицы
образуют группу по умножению, каждая невырожденная матрица по-
порождает циклическую группу и т. д. Связь с невырожденными опе-
операторами позволяет утверждать, что каждая невырожденная матрица А
§62]
МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ
199
имеет, и притом единственную, матрицу А'1 такую, что
А~1А = АА~1 = Е. F2.1)
Матрица А'1 называется обратной к матрице А.
Используя понятие определителя, можно указать явный вид элементов
обратной матрицы через миноры матрицы А, Основой решения этого
вопроса служат формулы D0.5) - D0.9). Учитывая формулу F1.1) для
элемента произведения двух матриц, мы заключаем, что уравнениям
F2.1) удовлетворяет матрица
АЛ Л \
-^11 -^21 лт1 \
d
А12
d
Aim
d
>А22
d
л2т
"* d
лт2
"' d
А
¦Я-тт
d d
Здесь d — определитель матрицы А; А у — алгебраическое дополнение
ее элемента aiy В силу единственности обратной матрицы она может
иметь только такой вид.
Введем сокращенные обозначения для миноров произвольной мат-
матрицы А. Минор, расположенный в строках iu \ъ ..., ip и столбцах
Зи Ji> • • • 9 Зру будем обозначать
Hi Z*2> •••>
При этом будем дополнительно считать, что совпадение каких-либо
индексов в верхней (нижней) строке в обозначении минора озна-
означает, что совпадают между собой соответствующие строки (столбцы)
самого минора.
Теорема 62.1 (формулаВине — Коши). Пусть квадратная матрица
С порядка п равна произведению двух прямоугольных матриц А и В со-
соответственно размеров п х т и т х п, причем т^п. Тогда
1 2
1 2
I
Доказательство. Обозначим через аи, btj, ctj элементы матриц
А, В, С. Согласно определению произведения матриц имеем
Подставляя вместо элементов матрицы С их выражения и используя
свойство линейности определителя в отношении векторов-столбцов,
2Q<[) МАТРИЦЫ « ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
находим
<62'3)
Каждый из индексов s1? s2, ..., 5Я не зависит от других и может
принимать любые значения от 1 до ш, поэтому полученное выражение
представляет собой сумму тп слагаемых. В этой сумме будут равны
нулю те слагаемые, у которых значения хотя бы двух индексов
равны между собой, так как будут равны нулю соответствующие
миноры матрицы А. Все остальные слагаемые можно разбить на
группы по п\ слагаемых в каждой, объединяя в одну группу все те
слагаемые, значения индексов которых образуют одну и ту же сово-
совокупность чисел.
Обозначим через ки к2, ...,&„ упорядоченное в порядке возрастания
расположение значений индексов su s2, ..., sn. Пусть
z(sx, s2, ..., 5„) = (-1)лг,
где N чэеть чжшо транспозиций, необходимых для преобразования
л&рестанобки su s2, .--^sn к перестановке ки к2, ..., кп. Тогда в
§ 62] МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ 201
пределах одной группы значений индексов su s2> ..., sn сумма со-
соответствующих слагаемых из F2.3) будет равна
1 2 ... n\Jkt k2 ... ft,
\l 2 ... n
Из полученного соотношения и вытекает формула F2.2).
Следствие. Определитель произведения двух квадратных матриц
равен произведению определителей сомножителей.
Сумма в формуле F2.2) будет состоять в данном случае из
одного слагаемого. Поэтому
2 ...,Л_ Л 2...Л /Г2.../Л
l2...n)-A{l2... n)B[l2...n)
или, что то же самое,
det С = det Л-det Б.
Следствие. Пусть квадратная матрица С порядка п равна произве-
произведению двух прямоугольных матриц Л и В соответственно размеров
п х т и т х п, причем т < п. Тогда det С = 0.
Действительно, добавим к матрицам А и В по п — т нулевых по-
последних столбцов и, соответственно, строк. Полученные матрицы станут
квадратными порядка и и их определители будут равны нулю. Про-
Произведение этих матриц дает матрицу С. Поэтому согласно первому
следствию det С = 0.
Упражнения.
1. Доказать, что для любой невырожденной матрицы А справедливо равен-
равенство (А-1)'^{А')-\
2. Доказать, что для любой невырожденной матрицы А справедливо ра-
равенство det (A-1) = (det A)~ К
3. Доказать, что для любой квадратной матрицы А порядка и спра-
справедливо равенство det (сиА) = а" • det A.
4. Доказать, что если для квадратных матриц А, В выполняется ра-
равенство АВ — Е, то А — невырожденная и В = А~1.
5. Написать формулу типа F2.2) для произвольного минора произведения
двух матриц.
6. Доказать, что для любой вещественной матрицы А все главные
миноры матриц А'А и АА' неотрицательны.
7. Доказать, что ранг произведения матриц не выше ранга каждого из
сомножителей.
8. Доказать, что при умножении на невырожденную матрицу ранг не
ется.
202 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
§ 63. Переход к другому базису
При фиксированных базисах в пространствах координатное равенство
позволяет полностью исследовать действие линейного оператора. Оче-
Очевидно, что это исследование осуществляется тем эффективнее, чем
проще вид матрицы оператора. В общем случае матрицы опера-
операторов зависят от базисов и выяснение этой зависимости явля-
является нашей ближайшей задачей.
Пусть еъ е2, ..., ет и /ь /2, ..., /ш - два базиса одного и того
же m-мерного пространства X. Векторы /ь /2, ..., fm однозначно
определяются своими разложениями
fl = Pi 2^1 + P22^2 + • • • + Pml^my
- F3.1)
fm = Pl»A + Vlvfil + • • • + Pinn^m
по векторам еъ е2, ...,-ет. Коэффициенты pti определяют матрицу
Pll Pl2 •- Plm
p = I P21 P22 ••• P2m
Pml Pml
Эта матрица называется матрицей преобразования координат при
переходе от базиса еъ е2, ..., ет к базису /ь /2, ...,/,„.
Возьмем произвольный вектор хе! и разложим его по векторам
обоих базисов. Пусть
Согласно F3.1) имеем
»* та m ш /а / m \ т / т
Сравнивая коэффициенты при ef в левой и правой частях полученных
соотношений, находим
m
?>i = 2] РуП./ F3.2)
7=1
для г = 1, 2, ..., т. Эти формулы называются формулами преобразо-
преобразования координат. Обозначим, как прежде, через хе и xf матрицы
размеров т х 1, составленные из координат вектора х в соответствую-
§ 63] ПЕРЕХОД К ДРУГОМУ БАЗИСУ 203
щих базисах. Формулы F3.2) показывают, что
хе = Pxf. F3.3)
Матрица преобразования координат должна быть невырожденной,
так как в противном случае будет иметь место линейная зависимость
между ее столбцами и, следовательно, между векторами /ь /2, ..., /ш.
Конечно, любая невырожденная матрица является матрицей некоторого
преобразования координат, определяемого равенством F3.3). Умножая
равенство F3.3) слева на матрицу Р, получим
Пусть теперь в линейном пространстве X заданы три базиса
^ь •••> ет, /ь •••> /ж и гъ ..., rm. Переход от первого базиса к
третьему можно осуществить двумя способами: либо непосредственно
от первого к третьему, либо сначала от первого ко второму, а затем
от второго к третьему. Нетрудно установить связь между соответст-
соответствующими матрицами преобразования координат. Согласно F3.3) имеем:
хе — Pxj, Xj- = Rxn xe = Sxr.
Из первых двух соотношений вытекает
xe = Pxf = P(Rxr) = (PR)xn ,
откуда следует, что
5» = PR.
Таким ''образом, при последовательном выполнении преобразований
координат матрица результирующего преобразования будет равна
произведению матриц составляющих преобразований.
Снова рассмотрим линейный оператор А9 действующий из X в У.
Выберем в пространстве X два базиса el9 ..., ет и /ь ..., /w, а в
пространстве Y два базиса ql9 ..., q^ и tu •••> *л« Одному и
тому же оператору А в первой паре базисов соответствует координатное
равенство
y Ax F3.4)
а во второй паре базисов
^ = А,/х/. F3.5)
Соответственно этим парам базисов для одного и того же оператора А
мы имеем две матрицы Aqe и Atf.
Обозначим через Р матрицу преобразования координат при переходе
от базиса el9 ..., ет к базису fl9 ..., fm, через Q — матрицу пре-
преобразования координат при переходе от ql9 ..., qn к tl9 ...ч, tn.
Имеем
xe = Pxf, yq = Qyt. F3.6)
204 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 1
Подставляя эти "выражения для xei yq в F3.4), находим
Qyt« AqePxf,
откуда следует
У (й
Сравнивая полученное равенство с F3.5), заключаем, что
F3.7)
Это и есть искомое соотношение, связывающее матрицы одного и
того же оператора в разных базисах.
Упражнения.
1. Доказать, что при переходе к другим базисам ранг матрицы опера-
оператора не меняется.
2. Доказать, что определитель матрицы оператора, действующего в линей-
линейном пространстве, не зависит от выбора базиса.
3. Какое соответствие можно установить между невырожденными операто-
операторами, действующими в пространстве А", и преобразованиями координат в
том же пространстве?
4. Назовем два базиса одного вещественного пространства одноименными,
если определитель их матрицы преобразования координат — положительный.
Доказать, что все базисы можно разбить на два класса одноименных ба-
базисов.
5. Назовем один класс одноименных базисов левым, второй — правым.
Сравнить эти классы с описанными в § 34.
§ 64 Эквивалентные и подобные матрицы
Каждому, линейному оператору А, действующему из пространства
X в пространство У, соответствует множество его матриц, определяе-
определяемое возможностью выбора различных базисов в X и У. Строение
этого множества будет существенно различным, в зависимости от того,
совпадает 1с У или не совпадает.
Две прямоугольные матрицы А и В одинаковых размеров назы-
называются эквивалентными, если существуют две невырожденные квадратные
матрицы R и S такие, что
В = RAS.
Из F3.7) следует, что две матрицы, соответствующие одному и
тому же линейному оператору при различном выборе базисов в X и У,
всегда эквивалентны между собой. Нетрудно видеть, что справедливо
и обратное утверждение. Именно, две эквивалентные матрицы всегда
соответствуют одному и тому же линейному оператору в подходящим
образом выбранных базисах. "Таким образом, каждому линейному опера-
оператору, отображающему X в У, соответствует класс эквивалентных
матриц.
§64]
ЭКВИВАЛЕНТНЫЕ И ПОДОБНЫЕ МАТРИЦЫ
205
Теорема 64.1. Для того чтобы две прямоугольные матрицы
одинаковых размеров были эквивалентны, необходимо и достаточно,
чтобы они имели один и тот оке ранг.
Доказательство. При умножении любой матрицы на невыро-
невырожденные матрицы ее ранг не меняется, поэтому эквивалентные мат-
матрицы имеют рдинаковые ранги. Пусть теперь две матрицы одинаковых
размеров имеют один и тот же ранг. Докажем, что эти матрицы
эквивалентны. Мы докажем даже большее, а именно, что каждая
матрица ранга г эквивалентна матрице
1 0 ... О 0 ... О \
О 1 ... О 0 ... О
О 0 ... 1 0 ... О
О 0 ... О 0 ... О
О 0 ... О 0 ... О
Пусть дана прямоугольная матрица размеров и х т. Она определяет
некоторый линейный оператор А, отображающий пространство X с
базисом еъ еъ ..., ет в пространство У с базисом qu q2, ..., qn.
Обозначим через г число линейно независимых векторов среди об-
образов векторов базиса Аеъ Аеъ ..., Ает. Не нарушая общности, можно
считать,лто линейно независимыми являются векторы Аеъ Аеъ ..., Аеп
так как этого можно достигнуть надлежащей нумерацией векторов базиса.
Остальные векторы Аег+и ..., Ает линейно через них выражаются,
для к — г + 1, ..., т. Определим новый базис fu f2, ..., fm в X
следующим образом:
: = i, 2, ..., г,
: = г + 1, ..., т.
F4.2)
F4.3)
Afk = 0
для к = /• + 1, ..., т. Положим, далее,
Afj = tj F4.4)
для j = 1, 2, ..., г. Векторы tlt t2, ..., tr по предположению линейно
независимы. Дополним их некоторыми векторами tr+1, ..., tn до базиса
206 МАТРИЦЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [Гл. 7
в У и рассмотрим матрицу оператора А в новых базисах /ь ..,
... ,/ж и tl9..., tn. Коэффициенты fe-ro столбца этой матрицы совпадают
с координатами вектора Afk в базисе tl9 ..., tn. Согласно соотно-
соотношениям F4.3), F4.4) матрица оператора А будет совпадать с 1Г. 1
Исходная матрица и матрица 1Г соответствуют одному и тому же
оператору, поэтому они эквивалентны. Следовательно, все матрицы
одного и того же ранга эквивалентны матрице 1Г и поэтому эквивалент-
эквивалентны между собой.
В процессе доказательства теоремы мы ответили на очень важный
вопрос: «Как выбрать базисы в пространствах X и Y, чтобы матрица
линейного оператора имела наиболее простой вид?» Кроме этого, мы
указали явный вид этой простейшей матрицы.
Столь простой и эффективный ответ оказался возможным
потому, что базисы в X и У могли выбираться независимо друг от друга.
Пусть теперь оператор А действует в пространстве X, Конечно,
можно было бы снова рассматривать образы и прообразы в различных
базисах, однако сейчас это не является естественным, так как и образы,
и прообразы принадлежат одному и тому же пространству. Исполь-
Использование различных базисов существенно затруднило бы исследование
действия оператора на векторы пространства X. Если базис один, то
матрицы Р и Q в F3.6) совпадают. Следовательно, каждому линейному
оператору, действующему в линейном пространстве, соответствует класс
матриц, связанных между собой соотношениями v
В = Р'ХАР F4.5)
для различных невырожденных матриц Р. Такие матрицы называются
подобными, матрица Р называется матрицей подобного преобразования.
Вопрос о том, когда две матрицы могут быть подобны, решается
довольно сложно, и мы получим на него ответ значительно позднее.
Столь же сложным является вопрос о том, каков вид самой простой
матрицы среди всех подобных матриц. Этим исследованиям посвя-
посвящены следующие две главы.
Упражнения.
1. Доказать, что признак эквивалентности матриц и признак подобия
являются отношениями эквивалентности.
2. Доказать, что подобные матрицы имеют одинаковый след и определитель.
3. Доказать, что при одном и том же подобном преобразовании цик-
циклическая группа невырожденных матриц переходит в циклическую группу.
4. Доказать, что при одном и том же подобном преобразовании ли-
линейное подпространство матриц переходит в линейное подпространство.
5. На множестве квадратных матриц одного порядка рассмотрим оператор,
заключающийся в подобном преобразовании этих матриц с фиксированной
матрицей подобного преобразования. Доказать, что этот оператор — линейный.
6. Доказать, что множество всех операторов подобного преобразования,
заданных над одним и тем же множеством квадратных матриц одного
порядка, образует группу по умножению.
207
ГЛАВА 8
ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН
§ 65. Собственные значения и собственные векторы
Пусть линейный оператор А действует в пространстве X. Это озна-
означает, что каждому вектору хеХ ставится в соответствие некоторый
вектор у = Ах из того же пространства X. Может оказаться, что для
некоторого ненулевого вектора х образ и прообраз коллинеарны.
Как мы увидим в дальнейшем, наличие подобной ситуации позволяет
существенно упростить исследование оператора.
Число X называется собственным значением, а ненулевой вектор
х — собственным вектором линейного оператора А, _если они связаны
между собой соотношением Ах = Хх.
Заметим, что если х есть собственный вектор, соответствующий
собственному значению X, то любой коллинеарный вектор ах при
а Ф 0 будет также собственным вектором. Если собственному значению
X соответствуют два собственных вектора х, у, то собственным
вектором будет и любой ненулевой вектор вида ах + ру. Нулевой вектор
по определению не является собственным. Поэтому множество Хк всех
собственных векторов, являющихся линейными комбинациями любого
числа заданных собственных векторов, соответствующих одному и тому
же собственному значению X, не является подпространством. Если же
мы расширим Хъ присоединив к нему нулевой вектор, то Хк станет
подпространством. Это подпространство называется собственным под-
подпространством оператора А, соответствующим собственному значению X.
Нетрудно понять, что собственными векторами операторов О, Е и аЕ
будут все ненулевые векторы пространства X. Эти операторы имеют
лишь по одному собственному значению, равному соответственно 0,1 и а,
и следовательно, по крайней мере по одному собственному подпро-
подпространству, совпадающему со всем пространством X. Оператор проек-
проектирования Р имеет две совокупности собственных векторов: все векторы
из области значений оператора Р и все векторы из области значений
оператора Е — Р. Первой совокупности собственных векторов соответст-
соответствует собственное значение X = 1, второй — X = 0. Действительно, так как
Р2 = Р, то
= Р2х = Рх= 1-Рх,
Р((? - Р)х) = (Р - Р2)х = (Р - Р)х = 0 = 0(Е - Р)х.
208 ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН [Гл. 8
Следовательно, оператор проектирования имеет по крайней мере два
собственных подпространства.
Теорема 65.1. Система собственных векторов хх, x2> ..., хт
оператора А, соответствующих попарно различным собственным зна-
значениям Xl9 Хъ ..., Хт линейно независима.
Доказательство. Собственные векторы являются ненулевыми
по определению, поэтому теорема заведомо верна при m = I. Пусть
она верна для любой системы из т — 1 собственных векторов,
но не верна для векторов хь х2, ..., хт. Тогда система этих векторов
будет линейно зависимой, т. е. для некоторых чисел ось ос2, ..., осш,
не равных нулю одновременно, выполняется равенство
ос2х2 + • • • + итхт = 0. F5.1)
Предположим, что ах Ф 0. Применяя А к F5.1), получим
+ 0^2*2 + • • • + Ът\тХт = 0. F5.2)
Умножив F5.1) на Хт и вычитая его из F5.2), находим
а2(Х2 - Хт)х2 + ... + ат_!(Хт-Х - ^w)xw_! = 0.
Согласно индуктивному предположению, отсюда следует, чхо все
коэффициенты при векторах хь х2, ..., хш_! равны нулю. В частности,
ai (^i — ^-m) = ^j ЧТ0 противоречит условию Хх Ф Хт и предположению
&! Ф 0. Следовательно, система векторов хь х2,..., хт линейно независима.*
Следствие. Любой линейный оператор, действующий в т-мерном
пространстве, не может иметь более т попарно различных собственных
значений.
Особый интерес представляет тот случай, когда в m-мерном про-
пространстве оператор А имеет т попарно различных собственных
значений. В этом ^y4aej согласно теореме 65.1, мы можем выбрать
базис пространства, целиком состоящий из собственных векторов опе-
оператора А.
Линейный оператор А, действующий в m-мерном пространстве X,
называется оператором простой структуры, если он имеет m линейно
независимых собственных векторов.
Тот факт, что среди всех линейных операторов мы выделяем операторы
простой структуры, объясняется очень просто. Эти и только эти
операторы в некотором базисе имеют диагональные матрицы. Действи-
Действительно, пусть хь х2, ..., хт — линейно независимые собственные
векторы оператора А. Возьмем их в качестве базисных векторов
пространства X и построим матрицу оператора А в этом базисе. Имеем
Ах2 = Х2хъ
Ахт = Хтхт.
§ 65] СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ 209
Напомним, что элементы столбцов матрицы оператора совпадают с
координатами образов векторов базиса. Поэтому матрица Д оператора
А в базисе из собственных векторов будет иметь следующий вид:
Kt 0 ... 0
А-1
ч0 0 ... JL
•тг
Если теперь оператор А в некотором базисе xl9 х2, ..., хт имеет
диагональную матрицу с какими-то, не обязательно различными чис-
числами Хи Хъ ..., Хт на главной диагонали, то х1? х2, ..., хт явля-
являются собственными векторами оператора А, соответствующими собст-
собственным значениям Xl9 Х2, ..., Хт.
Таким образом, операторы простой структуры и только они имеют
диагональные матрицы в некотором базисе. Этот базис может быть
составлен лишь из собственных векторов оператора А. Действие любого
оператора простой структуры всегда сводится к «растяжению» коорди-
йат вектора в данном базисе. Если бы все линейные операторы
были простой структуры, то вопрос о выборе базиса, в котором
матрица оператора имеет наиболее простой вид, был бы полностью
решен. Однако операторами простой структуры не исчерпываются все
линейные операторы.
Упражнения.
1. Пусть оператор А имеет собственный вектор х, соответствующий собст-
собственному значению X. Доказать, что для оператора
где a0, oti, ..., аи — некоторые числа, вектор х будет также собственным,,
но соответствующим собственному значению ос0 +.OLtX + ... + а„Хп.
2. Доказать, что операторы А и А — &Е имеют одни и те же собственные
векторы при любом операторе А и числе ое.
3. Доказать, что оператор А является невырожденным тогда и только
тогда, когда он не имеет нулевых собственных значений.
4. Доказать, что операторы А и А'1 имеют одни и те же собственные
векторы при любом невырожденном операторе А. Как связаны между собой
собственные значения этих операторов?
5. Доказать, что если оператор А — простой структуры, то оператор
— также простой структуры.
6. Доказать, что оператор дифференцирования, действующий в простран-
пространстве многочленов, не является оператором простой структуры. Найти, собст-
собственные векторы и собственные значения этого оператора.
7. Рассмотрим оператор подобного преобразования с диагональной мат-
матрицей. Доказать, что этот оператор — простой структуры. Найти все его
собственные векторы и собственные значения.
210 ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН [Гл. 8
§ 66. Характеристический многочлен
Не всякий линейный оператор имеет хотя бы один собственный
вектор. Предположим, налример, что оператор действует в пространстве
V2 и осуществляет поворот каждого направленного отрезка вокруг
начала координат на угол 90° против часовой стрелки. Очевидно, что
в этом случае образ и прообраз никогда не будут коллинеарными
и оператор не будет иметь ни одного собственного вектора. Для того
чтобы исследовать вопрос существования собственных векторов, выведем
сначала уравнение, которому удовлетворяют все собственные значения
линейного оператора.
Пусть линейный оператор А действует в m-мерном пространстве X,
заданном над полем Р. Если оператор имеет собственное значение Х9
соответствующее собственному вектору х, то по определению выпол-
выполнено соотношение Ах = Хх или, что то же самое,
(ХЕ-А)х = 0, F6.1)
Вектор х — ненулевой, поэтому из F6.1) вытекает, что оператор ХЕ — А —
вырожденный. Таким образом, собственными значениями оператора А
являются те и только те числа X из Р, для которых оператор
ХЕ — А является вырожденным.
Зафиксируем в пространстве X некоторый базис еи е2, ..., ет
и обозначим через Ае матрицу оператора А в этом базисе. Оператор
ХЕ — А является вырожденным тогда и только тогда, когда будет вырож-
вырожденной его матрица ХЕ — Ае, т. е. когда
^e) = O. F6.2)
Определение собственных значений не было связано с выбором
базиса в пространстве X. Поэтому числа X из поля Р, удовлетворяю-
удовлетворяющие уравнению F6.2), также не должны зависеть от базиса. В дейст-
действительности не зависит от выбора базиса левая часть F6.2) при любом
X, хотя формально эта зависимость отмечена. Пусть в некотором другом
базисе /ь /2, ..., /т оператор А имеет матрицу Af. Согласно F4.5)
матрицы Ае и As связаны соотношением
при некоторой невырожденной матрице Q. Теперь при любом X из Р
находим
det(X? - Af) = det^Q-^e - 0Г}АД) = detF (ХЕ - Ae)Q) =
= det Q~x det (XE - Ae)det Q = (det Q) det (XE - Ae)det Q = det {XE - Ae).
Учитывая выражение для определителя матрицы через ее элементы,
легко понять, что левая часть F6.2) может быть представлена в
таком виде:
det {ХЕ - Ае) = а0 + ахХ + ... + ат. хХт~1 + атХт. F6.3)
§ 66} ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН 211
Коэффициенты а0, ..., ат каким-то образом вычисляются по элементам
матрицы Ае и не зависят от X. Максимальная степень X входит
лишь в произведение диагональных элементов матрицы ХЕ — Ае, поэтому
ат=1.
Укажем явное выражение еще двух коэффициентов. Именно,
Вообще говоря, можно предположить, что, раскрывая определитель
det (ХЕ — Ае) по степеням X различными способами, мы будем полу-
получать выражения типа правой части F6.3), но с различными коэффи-
коэффициентами а{. Однако в дальнейшем будет показано, что это пред-
предположение не имеет места. Коэффициенты в правой части F6.3)
не зависят от способа их вычисления. Учитывая независимость определи-
определителя dct(XE — Ae) от базиса, мы заключаем, что все коэффициенты
а0, ..., ат-1 в действительности являются характеристиками оператора
А. Функция
f(X) = а0 + а{Х + ... + ат- {Хт~1 + V" F6.4)
называется характеристическим многочленом оператора А.
С каждым линейным оператором связывается характеристический
многочлен. Верно и обратное утверждение. Каждый многочлен вида
F6.4) является характеристическим для некоторого линейного оператора.
Им может быть, например, оператор, матрица Ае которого в каком-либо
базисе имеет следующий вид:
1 0 ... О О
О 1 ... О О
. . . А
О 0 ... 1 0 /
F6.5)
В этом легко убедиться непосредственной проверкой, используя тео-
теорему Лапласа для вычисления определителя det(^E — Ae). Матрица вида
F6.5) называется матрицей Фробениуса.
Для того чтобы число X из поля Р было собственным значением
оператора А, необходимо и достаточно, чтобы оно удовлетворяло
уравнению
а0 + ахХ + ... + пп-хХ1"-1 +Хт = 0,
т. е. было корнем характеристического многочлена. Не в каждом
поле Р любой многочлен с коэффициентами из Р имеет хотя бы
один корень из Р. Примером может служить многочлен X2 + 1, ко-
который не имеет корней ни в поле рациональных, ни в поле ве-
вещественных чисел.
212 ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН [Гл. 8
Поле Р называется алгебраически замкнутым, если любой многочлен
с коэффициентами из Р имеет хотя бы один корень из Р.
Таким образом, если линейный оператор действует в пространстве,
заданном над алгебраически замкнутым полем, то он обязательно име-
имеет хотя бы один собственный вектор. Можно построить различные
примеры алгебраически замкнутых полей, однако наибольшее практи-
практическое значение имеет лишь одно из них — поле комплексных чисел.
Доказательству алгебраической замкнутости этого поля посвящены наши
ближайшие исследования.
Упражнения.
1. Найти характеристический многочлен для нулевого и тождественного
операторов.
2. Найти характеристический многочлен для оператора дифференцирования.
3. Является ли совпадение характеристических многочленов признаком
равенства операторов?
4. Доказать, что операторы с матрицами А и А' имеют одинаковые ха-
характеристические многочлены.
5. Пусть в некотором базисе оператор имеет матрицу F6.5). Найти ко-
координаты собственных векторов в том же базисе.
6. Доказать, что оператор с матрицей F6.5) имеет простую структуру тогда
и только тогда, когда характеристический многочлен имеет т Попарно различ-
различных корней.
§ 67. Кольцо многочленов
В некоторых упражнениях и примерах мы уже обращали вни-
внимание на алгебраические свойства многочленов. В связи с изучением
характеристического многочлена мы продолжим эти исследования,-
Пусть задано произвольное пол« Р. Рассмотрим множество мно-
многочленов, т. е. функций вида
F7.1)
зависящих от аргумента z, принимающего значения из Р, и имеющих
коэффициенты а0, ..., ап из Р. Будем считать многочлен f(z) мно-
многочленом степени и, если ап ф О, а все коэффициенты с большими
номерами равны нулю. Единственным многочленом, не имеющим
определенной степени, является многочлен, у которого все коэффициенты
равны нулю. Мы будем называть его нулевым многочленом и обозначать
символом 0.
Два многочлена будем считать равными, если равны все их коэф-
коэффициенты при одинаковых степенях аргумента.
Пусть теперь даны многочлены f(z) и g(z) степени п и s соот-
соответственно. Обозначим
/(z) = а0 + axz + ... + а„_ xzn~i + anz\
g(z) = b0 + bxz + ... + Viz* + bszs
§ 67] КОЛЬЦО МНОГОЧЛЕНОВ 213
и предположим' для определенности, что n^s. Суммой f(z) + g(z)
многочленов f(z) и д (z) назовем многочлен
f(z) + g{z) = с0 + cxz + ... + Cn-iZ*-1 + cnzn,
Где d — cii + bi для i^s и cf = af для i > s. Степень суммы много-'
членов равна п, если п > s, но при п — s она будет меньше п, если
К *= - о».
Произведением f(z)-g(z) многочленов f(z), и g(z) назовем многочлен
/(z).flf(z) = d0 + iiz + ... + d^,.^' + dJI+Iz»+I,
где л v
d X
для z = 0, 1, ..., n + s. Коэффициент d? есть сумма произведений
тех коэффициентов многочленов f(z) и g(z), сумма индексов которых
равна L Например,
d0 = aobQ, dn+s- anbs>
Из последнего равенства вытекает, что dn+s Ф 0, поэтому степень
произведения ненулевых многочленов равна сумме степеней сомножи-
сомножителей. Следовательно, произведение ненулевых многочленов есть ненуле-
ненулевой многочлен.
Частным случаем произведения многочленов является произведение
cxf(z) многочлена f(z) на число а, так как ненулевое число можно
рассматривать как многочлен нулевой степени.
Множество многочленов с введенными выше операциями представ-
представляет собой коммутативное кольцо. Мы не будем останавливаться на
проверке выполнения всех аксиом.
Теорема 67.1. Для любого многочлена f(z) и ненулевого многочлена
g(z) можно найти единственные многочлены q(z) и r(z) такие, что
f(z) = g(z)q(z) + r(z), F7.3)
причем степень r(z) меньше степени g(z) или r(z) = 0.
Доказательство. Пусть многочлены f(z) и g(z) имеют степени
п и s. Если п< s или f(z) = 0, то в разложении F7.3) можно положить
q(z) — 0, r(z) =f(z). Предположим поэтому, что п^ s.
Представим многочлены f(z) и g (z) согласно F7.2) и положим
f{z)-^-^g{z)=f1{z). F7.4)
Пусть степень многочлена/! (z) равна nl9 а его старший коэффициент —
аап\ Ясно, что nt < п. Если щ ^ s, то положим
'e(z)-/2(z). F7.5)
214 ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН [Гл. 8
Обозначим через п2 степень, а через сР\г — старший коэффициент мно-
многочлена /2 (z). Если пг ^ s, то снова положим
f2{z)-^-z*-g(z)=f3(z) F7.6)
И Т. Д.
Степени многочленов f1 (z), f2 (z), ... убывают. Поэтому после ко-
конечного числа шагов мы придем к такому равенству:
a
-! (z) - -J^-^-i -^(z) =/,D F7.7)
в котором многочлен/k(z) либо является нулевым, либо его степень
пк меньше s. После этого процесс останавливается.
Складывая теперь все равенства типа F7.4) — F7.7), мы получим
Это означает, что многочлены
а аA) а(к}
q(z) = -^z"-* + _2i.z»i-'•+•.. + -^-2*-i-, r{z) =/k(z)
удовлетворяют равенству F7.3), причем либо r(z) = 0, либо степень
r(z) меньше степени g(z).
Докажем теперь, что многочлены q(z) и r(z), удовлетворяющие
условию теоремы,—единственные. Пусть существуют еще многочлены
q'(z) и r'(z)9 для которых
f() ()'() '()
причем либо г' (z) = 0, либо степень г' (z) меньше степени д (z). Тогда
g(z)(q(z)-q'(z)) = r'(z)-r(z). F7.8)
Многочлен в правой части этого равенства либо является нулевым,
либо его степень меньше степени g(z). Многочлен же в левой части
при q(z) — qf(z) Ф 0 имеет степень, не меньшую степени g(z). Поэтому ра-
равенство F7.8) возможно лишь в случае
q(z) = q'(z), r(z) = /(z).
Теорема полностью доказана.
Многочлен q(z) называется частным от деления f(z) на g(z), a
r(z) — остатком от этого деления. Если остаток равен нулю, то будем
говорить, что f(z) делится на g(z), а сам многочлен g(z) называть
делителем многочлена f(z).
Рассмотрим деление произвольного ненулевого многочлена f(z) на
многочлен первой степени z — а. Имеем
(z-a)q(z) + r(z). F7.9)
§ 67] КОЛЬЦО МНОГОЧЛЕНОВ 215
Так как степень r(z) должна быть меньше, чем степень многочлена
z — a, то r(z) является многочленом нулевой степени, т. е. константой.
Эту константу легко определить. Подставив в левую и правую части
соотношения F7.9) z = a, находим, что r(z)=f(a). Итак,
f(z) = (z-a)q(z)+f(a). F7.10)
Для того чтобы многочлен/^) делился на многочлен z — a, необходимо
и достаточно, чтобы f(a) = 0. Числа а, для которых f(a) = 0, принято
называть корнями многочлена /(z). Таким образом, отыскание всех
линейных делителей многочлена равносильно отысканию всех его корней.
Использование формулы F7.10) позволяет сделать следующий вывод.
Для любого числа а из Р многочлен f(z) степени п можно единст-
единственным образом представить в виде разложения по степеням (z — a):
f(z) = Ао + Ax(z - а) + ..". + An^(z - а)»'1 + An(z - af, F7.11)
где Ао, ..., Ап — числа из Р.
Существование хотя бы одного разложения F7.11) устанавливается
довольно просто. Разделив f(z) на (z — а), мы получим частное qx (z)
и остаток Ао, связанные между собой равенством
f(z) = (z-a)qi(z) + A0. F7.12)
Если q±(z) имеет нулевую степень, то разложение F7.11) получено.
Если же степень qx(z) отлична от нуля, то, поделив q1(z) на (z — a),
будем иметь
1i{z) = (z-a)q2(z) + A1. F7.13)
Объединяя F7.12), F7.13), находим
f(z) = (z - aJq2(z) + A^z- a) + Ao.
При необходимости снова делим q2 (z) на (z — a) и т. д. Так как
степени частных q±(z), q2(z), ... последовательно уменьшаются, то
процесс остановится через п шагов, давая разложение F7.11).
Предположим теперь, что разложение такого же вида получено каким-
то другим способом и имеет коэффициенты А'о, ..., А'п. Обозначив
4i(z) = At + A'l+1(z - а) + ... + A'n(z - af1
для i — 0, 1, ..., n, мы заключаем, что
4t{z) = {z-aU+1{z) + A't. F7.14)
При этом, конечно, 4o(z)=/(z). Сравнивая F7.12) с F7.14) при i==0
и учитывая единственность частного и остатка, мы заключаем, что
Ао = А'о, qx (z) = q'i (z). Аналогичным образом доказывается равенство
и других коэффициентов.
216 ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН [Гл. 8
Упражнения»
1. Доказать, что в кольце многочленов нет делителей нуля,
2. Пусть для некоторых многочленов справедливо равенство f(z)<p(z) =
= д (z) ф (z). Доказать, что если ф (г) Ф 0. то /(-) = д (z).
3. Доказать, что ненулевые многочлены /(г) и g{z) делятся друг на друга
тогда и только тогда, когда g(z) — if{z) для ненулевого числа а.
4. Пусть каждый \п мноючленов j\(z\ ...,/k(r) делится на y(z). Дока-
Доказать, что на ф(г) делится и многочлен )±(z)g1 (z) + ... + fk{z)gk(z\ где g^z), ...
• ••? Ук(=) — произвольные многочлены.
5. Доказать, что в разложениях F7.1), F7.11) для одного и того же много-
многочлена /(г) коэффициенты ап и Лп совпадают.
§ 68. Основная теорема алгебры
Мы приступаем к доказательству одного из важнейших утвержде-
утверждений — теоремы об алгебраической замкнутости тюля комплексных чисел.
Эта теорема находит применение в самых различных областях ма-
математики. В частности, на ней основана вся дальнейшая теория
линейных операторов. Согласно установившейся традиции, мы будем
называть ее основной теоремой сигебры.
Итак, мы яолжны доказать, что всякий многочлен степени и ^ 1
с комплексными коэффициентами имеет хотя бы один корень, в общем
случае комплексный. Рассмотрим сначала многочлены специального вида.
Именно,
f(z) = a-z>\ F8.1)
Представим комплексные числа z в так называемой тригонометри-
тригонометрической форме .
z = r(coscp + /sincp).
Здесь г — неотрицательное число, называемое модулем числа z, ф —
вещественное число, называемое аргументом числа z. Ясно, что для
каждого числа z модуль определен однозначно. Для ненулевых чисел z
аргумент определен с точностью до числа, кратного 2гс; для z = 0
аргумент не определен. Составляя произведение двух комплексных чисел
z — r (cos ф + i sin ф), v = p(cos v|/ + / sin v|/),
находим
zv = rp (cos ф + i sin ф) (cos \jf + i sin \|/) = rp (cos (ф + \|/) -f f sin (ф 4- \j/)).
Отсюда выводим, что
zn = r" (cos /?ф + i sin щ).
Это равенство называется формулой Муавра. Оно позволяет легко
найти корни уравнения F8.1). Действительно,, пусть комплексное число а
представлено в тригонометрической форме
а = a (cos 9 4- isinG).
§ щ ОСНОВНАЯ ТОДКЕМА АЛГЕБРЫ 217
Уравнение Q _ fX = Q
относительно г эквивалентно уравнению
a(cos0 + /sin 6) = r"(cos7Kp + /sinmp)
относительно г и ф. Но последнее уравнение заведомо имеет такие
Решения е
для к = 0, 1. 2, /7—1. Следовательно, комплексные числа
, »/-/ 0 + 2/стс . . 9 + 2Ьс\ ,,й_.
ак = + |/a( cos h 7Sin I F8.2)
являются корнями уравнения F8.1). Мы будем называть эти числа
корнями и-й степени из числа а и обозначать их общим символом
ак = \/а.
Пусть теперь задан произвольный многочлен /(г) с комплексными
коэффициентами. Будем рассматривать его как комплексную функцию
комплексного аргумента z. Для таких функций, как и лля вещественных
функций вещественного аргумента, можно ввести понятия непрерывности,
производной и т. д. Не все эти понятия будут нам нужны в одинаковой
мере, но все они основаны на использовании полноты пространства
комплексных чисел.
Однозначная комплексная функция /(г) комплексного аргумента г
называется непрерывной в точке z0, если для всякого сколь угодно
малого числа г > 0 можно найти такое 8 > 0, что для любого комплекс-
комплексного числа г, удовлетворяющего неравенству
|=-го|<6,
будем иметь
|/()/()|
Функция f(z\ непрерывная в каждой точке области определения, на-
называется непрерывной всюду или просто непрерывной.
Лемма 68.1. Многочлен f(z) с комплексными коэффициентами
есть непрерывная функция комплексного аргумента г.
Доказательство. Пусть
f{z) = ao + aiz + ... + an^ F8.3)
и г0 — произвольное фиксированное комплексное число. Обозначим
h = z — zQ. Покажем, что для любого сколь угодно малого числа
s>0 можно найти такое 8 > 0, что при |й|<5 выполняется нера-
неравенство L/X-) — Л-оI < е.
218 ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН [Гл. 8
Разложив заданный многочлен f(z) по степеням (z — го)? мы получим
f{z) = Ао + А!(z - z0) + ...+An(z- zo)\
Так как Ао =/(z0), a (z — z0) обозначено через ft, то
f(z0 + ft) -/(z0) = ^ft + ... + 4,ft". F8.4)
Отсюда следует, что
|/(z0 + ft) -f{zQ)\ ^ \A±\\h\ + ... + |4,| |ft|" = ^(|й|)- F8.5)
Вещественная функция A(\h\) есть многочлен с вещественными
коэффициентами \At\ относительно вещественной переменной .|/?|. Как
известно из курса математическо1 о анализа, А (h \) есть непрерывная функ-
функция всюду и, в частности, при | ft | = 0. Так как А @) = 0, то по заданному
8 > 0 можно найти такое 5 > 0, что при
|ft|<8 F8.6)
будем иметь
A(\h\)<s.
Учитывая неравенство F8.5), заключаем, что при выполнении F8.6)
будет выполняться и неравенство
Следствие. Модуль многочлена есть непрерывная функция.
Это утверждение сразу вытекает из следующего соотношения:
Следствие. Если последовательность комплексных чисел {zk}
сходится к г0, то для любого многочлена f(z)
\imf(zk)=f(z0).
Лемма 68.2. Если многочлен f(z) степени п ^ 1 не обращается в
пуль при z = z0, то всегда можно найти такое комплексное число ft, что
\f(zo + h)\<\f(zo)\
Доказательство. Снова рассмотрим разложение F8.4). Пусть
среди коэффициентов Аъ А2, ..., Ап первым отличным от нуля будет
коэффициент Ак. Возьмем
к_ ~
F8.7)
где в качестве корня к~й степени берется любое из его значений и
0<Г<1. F8.8)
ОСНОВНАЯ ТЕОРЕМА АЛГЕБРЫ
§ 68]
Обозначим
Теперь из F8.4), учитывая F8.7), F8.8), находим
Lf(-o + /01 = 1/Ы ~ tkj\zQ) + tk+1Bk+1 -к.. + ГВЯ|
< |A - tk)f{z0)\ + t*+1|Bk+1| + ... V f\BH\ =
= A - **IЯ-оI + tk+1 |Bk+1| + ... + f\Bn\ =
= \f(zo)\ + t*(- |/(zo)| + t\Bk+1\ + ... + ^-*|В
Окончательно имеем
219
tkB(t).
Функция B(t) есть многочлен с вещественными коэффициентами
и вещественным аргументом t. Это непрерывная функция. Но В @) =
= — |./ (-о) I < 0, поэтому в силу непрерывности В (t) найдется такое 10
в пределах 0 < t0 < 1, что B(t0) будет также отрицательным. Для
комплексного числа /?, определяемого числом t0 согласно F8.7), получим
№о + йI < 1Л-оI + *о*('о) < 1/(-оI •
Лемма 68.3. Для любого многочлена f(z) степени /? > I // любой
бесконечно большой последовательности [zk] комплексных чисел имеет
место предельное соотношение
Umlf(z»)|= + co. F8.9)
Доказательство. Рассмотрим многочлен F8.3). Для любого
z ф 0 находим
№01
1-
F8. JO)
Так как последовательность [гк] — бесконечно большая, то
lim \zk\ = + оо.
it-* 00
Правая часть соотношения F8.10) есть вещественная функция, поэтому
вычисляем
lim I 1 -
\=ыГя
Но для другого сомножителя из F8.10) имеем
lira \an\\zk\"= +oo.
|rk|->0G ,
Следовательно, соотношение F8.9) справедливо
220 ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН [Гл 8
Теорема 68.1 (основная теорема алгебры). Всякий многочлен
f(z) степени и > 1 с комплексными коэффициентами имеет хотя бы
один корень, в общем случае комплексный.
Доказательство. Рассмотрим множество всевозможных значе-
значений модуля многочлена /(г). Так как I/(г) | ^ 0, то это множество огра-
ограничено снизу. Из курса математического анализа известно, что всякое
непустое ограниченное снизу множество действительных чисел имеет точ-
точную нижнюю грань. Пусть для множества значений |/(г)| она равнк /.
Это означает, что для каждого натурального числа к можно найти
такое комплексное число zk, что
Отсюда вытекает, что
\тЦЫ = 1. F811)
Если предположить, что последовательность {zk} неограничена, то
тогда из нее можно было бы выбрать бесконечно большую подпосле-
подпоследовательность и, согласно лемме 68.3. соотношение F8.11) не могло бы
выполняться. Поэтому последовательность [zk\ ограничена. Выберем из
нее сходящуюся подпоследовательность {zk} и пусть
lim z. = z0.
fcv'->x ч
Согласно следствию из леммы 68.1. модуль многочлена есть непре-
непрерывная функция. Следовательно.
[f(:o)\=)imj\zk)\ = l
Если / ф 0, то из леммы 68.2 вытекает, что найдется такое число
г0, для которого |./(-оI < J- Это противоречит .тому, что / есть точная
нижняя грань значений модуля многочлена, поэтому / = 0.
Итак, мы показали существование такого комплексною числа zQ,
что |/(го)| = 0 или, что то же самое.
Это означает, что г0 есть корень многочлена/(j).
Упражнения.
1. Доказать, что множество всех корней л-й схепенц из комплексного
числа 1 образует коммутативную группу но умножению.
2. Доказать, что для того чтобы последовательноеil комплексных чисел
[zk] была енраниченной, необходимо и достаточно, чюбы хотя бы для одното
многочлена f(z) степени п ^ 1 была oi раниченной последовательность {f(zk)}.
3. Доказать, что для любого мноточлена J(z) счепешт п^\ и любого
комплексного числа г0 существует такое комплексное число //. что [/("о + Л)| >
f 69]" СЛЕДСТВИЯ ИЗ ОСНОВНОЙ ТЕОРЕМЫ 221
4. Доказать, чго все корни многочлена F8.3) находятся в кольце
max
к>0
ao\J \ k<n
5. Попытайтесь «доказать» алгебраическую замкнутость ноля вещественных
чисел по той же схеме, что и для комплексных чисел. В каком месте «до-
«доказательство» не имеет аналогии?
§ 69. Следствия из основной теоремы
Из основной теоремы вытекает целый ряд следствий. Рассмотрим'
наиболее существенные из них.
Многочлен f(z) степени н ^ 1 с комплексными коэффициентами
имеет хотя бы один корень zt. Поэтому f(z) обладает разложением
Д=) = (z-=1)<?(z),
где ф(г) есть многочлен степени /7 — 1. Коэффициенты многочлена
Ф (г) снова являются комплексными числами. Следовательно, ф (г) имеет
корень z2 (если п ^ 2) и
() (И
откуда вытекает, что
/(_-) = (г -=,)(= -=2Щ:\>
Продолжая этот процесс, мы получим разложение многочлена в произве-
произведение линейных множигелей:
/(г) = /,(г-г1)(г-г2)...(г-,,,),
где b — некоторое число. Раскрывая скобки в правой части полученного
разложения и сравнивая коэффициенты при схепенях с коэффициентами
аг многочлена f(z\ мы заключаем, что h = ап.
Среди чисел г^ z2 zn могут быть равные между собой.
Предположим для простоты, чго гь гг попарно различны, • а
каждое из чисел гг+1. .... zn равно одному из первых. Тогда многочлен
f(z) можно записать в таком виде:
f(z) - ап (= - =гЬ (= ~ -2)А^ •••(-"- -Л F9.1)
где 2гФ Zj при \Ф) и
Разложение F9.1) называется каноническим разложением многочлена
f(z) на множители.
Каноническое разложение является единственным для многочлена
f(z) с точностью до порядка расположения сомножителей. В самом деле,
пусть наряду с разложением F9.1) существует другое каноническое
222 ХАРАКТЕРНО ИЧЬСКИЙ MIIO1 ОЧЛНН II л 8
разложение
Тогда справедливо равенство
(z - z^ (z - =2Г-...(-- zff> = (~ - fiV' I- - Г2У3...(-- vj*. F9.2)
Заметим, что совокупность чисел zu ..., zr должна совпадать с
совокупностью чисел г1? ..., vm. Если, например, z1 не равен ни одному
из чисел vu ..., гш, то, подставляя z = zt в F9.2), мы получим в
левой части равенства нуль, а в правой — число, отличное от нуля.
Итак, если существуют два канонических разложения многочлена
f(~), то равенство F9.2) может быть лишь таким:
(г - =1Ь {= - =2Ь...(-- Ф = (г - z& (z - z2f-... (г - zry>.
Предположим, например, что А'х ф /1ч и пусть для определенности
/ч! > /х. Разделив правую и левую часть последнего равенства на один и
тот же делитель (г — z^1, мы получим, что
(г - г^-'i (z - z2b...(z - rrf = (г - z2t-...(z - zjt-.
Снова, подставляя сюда z = zl9 устанавливаем, что в левой части ра-
равенства стоит нуль, а в правой — число, отличное от нуля. Таким обра-
образом, единственность канонического разложения доказана.
Если к( = 1 в каноническом разложении F9.1), то корень zi на-
называется простым; если же kt> i, то корень zt называется кратным.
Число kt называется кратностью корня z{. Теперь мы можем сделать
весьма важный вывод:
Любой многочлен степени п ^ 1 с комплексными коэффициентами
имеет п корней, если каждый из корней считать столько раз, какова
его кратность.
Многочлен нулевой степени не имеет корней. Единственным мно-
многочленом, который имеет сколь угодно много попарно различных корней,
является нулевой многочлен. Этими фактами можно воспользоваться
для того, чтобы сделать следующий вывод:
Если два многочлена f(z) и g(z), степени которых не превосходят п,
имеют равные значения более чем при п различных значениях аргумента,
то все соответствуюгцие коэффициенты этих могочленов равны между
собой.
Действительно, многочлен f(z) — g (z) couiacno предположению име-
имеет более п корней. Но его степень не превосходит /?, поэтому
f(z)-g(z) = 0.
Итак, многочлен/(и), степень которого не превосходит //, полностью
определяется своими значениями при любых /? + 1 различных значениях,
аргумента. Это позволяет восстанавливать многочлен ио его значениям.
Нетрудно указать явный вид этого «восстанавливающего» многочлена.
Если при значениях аргумента, равных <хь ..., эс,?+1, многочлен f(z)
§ 693 СЛЕДСТВИЯ ИЗ ОСНОВНОЙ ТЕОРЕМЫ 223
принимает значения ДаД ..., Да„+1), то
ял = V /Ь) (--aib..(r-oc^1)(r-^+1) ...(г =a?ti)
Ясно, что степень многочлена в правой части не превосходит п,
и в точках г = y.t он принимает значения /(af). Построенный таким
образом многочлен называется интерполяционным многочленом Ла-
гранжа.
Рассмотрим теперь многочлен f(p) степени и, и пусть zu
z2,...9zn — его корни, выписанные столько раз, какова их кратность. Тогда
f(z) = ая (z - =1) (z - z2)... (г - zn).
Перемножая выражения в скобках, стоящие справа, приводя подобные
члены и сравнивая полученные коэффициенты с коэффициентами из
F8.3), мы можем вывести следующие равенства:
an~Jan = - (zx + z2 + ... + zn\
ап-г\ап = + (ri-2 + -i-з + • • • + -1-я + • • • + zn- i-n)>
ап-ъ1ап — ~ (Г1г2г3 + Z1Z2ZA- + ... + zn-2zn~l'ZfX
<*i/an = (-1)""' (гхг2... г„_!+...,+ z2z3... г„),
ЯоЛ*п = (- If-1-2 •••-«•
Эти равенства называются формулами Въета и выражают коэффициенты
многочлена через его корни.
В правой части ?>го равенства стоит сумма всевозможных произ-
произведений по к корней, взятая со знаком плюс или минус в зависимости
от четности или нечетности к.
Для дальнейшего нам будут полезны некоторые следствия из основной
теоремы алгебры, относящиеся к многочленам с действительными ко-
коэффициентами. Пусть многочлен
с действительными коэффициентами имеет комплексный (но не действи-
действительный!) корень г\ т. е.
а0 + axv + ... + anvn = 0.
Последнее равенство не нарушится, если в нем все числа заменить
на комплексно сопряженные. Однако коэффициенты а0, ап и число 0,
являясь действительными числами, останутся при этой замене без из-
изменения. Поэтому
а0 + «!« + ... + anvn = 0,
т. е. f(v) = 0.
224 ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН [Гл. 8
Таким образом, если комплексное (но не действительное!) число v
есть корень многочлена f(z) с действительными коэффициентами, то кор-
корнем f(z) будет и комплексно сопряженное число v.
От<ж>да следует, что многочлен /(z) будет делиться на квадратный
трехчлен
ф (z) = (z - v)(z - v) = z2 - (v + v) z + vv.
коэффициенты которого действительные. -Пользуясь этим фактом, дока-
докажем, что корни v и v имеют одну и ту же кратность.
Пусть они имеют соответственно кратности к и / и, например,
к > I Тогда f(z]j делится на 1-ю степень многочлена ф (г), т. е.
Многочлен q(z\ как частное двух многочленов с действительными
коэффициентами, также имеет действительные коэффициенты. По .предпо-
.предположению он должен иметь число v своим (к — /)-кратным корнем и не
иметь корня, равного д. Согласно доказанному выше, это невозможно,
поэтому к = /. Таким образом, все комплексные корни любого много-
многочлена с действительными коэффициентами попарно комплексно со-
сопряжены. Из единственности канонического разложения следует такой
вывод.
Всякий многочлен с действительными коэффициентами представим
с точностью до порядка расположения сомножителей единственным об-
образом в виде произведения его старшего коэффициента и многочленов
с действительными коэффициентами. Эти многочлены имеют старшие
коэффициенты, равные единице, и являются линейными, если соответ-
соответствуют действительным корням, и квадратичными — если соответствуют
паре комплексно сопряженных корней.
Наконец, самый важный вывод, ради которого, собственно говоря,
и доказывалась основная теорема алгебры. Пусть линейный оператор
А действует в комплексном пространстве. Собственные значения этого
оператора и только они являются корнями характеристического много-
многочлена. Согласно основной теореме, оператор А имеет по крайней мере
одно собственное значение X. Следовательно;,
Любой линейный оператор, действующий в комплексном линейном
пространстве, имеет по крайней мере один собственный вектор.
Заметим, что если оператор А действует в вещественном или ра-
рациональном пространстве, то этот вывод уже не верен.
По отношению к собственным значениям мы будем применять ту
же терминологию, что и по отношению ,к корням многочлена. В част-
частности, собственное значение мы будем называть простым, если оно
является простым корнем характеристического многочлена, и крат-
кратным — в противном случае. Кратностью собственного значения X
мы будем называть кратность X как корня характеристического мно-
многочлена.
§ 69] СЛЕДСТВИЯ ИЗ ОСНОВНОЙ ТЕОРЕМЫ 225
Упражнения.
1. Доказать, что если комплексное число а^О, то для любого натураль-
натурального числа п существует, только п различных комплексных чисел, и-я
степень которых равна а.
2. Как связаны между собой корни многочленов f(z) и f(z — а), где
а — комплексное число?
3. Пусть многочлен f(z) степени не выше п с комплексными коэффициен-
коэффициентами принимает одинаковые значения при 72 + 1 различных значениях аргумен-
аргумента. Доказать, что /(z) есть многочлен' нулевой степени.
4. Доказать, что любой многочлен нечетной степени с вещественными
коэффициентами имеет по крайней мере один вещественный корень.
5. Доказать, что многочлен f(z) имеет по крайней мере по одному корню
в каждой из двух областей
6. Доказать, что оператор А имеет простую структуру тогда и только
тогда,- когда каждому собственному значению соответствует столько линейно
независимых собственных векторов, какова кратность X.
8 В. В. Воеводин
ГЛАВА 9
СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА
§ 70. Инвариантные подпространства
Все ближайшие исследования мы будем проводить в предполо-
предположении, что линейный оператор задан в комплексном пространстве X.
Как уже отмечалось ранее, это предположение гарантирует сущест-
существование у каждого линейного оператора хотя бы одного собствен-
собственного вектора.
Подпространство L линейного пространства X называется инва-
инвариантным относительно оператора А, если для каждого вектора х
из L его образ Ах также принадлежит L.
Любой линейный оператор имеет по крайней мере два тривиаль-
тривиальных инвариантных подпространства — нулевое подпространство и все
пространство X. Существенное значение имеют лишь нетривиальные
инвариантные подпространства. К подобным подпространствам отно-
относятся, например, собственные подпространства. Так как в комплексном
линейном пространстве любой оператор заведомо имеет хотя бы один
собственный вектор, то любой оператор в таком пространстве обяза-
обязательно имеет по крайней мере одно нетривиальное инвариантное
подпространство.
Легко проверить, что для каждого оператора А область значений
ТА и ядро NA будут инвариантными подпространствами. Эти подпрост-
подпространства являются тривиальными тогда и только тогда, когда опера-
оператор А — невырожденный или нулевой.
Если L есть инвариантное подпространство, то можно многими
способами построить дополнительное подпространство М такое, что
X = L+ М. Однако среди этих дополнительных подпространств может
не быть ни одного инвариантного. Если же есть хотя бы одно инва-
инвариантное дополнительное подпространство, то можно говорить о раз-
разложении пространства в прямую сумму инвариантных подпространств.
Знание какого-либо инвариантного подпространства и тем более
разложения пространства в прямую сумму инвариантных подпрост-
подпространств позволяет построить базис, в котором матрица оператора
имеет более простой вид. Пусть оператор А имеет в т-мерном
пространстве X инвариантное подпространство L размерности п. Выбе-
Выберем базис еи е2, ..., ет в X таким образом, чтобы его первые п
векторов принадлежали L. Тогда образы Аеи ..., Аеп векторов еи ..., еп
будут принадлежать L и их можно разложить по векторам el9..., еп
§ 70]' ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 227
как векторам базиса L. Следовательно,
Ле1 = апе1 + а21е2 + ... + anien9
Аеп = а1пех + е2пе2 + ... + ^ии^.
Напомним, что элементы столбцов матрицы оператора совпадают
с координатами образов векторов базиса. Поэтому матрица Ае опера-
оператора А в базисе еи еъ ..., ет будет иметь вид:
0 ...0
ап,
10 ... О :атгП+1 ... атм
Как правило, матрицы подобного типа записывают в так называемом
клеточном виде. Именно,
1 1)' G0Л)
Здесь Ап — квадратная матрица порядка п, А22 — квадратная матрица
порядка m - п, 0 - нулевая матрица размеров (т - п) х п, А12 - матрица
размеров пх (т — п).
Предположим теперь, что пространство X разложено в прямую
сумму инвариантных подпространств Ьи М. Выберем базис еи е2,..., ет
в X таким образом, чтобы его первые п векторов принадлежали
L, а остальные т—п векторов принаддежали М. В этом случае образы
Аеи...,Аеп можно разложить лишь по векторам еи...,ею а образы
Аеп+1,..., Ает лишь по векторам еп+и...9ет< Матрица А12 в G0.1)
очевидно будет нулевой. Поэтому матрица Ае оператора А в рас-
рассматриваемом базисе будет иметь еще более простой вид. Именно, '
V 0 . А22)
Пусть исследуется действие оператора А лишь на векторах инва-
инвариантного подпространства L. Если xeL, то AxeL. Следовательно,
можно считать, что оператор А порождает на L некоторый другой
оператор А | L, определенный равенством
(А\Ь)х = Ах
для всех xeL. Оператор А | L называется индуцированным оператором,
порожденным оператором А. По отношению к оператору A\Lоператор А
называется порождающим. В силу линейности оператора А индуциро-
индуцированный оператор будет также линейным. Индуцированный оператор
А | L совпадает с порождающим оператором А на инвариантном
8*
228 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
подпространстве L и не определен вне L. Таким образом, эти опера-
операторы отличаются, в основном, областью определения.
Несмотря на кажущуюся искусственность введения индуцированного
оператора, он представляет собой весьма удобный вспомогательный
аппарат при выполнении самых различных исследований. Например,
индуцированный оператор, как и любой другой линейный оператор,
имеет по крайней мере один собственный вектор. Но, так как он
совпадает с порождающим оператором на своей области определения,
то это означает, что:
Любой линейный оператор в каждом инвариантном подпространстве
имеет по крайней мере один собственный вектор.
Если пространство разложено в прямую сумму г инвариантных
подпространств, то линейный оператор имеет по крайней мере г линейно
независимых собственных векторов.
Ясно, что любое собственное значение и любой собственный вектор
индуцированного оператора являются соответственно собственным зна-
значением и собственным вектором порождающего оператора. Менее
очевидна
Теорема 70.1. Характеристический многочлен индуцированного
оператора, порожденного на нетривиальном подпространстве, является
делителем характеристического многочлена порождающего оператора.
Доказательство. Пусть индуцированный оператор А \ L опре-
определен на инвариантном подпространстве L. Снова выберем базис
еи...,ет пространства X так, чтобы векторы еи ...,е„ составляли
базис в L. Если матрица порождающего оператора есть Ае из G0.1),
то матрица индуцированного оператора ,4|LecTb Ai± из G0.1). Характе-
Характеристический многочлен для оператора А равен det (XE — Ае), для опе-
оператора A\Lou равен det(XE — Аи). Применяя теорему Лапласа для
разложения определителя det(A,? — Ае) по первым п столбцам, находим
- А.) = det^? QAli ^^ ) = dct(XE - An)det(XE - А22).
Полученное равенство и означает справедливость утверждения теоремы.
Определение всех собственных значений оператора А сводится к на-
нахождению всех корней характеристического многочлена. Если оператор А
имеет нетривиальное инвариантное подпространство, то, согласно тео-
теореме 70.1, эта задача может быть сведена к нахождению всех корней
двух многочленов меньшей степени. Если индуцированный оператор
сам имеет нетривиальное инвариантное подпространство, то процесс
разложения характеристического многочлена на множители может быть
продолжен.
Упражнения.
1. Доказать, что сумма и пересечение инвариантных подпространств являются
инвариантными подпространствами.
2. Доказать, что если оператор А — невырожденный, то любой индуциро-
индуцированный оператор также невырожденный,
§ 71] ОПЕРАТОРНЫЙ МНОГОЧЛЕН 229
3. Доказать, что если оператор А — простой структуры, то любой инду-
индуцированный оператор также простой структуры.
4. В каком случае инвариантное подпространство оператора простой
структуры есть прямая сумма собственных подпространств?
5. Доказать, что если хотя бы одно инвариантное подпространство опе-
оператора А не имеет дополнительного инвариантного подпространства, то А
не может быть оператором простой структуры.
6. Доказать, что если оператор А — простой структуры, то область зна-
значений и ядро не имеют общих ненулевых векторов.
7. Доказать, что если подпространство является инвариантным относительно
оператора А, то оно является инвариантным и относительно оператора
E A Ар
§ 71. Операторный многочлен
Одним из важнейших способов построения инвариантных подпрост-
подпространств линейного оператора является использование многочленов с
комплексными коэффициентами.
Пусть некоторый линейный оператор А действует в комплексном
пространстве X. Возьмем произвольный многочлен
Ф (z) = а0 + axz + ... + apzp
с комплексными коэффициентами и рассмотрим линейный оператор
= а0Е + atA + ... + apAp.
Этот оператор действует в пространстве X и называется оператор
ным многочленом или многочленом от оператора А.
Зафиксируем оператор А и построим множество всех операторных
многочленов, зависящих от А. Так как множество всех многочленов
является коммутативным кольцом, то будет коммутативным кольцом
и множество всех операторных многочленов. В частности, отсюда
следует, что
для любого многочлена (p(z). Коммутативность кольца операторных
многочленов играет исключительно важную роль во всех дальнейших
исследованиях.
Легко показать, что область значений 7^, любого операторного'
многочлена ф (А) является инвариантным подпространством для опера-
оператора А. В самом деле, пусть хеТф. Это означает, что х = <р(А)у для
некоторого уеХ. В силу перестановочности операторов А и (Л)
имеем
Следовательно, вектор Ах есть результат применения оператора <р(А)
К вектору АуеХ, т.е. АхеТг
230 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
Ядро АГФ операторного многочлена <р(Л) также является инвариант-
инвариантным подпространством для оператора А. Если хеАГф? то ф(А)х = 0,
но тогда
Ф {А) (Ах) = А (ф (А) х) = А @) = 0.
Уже отмечалось ранее, что в любом инвариантном подпространстве
содержится по крайней мере один собственный вектор оператора.
Теперь можно высказать более точное утверждение. Именно:
Если собственное значение оператора А является (не является)
корнем многочлена q>(z), то все собственные векторы оператора А,
соответствующие этому собственному значению, принадлежат ядру
(области значений) оператора Ц>(А).
Действительно, пусть х — собственный вектор оператора А, соот-
соответствующий собственному значению А,. В упражнениях к § 65 под-
подчеркивалось, что вектор х является собственным и для оператора
ф(Л), но соответствует собственному значению ф(А,). Следовательно,
ф(Л)х = (р(Х)х. Если А, есть корень многочлена ф(г), то ф(Х) = 0 и век-
вектор х принадлежит ядру оператора ф (А). Если же ф (X) Ф 0, то вектор
ц>(Х)х будет ненулевым и вектор х принадлежит области значений
оператора ц>(А).
Мы не можем доказать, что любое инвариантное подпространство
оператора А является либо областью значений, либо ядром некоторого
операторного многочлена. Это утверждение, вообще говоря, неверно,
о чем говорит пример тождественного оператора. При любом много-
многочлене (p(z) имеем ф(?) = фA)?, поэтому оператор (р(Е) либо нулевой,
либо невырожденный. Следовательно, область значений и ядро для ф (Е)
всегда представляют собой тривиальные подпространства. Инвариант-
Инвариантным же подпространством оператора Е является любое подпростран-
подпространство. Тем не менее каждое инвариантное подпространство оператора А
имеет определенное отношение к операторным многочленам от А.
Справедлива
Теорема 71.1. Пусть L— произвольное инвариантное подпрост-
подпространство оператора А. Если все собственные значения оператора, инду-
индуцированного на L, являются корнями многочлена ф(г), то L входит
в ядра операторов ц>к(А) при всех достаточно больших целых положи-
положительных степенях к.
Доказательство. Обозначим через Т'ь Т,... области значений
операторов, индуцированных на L с помощью операторных много-
многочленов <$к(А) при к = 1, 2,... Оператор ф (А) является вырожденным на L,
так как в его ядро входят по крайней мере все собственные векторы
оператора А, принадлежащие L. Поэтому Т\ с L, dim T\ < dim L. Под-
Подпространство Т'х является инвариантным относительно А. Если Т\ —
ненулевое, то, согласно теореме G0.1), характеристический многочлен
оператора, индуцированного на Т\ с помощью А, является делителем
характеристического многочлена оператора, индуцированного на Lc по-
помощью А. Следовательно, все собственные значения оператора, инду-
§ 72] ТРЕУГОЛЬНАЯ ФОРМА 231
цированного на Т\, являются также корнями многочлена cp(z). Но
отсюда снова вытекает, что Т2 с Ти dim Т2 < dim Тх и т. д. Размер-
Размерности подпространств Ти Ть ... не могут убывать неограниченно.
Поэтому, начиная с некоторого номера /с, эти подпространства будут
оставаться нулевыми, что и означает справедливость утверждения
теоремы.
Проведенные исследования позволяют установить важный факт,
касающийся существования нетривиальных инвариантных подпрост-
подпространств.
Теорема 71.2. Любой линейный оператор А, действующий в
т-мерном комплексном пространстве X, имеет по крайней мере одно
инвариантное подпространство размерности т — 1.
Доказательство. Оператор А имеет по крайней мере один
собственный вектор х. Пусть он соответствует собственному значе-
значению X. Согласно доказанному область значений Тх оператора А — ХЕ
представляет инвариантное подпространство оператора А. Но, так как
оператор А — ХЕ — вырожденный, подпространство Тх имеет размер-
размерность не выше m — 1.
Рассмотрим теперь любое подпространство L размерности т — 1,
целиком содержащее подпространство Тх< Любой вектор пространства
X преобразуется оператором А — ХЕ в некоторый вектор из Тк. Поэтому
любой вектор из L снова переходит в вектор из L. Таким образом,
L является подпространством, инвариантным относительно А — ХЕ и,
конечно, инвариантным относительно А. Теорема доказана.
Упражнения.
1. Пусть А — оператор дифференцирования, действующий в конечномерном
вещественном пространстве многочленов. Что представляет собой оператор
<р(А) для многочлена cp(z) с вещественными коэффициентами?
2. Пусть ф (z) — характеристический многочлен индуцированного оператора,
порожденного оператором А на инвариантном подпространстве N. Доказать,
что N принадлежит ядру оператора Ф*(Л) при некотором целом положи-
положительном к.
3. Доказать, что если все собственные значения оператора А являются
корнями многочлена 9(z), то ук(А) = 0 при некотором целом положительном к,
4. Доказать, что кольцо операторных многочленов, порожденных любым
оператором, имеет делители нуля.
5. Доказать, что если оператор А — простой структуры, то оператор ф D)
также простой структуры. Верно ли обратное утверждение?
§ 72. Треугольная форма
Теперь мы можем решить вопрос о приведении матрицы опера-
оператора к одной из простейших форм, так называемой треугольной
форме.
Теорема 72.1. Для любого линейного оператора А, действующего
в т-мерном пространстве Хг существуют инвариантные подпрострап-
232 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
ства Lp размерности р, р = 0, 1,..., т — 1, т, такие, что
LocL1c:...c:Lm_1c:Lw.
Доказательство. Существование подпространств Lo и Lm оче-
очевидно. Согласно доказанному ранее, оператор А имеет инвариантное
-подпространство Lm-1 размерности т — 1.
Рассмотрим на подпространстве Lm-1 индуцированный оператор.
Как и любой другой оператор, заданный на Lm_b он имеет инвари-
инвариантное подпространство Lm_2 размерности т — 2. Но подпространство,
инвариантное для индуцированного оператора, будет инвариантным
и для порождающего оператора А. Таким образом, существование
подпространства Lw_2 доказано. Если рассмотреть индуцированный опе-
оператор на подпространстве Lw_2, то аналогично доказывается сущест-
существование подпространства Lm_3 и т.д.
Эта теорема интересна, главным образом, своей матричной интер-
интерпретацией. Построим базис еи е2,...,ет пространства X, используя
инвариантные подпространства Lp. В качестве вектора е± возьмем
любой ненулевой вектор из Lb в качестве вектора е2 возьмем любой
ненулевой вектор из L2, не принадлежащий Ll9 и, вообще, в качестве
вектора ер возьмем любой ненулевой вектор из Lp, не принадлежа-
принадлежащий Lp-i. Рассмотрим матрицу Ае оператора А в этом базисе.
Так как ej принадлежит Lj5 a Lj инвариантно относительно А, то
вектор Aej должен быть линейной комбинацией лишь векторов
еь е2> •••? ej- Значит, в разложений
A a2je2 + ... + amjem
коэффициент при е{ должен равняться нулю для всех г > j. Следо-
Следовательно, матрица оператора А имеет вид
11 «12 ••• «l,m-l «lm \
> а1г ... а2>m-i «2m
О 0 ... а*,-!,™-! ам-1§
О 0 ... О атт
где atJ = 0 для i>j.
Матрица, у которой все элементы, расположенные ниже (выше)
главной диагонали, равны нулю, называется правой (левой) треугольной
матрицей. На языке матриц полученный результат означает, что любая
квадратная матрица подобна правой треугольной матрице.
Треугольная форма матрицы широко используется при доказа-
доказательстве самых различных фактов, касающихся линейных операторов.
Это объясняется, в основном, следующим ее свойством:
Если оператор А имеет в некотором базисе треугольную матрицу Ае,
то диагональные элементы матрицы Ае совпадают с собственными
значениями оператора А даже с учетом их кратности.
§ 73] ПРЯМАЯ СУММА ОПЕРАТОРОВ 233
Действительно, используя теорему Лапласа, находим, что характерис-
характеристический многочлен матрицы Ае равен
откуда и вытекает справедливость сформулированного утверждения.
Значительная часть дальнейшей теории линейных операторов посвя-
посвящена усовершенствованию только что полученного результата о при-
приведении матрицы оператора к треугольной форме. Простейший воз-
возможный вид, который может иметь матрица оператора, — диагональ-
диагональный. Как мы знаем, к этому виду могут быть приведены лишь
матрицы операторов простой структуры. Однако и для операторов
не простой структуры треугольная форма не является самой простой.
Упражнения.
1. Доказать, что любая квадратная матрица подобна левой треугольной
матрице.
2. Доказать, что множество треугольных матриц одного порядка и одного
наименования образует кольцо.
3. Доказать, что множество невырожденных треугольных матриц одного
порядка и одного наименования образует группу.
4. Пусть Хи Х2, ..., Хт — собственные значения оператора А, выписанные
подряд с учетом кратности. Доказать, что с учетом кратности ч собственными
значениями оператора <р(А) при любом многочлене <p(z) являются числа
5. Доказать, что если все диагональные элементы треугольной матрицы
А порядка m равны нулю, то Ат — 0.
6. Пусть треугольная матрица подобна диагональной. Доказать, что матрица
подобного преобразования может быть выбрана треугольной того же наиме-
наименования.
§ 73. Прямая сумма операторов
Линейный оператор, все собственные значения которого одинаковы,
является в некотором смысле исключительным. Тем не менее мы
покажем, что любой линейный оператор может быть составлен именно
из таких операторов.
Пусть пространство X представлено в виде прямой суммы подпрост-
подпространств L и М. Зададим на подпространстве L некоторый оператор В,
на подпространстве М — оператор С. Для любого вектора хеХ имеет
место единственное разложение
M, G3Л)
где xLeL, xMeM.
Оператор А, определенный равенством
234 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
называется прямой суммой операторов Б и С. Если одно из под-
подпространств L, М является тривиальным, то и прямая сумма назы-
называется тривиальной.
Легко проверить, что А есть линейный оператор в X. Покажем, что
он может быть представлен лишь единственным образом в виде
прямой суммы операторов, определенных на подпространствах L и М.
В самом деле, для любого вектора xeL имеем Ах = Вх. Аналогично
Ах = Сх для любого хеМ. Это означает, что оператор В совпадает
с индуцированным оператором A\L, оператор С совпадает с А\М.
Рассмотрим теперь произвольный оператор А в пространстве X.
Если X каким-либо образом разложено в прямую сумму подпространств
L и М, инвариантных относительно оператора А, то и сам оператор
А можно разложить в прямую сумму. Действительно, построим инду-
индуцированные операторы А | L и А | М. Разложив снова произвольный
вектор хеХ в виде суммы G3.1), мы получим, что
Ax = (A\L)xL+(A\M)xM.
В этом случае согласно теореме 70.1 характеристический многочлен
оператора А равен произведению характеристических многочленов инду-
индуцированных операторов А | L и А | М.
Разложение оператора А в прямую сумму можно осуществить
с помощью любого операторного многочлена <р(А). Обозначим через
Nk ядро оператора <рк(А). Это есть инвариантное относительно А
подпространство, и очевидно, что Nt с: N2 <= ... Докажем сначала, что
если Nk = Nk+1 для какого-нибудь к, то Nk — Np для всех р > к.
Действительно, возьмем любой вектор xeNp, тогда <рр(А)х = 0. Записав
это равенство в виде cpfc+ х {А) (фр~к~ * {А) х) = 0, мы заключаем, что вектор
<pp~k~1(A)xeNk+1. В силу равенства Nk = Nk+1 этот же вектор при-
принадлежит Nk. Следовательно,
-*-1 (а)х)= ^-1{а)х = о,
т.е. вектор xeNp-v Справедливость высказанного утверждения теперь
устанавливается индукцией по р.
Пространство X, в котором действует оператор А, — конечно-
конечномерное, поэтому размерности подпространств Nk не могут неограни-
неограниченно возрастать. Пусть q — наименьшее целое положительное число,
для которого Nq = Nq+1. Обозначим через Тк область значений опе-
оператора ф*(^4) и рассмотрим любой общий вектор х подпространств
Tq и Nq. Имеем ф* (А) х = 0 и х = ф* (А) у для некоторого вектора
уеХ. Отсюда следует, что cp2q(A)y = 0, т. е. yeN2q. Но по доказанному
выполняется равенство Nq = N2q. Поэтому yeNq, т.е. х = <pq{A)y = 0.
Таким образом, подпространства Tqn Nq имеют общим лишь нулевой
вектор. В силу формулы E6.3) это означает, что X = Tq 4- N4. Под-
Подпространства Tq и Nq — инвариантные, следовательно, возможность раз-
разложения оператора установлена.
§ 73] ПРЯМАЯ СУММА ОПЕРАТОРОВ" 235
Как уже отмечалось ранее, все собственные векторы оператора А
должны находиться в подпространствах Tq и Nq. При этом в Nq
находятся те из них, которые соответствуют собственным значениям,
совпадающим с какими-либо корнями многочлена (p(z), в Tq находятся
те собственные векторы, для которых соответствующие собственные
значения не совпадают ни с одним из корней cp(z). Так как каждому
собственному значению соответствует хотя бы один собственный век-
вектор, то отсюда вытекает, что:
Каждый из корней (ни один из корней) характеристического много-
многочлена оператора, индуцированного на Nq(Tq), является (не является)
корнем многочлена (p(z).
Окончательную характеристику разложений оператора в прямую
сумму, полученную с помощью операторных многочленов, дает
Теорема 73.1. Пусть характеристический многочлен f(z) опера-
оператора А разложен в произведение многочленов cp(z) и \|/(z), не имеющих
общих корней. Тогда оператор А молено единственным образом раз-
разложить в прямую сумму операторов В и С с характеристическими
многочленами <p(z) и \|/(z).
Доказательство. Рассмотрим разложение оператора А в пря-
прямую сумму, полученную с помощью многочлена cp(z). Так как про-
произведение характеристических многочленов операторов, определяющих
прямую сумму, совпадает с характеристическим многочленом /(z), то
существование по крайней мере одного разложения вытекает из про-
проведенных выше исследований.
Предположим теперь, что пространство Х- разложено каким-то
другим способом в прямую сумму инвариантных подпространств N я Т.
При этом индуцированный оператор на N имеет характеристический
многочлен ф(г), а оператор на Т— многочлен \|/(z). Согласно теореме
71.1, JV с Nk для всех достаточно больших /с, поэтому iV с Nq. Оператор
Ф (А) является невырожденным на Т9 следовательно, множество образов
векторов из Тпо отношению к (р(А) совпадает с Т. Но это означает,
что Та Тк для всех к. Подпространства JV, Т9 а также Nqi Tq в прямой
сумме образуют пространство X. Поэтому включения N с Nq, TczTq
могут иметь место лишь в том случае, когда N = Nq9 T—Tq. Теорема
доказана.
Пусть оператор А действует в m-мерном пространстве X. Пред-
Представим характеристический многочлен /(z) оператора А в виде кано-
канонического разложения
f(z) = (z - Xtfiz - X2f>... (z - Kf-, G3.2)
где Xl9 X2,... Д, — попарно различные собственные значения и
/ci + к2 + ... + К — т. Рассмотрим многочлены
Z ~~* f^>\j j (Z ™~* A*2y ) • • •) 1-" "^ ^"f/ r*
Они являются делителями характеристического многочлена f(z)9 и ни-
никакая пара из них не имеет общих корней. Согласно теореме 73.1,
236 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
существуют инвариантные подпространства Rl9 R2,..., Rr такие, что
X = RX 4-R2+•• + ?,.
При этом размерность подпространства Rt равна кь и индуцирован-
индуцированный оператор на R( имеет характеристический многочлен (z — А,?)Ч
Подпространство Rt называется корневым подпространством опера-
оператора А9 соответствующим собственному значению Xh Векторы корне-
корневого подпространства называются корневыми векторами. Из сказанного
вытекает, что любой оператор может быть разложен в прямую сумму
операторов, индуцированных на корневых подпространствах.
Корневое подпространство Rt совпадает с ядром оператора
((А — XiE)ki)q при некотором целом положительном q. Покажем, что в
данном случае всегда можно положить q — \. Рассмотрим операторы
(А — XtE)p для р = 1, 2, ... Пусть р{ — наименьшее число, для которого
ядро оператора (А — XtE)Pi совпадает с ядром оператора (А — Xfif1 + \
Тогда корневое подпространство Rt будет совпадать с ядром оператора
(А — Х(ЕУ1. Так как размерности ядер операторов (А — XtE)p для р — 1, 2,...
монотонно возрастают, а размерность подпространства Rt равна kh
то Pi < fc?.
Таким образом, Rh соответствующее собственному значению Xi
кратности kh заведомо совпадает с ядром оператора (А — Х{Е)кк
Теорема 73.2 {теорема Кели — Гамильтона). Если f(z) есть харак-
характеристический многочлен оператора А, то f(A) есть нулевой оператор.
Доказательство. Представим характеристический многочлен
в виде канонического разложения G3.2). Так как операторный многочлен
f(A) содержит множитель (А — X{Ef^ и любые многочлены от одного
и того же оператора перестановочны, то f(A)xt = 0 для любого
век-тора xt из Rt. Возьмем теперь произвольный вектор х и представим
его в виде разложения х = хх 4- х2 4-... + х„ где xteRi. Теперь ясно,
что f(A) х = 0, т. е. f(A) есть нулевой оператор.
Снова значительный интерес представляет матричная интерпрета-
интерпретация полученных результатов. Составим базис пространства как после-
последовательное объединение любых базисов корневых подпространств
Rl9 R2,--, Rr- Корневые подпространства инвариантны и их прямая
сумма совпадает с X. Поэтому матрица Ае оператора А в данном
базисе будет иметь так называемый квазидиагональный вид
о \
G3.3)
О
Ar,j
Каждая матрица Аи имеет порядок kt и представляет собой матрицу
оператора, индуцированного на подпространстве Ru
§ 74] ЖОРДАНОВА ФОРМА 237
Упражнения.
1. Можно ли оператор дифференцирования, заданный в конечномерном
пространстве многочленов, разложить в нетривиальную прямую сумму?
2. Доказать, что система корневых векторов, соответствующих попарно
различным собственным значениям, линейно независима.
3. Доказать, что если оператор А — невырожденный, то А~1 = (р(А) для
некоторого многочлена (p(z).
4. Оператор А называется нилъпотентным, если Ар = 0 для некоторого
целого положительного р. Доказать, что оператор является нильпотентным тогда
и только тогда, когда все его собственные значения равны нулю.
5. Пусть ф (z) есть многочлен наименьшей степени, для которого ф (А) == 0.
Доказать, что (p(z) является делителем характеристического многочлена опе-
оператора А.
§ 74. Жорданова форма
Дальнейшее упрощение матрицы оператора по сравнению с квази-
квазидиагональным видом G3.3) может осуществляться лишь за счет специаль-
специального построения базисов каждого из корневых подпространств. Конечно,
корневые базисы можно выбрать таким образом, что каждая матрица
Аи в G3,3) будет треугольной. Однако и этот вид матрицы оператора
не является самым простым.
Обратимся к более подробному изучению строения корневых под-
подпространств. Если xeRb то (А — Х(Е)^'х = 0. Но для каждого конкрет-
конкретного вектора х вполне возможно выполнение равенства (А — XiE)m х — 0
и при т < к-х. В частности, если х — собственный вектор, соответствую-
соответствующий кратному собственному значению Хь то (А — Х(Ё) х = 0, хотя kt > 2.
Высотой корневого вектора х называется наименьшее, целое не-
неотрицательное число т, для которого (А — XtE)m х — 0.
Все корневые векторы, соответствующие собственному значению Xi9
имеют высоты, не превосходящие кратности Х(. Однако напомним, что
в общем случае высоты корневых векторов и кратности собственных
значений — два различных понятия. Так, например, для оператора
простой структуры вообще не существует корневых векторов высоты
больше единицы независимо от кратностей собственных значений.
Пусть Rt есть корневое подпространство, соответствующее собствен-
собственному значению Х( кратности кг. Обозначим через t максимальную
высоту корневых векторов из Rt. Ясно, что t ^ к{. Если вектор х имеет
высоту /с, то вектор {A — XJ^x будет иметь высоту к — 1. Поэтому
в подпространстве Rt есть корневые векторы всех высот от 0 до г.
Для любого к ^ t обозначим через Нк совокупность всех векторов,
высоты которых не превосходят к. Легко показать, что Нк есть под-
подпространство в Rt. Если х, уеНк, то (А — XtE)kx = (А — XtEfy = 0.
Но тогда при любых числах а, C имеем (А — XtE)k (ах + $у) =? 0,
т. е. ах + ру g Нк. Очевидно, далее, что
238 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл 9
Размерности этих подпространств обозначим через ть О — то<т1<
< ... < т,_! < mt — kt.
Пусть /ь ..., / — произвольные линейно независимые векторы из
Яг, линейная обЬлочка которых в прямой сумме с Ht-X дает Ht.
Ясно, что это будут корневые векторы высоты t, Pi — Щ-^Щ-и
и никакая ненулевая линейная комбинация векторов/ь •••?/Pi не при-
принадлежит Ht-.v Рассмотрим совокупность векторов
(A-XiEJJ\,...,(A-XiEJfPi, G4Л)
Покажем, что эти векторы линейно независимы. В самом деле,
составим их линейную комбинацию и приравняем ее нулю. Применив
к обеим частям полученного равенства оператор (А — XiE)t9 мы найдем,
что линейная комбинация векторов /\, ...,fPi переводится оператором
(А — Х(Е)'~1 в нулевой вектор, т.е. она является вектором из #f_i.
Следовательно, коэффициенты, стоящие при этих векторах, должны
быть нулевыми. Применив теперь к тому же равенству оператор
(А — XiEI, мы аналогичным образом убеждаемся, что должны быть
нулевыми' коэффициенты, стоящие при векторах, расположенных во
второй строке G4.1), и т. д. • %
Заметим, что, в силу выбора векторов /ь ...,/, никакая ненулевая
линейная комбинация векторов, стоящих в f-й строке G4.1), не при-
принадлежит Hr_f.
Дополним векторы (А — XfE)/b ..., (А — htE)f такими векторами
//I,+ i» --'Ург из Ht-u чтобы вся эта совокупность была линейно не-
независимой и ее линейная оболочка в прямой сумме с Я,_2 давала
Ht-i. Ясно, что это будут корневые векторы высоты t — 1, р2 = Щ-i ~
— ш,_2, и никакая ненулевая * линейная комбинация данных векторов
не принадлежит Я,_2. Снова строим совокупность векторов
G4.2)
Относительно совокупности векторов (А — 7^E)fu ..., (А — pi
fPx + v">fp, можно доказать все те же факты, что и относительно
совокупности векторов/\,...,//), с заменой, конечно, t на t — 1. Переходя
таким же образом к подпространствам Я,_2, Я,_3,..., Яь мы получим
линейно независимую систему из kt векторов, принадлежащих корне-
корневому подпространству R(. Таблицы типа G4.1), G4.2) заканчиваются
§ 74] ЖОРДАНОВА ФОРМА 239
таблицей из одной строки
Эти векторы принадлежат Яь т. е. являются собственными, pt = mi — т0.
Расположим таблицы типа G4.1) — G4.3) последовательно слева на-
направо, выровняв их по последней строке и введя более компактные
обозначения для всех векторов. Тогда получим следующую таблицу:
pit) p(t)
Jt-l) pit~l) M-l) M~\)
: rr': :r:'r:?:
в1 9 '">epi9 epi + V '"' epz' '"' ^Pl-l + l' '"' ePt '-
Векторы, стоящие в первой строке этой таблицы, имеют высоту ?,
ректоры следующей строки — высоту t — 1 и т. д. Векторы последней
строки имеют высоту 1, т. е. оператором А — ХгЕ переводятся в нулевой
вектор. Каждый столбец таблицы определяет инвариантное подпрост-
подпространство оператора А — XtE и, следовательно, оператора А. Эти под-
подпространства называются циклическими. Первые р! циклических под-
подпространств имеют размерность t, следующие р2 — Pi подпространств
имеют размерность t — 1 и т. д. Последние столбцы определяют одно-
одномерные циклические подпространства. Все корневое подпространство
R( есть прямая сумма pt указанных циклических подпространств.
Напишем матрицу оператора, индуцированного в циклическом под-
подпространстве. Предположим, например, что в качестве базиса взяты
векторы eii\ е{1\ ..., е\г~1), е[г). Так как
(A-XiE)e{1) = 0, (A-:
то
Следовательно, матрица индуцированного оператора будет иметь та-
такой вид:
1 0 ... 0 0
0 ^ 1 ... 0 0
0 0 0 ... ^
чо о о... о v
Матрицы подобного вида называются каноническими ящиками Жордана.
Будем теперь строить базис пространства как последовательное
объединение базисов корневых подпространств Rl9 R2,..., Rr. В качестве
же базиса каждого корневого подпространства Rt мы возьмем векторы
типа G4.4), упорядоченные подряд снизу вверх и слева направо. Базис
пространства, построенный таким образом, называется корневым ба-
240
СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА
[Гл.9
В корневом базисе матрица J оператора А приобретает так назы-
называемую каноническую форму Жордана. Это есть квазидиагональная
матрица, составленная из ящиков Жордана. Первыми расположены
ящики Жордана, соответствующие собственному значению Яь причем
в порядке невозрастания их размеров. Затем в таком же порядке
расположены ящики Жордана, соответствующие Х2, и т. д. Итак,
О Ц...0
О 0.../Ц
\
о
G4.5)
Конечно, в общем случае некоторые из ящиков Жордана низших
порядков могут отсутствовать.
Задание оператора в линейном пространстве определяет класс подоб-
подобных матриц. Полученный результат означает, что любая квадратная
матрица может быть приведена подобным преобразованием к канони-
канонической форме Жордана. Ясно, что две квадратные матрицы одина-
одинакового порядка подобны тогда и только тогда, когда они имеют оди?
наковые формы Жордана. Поэтому при фиксированном базисе:
Две квадратные матрицы одинакового порядка определяют один и
тот же оператор в комплексном пространстве тогда и только тогда,
когда они имеют одинаковые формы Жордана.
Упражнения.
1. Пусть х — корневой вектор высоты v, соответствующий собственному
значению Xt оператора А. Доказать, что если Xt является корнем кратности р
многочлена ср(Д то вектор и = ф(Л)х является корневым вектором высоты
г = max {0, v — р), соответствующим тому же собственному значению Xt. Что
можно сказать о векторе v, если Xt не является корнем многочлена cp(z)?
2. Пусть х — произвольный ненулевой вектор, ср (z) — многочлен наименьшей
степени, для которого <р (А) х = 0. Доказать, что ф (z) является делителем харак-
характеристического многочлена оператора А.
3. Доказать, что любая квадратная матрица может быть приведена к кано-
канонической форме Жордана единственного вида~ с точностью до перестановки
ящиков Жордана,
§ 75] СОПРЯЖЕННЫЙ ОПЕРАТОР 241
4. Доказать, что если матрица подобна матрице J из G4.5), то она
подобна и матрице J'.
5. Доказать, что квадратные матрицы А и А' являются матрицами одного
и того же оператора.
6. Пусть J есть каноническая матрица Жордана. Какой вид имеет матрица Р
для целых положительных чисел р?
§ 75. Сопряженный оператор
Теперь мы переходим к исследованию линейных операторов, дей-
действующих в унитарном пространстве. Конечно, все результаты, полу-
полученные ранее в отношении операторов в комплексном пространстве,
имеют место и в этом случае. Поэтому мы будем изучать лишь
дополнительные свойства операторов, связанные с понятием ортого-
ортогональности. В отдельных случаях мы будем рассматривать и операторы,
действующие из одного унитарного пространства в другое унитарное
пространство. Основную роль в наших исследованиях будет играть
так называемый сопряженный оператор.
Пусть заданы два унитарных пространства X, Y. Оператор А*,
действующий из Y в X, называется сопряженным по отношению
к оператору А, действующему из X в Y, если для любых векторов
хеХ, yeYвыполняется равенство
(Ах,у) = (х,А*у). G5.1)
Теорема 75.1. Для любого линейного оператора А существует
сопряженный оператор А*, и притом только один.
Доказательство. Выберем в X какой-либо ортонормирован-
ный базис еъ е2, •••> ет- Напомним, что для любого вектора хеХ
имеет место разложение
*= I (x,ejek. G5.2)
fc=i
Если оператор А* существует, то, согласно этой формуле, для любого
вектора ye Y имеем
А*У = t(A*y
fc=i
или, учитывая G5.1),
А*у = ? (е* А*у) ек = ^ (Аеь у) ек = ? (У, Аек) ек. G5.3)
fc=l fc=l k=l
Нб это означает, что если оператор Л* существует, то он единственный.
Примем теперь равенство G5.3) за определение оператора А*.
Легко проверить, что построенный таким образом оператор А* яв-
линейным. Он удовлетворяет и равенству G5.1). Дейстэительно,
242 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
учитывая ортонормированность системы еи е2, ..., ет и принимая
во внимание G5.2), G5.3), получаем для любых векторов xeX9,yeY
/ m \ ж
(Ах, у) = [А ? (х, хк) ек, у )= ? (х, ек) (Аек, у),
(х, А*у) = ( ? (х, efc)?fc, ? (у,
fc=i k=i
= E (x, ек)&Ж)= | (x,
Теорема доказана.
Сопряженный оператор А* связан с оператором А определенным»
соотношениями. Отметим некоторые из них:
04*)* = А
(А + Б)* = Л* 4- ?*,
(оА)* = аЛ*, G5.4)
Здесь черта над а означает комплексное сопряжение. Все соотношения
доказываются по одной и той же схеме. Поэтому мы подробно
остановимся лишь на первом и последнем свойствах.
Рассмотрим произвольный оператор А и сопряженный к нему
оператор А*. В свою очередь для оператора А* сопряженным будет
оператор (Л*)*. Теперь для любых хеХ, yeYимеем
(у, (Л*)* х) = (А*у, х) = (х, А*у) = (Ах, у) = (у, Ах).
Левая часть равна правой при любом векторе у. Следовательно,
(Л*)*х = Ах. Но так как данное равенство справедливо при любом
векторе х, то это означает, что (Л*)* = А.
Предположим теперь, что оператор А действует в пространстве X
и невырожден. Докажем сначала, что будет невырожденным и опера-
оператор А*. Пусть А*у = 0. Согласно G5.3) отсюда следует, что
(у, Аек)ек =
к=1
Система векторов еи ..., ет является базисом, поэтому
(у, Аек) = 0 G5.5)
для всех к = J, 2, ..., ю. Оператор А — невырожденный, следовательно,
он любой базис переводит снова в базис» Но тогда система векторов
§ 75] СОПРЯЖЁННЫЙ ОПЕРАТОР 243
Аеи ..., Ает также является базисом и из G5.5) вйтекает, что у - 0.
Таким образом, ядро оператора А* содержит лишь нулевой вектор,
т. е. этот оператор — невырожденный.
Возьмем произвольные векторы х, у е X. Существуют единственные
векторы м, v, для которые
Аи = х, A*v = у.
Находим, далее,
(х, (А-'Г у) = (А-'х, у) = (и, A*v) = (Аи, v) = (х, (Л*) у).
Левая часть равна правой при любом векторе х. Следовательно,
(А'1)*у = (А*)~*у. Ввиду произвольности у это и означает, что
Многие совместные свойства операторов / Л и Л* можно устано-
установить, исследуя матрицы этих операторов. Пусть в пространстве X
выбран ортонормированный базис еи е2, ..., ет, в пространстве
У — ортонормированный базис ql9 q2, ..., qn. Если X совпадает с У,
то будем считать совпадающими и базисы. Предположим, что матрица
Aqe с элементами ау соответствует оператору А. Тогда
Отсюда, согласно G5.2), заключаем, что
atj = (Aej, qt). G5.6)
Предположим далее, что оператору А* в тех же базисах соответ-
соответствует матрица A*q с элементами aj§. Согласно формуле G5.6)
afj = (A*qj9 et).
Сравнивая элементы atj и afj и принимая во внимание G5.1), находим
afj = (A*qj9 ед = {ei9 A%) = (Aei9 q$ = ajh
Эта формула дает основание для следующего определения.
Матрица Л* размеров т х п с элементами afj называется сопряжен-
сопряженной по отношению к матрице А размеров п х т с элементами atj,
если ag = о,-; для всех z, j.
Таким образом, в любых ортонормированных базисах сопряженным
операторам соответствуют сопряженные матрицы. Сопряженные мат-
матрицы, очевидно, удовлетворяют всем соотношениям G5.4). Сопряжен-
Сопряженная матрица Л* связана с матрицей А операциями транспонирования
и комплексного сопряжения. Именно,
А" = (J0 = (!)'. G5.7)
Здесь черта означает, что все элементы матрицы заменяются на
комплексно сопряженные.
244 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
Ранг оператора совпадает с рангом его матрицы. Поэтому из
формулы G5.7) следует, что операторы А и Л* имеют одинаковые
ранги.
Обозначим через N с X, N* <= У и Та Y, Т* а X соответственно
ядра и области значений операторов А и Л*. Если xeN, то Ах = 0
и (х, А*у) = 0, Это' означает, что область значений оператора Л* есть
подпространство, ортогональное к ядру оператора А. Конечно, область
значений оператора А также ортогональна к ядру оператора Л*.
В силу равенства размерностей подпространств Т, Т* и соотношений
типа E6.4) заключаем, что
X = N® Г*, У = N* 0 Т. G5.8)
Базис yl9 y2, ..., ут унитарного пространства X называется
двойственным по отношению к базису хи х2, ..., хт того же про-
пространства, если
О при \Фи
прй /=;.
Двойственный базис нередко используется для исследования совмест-
совместных свойств операторов А и Л*, действующих в одном и том же
пространстве. Докажем сначала, что любой базис имеет двойственный,
и притом только один. Пусть хи х2, ..., хт — произвольный базис.
Для любого j вектор ^ должен быть ортогонален к векторам
хи ..., Х/-1, Xj+1, ..., хт и, следовательно, ортогонален к линейной
оболочке Lj, построенной на этих векторах. Отсюда вытекает, что
вектор yj лежит в одномерном подпространстве L/-. Условие норми-
нормировки (xj, у$ = 1 определяет его единственным образом.
Ясно, что базис будет двойственным к самому себе в том и
только в том случае, если он ортонормированный. Отношение двой-
двойственности базисов симметрично, поэтому имеет смысл говорить о паре
взаимно двойственных базисов. Взаимно двойственные базисы назы-
называются биортонормированиями.
Теорема 75.2. Если в некотором базисе оператор А имеет мат-
матрицу J, то в базисе, двойственном к данному, сопряженный оператор
А* имеет матрицу J*.
Доказательство. Пусть в ортонормированием базисе еи е2, ...
..., ет операторы А и А* имеют соответственно матрицы Ае и А*,
а в базисе хи хъ ..., хт оператор А имеет матрицу J. Обозначим
через Р матрицу преобразования координат при переходе от базиса
еи еъ ..., ет к базису хи х2, ..., хт. Тогда, согласно формуле F4.5),
имеем
J = P~1AeP.
Беря матричное сопряжение от левой и правой частей этого
§ 75] СОПРЯЖЕННЫЙ ОПЕРАТОР 245
равенства, находим
или, что то же самое,
Полученное соотношение показывает, что сопряженный оператор Л*
имеет матрицу J* в базисе уи у2, ..., ут, для которого матрица
преобразования координат при переходе от базиса еъ е2, ..., ет есть
(Р)*. Согласно формуле F3.3), координаты векторов хи х2, ..., хт
в базисе el9 еъ ..., ет суть элементы столбцов матрицы Р, координаты
векторов уи у2, ..., >'т в базисе еь е2, ..., ет суть элементы столбцов
матрицы (Р")*. Вычисление попарных скалярных произведений векто-
векторов из базиса хь х2, ..., хт и векторов из базиса уь у2> •••? Ут равно-
равносильно вычислению элементов матрицы Р'(Р~Х)*. Но
F (Р)* = F (РO = F (РO = (Р~ХРУ = Е.
Следовательно, базис уи у2, ..., ут является двойственным для базиса
Х.Ь Х2> • • • j хт-
Доказанная теорема позволяет вывести много следствий. Если,
например, J есть каноническая матрица Жордана, то на ее диагонали
стоят собственные значения Хи Х2, ..., Хт. Но собственные значения
матрицы J* суть Хи Х2, ..., lm. Поэтому все собственные значения
оператора Л* комплексно сопряжены по отношению к собственным
значениям оператора Л. Если оператор А — простой структуры, то
теорема 75.2 позволяет утверждать, что сопряженный оператор Л*
также имеет простую структуру. При этом базисные системы собствен-
собственных векторов операторов А и А* можно выбрать таким образом,
чтобы они были биортонормированными и т. д.
Упражнения.
1. Пусть координаты векторов некоторого базиса евклидова пространства,
заданные в ортонормированном базисе еъ е2, ..., ет, образуют столбцы
матрицы А. Доказать, что координаты векторов двойственного базиса, задан-
заданные в том же базисе еь е2, ..., ет, образуют строки матрицы А.
2. Как связаны между собой характеристические многочлены операторов
А и А*1
3. Доказать, что если некоторое подпространство инвариантно относитель-
относительно оператора А, то его ортогональное дополнение инвариантно относитель-
относительно А*.
4. Доказать, что любой собственный вектор оператора А, соответствую-
соответствующий собственному значению X, ортогонален к любому собственному вектору
оператора А*, соответствующему собственному значению ц # X.
5. Доказать, что любой корневой вектор оператора А, соответствующий
собственному значению X, ортогонален к любому корневому вектору оператора
А*, соответствующему собственному значению jj. # X.
246 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА {Гл. 9
§ 76. Нормальный оператор
Наличие ортонормированного базиса в пространстве и базиса из
собственных векторов линейного оператора имеет большое значение
при выполнении самых различных исследований. Поэтому нашей
ближайшей задачей является изучение того класса операторов, кото-
которые в унитарном пространстве имеют ортонормированные базисные
системы, состоящие из собственных векторов. Такие операторы заве-
заведомо существуют. Например, к ним относятся все скалярные опе-
операторы.
Теорема 76.1 (теорема Шура). Для любого линейного оператора
в унитарном пространстве существует ортонормированный базис,
в котором матрица оператора является треугольной.
Доказательство. Рассмотрим, например, случай правой тре-
треугольной матрицы. Согласно теореме 72.1, для любого оператора А
существуют инвариантные подпространства Lp, р — 1, 2, ..., т, такие,
что размерность Lp равна р, и каждое подпространство с меньшим
индексом входит во все подпространства с большими индексами.
Искомый базис построим следующим образом. В качестве вектора е±
возьмем любой нормированный вектор из Lx. В качестве е2 возьмем
нормированный вектор из L2, ортогональный к подпространству Lb
и т. д. В качестве вектора ет возьмем нормированный вектор из Ьш,
ортогональный к подпространству Ьш_!. Базис еъ e2, ..., ^ — орто-
ортонормированный и, как отмечалось в § 72, матрица оператора в таком
базисе является правой треугольной.
Линейный оператор А называется нормальным, если он перестано-
перестановочен со своим сопряженным, т. е.
АА* = А* А.
Мы покажем, что нормальные операторы и только они имеют
в унитарном пространстве базисные системы ортонормированных
собственных векторов.
При изучении этих операторов полезно следующее замечание. Если
треугольная матрица перестановочна со своей сопряженной, то она
диагональная. В самом деле, пусть, например, матрица В порядка
т — правая треугольная и В*В = ВВ*. Обозначим через Ъц элементы
матрицы В. Условие равенства нулю диагональных элементов матрицы
В*В — ББ* дает следующую систему уравнений относительно недиаго-
недиагональных элементов матрицы В:
Ч&1212 Ч*1зI2 HfriJ2 -... 4&iJ2 ¦-= о,
§ 76] НОРМАЛЬНЫЙ ОПЕРАТОР 247
Так как единственным решением данной системы является нулевое
решение, то это и доказывает справедливость высказанного замечания.
Теорема 76.2. Для того чтобы оператор в унитарном простран-
пространстве был нормальным, необходимо и достаточно, чтобы он имел
базисную систему ортонормированных собственных векторов.
Доказательство. Пусть А — нормальный оператор. Выберем
согласно теореме 76.1 такой ортонормированный базис, в котором
матрица оператора будет треугольной. В этом же базисе оператору Л*
соответствует сопряженная треугольная матрица. По условию оператор
Л — нормальный, поэтому матрицы операторов Л и Л* в выбранном
базисе должны быть перестановочны. Согласно сделанному ранее
замечанию, эти матрицы являются диагональными. Итак, мы построили
ортонормированный базис, в котором матрица оператора имеет диаго-
диагональный вид. Это означает, что данный базис целиком составлен из
собственных векторов оператора.
Предположим теперь, что оператор Л имеет базисную систему
ортонормированйых собственных векторов. Тогда в базисе, составлен-
составленном из этих векторов, матрица оператора Л будет диагональной.
Но в этом же базисе оператору Л* соответствует сопряженная
матрица, которая, очевидно, тоже будет диагональной. Диагональные
матрицы всегда перестановочны, поэтому перестановочны и операторы
А и А*.
В процессе доказательства теоремы мы показали, что если опера-
оператор А — нормальный, то в базисе из ортонормированных собственных
векторов не только матрица оператора А, но и матрица оператора Л*
также будет диагональной. Это дает
Следствие. Если оператор А — нормальный, то всякая орто-
нормированная система собственных векторов оператора А является
ортонормированной системой собственных векторов оператора Л* и
наоборот.
Следствие. Если оператор А — нормальный, то собственные
значения операторов А и А*, соответствующие общему собственному
вектору, комплексно сопряжены.
В самом деле, если Ах = Ъс и Л*х = \ix, то согласно G5.1) для
любого нормированного собственного вектора х будем иметь
% = (Хх, х) = (Ах, х) = (х, Л*х) = (х, [ix) = р.
Конечно, этот факт справедлив для любого оператора А, имеющего
общие собственные векторы с оператором Л*. Нормальность опера-
оператора Л гарантирует наличие общих векторов.
Значение нормальных операторов в общей теории определяется
двумя обстоятельствами. Во-первых, это один из наиболее простых
классов операторов в унитарном пространстве. А во-вторых, исследо-
исследование произвольного оператора нередко сводится к исследованию
нормальных операторов.
248 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
Упражнения.
1. Пусть А — произвольный линейный оператор, а, C — равные по модулю
комплексные числа. Доказать, что оператор осЛ + fL4* — нормальный.
2. Пусть А — нормальный оператор. Доказать, что для любого много-
многочлена (p(z) оператор <р(А) будет нормальным.
3. Доказать, что для нормального оператора любой индуцированный
оператор будет нормальным.
4. Доказать, что оператор А является нормальным тогда и только тогда,
когда для любого инвариантного подпространства L ортогональное дополне-
дополнение L1 также инвариантное.
5. Пусть А — оператор простой структуры в комплексном пространстве.
Доказать, что при соответствующем задании скалярного произведения в про-
пространстве оператор А всегда можно сделать нормальным.
§ 77. Унитарный и эрмитов операторы
Среди нормальных операторов наибольшее применение находят
операторы двух типов — унитарные и эрмитовы операторы.
Линейный оператор 17 называется унитарным, если сопряженный
оператор 17* совпадает с обратным С/, т.е.
Теорема 77.1. Нормальный оператор U является унитарным
тогда и только тогда, когда все его собственные значения по модулю
равны единице.
Доказательство. Пусть U — унитарный оператор. Возьмем
любое его собственное значение X и соответствующий ему нормирован-
нормированный собственный вектор х. Имеем
1 = (х, х) = (х, U*Ux) = (Ux, Ux) = (Хх, Хх) = X• Цх, х) = \Х\2.
Предположим теперь, что все собственные значения нормального
оператора U по модулю равны единице. Обозначим через л*ь ..., хт
ортонормированные собственные векторы оператора G, через Xl9 ...
..., Хт — его собственные значения. По условию | Xt | = 1 для всех L
Напомним, что для сопряженного оператора U* векторы ль ..., хт
остаются собственными, но соответствуют собственным значениям
Xl9 ..., Хт. Возьмем произвольный вектор х и разложим его по
собственным векторам оператора U
х = а1х1 + ... + ocmxm.
Теперь вычисляем
U*Ux = U* {Ux) = L7* (ouMi + • • • + а,АЛп) =
+ ... + ОС„Л„ЛШХШ = OLiXi + ... + ОСШХШ = X.
Так как х — произвольный вектор, это означает? что 17*17 =-Б, Анало-
Аналогично доказывается, что G С/* = Е,
§ 77] УНИТАРНЫЙ И ЭРМИТОВ ОПЕРАТОРЫ 249
Теорема 77.2. Оператор U является унитарным тогда и только
тогда, когда для любых двух векторов их скалярное произведение
равно скалярному произведению их образов.
Доказательство. Пусть U — унитарный оператор, тогда для
любых двух векторов х, у имеем
(х, у) = (х, U*Uy) = (Ux, Uy). G7.1)
Предположим теперь, что для некоторого оператора U при любых
векторах х, у выполняются равенства G7.1). Отсюда следует, что
Так как векторы х, у — произвольные, то это означает, что U*U = Е.
Оператор U — невырожденный, ибо в противном случае равенство
U*U = Е было бы невозможно. Следовательно, оператор U'1 суще-
существует. Умножая равенство 17* U = Е слева на оператор U и справа
на оператор I/, получаем другое равенство UU* = Е. Итак, оператор
U является унитарным.
Следствие. Оператор U является унитарным тогда и только
тогда, когда либо GG* = Е, либо G*G = Е.
Следствие. Любой унитарный оператор переводит любую орто-
нормированную систему векторов снова в ортонормированную.
Следствие. Если линейный оператор U переводит какой-либо
ортонормированный базис снова в ортонормированный базис, то U —
унитарный оператор.
Действительно, пусть хь ..., хт — ортонормированный базис, Uxt =
= Vf и yl9 ..., ут — также ортонормированный базис. Возьмем два
произвольных вектора х, у. Если
х=
то
{*> у)
1=1
В силу линейности оператора U
Ux = ? ОД, Uу = X Pitt-
Поэтому снова
(?/х, 1/у) = ?аД..
1=1
Итак, равенства G7.1) имеют место для любых векторов х, у.
Заметим, что мы могли бы определить унитарный оператор как
изометричный оператор, т.е. оператор, сохраняющий длины всех век-
250 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
торов. Это следует из теоремы 77.2 и легко проверяемого соотно-
соотношения
|x + yl2-lx-:H2 + *'l.x-f iy\2-i\x-iy\2
кх> У) — ^
Линейный оператор Я называется эрмитовым или самосопряжен-
самосопряженным, если он совпадает со своим сопряженным, т. е.
Н = Н*.
Теорема 77.3. Нормальный оператор Я является эрмитовым
тогда и только тогда, когда все его собственные значения суть
вещественные числа.
Доказательство. Пусть Я — эрмитов оператор. Возьмем любое
его собственное значение X и соответствующий ему нормированный
собственный вектор х. Имеем
X = (Ajc, х) = (Ях, х) = (х, Я*х) = (х, Ях) = (х, Хх) = X,
т. е. X — вещественное число. Предположим теперь, что нормальный
оператор Я имеет вещественные собственные значения. Тогда в базисе
из ортонормированных собственных векторов оператора Я матрицы
операторов Я и Я* будут совпадать. Следовательно, совпадают
и сами операторы, т. е. Я — эрмитов оператор.
Эрмитов оператор Я называется неотрицательным (положительно
определенным), если для любого (ненулевого) вектора х выполняется
неравенство
(Ях, х) ^ 0 (> 0)..
Теорема 77.4. Эрмитов оператор Н является неотрицательным
(положительно определенным) тогда и только тогда, когда все его
собственные значения неотрицательны (положительны).
Доказательство. Выберем ортонормированный базис из соб-
собственных векторов хь . ., хт эрмитова оператора Я. Тогда из раз-
разложения
для произвольного вектора х следует, что
(Ях, х) = Х1|?1|2 + ... + Хм|?м|2.
Отсюда вытекает, что если все собственные значения эрмитова опе-
оператора неотрицательны (положительны), то и сам оператор неотрица-
неотрицательный (положительно определенный). Положив х = xi9 получаем
(Нх„ хЦ = Xt
для всех I. Поэтому у неотрицательного (положительно определенного)
оператора все собственные значения неотрицательны (положительны).
Из сказанного вытекает, что положительно определенный оператор
есть невырожденный неотрицательный оператор. Среди всех эрмитовых
§ 77] УНИТАРНЫЙ И ЭРМИТОВ ОПЕРАТОРЫ 251
операторов неотрицательные и положительно определенные операторы
играют особо важную роль. Отметим некоторые их свойства.
Если Я и S — положительно определенные операторы, то оператор
осЯ + р5 положительно определен при любых неотрицательных числах
а, р, не равных нулю одновременно.
В самом деле, оператор осЯ + pS является эрмитовым при любых
вещественных числах а, р. Если же эти числа неотрицательны и не
равны нулю "одновременно, то
((осЯ + pS) х, х) = а {Нх, х) + Р (Sxt x)>0
при х#0.
Если оператор Я положительно определен, то оператор Н также
положительно определен.
Действительно, так как Я = Я*, то Я" = (Я*) = (Я)*, т. е. опе-
оператор Я эрмитов. Собственные значения оператора Я являются
обратными величинами по отношению к собственным значениям опе-
оператора Я. Поэтому они положительны и оператор Я—положи-
Я—положительно определенный.
Если Н — положительно определенный, а А — произвольный .невы-
.невырожденный оператор, то операторы А*НА и ЛЯЛ* положительно
определены.
Легко проверить, что эти операторы эрмитовы. В силу невырож-
невырожденности оператора А для любого х Ф О будем иметь Ах Ф 0 и
А*х ф 0. Поэтому
(Л*ЯЛх, х) = {НАх, Ах) > 0, (АНА*х, х) = (ЯЛ*х, А*х) > 0
при хФО. Отсюда, в частности, вытекает, что для любого невырож-
невырожденного оператора А операторы А*А и АА* положительно опреде-
определены. Если же А — вырожденный оператор, то операторы А*А и
А А* — неотрицательные.
Для любого неотрицательного оператора Н существует такой
неотрицательный оператор S, что S2 = Я.
Действительно, пусть Х1п ..., Хт — собственные значения оператора
Я и хь ..., хт — соответствующие ортонормированные собственные
векторы. Тогда Hxt = Х(хь для всех i. Определим оператор S равен-
равенствами 5xj = ]/^.Yj. Оператор S — неотрицательный, так как он имеет
базисную систему ортонормированных собственных векторов х1ч..., хда,
соответствующих неотрицательным собственным значениям jAb ...
.., |Am. Кроме этого, S2xt = Hxi — XiXi. Таким образом, операторы
S2 и Я совпадают на векторах базиса хь ..., хт, поэтому они
совпадают и на всех векторах, т. е. S2 = Я.
Неотрицательный оператор S называется арифметическим корнем
квадратным из неотрицательного оператора Я, если S2 = Я.
Важно подчеркнуть, что все собственные векторы операторов S
и Я совпадают. В самом деле, предположим, что Хх, ..., Хг и
252 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
yki, ..., ук, — все различные собственные значения операторов Н и S
соответственно. Обозначим через Xt (Yt), i = 1, 2, ..., г, собственное
подпространство оператора Я (S), содержащее все собственные векторы,
соответствующие собственному значению Xt (]/%). Прямые суммы соб-
собственных подпространств Xl9 ..., Хг и Уь ..., Уг совпадают со всем
пространством. Поэтому
! + ... + dimX, = dim Y1 +. .. + dim Yr. G7.2)
Ясно, что для всех i YtczXi9 т.е. dim У^ < dim Хг. Следовательно,
равенство G7.2) может иметь место лишь в том случае, когда для
всех i будет выполняться равенство dim У; = dimXt, т. е. Yt = Х(.
Итак, собственные значения и собственные векторы оператора S
однозначно определяются оператором Я. Так как S — эрмитов опера-
оператор, то это означает, что арифметический корень из оператора Я
может быть лишь единственным.
Упражнения.
1. Доказать, что множество всех унитарных операторов в данном уни-
унитарном пространстве образует группу по умножению.
2. Доказать, что множество всех эрмитовых операторов в данном уни-
унитарном пространстве образует группу по сложению.
3. Пусть оператор А — эрмитов, В — положительно определенный. Дока-
Доказать, что собственные значения операторов В А и В~ гА — вещественные.
4. Доказать, что если А, В — положительно определенные операторы,
то все собственные значения оператора ВА положительны.
5. Доказать, что если А, В — перестановочные положительно определенные
операторы, то оператор ВА также положительно определенный.
6. Доказать, что если А есть положительно определенный оператор
в унитарном пространстве, то функция (х, у)д = (Ах, у) удовлетворяет всем
аксиомам скалярного произведения.
§ 78. Операторы А*А и АА*
Если оператор А действует из унитарного пространства X в уни-
унитарное пространство У, то в X определен оператор А*А, а в У —
оператор 4Л*. Эти операторы будут играть в дальнейших исследова-
исследованиях существенную роль, поэтому мы займемся сейчас их изучением.
Из первого и четвертого свойств G5.4) вытекает, что операторы
А*А и ЛЛ* — эрмитовы. Более того, они неотрицательные, так как
для любых векторов х е X, у е У имеем
(А*Ах, х) = (Ах, Ах) > О,
(АА*у, у) = (А*у, Л*H>О.
Поэтому в пространстве X существует неотрицательный оператор G,
а в пространстве У — неотрицательный оператор F такие, что
4*4 -G2, 44* =f2,
§ 78] ОПЕРАТОРЫ А*Л и АА* 253
Операторы G и F, удовлетворяющие этим соотношениям, — един-
единственные.
Каков бы ни был оператор Л, оператор А*А имеет ортонормиро-
ванную систему собственных векторов xl9 х2, ..., хт. Эта система
всегда переводится оператором А в некоторую ортогональную систему.
Действительно, пусть
А*Ахк = р2кхь рк > О G8.1)
для всех к = 1, 2, ..., ш. Тогда
(Лхь Axt) = (i4*i4xfc, xO = pi (xk, xt) = О
при к Ф I. Кроме этого, для всех к
поэтому вектор Ахк отличен от нулевого тогда и только тогда, когда
собственное значение р? оператора Л*Л не равно нулю.
Ненулевой вектор Ахк_ является собственным вектором оператора
ЛЛ* и соответствует собственному значению рк. В самом деле,
согласно G8.1)
Л Л* (Ахк) = Л (А*Ахк) = A {plxk) = р^Ахк.
Таким образом, все ненулевые собственные значения оператора
А*А являются собственными значениями оператора АА*. Конечно,
верно и обратное утверждение. Поэтому ненулевые собственные зна-
значения операторов А*А и АА* всегда совпадают.
Собственные значения операторов А*А и АА* мы будем обозна-
обозначать через pf, p2, ... При этом, не ограничивая общности, можно
считать, что
2
а остальные собственные значения рк равны нулю. Очевидно, что
собственные значения операторов А*А и АА* отличаются лишь крат-
кратностью нулевого собственного значения. У оператора А*А она равна
(т — t), у оператора АА* — (п — t).
Арифметические значения квадратных корней из общих собственных
значений операторов А*А и АА* называются сингулярными (или
главными) числами оператора А.
Используя собственные векторы операторов А* А и А А*, можно
построить такие ортонормированные базисы в пространствах X и У,
с помощью которых легко описывается и исследуется действие опе-
операторов Л и Л*. Возьмем за базис в пространстве X ортонорми-
рованную систему хи ..., хт собственных векторов оператора А*А.
Как вытекает из G5.8), векторы л^, ..., xt образуют базис в Г*,
векторы xt+i, ..., хт — базис в N. Ортонормированный базис yl9 ..., уп
в пространстве У построим следующим образом. В качестве у1щ ..., vr
возьмем векторы, полученные после нормировки Ахх, ..., Axt. Эти
254
СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА
[Гл. 9
векторы образуют базис в Т. За yt+l9 ..., уп возьмем любой орто-
нормированный базис в N*. Ясно, что векторы уи ..., уп являются
собственными для оператора АА* и образуют базис в У. Учитывая,
что | Ахк | = рь теперь находим
f РкУь k^t,
o, k>,
Умножая эти равенства на оператор ,4* и принимая во внимание G8.1),
получаем
f ркхк, ? < t,
о, *>е
Ортонормированные базисы в пространствах X, У, связанные с опе-
операторами Ау А* соотношениями G8.2), G8.3), называются сингулярными
базисами.
Если пространства X, У—различные, то в сингулярных базисах
можно написать матрицу оператора А. Обозначим ее через Л.
Согласно G8.2) она такова:
'\ о ¦
О
р(
G8.4)
Если пространства X, У совпадают, то сингулярные базисы, как пра-
правило, не используют для написания матрицы оператора. Однако
соотношения G8.2), G8.3) снова имеют место.
Упражнения.
1. Доказать, что совпадают между собой ядра операторов А, А*А (А*, АА*)
и области значений операторов А* А А* (А*, А* А).
2. Доказать, что если dim X > dim У (dim X < dim У), то оператор А*А
(А А*) — вырожденный.
3. Доказать, что сингулярные числа не меняются от умножения оператора. А
на любые унитарные операторы.
4. Пусть оператор А действует в пространстве .Y и все его сингулярные
числа попарно различны. Доказать, что сингулярные базисы определяются
однозначно с точностью до умножения каждого из векторов на число, по
модулю равное единице.
5. Доказать, что у нормального оператора сингулярные числа совпадают
с модулями собственных значений.
6. Доказать, что сингулярные числа оператора А'1 обратны к сингулярным
числам оператора А, а сингулярные базисы обоих операторов совпадают.
7. Пусть оператор А действует в /«-мерном унитарном пространстве X.
Обозначим через Хи ..., Хт его собственные значения, через ри .., pw —
§ 791 РАЗЛОЖЕНИЯ ПРОИЗВОЛЬНОГО ОПЕРАТОРА 255
сингулярные числа. Доказать, что
< ZpZ> ft l**l= Пр*-
8. Доказать, что если | Хк | = pk для всех к = 1, 2, ..., m, то оператор —
нормальный.
§ 79. Разложения произвольного оператора
Одним из обстоятельств, определяющих значение унитарного и
эрмитовою оператора, является возможность представления через эти
операторы произвольного линейного оператора.
Пусть произвольный линейный оператор А действует в унитарном
пространстве X. Покажем, что его всегда можно представить в виде
A = Hi+iH2, G9.1)
где Н1 и Н2 — эрмитовы операторы. В самом деле, если это разло-
разложение существует, то
Л* = Н1 - Ш2.
Но тогда
Н^^А+А*), Н2 = ±-(А-А*).
Полученные формулы и определяют разложение G9.1). Так как
Н1Н2 - Н2Н, = ^г (А*А - АА*),
то из нормальности оператора А следует перестановочность операто-
операторов Яь Я2, и наоборот.
Пусть хь ..., хт — ортонормированная система собственных векто-
векторов оператора А*А. Согласно G8.2) существует ортонормированная
система уи ..., ут собственных векторов оператора АА* такая, что
Ахк = ркУк G9.2)
для всех к. Определим теперь линейные операторы F и U в простран-
пространстве X следующими равенствами на базисных системах векторов:
Uxk = yb Fyk = pkyk. G9.3)
Соотношения G9.2), G9.3) означают, что получено разложение
А = FU. G9.4)
Здесь F — неотрицательный эрмитов оператор, поскольку он имеет
базисную ортонормированную систему собственных векторов у1ч у2, ...
..., ут и неотрицательные собственные значения рь р2, ..., рт. Опе-
Оператор U — унитарный, так как он переводит ортонормированную
256 Строение линейного оператора [гл. 9
систему векторов хь х2, ..., хт в ортонормированную систему
У и У2, • • • > Ум- Отметим, что из G9.4) следует
АА* = F2, G9.5)
т. е. F есть арифметический корень квадратный из оператора
Разложение G9.4) называется полярным разложением оператора А.
В силу единственности арифметического корня всегда будет единствен-
единственным оператор F в полярном разложении. Оператор 17 будет един-
единственным лишь тогда, когда оператор А — невырожденный. В этом
случае U = F~XA.
Снова существует прямая связь между нормальностью оператора А
и перестановочностью компонент полярного разложения. В самом деле,
пусть UF — FJJ для некоторого оператора А, тогда
А* А = U*F*FU = F*U*UF = F2,
что вместе с G9.5) и означает нормальность оператора А.
Предположим теперь, что оператор А является нормальным, т. е.
А*А = АА*. Согласно G9.4), имеем А — FU. Следовательно, А* = U*F.
Условие нормальности оператора приводит к равенству U*F2U = F2
или
F2U= UF2.
Принимая во внимание второе из соотношений G9.3), получаем
для всех к = 1, 2, ..., т, т". е. векторы TJyk являются собственными
для оператора F2. Как отмечалось ранее, операторы F2 и F имеют
одни и те же собственные векторы, поэтому
для всех к = 1, 2, ..., т. С другой стороны, согласно второму из
соотношений G9.3)
(UF) yk=U (Fyk) = 17 (ркУк) = Pk (Uyk).
Полученные равенства показывают, что операторы FU и UF
совпадают на базисной системе векторов уи у2, ..., ут. Следова-
Следовательно, UF = FU.
Упражнения.
1. Доказать, что если оператор — нормальный, то собственные значения
оператора Ht (H2) из G9.1) суть вещественные (мнимые) части собственных
значений оператора А.
2. Доказать, что если оператор А — нормальный, то собственные значения
оператора F (аргументы собственных значений оператора U) из G9.4) являются
модулями собственных значений (аргументами ненулевых собственных значе-
значений) оператора А.
§ 80] ОПЕРАТОРЫ В ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ 257
3. Доказать, что если оператор А — нормальный, то оба оператора в раз-
разложении G9.1) имеют те же собственные векторы, что и оператор А. Что
можно сказать о собственных векторах компонент разложения G9.4)?
§ 80, Операторы а вещественном пространстве
При исследовании линейных операторов, действующих в веществен-
йом пространстве, возникают дополнительные трудности. Они связаны,
в основном, с тем, что не всякий линейный оператор в вещественном
пространстве имеет хотя бы один собственный вектор.
Конечно, если характеристический многочлен оператора в веществен-
вещественном пространстве имеет лишь вещественные корни, то имеет место
полная аналогия в теории. По существу, меняется только терминоло-
терминология. . Именно, слова «комплексный, унитарный, эрмитов» заменяются
соответственно на «вещественный, ортогональный, симметричный».
Если же характеристический многочлен имеет и комплексные корни,
то исследование такого оператора становится сложнее.
Пусть задано вещественное пространство R. Рассмотрим множество
всевозможных пар (х; у) векторов х, у из R. Определим операции
над этими парами. Будем считать, что
(х; у) + (и; v) = (х + и; у + v)
для любых двух пар, а для комплексного числа ~\; + щ и пары (х; у)
E +-iT|)(x; у) = (fyc - у\у; т\х + %у):
Легко проверить, что множество всех пар векторов из R с введенными
таким способом операциями представляет собой комплексное простран-
пространство С.,.
Построенное пространство С имеет ту же размерность, что й
пространство R« В самом деле, пусть ех, еъ ...., ет — базис в R,
Для любой пары векторов и9 v из R .имеем.
где ocj, Pf — вещественные числа. Но отсюда следует, что
Е 0). (80.2)
Система (е^ 0), ..., (ет; 0) линейно независима, поэтому размерность
пространства С равна т.
При любом базисе еи ..., ет в пространстве R и любых веще-
вещественных числах ai5 ..., aw выполняется равенство
9 В. В. Воеводин
258 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА 1Гл. <>
Следовательно, между всеми Лекторами и из R и всеми ларами вида
(м; 0) из С существует взаимно однозначное соответствие. Более того,
это соответствие есть изоморфизм, если ограничиваться операциями
С вещественными числами^
Если все пары вида (и; 0) отождествить с самими ректорами и из R,
то из (80.1), (80.2) вытекает, что пространство* С можно рассматривать
как множество элементов
w = и + iv,
где и, t?eR. Конечно, при этом следует помнить, что в действитель-
действительности элементы щ ч> есть пары (и; 0), (v; 0), а умножение на число i
и сложение осуществляются согласно введенным выше определениям.
При v = 0 м*>1 получаем элементы пространства R. Это пространство
естественно считать некоторым множеством из С* Элементы вида
U + ДО мы будем называть вещественными, элементы и + iv и и — iv —
комплексно сопряженными.
Пространство С называется комплексным расширением веществен*
ного пространства R.
При решении различных задач в евклидовом пространстве мы
можем аналогичным образом расширить это пространство до унитар-
унитарного. Рассмотрим комплексное расширение С евклидова пространства
R. Для любых двух векторов
z = х + iy, w = и + iv
из С будем считать по определению, что
(?, w)-((x, u) + (y, v)) + i((y9 и)-(х, !>)).
Нетрудно установить, что пространство С с таким скалярным про-
произведением становится унитарным. При этом скалярное произведение
для любых двух векторов из R сохраняется.
Пусть оператор А действует4 в пространстве R, Построим новый
оператор Л, действующий в пространстве? С и • совпадающий с опе-
оператором А на векторах из R. Для этого положим
А (и + iv) = Аи + iAv.
Ясно, что оператор А — линейный и Аи = Аи для всех векторов mgR,
Оператор А называется расширением оператора А на комплексное
пространство. С.
Теперь вместо изучения оператора \ в вещественном пространстве
R можно рассматривать оператор А в комплексном пространстве С
и исследовать его действие в R как множестве пространства С. Этим
приемом чаще всего и пользуются, если какому-либо факту в комплекс-
комплексном пространстве не находится соответствующего аналога в веществен*
ном пространстве.
Предположим, что в комплексном пространстве С выбран веще-
вещественный базис Тогда в этом базисе матрица расширенного опера-
§ 80] ОЙЕРАТОРЫ Ь ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ 25?
тора А будет вещественной и будет совпадать с матрицей оператора
А в том же базисе. Отсюда вытекает, что характеристический много-
многочлен оператора А совпадает с характеристическим многочленом опе-
оператора А и, следовательно, имеет вещественные коэффициенты. Оче-
Очевидно, что
Если характеристический многочлен оператора А, действующего
в вещественном пространстве R, имеет вещественный корень, то этот
корень является собственным значением оператора А и ему соответ-
соответствует по крайней мере один вещественный собственный вектор.
Рассмотрим теперь какой-либо комплексный корень X характе-
характеристического многочлена оператора А. Он является собственным*
значением оператора А и ему соответствует некоторый собственный
вектор w. Так как коэффициенты характеристического многочлена
оператора А — вещественные, то этот оператор будет иметь и комп-
комплексно сопряженное собственное значение X. Оператор А переводит-
комплексно сопряженные векторы в комплексно сопряженные, поэтому]
из Aw = Xw вытекает Aw = Xw. Следовательно, комплексно сопряжен-
сопряженным собственным значениям оператора А соответствуют комплексно
сопряженные векторы.
Если X Ф X, то векторы w, w будут линейно независимыми как
собственные векторы, соответствующие различным собственным зна-
значениям.
Рассмотрим векторы х, у, определяемые следующим образом через
w, w:
x = J_(w + Vv), y = -4-(w-w). (80.3)
Легко проверить, что они вещественные. Кроме этого, нетрудно
установить, что если X = р. + iv, то
Ах = \ix — vy, Ay =s vx 4- цу.
Поэтому линейная оболочка в пространстве R, построенная на векторах
(80.3), является инвариантным подпространством оператора А. Матрица
индуцированного оператора на этом подпространстве в базисе (80.3)
такова:
с
V-V
Следовательно, характеристический многочлен индуцированного опера-
оператора равен (z - цJ Ч- v2 или, что то же самое, z2 — (X 4- X) z + XX.
Отметим, что в построенном инвариантном подпространстве оператор
А не имеет ни одного собственного вектора при v Ф 0. Таким образом,
мы получили важный вывод. Именно:
Если характеристический многочлен оператора А, действующего
в вещественном пространстве R, имеет комплексный (не веществен-
вещественный!) корень, то этому корню в пространстве R соответствует
9*
260 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл, 9
двумерное инвариантное подпространство оператора А, не содержащее
собственных векторов.
Этот вывод имеет такое же 'значение для исследования операторов
в вещественном пространстве, как и факт существования по крайней
мере одного собственного вектора для исследования операторов
в комплексном пространстве. Выбирая подходящим образом базисы
в пространстве R, можно приводить матрицу оператора к виду,
в каком-то смысле похожему либо на диагональный, либо на тре-
треугольный, либо на каноническую форму Жордана, Подобный путь
исследования оператора используется относительно редко, так как
вещественные канонические формы не обладают многими достоин-
достоинствами комплексных канонических форм. Значительно легче и плодо-
плодотворнее исследовать расширение оператора на комплексное простран-
пространство.
Упражнения,
1. Доказать, что область значении (ядро) оператора А является комплекс-
комплексным расширением области значений (ядра) оператора Л.
2. Пусть расширенный оператор Д имеет простую структуру. Доказать,
что в пространстве R может быть выбран такой базис, в котором матрица
оператора Л имеет квазидиагональный вид с матрицами 1-го и 2-го порядков
на диагонали.
3. Доказать, что в вещественном пространстве R размерности т любой
оператор имеет инвариантное подпространство размерности т — 1 или т — 2,
4. Какой аналог имеет в вещественном пространстве теорема 72.1?
5. Доказать, что любой линейный оператор, действующий в вещественном
пространстве нечетной размерности, имеет по крайней мере один-собственный
вектор,
§ 81. Матрицы специального вида
Мы рассмотрели" некоторые операторы специального вида. Есте-
Естественно предположить, что и матрицы этих операторов должны
обладать определенной спецификой.
Квадратная комплексная матрица U называется унитарной, если
сопряженная матрица 17* совпадает с обратной U~x9 т.е.
= 17*1/ = ?.
Напомним, что в ортонормированном базисе сопряженному опера-
оператору соответствует сопряженная матрица. Следовательно, матрица
унитарного оператора в ортонормированном базисе является уть,
тарной.
Пусть в унитарном пространстве заданы любые два ортонорми-
рованных базиса. Построим матрицу преобразования координат при
переходе от одного из этих базисов к другому. Согласно формуле
F3.3) столбцы матрицы составлены из координат векторов второго
базиса относительно первого базиса. Но такой же вид имеет и мат-
§ 81] МАТРИЦЫ СПЕЦИАЛЬНОГО ВИДА 261
рица линейного оператора, преобразующего векторы первого базиса
в векторы второго базиса. Согласно второму следствию из теоремы
77.2 этот оператор является унитарным, Поэтому
Матрица преобразования координат при переходе от ортон'ормиро-
ванного базиса к ортонормированному является унитарной.
Мы будем называть две матрицы унитарно подобными, если они
подобны и матрица подобного преобразования является унитарной.
Из свойств унитарного оператора вытекает, что любая унитарная
матрица унитарно подобна диагональной матрице с диагональными
элементами, по модулю равными единице.
Легко написать соотношения, определяющие элементы унитарной
матрицы. Пусть матрица U имеет порядок т. Обозначим через щ^
ее элементы. Тогда из равенства 1/17* = Е следует, что
" 0, если i Ф j,
если i~j.
Аналогично, из равенства U*U = Е получаем, что
О, если \Ф],
, если /=j.
Таким образом, системы векторов-строк и векторов-столбцов любой
унитарной матрицы представляют собой ортонормированные системы*
Вещественная унитарная матрица U называется ортогональной* Эта
матрица определяется такими соотношениями:
UU' - U'U « Е.
Все свойства ортогональных матриц вытекают из свойств унитарных
матриц.
Квадратная комплексная матрица Я называется эрмитовой или
самосопряженной, если она совпадает со своей сопряженной, т, е.
Я = Я*.
Таким образом, матрица эрмитова оператора в ортономированном
базисе является эрмитовой.
Из свойств эрмитова оператора следуех, что любая эрмитова
матрица унитарно подобна вещественной диагональной матрице. Если
hij — элементы эрмитовой матрицы Я, то
для всех z, j. Отсюда, в частности, получаем, что диагональные эле-
элементы любой эрмитовой матрицы — вещественные,
Вещественная эрмитова матрица Я называется симметричной. Эта
матрица определяется таким соотношением:
262 СТРОЕНИЕ ЛИНЕЙНОГО ОПЕРАТОРА [Гл. 9
Отметим, что любая симметричная матрица ортогонально подобна
вещественной диагональной матрице.
Квадратная матрица называется нормальной, если она перестано-
перестановочна со своей сопряженной.
Согласно этому определению, матрица нормального оператора
в ортонормированном базисе является нормальной. Принимая
во внимание свойства нормального оператора, легко понять, что
любая комплексная нормальная матрица унитарно подобна диагональ-
диагональной матрице.
Матрицы специального вида играют большую роль в построений
самых различных вычислительных алгорифмов. Тем не менее, мы
не будем заниматься их детальным исследованием, ^се свойства этих
матриц, по существу, являются отражением аналогичных свойств
соответствующих операторов.
Упражнения.
1. Доказать, что любая комплексная матрица унитарно подобна треуголь-
треугольной матрице.
2. Пусть Xi9 %2> •..» кт — собственные значения матрицы А, причем каждое
собственное значение выписано столько раз, какова его кратность. Доказать,
что
t). (81.1)
3. Доказать, что равенство в соотношении (81.1) имеет место тогда и
только тогда, когда матрица А — нормальная.
4. Используя формулу Бине — Коши, доказать, что для любой матрицы А
главные миноры матрицы А*А неотрицательны.
5. Доказать, что сумма квадратов модулей всех миноров унитарной мат-
матрицы, расположенных в любых фиксированных строках или столбцах, равна
единице.
6. Доказать, что любая прямоугольная матрица А может быть представлена
в виде А ~ QAS, где Q9 S — унитарные матрицы, Л — диагональная матрица
с неотрицательными элементами.
ГЛАВА 10
МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА
§ 82. Непрерывность и ограниченность оператора
Мы ввели понятие линейного оператора как некоторое обобщение
понятия функции. Если предположить, что в пространствах определена
метрика; то можно провести аналогию с ограниченностью .функции,
непрерывностью функции и т»п. При изучении .этих вопросов мы
всегда будем считать, что оператор действует из m-мерного нормиро-
нормированного пространства X в и-мерное нормированное пространство Y
Если X. не совпадает с Y, то нормы в обоих пространствах могут
быть введены лезависимо друг от друга.
Оператор А, действующий из X в Y, называется непрерывным
в точке хоеХ, если из условия хк~+х0 следует Ахк-+Ах0 для любой
последовательности {хк} из X. Если оператор непрерывен в каждой
точке пространства X, то он называется непрерывным всюду или
просто непрерывным,
Теорема 82.1. Линейный оператор, действующий в произвольных
конечномерных нормированных пространствах, является непрерывным*
Доказательство. Возьмем произвольный вектор. хоеХ п выбе-
выберем в X любой базис еъ е2% ..., ет. Имеем
Предположим, что хк^>х0 и
Согласно теореме 53.1, из сходимости по норме вытекает координат-
координатная сходимость. Поэтому Z,ikJ -»^f)) при всех s. Но
и, кроме этого,
Теперь ш сходимости Z™ -* ^(s0) при всех s будет следовать сходимость
Ахк-*Ах0 по норме пространства Y.
Оператор А называется ограниченным, если существует такая
константа М, что ||Лх|| <М ||х|| для любого вектора хеХ.
Теорема 82.2. Линейный оператор, действующий в произвольных
конечномерных нормированных пространствах, является ограниченным.
264 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА [Гл. 10
Доказательство. Пусть в каком-либо случае оператор А не
является ограниченным. Тогда найдется такая последовательность
{хк} ненулевых векторов, что
\\Ах-к\\>к\\хк\\.
Рассмотрим последовательность векторов
Ук
Она сходится к нулю, так как
1
Ук~ к\\хк\\Хк'
1
С другой стороны;
Это означает, что последовательность {Аук} не сходится к нулю,
т. е. оператор А не является непрерывным в нуле. Полученное про-
противоречие с теоремой 82.1 завершает доказательство»
Естественно поставить вопрос о наименьшей из констант М,
удовлетворяющих условию || Ах\\<М\\х \\ для всех векторов х.
Так как множество этих констант ограничено снизу нулем, то наимень-
наименьшая .константа заведомо существует. Она называется нормой операто*
ра А и обозначается символом ||Л||, По определению норма опе-
оператора обладает следующими двумя свойствами:
1) для любого вектора х из пространства X справедливо не-
неравенство
Н Ас|| •< МИ-II*И, (82.1)
2) для каждого числа е>0 найдется такой вектор xseX, что
№*,Ц >(МИ-*)и*,К. <ш>
Докажем, что
MIH sup || Ас || (82.3)
И х 11 ^ А
или, что то же самое*
если, конечно, dim X > 0.
Возьмем произвольный вектор х9 удовлетворяющий неравенству
И х || < 1. Тогда из (82.1) вытекает, что
Следовательно»,
sup || Ах д< \\А ||. (82.5)
II х И ^ I
§ 83] НОРМА ОПЕРАТОРА 265
Возьмем, далее, любой вектор хе согласно (82.2) и построим вектор.
Тогда
Так как || ys ]| = 1, то
sup Ш\[>\\АуЛ>Ш-ь
IIх и ^ i
В силу произвольности s получаем, что
sup || Ас Ц > || Л ||. 182.6)
II * II < 1
Теперь из (82.5); (82.6) следует соотношение (82.3), которое и требова-
требовалось установить.
В ближайшее время мы покажем, что норма оператора играет
исключительно важную роль при введении метрики в пространствах
линейных операторов. При этом будет существен именно явный
вид (82.3).
Упражнения.
1. Доказать, что на ограниченном замкнутом множестве векторов достигают-
достигаются верхняя и нижняя грани норм значений линейного оператора.
2. Доказать, что линейный оператор переводит любое ограниченное замкну-
замкнутое множество снова в ограниченное замкнутое множество.
3. Верно ли утверждение предыдущего упражнения, если не требовать
ограниченности множества?
4. Доказать, что в формуле (82.3) верхняя грань достигается на множестве
векторов, удовлетворяющих условию ||х|| = 1, если только dimJ?>0.
5. Пусть оператор А действует в пространстве X. Доказать, что А являет-
является невырожденным тогда и только тогда, когда существует такое число
т > О, что || Ах || ^ т || х || для любого хеХ.
§ 83. Норма оператора
Множество <дХу линейных операторов, действующих из X в Y9
есть конечномерное линейное пространство. Если это пространство
является вещественным или комплексным, то его можно превратить
в полное метрическое пространство, введя в нем каким-либо образом
норму.
Введение нормы в пространстве линейных операторов осуществляет-
осуществляется такими же способами, как и в любом другом линейном пространстве;
Однако в данном случае наибольший интерес представляют лишь те
нормы в (оХу> которые достаточно тесно связаны с нормами в прост-
пространствах X, Y. Один из важнейших классов подобных норм состав-
составляют так называемые согласованные нормы,
266 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА [Гл. 10
Если для каждого оператора из ®Xy выполняется неравенство
для всех хеХ, то норма операторов называется согласованной с
векторными нормами в пространствах X, Y.
Преимущество согласованных норм легко видеть на следующем
примере. Предположим, что X есть собственное значение оператора А,
действующего в пространстве X, х — соответствующий ему собствен-
собственный вектор. Тогда Ах = Хх и поэтому
Следовательно, \Х\ < || А Ц. Итак, мы получили весьма важный вывод:
Модули собственных значений линейного оператора не превосхо-
превосходят любой его согласованной нормы.
Данный пример показывает, что для получения наилучших оценок
желательно использовать наименьшую из согласованных норм. Ясно,
что все согласованные нормы ограничены снизу выражением (82.3).
Если мы покажем, что это выражение удовлетворяет аксиомам нормы,
то оно и будет представлять наименьшую из согласованных норм.
Тем самым мы оправдаем как название выражения (82.3), так и его
обозначение.
Очевидно, что для любого оператора А выражение || А || неотри-
неотрицательно. Если || А || == 0, т. е.
1Uxll=0-
то || Ах |1 = 0 для всех векторов* х, норма которых не больше еди-
единицы. Но тогда, в силу линейности оператора, Ах = 0 для всех л?.
Следовательно, А = 0. Для любого оператора А и числа X имеем
||Ы||=: SU? ||Ых||=|Х1 SU|> ||Лх||=|:
И, наконец, для любых двух операторов А, В из
|| А + В И — sup |[ Ах + Вх || < sup (И Ах \\ + ]| Вх ||) <
-ЦВЦ.
Все эти соотношения и означают, что выражение (82.3) представляет
собой норму в пространстве линейных операторов. Норма (82.3) на-
называется нормой оператора, подчиненной векторным нормам в
пространствах X, Y.
Подчиненная норма обладает весьма важным свойством и по
отношению к операции умножения операторов. Пусть оператор А
действует из X в У, оператор В — из У в Z. Тогда, как известно,
«пределен оператор В А. Учитывая согласованность подчиненных норм,
§ 83] НОРМА ОПЕРАТОРА 267
находим
\\BA\\ = sup ||(А1)х|| = sup \\В(Лх)\\ <
II х \\ < 1 || х || ^ 1
< sup (||В|[-|Мх||)=||ВП sup Мх|| = ||В||.||Л1|,
II х И ^ 1 ]| л* || ^ 1
Таким образом, всякая подчиненная норма оператора обладает
следующими четырьмя основными свойствами. Для любых операторов
А9 В и любого числа X
1) ||4||>0, если ЛФО; ||0Ц=0,
2) \\ХА\\ = \Х\\\А\\,
3)
4)
В качестве дополнительного свойства отметим, что для тождествен-
тождественного оператора Е справедливо равенство
5) ||?|| = 1.
Оно вытекает из (82.3), так как Ех = х для любого вектора х.
В общем случае подчиненная норма оператора зависит как от
нормы в пространстве X, так и от нормы в пространстве Y. Если
оба эти пространства являются унитарными, то в качестве нормы в
них может быть взята длина векторов. Соответствующая подчиненная
норма оператора называется спектральной нормой и обозначается
символом || «Ца- Итак, для любого оператора А9 действующего из
X в Y,
\\A\\22={xSu^(Ax9 Ax). (83.2)
Исследуем некоторые свойства спектральной нормы.
Спектральная норма не меняется от умножения оператора на
любые унитарные операторы.
Пусть V, U — произвольные унитарные операторы, действующие
соответственно в пространствах X, Y. Рассмотрим оператор В = UAV%
Имеем
ЦВ|Ц= sup (Bx,Bx)= sup (UAVx, UAVx) =
(x,.\Ki (x,x)^i
= sup (AVx, U*UAVx) = sup (AVx9 AVx) =
ix,x)kr (x,x)kr
= sup (AVx, AVx) = sup [Av, Av) = \\ А Ц |.
(Kv, K\) < 1 (v, v) < 1
Задание спектральной нормы в форме (83.2) позволяет установить
ее связь с сингулярными числами оператора А. Пусть xl9 x2, ...
..., х'т — ортонормированная система собственных векторов оператора
А*А9 pf, pi, ..., Pm — его собственные значения. Не ограничивая
268 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА (Гл. 10
общности, предположим, что
Pi ^ Рг ^ • • • ^ Рт ^ ^ (oi.ij
Представим вектор хеХ в виде разложения
х = aj^i + ... + сстхт9 (83.4)
тогда
Как отмечалось в § 78, система хь хъ ..., xw переводится операто-
оператором А в ортогональную систему, при этом
{Axh Axt) р= р?
для всех I. Следовательно,
(Ах9 ?
что дает,
\\А\\22= sup f|a,.|2p?. (83.5)
Ясно, что при условии (83.3)
Mlli<pf.
Но для вектора хх правая часть (83.5) принимает значение р?.
Поэтому
\\л\\22 = р1
Таким образом,
Спектральная норма оператора А равна максимальному сингулярно-
сингулярному числу.
Напомним, что для нормального оператора А сингулярные числа
совпадают с модулями собственных значений. Следовательно, спектраль-
спектральная норма унитарного оператора равна единице, спектральная нор-
норма неотрицательного оператора равна наибольшему собственному
значению.
Упражнения.
1. Доказать, что для любого собственного значения X оператора А спра-
справедливо неравенство
2. Пусть <р (г) — любой многочлен с неотрицательными коэффициентами.
Доказать, что
3. Доказать, что || Л \\ ^ Ц А \\ ~* для любого невырожденного оператора Л.
Когда имеет место равенство в случае спектральной нормы?
§ 84] , МАТРИЧНЫЕ НОРМЫ ОПЕРАТОРА 269
§ 84. Матричные нормы оператора
Спектральная норма по существу является единственной подчинен-
подчиненной нормой оператора, вычисление которой не связано явно с базиса-
базисами. Если же в пространствах, в которых заданы операторы, фикси-
фиксированы какие-либо базисы, то возможность введения операторных
норм существенно расширяется.
Итак, снова рассмотрим линейные операторы, действующие из
пространства X в пространство Y. Предположим, что в X фикси-
фиксирован базис еи е2, •••> ет в Y~ базис qu q2, ..., qn. Разложив
произвольный вектор хе! по базису, получим
х = х1е1 +... + хтет. (84.1)
Теперь норму в пространстве X можно ввести, например, согласно
формуле E2.3) или каким-либо иным способом через коэффициенты
разложения (84.1). Аналогичным образом может быть введена норма
и в пространстве Y.
Наиболее употребительными являются нормы вида E2.4). Поэтому
мы будем исследовать нормы операторов, подчиненные и согла-
согласованные именно с этими нормами. Более того, мы будем считать,
что в обоих пространствах X и У введены нормы одного и того же
типа. Очевидно, что соответствующие нормы оператора А должны
быть каким-то образом связаны с элементами atj матрицы оператора
в выбранных1 базисах.
Установим сначала выражения для норм операторов, подчинен-
подчиненных 1-нормам и оо-нормам из E2.4). Имеем
= sup \\Axh= sup
Покажем теперь, что для некоторого вектора, х, удовлетворяющего
условию Hxjji^l, || Ах ||i совпадает с правой частью полученного
соотношения.
Пусть наибольшее значение в правой части достигается при j = I.
Тогда все неравенства обращаются в равенства, например, при х = ех.
Итак,
270 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА {Гл. 10
Аналогично исследуется и другая норма:
МИ * = sup \\Ax\\o0= sup (max
11*1» <i l-Xlle^iKKfl
= | max
Предположим, что наибольшее значение в правой части достигает-
достигается при i = /. Возьмем вектор х с координатами Xj = \ aVi \ /аи, если
ау Ф 0, Xj = 1, если a(j = 0. Нетрудно проверить, что для этого век-
вектора все неравенства обращаются в равенства. Следовательно,
Для того чтобы найти норму оператора, подчиненную 2-нормам
из E2.4), поступим следующим образом. Введем в пространствах X,
Y скалярное произведение по аналогии с C2.1). Тогда 2-норма из
E2.4) будет совпадать с длиной вектора. Поэтому подчиненная норма
есть не что иное, как спектральная норма оператора, соответствующая
данному скалярному произведению. Базисы при выбранных скалярных
произведениях становятся ортонормированными. поэтому в этих базисах
сопряженному оператору будет соответствовать сопряженная матрица.
Если через Aqe мы обозначим матрицу оператора Л, то из сказан-
сказанного выше вытекает, что:
Норма оператора, подчиненная 2-нормам, равна максимальному
сингулярному числу матрицы Айе.
Рассмотренные нормыявляются некоторыми функциями от матрицы
оператора. Подобным образом можно строить не только подчиненные,
но и согласрванные нормы. Одной из важнейших согласованных норм
является так называемая евклидова норма. Мы будем обозначать ее
символом II * \\е- Если в выбранных базисах оператор А имеет матрицу
Aqe с элементами а^9 то по определению
(п т \1/2
Правая часть этого выражения является нормой в п х т-мерном
пространстве линейных операторов. Поэтому выполнение первых трех
свойств из (83.1) не вызывает сомнений. Весьма важным является
то обстоятельство, что для евклидовой нормы выполняется и четвер-
четвертое свойство из (83.1). Для доказательства воспользуемся неравенством
Коши - Буняковского типа B7.5).
§ 84] МАТРИЧНЫЕ НОРМЫ ОПЕРАТОРА 271
Рассмотрим линейные пространства X, Y, Z размерности соответ-
соответственно т, и, р. Пусть оператор А действует из X в Y, оператор В —
из *У в Z. Через aij9 b(j обозначим элементы матриц этих опера-
операторов в выбранных базисах. Имеем
р т / п \/п W1/2
Z ZI ZIWH 1Ы2 =
В общем случае евклидова норма не является подчиненной. Согла-
Согласованность ее с 2-нормами доказывается таким же способом, как и
только что рассмотренное свойство.
Непосредственная проверка позволяет установить важные формулы
для евклидовой нормы. Именно,
\\Л\\Е = tt(A*eAqe) = tt(AqfA*e). (84.2)
Теперь можно сделать следующие выводы.
Сопряженной матрице в ортонормированных базисах соответствует
сопряженный оператор. Мы превратим выбранные базисы в орто-
нормированные, если введем в пространствах Х9 Y скалярные произ-
произведения по аналогии с C2.1). Т^к как след матрицы равен сумме ее
собственных значений, то из (84.2) вытекает, что:
Квадрат евклидовой нормы оператора равен сумме квадратов его
сингулярных чисел.
При введении скалярных произведений в X, Y можно говорить
об унитарных операторах, В отношении именно этих унитарных
операторов легко показать, что:
Евклидова норма, не меняется от умножения оператора на любые
унитарные операторы.
Действительно, как отмечадось в упражнениях к § 78, сингулярные
числа не меняются от умножения на унитарные операторы, а евкли-
евклидова норма выражается только через сингулярные числа.
В большинстве приложений, связанных с нормами, важно не столько
явное задание нормы оператора,, сколько выполнение свойств (83.1).
Поэтому норму оператора можно определить аксиоматически через его
матрицу. Выберем в пространствах, в которых заданы операторы,
какие-либо базисы, тогда каждому оператору будет соответствовать
некоторая матрица. Каждой матрице поставим в соответствие число,
обозначаемое символом || • ||, и предположим, что при этом выпол-
выполнены условия (83.1) как аксиомы. Число || • || будем называть нормой
матрицы. Если теперь каждому оператору поставить в соответствие
272 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА [Гл. 10
норму его матрицы, то ясно, что тем самым вводится норма в
пространстве операторов. Условия (83.1), очевидно, выполняются и для
операторов. Верно и обратное. Любая норма оператора порождает
при фиксированных базисах норму матрицы. Эти нормы матриц мы
будем обозначать аналогичными символами ||«||2, Ц-Ц^ и т. д. Оче-
Очевидно, что аксиоматически мы можем потребовать и согласованность
нормы.
Рассмотренные выше примеры показывают, что практическая реали-
реализация аксиоматического задания нормы оператора через норму мат-
матрицы возможна. Говоря в дальнейшем о нормах матриц и операто-
операторов, мы будем всегда предполагать их согласованность и выполнение
условий (83.1).
Упражнения.
1. Доказать, что при любой норме для единичной матрицы выполняется
неравенство
|| ?||^1. (84.3)
2. Пусть Xl9 ..., Хт — собственные значения матрицы А. Доказать, что
в ki
Сравните это равенство с (81.1).
§ 85. Операторные уравнения
Одной из важнейших задач алгебры является решение систем ли-
линейных алгебраических уравнений. Мы уже неоднократно встречались
с этой задачей на протяжении всего курса. Теперь рассмотрим ее с
точки зрения теории линейных операторов.
Пусть задана система F0.2) с элементами из поля Р вещественных
или комплексных чисел. Возьмем любое m-мерное пространство X
и и-мерное пространство У над одним и тем же полем Р и зафикси-
зафиксируем в них какие-либо базисы. Тоща соотношения F0.2) будут экви-
эквивалентны одному матричному равенству типа F1.2), а оно в свою
очередь эквивалентно операторному равенству
Ах = у. (85.1)
Здесь А есть оператор, который действует из X в У и в выбранных
базисах имеет ту же матрицу, что и система F0.2). Векторы хеХ
и yeY имеют в выбранных базисах соответственно координаты
Йь ..., 5J и (ль ...9 цп).
Таким образом, вместо систем линейных алгебраических уравнении
мы можем рассматривать уравнения (85.1). Задача состоит в опреде-
определении всех векторов хеХ, которые при заданных операторе А и векто-
векторе уе У удовлетворяют (85.1)* Уравнение вида (85.1) называется опе-
операторным уравнением, вектор у — правой частью, вектор х — решением.
§ 85] ОПЕРАТИВНЫЕ УРАВНЕНИЯ 273
Конечно, все свойства систем уравнений автоматически переносятся
на операторные уравнения и наоборот.
Теорема Кронекера — Капелли формулирует необходимое и доста-
достаточное условие разрешимости системы в терминах ранга матрицы.
Это не очень удобно, так как не позволяет заметить той глубокой
связи, которая существует между системами и уравнениями других
типов.
Пусть пространства X, Y- унитарные, тогда определен оператор Л*.
Уравнение (85.1) будем называть основным неоднородным уравнением,
уравнение
^ сопряженным неоднородным уравнением. Если правые части — нуле-
нулевые, то соответствующие уравнения будем называть однородными.
Справедливо следующее утверждение*.
Или основное неоднородное уравнение имеет решение при любой
правой части, или сопряженное однородное уравнение имеет по крайней
мере одно ненулевое решение.
Действительно, обозначим через г ранг оператора А. Такой же
ранг будет иметь и оператор А*. Могут быть два случая: или
г = и, или • г < п. В первом случае область значений оператора А
имеет размерность п и, следовательно, совпадает с пространством К
Поэтому основное неоднородное уравнение должно иметь решение при .
любой правой части. В этом же случае дефект сопряженного опера-
оператора равен нулю, поэтому ядро не имеет ненулевых 'векторов, т. е.
сопряженное однородное уравнение не имеет ненулевых решений.
Если г < п, то область значений оператора А не совпадает с Y, и
основное неоднородное уравнение не может иметь решение при любой
правой части. При этом ядро сопряженного оператора состоит не
только из нулевого вектора, и поэтому однородное сопряженное
уравнение обязательно имеет ненулевые решения.
Особое значение доказанное утверждение имеет тогда, когда прост-
пространства X, Y совпадают. Теперь существование решения основного
неоднородного уравнения при любой правой части означает невырож-
невырожденность оператора А. Поэтому в данном случае справедлива так
называемая
Альтернатива Фредгольма. Или основное неоднородное
уравнение всегда имеет, и притом единственное, решение при любой*
правой части, или сопряженное однородное уравнение имеет по крайней
мере одно ненулевое решение.
Теорема Фредгольма. Для того чтобы основное неоднород-
неоднородное уравнение было разрешимо, необходимо и достаточно, чтобы, его
правая часть была ортогональна ко всем решениям сопряженного
однородного уравнения.
Доказательство. Обозначим через JV* ядро оператора Л*,
через Т— область значений оператора А. Если основное неоднородное
274 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА ГГл. 10
уравнение разрешимо, то правая часть уеТ. Согласно G5.8), отсюда
следует, что yl N*, т. е. (у, и) = О для всех векторов и, удовлетво-
удовлетворяющих уравнению Л*и = 0. Пусть теперь (у, и) = О для тех же векто*
ров и, тогда yl. N* и, согласно G5.8), уеТ. Но это означает, что
найдется такой вектор хеХ, что Ах = у, т.е. основное неоднородное
уравнение разрешимо.
Упражнения.
1. Доказать, что уравнение А*Ах — А*у разрешимо.
2. Доказать, что уравнение (А*А)рх = (A*Afy разрешимо при любых целых
положительных р9 q.
3. Установить геометрический смысл альтернативы и теоремы Фредгольма.
§ 86. Псевдорешения и псевдообратный оператор
Произвольное задание оператора А и правой части у может
привести к тому, что уравнение (85.1) не будет иметь ни одного
решения. Очевидно, это связано только с тем, что именно мы по-
нимаем под рещением уравнения.
Возьмем произвольный вектор хеХи рассмотрим вектор г = Ах — у,
называемый невязкой вектора х. Для того чтобы х был решением
уравнения (85.1), необходимо и достаточно, чтобы его невязка равнялась
нулю. В свою очередь, для того чтобы невязка равнялась нулю,
необходимо и достаточно, чтобы равнялась нулю ее длина. Таким обра-
образом, все решения уравнения (85.1) и только они удовлетворяют
равенству
\Ах-у\2=0.
Поскольку нулевое значение длины невязки является наименьшим,,
то определение решений уравнения (85.1) можно рассматривать как
задачу отыскания таких векторов х, для которых достигает наименьшего
значения выражение
Ф0(х) = \Ах-у\2. (86.1)
Правая часть этого выражения называется функционалом жвязки*
Нахождение векторов, минимизирующих функционал невязки, имеет
смысл и в том случае, когда решения уравнения (85.1) не существуют.
Это дает основание для следующего определения.
Псевдорешением (или обобщенным решением) уравнения (85.1) назы-
называется любой вектор хеХ, для которого функционал невязки дости-
достигает своего наименьшего значения. Псевдорешение наименьшей длины
называется нормальным псевдорешением.
Покажем, что нормальное псевдорешение всегда существует и
единственно. Зафиксируем в пространствах Х9 Y сингулярные базисы
хи ..., хт и уи ..., уя. Пусть
*= ?.ЧХ*У= ЕРрУр. (86.2)
k=i j>=i
§ 86] ПСЕВДОРЕШЕНИЯ И ПСЕВДООБРАТНЫЙ ОПЕРАТОР 275
"Учитывая соотношения G8.2), находим, что
Лх - у =
fc=l p=l
Будем по-прежнему считать, что сингулярные числа рь ... > р, отличны
от нуля, а остальные равны нулю. Так как сингулярные базисы ор-
тонормированы, то
Фо(*)= Е1РЛ-рк|2+ t tP.I2.
k=i P=t+i
Очевидно, что наименьшее значение функционала невязки достигается
на тех векторах х, у которых последние т — t координат оск — произ-
произвольные, а первые t координат определяются формулой
** = Р*/р* (86.3)
Нормальное псевдорешение будет таким:
t
^ (86.4)
Напомним, что векторы xt+u ..., хт образуют базис ядра. N
оператора А. Поэтому множество всех псевдорешений представляет
собой плоскость в пространстве X, направляющее подпространство
которой совпадает с ядром N, а вектор двига -* с любым псевдо-
псевдорешением. Нормальное псевдорешение является единственным вектором
этой плоскости, который ортогонален к N.
Используя соотношения G8.2), G8.3), легко показать, что псевдо-
псевдорешения и только они удовлетворяют уравнению
А* Ах = А*у. (86.5)
.Действительно, запишем векторы х, у в виде' разложений (86.2). Имеем
t
А*Ах = X р?адь А*у = X РрРр*р-
Отсюда следует, что решениями уравнения (86.5) являются te и
только те векторы х, первые t координат <xfc которых вычисляются
согласно (86.3), а последние т — t координат — произвольные.
Таким образом, если разрешимость уравнения (85.1) не гарантирует-
гарантируется, то мы всегда можем заменить решение этого уравнения решением
уравнения (86.5). При этом обеспечивается минимизация функционала
невязки для уравнения (85.1).
Обратный оператор играет существенную роль при выполнении
многих исследований. Однако он был определен лишь для невырожден-
невырожденного оператора и пока мы не имеем соответствующего аналога для
вырожденного оператора и оператора, действующего из одного
276 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА [Гл. 1G
пространства в другое. Этот аналог может быть построен на основе
псевдорешений.
Предположим, что оператор А действует из пространства X в
пространство Y. Тогда каждому вектору у е Y мы можем поставить
в соответствие единственный вектор хоеХ, являющийся нормальным*
псевдорешением уравнения (85.1). Это соответствие определяет неко-
некоторый оператор А+, который действует из У в X и называется опе-
оператором, псевдообратным (или обобщенным обратным) к оператору А.
Итак, по определению
х0 = А+у (86.6)
для любого yeY. Ясно, что если оператор А — невырожденный, то
псевдообратный совпадает с обратным. Исследуем свойства псевдообрат-
псевдообратного оператора.
Пусть наряду с (86.6) мы имеем и0 = A+v для некоторого векто*-
pa v e Y. Рассмотрим вектор ау + ри при любых числах а, р. Если
мы возьмем его в качестве правой части уравнения (85Л), то вектор
оос0 + рм0 заведомо будет удовлетворять соответствующему уравнению
типа (86.5) и поэтому он будет псевдорешением:' Так как х0, и0
ортогональны к ядру оператора А, то ортогонален к ядру и вектор
ах0 + Рм0- Следовательно, он является нормальным псевдорешением.
Таким образом, линейность псевдообратного оператора установлена.
Свойства псевдообратного оператора легко установить, если рас-
рассмотреть его действие на векторы сингулярных базисов* Согласно
(86.4), имеем
"*»-{ о, *>,. <м'7>
Отсюда следует, что:
Область определения, ядро и область значений псевдообратного и
сопряженного операторов совпадают.
С помощью формул G8.2), G8.3), (86.7) можно получать различные
соотношения, связывающие операторы А, А*, А+. Отметим некоторые
из них:
3) (АА+)* = АА+, (АА+J = АА+9
4) {А+А)* = А+А, (А+АJ = А+А,
5) АА+А = А.
Эти соотношения доказываются по одной и той же схеме, поэтому
в качестве примера рассмотрим более подробно лишь первое и третье.
Сравнивая. G8,2) и (86.7), возьмем в качестве оператора А сопря-
сопряженный оператор А*. 'Так как для этого оператора имеет место
§ 86] ПСЕВДОРЕШЕНИЯ И ПСЕВДООБРАТНЫЙ ОПЕРАТОР 27^
G8.3), то
1 0, k>t.
Теперь, исходя из (86.7), применим соотношение, аналогичное G8.3),
к оператору (А+)*. Тогда
Таким образом, операторы (Л*)+ и D+)* совпадают на базисе
xi9 ..., xm, следовательно, они равны.
Принимая во внимание G8.2), (86.7), заключаем, что для опера*
тора АА+ справедливы соотношения
Это означает, что оператор АА+ имеет ортонормированную систему
собственных векторов уи ..., уп и вещественные собственные значения
1 и 0, т. е. является эрмитовым. Тем самым доказано, первое ра-
равенство из соотношений третьей группы. Второе равенство очевидным
образом вытекает из (86.8).
Упражнения.
1. Что представляет робой оператор, псевдообратный для нулевого?
2. Пусть пространства Х9 Г— различные. Написать матрицу псевдообратного
оператора в сингулярных базисах и сравнить ее с G8.4).
3. Пусть 17, V— унитарные операторы, действующие соответственно в X*
Y. Доказать, что
(VAV)+ = U*A+V*.
4. Доказать, что существуют такие операторы К в X и L в Y, что
А+ =KA*=A*L.
Опишите действие операторов К, L.
5. Доказать, что псевдообратный оператор однозначно определяется ус»
ловиями
АА+А = А,
А+ = КА* = A*L.
6. Доказать, что все псевдорешения и только они являются решениями:
уравнения
Ах = АА+у.
7. Установите геометрический смысл псевдорешений.
278 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА [Гл. 10
§ 87* Возмущение и невырожденность оператора
Мы неоднократно подчеркивали, что малое изменение базиса,
координат векторов, элементов матрицы и т. п. может приводить
к изменению многих свойств, связанных с понятием линейной зави-
зависимости. Это понятие играет решающую роль во всей теории линей-
линейных операторов, поэтому очень важно исследовать влияние малого
изменения самих операторов на их свойства.
В качестве вспомогательного средства при решении самых различ-
различных вопросов нередко приходится использовать оператор, близкий
к тождественному* Под этим названием мы будем понимать опера-
оператор, действующий в пространстве X и имеющий вид Е + А, где
|| А || < 1 для какой-либо нормы.
Если X есть любое собственное значение оператора А, то 1Ч-Х
является собственным значением оператора ЕЛ-А. Так как |Л,|< ||А||,
то, в силу условия || А || < 1, все собственные значения оператора А
по модулю меньше единицы. Следовательно, все собственные значения
оператора Е 4- А отличны от нуля и этот оператор будет невырож-
невырожденным.
Таким образом, при выполнении условия || А || < 1 существует опе-
оператор {Е + А). Если оке оператор ЕЛ-А — вырожденный, то ||А|| > 1
для любой нормы.
Для любого числа а, по модулю меньшего единицы, справедливо
предельное соотношение
A+аГ1= lim ос,*
Покажем, что аналогичное соотношение имеет место и для оператора
{Е + А)9 если || Л || < 1, Рассмотрим последовательность {Ар} опера-
операторов
Легко проверить, что
поэтому
\\(Е + А)Ар-Е\\ = \\А>+11 (87.1)
Формально это равенство верно и для р = — 1, если считать Л-i = 0.
§ 87J ВОЗМУЩЕНИЕ И НЕВЫРОЖДЕННОСТЬ ОПЕРАТОРА 279
Далее имеем
|| (Е + А) Ар - Е || = || (Ар -(Е + А)) + А (Ар - (Е + А)) || ^
^\\\Ар-(Е + А)-1\\-\\А\\'\\Ар - (Е + А)~х || | =
-а-МШ^-да + л)-1!!.
Теперь, учитывая (87.1), получаем при р = — 1 оценку нормы оператора
(Е + Л), т.е.
ц^ + л) 11<1вМ||.
Для любой подчиненной нормы справедливо равенство ]| Е \\ = 1, сле-
следовательно, в этом случае
r'IK-r-W- (87-2>
При р>0 получаем оценку отклонения оператора Ар от оператора
(Е + Л). Именно,
В силу условия || А || < 1 это означает, что последовательность {Ар}
будет сходиться к оператору (Е + А). Если оператор Ар считать
приближением к оператору (е + А)~х9 то формула (87.3) дает оценку
точности приближения.
Пусть А—>любой невырожденный оператор. Рассмотрим оператор
А + гА, где ^ — произвольный оператор. Будем называть гА возмуще-
возмущением оператора А, а оператор А + гА — возмущенным оператором.
Выясним, при*каких условиях на величину нормы возмущения воз-
возмущенный оператор будет невырожденным. При этом мы будем инте-
интересоваться лишь малыми значениями нормы возмущения.
Оператор А — невырожденный, поэтому существует оператор А" К
Следовательно, справедливо равенство
А + 8Л = А(Е + А~1гА).
Отсюда вытекает, что оператор А + гА будет невырожденным тогда
и только тогда, когда будет невырожденным операторкЕ + А гА.
Это условие заведомо выполняется, если
для какой-либо нормы. Тем более оно выполняется, если
\\А-1\\\\еЛ\\<1.
Таким образом, возмущенный оператор будет Невырожденным при
всех возмущениях, удовлетворяющих неравенству
Ы\<\\А-1\\-К (87.4)
280 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА [Гл. 10
При возмущении оператора А на гА обратный оператор А по-
получит возмущение, равное {А + еА)~л - Л~Ч Обозначим через
ЬА \\A\\' ЬЛ || А1| ( '
-величины относительных возмущений операторов Л и Л. При вы-
выполнении условия (87.4) оператор Е + А~хеА будет невырожденным,
поэтому
{А + гАТ±~А-х - ({А + 6/U - Е) А =
Согласно формуле (87.3) при р = О находим, что
1-Й" 44II ^ 1- II А'11| .J еА |
Теперь, учитывая обозначения (87.5), получаем такую оценку:
тде
Число v^ называется числом обусловленности оператора А. Хотя
это число и зависит от выбранной нормы, но оно никогда не может
•быть очень малым. Из равенства
учитывая.(84.3), заключаем, что
Формула (87.6) показывает, что малое относительное возмущение
оператора А приводит К малому относительному возмущению А~х
лишь в том случае, когда число обусловленности оператора А не слиш-
слишком велико по сравнению с единицей. С этим числом мы встретимся
и в других задачах.
Предположим, что с невырожденным оператором А решается опе-
операторное уравнение
Ах = у. (87.8)
Расмотрим возмущенное уравнение
= у + гу. (87.9)
Если выполняется условие (87.4), то возмущенное уравнение (87.9)
и точное уравнение (87.8) будут иметь единственные решения х и х.
Оценим их разность.
§ 87] ВОЗМУЩЕНИЕ И НЕВЫРОЖДЕННОСТЬ ОПЕРАТОРА 281
Наряду с (87.5), (87.7) введем соответствующие обозначения для
относительных возмущений в х, у, т. е.
Имеем
Отсюда находим
и далее
|| х - х |К II (Е + А-хвлГ1'- Е || ¦ || х || + || (Е + Л^)-11| • || Л1| • || ъу ||.
Будем считать, что используется подчиненная норма. Принимая
во внимание оценки (87.2), (87.3)s а также неравенство || у || ^ || А || • || х ||,
получим
.1^1
Согласно принятым обозначениям это означает, ччго
5х ^ -—^~гт № + ЗД- (87.10)
Полученная формула снова показывает значение числа обусловлен-
обусловленности, и снова с точки зрения устойчивости важно, чтобы оно было
не слишком большим.
Упражнения.
1. Доказать, что число обусловленности, выраженное в спектральной
норме, равно отношению максимального сингулярного числа к минимальному..
2. Существуют операторы с наименьшим числом обусловленности. Что
представляют собой эти операторы, если используется спектральная норма?
3. Доказать, что при умножении оператора на унитарные операторы его
число обусловленности, выраженное в спектральной или евклидовой норме,
не меняется.
4. Доказать, что для любых невырожденных операторов А, В справедливо
неравенство
||2Г*-Л || \\A-B\\
— ^ VA
5, В чем заключается причина большой неустойчивости системы векторов,
описанной в § 22? Оценить число обусловленности оператора, у которого
столбцы матрицы совпадают с координатами векторов B2.7).
282 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА [Гл. 10
§ 88. Устойчивое решение уравнений
Формула (87.10) показывает, что для оператора, близкого к вырож-
вырожденному, возможны большие возмущения в решении даже при малых
возмущениях в операторе и правой части. Может показаться, что этот
факт связан лишь с тем, что само решение существует не всегда.
Однако в случае определения псевдорешений положение аналогично.
Действительно,, пусть оператор действует в двумерном пространстве.
Предположим, что в некотором ортонормированном базисе уравнению
(8,5.1) соответствует система линейных алгебраических уравнений такого
вида:
1-*! +0-х2- 1
0-*! + 0-х2 = 1.
Легко определить, что нормальное псевдорешение и0 будет иметь
следующие координаты;
wo = A,0).
Вполне возможно, что возмущенное уравнение приведет в том же
базисе к системе
0 • Xt + 8 • Х2 = 1,
где число 8 будет хотя и малым, но все же отличным от нуля.
Теперь нормальное псевдорешение и{$ возмущенного уравнения имеет
координаты
и§> = A, в).
При малых е векторы и0 и и%} не только отличаются весьма зна-
значительно, но даже почти ортогональны.
Если уравнение имеет более одного псевдорешения, то в общем
случае малые возмущения в операторе и правой части всегда будут
приводить к большим возмущениям в нормальном псевдорешении.
Тем не менее мы покажем, что, несмотря на неустойчивость многих
понятий, связанных с операторными уравнениями, нормальное псевдо*
решение можно определить устойчивым образом.
Пусть оператор А действует из пространства X в пространство Y
и решается уравнение (85.1). По аналогии с функционалом невязки
рассмотрим так называемый регуляризирующий функционал
ФЛх) = *\х\2 + \Ах-*у\2, (88.1)
где число ос>О. Ясно, что при а = 0 этот функционал совпадает
с функционалом невязки и достигает своего минимума на псевдо-
псевдорешениях уравнения (85.1). Выясним, на каких векторах достигает
своего минимума регуляризирующий функционал при а > 0. Используя
§ 88] УСТОЙЧИВОЕ РЕШЕНИЕ УРАВНЕНИЙ 283
разложения (86.2), находим
<М*)= Е(аЫ2 + 1р)Л-р*|2) + * ? Ы2 + ? |рр|2.
k-l fc=t+l p=t+l
Отсюда следует, что для достижения минимума необходимо взять
нулевые значения последних координат ut+u ..., ocm и для каждого
fc < t минимизировать выражение
Это дает для к < t
Таким образом, минимальное значение регуляризирующего функцио-
функционала (88.1) при каждом a > 0 достигается на единственном векторе
к=1
Сравнение формул (86.4), (88.2) позволяет установить некоторые
соотношения, связывающие ха и х0. Имеем для р, a > О
IP12- Р21Р12 r_lpl2a2
^ р2 (a + р2)^ Р21
поэтому отсюда вытекает, что
I ^« I ^ I *0 I ^ I ^ое I + ?Щ 9
где
Рл
Далее находим
откуда заключаем, что
|хо-хя|<ау, (88.4)
284 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА Гл. Ю
где
7 - L
La Pk
fc=l
Следовательно,
lim xa = Xq •
a-» +0
Таким образом, при малых значениях ос вектЬр ха может служить
приближением к нормальному псевдорешению х0.
Разложим векторы ха и х0 по. сингулярным базисам аналогично
(86.2). Непосредственной проверкой легко убедиться, что ха удовлетво-
удовлетворяет уравнению
(А* А + осЕ) ха = А*у. (88.5)
При а > 0 оператор А*А + аЕ является положительно определенным,
поэтому существует оператор (A*A + olE)9 т.е.
хя « (А*А + <хЕ)~х А*у. (88.6)
На векторе ха достигается минимальное значение функционала (88.1),
следовательно, Фа (ха) < Фа (х0). Принимая во внимание (88.3), (88.4),
получаем отсюда, что
\Ахх- у\2 ^\Ахо-у\2 + а(\хо\2 -\хх\2)<\Ах0- у\2 + 2а2ц\ (88.7)
Кроме этого, Фа(х^ < Ф«@), откуда вытекает
lxl<JzL
Вместе с (88.6) это означает, что для любых оператора А и вектора у
при а > О
К^ + аЕГ1^^^. (88.8)
При практическом решении уравнения (85.1) оператор А и правая
часть у обычно задаются неточно и вместо них приходится рассмат-
рассматривать возмущенные оператор А и правую часть у. Если в простран-
пространствах X, Y в качестве нормы использовать длину векторов, то ей
подчинена спектральная норма операторов. Поэтому мы будем пред-
предполагать, что
\\А-А\\2^га, \\у-у\\^еу. (88.9)
Определение приближенного решения ха по возмущенным А и у
приводит к такому уравнению:
(Л*Л + осЖ) & *'А*у. (88.10)
§ 88] УСТОЙЧИВОЕ РВШЕНИЁ УРАВНЕНИЙ! 285
Из (88.5), (88.10) находим
(Л*Л + осЕ)(ха - ха) - 4* (Ах, - у) - Л*(Лха - у)«
Это означает, что разность хя — хя является решением уравнения
с оператором (Л* Л + ос?) и правой частью вида z = и + Л*у, где
Поэтому
ха - ха = (Л*Л + аЕ) и + (Л*Л + осЕГ1 Л*».
Оценим теперь нормы обоих слагаемых в этом равенстве.
Собственные значения оператора Л*Л + аЕ не меньше а. Следова-
Следовательно, собственные значения оператора (Л^Л + аЕ) не больше оГ1.
Для положительно определенного оператора спектральная норма сов-
ладает с максимальным собственным значением, т. е.
Учитывая (88.7), (88.9), будем иметь
ii oET1 ti|| < ||(Л*Л Ч-аЕГ11|
. оу4 и л и ^ А /и а • II2 f\' I 1\\ fy
ОС ОС
Для оценки второго слагаемого воспользуемся формулами (88.3), (88.8),
<88.9). Находим
|| (Л*Л + а?) Л*1> || < Ajf ^ -щ- (гА || х0 || + в,).
ос ос
Итак,
\\хл-хх\\<—(\\Ахо-у\\2 + 2а2г\2у12 ' J -¦¦ "¦ —
r(lA || х0 || +Ё,).
Полная погрешность вычисленного псевдорешения х„ такова:
II *о - *, II < II ^о - х, II + II х, - х, || <
< осу + -^-(Ц Лх0 - у ||2 + 2«2Л2)^ +/?ПгОи II хо II + д.- (88.11)
Правая часть этого неравенства не содержит никакой информации,
связанной с возмущенными данными Л, у. Поэтому существует
такое а, при котором она достигает своего минимума. Это значение a
будет обеспечивать почти наилучшее приближение Я% к точному
нормальному псевдорешению х0.
286 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА [Гл. 10»
Предположим, что гА и гу суть величины порядка 8 и само с
достаточно мало. Если точное уравнение (85.1) имеет решение, то
Ахо~ У = 0. В этом случае правая часть (88.11) по характеру зависи-
зависимости от а и 8 есть функция вида
<* + е+—-.'
При ос = е2/3 она принимает значение порядка е2/3. Если же точное
уравнение не имеет ни одного решения, то Ах0 -г у Ф 0. Теперь права*
часть (88.11) есть функция вида
При а = г112 она принимает значение порядка г112.
Таким образом, если входные данные уравнения (85.1) заданы с точ~
ностъю порядка е, то нормальное псевдорешение может быть опреде^
лено с точностью порядка е2/3 в случае разрешимости точного урав-
уравнения и с точностью г112 в противном случае.
Параметр а, обеспечивающий необходимое приближение ха, не мо-
может быть найден лишь по возмущенным А и у. Это связано, в ос-
основном, с тем, *что условия (88.9) не гарантируют непрерывности
нормального псевдорешения в заданной области изменения оператора
и правой части. Для определения параметра а обычно используют
дополнительную информацию о решении. В некоторых задачах не
требуется гарантированной близости к нормальному псевдорешению,
а считается достаточным устойчивое определение минимума функцио-
функционала невязки. В таких задачах определение параметра а несколько-
проще. Несмотря на важность всех этих вопросов, мы не будем
на них останавливаться, так как они выходят за пределы данного
курса.
Упражнения.
!• Доказать, что у\ в оценке (88.3) есть длина нормального' решения
уравнения
A*A(A*A)ll2x~A*y.
2. Доказать, что у в оценке (88.4) есть длина нормального решения
уравнения
(А*АJх~А*у.
3. Доказать, что разность х* - х$ удовлетворяет уравнению
(А*А + аЕ) (А*А + PJE) (хя - хр) - ф - а) А*у.
4. Сравнить (88.11) с (87.10). Что можно сказать об оценке (88.11) в случае
невырожденного оператора. А!
5. С" какой точностью можно вычислить нормальное лсевдорешение,
если -4 = 0?
•§ 89] ВОЗМУЩЕНИЕ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 287
§ 89. Возмущение и собственные значения
Возмущение оператора в общем случае приводит к изменению
всех его собственных значений и собственных векторов. Так как
исследование этой зависимости является очень сложным, мы ограни-
ограничимся ее иллюстрацией на отдельных примерах. Данную задачу удобнее
описывать в терминах матриц операторов, а не самих операторов.
Пусть В — произвольная матрица простой структуры и матрица
Л — такая, что
НГ^Н^А, (89.1)
где А — диагональная матрица собственных значений Хи Х2, •••> ^т-
Рассмотрим возмущенную матрицу В + гв и какое-нибудь ее собствен-
лое значение X. Матрица В + гв — ХЕ — вырожденная, поэтому будет
вырожденной и матрица
Я (В + ев - ХЕ) Н = (Л - ХЕ) + Н~1гвН>
Возможны два случая:
1) X = Xi при, некотором /,
2) ХфХ-% при всех i.
Во втором случае матрица Л — ХЕ — невырожденная, следовательно,
(Л - ХЕ) + Н-хевН = (Л - ХЕ)(Е + (Л - ХЕТ^Я-^Я).
Матрица, стоящая вторым сомножителем,—вырожденная. Это озна-
означает, что любая норма матрицы (Л — ХЕ)~1Н~хгвН должна быть
ле меньше единицы. В частности,
Отсюда вытекает, что
max \{Х^ХГ'\\\Н-'\\2\\ч\\г\\Н\\2>1
1 < I"^ П
или
В первом случае это неравенство также выполняется, поэтому
всегда
|b|-M<vH||eB||a (89.2)
ло крайней мере при одном значении и Здесь
есть число обусловленности матрицы Я, выраженное в спектральной
лорме^
283 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА [Гл. 10
Полученное соотношение означает, что, каково бы ни было воз-
возмущение гв матрицы В, для любого собственного значения X возму-
возмущенной матрицы В + ев найдется такое собственное значение Xt
матрицы В, что будет иметь место неравенство (89.2). Заметим, что
мы нигде не требовали малости возмущения ев. Соотношение (89.2)
можно истолковать несколько иначе. Именно:
Собственные значения возмущенной матрицы находятся в области,
являющейся объединением всех кругов с центрами в Xt и радиуса v# || гв ||2.
Столбцы матрицы Я представляют собой собственные векторы
матрицы В. Поэтому из (89.2) вытекает, что общей мерой чувстви-
чувствительности собственных значений к возмущению матрицы, по-видимому,
может служить число обусловленности матрицы Я из собственных
векторов (а не самой матрицы В!). Матрица Я, удовлетворяющая (89.1),
не единственная, так как собственные векторы определены с точ-
точностью до произвольных множителей. Будем считать, что матрица Я
всегда выбирается такой, что значение vH является минимальным;
Напомним, что в любом случае vH ^ 1.
Если В — нормальная матрица и, в частности, эрмитова или унитар-
унитарная, то мы можем взять матрицу Я унитарной. Тогда v# = 1, и еле*
довательно,
1*|-Ь|<||ев||2. (89.3)
Рассмотрим несколько подробнее случай эрмитовой матрицы В с эр-
эрмитовым возмущением гв. Теперь мы можем показать, что:
В каждом круге с центром в %t и радиусом || гв ||2 содержится
хотя бы одно собственное значение возмущенной матрицы.
Действительно^ будем рассматривать условно матрицу В + гв как
«точную», матрицу В = (В + ?в) — ?в ка* «возмущенную» с возмуще-
возмущением, равным — ев. Повторяя дословно все выкладки, мы получим
формулу, аналогичную формуле (89.3), но в которой собственные
значения матриц В и В + гв поменяются ролями. Это означает, что
для любого собственного значения Xi «возмущенной» матрицы В
обязательно найдется хотя бы одно собственное значение X «точной»
матрицы В-Ь?д> при котором, неравенство,(89.3). имеет место.
Если собственнее значения матрицы В — простые, то при достаточно
малом возмущении гв все круги разделяются и тогда в каждом круге
будет содержаться одно и только одно собственное значение возму-
возмущенной матрицы.
Формула (89.3) показывает, что собственные значения нормальных
матриц обладают значительной устойчивостью к возмущению. Однако
в общей проблеме определения собственных значений это явление
скорее является исключением, чем правилом.
Рассмотрим для примера в некотором смысле «предельный» случай,
когда матрица Д состоит из одного, канонического ящика Жордана.
Можно условно считать, что все собственные векторы такой матрицы
коллинеарны, матрица из собственных векторов вырождена и, следо-
ВОЗМУЩЕНИЕ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ
289
вательно, ее число обусловленности равно «бесконечности». Итак,
пусть матрица В порядка т имеет вид
В
О \
К 1
Хо
о
\
Очевидно, что ее характеристический многочлен есть (X — Х0)т.
Возьмем теперь такую матрицу возмущения гв, в которой лишь
один элемент, стоящий в позиции (т, 1), отличен от нуля и равен
числу 8. Характеристический многочлен возмущенной матрицы равен
(X — Х0)т — 8. Поэтому собственные значения возмущённой матрицы
находятся на расстоянии |е|1/т от собственных значений точной мат-
матрицы* Если, например, т = 20, е = 10~10, Хо — порядка единицы, то
ни о какой практической устойчивости не может быть и речи.
Важно понимать, что неустрйчивость собственных значений не обя-
обязательно связана с наличием кратных собственных значений и тем
более с наличием жордановых клеток. Рассмотрим матрицу В 20-го по-
порядка:
В
20 20
19 20
18 20
о \
о
2 20
Это — треугольная матрица, и поэтому ее собственными значениями
будут диагональные элементы. На первый взгляд они достаточно
хорошо разделены, и вроде бы нет никаких оснований ожидать
неустойчивости. Но добавим возмущение е к нулевому элементу,
стоящему в позиции B0.1). Свободный член характеристического
многочлена изменится при этом на величину 2019е. Так как произ-
произведение собственных значений равно свободному члену, то сами
собственные значения должны измениться очень сильно.
Еще более сложные вопросы возникают при изучении устойчивости
собственных векторов. Ясно, что если собственное значение X матрицы В
неустойчиво к возмущению, то соответствующий ему собственный
вектор х заведомо не может быть устойчивым, так как В, X, х
связаны между собой линейным соотношением Вх = Хх.
10 В. В. Воеводин
290 МЕТРИЧЕСКИЕ СВОЙСТВА ОПЕРАТОРА [Гл 10
Однако важно отметить, что даже если собственные значения не
изменяются при возмущении, то собственные векторы не только могут
быть неустойчивыми, но и их число может меняться. Например,
первая из матриц
(l 0 <)\ /2 0 о\
0 10, 01s
\0 0 1/ \0 0 1/
имеет три линейно независимых собственных вектора, вторая — два,
хотя собственные- значения у них одинаковы. Теоретически это явление
связано только с наличием кратных собственных значений исходной
матрицы. Но в условиях приближенного задания матрицы трудно,
а чаще всего и невозможно решить, какие собственные значения
считать кратными, а какие — простыми.
Вопросы изучения устойчивости собственных значений, собственных
и корневых векторов являются одними из самых сложных в разделах
алгебры, связанных с вычислениями.
Упражнения.
1. Пусть матрица В — простой структуры, но имеет кратные собственные
значения. Доказать, что для любого сколь угодно малого числа е > 0 найдется
такое Фозмущение ев, удовлетворяющее условию || ев || < е, что матрица В + гв
уже не имеет простой структуры.
2. Пусть матрица В имеет попарно различные собственные значения
и d >0 есть наименьшее расстояние между собственными значениями. Дока-
Доказать, что найдется такое возмущение ев, удовлетворяющее условию || гв ||2 > d,
что матрица В + гв не будет иметь простой структуры.
, 3. Пусть теперь матрица В эрмитова. Доказать, что если эрмитово
возмущение ев удовлетворяет условию || гв || 2 < d]2, то матрица В + sB имеет
попарно различные собственные значения.
4. Пусть, наконец, матрица В неэрмитова и имеет попарно различные
собственные значения. Доказать, что существует такое число г, удовлетворяю-
удовлетворяющее условиям 0 < г ^ d, что матрица В + ев имеет простую структуру,*' если
ТОЛЬКО || 8д ||2 О\
5. Попробуйте установить более точную связь между числами г я d.
ЧАСТЬ III
БИЛИНЕЙНЫЕ ФОРМЫ
ГЛАВА 11
БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ
§ 90. Общие свойства билинейных и квадратичных форм
Рассмотрим числовые функции ф(х, у) от двух векторных аргумен-
аргументов х, у из некоторого линейного пространства Кп, заданного над
числовым полем Р, принимающие значения из Р. Функция ф(х, у)
называется билинейной формой, если для любых векторов х, у, zeKn
и любого числа а е Р выполняются соотношения
Ф (х + z, у) = ф (х, у) + Ф (z, у), Ф (ах, у) = аф (х, у),
Ф (х, у + z) = ф (х, у) + ф (х, z), ф (х, осу) = аф (х, у).
Первые два соотношения из (90.1) означают линейность формы ф (х, у)
по первому аргументу, Последние два — линейность по второму аргу-
аргументу.
Легко проверить, что сумма двух билинейных форм, а также
произведение билинейной формы на число снова будет билинейной
формой. Поэтому множество всех билинейных форм, заданных над
одним и тем же пространством Кп и принимающих значения из
одного и того же числового поля Р, есть линейное пространство.
При этом «нулем» данного пространства будет билинейная форма
0 (х, у), для которой 0 (х, у) = 0 для всех х, у. 0 (х, у) называется
нулевой билинейной формой.
Мы уже встречались ранее с функцией такого вида. Сравнивая
B7.1)' и (90.1) легко заметить, что скалярное произведение в евклидо-
евклидовом пространстве является билинейной формой. Вспоминая, какую
важную роль играло скалярное произведение при изучении евклидовых
пространств и действующих в них линейных операторов, можно
предположить, что изучение билинейных форм также окажется по-
полезным.
Среди билинейных форм особое место занимают симметричные
и кососимметричные билинейные формы. Билинейная форма ф(х, у)
называется симметричной, если для любых векторов х, уеКп выпол-
выполняется равенство
Ф (х, у) = ф {у, х).
10*
292 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. И
Если же для любых х, уеКп
ф(х, У)= -Ф(ьос),
то билинейная форма называется кососимметричной.
Любая кососимметричная билинейная форма ф(х, у) принимает
нулевое значение при совпадении аргументов. Действительно, так как
ф(х, х) = — ф(х, х), то ф(х, х) = 0. Несколько неожиданным является
другой факт, связанный со значениями симметричной билинейной
формы при совпадении аргументов. Именно, любая симметричная
билинейная форма ф (х, у) однозначно определяется своими значениями
при совпадающих аргументах. В самом деле, пусть х, у — любые
векторы из Кп. Принимая во внимание симметричность формы
ф(х, у), имеем
ф(х + у, х + у) = ф(х, х) + ф()/, у) ± 2Ф(х, у), (90.2)
откуда вытекает, что-
^ + У,-х + у)-у(х9 х)-ф()/, у)}. (90.3)
Полученная формула доказывает справедливость высказанного утверж-
утверждения, так как правая часть соотношения есть симметричная би-
билинейная форма.
Билинейная форма однозначно разложима в сумму симметричной
и кососимметричной билинейных форм. Это разложение можно
написать в явном виде
^ {( )( )}. (90.4)
Легко проверить, что первые два слагаемых в правой части дают
симметричную билинейную форму, а последние два — кососимметрич-
ную. Если допустить существование какого-то другого разложения,
то подставив равные аргументы, мы должны будем сделать вывод
об однозначности определения симметричной части разложения, а сле-
следовательно, и разложения в целом.
Если билинейная форма не является симметричной, то теперь
вместо (90.2) будем иметь
Следовательно
\ {ф (*, У) + Ф (У, х)} =.^{ф (х + у, х + у) - ф (х, х) - Ф (у9 у)}. (90.5)
Сравнивая полученное соотношение с (90.3), заключаем, что для не-
несимметричной билинейной формы ее симметричная часть однозначно
определяется значениями формы при совпадающих аргументах.
§ 90] ОБЩИЕ СВОЙСТВА БИЛИНЕЙНЫХ И КВАДРАТИЧНЫХ ФОРМ 293
Наряду с билинейными формами мы^будем рассматривать и так
называемые квадратичные формы. Пусть ф (х, у), — билинейная форма
в пространстве Кп. Квадратичной формой называется числовая функция
ф(х, х) от одного векторного аргумента хеКп, которая получается
из билинейной формы ф (х, у) заменой вектора у на вектор х.
Вообще говоря, нельзя однозначно восстановить по квадратичной
форме породившую ее билинейную форму. Но, как вытекает из фор-
формулы (90.3), существует и притом только^одна симметричная били-
билинейная форма, из которой может быть получена исходная квадратич-
квадратичная форма. Эта билинейная форма называется полярной по отношению
к заданной квадратичной форме. Множество всех билинейных форм,
порождающих одну и ту же квадратичную форму, может быть полу-
получено путем сложения полярной билинейной формы и произвольной
кососимметричной формы. Поэтому при использовании билинейных
форм для изучения свойств квадратичных форм достаточно ограни-
ограничиться рассмотрением лишь симметричных билинейных форм.
Невозможность восстановления билинейной формы по квадратич-
квадратичной объясняется тем, что квадратичная форма не дает никакой ин-
информации о кососимметрической части любой билинейной формы.
Лемма 90.1. Кососимметричные билинейные формы и только они
принимают нулевые значения при всех совпадающих аргументах.
Доказательство. Мы уже отмечали, что если ф(х, у) — косо-
симметричная, то ф (х, х) = 0 при всех л*. Если же ф (х, л) = 0 при всех х,
то из соотношения (90.5) следует, что для всех векторов х, у спра-
справедливо равенство ф (х, у) + ф (у, х) = 0, т. е. билинейная форма ф (х, у) —
кососимметричная.
Сравнение свойств скалярного произведения и соотношений (90.1)
показывает, что в унитарном пространстве скалярное произведение,
строго говоря, не является билинейной формой. В комплексном
пространстве со скалярным произведением тесно связаны эрмитовы
билинейные формы. Числовая функция ф (х, у) называется эрмитовой
билинейной формой, если для любых векторов х, у, zeKn и любого
числа а из поля комплексных чисел Р выполняются соотношения
ф (х + г, у) = ф (х, у) + Ф (-, у), ф (ах, у) = аф (х, у),
Ф (х, у + г) = ф (х, у) + ф (х, г), ф (х, ау) = Щ (х, у).
Здесь черта означает комплексное сопряжение.
Снова сумма двух эрмитовых билинейных форм, а также произ-
произведение эрмитовой билинейной формы на число будет эрмитовой
билинейной формой. Поэтому множество всех эрмитовых билинейных
форм, заданных над комплексным пространством и принимающих
комплексные значения есть комплексное линейное пространство.
Эрмитова билинейная форма называется эрмитовой симметричной,
если для любых векторов х, уеКп
Ф (*. У) = Ф (v. *).
294 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. 11
Если для любых х9 уеКп
то форма называется эрмитовой кососимметричной. На совпадающих
векторах эрмитова кососимметричная форма принимает чистО мнимые
значения, а эрмитова симметричная форма — вещественные. Теперь
любая эрмитова билинейная форма однозначно определяется своими
значениями при совпадающих аргументах. Но вместо (90.3) справед-
справедливо такое соотношение
Ф (х, У) = -j (ф (х + У, х + у)-<р {х - V, х - у) +
+ 1ф (х + iy, х + iy) - щ (х - iy9 x - iy)}. (90.6)
Из него, в частности, вытекает, что
Среди эрмитовых бйлпнейнЫх форм нулевая форма и только она
принимает нулевые значения при всех совпадающих аргументах.
И в этом случае эрмитова бйлйнейнай форма также однозначно
представима в виду суммы эрмитовой симметричной й эрмитовой
кососимметричной, при этом
4 (( ) + ОС~Щ +
Ф(х, v) = 4 (<Р(х, У) + ФОС~Щ + y 1<Р(*, >') - ФОГ^]• (90.7)
Доказательства перечисленных фактов для эрмитовых форм почти
не отличаются от соответствующих доказательств для билинейных
форм.
Квадратичной эрмитовой формой называете** числовая функция
ф(.\, л-) от одного векторного аргумента хеКП9 которая получается,
из эрмитовой билинейной функции ф(л% у) заменой вектора v на век-
вектор х. В отлйчйе от квадратичных форм по эрмитовой квадратичной
форме однозначно восстанавливается порождающая ее эрмитова били-
билинейная форма. Это восстановление осуществляется согласно формуле
(90.6), и соответствующая билинейная форма также называется полярной
по отношению к исходной квадратичной форме.
Возможность однозначного восстановления эрмитовой билинейной
формы но порожденной ею* эрмитовой кватфаТйчной форме объясня-
объясняется тесной свйзью между ЗрШтОвымй симметричными й эрМитОвыми
косОсймметричными билинейными формами.
Лемма 90.2. Если ф(.\-, у)- эрмиШва симметричная (косдсимМет-
ричная) билинейная форма, то \|/(.\, г) = /ф(х, у) будет эрмшПЪ'вдй
кососимметричной (самме)причйой) билинейной формой.
Доказательство. Пусть, например, ф(х, v) эрмитова симмет-
симметричная. Тогда для всех векторов х, у имеем
Щх9 у) «/ф (х, у) *= ф Ifx, у) = ф(^, IX) = -1ф (v, .\) = -\|/ (v, х),
§ 90] ОБЩИЕ СВОЙСТВА БИЛИНЕЙНЫХ И КВАДРАТИЧНЫХ ФОРМ 295
т. е. \|/(х, у) эрмитова кососимметричная. Случай эрмитовой кососим-
метричной формы (р (х, у) рассматривается аналогично.
В дальнейшем более часто мы будем иметь дело с эрмитовыми
квадратичными формами, порождаемыми эрмитовыми симметричными
билинейными формами.
Лемма 90.3. Среди эрмитовых билинейных форм симметричные
формы и только они порождают вещественные эрмитовы квадратич-
квадратичные формы.
Доказательство. Ранее уже отмечалось, что эрмитовы сим-
симметричные формы принимают вещественные значения при совпадаю-
совпадающих аргументах. Предположим теперь, что эрмитова квадратичная
форма ф (л*, х) принимает только вещественные значения. В соответ-
соответствии с (90.6) для полярной билинейной формы ср (х, у) имеем
ф,(у, х) = — х[ф (у + х, у 4- х) - ф (у - х, у - х) 4-
+ 1ф (у + ix, у + ix) - i(? (у - ix, у - ix)\ =
= — (ф (х + з', х + у) - ф (х - у, х - у) + *ф,(.т - iy, х - iy) -
1
- щ (х + iy, х + iy)) = — (ф (х + у, х + у) - Ф (х - у, х - у)
+ /ф {х + iy, х + iy) - щ (х - iy\ x iy)) = fp (x, у).
Следствие. Среди эрмитовых билинейных форм кососимметрич-
ные и только они поролсдают чисто мнимые эрмитовы квадратичные
формы.
Следствие. Никакая эрмитова несимметричная билинейная форма
не может породить вещественную эрмитову квадратичную форму.
Как вытекает из свойств линейности билинейных и эрмитовых
билинейных форм по каждому аргументу, ф @, 0) = 0 для любой квад-
квадратичной формы ф (х, х). Однако в общем случае могут существовать
и ненулевые векторы х, для которых ф (х, х) = 0. Тадсие векторы мы
будем называть изотропными. Понятие изотропности связано только
с квадратичной формой. Поэтому векторы, изотропные для одной
квадратичной формы, могут быть не изотропными для другой квад-
квадратичной формы и наоборот. В частности, лемма 90.1 означает, чго
для квадратичной формы, порожденной кососимметричной билинейной
формой, все векторы пространства Кп, кроме нулевого, являются
изотропными.
Среди обыкновенных и эрмитовых вещественных форм наибольшее
применение находят те из них, которые при всех векторных аргумен-
аргументах принимают значения одного и того же знака. Вещественная
квадратичная форма ф (х, х) называется положительно определенной,
если ф(х, х) > 0 для всех х Ф 0. Форма называется неотрицательной,
если для всех х Ф 0 выполняется неравенство ф (х, х) ^ 0. Аналогично
296 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. 11
определяются неположительные и отрицательно определенные квадра-
квадратичные формы*
Как правило, только положительно и отрицательно определенные
квадратичные формы называются знакопостоянными. Но иногда знако-
знакопостоянными называются также неотрицательные и неположительные
квадратичные формы. Во избежание появления недоразумений в нуж-
нужных случаях положительно и отрицательно определенные квадратичные
формы мы будем называть строго знакопостоянными.
Если квадратичная форма является знакопостоянной, то и порож-
порождающую ее обыкновенную или эрмитову билинейную форму будем
называть положительно определенной, неотрицательной и т.д.
Если вещественная квадратичная форма ср (х, х) строго знако-
знакопостоянная, то она не имеет изотропных векторов. В случае веществен-
вещественных билинейных и эрмитовых симметричных билинейных форм ф (х, у)
соответствующие квадратичные формы будут вещественными и для них
верно обратное утверждение. Именно, имеет место
Теорема 90.1. Пусть квадратичная форма ф(х, х) порождена ве-
вещественной билинейной или эрмитовой симметричной билинейной фор-
формой ф (х, у). Если ф (х, х) не имеет изотропных векторов, то она
строго знакопостоянная.
Доказательство. Как уже отмечалось, квадратичная форма
Ф (х, х) вещественная. В обоих случаях на коллинеарных векторах она
принимает значения одного и того же знака. Предположим, что
Ф (х, х) не является строго знакопостоянной. Тогда найдутся линейно
независимые векторы и, v такие, что ф (и, и) > 0, ф (v9 v) < 0. Для
любого вещественного числа а
Ф (и + olv, и -Ь аи) = ф (м, и) -Ь а(ф(м, v) + ф (v, и)) 4- а2ф (у, v). (90.8)
Правая часть этого равенства есть многочлен второй степени отно-
относительно а. Его коэффициенты вещественные, что определяется ве-
вещественностью квадратичной формы ф(х, х) и леммой 90.3. Так как
Ф (и, м) и ф (у, v) имеют противоположные знаки, то многочлен (90.8)
будет иметь два вещественных корня. Пусть у.о — один из них. Это
означает, что ф (и + аог>, и 4- otov) — 0. Однако вектор и + aot; ненулевой
в силу линейной независимости векторов и, и, поэтому обращение
на нем квадратичной формы в нуль невозможно по условию теоремы.
Полученное противоречие завершает доказательство теоремы.
Мы не случайно ограничились рассмотрением в теореме 90.1
квадратичных форм, порожденных только вещественной билинейной
и эрмитовой симметричной билинейной формами. Никакая другая
билинейная форма не может привести к вещественной квадратичной
форме. По существу осталось рассмотреть лишь билинейную форму
в комплексном пространстве. Но такая билинейная форма не может
породить" вещественную квадратичную форму, не равную тождественно
нулю. Если для некоторого вектора и квадратичная форма принимает
не равное нулю вещественное значение ф (и, и), то ф (аи, оси) = а2ф (и, и)
§ 90] ОБЩИЕ СВОЙСТВА БИЛИНЕЙНЫХ И КВАДРАТИЧНЫХ ФОРМ 297
будет комплексным числом при любом комплексном а с ненулевыми
вещественной и чисто мнимой частями. Итак,
Для вещественных квадратичных форм строгая знакопостоянность
является необходимым и достаточным условием, чтобы эта форма
не имела изотропных векторов.
Комплексная билинейная форма всегда порождает квадратичную
форму, имеющую изотропные векторы, если только она определена
на линейном пространстве размерности больше единицы. Действи-
Действительно, если предположить, что это не так, то всегда найдутся
линейно независимые векторы и, и, для которых ф (и, и) ф 0, ф (v, v) ф 0.
Но согласно (90.8) вектор и + at? будет изотропным при подходящем
выборе комплексного числа а. Эрмитова билинейная комплексная
форма может породить квадратичную форму, не имеющую изотропных
векторов. Как вытекает из наших исследований,
Для того чтобы квадратичная форма, порожденная эрмитовой би-
билинейной формой, не имела изотропных векторов, достаточно, чтобы
вещественная (или мнимая) часть квадратичной формы была строго
знакопостоянной.
Упражнения.
1. Доказать, что для любой билинейной формы ф(х, у) выполняются
равенства ф @, у) = Ф (.v, 0) = 0 при любых х, у е Кп.
2. Определить размерность и базис линейного пространства билинейных
форм.
3. Доказать, что множества симметричных и кососимметричных билиней-
билинейных форм образуют подпространства в линейном пространстве всех билиней-
билинейных форм.
4. Доказать, что пространство всех билинейных форм есть прямая сумма
подпространств симметричных и кососимметричных билинейных форм.
5. Доказать, что множество всех квадратичных форм образует линейное
пространство, Определить его размерность и базис.
6. Образуют ли линейные подпространства следующие множества квадра-
квадратичных форм:
знакопостоянные квадратичные формы,
квадратичные формы, принимающие вещественные значения,
квадратичные формы, не имеющие изотропных векторов,
квадратичные формы, для которых все векторы из заданного множества
являются изотропными?
7. Доказать, что для любой квадратичной формы, заданной в, нормиро:
ванном пространстве, существует такое число ос, что при всех л*
|ф(л%л-)Кос||л-]|2.
8. Пусть квадратичная форма ф (л% х) — строго знакопостоянная, квадра-
квадратичная форма ф (л\ л) - произвольная. Доказать, что существует такое число р,
что при всех л
|ф(.\\ х)|<Рф(л\ л-).
9. Доказать, что квадратичная форма не строго знакопостоянна тогда
и только тогда, когда множество изотропных векторов и нулевой вектор
образуют линейное подпространство.
298 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. 11
10. Рассмотреть упражнения 1-9 для эрмитовых билинейных и квадратин-*
ных форм. Все ли высказанные утверждения остаются справедливыми?
11. Пусть в комплексном пространстве К„ некоторое подпространство L
состоит только из изотропных векторов эрмитовой билинейной формы ф (х, у)
и нулевого вектора. Доказать, что <р (и, v) = 0 для любых векторов щ veL.
§ 91. Матрицы билинейных и квадратичных форм
Исследуем билинейную форму ф (х, у), заданную в1 пространстве
Кп. Вйберем в Кп два фиксированных базиса еи е2> ..., еп и
<?ь Яъ •> In и пусть
и п
х = I %fib У = X ЛА-
1—1 J— X
Тогда в силу свойств @0.1) имеем
Ё^, iw)'= t Z9fe,^)^ (91.1)
Обозначим, как прежде, через хе и yq матрицы размеров
w х 1, составленные из координат векторов х п у в собтвет1 ствую-
щих базисах, а че^ез Geq матрицу порядка п с элементами g\*q) =
*=ф(е*, qj). Соотношение (91.1) означает, что
ф(л%у) = л'^Л. (91.2)
Таким образом, при фиксированных базисах в пространстве K,t
билинейная форма может быть представлена в матричном виде (91.2),
Матрица Geq называется матрицей билинейной формы и при фикси-
фиксированных базисах определяется однозначно. Если предположить, что дли
формы ф(х, у) кроме (91.2) существует другое аналогичное представ-
представление с некоторой матрицей feq, то бери х = eh у = эд, мы сразу по-
получаем, что /jj«> = <p(ei9 qj), т. е. Feq = Geq.
Отметим, что правая часть (91.2) при любой матрице Geq опреде-
определяет некоторую билинейную форму. Выполнение соотношений (90.1)
непосредственно вытекает из соответствующих свойств матричных опера-
операций. Тем самым при фиксированных базисах в К„ устанавливается
взаимно однозначное соответствие между билинейными формами и
квадратными матрицами. '
При замене базйсбв в Кп матрйцд1 билинейной1 формы^ конечно,
меняется. Пусть Р — матрица преобразования координат при переходе
от базиса еъ е2, .., еи к базису /ь f2, ..., fm a Q -
матрица преобразования координат при переходе от ql9 q2i ..., qrt
к tl9 t2, .-, tn. Согласно F3.3)
xe = Pxf9 yq = Qyu (91.3)
пЬэтому из (§1.2) вытекает, что
ф(х, у) = xfeGeqyq = x'fP'GeqQyt.
§ 91] МАТРИДЙ БИЛШЁЙНЬрС И КВАДРАТИЧНЫХ ФОРМ 299
Щ с другой стороны,
Следовательно,
(91.4)
Так как матрицы Р ц Q невырождендые, то в сфотэетствии
с введенной в § 64 терминологией мы будем называть матрвды
Gft и Geq эквивалентными. Как было показано ранее, эквивалентные
матрицы одного порядка и только они имеют один и тот же ращ\
Это означает,, что ранг матрицы билинейной формы не зависит от
выбранных базисов и является характеристикой самой формы. Мы будем
называть его рангом билинейной формы, ррлинейную форму будем
называть невырожденной, если невырождена ее матрица. Характеристи-
Характеристикой билинейной формы является и разность между размерностью
пространства Кл и рангом формы. Будем называть ее дефектом би-
лидейной формы.
Из результатов § 64 вытекает, что все матрицы одного ранга эк-
эквивалентны диагональной матрице с элементами 0 и 1. На языке
билинейных форм этот факт говорит о том, что для произвольной
формы ранга г всегда можно указать такие базисы /ь /2, ..., /„ ц
tu *2> •••> гю в которых форма будет идоехь самьщ простой вид.
Именно, если
» п
i=i j=i
то
Раздельный вы^ор базисов для каждой цеременной билинейной
формы применяется довольно редко. Значительно чаще используется
общий базис, Пусть еи е2, ...? ^-некоторый базис Кп и
п п
В этом случае аналогично (91.1) получаем следующее представление
билинейной формы:
и п
*=i;=i
или в матричной записи
<$>(x,y)-x'eGeye. (91.5)
Здесь Ge - матрица с элементами g\f = ф {eh e^. Всюду в дальнейшем
именно матрицу Ge мы будем называть матрицей билинешюй формы.
300 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. И
Если снова Р есть матрица преобразования координат при переходе
от базиса еъ е2, ..., еп к базису fl9 /2, ..., /„, то матрицы Ge и Gf
одной и той же билинейной формы ф(х, у) будут согласно (91.4) связаны
между собой соотношением
Gf = P'GeP. (91,6)
Матрицы Ge и Gfi связанные между собой соотношением (91.6)
при невырожденной матрице Р, называются конгруэнтными. Конгру-
Конгруэнтные матрицы всегда эквивалентны. Обратное, конечно, в общем
случае неверно.
Сказанное относительно билинейных форм переносится с небольшими
изменениями на эрмитовы билинейные формы. Каждая эрмитова форма
единственным образом представляется в матричном виде
при фиксированных базисах е\, е2, ..., еп и #ь #2> •••> #«• При переходе
к другим базисам fu /2, ...,/„ и tl9 t2, ..., tn вместо (91.4)
будем иметь
Gft = P'GeqQ.
Если аргументы эрмитовой билинейной формы заданы в одном базисе,
то матричная запись формы аналогична (91.6). Именно,
q>{x,y) = x'eGeye. (91.7)
При переходе к новому базису матрицы формы будут связаны между
собой соотношением
Gf = P'GeP
и мы будем говорить, что эти матрицы эрмитово конгруэнтны.
Теперь можно установить связь между видом билинейной формы
и видом ее матрицы. Если форма симметричная, то при любом базисе
*ь е29 ..., еп
9\f = Ф {еь ej) = ф (ej9 et) = gf,
т. е. Ge = Gre и матрица Ge формы ф(х, у) является симметричной.
Если же форма кососимметричная, то
g\f = Ф (ei9 ej) = - ф (ej9 e() = -gf,
т. е. Ge = — Gg. В этом случае матрица Ge также называется кососим-
метричной.
Верно и обратное утверждение. Если в каком-либо базисе матрица
формы симметричная (кососимйетричная), то и порождающая ее били-
билинейная форма также будет симметричной (кососимметричной). Пусть
Gt» G^, тогда
Х'ДеУе = х'?еУе = ф(х, У).
§ 91] МАТРИЦЫ БИЛИНЕЙНЫХ И КВАДРАТИЧНЫХ ФОРМ 301
Если же G'e = - Ge, то
ф(й *) = ДОЛ = (ДОехе)' = x;G;ye = - x'eGeye = - ф(х,у).
Аналогичные утверждения имеют место и в отношении связи
эрмитовой билинейной формы и ее матрицы. Если форма эрмитова
симметричная, то
g\f = ф (eh ej) = ф (ej9 et) = gf,
т. е. Ge — G* и матрица Ge формы ф (х, у) является эрмитовой.
Если форма эрмитово кососимметричная, то
g\f - ф (eh ej) = - Ф(е,,^)= - flff,
т. е. Ge == — G*. В этом случае матрица Ge называется косоэрмитовой.
Верны и обратные утверждения. Пусть Ge = G*, тогда для порождаю-
порождающей эрмитовой билинейной формы имеем
Ф (У, х) = УвО^св = tye
Для случая Ge= — G* находим
Ф (У, х) = де«ле = (yiG^J = х'е&еУе = ^G*ye = - x'eGeye = - ф (х,
Матрица нулевой билинейной формы состоит только из нулевых
элементов, т. е. является нулевой матрицей. Это единственная матрица,
которая одновременно симметричная и кососимметричная, так же как и
нулевая форма.
Мы уже отмечали, что существует очень тесная связь между
симметричными билинейными и квадратичными формами. Эта связь
наглядно видна на матричном уровне. Для билинейной формы ф(х, у)
справедливо матричное соотношение (91.5). Для соответствующей квад-
квадратичной формы имеем
ф(х, x) = x;Gexe. (91.8)
При фиксированном базисе еи е2, ..., еп каждая запись вида (91.8)
при любой матрице Ge определяет некоторую квадратичную форму.
Матрица Ge в (91.8) называется уже не матрицей билинейной формы,
а матрицей квадратичной формы.
Если для билинейных форм существует взаимно однозначное со-
соответствие между формами и их матрицами при фиксированном базисе
в Кп9 то теперь такого соответствия нет. Каждая квадратичная форма
может быть задана целым множеством своих матриц. Это множество
содержит только одну симметричную матрицу и разность между дю-
быми двумя матрицами из данного множества — кососимметричная
матрица.
Таким образом, любую обыкновенную квадратичную форму всегда
можно задать симметричной матрицей. При переходе к другому базису
матрицы квадратичной формы меняются согласно $1.6). Поэтому
снова заключаем, что задача исследования симметричных билинейных
302 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 1Гл. И
и квадратичных форм тесно связаны друг с другом. Для эрмитовых
квадратичных форм это уже не так, так как между ними и эрмито-
эрмитовыми билинейными формами существует взаимно однозначное со-
соответствие и такое же соответствие имеет место между их матрицами.
По аналогии с билинейными формами мы будем называть рангом
квадратичной формы ранг ее матрицы в любом базисе. Если матрицй.
квадратичной формы невырожденная, то и квадратичную форму будем
называть невырожденной.
Изучение билинейных форм по существу означает изучение их матриц
в различных базисах или, что то же самое, изучение класса конгруэнтных
матриц. Поэтому все наши ближайшие исследования и будут связаны
с исследованием классов конгруэнтных и эрмитово конгруэнтных матриц.
Можно сразу же указать для таких классов ряд свойств, вытекаю-
вытекающих из предыдущих результатов. Так, матрица, конгруэнтная симметрич-
симметричной (кососимметричной), обязательно симметричная (кососимметричная).
В частности, симметричной будет матрица, конгруэнтная диагональной.
Отсюда заключаем, что ненулевая симметричная матрица никогда не
конгруэнтна кососимметричной, хотя может быть и эквивалентна ей,
а ненулевая кососимметричная матрица никогда не может быть кон-
конгруэнтна диагональной, Матрица, эрмитово конгруэнтная эрмитовой
(косоэрмитовой) матрице, обязательно эрмитова (косоэрмитова). Среди
диагональных матриц эрмитовой (косоэрмитовой) может -быть только
матрица с вещественными (часто мнимыми) элементами.
В соответствии с разложениями (90.4), (90.7) билинейных и эрмитово
билинейных форм получаем разложения произвольной матрицы в сумму
симметричной и кососимметричнрй, а также эрмитовой и косоэрмитовой
матриц. Эти разложения можно выписать в явном виде:
л (л + ло + (ллг
Если А — матрица билинейной формы, то первые слагаемые правых
частей являются матрицами симметричных частей билинейной формы,
а вторые — матрицами кососимметричных частей той же формы.
Мы будем часто без дополнительного объяснения переносить на
матрицы терминологию, введенную для билинейных и квадратичных
форм. Например, будем называть матрицу положительно определенной,
понимая под этим, что она является матрицей положительно опре-
определенной формы и т. п.
Одной из важнейших задач, связанных с билинейной формой, яв-
является определение простейшего вида, к которому может быть приведена
ее матрица при изменении базиса, и нахождение соответствующего
базиса. Эту задачу мы будем называть задачей преобразования
билинейной формы или задачей ее приведения к простейшему виду.
§ 91] МАТРИЦЫ БИЛИНЕЙНЫХ И КВАДРАТИЧНЫХ ФОРМ 303
В матричной трактовке задачу преобразования можно сформулиро-
сформулировать следующим образом:
По заданной матрице А" найти такую невырожденную матрицу Р,
чтобы конгруэнтная матрице А матрица
С = Р'АР (91.9)
имела наиболее простой вид.
По существу это дает разложение матрицы на множители, так
как из (9Г.9) вытекает, что
Конечно, для эрмитовых билинейных форм вместо (91.9) мы будем
рассматривать преобразования
С = Р'АР. (91.10)
С вычислительной точки зрения важно, чтобы матрица Р в (9L9),
(91.10) была не очень сложной. Это объясняется тем, что при нахождении
новых координат векторов через старые ъ соответствии с F3.3) при-
приходится решать систему линейных алгебраических уравнений с матрицей
Р № нужно, чтобы это решение осуществлялось достаточно быстро.
В некоторых случаях вместо матрицы Р удобнее находить матрицу Р.
Кроме рассмотренных форм записи билинейных и квадратичных форм
используются и некоторые другие. Иногда мы будем их задавать в яв-
явном виде;
И I! М 71
Ф= S 2>,Л-У,-> F= I 2>yix,-ry. (91.11)
i~lj=l i=lj=l
Эти записи можно упростить. Пусть, например, пространство веще-
вещественное, тогда вещественными буДут как сама билинейная форма,
так и матрица А из коэффициентов ajL. Введем пространство Rn,
элементами которого являются векторы-столбцы
X = (Л'ь Х2, ..., Л"„)', у = (уь V2, ..., )>„)',
и предположим, что скалярное произведение введено как сумма попарных
произведений- координат. Теперь можно записать:
Для эрмитовых билинейных форм при их записи в виде
п п п п
ф = I Z <w* F = Е I алх&
i=l 7=1 i=l j=l
снова имеет место (91.12), если, конечно, скалярное произведение вво-
вводить как сумму произведений координат первого вектора на комплексно
сопряженные* координаты второго вектора.
304 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. 11
Упражнения.
1. Доказать, что определитель эрмитовой матрицы есть вещественное число.
2. Каким числом является определитель косоэрмитовой матрицы?
3. Доказать, что ранг кососимметричной матрицы есть число четное.
4. Билинейные формы (р (х, у) и (р (у, х), вообще говоря, различные. Что
можно сказать о их матрицах?
5* Доказать, что ранг суммы билинейных форм не превосходит суммы рангов
слагаемых.
6. Доказать, что каждую билинейную форму ранга г можно представить
в виде суммы г билинейных форм ранга 1.
7. Доказать, что каждую билинейную форму ср(х, у) ранга 1 можно пред-
представить в виде
<р(х, у)~(р{х, а)'<р(Ь, у)
для некоторых векторов а3 Ь. Единственно ли такое представление?
§ 92. Приведение к каноническому виду
Прежде чем приступать к исследованию различных сфер применения
билинейных и квадратичных форм, рассмотрим общий метод конгру-
конгруэнтного и эрмитово конгруэнтного преобразования матриц к простому
виду.
Пусть задана квадратная -матрица А порядка п и требуется
найти такую невырожденную матрицу Р, что матрица С = Р'АР имеет
достаточно простой вид. При эрмитово конгруэнтномглгреобразовании
простой вид должна иметь матрица С = Р'АР, Мы опишем сейчас об-
общий метод преобразования, пригодный для всех матриц А. Отличия
конгруэнтного и эрмитова конгруэнтного преобразований друг от друга
будут незначительны. Поэтому для определенности будем считать, что
выполняется конгруэнтное преобразование матрицы.
Метод состоит в построении последовательности матриц Ао = А,
Аи А2,..., Asi в которой каждая последующая конгруэнтна предыдущей,
т. е.
для некоторой матрицы Pk+i. Так как отношение конгруэнтности тран-
зитивно, то последняя матрица As будет конгруэнтна исходной мат-
матрице Л» Принцип построения последовательности матриц Ак основан
на том, чтобы для всех к получать в матрице Ак+^ больше нулевых
элементов, чем в Матрице Ак. Более того, каждый раз, вычисляя мат-
матрицу Pfc+i по матрице Ак мы будем требовать, чтобы в матрице Ак+1
не только появлялись новые нулевые элементы, но и сохра-
сохранялись все нулевые элементы, полученные на всех предыдущих шагах.
Преобразование матрицы Ак в матрицу Ак+1 будем называть
основным шагом метода. Каждый основной шаг может состоять из
нескольких вспомогательных. Все они будут сводиться к выполнению
элементарных операций: перестановки столбцов (строк) матрицы, прибав-
§ 92] ПРИВЕДЕНИЕ К КАНОНИЧЕСКОМУ ВИДУ 305
ления к одному столбцу (строке) другого столбца (строки), умноженного
на число, умножений столбца (строки) на число. Мы опишем вспомо-
вспомогательные шаги в терминах преобразований матрицы А в конгруэнтную
ей матрицу С = Р'АР, опуская для простоты индекс fc.
• А. В матрице А элемент ах х Ф 0. Существует невырожденная матрица
Р такая, что для элементов первого столбца матрицы С = Р'АР выполня-
выполняются соотношения
О, 1Ф1.
Матрица Р отличается от единичной лишь своей первой строкой, при этом
Умножение матрицы А слева на матрицу F не меняет первую строку
матрицы А и делает нулевыми все внедиагональные элементы первого
столбца матрицы Р'А. Умножение матрицы Р'А справа на Р не меняет
первый столбец матрицы Р'А.
Отметим одно важное обстоятельство. Будем называть главными
все миноры матрицы, расположенные в верхнем левом углу. Так как
матрица Р — правая треугольная и все ее диагональные элементы равны,
единице, то среди всех миноров, расположенных в первых г столбцах,
отличен от нуля только главный минор — он равен единице. Поэтому
в матрицах А и С будут совпадать между собой все главные миноры.
Действительно, используя формулу Бине — Коши, находим
1 2... Л у A 2 ...Л (к, к2 ...
1 2 ... r)-^ki<kX,<K<nr \кх к2 ... К) \1 2 ...
_ /12... Л /1 Ч2 ...г\ (к, кг...к;
1 2
>1 2
Этим замечанием мы воспользуемся в дальнейшем.
В. В матрице А элемент ап равен 0, но некоторый элемент
ajj отличен от 0, j> 1. Существует невырожденная матрица Р такая,
что для матрицы С = Р'АР элемент сх х = йу3 отличен от 0. Матрица Р
отличается от единичной только четырьмя элементами, стоящими на
пересечений строк и столбцов с номерами I,;. В этих позициях матрица Р
/0 1\
имеет вид ( I. Умножение матрицы А справа на матрицу Р пере-
переставляет в матрице А столбцы с номерами 1, j. Умножение матрицы
306 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. И
АР слева на матрицу Р' переставляет в матрице АР строки с номера-
номерами 1, j.
С. В матрице А все диагональные элементы равны нулю, но есть
такие индексы j, I, где j < I, что aVi + ajt Ф 0. Существует невырожден-
невырожденная матрица Р такая, что для матрицы С— Р'АР элемент сп —
— fly + ciji отличен от 0. Матрица Р отличается от единичной одним
элементом ру=1. Умножение матрицы А справа на матрицу Р
прибавляет к j-ому столбцу матрицы А ее 1-й столбец. Умноже-
Умножение матрицы АР слева на матрицу F прибавляет к j-й строке матрицы
АР ее /-ю строку.
1>. Матрица А — ненулевая шсосимметричная, элемент а12 равен 0,,
но некоторый элемент а# отличен от 0, где j < I. Существует невырож-
невырожденная матрица Р такай, что в кососимметричной матрице С =
= Р'АР элемент с12 = % отличен от 0. Матрица Р представлена в
виде произведения Р = Р1-Р2. Матрицы Pi9 P2 отличаются от единичных
лишь четырьмя элементами, стоящими на пересечении строк и столб-
столбцов соответственно с номерами 1, j и 2, I В этих позициях матрицы
Рх и Р2 имеют вид ( ). Как уже говорилось, умножение справа на
эти матрицы осуществляет перестановку столбцов, умножение слева —
пфестайовку строк.
Е. Матрица главного Минора третьего пьрядка матрицы А имеет вид
(92.3)
где элементы ап, а2^ и а32 отличны от нуля. Существует невы-
невырожденная матрица Р такая, что в матрице С = Р'АР будут отличйы
от нуля первые три главных минора. Матрица Р отличается от
единичной одним1 элементом р31, который может быть любым числом,
кроме 0, — а12а32 й — ацаГз1- Умноэкение матрицы А справа на матрицу
Р прибавляет к первому столбцу матрицы А ее третий столбец,
умноженной на р31. Умножение матрицы АР слева на матрицу F
прибавляет к первой строке матрицы АР ее третью строку, умно-
умноженную на р31.
F. Матрица А — кососимметричная, элемент а12 отличен от 0.
Существует невырожденная матрица Р такая, что для элементов* первых
двух столбцов матрицы С = Р'АР выполняются соотношения
J - Я12, 7 = 2, j a12, j = 1,
Так как при конгруэнтном преобразовании кососимметричная матрица
переходит в кососимметричн*ую, то аналогичные соотношения будут
иметь место и для элементов первых двух строк матршхй С. Матрица Р
представляется в виде произведения Р = Рх-Рг. Матрица Рг отличается
§ 92} ПРИВЕДЕНИЕ К КАНОНИЧЕСКОМУ ВИДУ
от единичной лишь второй строкой, при этом
О, ./=1,
307
\ «12
Матрица Р2 отличается от единичной только- первод строкой, при этом
1, J = U
О, j = 2,
«12
Умножение матрицы А слева на матрицу Pi не меняет первые две
строки и второй столбец адатридь? А и делает нулевыми все элементы
первого столбца матрицы Р'ХА, кроме первых двух. Умножение матрицы
Pi А слева на матрицу Р2 не меняет первые две строки д первый
столбец матрицы Р\А и делает нулевыми все элементы второго столбца
матрицы Р'А, кроме первых двух. Умножение матрицы Р'А справа на
матрицу Р не меняет первые два столбца матрицы Р'А.
G. Предположим, что матрица А имеет при каком-ндбудь разбдении
на клетки строение
Л = ^НИ^5 (92.4)
где Аи, Лц — квадратные клетки. Если Р22 — невырожденная матрица,
порядок которой равен порядку Агъ то матрица
\ О :Р' А р J
конгруэнтна матрице А. При этом С = Р'АР, где
р = /?:0
Непосредственная проверка всех утверждений, высказанных при описа-
описании вспомогательных шагов, не представляет особой трудности, и мы
предлагаем читателю убедиться в их справедливости в качесчве упраж-
упражнений.
Метод в целом осуществляется следующим образом. На первом
основном шаге матрица А приводится к виду (92.4), где Ап —
невырожденная матрица первого или второго порядка. Если матрица
Ак, к ^ 1, имеет вид (92.4), то на очередном основном шаге матрица
в нижнем правом углу также приводится к виду (92.4) и выполняется
общее конгруэнтное преобразование согласно шагу О. Матрицу Ak+i
308, БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (Гл. 11
снова можно представить в виде (92.4), но для нее клетка в верхнем
левом углу будет не только невырожденной, но и будет иметь больший
порядок, чем для матрицы Ак. Процесс повторяется до тех пор, пока
на каком-то шаге в матрице As не появится в представлении (92.4)
нулевая клетка в нижнем правом углу или порядок клетки в верхнем
левом углу не -станет • равным п. При этом матрица результирую-
результирующего преобразования будет равна произведению слева направо матриц
преобразований всех шагов.
Вид матрицы As зависит от того, является ли матрица А косо-
симметричной или нет. От этого же зависит и состав основных шагов
метода из вспомогательных.
Как бы не был устроен основной шаг, его цель состоит в получении
очередной порции нулей в преобразуемой матрице. Если исходная мат-
матрица не кососимметричная, то нули всегда получаются с помощью
вспомогательного шага А, а шаги В — С нужны лишь для его подго-
подготовки. Если же исходная матрица косоеимметричная, то нули получа-
получаются с помощью шага F, а подготовительным является шаг D.
Мы опишем основной шаг метода также в терминах преобразования
матрицы А и начнем с некососимметричной матрицы А.
На первом основном шаге преобразуемая матрица некососимметрич-
ная. Если элемент ях t Ф О, а все внедиагональные элементы первого
столбца нулевые, то ничто не.меняется и считаем, что основной шаг
выполнен. При этом в качестве матрицы преобразования Р берем
единичную матрицу. В общем же случае выполняем первый из
вспомогательных шагов А — С, который можно осуществить. Если тако-
таковым окажется шаг В или С, то после него обязательно выпол-
выполняем шаг А или оба шага В, А. В качестве матрицы преобразо-
преобразования Р берем произведение слева направо всех матриц преоб-
преобразований действительно реализованных вспомогательных шагов. В ре-
результате выполнения первого основного шага в преобразованной
матрице Аг будут нулевыми все внедиагональные элементы первого
столбца, т. е. матрица At будет иметь клеточное строение вида
(92.4).
Отличие всех остальных шагов от первого связано с тем, что
преобразуемая матрица может оказаться кососимметричной. Если она не
кососимметричная, то очередной основной шаг ничем не отличается
от первого. Если же преобразуемая матрица кососимметричная, то при
любом ее конгруэнтном преобразовании она остается кососимметричной
и нельзя только с ее помощью получить ненулевой элемент в верхнем
левом углу. Выход из этого положения основан на том, чтобы
преобразовывать расширенную нижнюю диагональную клетку.
Пока не встретится кососимметричная матрица, клетка в верхнем
левом углу представления (92.4) для матриц Ак будет правой треуголь-
треугольной с ненулевыми диагональными элементами. Если элементы в пози-
позициях A, 2) и B, 1) кососимметричной матрицы в нижнем правом углу
отличны от нуля, то для очередной преобразуемой матрицы Ак
§ 92] ПРИВЕДЕНИЕ К КАНрНИЧЕСКОМУ ВИДУ 309
заменим представление (92.4), уменьшив на единицу порядок клетки
в верхнем левом углу. Теперь матрица третьего порядка в верхнем
левом углу новой нижней диагональной клетки будет иметь вид
(92.3), и мы можем выполнить вспомогательный шаг Е. После этого
можно три раза подряд выполнять шаг А. В самом деле, как мы
отмечали, реализация шага А не меняет главные миноры матрицы.
Следовательно, в данном случае после выцолнения шага А у новой
матрицы в нижнем правом углу будут отличны от нуля два первых
главных минора. Поэтому можно заведомо сделать еще один шаг А.
Аналогичные рассуждения показывают, что шаг А можно выполнить
и в третий раз. Отступив на один шаг «назад», мы получили возмож-
возможность продвинуться на три шага «вперед». В случае необходимости
перед осуществлением шага Е выполняется шаг D.
Таким образом, если матрица А не является кососимметричной,
то описанный" выше метод позволяет построить такую невырожденную
матрицу Р9 что конгруэнтная матрице А матрица Р'АР будет иметь
следующее строение:
Здесь М — правая треугольная матрица с ненулевыми диагональ-
диагональными элементами, порядок матрицы М равен рангу матрицы А,
Если матрица А кососимметричная, то все основные шаги метода,
в том числе и первый, выполняются по одной схеме. Пусть уже
получена матрица Ак вида (92.4), причем в верхнем левом углу стоит
невырожденная клеточно диагональная матрица с кососимметричными
клетками второго порядка. Так как при конгруэнтном преобразова-
преобразовании кососимметричная матрица переходит в кососимметричную, то
клетка Ai2 в (92.4) будет нулевой. Сначала добиваемся того, чтобы в
позициях A, 2) и B, 1) кососимметричной матрицы в нижнем правом
углу стояли ненулевые элементы. Возможно, что для этого потребуется
сделать вспомогательный шаг D. Далее выполняем шаг F, что добавляет -
к диагонали еще одну невырожденную кососимметричную клетку второго
порядка, и переходим к следующему основному^ шагу. Процесс и теперь
продолжается до тех пор, пока на каком-то шаге в матрице As
не появится в представлении (92.4) нулевая клетка в нижнем правом углу
или порядок клетки в верхнем левом углу не станет равным п.
Итак, если матрица А — кососимметричная, то в этом случае метод
позволяет построить невырожденную матрицу Р, для которой матрица
Р'АР будет иметь следующее строение:
(92.6)
Здесь М — клеточно диагональная матрица с невырожденными косо-
симметричными клетками второго порядка. Порядок матрицы М
равен рангу матрицы А.
310 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. И
При эрмитовом конгруэнтном иреобразоэании общая схема метода
остается без изменения. Однако сам процесс оказывается даже проще,
нем при обычном конгруэнтном дреобразозании, если заменить вспо-
вспомогательный щаг С на следующий.
С. В матрице А все диагональные элементы рарны нул^о, но есть
такие индексы j9 /, где j < /, что среди элементов aVp aJt хотя бы один
отличен от нуля. Существует невырожденная матрица Р такая, что для
матрицы О— Р'АР один из диагональных элементов сп, сп отличен от
нуля. Именно, Cjj = ajt + aVp cn = i(an — aij). Матрица P отличается от
единичной двумя элементами р0- = 1, pjt = L Умножение матрицу А справа
на матрицу Р прибавляет к j-ому .столбцу матрицы А ее /-Ц столбец,
а к /,-,ому столбцу ее ;-й столбец, умноженный на — i. Умножение мат-
матрицы АР слева на матрицу Р' прибавляет к j-й строке матрицы АР
ее 1-ю строку, а к /-й строке — ее ;-ю строку, умноженную на i.
Тецерь нет никакой необходимости в шагах Р — F общего метода,
так как мы никогда не пойдем дальше шага С. При этом формулы
(92.2) остаются без изменения.
Таким образом, если А — ненулевая матрица, то метод позволяет
построить такую невырожденную матрицу Р, что эрмитово конгруэнт-
конгруэнтная матрице А матрица Р'АР будет .иметь следующее строение:
(92.7)
Здесь М — праэая треугольная матрица с ненулевыми диагональными эле-
элементами. Порядок матрицы М равен рангу матрицы А.
Виды матриц (92.5) — (92.7) назьщаются каноническими для операций
конгруэнтного преобразования. Каноническим называется и любой базис,
в котором исходная матрица имеет такой вид. Сами по сфе матрицы
вида (92.5), (92.7) цосят дазвание правых трапециевидных. Аналогично
определяются левые трапециевидные матрицы.
Отметим, ряд интересных выводов, вытекающих из канонических
видов матриц. Как мы уже говорили, при конгруэнтном преобразо.-
вании сохраняется симметричность и кососимметричность матрицы.
Если одним из этих свойств обладала исходная матрица, то оно должно
церецти и в канонический вид. Поэтому в дополнение к сказанному,
можно заключить, что
Симметричная матрица конгруэнтна диагональной матрице.
Эрмитова матрица эрмитово конгруэнтна вещественной диагональной
матрице.
Косоэрмитова матрица эрмитово конгруэнтна чисто мнимой диа-
диагональной матрице.
Во всех этих случаях приведение к каноническому виду осуществляется
особенно просто, так как не может появиться необходимость выпол-
выполнения хотя бы одного из вспомогательных шагов D — F.
С матрицами канонического вида (92.5), (92.6) можно совершить еще
одно конгруэнтное преобразование с диагональной матрицей и дрбиться
§ 92] ПРИВЕДЕНИЕ К КАНОНИЧЕСКОМУ ВИДУ 311
того, чтобы ненулевые элементы, определяющие невырожденность клетки
М, были равны либо +1, либо —1. Такой канонический вид матрицы
и соответствующий ему базис называются нормальными. Ясно, что
умножение справа (слева) на диагональную матрицу приводит к
умножению столбцов (строк) на диагональные элементы матрицьг преоб-
преобразования. Снова опишем это преобразование в терминах выполнения
вспомогательного шага с матрицей А.
Н. Вещественная некососимметричная матрица А ранга г имеет
канонический вид (92.5). Существует вещественная диагональная" матрица
Р такая, что у матрицы С = Р'АР ненулевые диагональные элементы
Cjj равны signa^-. При этим
f (aj7signer1'2, j^r,
Pjj~{ 1, />r.
Вещественная (комплексная) кососимметричная матрица А ранга г
имеет канонический вид (92.6). Существует вещественная (комплексная)
диагональная матрица Р такая, что у матрицы С = Р'АР ненулевые
наддиагональнйе элементы равны +1, а ненулевые поддиагональные
элементы равны —1. При этом
Г i? j - нечетное,
Pii~~\a7-\,j> j-четное.
Комплексная некососимм'етрйчная матрица А ранга г имеет канони^-
ческий вид (92.5): Существует комплексная диагональная' матрица Р та-
такая, что у матрицы С = Р'АР ненулевые диагональное элементы сп-
справны 1. При этом
Эрмитово конгруэнтное преобразование с диагональной матрицей
выполняется редко, так как с его помощью можно изменить лишь
модули элементов, определяющих невырожденность клетки М в (92.7),
но нельзя комплексное диагональные элемЬнты сделать вещественными.
Упражнения.
1. Доказать, что если приведение к каноническому виду с помощью мат-
матрицы Р осуществляется по рассмотренному йьйпе методу, то detP= ±1.
2. Что означает с точки зрения канонического вида матричное равенство
3. К какому виду моэкно привести некососимметричную матрицу с помо-
помощью конгруэнтного преобразования, если исключить вспомогательный шаг Е?
4. Какой йид имеет матрица преобразбвания F, если каждый основной шаг
рассмотренного выше метода состоял только из вспомогательного шага А?
5* Доказать, что любая правая треугольная матрица конгруэнтна левой
треугольной. Каков простейший вид- матрицы преобразования?
312
БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ
[Гл. И
6. Доказать, что любая невырожденная матрица нечетного порядка конгру-
конгруэнтна невырожденной правой треугольной матрице.
7. Пусть матрица G — матрица положительно определенной билинейной
формы.ч Доказать, что для ее элементов g{j при всех i, j выполняются соот-
соотношения
да > 0, {Qij + д]гJ < 4 дмр
8. Пусть матрица G — матрица отрицательно определенной билинейной-
формы. Доказать, что для ее элементов gtj при всех i, j выполняются соотно-
соотношения
Qu < Q, (dij + 9jd2 < 4 gagjj.
9. Доказать, что матрицы всех симметричных положительно (отрицательно)
определенных билинейных форм конгруэнтны между собой.
10. Доказать, что для того чтобы матрица G была матрицей знакопере-
знакопеременной билинейной формы, достаточно, чтобы среди ее диагональных эле-
элементов были элементы разных знаков.
§ 93. Конгруэнтность и матричные разложения
Общий метод конгруэнтного преобразования матрицы к каноническо-
каноническому виду не всегда позволяет заранее сказать, какой вид будет иметь
матрица преобразования координат при переходе к каноническому
базису. Однако при некоторых дополнительных ограничениях, наклады-
накладываемых на исходную матрицу, на этот вопрос можно дать вполне
определенный ответ.
Предположим, что у матрицы А отличны от нуля все главные
миноры, кроме, может быть, минора наибольшего порядка, т. е. опре-
определителя матрицы А. Покажем, что такую матрицу всегда можно предста-
представить в виде произведения
А = LDU, (93.1)
где L— левая треугольная матрица с единичными диагональными элемен-
элементами, D — диагональная матрица, U — правая треугольная матрица с еди-
единичными диагональными элементами, т. е.
1
hi
о
о
U2Hi
Приравнивая между собой элементы матрицы А и произведения
LDU, получаем
min (i, j)
««- I Mw%- (93-2)
§ 93] КОНГРУЭНТНОСТЬ И МАТРИЧНЫЕ РАЗЛОЖЕНИЯ 313
Теперь из (93.2) последовательно находим все неизвестные элементы
матриц разложения (93.1). Именно,
i-l
i
(93.3)
4
^
4
Применим к соотношению (93.1) формулу Бине — Коши. Вспомним,
что среди миноров левой треугольной матрицы L, находящихся в пер-
первых г строках, отличен от нуля только главный минор — он равен
единице. Аналогичное утверждение имеет место и для матрицы U с
заменой, конечно, строк столбцами. Поэтому
А 2 ... Л v ,/12 ... г \ (к, к2 ... кг\\
)^JVU{ 2 ...)
Отсюда заключаем, что
( \ - )
= а11г 4 = — ——-. (93.4)
По условию главные миноры матрицы А отличны от нуля. Следова-
Следовательно, будут отличны от нуля все диагональные элементы d{i в
(93.4), кроме, может быть, последнего.
Довольно часто мы будем иметь дело с разложениями (93.1) для
симметричных и эрмитовых матриц. Если снова у матрицы А отличны
от нуля все главные миноры, кроме, может быть, последнего, то сим-
симметричную матрицу всегда можно представить в виде произведения
А = S'DS, (93.5)
314
БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ
а эрмитову матрицу в виде произведения
Л = S'DS,
(93.6)
Здесь S — правая треугольная матрица с единичными диагональными
элементами, D — диагональная матрица, т. е.
о
sin
о
О
В полном соответствии с (93.3) теперь будем иметь
i-l
i
для разложения (93.5) и
i-i
i-l
Z
l
(93.7)
для разложения (93.6). При этом формулы (93.4) сохраняются.
Разложения (93.1), (93.5), (93.6) очень широко используются для
решения самых различных задач линейной алгебры. Что же касается
конгруэнтных преобразований матрицы, то данные разложения приводят
к следующим соотношениям:
(L-vyAL~v - DUL~V, (L^YAL717 = DULrT\
S-VAS~1 =D, S-1AS-1=D.
Матрицы DDL' и DUL~V - правые треугольные, матрицы D-
диагональные, причем нулевой элемент на их главных диагоналях
§ 93] КОНГРУЭНТНОСТЬ И МАТРИЧНЫЕ РАЗЛОЖЕНИЯ 315
может быть только последним. Поэтому мы снова получили уже избест-
ные нам канонические виды матриц при конгруэнтном преобразований.
Однако теперь можно утверждать, что матрицы преобразования
координат при переходе к каноническому базису будут правыми треуголь-
треугольными, так как правыми треугольными являются матрицы L~v, S~\ Сами
рассмотренные разложения дают матрицы I/, S преобразований коорди-
координат при переходе от канонического базиса к первоначальному, которые
также будут правыми треугольными.
В случае симметричной матрицы описанный процесс разложения
тесно связан с так называемым алгорифмом Якоби преобразования
квадратичной формы к каноническому виду. Различие заключается лишь
в том, что в алгорифме ЯкОби вместо матрицы S определяется матрица
5. Заметим, что матрица S находится значительно проще, чем S~S
Конгруэнтные преобразования с правой треугольной Матрицей явля-
являются одними из самых простых, но все еще достаточно общих, чтобы
быть применимыми к широкому классу матриц. Поэтому определенный
интерес представляет описание того класса Матриц, которые могут
быть приведены к каноническому виду с поМоцДью преобразования с пра-
правой треугольной матрицей.
Лемма 93.1.- Если прямоугольная матрица А представлена в кле-
клеточном виде
(93.8)
где В — квадратная невырожденная матрица порядка г, то ранг матрицы А
равен г в том и только в том случае, когда
. T=RB~1Q. - (93.9)
Доказательство. УмножиМ матрицу А слева на невырожденную
клеточную матрицу
где соответствующие клетки имеют такие же размеры, как в (93.8). Тогда
Матрицы А и VA имеют один и тот же ранг, но он будет равен г
тогда и только тогда, когда Т— RB~1Q = 0.
Теперь Мы можем описать искомый класс матриц. Он Оказывается
тесно сгёязанйым с матрицами Ьида (93.8), (93.9).
Теорема 93.1. Для того чтобы некососимметричная мйтрица А
могла быть приведена к каноническому виду с помощью конгруэнтндгд
преобразования с правой треугольной матрицей, необходимо и достаточно,
чтобы число первЫх ненулеЩх главных миндров матрицы А равнялось
ее рангу.
316 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. 11
. Доказательство. Необходимость. Пусть некососим-
метричная матрица А с помощью правой треугольной матрицы Р при-
приводится к каноническому виду (92.5). Ясно, что число первых ненулевых
главных миноров в матрице А не может быть больше, чем порядок
клетки М. Применяя формулу Бине - Коши и принимая во внимание,
что в первых столбцах матрицы Р нет ненулевого минора, кроме
главного, получим
2 ..
для всех s, не превосходящих порядка матрицы М. Так как главные
миноры матриц М и Р отличны от нуля, то число первых ненулевых
главных миноров матрицы А равняется ее рангу.
Достаточность. Предположим, что число первых ненулевых
главных миноров матрицы Л и ее ранг равны г. Представим мат-
матрицу А в клеточном виде (93.8), где порядок клетки В равен г.
Так как у матрицы В отличны от нуля все главные миноры, то согласно
сказанному выше ее можно представить в виде В = LDU анало-
аналогично (93.1). Построим клеточную матрицу
Непосредственная проверка показывает, что
р>ар =
Матрица DUL r — невырожденная правая треугольная, матрица Р —
невырожденная правая треугольная и, следовательно, матрица А
нужным способом приводится к каноническому виду.
Для конгруэнтного преобразования кососимметричной матрицы и
эрмитова конгруэнтного преобразования произвольной матрицы соот-
соответствующие утверждения доказываются аналогично, и мы ограничимся
лишь их формулировкой.
Теорема 93.2. Для того чтобы кососимметричная матрица А
ранга г могла быть приведена к каноническому виду с помощью кон-
конгруэнтного преобразования с правой треугольной матрицей, необходимо
и достаточно, чтобы число первых ненулевых главных миноров четного
порядка матрицы А равнялось г/2.
Теорема 93.3. Для того чтобы матрица А могла быть приведена
к каноническому виду с помощью эрмитова конгруэнтного преобразо-
преобразования с правой треугольной матрицей, необходимо и достаточно, чтобы
число первых ненулевых главных миноров матрицы А равнялось ее
рангу.
Конгруэнтные и эрмитово конгруэнтные преобразования матрицы
не являются в общем случае преобразованиями подобия, Однако, если
§ 93] КОНГРУЭНТНОСТЬ И МАТРИЧНЫЕ РАЗЛОЖЕНИЯ 317
для некоторого класса матриц Р выполняется одна из групп соотношений
РР' = Р'Р = Е9 РР* = Р*Р = ?, (93.10)
то в этом случае преобразование конгруэнтности становится преобразова-
преобразованием подобия и для проведения исследований можно привлекать полу-
полученные ранее результаты, относящиеся к подобию матриц. Как мы уже
знаем, первой группе соотношений в (93.10) удовлетворяют вещественные
ортогональные матрицы, второй группе соотношений — комплексные
унитарные матрицы. Поэтому, вспоминая результаты §§ 76—81, относя-
относящиеся к ортогональному и унитарному подобиям, заключаем, что
справедливы следующие утверждения.
Любая-вещественная симметричная или кососимметричная матрица
приводится к каноническому виду конгруэнтным преобразованием с
ортогональной матрицей.
Любая комплексная матрица приводится к каноническому виду эрми-
эрмитовым конгруэнтным преобразованием с унитарной матрицей.
Эти утверждения представляют, в основном, теоретический интерес,
так как практически находить ортогональные и унитарные матрицы
преобразования очень трудно, особенно при п ^ 5.
Упражнения.
1. Доказать, что если разложения (93.1), (93.5), (93.6) существуют, то они
единственные.
2. Доказать, 4to если у матрицы А отличны от* нуля все миноры
(кроме, может быть, минора наибольшего порядка), стоящие в нижнем правом
углу, то существует и притом единственное разложение А = LDU, где L— пра-
правая треугольная, U — левая треугольная матрицы с единичными диагональными
элементами, D — диагональная матрица.
3. Доказать, что для элементов du матрицы D из упражнения 2 спра-
справедливы соотношения
U i + l, ..., п\
i, i + l,..., п)
i + l, i+2, ..., /г
4. На какие треугольные множители можно разложить матрицу, если у
нее» отличны от нуля миноры, находящиеся в левом нижнем (правом верхнем)
углу?
5. Пусть для элементов аи матрицы А выполняются соотношения
ло = 0, k<j-i, ;'-*</, (93.11)
при некоторых числах I <к. Такая матрица называется ленточной. Доказать,
что если для ленточной матрицы А имеет место разложение (93.1), то
6. Матрица А называется трехдиагоналъной, если она удовлетворяет усло-
условиям (93.11) при fe = l, /= -1. Какой вид имеют формулы (93.3), (93.7) для
трехдиагональной матрицы?
318 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. 11
7. Матрица А называется правой (левой) почти треугольной, если она
удовлетворяет условиям (93.11) при к = п, I — — X (к = 1, I = — п). Какой вид
имеют .формулы (93.3) для почти треугольных матриц?
8. Какое число арифметических операций требуется выполнить для различных
видов матриц при получении разложений типа (93.1)?
9. Как применить разложения (93.1), (93.5), (93.6) для решения систем
линейных алгебраических уравнений?
§ 94. Симметричные билинейные формы
Рассматривая билинейные и квадратичные формы, мы неоднократно
обращали особое внимание как на симметричные билинейные формы,
так и на билинейные формы, порождающие вещественные квадратичные
формы. Лишь два вида билинейных форм одновременно удовлетворяют
обоим условиям — это вещественная симметричная и эрмитова сим-
симметричная билинейные формы. Матрицы этих форм в любом базисе
являются соответственно вещественной симметричной или эрмитовой.
Оба вида матриц конгруэнтным преобразованием приводятся к диаго-
диагональному вещественному нормальному виду.
Как мы видели, одна и та же матрица может быть разными
конгруэнтными преобразованиями приведена к каноническому виду.
Поэтому, вообще говоря, канонический вид оне является однозначно
определенным. Естественно возникает вопрос, что общего у различных
канонических видов, к которым приводится одна и та же матрица.
Мы знаем, что ранг матрицы не зависит от преобразования. Поэтому
при любом способе приведения к каноническому виду число последних
нулевых строк будет одним и тем же. Для вещественной симметричной
и эрмитовой матриц можно сказать значительна больше. Канонический
вид этих матриц мЬжет быть описан числом его положительных
и отрицательных членов. Имеет место важная
Теорема 94.1 (закон инерции квадратичных форм). Число поло-
положительных и число отрицательных членов в каноническом виде вещест-
вещественной симметричной матрицы при обычном конгруэнтном преобразо-
преобразовании и эрмитовой матрицы при эрмитовом конгруэнтном преобразо-
преобразовании не зависят от способа приведения.
Доказательство. Пусть некоторая матрица А удовлетворяет
условиям теоремы. Рассмотрим квадратичную форму F с матрицей А
ранга г от переменных хь х2, ...,х„ и, предположим, что она двумя
способами приведена к нормальному виду
F = yl +У2 + --- + Ук~Ук + 1 -Ук + 2 -...-)? =
= г\ + z\ + ... + if - zUi - zf + i - ... - г?. (94.1)
Так как переход от переменных хи х2, ...,х„ к переменным
У и b'-'Jn был осуществлен невырожденным линейным преобразо-
преобразованием, то вторые переменные будут линейно выражаться через первые,
причем определитель матрицы обратного преобразования будет отличен
§ 94J СИММЕТРИЧНЫЕ БИЛИНЕЙНЫЕ ФОРМЫ 319
от нуля. Лтак,
Аналогично
Zj = ? Cjtxt, detf.^..1...:.-.:..^ Ф 0. (94.3)
Предположим, что к < /, и напишем систему равенств
3>i=)>2= ... =yk = zi+i= ... = *„ = 0. (94.4)
Если левые части этих равенств заменить их выражениями из (94.2),
(94.3), мы получим систему п — I + к линейных однородных уравнений
с п неизвестными xl9 x2,..., хп. Число уравнений в этой системе меньше
числа неизвестных, поэтому система обладает ненулевым вещественным
решением аь а2,..., а„.
Заменим теперь в равенстве (94.1) все переменные их выражениями
из (94.2), (94.3), а затем подставим вместо переменных хь х2, ..., хп
числа oci, а2,..., а„. Если для краткости через у,(а) и ^«(а) обозначить
значения переменных yh zj после такой подстановки, то с учетом (94.4)
соотношение (94.1) превращается в равенство .
-У2к + М- ••• -Л2(а) = 2?(а)+ ... +z?(a).
Отсюда следует
z1(o)=...=z,(a) = 0. (94.5)
С другой стороны, по самому выбору чисел ab a2, ...,а„ имеем
г|+1(а)= ... =zr(a)= ... =zn(a) = 0. (94.6)
Таким образом, система из п линейных однородных уравнений
z. = 0, i= 1,2,-...,??,
с п неизвестными хь х2, ..., -\*и обладает в силу (94.5), (94.6) ненулевым
решением al4 a2, ..., а„, т. е. определитель этой системы должен
быть равен нулю. Это противоречит (94.3). К аналогичному противоре-
противоречию мы придем при предположении I <к. Следовательно, / = к и теорема
доказана.
Любая вещественная обыкновенная (эрмитова) квадратичная форма в
вещественном (комплексном) линейном пространстве в любом базисе
имеет единственную вещественную симметричную (комплексную эрми-
эрмитову) матрицу. Эти матрицы удовлетворяют условиям теоремы 94.1.
Каков бы ни был базис, число положительных и отрицательных
членов канонического вида матрицы является инвариантом для
квадратичной формы и называется соответственно ее положительным
и отрицательным индексом инерции. ^Разность между положительным и
отрицательным индексами называется сигнатурой квадратичной формы.
320 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 1Гл. 11
Теперь можно сформулировать некоторые полезные следствия из тео-
теоремы 94.1.
Следствие. Квадратичная форма положительно (отрицательно)
определена тогда и только тогда, когда положительный (отрицательный)
индекс инерции равен п.
Следствие. Квадратичная форма знакопостоянна тогда и только
тогда, когда один из индексов инерции равен нулю.
Закон инерции позволяет дать некоторую классификацию веществен-
вещественных квадратичных форм. Будем называть две квадратичные формы
аффинно эквивалентными, если для каждой из них можно подобрать
такой базис, что матрицы этих квадратичных форм становятся оди-
одинаковыми. В этом случае будем говорить также, что с помощью не-
невырожденного преобразования одна квадратичная форма переводится
в другую. Легко проверить, что аффинная эквивалентность квадра-
квадратичных форм есть отношение эквивалентности и две квадратичное
формы эквивалентны тогда и только тогда, когда в одном и том же базисе
их матрицы конгруэнтны. Поэтому из закона инерции следует, что все
вещественные квадратичные формы в линейном пространстве Кп можно
разбить на непересекающиеся классы* в каждый из которых входят
аффинно эквивалентные квадратичные формы и только они. Класс
характеризуется рангом и сигнатурой. Указанное разбиение на клас-
классы называется аффинной классификацией вещественных квадратичных
форм.
При любом заданном ранге г квадратичных форм в данной класси-
классификации всегда есть два «крайних» класса — классы с сигнатурами
+г и — г. Первый класс — все неотрицательные квадратичные формы
ранга г, второй класс — все неположительные квадратичные формы
ранга г. Оба класса вместе содержат все знакопостоянные квад-
квадратичные формы ранга г и только их.
Знакопостоянность квадратичной формы в общем случае легко
устанавливается путем ее приведения к каноническому виду по одному
из описанных ранее способов. Однако в отдельных случаях имеют
значительный интерес и непосредственные признаки знакопостоянности.
Принимая во внимание большую значимость именно этих квадра-
квадратичных форм, мы проведем для них дополнительные исследования,
ограничившись в основном рассмотрением квадратичных форм в ве-
вещественном пространстве. При этом будем снова считать, что матрица
квадратичной формы вещественная симметричная. Для случая комп-
комплексного пространства результаты исследований будут такими же, а
доказательства отличаются незначительными деталями.
Теорема 94.2 (критерий Сильвестра). Для того чтобы квадратич-
квадратичная форма была положительно определенной, необходимо и доста-
достаточно, чтобы все главные миноры матрицы этой формы были положи-
положительными.
Доказательство. Необходимость. Пусть квадратичная
форма с матрицей А положительно определена. Тогда существует
§ 94] СИММЕТРИЧНЫЕ БИЛИНЕЙНЫЕ ФОРМЫ 321
невырожденное преобразование с матрицей Р, приводящее форму к
сумме квадратов. Согласно (91.9) это означает, что Е = Р'АР или
А = (Р~г)Т~г. Используя формулу Бине — Коши, находим
z ('-(:¦'¦::¦))'¦
Так как матрица Р невырожденная, то в первых s столбцах есть
хотя бы один минор, не равный нулю. Следовательно, при всех s
правая часть полученного равенства положительна.
Достаточность. Предположим теперь, что все главные миноры
матрицы А некоторой квадратичной формы положительны. Приведем
эту форму с помощью преобразования, определяемого формулами
(93.7), к каноническому виду. Согласно условиям теоремы и формулам
(93.4) все коэффициенты канонического вида будут положительными,
т. е. квадратичная форма положительно определенная.
Следствие. Для того чтобы квадратичная форма была отрица-
отрицательно определенной, необходимо и достаточно, чтобы все главные
миноры нечетного порядка были отрицательными, а все главные миноры
четного порядка — положительными.
Доказательство следует из критерия Сильвестра и того факта,
что если А — матрица отрицательно определенной квадратичной
формы, то — А — матрица положительно определенной квадратичной
формы.
Теорема 94.3 {критерий Якоби). Для того чтобы квадратичная
форма была положительно определенной, необходимо и достаточно,
чтобы все коэффициенты характеристического многочлена матрицы
формы были отличны от нуля и имели чередующиеся знаки.
Доказательство. Необходимость. Как уже отмечалось,
преобразованием переменных с ортогональной матрицей заданная квад-
квадратичная форма может быть приведена к каноническому виду, где
коэффициентами являются собственные значения Хъ Х2,..., Хп матрицы
формы. Согласно условиям теоремы собственные значения должны
быть положительными. Характеристический многочлен f(X) равен
f(X) = (Х- КХ)(Х - Х2)... (X - Хп) = X» + о,-А" + ... + а,Х + а0
и все его коэффициенты ненулевые и имеют чередующиеся знаки, что
сразу вытекает из формул Вьета для коэффициентов а(.
Достаточность. Пусть коэффициенты характеристического мно-
многочлена отличны от нуля и имеют чередующиеся знаки. Корни этого
многочлена как собственные значения симметричной матрицы будут
вещественные и остается показать, что они положительные. Пред-
11 В. В. Воеводин
322 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. 11
положим, что это утверждение доказано для всех многочленов степени
п—1. Так как все коэффициенты f'(X) отличны от нуля и имеют
чередующиеся знаки, то согласно предположению f'{k\ имеет п — 1
положительный корень. Из курса математического анализа известно,
что если многочлен имеет лишь вещественные корни, то они раз-
разделяются корнями дроизводной. Поэтому f(X) имеет, по крайней мере,
п—1 положительных корней. Последний корень будет также поло-
положительным в силу того, что положительно произведение всех
корней.
Признаки для неотрицательных и неположительных квадратичных
форм значительно сложнее и связано это, в оснЪвном, с тем, что
в этих случаях матрицы форм вырождены. Один из основных путей
исследования знакопостоянности квадратичной формы связан с приве-
приведением ее матрицы к симметричному виду (93.8), (93.9) и с изучением
этого вида. В силу тесной связи знакопостоянных матриц между собой
ограничимся рассмотрением только неотрицательных матриц.
Будем называть матрицу Я матрицей перестановок, если в каждой
ее строке и каждом столбце находится только по одному ненулевому
Элементу и все ненулевые элементы равны единице. Ясно, что при
умножении произвольной матрицы А справа на матрицу перестановок:
Я в матрице А переставляются ее столбцы, а при умножении слева
переставляются строки.
Лемма 94.1. Для произвольной невырожденной матрицы А сущест*
вует такая матрица перестановок Я, что в матрице АН отличны
от нуля все главные миноры.
Доказательство. Матрица А — невырожденная. Следовательно,
в ее первой строке есть хотя бы один ненулевой элемент. Переставив
соответствующий столбец на место первого, сделаем ненулевым главный
минор первого порядка. Предположим, что перестановкой столбцов
мы добились неравенства нулю всех главных миноров до fc-ro порядка.,
Если теперь перестановкой последних п — к столбцов нельзя получить,
ненулевой главный минор (к + 1)-го порядка, то это означает, что
в первых к + 1 строках матрицы А нет ненулевого минора порядка
к 4-1, т. е. матрица А должна быть вырожденной. Противоречие с ус-
условием леммы означает ее доказательство.
Теорема 94.4. Для того чтобы квадратичная форма ранга г
с матрицей А была неотрицательной, необходимо и достаточно, чтобы,
существовала такая матрица перестановок Я, для которой в матрице
Н'АН первые г главных миноров положительны.
Д о к а з а т e'jib ство. Необходимость. Пусть квадратичная
форма ранга г с матрицей А — неотрицательная. Тогда существует
невырожденная матрица Р такая, что А = (Р)'ЕГР~ где Е —диаго-
—диагональная матрица, у которой первые г элементов равны единице,
а остальные — нулю. Согласно лемме 94.1 существует матрица пере-,
становок Я, при которой все главные миноры матрицы Р~гН отличны
от нуля.
94] СИММЕТРИЧНЫЕ БИЛИНЕЙНЫЕ ФОРМЫ
Используя формулу Бине — Коши, находим для i < s < г
fcs< И
1 ^kt <k2 <... <ks^r
Достаточность. Предположим, что для квадратичной формы
ранга г с матрицей А существует такая матрица перестановок Я,
что в матрице Н'АН первые г главных миноров положительны. Мат-
Матрица Н'АН согласно теореме 93.1 может быть приведена к канони-
каноническому виду с помощью преобразования с треугольной матрицей.
В соответствии с (93.4) ненулевые коэффициенты канонического вида
матрицы Н'АН и, следовательно, матрицы А будут положительными,
т. е. квадратичная форма — неотрицательная.
Что касается незнакопостоянных квадратичных форм, то полных
аналогов теорем 94.1, 94.4 для них не существует. Имеет место лишь
Теорема 94.5. Если квадратичная форма имеет симметричную
матрицу А вида (93.8), (93.9), то ее индексы инерции совпадают с
индексами инерции «усеченной» квадратичной формы, определяемой мат-
матрицей В из (93.8).
Доказательство. Согласно теореме 93.1 матрица А может
быть приведена к каноническому виду с помощью преобразования
с правой треугольной матрицей, при этом для ненулевых коэффициентов
канонического вида имеют место соотношения (93.4). Но матрица В
«усеченной» квадратичной формы также удовлетворяет условиям тео-
теоремы 93.1, и для коэффициентов ее канонического вида опять имеют
место соотношения (93;4). Поэтому индексы инерции квадратичных
форм, определяемых матрицами А и В, совпадают.
Особый интерес, который мы проявили к знакопостоянным квадра-
квадратичным формам, объясняется большой областью их приложений. Одно
из важнейших приложений — это введение метрики в линейном прост-
пространстве. Любую билинейную форму, полярную к некоторой положи-
положительно определенной квадратичной форме, можно рассматривать как ска-
скалярное произведение и, следовательно, с ее помощью можно превратить
линейное пространство в евклидово или унитарное. Выполнение аксиом
для этих пространств очевидно. Не меньшее значение для введения
метрики, особенно метрики на подпространствах, имеют и неотрица-
неотрицательные формы. В качестве примера использования- знакопостоянности
докажем, что справедлива
11*
324 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. Н
Теорема 94.6. Для того чтобы невырожденная эрмитова били-
билинейная форма была приводима к диагональному виду, достаточно, чтобы
ее симметричная (или кососимметричная) часть была строго знако-
знакопостоянной»
Доказательство. Рассмотрим случай положительно определен-
определенной симметричной части. Пусть А — матрица билинейной формы, тогда
матрица — (А + А*) будет матрицей симметричной части. Так как
симметричная часть положительно определена, то матрица —(А + А*)
эрмитово конгруэнтна единичной матрице. Следовательно, существует
такая невырожденная матрица S, что
у S'(Л + Л *)? = ?. (94.7)
Покажем, что матрица S'AS — нормальная. Имеем из (94.7)
Поэтому
(S'AS) (S'AS) * - (S'AS) * (S'AS) = S* (ASS'A * - A *SS'A) =
= 2S'(A(A + A*) A* - A*(A + A*) A)S =
= 2S'((A*-1 + A-1)-1 ~ О** + A~1)~1)S = 0.
В силу нормальности матрица SrAS приводится к диагональному
виду с помощью эрмитова конгруэнтного преобразования с унитарной
матрицей.
Таким образом, матрица А эрмитовой билинейной формы эрмитово
конгруэнтна диагональной матрице, что и требовалось показать. Все
остальные случаи рассматриваются аналогично..
Упражнения.
1. Доказать, что если у вещественной симметричной или комплексной
эрмитовой матрицы отличны от нуля все главные миноры, то число ее поло-
положительных и отрицательных собственных значений совпадает соответственно
с числом положительных и отрицательных членов последовательности (93.4).
2. Доказать, что если матрица положительно определенная,, то любой
диагональный минор является положительным.
3. Доказать, что у симметричной матрицы ранга г всегда существует хотя бы
один диагональный минор порядка г, не равный нулю.
4. Доказать, что у положительно определенной матрицы максимальный
элемент находится на главной диагонали.
5. Доказать, что матрица А положительно определенная, если для всех i
§ 95] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 325
6. Доказать, что для любой симметричной матрицы А ранга г суще-
существует такая матрица перестановок Я, что среди первых г главных миноров
матрицы Н'АН нет двух соседних, равных нулю, и при этом минор г-го
порядка отличен от нуля.
7. Доказать, что матрицу Н'АН из упражнения 6 можно представить в виде
Н'АН = S'DS, где S — правая треугольная матрица с единичными диагональными
элементами, D — клеточно диагональная матрица с клетками' первого и второг о
порядков. ,
8. Доказать, что любая неотрицательная матрица ранга г может быть
представлена в виде суммы г неотрицательных матриц ранга 1.
9. Пусть А, В — положительно определенные матрицы с элементами а^
bij. Доказать, что матрица С с элементами су = а^ Ьц также положительно
определенная.
§ 95, Гиперповерхности второго порядка
С изучением вещественных квадратичных форм тесно связано иссле-
исследование и других объектов — гиперповерхностей второго порядка. Желая
подчеркнуть геометричность многих свойств гиперповерхностей, мы
почти всюду в дальнейшем будем называть векторы точками прост-
пространства Rw.
Гиперповерхностью f второго порядка в пространстве RM называется
множество точек, координаты хи x2, ...,*„ которых удовлетворяют
уравнению
t t W*j ~ 2 ? bkxk + с = 0, (95.1)
где aJi9 Ъь с — вещественные числа.
Упростим запись. Как и в случае квадратичных форм, будем
предполагать, что матрица А с коэффициентами а# — симметричная.
Через Ъ обозначим вектор с координатами Ъъ Ъ2,..., Ъп. Введем в прост-
пространстве К„ скалярное произведение как сумму попарных произведений
координат Теперь гиперповерхность / второго порядка в пространстве
Rw мы можем рассматривать как множество точек х из евклидова
пространства Rn, удовлетворяющих уравнению
{Ах, х)-2(Ь, х) + с = 0 (95.2)
или, в силу симметрии матрицы А, уравнению
(х, Ах)-2(Ъ, х) + с = 0Г
Исследование гиперповерхностей второго порядка мы начнем с изу-
изучения совместного расположения этих поверхностей с прямыми ли-
линиями. Возьмем произвольную прямую линию в пространстве R,,;
Пусть она проходит через точку х0 и имеет направляющий вектор I
Точки А' этой прямой определяются равенством
X т Х0 + U (95.3)
326 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. И
для всевозможных вещественных чисел и Подставив данное выражение
для х в (95.2), получим
t2(Al, I) - ЩЬ, I) - (А1, х0)) + (Ах0, х0) - 2(Ь, х0) + с = 0. (95.4)
Таким образом, точки пересечения прямой линии (95.3) с гиперповерх-
гиперповерхностью (95.2) определяются корнями квадратного уравнения (95.4).
Мы будем говорить, что прямая линия (95.3) с направляющим
вектором / имеет неасимптотическое (асимптотическое) направление
относительно гиперповерхности (95.2), если (А1, 1)Ф0 ((А1, I) = 0).
Рассмотрим любую прямую, имеющую неасимптотическое направ-
направление / и пересекающую гиперповерхность. Точки пересечения опреде-
определяют на каждой такой прямой отрезок, который по аналогии с эле-
элементарной геометрией будем называть хордой. Обозначим через L
множество середин всех хорд. Бели концы хорды стягиваются в одну
точку, то эту точку мы будем считать и серединой хорды. Покажем,
что L принадлежит некоторой гиперплоскости.
Концы любой хорды определяются значениями параметра t, совпа-
совпадающими с корнями уравнения (95.4). Поэтому середина хорды опреде-
определяется значением t, равным полусумме корней. Согласно формулам
Вьета это дает
[Al, I)
Если z0 — середина хорды, то
. _„ ^ Сь, 0-(
Теперь имеем
Итак, середины всех хорд удовлетворяют уравнению
(Al,x) = (b9l). (95.6)
Так как его правая часть не зависит от х0, то согласно формуле
D6.8) это уравнение определяет гиперплоскость, нормальный вектор
которой равен AL
Гиперплоскость (95.6) называется диаметральной гиперплоскостью,
Сопряженной направлению / относительно гиперповерхности (95.2).
Явный вид уравнения диаметральной гиперплоскости позволяет
установить ряд важных свойств гиперповерхностей второго порядка.
Пусть матрица А — невырожденная. Тогда для любых линейно незави-
независимых векторов 1Ъ 12, ..., /„ будут линейно независимыми и векторы
§ 95] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 327
А\ъ Л12у ...* А1п. Предположим далее, что все направления 1Ъ 12, ¦ .., 1п
являются неасимптотическими. Это заведомо будет иметь место, на-
например, в случае, когда квадратичная форма (Ах, х) положительно
определенная. Следовательно, можно построить систему из п диамет-
диаметральных гиперплоскостей, сопряженных направлениям 1и /2,..., К- Гипер-
Гиперплоскости будут иметь общей единственную точку х*. Теперь из фор-»
мулы (95.6) вытекают равенства
{Ах*-Ь, /,) = 0
для г = 1, 2, ..., к. В силу линейной независимости векторов lt это
означает, что Ах* — Ъ — О, т. е* точка х* есть не что иное, как решение
системы линейных алгебраических уравнений
Ах = Ь. (95.7)
Решение системы с невырожденной матрицей единственно, поэтому
построенная точка х* в действительности не зависит от выбора век-
векторов /ь/2, ...,/„.
Несложные вычисления показывают, что для любой точки х*
справедливо соотношение
{Ах, х) - 2(Ь, х) + с = (А(х - х*),х - х*) + 2{Ах* - Ь,х - х*) +
+ (Ах *, х *) - 2 (Ь, х *) + с. (95.8)
Если же х* является решением системы (95.7), то относительно такой
точки гиперповерхность (95.2) обладает важным свойством симметрии.
Именно, при любом х левая часть (95.2) принимает одинаковые зна-
значения в точках , ;
х = х * + (х - х *), х' = х * - (х - х *). (95.9)
Отсюда, в частности, следует, что обе точки х, х' лежат или не
лежат на гиперповерхности (95.2) одновременно. Равенство
позволяет назвать точку х* центром симметрии гиперповерхности.
Если на гиперповерхности (94.2) находится хотя бы одна точка из
Rw, то центр симметрии называется действительным. В противном
случае он называется мнимым.
Пусть теперь х* является центром симметрии, т.е. при любом х
левая часть (95.2) принимает одинаковые значения в точках х, хг.
Следовательно,
(Ах, х) - 2{Ь, х) + с = (Ах1, х') - 2F, х') + с.
Согласно (95.8), (95.9) это возможно лишь в случае, когда при любом х
328 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. П
Но последнее тождество справедливо тогда и только тогда, когда
Ах* — Ь = 0, т.е. когда точка х* будет решением системы (95.7).
Заметим, что здесь мы нигде не предполагали ни невырожденности
матрицы А, ни наличия каких-либо других ее особенностей, кроме
симметрии. Поэтому:
Для того чтобы система Ах s= Ъ имела решение, необходимо и
достаточно, чтобы гиперповерхность (95.2) имела центр симметрии.
Множество всех решений совпадает с множеством^ всех центров сим-
метрии.
Таким образом, обнаруживается весьма глубокая связь между систе-
системами линейных алгебраических уравнений и гиперповерхностями вто-
второго порядка. Эта связь широко используется при построении самых
различных вычислительных алгорифмов. В частности, на построении
системы диаметральных гиперплоскостей основана большая группа
методов, входящих в группу так называемых методов сопряженных
направлений. Об этих методах мы будем говорить в последней главе
книги.
В общем случае исследование гиперповерхностей второго порядка
может быть основано на их приведении к каноническому виду почти
в полной аналогии с квадратичными формами. Но кроме линейных
невырожденных преобразований переменных при этом еще потребуется
привлечение операций сдвига.
Рассмотрим любое преобразование переменных х = Ру, приводящее
квадратичную форму (Ах, х) к нормальному виду. В переменных
У и У 2, •••> Уп уравнение гиперповерхности будет иметь следующий вид
Ух+ ¦•¦ +Ук~Ук+1- ..• -Уг~
- ... ~2dryr-2dr+1yr+1- ...
Произведем теперь сдвиг переменных согласно формулам
*i = \ Уг + 4 к + 1 ^ i ^ г,
( уь г + 1 ^ i ^ п.
В этих переменных уравнение таково:
z2x+ ... +zjj-zj>+l- ...-z2r-2</r+1zr+1- ... -2dA
Пусть одно из чисел dr+1, ...> dn, например dn, отлично от 0. Положим
2Ь г < п,
dr+ iZr+ x -f ... + dnzn, i = n,
и затем снова делаем сдвиг
vh i < п,
§ 95] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 329
Теперь уравнение гиперповерхности будет таким:
± и\ ± и\ ± ... ± и2 ~ 2ип = О, 1 < г < п - 1. (95.10)
Если среди чисел dr+1,... , dn, р нет ни одного ненулевого, то урав-
уравнение гиперповерхности приобретает следующий вид:
± и\ ± и\ ± ; г. ± и2 = 0, 1 < г < и. (95.11)
И, наконец, если числа Jr+1,..., dn равны нулю, но р Ф 0, то положив
щ = zt/\p |1/2~для всех j, получим еще .одну форму уравнения гипер-
гиперповерхности. Именно,
±и\ ±и\± ... ±иг2±1 = 0, Kr<7t. (95.12)
Вследствие закона инерции квадратичных форм, поверхности, зада-
задаваемые различными уравнениями вида (95.10) — (95.12), нельзя перевести
друг в друга с помощью линейного преобразования переменных и
сдвига. При этом различными следует считать уравнения, которые
нельзя перевести друг в друга умножением на (— 1) и изменением нуме-
нумерации координат. Как и в случае квадратичных форм, мы снова полу-
получили разбиение всех гиперповерхностей второго порядка на непересе-
непересекающиеся классы.
Нередко при приведении гиперповерхностей второго порядка к кано-
каноническому виду используются лишь операции переноса и линейные
преобразования переменных с ортогональными матрицами. Это связано^
в основном, с тем, что оба типа указанных преобразований не меняют
расстояний между точками. В этом случае канонические виды будут
несколько иными, хотя в целом они получаются тем же путем, что
и рассмотренные выше. Например, в случае пространства R2 гиперг-
поверхность второго порядка можно привести лишь к одному из сле-
следующих видов:
I. Ххх2 + Х2у2 + а0 = 0,
И. ц2/ + Ьох = 0, (95.13)
III. Ххх2 + а0 = 0,
в случае пространства R3 — к одному из таких видов:
I. Ххх2 + Х2у2 + Хъг2 + а0 = 0,
II. Х,х2 + Х2у2 + boz = 0,
III. Хх.х2 + Х2у2 + а0 = 0, (95.14)
IV. X,у2 + Ьох = 0,
V. Ххх2 + а0 = 0.
Во всех уравнениях (95.13), (95.14) коэффициенты при выписанных
переменных отличны от нуля. Свободный член может быть равен нулю.
Согласно установившейся терминологии гиперповерхности в прост-
пространстве R2 мы будем называть линиями второго порядка, в пространстве
ЗЗР БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ |Гл. П
R3 — поверхностями второго порядка. Учитывая интересы многих раз-
разделов математики, мы изучим более подробно линии и поверхности
второго порядка по их каноническим видам (95.13), (95.14).
Упражнения.
1. Пусть матрица Л — положительно определенная. Доказать, что на решении
системы Ах = b достигает своего минимального значения выражение
(Ах, х)-2(Ь, 4
2. Пусть матрица А — положительно определенная. Доказать, что на прямой
(95.3) выражение (Ах, х) — 2(Ь, х) достигает своего минимального значения
при значении t из (95.5).
3. Доказать, что для того, чтобы любое направление было неасимптоти-
неасимптотическим для гиперповерхности (95.2), необходимо и достаточно чтобы квадра-
квадратичная форма (Ах, х) была либо положительно, либо отрицательно определенной.
4. Каким свойством симметрии обладает диаметральная гиперплоскость,
сопряженная направлению I, если / есть собственный вектор матрицы А,
соответствующий ненулевому собственному значению?
5. Доказать, что система Ах = Ъ не имеет решения тогда и только тогда,
когда гиперплоскость (95.2) приводится к каноническому виду (95.10).
§ 96. Линии второго порядка
Будем изучать линии второго порядка по уравнениям (95.13). Пусть
уравнение линии имеет вид
2 + Х2у2 + а0=0. (96.1)
1.1. Число а0 не равно нулю; числа Xl9 X2 имеют одинаковые знаки,
противоположные знаку а0. Запишем (96.1) в виде
У2 _<
(М ""У Л/ «oV
и обозначим
Согласно условию, числа а и Ь вещественные, поэтому уравнение
(96.1) эквивалентно уравнению
х2 v2
^т-+Т2-=1- (96.3)
a b
Линия, описываемая этим уравнением, называется эллипсом (рис. 96.1),
а само уравнение называется каноническим уравнением эллипса. Выясним
некоторые свойства эллипса. Эллипс — ограниченная линия. Как следует
из уравнения (96.3), для всех точек эллипса имеем: |х|<а, |у|<Ь.
Эллипс имеет две оси симметрии — ось Ох и ось Оу, а также центр
симметрии —, начало координат. Это вытекает из того, что наряду с
§96]
ЛИНИИ ВТОРОГО ПОРЯДКА
331.
точкой, имеющей координаты (х, у\ эллипсу принадлежат точки^
имеющие координаты (х, - у), (- х, у), (- х, - у). Оси симметрии назы-
называются главными осями эллипса, центр симметрии — центром эллипса.
Если а> Ь, то ось Ох называется
большой осью эллипса, а ось Оу —
малой осью эллипса. Точки пересече-
пересечения главных осей эллипса с самим эл-
эллипсом называются вершинами эллипса.
При а = Ъ эллипс становится окруж-
окружностью с центром в начале координат
и/радиусом, равным а. Предположим
для определенности, что а> Ь, и обо-
обозначим
= а2- Ь2.
Рис. 96.1.
(96.4)
Точки Fl9 F2 с координатами (—с, 0), D- с, 0) называются фокусами
эллипса.
Теорема 96.1. Сумма расстояний от любой точки эллипса до его
фокусов есть величина постоянная и равна 2а.
Доказательство. Для любой точки М(х, у) эллипса
Для этой же точки вычисляем
р(М, F2) = ((х - сJ + у2I12 = U2 - 2хс + с2 + Ь2-
l/2
1/2
с
d
ПЬследнее равенство справедливо, так как х + а>0 в силу того,
а
что ] х | < а и с/а < 1.. Далее,
- /
р(М, F,) = ((х + сJ + у2I'2 = Iх2 + 2хс +с2 + Ъ2-
/ / ^2\ .\1/2 /Х2
= (Х2/ ! _ ?_j + 2хс + a2J = ^
2\1/2
J
2хс + а2
1/2
ex YV с
332
БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ
[Гл. П
Окончательно имеем:
р(М, Fx) + р(М, F2)'= - —х + а + —х + а = 2а.
1.2. Число а0 не равно нулю; числа Хи Х2, а0 имеют одинаковые
знаки. Обозначим
а =
тогда уравнение (96.1) эквивалентно уравнению
(96.5)
(96.6)
Ясно, что нет ни одной точки плоскости, удовлетворяющей (96.6).
Принято говорить об уравнении (96.6) как об уравнении мнимого
эллипса.
1.3. Число а0 равно нулю; числа Xl9 Х2 имеют одинаковые знаки.
Обозначим
1
(96.7)
тогда уравнение (96.1) эквивалентно уравнению
Ясно, что лишь начало координат удовлетворяет уравнению (96.7).
Принято говорить об уравнении (96.7) как об уравнении вырожден-
вырожденного эллипса.
1.4. Число а0 не равно нулю; числа Хи Х2 имеют противополож-
противоположные знаки. С помощью введения новых коэффициентов, аналогичных
(96.2), (96.5), приведем уравнение (96.1)
к эквивалентному уравнению (с точно-
точностью до переобозначения переменных)
/а ( ^--4а1' (%-8)
\
Линия, описываемая этим уравнени-
уравнением, называется гиперболой (рис. 96.2),
а само уравнение называется ка-
каноническим уравнением гиперболы. В
Рис. 96.2. отличие от эллипса гипербола - неогра-
неограниченная линия. Как и эллипс, гипер-
гипербола имеет осями "симметрии координатные оси, а центром сим-
симметрии — начало координат. Оси симметрии называются главными
осями гиперболы, центр симметрии — центром гиперболы. Одна
из главных осей (ось Ох) пересекается с гиперболой в двух
§96]
ЛИНИИ ВТОРОГО ПОРЯДКА
333
точках, которые называются вершинами гиперболы. Эта ось называется
действительной осью гиперболы. Другая ось (ось О у) не имеет общих
точек с гиперболой и поэтому называется мнимой осью гиперболы.
Обозначим
с2 = а2 + Ъ\
Точки Fi,'F2 с координатами {—с, 0), (+с, 0) называются фоку-
фокусами гиперболы.
Теорема 96.2. Абсолютная величина разности расстояний от любой
точки гиперболы до ее фокусов есть величина постоянная и равна 2а.
Доказательство. Для любой точки М(х, у) гиперболы
b2v2
Для этой же точки вычисляем
р (М, F2) = ((х - сJ + у2I*2 = (х2 ~ 2хс + с2 - Ъ2 + ^-J =
- 2хс + а2
• ~ 2хс + а:
1/2
с
—х — а
а
Далее
2хс + с2 + Jx2 - Ь2)" = (x2(l + 5
Х2С2'
1/2
2\1/2
С
—х + а
Для всех точек гиперболы имеем |х | > а и с/а > 1, Поэтому
p(M,F2)=-
—х - а для х > 0,
—х + а для х <0,
—х + а для х >0,
а
х — а для х < 0.
а
334 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл, И
Окончательно
\p{MtF1)-p(M,F2)\=2a.
Рассмотрим часть гиперболы, расположенную в первой четверти.
Для нее х ^ а, у^О. Для этой четверти уравнение (96.8) эквивалентна
уравнению -
Ь
если, конечно, считать Ъ > 0, а > 0. Легко убедиться, что эта функция
может быть представлена в следующей форме:
,-А*-- *« (96.9)
а
Наряду с функцией (96.9), рассмотрим* уравнение прямой
У=^х. (96.10)
Обозначим через М(х, у) и М'(х, у') точки гиперболы (96.0) и яря-
мой (96.10), имеющие одну и ту же абсциссу х. При неограниченном
возрастании х разность
оставаясь положительной, монотонно убывает и стремится к нулю.
Следовательно, точки М и М' сближаются, но точка. М гиперболы
чвсе время остается ниже точки М прямой (96.10).
Аналогичное свойство имеет место и для других частей гиперболы.
При этом роль прямой (96.10) играет одна из прямых
у = —х, у= -— х. (96.11)
Эти прямые называются" асимптотами гиперболы.
Заметим, что мы говорили об уравнении (96.8) как об уравнений
гиперболы. Однако из школьного курса известно другое уравнение,
также называемое уравнением гиперболы.
Согласно (96.11), сделаем замену координат
Х а Ъ9
х у
а о
Из (96.8) имеем
} 96]
ЛИНИИ ВТОРОГО ПОРЯДКА
335
Следовательно, в новой системе координат (вообще говоря, не прямо-
прямоугольной) уравнение гиперболы имеет вид
х'у' = 1 (96.12)
или
У хг
Это и есть знакомое школьное уравнение. Уравнение (96.12) называется
уравнением гиперболы относительно ее асимптот.
1.5. Число а0 равно нулю; числа Хи "кг имеют противоположные
знаки. После стандартной замены коэффициентов получим уравнение
а о*
эквивалентное уравнению (96.1). Из этого уравнения получаем
х
(96.13)
или
= 0
у = —х, у=~—х. (96.14)
Таким образом, уравнение (96.13) есть уравнение линии, распадаю-
распадающейся на две пересекающиеся прямые (96.14).
Рассмотрим теперь второе уравнение из (95.13). Оно имеет вид
+ Ьох = 0.
(96.15)
11.6. Оба числа Х2, Ьо отличны от нуля.
Обозначим
Теперь уравнение (96.15) эквивалентно такому
уравнению:
уг = 2рх. (96.16)
F
Рис. 96.3.
«27
Линия, описываемая этим уравнением, называется параболой (рис,
96.3), а само уравнение называется каноническим уравнением параболы.
Не ограничивая общности, можно считать, что р > 0, так как при
р<0 получается линия, симметричная относительно оси Оу. Как и
гипербола, парабола — неограниченная Линия. Она имеет лишь одну
ось симметрии — ось Ох и не имеет центра симметрии. Точка пере-
пересечения оси параболы с самой параболой называется вершиной пара-
параболы. Точка F с координатами 1-=^, 0 гназывается фокусом параболы.
336 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. И
Прямая L, заданная уравнением
х=--^2 (96.17)
называется директрисой параболы.
Теорема 96.3. Расстояние от любой точки параболы до директрисы
равно расстоянию от этой оке точки до фокуса параболы.
Доказательство. Имеем для любой точки М(х, у) параболы
и далее
2\ 1/2 _
\
/ „2 \1/2 /
= Ьс2-рх + ^-+2рх\ = 1х
так как х > 0 и р > 0.
Наконец, рассмотрим третье уравнение из (95.13). Оно имеет совсем
простой вид:
+ а0 = 0. (96.18)
III.7. Число Яо не равно нулю; знак числа %i противоположен знаку
а0. Обозначим
тогда уравнение линии (96.18) эквивалентно уравнению
х2 -а2 = 0 (96.19)
или
х = а, х = - а. (96.20)
Следовательно, уравнение линии (96.19) есть уравнение линии, распадаю-
распадающейся на две параллельные прямые (96.20).
Ш.8. Число а0 не равно нулю; знак числа Хх совпадает со знаком а0.
Обозначим
тогда уравнение (96.18) эквивалентно уравнению
х2 + а2 = 0. (96.21)
I 96]
ЛИНИИ ВТОРОГО ПОРЯДКА
337*
Ясно, что нет ни одной точки плоскости, координаты которой
удовлетворяют этому уравнению. Принято говорить об уравнении
(96.21) как об уравнении, определяющем две мнимые прямые.
Ш.9. Число а0 равно нулю, В этом случае уравнение (96.18) эквива-
эквивалентно уравнению N
х2 = 0. (96.22)
По аналогии с уравнением (96.19) принято- говорит^ что уравнение
(96.22) определяет две совпавших прямые, каждая из которых определяется
уравнением
Заметим, что для всех точек эллипса или гиперболы имеем .следую-
.следующие равенства:
с
аг
с
(96.23).
Прямые otf (i = 1,2), определяемые уравнениями
х-
х+ — = 0,
с
(96.24)
называются директрисами эллипса и гиперболы. Будем снабжать директг
рису и фокус одинаковыми номерами, если они лежат в одной полу-
полуплоскости, определяемой осью Оу. Теперь можно показать, что:
Отношение расстояний-р (М, Ft) и р(М, at) есть величина постоянная
для всех точек М эллипса, гиперболы и параболы.
Для параболы это утверждение вытекает из теоремы 96.3. Для
эллипса и гиперболы — из (96.23),. (96.24). Отношение
р(М,а1)
называется эксцентриситетом. Имеем:
для эллипса:
е = -
для гиперболы:
для параболы:
12 В. В. Воеводий
338 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ"ФОРМЫ [Гл. II
Упражнения.
1. Что представляет собой диаметральная гиперплоскость, сопряженная'
данному направлению, для линий второго порядка?
2. Написать уравнения касательной линии для эллипса, гиперболы и пара-"
болы.
3. Доказать, что луч света, выходящий из одного фокуса эллипса, после
зеркального отражения от касательной проходит через второй фокус.
4. Доказать, что луч света, выходящий из фокуса параболы, после отра-
отражения от касательной проходит параллельно оси параболы.
5. Доказать, что луч света, выходящий из одного фокуса гиперболы,
после отражения от касательной кажется выходящим из второго фокуса.
§ 97, Поверхности второго порядка
Перейдем теперь к изучению поверхностей второго порядка, задан-
заданных в виде уравнений (95.14). Рассмотрим сначала уравнение
Х±х2 + Х2у2 + X3z2 + а0 = 0. . (97.1)
I. I. Число а0 не равно нулю; знаки всех чисел Xl9 X2, Х3 одина-
одинаковы Si противоположны знаку а0. Стандартная замена коэффициентов
' zk Дает
__ Поверхность, описываемая этим урав-
у нением, называется эллипсоидом (рис. 97.1),
а само уравнение (97.2) — каноническим
уравнением эллипсоида. Из уравнения (97.2)
вытекает, что координатные плоскости
являются плоскостями симметрии, начало
Рис. 97.1. координат — центром симметрии. Числа
а, Ь, с называются полуосями эллипсоида.
Эллипсоид — ограниченная поверхность, заключенная в параллелепипеде
|х|^а, 1у|<Ь, |z|<c. Линия пересечения эллипсоида с любой пло-
плоскостью представляет собой эллипс. В самом деле, такая линия пере-
пересечения есть линия второго порядка. В силу ограниченности эллипсоида
эта линия будет ограниченной, но единственной ограниченной линией
второго порядка является эллипс.
I. 2. Число а0 не равно нулю; знаки всех чисел Хи Х2, Хъ, а0 оди-
одинаковы. Стандартная замена коэффициентов дает
Нет ни одной точки пространства, координаты которой удовлетворяют
этому уравнению. Принято говорить об уравнении (97.3) как об урав-
уравнении мнимого эллипсоида.
§97]'
ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА.
L. 3. Число aQ равно нулю; знаки всех чисел Хи
Имеем
Y2 ЛJ 72
\ У \ Л
'339
одинаковы.
(97.4)
Этому уравнению удовлетворяет только начало координат. Принято
говорить об уравнении (97.4) как об уравнении вырожденного эллип-
эллипсоида.
L 4. Число а0 не равно нулю; знаки Хь Х2 совпадают и противо-
противоположны знакам Х3, а0. Стандартная замена коэффициентов дает
Ъ2
.(97.5)
Поверхности, описываемая этим уравнением, называется однополост-
ным гиперболоидом (рис. 97.2), а само уравнение -у
каноническим уравнением однополостного гипер-
гиперболоида. Из уравнения (97.5) вытекает, что коор-
координатные плоскости являются плоскостями сим-
симметрии, а начало координат — центром симметрии.
Рассмотрим линии Ln пересечения однополосного
гиперболоида с плоскостям^ z =*= h. Уравнение
проекции такой линии на плоскость Оху получа-
получается из уравнения (97.5), если положить в нем z = h.
Легко видеть, что эта линия есть эллипс
2 v2
л
ь*2
где
Рис. 97.2.
причем его размеры неограниченно увеличиваются при h -> + оо. Сече-»
ния однополостного гиперболоида плоскостями Oyz и Oxz представ-
представляют собой гиперболы.
Таким образом, однополостный гиперболоид представляет собой
поверхность, состоящую из одной полости и подобную трубке, не-
неограниченно расширяющейся в положительном и отрицательном
направлении оси Oz.
I. 5. Число а0 не равно нулю; знаки Xi9 X2, aQ совпадают и про-*
тивоположны знаку Хъ. Аналогично (97;5) имеем
х2 v2 z2
a be
Поверхность, описываемая этим уравнением, называется двуполост-
двуполостным гиперболоидом (рис. 97.3), а само уравнение — каноническим урав-
уравнением двуполостного гиперболоида. Координатные плоскости явля-
12*
340
БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ
{Гл. II
ются плоскостями симметрии, а начало координат.— центром сим-
симметрии. Линии Lh пересечения двуполостного гиперболоида с плоско-
плоскостями z = h представляют собой эллипсы, уравнения проекций которых
на плоскость Оху имеют вид
= 1
— х,
где
Отсюда вытекает, что секущая плоскость - z = h на-
начинает пересекать двуполостный гиперболоид лишь
при \h\^ с. В слое между плоскостями z=—с и
z— + с не содержится точек рассматриваемой поверх-
поверхности. В силу симметрии относительно плоскости
Оху поверхность состоит из двух полостей, распо-
расположенных вне указанного слоя. Сечения, двуполост-
Рис. 97.3. ного гиперболоида плоскостями Oyz и Oxz представ.-:
ляют собой гиперболы.
I. 6, Число а0 равно нулю; знаки Хи Х2 совпадают между собой
И противоположны знаку Хъ. Имеем
-2 v2 z2
+ Тг~^ = 0. . (97.7)
_
а2
Поверхность, определяемая этим уравнением, называется эллипти-
эллиптическим конусом (рис. 97.4), а само уравнение — каноническим уравне-
уравнением эллиптического конуса. Координатные
плоскости являются плоскостями симметрии,
начало координат — центром симметрии. Линии
Lh пересечения эллиптического конуса с пло-
плоскостями z = h представляют собой эллипсы.
Если точка М(хо> у о, z0) лежит на поверхности
конуса, то уравнению (97.7) удовлетворяют ко-
координаты тачки Mt(tx09 ty09 tz0) для любого
числа t. Следовательно, вся прямая, проходящая
через точку Мо и начало координат, целиком
лежит на данной поверхности.
Перейдем теперь к рассмотрению второго
уравнения из (95.14). Имеем
Рис. 97.4. П. 7. Числа Х,ь Х2 одного знака. Не orpa-v
ничивая общности, можно считать, что Ьо
имеет противоположный знак, так как при совпадении знака Ъо
со знаками Хи Х2 мы получим поверхность, расположенную
симметрично относительно плоскости Оху. Стандартная замена коэф-
§97]
ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА.
341
фициентов дает
(97.8)
Поверхность, описываемая этим уравнением, называется эллипти-
эллиптическим параболоидом (рис. 97.5), а само уравнение — каноническим
уравнением эллиптического параболоида* Для этой поверхности Oxz
и Oyz являются плоскостями симметрии, центра симметрии нет.
Эллиптический параболоид расположен в~ полупространстве z>0.
Линии Lh пересечения эллиптического параболоида с плоскостями
z = /?, h > О, представляют собой эллипсы, проекции которых на
плоскость Оху определяются уравнением
-= 1,
где a* -a \/h, Ь* = Ь ]Д. Отсюда следует, что при увеличении h
эллипсы неограниченно увеличиваются, т. е. эллиптический параболоид
представляет собой бесконечную чашу.
Рис. 97.6.
Сечения эллиптического параболоида плоскостями у = h и х = h
представляют собой параболы,. Например, плоскость .х = h. пересекает
поверхность по параболе
h2 у2
z г = ¦
расположенной в плоскости х — h.
II. 8. Числа Хи Х2 разного знака. Типичная поверхность для этого
случая определяется уравнением
X
Поверхность, описываемая этим уравнением, называется гиперболи-
гиперболическим параболоидом (рис. 97.6), а само уравнение — каноническим
уравнением гиперболического параболоида.. Плоскости Oxz и Oyz
342 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [Гл. 1!
являются плоскостями симметрии, центра симметрии нет. Линии пере-
пересечения гиперболического параболоида с плоскостями z — h представ-
представляют собой при h > 0 гиперболы
X2 V2
a*2 b*2 lj
где а* = a]/h, Ь* = Ь|А, и при h < 0 — гиперболы
2
где а* = я|/—А, Ь* = Ь]/—й. Плоскость z = 0 пересекает гиперболи-
гиперболический параболоид по двум прямым
Все поверхности, определяемые уравнениями III—V из (95.14), не
зависят от z. Поэтому проекции на плоскость Оху линий пересечения
этих поверхностей с плоскостями z = h также на зависят от h. Такие
поверхности называются цилиндрами с добавлением определения:
эллиптический, гиперболический и т. д. в зависимости от вида проекции
поверхности на плоскость Оху.
Теорема 97.1. Через каждую точку однополостного гиперболоида
и гиперболического параболоида проходят две различные прямые
линии, целиком располагающиеся на указанных поверхностях.
Доказательство. Рассмотрим однополостный гиперболоид,
заданный своим каноническим уравнением
X2 V2 Z2'
\ + TT-i2-=l- (97.10)
a2 b2 с2 .
При любых а, р, не равных нулю одновременно, пара плоскостей
определяет некоторую прямую линию Г. Легко проверить, что данная
прямая Г целиком лежит на поверхности (97.10). Более того,, через
каждую точку этой поверхности проходит одна прямая из семейства Г.
Действительно, будем рассматривать (97.11) как систему из двух
уравнений
относительно а, р. Определитель системы равен нулю тогда и только
тогда, когда точка М{хь у, z) лежит на гиперболоиде (97.10). При
§ 97] ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 343
этом ранг матрицы системы заведомо равен единице. Следовательно,
ос и C определяются с точностью до пропорциональности. Но это
и означает единственность прямой Г, проходящей через каждую точку
гиперболоида.
Аналогичным образом убеждаемся, что через каждую точку гипер-
гиперболоида проходит единственная прямая линия Г*, определяемая
плоскостями
Прямые Г и Г* различны. Такие же рассуждения показывают, что
гиперболический параболоид
~ а2 Ъ2
покрыт двумя различными семействами прямых П и П*, которые
определяются плоскостями
az = p —+ i- , P =
Упражнения.
1. Что представляет собой диаметральная гиперплоскость, сопряженная
данному направлению, для поверхностей второго порядка?
2. Написать уравнения касательной плоскости для различных поверхностей
второго порядка.
3. Исследовать оптические свойства поверхностей второго порядка.
ГЛАВА 12
БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА
§ 98. Матрица и определитель Грама
Пусть в линейном йространстве Кп9 заданном над числовым полем Р,
введена некоторая билинейная форма ф.(х, у). Пространство Кп назы-
называется билинейно метрическим, если каждой паре векторов х9 у из Кп
поставлено в соответствие число (х, у) из Р, называемое скалярным
произведением, причем
(х, y) = <p(x, у).
Если билинейная форма в комплексном пространстве Кп эрмитова,
то пространство К„ называется эрмитовым билинейно метрическим.
В этих случаях мы будем говорить также, что в линейном простран-
пространстве введена билинейная метрика.
Можно увидеть некоторую аналогию между билинейно метриче-
метрическими пространствами и рассмотренными ранее евклидовыми и уни-
унитарными пространствами. Однако сразу же подчеркнем существенные
различия. Сравнивая определения скалярного произведения в евклидо-
евклидовом и унитарном пространствах с определением билинейной формы,
нетрудно заметить, что в билинейно метрических пространствах ска-
скалярное произведение, вообще говоря, может не быть симметричным
и положительно определенным.
Изучение евклидовых и унитарных пространств сводилось к иссле-
исследованию дополнительных свойств как самих пространств, так и дей-
действующих в них операторов, возникающих по отношению к билиней-
билинейным формам, определяющим скалярные произведения. Такова же задача
изучения билинейно метрических пространств. Необходимость введения
ослабленного определения скалярного произведения вызвана тем, что
далеко не всегда билинейные функции, изучаемые совместно с векто-
векторами пространства и операторами, обладают свойством симметрии
и тем более положительной определенности.
Многие определения и факты будут одинаковыми как для обыкно-
обыкновенных билинейных, так и для эрмитовых билинейных метрических
пространств. Поэтому всюду, где это не вызывает каких-либо недора-
недоразумений, слово «эрмитово» мы будем опускать и будем проводить
соответствующие выкладки только для билинейных пространств, мол-
молчаливо подразумевая, что для эрмитовых пространств они проводятся
аналогично.
§ 98] МАТРИЦА И ОПРЕДЕЛИТЕЛЬ ГРАМА 345
\
Основным приемом исследования любого линейного пространства
является разложение вектора по заданной системе векторов и изучение
этого разложения в зависимости от различных факторов. В общем
линейном пространстве нет такого инструмента, с помощью которого
можно было бы найти разложение, но в билинейно метрическом
пространстве таким инструментом оказывается скалярное произведение.
Возьмем произвольную систему векторов х^, х2, . ;*, хт билинейно
метрического пространства Кп и вектор хеКп. Посмотрим, что дает
наличие скалярного произведения для исследования возможности раз-
разложения
х = а1Х! + ос2х2 -+... + ocwxm (98.1)
вектора х по выбранной системе. Скалярно умножая последовательно
равенство (98.1) справа на хь х2, ..., хт, получим для определения
неизвестных коэффициентов аь а2, ..., осж разложения (98.1) систему
линейных алгебраических уравнений
«1 (*ь хх) + ос2 (х2, хх) + ... + otw (хт, хх) = (х, хх),
ос! (хь х2) 4- а2 (х2, х2) + ... + ocw (x^, х2) = (х, х2),
<*i (*ь хт) + а2 (х2, хJ + .. • + ат (хт, хJ = (х, хт).
Матрица G, являющаяся транспонированной матрицей этой системы,
имеет вид
' {xi9 х2) .,. fa, хт)
(98.3)
/
(*т *2) •«¦ (*иэ Xm)i
и называется матрицей Грама системы векторов xl9 х2, ... > xm. Ее
определитель G(xl9 x2, ..., xw) называется определителем Грама.
Таким образом, задачи исследования разложений (98.1) и решения
систем (98.2) оказываются тесно связанными.
Если векторы хь х2, ..., хт образуют базис пространства, то
матрица Грама для них является матрицей основной билинейной
формы (х, у). Матрицы Грама для различных базисов конгруэнтны
и, следовательно, имеют одинаковые ранги. Ранг матриц Грама явля-
является инвариантом билинейно метрического пространства и называется
его рангом. Разность между размерностью и рангом пространства
называется дефектом пространства. Если дефект отличен от нуля,
билинейно метрическое пространство будем называть вырожденным.
Невырожденность основной билинейной формы означает невырожден-
невырожденность матриц Грама для всех базисов. В^ этом случае билинейно
метрическое пространство будем называть невырожденным. Для невы-
невырожденного пространства система (98.2), где хь ..,> хт — базис, всегда
346 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. 12
имеет единственное решение, так как матрица системы будет невы-
невырожденной, и мы получаем возможность исследовать коэффициенты
разложения (98.1) как решение системы (98.2).
Пусть для некоторых векторов х, у билинейно метрического
пространства Кп выполняется равенство (х, у) = 0. В этом случае век-
вектор у называется ортогональным справа к вектору х, а вектор х
ортогональным слева к вектору j/. В билинейно метрических простран-
пространствах мы вынуждены различать ортогональность слева и справа, так
как в общем случае (х, у) ф (у, х). Если же (х, у) = (у, х) = 0, то
такие векторы будем* называть просто ортогональными. Принимая
во внимание линейность скалярного произведения по каждому аргу-
аргументу, легко проверить, что ортогональность вектора j; справа к век-
векторам хь х2) ..., хт влечет за собой его ортогональность справа
к любой их линейной комбинации. То же самое можно сказать
в отношении ортогональности слева. Отсюда, в частности, следует, что
для того чтобы вектор пространства Кп был ортогонален ко всем
векторам линейного подпространства L, необходимо и достаточно,
чтобы он был ортогонален к векторам какого-нибудь базиса под-
подпространства L.
Лемма 98.1. Если матрица Грама системы векторов хь х2, ¦.., хт
вырожденная, то существуют такие векторы и, v, являющиеся нетри-
нетривиальными линейными комбинациями векторов xl5 х2, ..., хт, что и
ортогонален справа, a v — слева ко всем векторам линейной оболочки
векторов xl9 x2, ..., хт.
Доказательство. Если матрица Грама (98.3) вырожденная, то
ее строки линейно, зависимы. Следовательно, существуют такие числа
У и Уъ ••¦> Ymj не все равные нулю, что линейная комбинация строк
будет нулевой, т. е.
Yi (*ь *i) + Y2 (*2> хх) + ... + уж (х„„ хг)-= 0,
*2) + Y2 (*2> Х2) + . . . + Ym (*m, *2> = 0,
т) Y2 С2> Хт) + ... + Ym (*m, Xj = 0.
Если обозначить
п
v = Z
то соотношения (98.4) означают, что (v, xj) = 0 для всех j. Вектор v
является нетривиальной линейной комбинацией векторов хь х2, ..., хт,
ортогонален слева к каждому из этих векторов и поэтому ортогона-
ортогонален к каждому вектору их линейной оболочки. Вектор и строится
аналогично, но исходя из линейной зависимости столбцов матрицы
Грама.
Следствие. Если матрица Грама для линейно независимой сис-
системы векторов вырожденная, то квадратичная форма (х, х) имеет
§ 98] МАТРИЦА И ОПРЕДЕЛИТЕЛЬ ГРАМА 347
изотропный вектор, принадлежащий линейной оболочке заданной сис-
системы и ортогональный справа (слева) ко всем векторам этой оболочки.
Действительно, в силу линейной независимости векторов системы
будут ненулевыми векторы и, v; кроме того, (и, u) — (v9 t?) = 0.
В ряде важных случаев определитель Грама является удобным
средством для установления факта линейной зависимости или незави-
независимости системы векторов.
Лемма 98.2. Для любой линейно зависимой системы векторов
определитель Грама равен нулю.
Доказательство. Пусть система xl9 х2, ..., хт линейно зави-
зависима. Тогда нулевой вектор х можно представить в виде нетриви-
нетривиальной линейной комбинации векторов хи х2, .^., хт. Но в этом
случае однородная система (98.2) должна иметь ненулевое решение.
Следовательно, определитель матрицы этой системы, т. е. определитель
Грама системы xl9 х2, ..., хт, будет равен нулю.
Теорема 98.1. Если квадратичная форма (х, х) не имеет изотроп-
изотропных векторов, то определитель Грама не равен нулю тогда и только
тогда, когда его система векторов линейно независима.
Доказательство. Необходимость. Пусть определитель
Грама системы векторов х±9 х2, ..., хт не равен нулю. Если пред-
предположить, что эта система линейно зависима, то согласно лемме 98.2
определитель Грама должен равняться нулю, что невозможно по усло-
условию.
Достаточность. Предположим, что система векторов линейно
независима. Если определитель Грама равен нулю, то согласно след-
следствию из леммы 98.1 должен существовать изотропный вектор. Так
как это невозможно по условию, то определитель Грама не равен нулю.
Следствие. Если квадратичная форма (х, х) строго знакопосто-
знакопостоянная, то определитель Грама равен нулю тогда и только тогда,
когда система векторов линейно зависимая.
Следствие. Если билинейная форма (х, у) симметричная, а квад-
квадратичная форма (х, х) строго знакопостоянная, то для любых двух,
векторов х, у выполняется неравенство Коши — Буняковского
\(х,у)\Ы(х, х)(у, у), (98.5)
причем равенство достигается тогда и только тогда, когда векторы
х, у линейно зависимы.
В условиях данного утверждения определитель Грама для линейно
независимых векторов х, у будет положительным согласно критерию
Сильвестра или следствию из него и равным нулю для линейно
зависимых векторов согласно лемме 98.2. В обоих случаях неравен-
неравенство (98.5) имеет место. Если же в (98.5) достигается равенство, то
векторы х,- у будут линейно зависимы в соответствии с предыдущим
следствием, так как будет равен нулю их определитель Грама.
Рассмотрим следующие простые, но достаточно важные свойства
определителя Грама. Эти свойства не только порождают многочислен-
348 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. 12
ные следствия, но и нередко позволяют дать им четкую геометри-
геометрическую интерпретацию.
Свойство 1. Определитель Грама не изменяется при перемене
местами любых двух векторов в системе хи х2, ..., хт.
Действительно, если в системе хи х2, ..., хт поменять местами
какие-либо два вектора хг и xj9 то в определителе Грама поменяются
местами i'-й и j-й столбцы, а также i-я и j-я строки. При этом опре-
определитель Грама два раза сменит знак, т. е. в результате он останется
без изменения.
Свойство 2. Определитель Грама не изменяется от прибавления
к любому вектору системы х1у х2, ..., хт любой линейной комбинации
остальных векторов.
Очевидно, достаточно рассмотреть случай, когда изменяется вектор
Xi, так как остальные случаи, принимая во внимание свойство 1,
сводятся к этому. Пусть к вектору х^ прибавляется вектор а2х2 +.. ¦
... •+ awxm. Предположим, что билинейная форма (х, у) — обыкновенная.
Легко проверить, что новый определитель Грама получается из старого
путем прибавления к первой строке второй строки, умноженной на
ос2, и т.д. до последней строки, умноженной на am, и к первому
столбцу второго столбца, умноженного на а2, и т. д. до последнего
столбца, умноженного на ост. От этого, как известно, определитель
не изменяется. Если, билинейная форма (х, у) эрмитова, то столбцы
умножаются на а2, ..., ат.
Свойство 3. Если какой-либо вектор системы xl9 х2, ..., хт умно-
умножить на число а, то определитель Грама умножается на а2, если
билинейная форма (х, у) — обыкновенная, и на | а |2, если форма
(х, у) — эрмитова.
Снова досаточно рассмотреть случай изменения вектора хх. Но
умножение вектора х± на число ос приводит к умножению первой
строки и первого столбца определителя Грама на число ос в случае
обыкновенной билинейной формы (х, у). Если же форма (х9 у) эрми-
эрмитова, то первая строка определителя Грама умножается на число а,
а первый столбец — на число а. Отсюда и вытекает сформулированное
свойство.
Свойство 4. Если каждый из векторов хх, х2, ..., хт ортого-'
пален слева (справа) ко всем предшествующим векторам, то для
определителя Грама справедливо равенство
G (хи х2, ..., хт) = П (*ь хд. (98.6)
В самом деле, ортогональность слева (справа) каждого из векторов
системы хи х2, ..., хт ко всем предшествующим приводит к тому,
что матрица Грама будет правой (левой) треугольной. Но определи-
определитель треугольной матрицы равен произведению диагональных'элемен-
диагональных'элементов, откуда и следует (98.6).
§ 98] МАТРИЦА И ОПРЕДЕЛИТЕЛЬ ГРАМА 34?
. Особенно интересные свойства матрицы и определителя Грама
появляются в тех случаях, когда билинейная форма (х, у) — веществен*
ная симметричная или эрмитова симметричная и является положи-
положительно определенной. Конечно, эти случаи означают-не что иное, как
то, что билинейно метрическое пространство Кп в действительности
является евклидовым или соответственно унитарным.
В евклидовом и унитарном пространстве матрица Грама для любой
базисной системы будет матрицей положительно определенной квад-
квадратичной формы (х, х). Согласно критерию Сильвестра все главные
миноры матрицы Грама будут положительные. Так как любую линейна
независимую систему векторов можно достроить до базиса, то отсюда
вытекает, что справедлива
Лемма. 98.3. В евклидовом и унитарном пространстве определи-
определитель Грама для любой линейно независимой системы векторов явля*
ется положительным.
В евклидовом пространстве определитель Грама имеет очень прос-
простой геометрический смысл. Об этом говорит
Теорема 98.2. В евклидовом пространстве определитель Грама
G(xu хъ ..., хт) системы векторов xl9 х2, ..., хт равен квадрату
объема V2(xu х2, ..., хт) этой системы векторов.
Доказательство. Рассмотрим вещественную функцию
G1/2(xl5 ..,, х?) от т векторных аргументов хи х2, ..., хт. Она
удовлетворяет свойствам А, В из C6.3) согласно свойствам 2, 3 определи-
определителя Грама. В евклидовом пространстве каждый вектор любой орто-
нормированной системы векторов ортогонален всем предшествующим
векторам системы. Поэтому в соответствии с (98.6) функция G1/2(x1>
*2> •••> *т) удовлетворяет и свойству С из C6.3). Но теперь из
теоремы 36.1 вытекает, что эта функция совпадает с объемом системы
векторов. у
Следствие. Для, любой системы векторов хь х2, ...., хт евкли-
евклидова пространства справедливы неравенства
т
О.^ G (хь х2, ..., хт) < П (**> *i)>
причем равенство слева достигается тогда и толькд тогда, когда
система векторов линейно зависима, а равенство справа - тогда и
только тогда, когда либо система векторов ортогональна, либо содер-
содержит нулевой вектор.
Справедливость этого утверждения вытекает из первого следствия
теоремы 98.1 и из свойства объема системы векторов, описанного
неравенством Адамара C6.1).
Следствие. Для любой системы векторов хи х2, «..9 хт евкли-,
дова пространства справедливо неравенство
G(xu „,,x,, х1+и ..., xm)
350 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. 12
причем равенство достигается тогда и только тогда, когда либо
множества векторов хх, ..., х, и xl+v ..., хт ортогональны,
либо одно из этих множеств представляет линейно зависимую си-
систему.
Доказательство основано на простом анализе формулы C5.4).
Напомним только следующее. Если Lx я Ll9 где Lb L2 — любые под-
лространства, то |ortr x| ^ |ortLx| для любого вектора х. Причем
равенство достигается лишь в случае, когда x_LL2.
Упражнения.
1. Являются ли эквивалентными задачи отыскания разложений (98.1)
ц решения систем (98.2)?
2. Что дает решение системы (98.2), если вектор х не принадлежит
линейной оболочке векторов хь ..., хт?
3. Как выглядит матрица Грама (98.3), если:
векторы хь ..., хт попарно ортогональны,
каждый из векторов хь ..., хт ортогонален слева (справа) ко всем
Предшествующим (последующим) векторам,
каждый из векторов хь ..., хт ортогонален слева (справа) ко всем после-
последующим (предшествующим) векторам,
каждый из векторов х/+1, ..., хт ортогонален слева (справа) к каждому
из векторов 5с 1, ..., xj?
4. Как меняется матрица Грама при элементарных преобразованиях
системы векторов?
5. Доказать, что если в обыкновенном билинейно метрическом простран-.
стве из условия (х, у) = 0 всегда следует (у, х) = 0, то скалярное произве-
произведение задано либо симметричной, либо кососимметричной билинейной
формой.
6. Верно ли утверждение упражнения 5 для эрмитова билинейно метри-
метрического пространства?
7. Пусть G есть матрица Грама для некоторого базиса в невырожденном
эрмитовом билинейно метрическом пространстве Кп. Доказать, что для онера-
тора U с матрицей G~XG' том же базисе при всех векторах хеКп вы-
выполняется равенство
(l/x, Ux) = (х, х).
8. Доказать, что для любого линейного оператора А, действующего
в евклидовом или унитарном пространстве Кю отношение
G(xlt ..., xm)
не зависит от векторов х1? ..., хт и равно произведению квадратов модулей
собственных значений оператора А.
9. Доказать, что для любой линейно независимой системы векторов
Хь ..., xw евклидова или унитарного пространства и любого вектора г
выполняется неравенство
, G(xb ... xw, z) < G(xu ..., xw_b z)
v (xls ..., xm) и [xlt ..., xm_ ij
§991 невырожденные. Подпространства 351
§ 99. Невырожденные подпространства
Любое линейное подпространство L из Кп можно рассматривать
как билинейно метрическое пространство относительно того же скаляр-
скалярного произведения, которое введено в Кп. В общем случае из
невырожденности Кп не следует невырожденность L и наоборот.
Теорема 39.1. Для того чтобы в пространстве Кн были
невырожденными все его подпространства, необходимо и достаточ-
достаточно, чтобы квадратичная форма (х, х) не имела изотропных век-
векторов.
Доказательство. Необходимость. Пусть все подпростран-
подпространства в Кп — невырожденные. Тогда невырожденными являются и все
одномерные подпространства. Но матрицы Грама для ненулевых
векторов х совпадают со скалярным произведением (х, х), которое
должно быть отлично чэт нуля в силу невырожденности одномерных
подпространств.
Достаточность. Предположим, что (х, х) Ф О для всех х Ф 0.
Рассмотрим любое подпространство L и в нем базис хь х2, ...,
хт. Согласно теореме 98.1 определитель Грама для этой системы
отличен от нуля, т. е. подпространство L— невырожденное.
Следствие. Для того чтобы в билинейно метрическом про*
странстве Кп были невырожденными все его подпространства, необхо-
необходимо и достаточно, чтобы невырожденными были все его одномерные
подпространства.
Следствие. В любом обыкновенном комплексном билинейно метри-
метрическом пространстве существуют вырожденные одномерные подпростран-
подпространства.
Для доказательства этого утверждения достаточно вспомнить, что э
обыкновенном комплексном билинейно метрическом пространстве любая
квадратичная форма имеет изотропные векторы.
В том случае, когда квадратичная форма имеет изотропные
векторы, в билинейно метрическом пространстве будут существовать
как вырожденные, так и невырожденные подпространства. Если
билинейная форма (х, у) имеет ранг г, то ясно, что не может быть
невырожденных подпространств размерности больше г. Но невырожден-
невырожденные подпространства размерности г существуют. Таким, например, будет
подпространство, натянутое на те векторы канонического базиса, для
которых матрица Грама совпадает с матрицей М из (92.5).
Будем говорить, что множество векторов F из билинейно метри-
метрического пространства Кп ортогонально справа, слева или просто
ортогонально множеству векторов G из Кт если для каждой пары
векторов х, у, где xeF, yeG, выполняется аналогичное отношение
ортогональности. Ясно, что совокупность всех векторов пространств!
Кп9 ортогональных справа (слева) к каждому из векторов множества F
есть подпространство. Называется оно ортогональным дополнением
справа (слева) множества F и обозначается F1 (^-F).
S52 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. t2
В евклидовом и унитарном пространствах подпространства *-Кп и
Щ совпадают и состоят только из нулевого вектора. В билинейно
метрических пространствах эти подпространства могут быть различными
и не. обязательно состоят только из нулевого вектора. Подпростран-
Подпространства -1 Кп и Kjf называются соответственно левым и правым
нулевыми подпространствами в Кп.
Заметим, что для любого множества векторов F всегда спра-
справедливы включения К\ с FL9 LKn ? ^F, а для любых векторов из
±Кп или К± матрицы Грама оказываются нулевыми.
Теорема 99.2. Размерности левого и правого нулевых под-
подпространств совпадают и, равны дефекту билинейной формы (х, у).
Доказательство. Выберем в Кп какой-либо базис хъ х2, ...
*.., хп. Возьмем произвольный вектор х из К? и представим его
в виде разложения по базису аналогично (98.1). Условие принадлеж-
принадлежности вектора х подпространству К^ эквивалентно условиям орто-
ортогональности справа вектора х к каждому из векторов базиса.
Но эти условия приводят к решению однородной системы типа
(98.2) для определения коэффициентов разложения. Известно (см. § 48),
что множество решений этой системы есть подпространство, размер-
размерность которого равна дефекту матрицы Грама или, что то, же самое,
дефекту билинейной формы (х, у). Доказательство для левого нулевого
-подпространства проводится аналогично.
С л е-д с т в и е. Для пюго чтобы пространство Кп было невырожден-
невырожденным, необходимо и достаточно, чтобы правое и левое нулевые под-
подпространства состояли только из нулевого вектора.
В евклидовом и унитарном пространствах любое подпространство
ортогонально своему ортогональному дополнению и определяет раз-
разложение всего пространства не только в' прямую, но даже в орто-
ортогональную сумму этих подпространств. В билинейно метрических
пространствах аналогичные факты имеют место не всегда.
Теорема 99.3. Пусть L— подпространство в Кп. Для того чтобы
существовали разложения
Kn = L+U-=L+-LL, (99.1)
необходимо и достаточно, чтобы подпространство L было невырож-
невырожденным.
Доказательство. Необходимость. Предположим, что вы-
выполняются разложения (99.1). Будем рассматривать L как билинейно
метрическое пространство с тем же скалярным, произведением, что
и в Кп. Пересечение Lf^L1- является правым нулевым подпростран-
подпространством в L. Так как суммы (99.1) прямые, то это подпространство
содержит только нулевой вектор. Согласно следствию из теоремы 99.2
это означает, что подпространство L невырожденное.
Достаточность. Если подпространство L— невырожденнее, то
пересечение L (°) IA будет содержать только нулевой вектор и нужно
показать, что любой вектор хеКп может быть представлен в виде
99] НЕВЫРОЖДЕННЫЕ ПОДПРОСТРАНСТВА' 353
x = u + v, где ueL, reZA Возьмем какой-либо базис хь х2, ..., хт
в L. Для существования искомого разложения х = м + v необходимо
и достаточно, чтобы в L нашелся такой вектор м, что х — и орто-
ортогонален справа к векторам хь х2, ¦.., хт. Снова для определения
коэффициентов разложения вектора и по векторам хь х2, ..., хт
получаем систему линейных алгебраических уравнений с матрицей Грама.
Эта матрица — невырожденная, и система имеет рашение, т. е. вектор и
существует.
Конечно, все сказанное относительно подпространства Lx полностью
переносится и на подпространство -4L.
Следствие. Если невырожденное подпространство L имеет раз-
размерность т, то размерность подпространств Lx и Lh равна п — т.
Для доказательства этого утверждения достаточно использовать
равенство A9.1) и вспомнить, что размерность подпространств f
и Lf]1L равна нулю.
Следствие. Если невырожденное подпространство L имеет мак-
максимальную размерность, то L1 = К\, LL= ±Kn.
Действительно, пусть ранг билинейной формы (х, у) равен г.
Как мы уже отмечали, подпространство L будет иметь размерность г,
а подпространства L1 и 1L- размерность п — г. JHo подпространства
К\ и ±Кп тоже имеют размерность п — г и, кроме того, К\ с L1,
-ЧК„ <= -ll. Поэтому К\ = L\ LKn = LL.
Что же касается разложений типа (99.1) в ортогональные суммы,
то отметим, что из теоремы 99.3 вытекает
Следствие. Пусть L— невырожденное подпространство макси-
максимальной размерности. Разложения (99.1) будут ортогональными тогда и
только тогда, когда левое и правое нулевые подпространства совпадают.
В самом деле, если разложения (99.1) — ортогональные, то Z/
ортогонально к Ьне только справа, но и слева, т. е. LL <^LL. Анало-
Аналогично имеем ^cL1. Следовательно, L± = ±L. Так как L имеет
максимальную размерность, то это означает, что Ki = LKH. Если же
нулевые подпространства совпадают, то отсюда вытекает, что L1 = ±L9
т. е. подпространства L1 и LL ортогональны L как справа, так и слева,
и разложения (98.5) являются ортогональными.
Теперь мы можем дать ответ на вопрос о том, какая существует
связь между разложением (98.1) и решением системы (98.2). Пусть
векторы хь ..., хш образуют базис невырожденного подпространства L.
Согласно теореме 99.3 имеют место прямые разложения (99.1). Поэтому
каждый вектор х билинейно метрического пространства Кп может быть
единственным образом представлен в виде х = и 4- и, где иеЦ v-e LL.
Напомним, что вектор-м называется проекцией лектора х на подпро-
подпространство L параллельно подпространству ±L. Если мы решим систему
линейных алгебраических уравнений (98.2) и составим вектор
и = аххх + ос2х2 + ... + amxw, (99.2)
то именно он будет проекцией вектора х на подпространство L
354 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. 12
параллельно подпространству 1L. Действительно, вектор и принадлежит
L, а разность х — и согласно (98.2) ортогональна слева к векторам
xl9 ..., хт. Следовательно, х — и принадлежит -LL. Ясно, что для полу-
получения проекции вектора х на подпространство L параллельно 1Л
необходимо решить такую систему
х2) + ... + ос,п(хь хш) *= (хь х),*
2, х2) + ... + аш(х2, хш) = (х2, х), (99.3)
<*i (*», *i) + а2 (х„, х2) + ... + ос,н(х,н, хт) = (х}Ю х)
и затем вычислить искомую проекцию согласно (99.2). В случае эрмитова
билинейно метрического пространства коэффициенты а,- в (99.2) заме-
заменяются на бе,-.
Упражнения.
1. Описать все невырожденные подпространства максимальной размерности.
2. Доказать, что для любого множества L имеют место включения
В каких случаях в этих формулах достигаются равенства?
3. Доказать, что если L— невырожденное подпространство максимальной
размерности в пространстве Кю то
HLL) = № = *.„
4. Доказать, что если скалярное произведение задано симметричной, или
кососимметричной билинейной формой, то для любого множества F выполняется
равенство F1 = 1F.
5. Какая связь между разложением (98.1) и решением системы (98.2),
если матрица Грама системы л*!, л*2, ..., л*т вырожденная?
6. Может ли в невырожденном пространстве существовать базис из изо-
изотропных векторов?
7. Что можно сказать о скалярном произведении, если проекции на фикси-
фиксированное подпространство Lпараллельно 1Ln L1 совпадают для всех векторов?
8. Что можно сказать о скалярном произведении, если проекции фикси-
фиксированного вектора на все подпространства L параллельно 1L к. L1 совпадают?
9. Пусть L— невырожденное подпространство эрмитова билинейно метри-
метрического пространства К„ ранга г < п. Доказать эквивалентность следующих
утверждений:
подпространство LL имеет размерность п < г,
подпространство L1 имеет размерность п — г9
подпространство L имеет размерность г,
подпространства LL и К^ совпадают,
подпространства Чи 1КН совпадают,
подпространство LL состоит из изотропных векторов и нулевого вектора,
подпространство L1 состоит из изотропных векторов и нулевого вектора,
скалярное1 произведение на подпространстве 1L равно нулю,
скалярное произведение на подпространстве Lx равно нулю.
10. Какой вид будут иметь матрицы Грама для базисов, составленных из
базисов невырожденного подпространства L и подпространства LL (L1)?
§ 100] ОРТОГОНАЛЬНОСТЬ В БАЗИСАХ 355
§ 100. Ортогональность в базисах
В билинейно метрических пространствах базисы неравноправны.
Среди них есть такие, для которых системы (98.2) решаются и ис-
исследуются особенно просто. Так будет, например, в том случае,
когда значительная часть матрицы Грама состоит из нулевых элемен-
элементов. Соответственно тому, какой вид имеют матрицы Грама, мы будем
рассматривать различные классы базисов в билинейно метрических
пространствах.
Самые простые матрицы — диагональные. Диагональные матрицы
Грама появляются тогда и только тогда, когда базисы состоят из
попарно ортогональных векторов. Такие базисы мы будем называть
ортогональными. Систему векторов, которые образуют ортогональный
базис в своей линейной оболочке, будем называть ортогональной
системой.
Ортогональные базисы можно определить различными способами.
Определение через попарную ортогональность не всегда удобно для
проверки, особенно в тех случаях, когда векторы базиса строятся
последовательно, начиная с первого. Поэтому иногда полезно ис-
использовать следующее определение.
Базис elt е2, ..., еп называется ортогональным, если каждый из
его векторов ортогонален ко всем предшествующим векторам.
Матрица Грама для векторов, удовлетворяющих этому определению,
является диагональной, поэтому оба определения эквивалентны. В об-
общем случае в базисе могут быть как не изотропные, так и изо-
изотропные векторы. Векторы ортогонального базиса всегда можно пере-
переставить так, чтобы не изотропные векторы стояли первыми, а изо-
изотропные — последними. Диагональный вид матрицы Грама при этом,
конечно, сохраняется.
Ортогональные базисы существуют не во всяком билинейно мет-
метрическом или эрмитовом билинейно метрическом пространстве. Если
существует хотя бы один ортогональный базис, то это значит, что
матрица билинейной формы (х, у) в данном базисе имеет диаго-
диагональный вид. Следовательно, матрица билинейной формы (х, у) в любом
другом базисе должна быть конгруэнтна диагональной. Конечно, верно
и обратное утверждение. Поэтому
Для того чтобы в билинейно метрическом или эрмитовом били-
билинейно метрическом пространстве существовал ортогональный базис,
необходимо и достаточно, чтобы матрица билинейной формы (х, у)
была конгруэнтна диагональной матрице. При этом множество всех
ортогональных базисов с точностью до перестановки 'векторов совпада-
совпадает с множеством канонических базисов билинейной формы (х, у).
Теперь, опираясь на выполненные ранее исследования билинейных
форм, мы можем сказать, что среди обыкновенных билинейно метри-
метрических пространств имеют ортогональные базисы те и только те
пространства, в которых основная билинейная форма (х,у)-аш-
356 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. 12
метричная. Среди эрмитовых билинейно метрических пространств имеют
ортогональные базисы пространства с эрмитовой и косоэрмитовой
основной билинейной формой (х, у), а также с билинейной формой
(х, у), имеющей знакопостоянную вещественную или мнимую часть
квадратичной формы (х, х).
Отметим сразу одно принципиальное различие между обыкновен-
обыкновенными и эрмитовыми билинейно метрическими пространствами с орто-
ортогональными базисами. В обыкновенном -билинейно метрическом про-
пространстве Кп наличие ортогонального базиса влечет за собой, сим-
симметрию скалярного произведения (х, у), а это, в свою очередь,
обеспечивает существование ортогонального базиса в любом подпро-
подпространстве Кп. В эрмитовом билинейно метрическом пространстве
в общем случае из существования ортогонального базиса в самом
пространстве не вытекает автоматически существование ортогонально-
ортогонального базиса в любом его подпространстве. Однако, если скалярное
произведение задано эрмитовой симметричной или эрмитовой косо-
симметричной билинейной формой, то это следствие снова имеет место.
Рассмотрим любой ортогональный базис еи е2, ..., еп билинейно
метрического пространства Кп. В этом базисе столько изотропных
и столько не изотропных векторов, каков соответственно дефект и
ранг пространства Кп. Принимая во внимание закон инерции квадра-
квадратичных форм, заключаем, что если билинейная форма (х, у) —
вещественная .симметричная или эрмитова симметричная, то в любом
ортогональном базисе будет одно и то же число векторов, имеющих
положительные и отрицательные значения величин (eh et). Эти числа
являются инвариантами для всех ортогональных базисов в Кп. В со-
соответствии с этим мы будем говорить о положительном и
отрицательном индексе, а также о сигнатуре пространств с сим-
симметричной формой (х, у). Для билинейно метрических пространств с
несимметричной формой (х, у) мы будем говорить только о ранге
и дефекте пространств.
Если пространство Кп — невырожденное, то каждый ортогональный
базис еь е2,*..., еп не имеет изотропных векторов. В этом случае
для любого вектора хеКп справедливо разложение
= 1
В самом деле, умножая последовательно равенство
х = а^ + а2е2 + -«. + ад A00.2)
справа скалярно на векторы ех, е2, ..., еп, получим, что
§ 100] ОРТОГОНАЛЬНОСТЬ В БАЗИСАХ 357
для всех ]. Векторы ортогонального базиса в невырожденном про-
пространстве можно нормировать и получить ортонормированный базис.
Для ортонормированного базиса еи е2, ..., еп выполняются соотно-
соотношения |(ер е-)| = 1 при всех j.
В вырожденных пространствах среди векторов любого базиса обя-
обязательно будут находиться изотропные векторы. Поэтому представле-
представление A00.1) для разложения A00.2) векторов пространства уже не будет
иметь место. Однако и в этих пространствах ортогональные базисы
оказываются достаточно полезными. В качестве примера их использо-
использования покажем, например, что справедлива
Теорема 100.1. Если в пространстве со скалярным произведением
существует ортогональный базис, то правое и левор нулевые под-
подпространства совпадают.
Доказательство. Пусть в пространстве Кп ранга г существует
ортогональный базис еи е2, ..., еп. Будем считать, что векторы
?i, ..., ег — не изотропные, а векторы ег+1, .,., еп — изотропные.
Возьмем произвольный вектор хеКп и разложим его согласно A00.2).
Используя представление A00.2) и принимая во внимание ортогональ-
.ность базиса и изотропность векторов ег+1, .,., еп, легко установить,
что (х, ej) — (ej9 x) = 0 для r<j^n. Следовательно, векторы ег±и ..*
..., еп входят одновременно и в правое, и в левое нулевые под-
подпространства. Но векторы ег+1, ..., еп как векторы базиса линейно
независимы, и их число равно размерности нулевых подпространств,
поэтому оба нулевых подпространства совпадают.
Следствие. Если в билинейно метрическом пространстве скалярное
произведение задано симметричной или эрмитовой симметричной били-
билинейной формой, то правое и левое нулевые подпространства совпадают..
Следствие. В любом ортогональном базисе изотропные векторы
и только они образуют базис общего нулевого подпространства.
Следствие. Если в пространстве со скалярным произведением
существует ортогональный базис, то оно может быть разложено в
ортогональную сумму любого невырожденного подпространства, имеющее
го максимальную размерность, и нулевого подпространства.
Последнее следствие до существу означает, что изучение любых
вырожденных пространств с ортогональными базисами сводится к раз-
раздельному изучению невырожденных подпространств с ортогональными
базисами и подпространств, на которых скалярное произведение равно
нулю.
Знание ортогонального базиса в пространстве позволяет не только
указать ортогональный базис в невырожденном подпространстве макси-
максимальной размерности, но и получить явное разложение ортогональной
проекции любого вектора на это подпространство по его ортогональ-
ортогональному базису Действительно, пусть еи еъ . ¦., еп — ортогональный
базис- в Кт векторы еи ,- , ег — не изотропные, ег+1, ..., еп —
изотропные. Обозначим через L подпространство, натянутое на векторы
el9 •.., ег. Ясно, что оно невырожденное, имеет максимальную
358 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА 1Гл. Ц
размерность, L1 = LL и к тому же
Любой вектор х из Кп можно единственным способом предста-
представить в виде суммы x = u + v, где иеЦ i?elA Здесь и называется
левой ортогональной проекцией вектора х на подпространство L,
v — левым перпендикуляром к этому подпространству. Напишем для х
разложение A00.2) по базису ei9 e2, .,••> еп. Формула A00.1) уже не
будет иметь место. Однако заметим, что первые г слагаемых в A00.2)
образуют вектор и, последние п — г — вектор v. Умножая равенство
A00.2) последовательно справа скалярно на еХ9 ..., еп получим, что
Проекция v вектора х на нулевое подпространство определяется очень
просто
Е(х, е3)
7—т
(ej9 ej)
Единственное, что теперь нельзя сделать,—это найти разложение век-
вектора v по векторам er+i, ..., ею используя скалярное произведение,
несмотря на то, что само разложение существует.
Как мы уже говорили, ортогональные базисы существуют не во
всяком билинейно метрическом и эрмитовой билинейно метрическом
пространстве. Это обстоятельство заставляет нас искать другие классы
базисов, более удобные с точки зрения заданного в пространстве ска-
скалярного произведения. Решение подсказывается каноническим видом
матрицы билинейной формы.
Базис еи е2, .-.., ^называется псевдоортогоналъным, если каждый
из его векторов ортогонален слева ко всем предшествующим векторам,
а каждый из его изотропных векторов ортогонален слева ко всем век-
векторам базиса. Систему векторов, которые образуют псевдоортогональный
«базис в своей линейной оболочке, будем называть псевдоортогональ-
псевдоортогональной системой.
Заметим, что в данном определении ортогональность векторов слева
ко всем предшествующим можно заменить ортогональностью векторов
•справа ко всем последующим. Это определяет одни и те же условия.
Матрица Грама для векторов псевдоортогонального базиса является
правой трапециевидной. Если векторы базиса переставить так, чтобы
не изотропные векторы стояли первыми, а изотропные последними,
то матрица Грама не только останется правой трапециевидной, но и будет
заметь к тому же канонический вид (92.5). Выполненные ранее исследо-
§ 100] ОРТОГОНАЛЬНОСТЬ В БАЗИСАХ 359
вания по приведению матрицы билинейной формы к каноническому
виду дают полный ответ на вопрос, когда существует псевдоорто-
псевдоортогональный базис. Именно,
Псевдоортогопальный базис существует в любом эрмитовом билинейно
метрическом пространстве, а также в любом обыкновенном били-
билинейно метрическом пространстве, кроме пространств с кососимметрич-
ной билинейной формой (х, у). Множество всех псевдоортогопалъных
базисов совпадает с точностью до перестановки векторов с множеством
канонических базисов билинейной формы (х, у).
Каждый ортогональный базис является псевдоортогональным. В
обыкновенном билинейно метрическом пространстве не могут существо-
существовать одновременно ортогональный базис и псевдоортогональный базис^
не являющийся ортогональным. Это связано с тем, что существование
хотя бы одного ортогонального базиса влечет за собой симметрию
всех матриц Грама. Правая трапециевидная матрица может быть сим-
симметричной лишь в том случае, когда она диагональная. В эрмитовом
билинейно метрическом пространстве могут существовать одновременно
и ортогональный базис и псевдоортогональный базис, не являющийся
ортогональным. Это означает, что правая трапециевидная комплексная
матрица может быть эрмитово конгруэнтной диагональной матрице,,
что подтверждается также примером (92.8).
Если пространство Кп — невырожденное, то каждый псевдоортого-
псевдоортогональный базис не имеет изотропных векторов, так как правая тра-
трапециевидная матрица может быть невырожденной только тогда, когда
она является правой треугольной матрицей с ненулевыми диаго-
диагональными элементами. В невырожденном пространстве для коэффициен-
коэффициентов olj разложения A00.2) вектора х по векторам псевдоортогональ-
псевдоортогонального базиса еъ еъ ..., еп получаем систему линейных алгебраичес-
алгебраических уравнений с левой треугольной матрицей. Действительно, умно-
умножая последовательно равенство A00.2) справа на е1у е2, ..., еПУ
находим, что
<*! (еи ех) = (х, ех),
«1 (ей е2) + ос2 (е29 ё2) =(х? в2), A00.3)
<*i (el9 еп) + а2 (е2, еп) + ... + а„ (ею еп) = (х, еп).
Отсюда последовательно определяем ось а2, ..., аи. Конечно, векторы
псевдоортогонального базиса в невырожденном пространстве можно-
нормировать и получить псевдоортонормированный базис, для которого
\(е]9 ej)| = 1 при всех j.
Заметим, что. процесс решения системы A00.3) дает значительна
больше, чем просто разложение вектора х по псевдоортогональному
базису еи е2, ..., еп. Попутно без дополнительных затрат мы можем
вычислить все векторы
щ = а^! 4- а2е2 + ... + akek.
360 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. 12
Векторы ик образуют последовательность проекций одного и того же
вектора х на вложенные друг в друга подпространства
где !& — линейная оболочка векторов еъ еъ ..., ек. Если рассматри-
рассматривать ик как «приближение» к решению х, то ортогональность слева
«ошибки» vk = х — хк к подпространству 1^ означает в действитель-
действительности ортогональность vk слева к йъ и2, ..., щ. Ко всем этим
вопросам мы еще вернемся несколько позднее.
Если пространство Кп — вырожденное, то в общем случае су-
существование псевдоортогонального базиса не гарантирует совпадение
правого и левого нулевых подпространств и, следовательно, нельзя
надеяться на разложение пространства в ортогональную сумму каких-
либо его подпространств. Но знание псевдоортогонального базиса поз-
позволяет эффективно построить разложение пространства в прямую сум-
сумму (99.1).
Предположим, что в пространстве Кп ранга г существует псевдо-
псевдоортогональный базис еи е^ ,.., еп. Будем считать, что векторы
еи ..., ег — не изотропные, векторы ег+ъ ..», е'п — изотропные.
В псевдоортогональном базисе изотропные векторы ортогональны слева
ко всем векторам базиса, поэтому они ортогональны слева ко всем
векторам пространства Кп. Но это означает, что изотропные векторы
псевдоортогонального базиса образуют базис левого нулевого под-
подпространства хКп, Обозначим через L линейную оболочку векторов
еъ . ¦., ег. Согласно второму следствию теоремы 99.3
причем для обоих подпространств L и хКп известны базисы.
Для подпространства L базис е1? ..., ег будет псевдоортогональным.
Итак, изучение любых вырожденных пространств с псевдоортого-
Нальным базисом сводится к совместному изучению невырожденных,
лодцространств с псевдоортогональным базисом и подпространств,
на которых скалярное произведение равно нулю.
Любой вектор из Кп можно единственным способом представить
в виде суммы x — u + v9 где weL, vexKn. Если для вектора х
написать разложение A00.2), то для определения коэффициентов ос,-
снова получим систему типа A00.3), но уже не с невырожденной
Левой треугольной матрицей, а с левой трапециевидной матрицей.
Тем не менее, из этой системы можно определить первые коэф-
коэффициенты аь ,,,, аг, и мы имеем
и = ахех + а2е2 + ... + агеп
т. е. проекция вектора х на, подпространство L находится полностью
на основе знания лишь лсевдоортогонального базиса в L. Снова
V — х — и, и опять нельзя найти разложение вектора v по векторам
ег+ъ ..,, ею используя скалярное произведение.
§ 100] ОРТОГОНАЛЬНОСТЬ В БАЗИСАХ 361
Псевдоортогональный базис является достаточно общим типом
базиса, так как существует почти во всех пространствах. Как мы уже
знаем, он не существует только в обыкновенных билинейно метри-
метрических пространствах с кососимметричной формоц (х, у). Для этих
пространств наиболее удобный тип базиса очевиден и, конечно, яв-
является каноническим базисом матриц Грама. Вообще говоря, можно
ввести тип базиса, покрывающий все рассмотренные выше типы- ба-
базисов и существующий во всяком пространстве со скалярным произ-
произведением. -Однако его введение дает мало новых фактов, и мы
не будем сейчас на нем останавливаться.
Кроме одного базиса с теми или иными отношениями ортогональ-
ортогональности между его векторами мы иногда будем иметь дело с парами
аналогичных базисов.
Базис /ь f2, ..., fn называется левым (правым) двойственным
для базиса еи еъ ..., ет если {fh e,.) = 0 {{ej9 /0 = 0) дая гф] и_при
этом (?, et) ((eh jQ) равно 1 или 0 для всех I
Базис fl9 f29 ¦.., fn называется левым (правым) псевдодвойствен*
ным для базиса еи еъ ..., ею если (fh в/) = 0 ((efi fd-О) ДЛЯ
j<i при (fb et)=l ((eh /f) = 1) и для всех j при (fb ef) = 0
(fe/*) = 0).
Легко видеть, что матрица билинейной формы (х, у) в паре
двойственных базисов является диагональной, а в паре псевдодвой-
псевдодвойственных — правой (левой) трапециевидной. Вопросы существования и
построения двойственных и псевдодвойственных базисов тесно связаны
с эквивалентными преобразованиями (91.4) матрицы билинейной формы
(х, у), а также с разложением этой матрицы на множители. К де-
детальному исследованию таких базисов мы будем обращаться лишь
по мере необходимости, Сейчас же ограничимся только кратким их
обсуждением.
Теорема 100.2, В любом невырожденном пространстве каждый
базис имеет правый и левый двойственные базисы и притом единст-
единственные.
Доказательство. Рассмотрим базис еи е2, ..¦, еп в невырож-
невырожденном пространстве Кп9 и пусть Ge — матрица билинейной формы
(х, у) в этом базисе. Согласно (91.4) нахождение левого (правого)
двойственного базиса для еъ еъ ..., еп эквивалентно определению
матрицы P(Q), для которой матрица P'Ge (GeQ) будет единичной.
Тогда P(Q) будет матрицей преобразования координат при переходе
от базиса el9 e2i ..., еп к двойственному. Так как пространство
невырожденное, то невырожденной будет и матрица Ge4 и существует
единственное решение: Р ^G~v (Q = G),
Следствие. Б любом невырожденном пространстве каждый базис
имеет левый и правый псевдодвойственные базисы.
Действительно, каждый левый (правый) двойственный базис яв-
является одновременно и левым (правым) псевдодвойственным ба-
базисом.
362 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. 12
Принимая во внимание вид Матрицы билинейной формы (х; у),
легко установить, что если в невырожденном пространстве от левого
(правого) двойственного базиса перейт-и к другому базису с левой
треугольной матрицей преобразования координат с единичными диа-
диагональными элементами, то новый базис будет левым (правым) псевдо-
псевдодвойственным.
Упражнения.
1. Пусть скалярное произведение симметрично. Являются ли для неорто-
неортогональных базисов еь е2, ..., еп инвариантами количества векторов, имеющих
положительные, отрицательные и нулевые значения величин (еь е()Т
2. Как превратить любое вещественное или комплексное линейное прост-
пространство в билинейно метрическое пространство с симметричным скалярным
произведением с заданными рангом и сигнатурой?
• 3. Ортогональный базис в невырожденном пространстве не имеет изотроп-
изотропных векторов. Может ли в таком пространстве существовать базис из изо-
изотропных векторов?
4. Доказать, что ортогональная проекция и перпендикуляр как функции
векторов билинейно метрического пространства являются линейными опера-
операторами.
5. Какой вид имеет матрица Грама для псевдоортогонального базиса,
если правое и левое нулевые подпространства совпадают?
6. Доказать, что в любом обыкновенном или эрмитовом билинейно мет-
метрическом пространстве существует базис, в котором матрица Грама являе^тся
правой клеточно треугольной с клетками первого и второго порядка на
диагонали.
7. Как определяются коэффициенты разложения вектора по базису,
для которого известен какой-либо двойственный или псевдодвойственный
базис?
8. Доказать, что в невырожденном пространстве матрица преобразования
координат при переходе от одного базиса, псевдодвойственного к заданному,
к любому другому псевдодвойственному базису того же наименования явля-
является левой треугольной.
§ 101. Операторы и билинейные формы
Если в обыкновенном или. эрмитовом билинейно метрическом
пространстве действует линейный оператор, то, конечно, все результаты,
полученные ранее в отношении операторов в вещественном или
комплексном пространстве, имеют место. Поэтому мы будем изучать
лишь дополнительные свойства операторов, связанные с наличием
в пространстве скалярного произведения.
Одним из важнейших объектов является сопряженный оператор.
В евклидовом и унитарном пространствах сопряженный оператор
вводился через скалярное произведение, но при исследовании его свойств
широко использовалось существование в пространстве ортонормирован-
ного базиса. Теперь мы не можем идти таким путем, так как в общем
билинейно метрическом пространстве может не быть ни одного орто-
ортогонального базиса. Наши исследования будем проводить в эрмитовом
§ 101] ОПЕРАТОРЫ И БИЛИНЕЙНЫЕ ФОРМЫ 363
билинейно метрическом пространстве. Изменения для обыкновенного
билинейно метрического пространства очень просты.
Оператор Л* (*А), действующий в эрмитовом билинейно метриче-
метрическом пространстве Кт называется правым [левым) сопряженным опера-
оператором для оператора А, действующего в КП9 если для любых векторов
х9 увКп выполняется равенство
(Ах, у) = (х, А*у) ((х, Ау) = (*Лх, у)). A01.1)
Возьмем произвольный базис еи е2> • • • > #* в К™ и пусть Ge —
матрица Грама для этого базиса. Обозначим через Ае матрицу опе-
оператора А в базисе еъ е2, '..., ет через А* и *Ле — матрицы опера-
операторов А* и *А, если они существуют.
Теорема 101.1. Для любого линейного оператора А, действующего
в невырожденном эрмитовом билинейно метрическом пространстве^
существуют единственные сопряженные операторы А* и *А9 при этом
A* = G;xA'eGe, *Ae^G;vA'eG'e. . A01.2)
Доказательство. Если оператор Л* существует, то согласно
формуле A01.1) и принимая во внимание матричные записи типа F1.2),
(91.7), имеем
, (Ay, у) = (Ах)'е Geye = *; (Affi€) ye9
(х, А*у) = x'eGe {А*у)е - х'е {GeAt) Уе-
Правые части этих соотношений должны совпадать при всех векторах
*е> Уе> поэтому A'eGe — GeA*, откуда и вытекает первое равенство A01.2).
Аналогично,
(X, Ау) = x'eGe {Ау)е = К (GeAe) Уе>
(*лх, у) =
поэтому GeAe~ *AeGe, и мы получаем второе равенство A01.2).
Равенства A01.2) означают, что если сопряженные операторы су-*
ществуют, то они единственные. Примем теперь эти равенства как
форму задания правого и левого сопряженных операторов. Легко
непосредственно проверить, что построенные таким образом операторы
являются линейными и удовлетворяют соотношениям A01.1).
Следствие. Если эрмитова билинейная форма (х, у) — симметрии*
пая пли кососимметрцчная, то правый и левый сопряженные операторы
Совпадают.
Действительно, в этих случаях при любом базисе еи е2, ..., еп
выполняются равенства Ge=±G'e. В соответствии с A01.2) теперь
заключаем, что А* = *Ае.
Из этого следствия вытекает, что правый и левый сопряженные
операторы совпадают в унитарном пространстве. Но данный факт
можнй установить и другим способом. Если в унитарном пространстве
364 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. 12
взять ортонормированный базис еи е2, • • •, е«, то Для нег<> Ge = Е
и мы получаем хорошо известные равенства А* = *4е = А'е.
Сопряженные операторы связаны с оператором А определенными
соотношениями. Отметим некоторые из них, например, для правого
сопряженного:
A0U)
Для левого сопряжения соотношения аналогичны. Все соотношения
доказываются по одной и той же схеме на основе использования
представлений A01.2) для матриц сопряженных операторов. Поэтому
мы остановимся на доказательстве справедливости только последнего
свойства. Имеем
(Л*) = о;' {АХ1 (о:1) = б;1 {А^уое = (А;1)*.
Сравнивая формулы G5.4), A01.3), можно увидеть отсутствие в A01.3)
аналога первого соответствия G5.4). Теперь оно выглядит так:
(*Л)* = *(Л*) = А. A01.4)
Для доказательства его правильности снова обращаемся к представле-
представлениям A01.2) и получаем, что
б;1 (*Аеу Ge = g; 1 {g; vAfeGfey Ge = g; 'g^g^g^ Ae9
G.- v Ш G'e = G;1' (G^A'fiJ G'e = G^'G'.Afi^'G', = Aei
Т. е. соотношения A01.4) действительно справедливы.
Теорема 101.2. Если в невырожденном эрмитовом билинейно
метрическом пространстве оператор А имеет в некотором бизисе
матрицу J, то в правом (левом) двойственном базисе оператор А* (*А)
имеет матрицу J*.
Доказательство. Пусть оператор А имеет матрицу J в базисе
ей е2, ..., еп. Рассмотрим правый двойственный базис /ъ /2, ..,, /и.
Обозначим через Ge, Gf и Gef = Е матрицы билинейной формы (х9 у)
в соответствующих базисах. Если Р — матрица преобразования коор-
координат при переходе от первого базиса ко второму, то имеем
Ge = GefP~l=p- \ Gf = P'Gef = Р\
И далее, принимая во внимание F3.7), A01.2), получаем
А} = G}XASGS = GJ1{FZTJPfGf = G^GfJ'Gj1^ « J*.
Если же оператор А имеет матрицу / в базисе fu /2, ..., /„, то для
этого базиса левым двойственным будет базис еь- е2у ¦.., еп и теперь
§ 101] ОПЕРАТОРЫ И БИЛИНЕЙНЫЕ ФОРМЫ 365
находим
*Ле = G;vA'eGfe = G;v(PAfp-x)'Gre = G;lfGfJ'G;vG'e = J*.
Доказанная теорема имеет такое же значение при исследовании
сопряженных операторов в эрмитовых билинейно метрических прост-
пространствах, как и теорема 75.2 в унитарных пространствах. В частности,
из нее вытекает, что правый и левый сопряженные операторы Л* и *А
имеют одни и те же собственный значения, комплексно сопряженные
ло отношению к собственным значениям оператора А, что .правый
и левый сопряженные операторы Л* и *А имеют простую структуру,
если такую же структуру имеет оператор Л и т.д.
Кроме скалярного произведения (х, у) в эрмитовом билинейно
метрическом пространстве могут быть заданы и другие эрмитовы
билинейные формы. Рассмотрим, например, функции вида (Ах, у) и
(х, Ау\ где А — произвольный линейный оператор. Нетрудно убедиться,
что Э1$и функции являются эрмитовыми билинейными формами. При
этом разные операторы определяют разные формы в любом невы-
невырожденном пространстве Кп. Действительно, если А, В — разные опе-
операторы, то хотя бы при одном векторе х выполняется неравенство
АхФ,Вх, Предположим, что при всех уеКп справедливо равенство
{Ах, у) = (Вх, у). Отсюда следует, что ((А — В) х, у) = 0 при всех у е Кт
т. е. (А — B)xeLKn. Но в невырожденном пространстве подпространство
ХКН состоит только из нулевого вектора, поэтому Ах = Вх.
Теорема 101.3. В невырожденном эрмитовом билинейно метри-
метрическом ^пространстве Кп любая эрмитова билинейная форма ф (х, у)
может быть единственным образом представлена в виде
Ф (х, у) = (Ах, у) = (х, Ву\
где А, В — некоторые линейные операторы, действующие в Кп.
Доказательство. Выберем в пространстве Кп какой-либо базис
€и е2> • • • > ею и пусть Ge — матрица Грама в этом базисе, а Фе —
матрица формы ф(х,~у). Имеем
Ф(*, У) = <ФеУе = X^.G^Gj. = (О." ' '<ВД' Ge% =
Теперь матрицы Ае, Ве искомых операторов А, В определяются
равенствами
Ae = Gel'<!>'e, Be = G;^e. A01.5)
Единственность операторов А, В доказана раньше.
Сопряженный оператор определяется через скалярное произведение.
Поэтому, если в линейном пространстве вводить разные скалярные
произведения, то один и тот же линейный оператор будет иметь
разные сопряженные. Пусть в линейном пространстве наряду со ска-
скалярным произведением, задаваемым билинейной формой (х, у), вводятся
366 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. 12
и скалярные произведения, задаваемые формами (Мх, 'у), (х, My).
Пометим индексом *М внизу слева (справа) сопряженные операторы,
относящиеся к скалярному произведению (Мх, у) ((х, My)).
Теорема 101.4. Для любого оператора А и невырожденного опе-
оператора М имеют место соотношения '
МА* = (МАМ~*)*, *МА = М- * (*А) М,
А% = М" М*М, *АМ = *(МАМ~ % A0L6)
Доказательство. Выберем какой-либо базис еъ e2i . ¦., ею и
пусть Ge и Ме — матрицы соответственно билинейной формы (х, у)
и оператора М в этом базисе. Согласно A01.5) матрица билинейной
формы (Мх, у) равна M'eGe. Теперь в соответствии с A01.2) находим
j^Ag = (МеЬе) Ае (Me(je) = (je (Ме АеМе) \je =
уее = (млм~1)*.
~ м; * (g; ''AW) ме = м;1 (* Ае)
Полученные матричные равенства доказывают справедливость первой
группы операторных равенств A01.6). Вторая группа очевидным обра-
образом вытекает из первой, если принять во внимание равенство.
(х, My) = (*Mx, у) и соотношения A01.2).
В эрмитбвом билинейно метрическом пространстве рассматривают
различные типы операторов. Оператор А называется эрмитовым или
самосопряженным, если ддя любых х, уеКп
(Ах, у) = (х, Ау),
и косоэрмитовым или кососопряженным, если
{Ах, у) = - (х, Ау).
Отсюда соответственно следуют равенства
А - А* = *А, А= -Л* = -*А.
Оператор А называется изометричным, если для любых х, уеКп
(Ах, Ау) = (х, у).
Это приводит к равенствам
*АА = А* А:
В обыкновенном билинейно метрическом пространстве аналоги эр-'
митова и косоэрмитова операторов называются соответственно сим-
симметричным: и кососимметричным. В дальнейшем мы будем неодно-
неоднократно иметь дело с операторами, определяемыми равенством
•А* = olE + p^l A01.7)
для некоторых чисел а, р.
§ 102] БИЛИНЕЙНО МЕТРИЧЕСКИЙ ИЗОМОРФИЗМ 367
Далеко не все свойства операторов специального вида переносятся
из унитарного пространства в эрмитово билинейно метрическое
пространство, хотя некоторая общность имеет место. Мы не будем
останавливаться на исследовании всех этих вопросов.
Упражнения.
1. Как связаны между собой характеристические многочлены операторов
А, А*, *Л?
2. Пусть подпространство L инвариантно относительно оператора А.
Доказать, что подпространство L1 AL) инвариантно относительно оператора
А* (М).
3. Доказать, что любой собственный вектор оператора А, соответствующий
собственному значению X, ортогонален слева (справа) к любому собственному
вектору оператора-Л* (*А\ соответствующему собственному значению ц Ф X.
4. Доказать, что любой корневой вектор оператора А, соответствующий
собственному значению X, ортогонален слева (справа) к любому корневому
вектору оператора А* (*А\ соответствующему собственному значению ц Ф X.
5. Доказать, что собственные значения эрмитова (косоэрмитова) оператора,
соответствующие неизотропным собственным векторам, являются веществен-
вещественными ' (чисто мнимыми).
6. Доказать, что модули собственных значений изометричного оператора,
соответствующие неизотропным собственным векторам, равны единице.
7. Пусть в, невырожденном пространстве скалярное произведение эрмитово
симметрично. Доказать, что если оператор А эрмитов (косоэрмитов), то би-
билинейная форма (Ах, у) эрмитово симметрична (кососимметрична).
8. Пусть в невырожденном пространстве скалярное произведение эрмитово
симметрично. Доказать, что если билинейная форма (Ах, v) эрмитово сим-
симметрична (кососимметрична), то оператор А эрмитов (косоэрмитов).
9. Как меняются утверждения упражнений 7, 8, если скалярное произве-
произведение эрмитово кососимметрично?
10. Доказать, что если оператор А, удовлетворяющий условию A01.7),
имеет хотя бы два различных собственных значения, то | C1 = L
§ 102. Билинейно метрический изоморфизм
При исследовании евклидовых и* унитарных пространств было
показано, что с точностью до изоморфизма существует лишь по од-
одному пространству каждой размерности п. Для билинейно метрических
пространств дело обстоит сложнее.
Введем понятие изоморфизма. Будем говорить, что обыкновенные
или эрмитовы билинейно метрические пространства над одним и тем же
числовым полем изоморфны, если они изоморфны как линейные
пространства и при этом скалярные произведения пар соответствую-
1цих векторов равны друг другу.
Из этого определения вытекает, что в изоморфных пространствах
матрицы Грама систем соответствующих векторов совпадают. Верно
й обратное утверждение. Если в билинейно метрических пространствах
над общим числовым полем существуют такие базисы, в которых
матрицы Грама совпадают, то эти пространства изоморфны. Действи-
368 БИЛИНЕЙНО МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [Гл. 12
тельно, установив соответствие между базисами с равными матрицами
Грама, мы обеспечиваем совпадение скалярных произведений для
любых дар векторов из базисов и, следовательно, для любых пар
векторов.
Теорема 102.1. Обыкновенные (эрмитовы) билинейно метрические
пространства над одним и тем же числовым полем изоморфны тогда
и только тогда, когда матрицы Грама произвольных базисов из этих-
пространств конгруэнтны (эрмитово конгруэнтны).
Доказательство. Необходимость. Матрицы Грама всех
базисов одного пространства конгруэнтны, а на соответствующих
базисах разных пространств они совпадают. В силу транзитивности
отношения конгруэнтности, матрицы Грама для произвольных базисов
из изоморфных пространств будут конгруэнтны.
Достаточность. Если матрицы Грама для произвольных бази-
базисов билинейно метрических пространств конгруэнтны, то найдутся
базисы в разных пространствах, на которых матрицы Грама совпадают.
Но в этом случае пространства изоморфны.
Доказанная теорема говорит о том, что задача классификации
билинейно метрических пространств эквивалентна задаче классификации
билинейных форм с точностью до конгруэнтности. Рассмотрим
некоторые классы билинейно метрических пространств.
Вещественное билинейно метрическое пространство Кп называется
псевдоевклидовым, если скалярное произведение задано невырожденной
симметричной билинейной формой.
Для произвольного базиса псевдоевклидова пространства матрица
Грама — вещественная симметричная и, как мы знаем, конгруэнтна
диагональной матрице с элементами +1. Это означает, что в каждом
псевдоевклидовом пространстве существует базис, в котором скалярное
произведение (х, у) векторов х, у с координатами ?ь . .7, \п и г\и .. ¦, у\п
задается формулой
С точностью до изоморфизма псевдоевклидовы пространства опреде-
определяются двумя своими характеристиками: размерностью и сигнатурой,
положительным и отрицательным индексами и т. п. Среди псевдо-
псевдоевклидовых пространств особый интерес для физики представляет
четырехмерное пространство с положительным индексом, равным еди-
единице. Это так называемое пространство Минковского: Оно является
пространством событий специальной" теории относительности.
Вещественное билинейно метрическде пространство К„ называется
симплектическим, если скалярное произведение задано невырожденной
кососимметричной билинейной формой.
i Матрица Грама для любого симплектического пространства яв-
является кососимметричной и в силу этого конгруэнтна клеточно диа-
диатональной матрице с клетками вида [ I. Поэтому размерность
§ 102] БИЛИНЕЙНО МЕТРИЧЕСКИЙ ИЗОМОРФИЗМ 369
симплектического пространства всегда четная, и с точностью до изо-
изоморфизма существует лишь одно симплектическое пространство за-
заданной четной размерности. В татсом пространстве существует базис,
в котором скалярное произведение векторов х, у с координатами
§ь ..., 5„ и Г1Ь ..., цп имеет вид
(х, У) = ^Лг - ?2r|i + .... + 5,1-1 Ли - 5»Ли-1.
Комплексное билинейно метрическое пространство Кп называется
комплексным евклидовым, если скалярное произведение задано невы-
невырожденной симметричной билинейной формой.
Для любого базиса матрица Грама — комплексная симметричная
и конгруэнтна единичной матрице. С точностью до изоморфизма
существует только одно комплексное евклидово пространство каждой
размерности. В любом комплексном евклидовом пространстве су-
существует базис, в котором скалярное произведение векторов х, у таковр:
(*, у) = ^1Л1 + ^Л2 + . . . + ?„Лп-
Комплексное эрмитово билинейно метрическое пространство назы-
называется псевдоунитарным, если скалярное произведение задано невы-
невырожденной эрмитовой симметричной билинейной формой.
Матрица Грама для любого псевдоунитарного пространства явля-
является эрмитовой. Она эрмитово конгруэнтна вещественной диагональной
матрице с элементами +1. Поэтому всегда существует базис, в кото-
котором скалярное произведение векторов х, у имеет вид
(х, У) = 5ifli + • • • + 5.Л, - 5s+irb+i - ... - 5пЛИ5
где ?ь ..,, ^п и гц, ..., г\п — координаты векторов х, у. Снова с точ-
точностью до изоморфизма псевдоунитарное пространство однозначно
определяется двумя своими характеристиками: размерностью и сигна-
сигнатурой, положительным и отрицательным индексами и т. п.
Упражнения.
1. Доказать, что в изоморфных пространствах ортогональным (псевдо-
(псевдоортогональным, двойственным, псевдодвойственным) базисам соответствуют
ортогональные (псевдоортогональные, двойственные, псевдодвойственные) ба-
базисы.
2. Доказать, что в изоморфных пространствах невырожденным под-
подпространствам соответствуют невырожденные подпространства^
3. Доказать, что в изоморфных пространствах перпендикуляр и проекция
переходят соответственно в перпендикуляр и проекцию.
4. Доказать, что в изоморфных пространствах определители Грама соот-
соответствующих систем векторов равны.
В. В. Воеводин
ГЛАВА 13
БИЛИНЕЙНЫЕ ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ
ПРОЦЕССАХ
§ 103. Процессы ортогоналюации
Одним из важнейших понятий, связанных с любым билинешю
метрическим пространством, является понятие ортогональности. Мы
уже неоднократнр убеждались в том, какую важную роль играют
ортогональные системы векторов и в особенности ортогональные
базисы при изучении евклидовых и унитарных пространств. Не мень-
меньшую роль базисы с ортогональными векторами играют и в других
пространствах. Однако до сих пор большинство наших рассуждений
было связано с доказательством существования таких систем, но не
с процессами их построения. Некоторое исключение представляет
лишь общий метод преобразования матриц билинейных форм к кано-
каноническому виду и связанное с ним построение канонических базисов.
Ввиду важности ортогональных, псевдоортогональных и других ана-
аналогичных систем для конструирования самых различных вычислитель-
вычислительных алгорифмов рассмотрим сейчас общий процесс построения
подобных систем в билинейно метрическом пространстве.
Пусть в комплексном линейном пространстве Кп с помощью не-
некоторой невырожденной эрмитовой билинейной формы задано скаляр-
скалярное произведение (х, у). Рассмотрим базис el9 е2, ¦.., еп и попы-
попытаемся построить другой базис/ь/2, ...,/„5 обладающий следующими
двумя свойствами:
1) для любого fc>l линейные оболочки Lk векторов еи ..., ек и
fu --.,fk совпадают,
2) базис /ь ...,/„ — псевдоортогональный.
Предположим, что (еь ex) Ф 0 и положим f1 = ev Пусть уже построена
система псевдоортогональных векторов fu ..., /k, причем линейные
оболочки этих векторов и векторов еь ..., ек совпадают и (Д /f) Ф О
для 1 < i ^ к. Будем искать вектор /к+1в виде
где а1} к+ь ..., ик} к+ 1у — неизвестные коэффициенты. Условия орто-
ортогональности вектора /fc+1 слева к векторам /1? ..., fk дают для
определения > ах, к+ъ ..., akf k+1 систему линейных алгебраических
§ 103] ПРОЦЕССЫ ОРТОГОНАЛИЗАЦИИ 371
уравнений
<*l,*+l(/b/l) = "Ofc+b/l),
«1.1+1 (fu /2) + »2, *+1 (/2, /2) = - fe+ ь /2), (Ю3.2)
«i,k+1 (fu fk) + a2> k+! (/2, /*) + ... + afc>k+1 (/*> Л) = - («k+ь Л).
Матрица этой системы левая треугольная. По предположению ее
диагональные элементы отличны от нуля, поэтому система A03.2)
имеет единственное решение. Ясно, что так построенный вектор /fc+1
вместе с векторами /ь ..., fk образуют псевдоортогональную систему
и их линейная оболочка совпадает с Линейной оболочкой векторов
ви -••> ?fc+i. Система векторов/ь ...,/fe+1 линейно независима, ибо
линейно независимой является система /1? ...,/fc, е*^. /
. Продолжим процесс дальше. Если окажется, что для всех i будут
отличны от нуля величины (fh ft), то полученная система векторов
fu • • • 9 fn и будет искомым псевдоортогональным базисом. Конечно,
мы можем теперь нормировать, векторы /1? ...,/„ и получить псевдо-
ортонормированный базис.
Из формулы A03.1) вытекает одно полезное следствие. Перепишем
равенство A03.1) в виде
?fc+i =1 ~ L c
Вектор в круглых скобках принадлежит Lk9 вектор/fc+1 прийадлежит
1Lk по построению, поэтому решение систем A03.2) в действительности
дает разложение каждого вектора- ek+i на проекцию и левый перпен-
перпендикуляр по отношению к подпространству Lk.
Описанный процесс значительно упрощается, если скалярное про-
произведение задано эрмитовой симметричной билинейной формой. В этом
случае условия (fh fj) = 0 для j < i влекут за собой выполнение
условий (fb fj) = 0 для j Ф и Поэтому система A03.2) становится
системой с диагональной матрицей и мы имеем
(fbfi)
для всех i. Построенный базис /ь /2, ...,/„ будет не только псевдо-
псевдоортогональным, но и ортогональным.
Единственная причина, которая может помешать построению псев-
псевдоортогонального базиса/1? ...,./;, из базиса еи ..., ет— это обра-
обращение в нуль одного из скалярных произведений (fb fy, i < п. Такую
ситуацию будем называть вырожденной: Вырожденная ситуация заве-
заведомо не наступает, если квадратичная форма (х, х) не имеет изотроп-
изотропных векторов, например, если она является строго знакопостряндой.
13*
372 БИЛИНЕЙНЫЕ ФО*>МЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
Действительно, в этом случае равенство (fh /f) = 0 возможно только
при fi = 0. Но fi Ф 0 для всех i, так как векторы /ь ..., ft линейно
независимы. Следовательно, теперь процесс (Осуществим при любом
выборе базиса еи ..., еп. .
Во многих задачах не нужно сохранять связь нового базиса/ь ...,/„
с исходным базисом еъ ... 9 ею так как требуется построить лишь
какой-нибудь псевдоортогональный базис в пространстве. В этом
случае при каждом появлении равенства (fh /;) = 0 нужно заменить
вектор ei другим и снова вычислить вектор fh повторяя эту про-
процедуру до тех пор, пока не выполнится условие (fh ft) Ф 0. При этом
векторы/ь ...,/;_! не изменяются.
Необходимый для замены вектор et обязательно найдется. Пред-
Предположим, что при любом векторе et будет выполняться равенство
(/ь fd = 0. В силу ортогональности вектора ft слева к векторам
еи \., е(-1 это означает, что подпространство 1Цл1 состоит только
из изотропных векторов и нулевого вектора. Но подпространство
Ц-х —невырожденное, поэтому 1Li-l?=1Kn. Последнее равенство не-
невозможно при i — 1 < л, так как из-за невырожденности Кп под-
подпространство 1Кп состоит только из нулевого вектора.
Аналогичным способом можно построить и базис, псевдодвой-
псевдодвойственный для заданного. Пусть снова еъ е2, ..., еп — заданный базис
и нужно построить псев до двойственный для него базис, например,
левый. Возьмем еще один базис ql9 q2, ..., qn. Предположим, что
{Чъ ei) Ф 0 и положим tx — qv Допустим, что уже построена система
векторов tl9 ..., tk таких, что. их линейная оболочка совпадает
с линейной оболочкой векторов qu ..., qk и выполняются условия
(ti9 е()Ф0 для 1 ^ i < k и (ti9 ej) = 0 для j < i. Будем искать вектор
tk+i в виде к
tk+i = qk+1+ ? hk+Si, (ЮЗ.З)
где Pi,fe+i, ..., Pfe,fe+i —неизвестные коэффициенты. Условия ортого-
ортогональности вектора tk+l слева к векторам еи ..., ек снова дают для
определения Pi,fe+i, ..., Pfe,fc+i систему линейных алгебраических урав-
уравнений с левой треугольной матрицей:
A03.4)
i, ek).
Согласно предположению относительно диагональных элементов,
система имеет единственное решение. Если при продолжении процесса
окажется, что для всех i будут отличны от нуля величины (ti9 et), то
полученная система векторов после соответствующей нормировки будет
§ 103] ПРОЦЕССЫ ОРТОГОНАЛИЗАЦИИ 373
левым псевдодвойственным базисом для еи е2, ..., еп. Заметим, что
теперь процесс не упрощается, если скалярное произведение задано
симметричной билинейной формой. Использование вспомогательного
базиса qi, q2, ..., qn позволяет избегать вырождения процесса путем
замены в нужный момент одного из векторов qt и повторения
вычисления вектора tt. При этом снова векторы tu ..., t^^ не из-
изменяются.
Все описанные процессы' и аналогичные и^г, независимо от их
конкретного содержания, мы будем чаще всего называть в дальнейшем
процессами ортогонализации. Однако иногда нам придется в одном и том
же билинейно метрическом пространстве Кп строить последователь-
последовательности векторов, ортогональные или псевдоортогональные по отношению
к различным билинейным формам. Мы будем рассматривать лишь
билинейные формы вида (Ях, у\ где R — некоторый линейный
оператор в Ки. Чтобы отличить различные последовательнЬсти
друг от друга, будем говорить в этом случае о Д-ортогонализации,
R-псевдоортогонализации и т. п.
Многие свойства и особенности процессов ортогонализации можно
установить, рассматривая их матричные записи. Пусть скалярное про-
произведение в Кп задано эрмитовой билинейной формой (х, у). Псевдо-
Псевдоортогональность базиса / ь /2, ... j./;, означает, что (fh Jj) = O для j < f,
т. е. матрица Грама Gy билинейной формы (х, у) в базисе JuJi* •••>Уа
будет правой треугольной. Согласно процессу построения нового базиса
линейные оболочки векторов /ь ...,Jk и еь ..., ек' совпадают. Следо-
Следовательно, принимая во внимание A03. L), заключаем, что
?2=- oti, 2/1 +/2,- A03.5)
где &tf являются именно теми коэффициентами, которые вычисляются
из систем A03.2). Поэтому матрица А преобразования координат при
переходе от нового базиса /ь /2, ..., /„ к еи е2, ...., е„ является
правой треугольной с единичными диагональными элементами. Так
как матрица преобразования координат при переходе от старого базиса
к новому совпадает с Л, то имеем
Отсюда вытекает равенство
Ge = A'GjA. A03.6)
Легко проверить, что матрица G-A является правой треугольной
диагональные элементы которой совпадают с диагональными элементами
матрицы Gy.
374 БИЛИНЕЙНЫЕ ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
Обозначим через Eq (Fq) матрицу, столбцами которой являются
координаты векторов еи .,., ен (,/i, ...,/„) в базисе qi9 ..., qn. Соот-
Соотношения A03.5) показывают, что
при этом, конечно,
Gf = WV (Ю3.8)
Таким образом, рассмотренный процесс построения псе'вдоортого-
нального базиса оказывается тесно связанным с разложением матрицы
Грама на треугольные множители и с разложением A03.7) на мно-
множители матрицы координат.
Теорема 103.1. Для того чтобы процесс A03.1), A03.2) построен
пия псевдоортогопалыюго базиса fu /2, ...,/, из базиса еи е2, ..., еп
в невырожденном билинейно метрическом пространстве Кп был осу*
ществим, необходимо и достаточно, чтобы матрица Грама системы
еи е2, ..., еп имела ненулевые главные миноры.
Доказательство. Необходимость. Пусть процесс осу-
осуществим, т. е. имеет место соотношение A03.6). Матрица Gf — невы-
невырожденная, так как она является матрицей Грама невырожденной
билинейной формы (х, у) для базиса. Поэтому все ее диагональные
элементы отличны от нуля. Применяя формулу Бине — Коши, полу*
чаем, что
для всех г.'
Достаточность. Пусть главные миноры матрицы Грама Ge
отличны от нуля. Следовательно, в соответствии с (93.1) существует
разложение Ge = LeDeUe, где Le — левая треугольная матрица с единич-
единичными диагональными элементами, De — диагональная матрица с нену-
ненулевыми элементами, Ue — правая треугольная матрица с единичными
диагональными элементами. Легко видеть, что матрица
является левой треугольной, диагональные элементы которой совпадают
с диагональными элементами матрицы De. Если теперь в качестве
матрицы А взять правую треугольную матрицу Ve с единичными
диагональными элементами, то для базиса Jl9 J2, •••>./;, будут выпол-
выполняться соотношения A03.5). Именно этот базис и будет построен
согласно процессу A03.1), A03.2), в чем легко убедиться непосредствен-
непосредственной проверкой.
Если скалярное произведение задано симметричной эрмитовой
билинейной формой, то матрица Ge будет эрмитовой, так же как
и матрица Gf. Но отсюда следует, что матрица Gf будет диагональ-
диагональной. Этот факт мы уже ртмечали. Сравнивая (93.5), A03.6), заключаем,
§ 103] ПРОЦЕССЫ ОРГОГОНАЛЯЗАЦИИ 375
что процесс ортогонализации в данном случае по существу лолностью
совпадает с процессом лолучения разложения (93.5).
Если пространство Кп — унитарное, то процесс ортогонализации
определяет не только разложение матрицы Грама на треугольные
множители, но и разложение матрицы координат в произведение
унитарного и правого треугольного множителей. Действительно, вы-
выберем ортонормированный базис qu q2, ..., qa и обозначим через Dq
диагональную матрицу, составленную из длин столбцов матрицы Fq
из A03.7). Теперь имеем Eq = (FqD~l)(DqA). Матрица DqA - правая
треугольная. Но матрицы Gq и Gf (DJ — единичные. Согласно A03.8)
в данном случае (FqDq *)' (FqD ~*) = ?, т. е. матрица FqD~ l — унитарная.
Тот факт, что базис tl9 t2, ..., tn является левым псевдодвойствен*
ным для базиса еи еъ ...', ет означает, что для билинейной формы
(х, у\ определяющей скалярное произведение в Кю выполняются ус-
условия (th ej) = 0 для j < i и (th ei) = 1 для всех i. Другими словами,
это говорит о том, что для пары базисов еъ е2, ..., еп и tu t2i ..., tn
матрица Gte билинейной формы (х, у) является правой треугольной
с единичными диагональными элементами. Отсюда заключаем,- что
матрица Q преобразования координат при переходе от исходного
базиса ql9 q2, ..., qn к tu t2i ..., tn является правой треугольной.
Однако теперь диагональные элементы не будут равны единицам, так
как векторы tu гъ ,.., tn подвергались нормировке. Имеем
Gte~Q~VGq€,
и далее "
G
Процесс построения базиса, псевдодвойственного к заданному, также
оказывается тесно связанным с разложением (93.1) матрицы на Тре-
Треугольные множители.
Теорема 103.2. Для того чтобы процесс A03.3), A03.4) построения
базиса tl9 t2i ..., tm левого псевдодвопствеииого для el5 е2, .*., ет
исходя из базиса qu q2i ..*, qn, был осуществим, необходимо и
достаточно, чтобы матрица Gqe билинейной формы (х, у) имели
в базисах qu q2, ..., qn и еи еъ ..., еп ненулевые главные миноры.
Доказательство этой теоремы мы опускаем, так как оно является
почти дословным повторением доказательства предыдущей теоремы.
В заключение подчеркнем, что рассмотренные процессы ортогона-
ортогонализации полностью переносятся на обыкновенные билинейно метри-
метрические пространства. Меняются некоторые детали, связанные с комп-
комплексным сопряжением. Кроме этого, в данном случае более сложно
ликвидировать вырожденные ситуации.
Упражнения.
1. Какова геометрическая интерпретация процесса ортогонализашт? n
2. Доказать, что если процесс ортогонализацш применить к линейно
зависимой системе еи ег, ,.., ет toJI-Q для некоторого к < /?.
376 БИЛИНЕЙНЫЕ ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
3. Пусть квадратичная форма (х, х) не имеет изотропных векторов. Как
с помощью, процесса ортогонализации определить базу заданной системы
векторов ?
4. Доказать, что если процесс ортогонализации проводится в евклидовом
или унитарном пространстве, то для всех к выполняется неравенство | fk | ^ | ек |,
причем равенство достигается тогда и только тогда, когда вектор ек орто-
ортогонален векторам еи ..., ek-t.
5. Пусть координаты векторов еи ..., еп в некотором ортонормированном
базисе евклидова или унитарного пространства образуют треугольную мат-
матрицу. Как меняется матрица координат после выполнения процесса ортого-
ортогонализации?
6. Можно ли с помощью процесса ортогонализации построить двойствен-
двойственный базис?
7. Как применить процесс ортогонализации для получения правого
псевд о двойственного базиса?
8. Доказать, что разложение комплексной невырожденной матрицы в
произведение унитарной и правой треугольной единственное, если потре-
потребовать, чтобы диагональные элементы треугольной матрицы были положитель-
положительными.
9. Как применить процесс ортогонализации. для решения систем линейных
алгебраических уравнений?
10. Пусть пространство Кп — вырожденное. Как с помощью процесса ор-
ортогонализации построить псевдоортогональный базис невырбжденного под-
подпространства максимальной размерности?
11. Упрощается ли построение псевдоортогональных систем векторов
в вырожденном пространстве, если квадратичная форма (х, х) — знакопосто-
знакопостоянная?
§ 104. Ортогонализация степенной последовательности
В процессах ортогонализации матрица преобразования координат
при переходе от старого базиса к новому всегда является треуголь-
треугольной. Однако если исходный базис выбрать специальным образом,
можно получить существенно более простые представления для мат-
матрицы преобразования^координат и, следовательно, более простые про-
процессы ортогонализации.
Пусть в невырожденном эрмитовом билинейно метрическом про-
пространстве Кп задан некоторый оператор А. Возьмем ненулевой вектор х
и рассмотрим последовательность векторов
х, Ах, А2х, ..., Ак'хх. A04.1)
Будем называть такие последовательности степенными последователь-
последовательностями, порожденными вектором х.
* В любой степенной последовательности какое-то число первых
векторов является линейно независимым. Предположим, что к — наи-
наибольшее из таких чисел. Это означает, что существуют такие числа
оо, <хь ..., ос*, причем ocfc # 0, что
к = 0. A04.2)
§ 104] ОРТОГОНАЛИЗАЦИЯ СТЕПЕННОЙ ПОСЛЕДОВАТЕЛЬНОСТИ 377
Обозначим через (р(^) = оскХк + ... + а А + осо многочлен степени к. Ясно,
что равенство A04.2) эквивалентно равенству
= 0. A04.3)
Существует много многочленов, для которых выполняются соот-
соотношения типа A04.3). В частности, таким многочленом является
характеристический многочлен оператора А. Но среди них заведомо
есть многочлен наименьшей степени. Он называется Лишимальным
аннулирующим вектор л* многочленом. Ясно, что степень его равна
максимальному числу первых векторов степенной последовательности
A04.1), образующих линейно независимую систему, или, что то же
самое, на единицу меньше минимального числа первых векторов,
образующих линейно зависимую систему.
Степень минимального многочлена оказывается тесно связанной
с разложением вектора л* по корневому базису оператора А высотами
корневых векторов и числом попарно различных собственных значений.
Именно, справедлива
Лемма 104.1. Степень минимального аннулирующего вектор х
многочлена равна сумме максимальных высот корневых векторов опе-
оператора А, присутствующих в разложении вектора х по корневому
базису и соответствующих попарно различным собственным значениям.
Доказательство. Представим вектор х в виде суммы
х = иг +и2 + ...+и8, A04.4)
где мь ..., м8 принадлежат различным" циклическим подпространствам
оператора А. Так как различные циклические подпространства не
имеют общих векторов, кроме нулевого, то для выполнения равен-
равенства A04.3) необходимо и достаточно выполнение равенств <р (А) щ=0
для всех г. Если щ — корневой вектор высоты mt и соответствует
собственному значению Xi9 то равенство ф (А) и} = 0 будет иметь места
в том и только в том случае, когда многочлен ф(^) делится на
(X — XiY, где r^mt. В этом случае <p(A)uj = 0 не только при j = /,
но и при всех тех /, для которых векторы Uj соответствуют собствен-
собственным значениям, совпадающим с Xh и имеют высоты, не превосходя-
превосходящие г. Пусть Xil9 ..., Xt —попарно различные собственные значения,
соответствующие векторам ии ..., и8 из A04.4), mtl, ..., щ -макси-
-максимальные высоты корневых векторов ии ..., м8, соответствующих соб-
собственным значениям, совпадающим с Xit9 .... X: . Тогда
1 р
будет минимальным аннулирующим вектор х многочленом. Лемма
доказана.
Предположим, что векторы et = Л1~Ах для 1 ^ i ^ k линейно неза-
независимы. Применим к этой системе описанный ранее процесс для по-
получения псевдоортогональной системы векторов fh считая, конечно, что
378 БИЛИНЕЙНЫЕ ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
сам процесс осуществим. Если оператор А никак не связан с вве-
введенным в пространстве Кп скалярным . произведением, то трудно
надеяться на какое-то упрощение процесса. Однако ситуация резко
меняется, если оператор А удовлетворяет соотношению A01.7), напри-
например является самосопряженным в унитарном пространстве.
Теорема 104.1. Если оператор А удовлетворяет соотношению
A01.7), векторы е*х = А1~1Х линейно независимы для 1 ^ i < k и векторы
fu •••> fk получены из векторов еи ..., ек с помощью процесса
псевдоортогонализацищ то имеют место следующие соотношения
А = х,
Ti = 4fi-*ifi, A04.5)
fi+i = Afi - *ift - ft-i/i-i, i > h
где
„ ^ (Afi9 /i) (Ahfi-d f
UuJi) vi-uJi-i)
(ft-uft-i)(Afi,Jd-(AAft-i)(fi-ufd .^t " A04.6)
(//>( * l>
Доказательство для определенности проведем в эрмитовом би-
билинейно метрическом пространстве. Принимая во внимание вид век-
векторов et и согласно формулам A03.5), заключаем, что
j=o
для некоторых чисел yJti. Отсюда вытекает, что вектор /ц.х — А/(
принадлежит линейной оболочке векторов х, Ах> ..., А1х или, что то
же самое, векторов fl9f2, ..., Л Поэтому
fi+i=Aft+ itj.urfj
для некоторых чисел E/.f+i- Условия ортогональности "вектора fi+1
слева к векторам /ь /2, ..., /| дают для определения коэффициентов
?;,i+i систему линейных алгебраических уравнений
t/i» /2) тЬ 52.«+i (/a, /2) = - D/i, /2), -
A04.7)
(/1. ft-i) + • • • + &-1.1+1 </i-i* J5-i) - - (Afh ft-i),
{fu fd +. Л + b;M+1 W-ь Л + «u+i (Л Л - - (Д/t Л.
т
,ОРТОГ0НДЛИЗАЦИЯ СТ1ПЕИН0Й ПОСЛЕДОВАТЕЛЬНОСТИ
379
По условию теоремы оператор А удовлетворяет условию A01.7).
Поэтому, принимая во внимание псевдоортогональность системы век-
векторов jj9 имеем для /< i — 1
DГь fi) = (Л Л%) = (fh (olE + РA) ft) = ос (fh fd + Р (/„
- Р (fb /i+1 - I 5j. i+1./}) = P
I
E
0.
Среди правых частей системы A04.7) только две последние отличны
от нуля. Следовательно, только ?,i-ifi±i9 ^, *+i могут быть не равны
нулю, что и доказывает справедливость соотношений A04.5). Значение
для коэффициента ах находится из условия ортогональности вектора
/2 слева к /ь а значения, для коэффициентов af, Pf-i — из уеловия
ортогональности вектора fi+1. слева к векторам fh f^lt
Таким образом^ действительно процесс ортогонализации для сте-
степенной последовательности оказывается значительно проще, чем для
последовательности общего вида. Если на каком-либо шаге окажется,
что (Л fd = 0> ho'/j^O, то избежать вырождения процесса можно
с помощью выбора нового вектора х.
Предположим, что в степенной последовательности имеется п
линейно независимых векторов. Применяя процесс ортогонализации,
можно построить базис fl9 /2, ...,/, пространства Кп. Этот базис
знаменателен тем, что в нем матрица Af оператора А имеет трех-
диагональный вид
'«1 Pi n \
1 а2 р2 U
1 «з Рз
1 0L
/
A04.8)
В самом деле, столбцами матрицы оператора служат координаты
векторов Aft; Af2, ..., Afn относительно базиса fu f2, ..., /п. Но
согласно A04.5)
A04.9)
Если в степенной последовательности нет и линейно независимых
векторов, то, применяя процесс ортогонализации, мы получим, что
/г+1=0 при некотором г < п. Возьмем новый вектор и и образуем
380 БИЛИНЕЙНЫЕ ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
вектор
г
v = u- ? r\jfj9
J=l
определяя коэффициенты г|/ из условий ортогональности вектора v
слева к векторам/ь</2, ...,./,. Построим степенную последовательность,
порожденную вектором v. Легко показать, что каждый вектор этой
последовательности также ортогонален слева к векторам fu /2, ..., fr
Этим свойством по построению обладает вектор v. Предположим, что
мы доказали его для всех векторов v, Av, ..., Akv. Тогда, учитывая
соотношения A04.9) и равенство A01.7), для оператора А получаем
'= ос (А\ ft + р (Akv, pi-ifi-1+ а,/, + fi+ 0 = 0.
Применяя процесс ортогонализации к новой последовательности, мы
построим систему линейно независимых векторов qu q2, ..., qS9
псевдоортогональных между собой и в совокупности с векторами
/ь fi-> •••» /г- Еслиг r + s</7, продолжим процесс достройки базиса
до тех пор, пока не построим базис всего пространства. При этом
все пространство разобьется в прямую сумму инвариантных под-
подпространств, а матрица оператора А в таком базисе * будет иметь
клеточно диагональный вид с трехдиагональными клетками типа A04.8).
' Упражнения.
1. Доказать, что минимальный аннулирующий вектор х многочлен является
делителем характеристического многочлена. ^
2. Доказать, что минимальный аннулирующий вектор х многочлен един-
единственный с точностью до скалярного множителя.
3. Доказать, что если оператор А — эрмитов, а пространство Кп — унитар-
унитарное, то формулы A04.6) становятся такими:
* (Л Л '
\ (ft-x>fi-i) (ft-i,ft-i) (fi-ufi~i) '
4. Доказать, что в условиях упражнения 3 существует такая диагональная
матрица Д что для матрицы Af из A04.8) матрица D~lAfD будет вещественной
симметричной трехдиагональной.
5. Доказать, что при выполнении условия A01.7) матрицы билинейных
форм (Ах, у), (.V, Ау) в базисе/ь ...,/„ являются правыми почти треугольными.
6. Доказать, что в условиях упражнения 3 матрицы билинейных форм
(Ах, у), (х, Ау) в базисе /ь ...,/, являются эрмитовыми трехдиагональными.
7. Доказать, что если пространство Кп вырожденное, то с помощью
процессов A04.5), A04.6) можно построить псевдоортогональный базис невы-
невырожденного подпространства максимальной размерности.
§ 105] МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ 381
§ 105. Методы сопряженных направлений
Построение ортогональных, псевдоортогональных и т. п. систем
-векторов, особенно на основе использования степенных последователь-
последовательностей, дает большие возможности для создания различных численных
методов решения уравнений вида
Ах = Ь, A05.1)
где А — оператор, действующий в линейном пространстве Кю Ъ —
заданный, ах — искомый вектор.
Мы уже неоднократно касались различных аспектов этой задачи.
Теперь опишем большую группу численных методов решения урав-
уравнения A05.1), которые получили общее название методов сопряженных'
направлений. Все они основаны на процессах ортогонализации степен-
степенных последовательностей. Для простоты изложения предположим, что
оператор А — невырожденный и, следовательно* уравнение A05.1) всегда
имеет единственное решение. Будем считать, что пространство Кп —
комплексное и скалярное произведение в нем задано с помощью
симметричной положительно определенной эрмитовой билинейной
формы, т. е. Кп является унитарным пространством.
Возьмем любые невырожденные операторы С, В и пусть su ..., sn —
некоторая СЛВ-псевдоортогональная система векторов, т. е.
(CABs,, sd Ф 0, (CABsb sk) = 0, k < i,
для всех I Обозначим через х0 начальный вектор и пусть
и
х = х0 + В ? ctjSj,
.7=1
х, = х0 + в? cijsj, A05.2)
j=i
г i — Axi — b.
Тогда ji3 соотношений
х. = х.„,1 + яД9. (Ю5.3)
вытекает, что
Tt^r^+atABsi. A05.4)
Легко показать, что для выбранной С4?-псевдоортогональной
системы su ..., sn имеют место равенства
(Crh sk) = 0, 1 < к < I. (Ю5.5)
Действительно,
п
Г; = Ахь - Ъ = A (xt - х) = - ?
3§2 БИЛИНЕЙНЫ! ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
и далее
(Crh **)=- t ctj(CABsj, sk) = 0
j=i+X
для всех к < z.
Будем считать, что система векторов s1? ..., sw строится параллельно
с системой г0, ../, г,,.-! с помощью процесса ее СЛВ-псевдоортого-
нализации. Положим Si = г0 и для всех i будем иметь
s«+i=r,+ tfei+iV (Ю5.6)
Как всегда условия С4В-ортогональности вектора si+1 слева к векторам
5Ь ..., sf дают для определения коэффициентов pfc,i+i левую треуголь-
треугольную систему. В этом случае гк — линейная комбинация векторов
sl9 ..., sk+1. Следовательно, скалярное'произведение (Crh гк) — линейная
комбинация чисел (Crh st\ ..., (Crh sk+1) и оно равно нулю в соот-
соответствии с A05.5) для к < /, т. е.
(Crh rk) = 0, к < i. A05.7)
Это означает, что если (Crh rt) ф 0. для всех i9 то последователь-
последовательность векторов rt — С-псевдоортогональная. В /ьмерном линейном
пространстве С-псевдоортогональная система не может содержать
более п ненулевых- векторов. Поэтому на некотором шаге вычисли-
вычислительного процесса одна из невязок станет нулевой и мы получим
точное решение уравнения A05.1).
Для реализации процесса нам необходимо определять коэффициенты
д? из A05.2) и коэффициенты Ckj?+i из A05.6). Коэффициенты щ всегда
находятся очень просто. Согласно A05.4), A05.5), A05.7) имеем
(Сг,-Ь г,-0 (Crt.u sd
Oi - - (CABS* r^) - - (CABshsy
В общем случае коэффициенты pftjl-+i вычисляются значительно
сложнее. Однако если операторы А, В, С свйзаны между собой соот-
соотношением
)* «= VE-+ рЛБ A05.9)
для некоторых чисел а, р, то среди всех коэффициентов Рк>1-+1 только
Pu+i может быть отличен от нуля. Пусть
Si+i^ri + biSi. A05.10)
Коэффициент bt однозначно определяется из условия С4?-ортогональ-
ности вектора si+l слева к вектору sh что с учетом A05.9), A05.10)
дает
(CABrh Si) ft (Crh ABsd
8 105J МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ 383
Предположим, что вычисляя последовательность векторов st со-
согласно формулам A05.10), A05.11), мы показали, что последователь-
последовательность su ..., Si образует САВ-псевдоортогональную систему. Это
заведомо верно при i = 2. Принимая во внимание A05.9), для к < i
из A05.4)—A05.7) получаем, что
(CABsi+1, sk) = (CABrb sk) + bt(CABsb sk) = ((СABC-1) Crh sk) =
= (Crh (CABC-1)* sk) = (Crh (a? + рлB) sk) = a (Crh sk) + P {Crh ABsk) =
= p(crh -1 (rk ^rk^))=4- {{Crb rk) - (Crh rk^)} = 0.
\ ' ak J Як
Таким образом, при выполнении соотношения A05.9) решение опе-
операторного уравнения A05.1) может осуществляться по следующему
предписанию
r + bs
Здесь х0 — произвольный начальный вектор, коэффициенты аь Ь{ вы-
вычисляются согласно A05.8)> A05.11). Если обозначить щ = Bsi9 то процесс
будет таким:
«1 = Вг0,
xt = x^t + арь
при этом
(OVl, ri.1)= (Б-
(САщ, г,.!) (Б-
__ (B~l*CABrb щ) _-R (Crh Аид
Э^ги процессы и называются методами сопряженных направлений.
Из формул A05.4), A05.10) заключаем, что векторы гь si+i явля-
являются линейными комбинациями векторов одной и той же степенной
последовательности
г0, АВг09 ..„ {АВIг0. A05.13)
Более того, они получены из нее с помощью соответственно С- и
СЛВ-псевдоортогонализации. Из этого факта вытекают исключительно
р^жные следствия,
384 БИЛИНЕЙНЫЕ ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
Если в разложении вектора г0 по каноническому базису Жордана
оператора АВ присутствуют не. все составляющие, то обращение
невязки в нуль произойдет раньше, чем на %и-ом шаге. Процесс
оканчивается особенно быстро, если оператор АВ имеет простую
структуру и большое число совпадающих собственных значений.
Именно, если в разложении вектора г0 по собственным векторам
матрицы АВ ненулевые составляющие соответствуют т попарно раз-
различным собственным значениям, то гт = 0.
Согласно теореме 104.1 для векторов sh rt должны иметь место
трехчленные соотношения типа A04.5). Их можно получить непосред-
непосредственно из A05.4), A05.10). Именно,
si+1 = diABsi + A + bt) st - V ^_л, i > 1,
Отсюда можно получить и другие соотношения. Например, такое:
х? - Xi_i),
где (oi+u oil — подходящим образом выбранные числа.
В связи со сказанным относительно последовательности A05.13)
обратим внимание на следующую особенность условия A05.9). На пер-
первый взгляд, оно отличается • от условий типа A01.7). Однако если
принять во внимание A01.6), то легко показать, что условие A05.9)
в действительности также является условием типа A01.7), причем
одновременно по отношению к двум скалярным произведениям
(САВх, у) и (Сх, у). В самом деле, заметим, что сопряженный опе-
оператор в A05.9) связан с основным скалярным произведением унитар-
унитарного пространства, тогда как ортогональность векторов sh rt обеспе-
обеспечивается соответственно по отношению к скалярным произведениям
{САВх, у) и (Сх, у). Поэтому
cab{ABY = (CAB - АВ • (CAB)'х)* = (СЛВСх)* = а? + рЛВ,
С(АВ)* = (С ABC'1)* = aE + $АВ.
Реализации методов сопряженных направлений может помешать
лишь обращение в нуль одного из скалярных произведений (CABsh sf)
или (Сг(-и г?_!) "раньше, чем обратится - в нуль невязка. Если
(CABsh st) = 0, то нельзя вычислить коэффициенты ah bv Если же
(Сгх-Ъ rf_!) = 0, то это приведет к нулевому коэффициенту а{ и сов-
совпадению ненулевых невязок rt-u rt и, как следствие, к выполнению
равенства (CABsi+u si+1) = 0. Избежать подобной ситуации можно
путем выбора нового начального вектора х0. В случае положительной
определенности операторов CAB и С указанные вырождения невоз-
невозможны и вычислительный процесс протекает без осложнений. Если
оператор CAB положительно определен, то методы сопряженных
направлений приобретают дополнительно новые интересные свойства.
§ 105] МЕТОДЫ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ 385
О степени близости вектора z к решению уравнения A05.1) можно
судить по малости квадрата какой-либо нормы разности е = х — z.
Для этой цели удобно использовать так называемые обобщенные
функционалы ошибок вида (Re, e\ где R — любой положительно опре-
определенный оператор, например оператор В С А. Данный оператор
будет положительно определенным, так как он связан с оператором
CAB соотношением В* С А = В* (CAB) В. Справедлива
Теорема 105.1. Если оператор CAB положительно определен, то
среди всех векторов вида z = х0 + Bs9 где s принадлежит линейной
оболочке векторов s±, ..., si9 вектор xt дает минимум обобщенного
функционала ошибок ^ ^ (fi_
Доказательство. Так как оператор CAB положительно опре-
определен, то система векторов st будет САВ-ортогональной. Представим
вектор z в виде разложения, 'аналогичного разложению A05.2) для
вектора х: t
z = х0 + В ?
Имеем
9(z) = (B-1%*CA(x-2), x-z) =
l b( t аЛ- ?
'ajsj- ?
sj, sj)+ t \aj\2(CABsJ9Sj).
Отсюда заключаем, что минимум функционала ошибок достигается
при hj = а-р j < U т. е. при z = х{.
Функционал ошибок нельзя вычислять при практических расчетах,
так как он зависит от решения х, которое неизвестно. Однако этот
функционал лишь постоянным слагаемым отличается от другого
функционала: ^^ = {в-^САх> =).Же{в-г*СЬ, z),
который уже можно вычислять. Действительно,
) - (B'^CAz, x) + {B'^CAz, z) =
:) — (^*C/?, z) + (В-1*СЬ, .v) ~
= x|,(zL.E-i*C/?, x).
Отметим, наконец, некоторые классы операторов, для которых ус-
условие A05.9) выполняется.
386 БИЛИНЕЙНЫЕ ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
1. Все операторы А, В, С эрмитовы, при этом В — С. Условие A05.9)
справедливо при а = 0, р = 1:
(САВС~х)* = {В А)* = Л*Б* = 0 • Е + 1 • АВ.
2. Эрмитовыми являются операторы CAB и С. Условие A05.9)
снова справедливо при а = О, Р = 1:
(С4БСГ1)* = С* (CAB)* = С'1 CAB = 0 Е + 1 АВ.
3. Оператор С перестановочен с АВ, оператор АВ — нормальный
и его спектр лежит на прямой линии. Последнее условие означает,
что АВ = уЕ -t- 5Я для некоторого эрмитова оператора Н. Теперь
находим
(САВС~1)* = (СС'АВТ = (АВ)* = (уЕ + 5Я)* =
4. Представим оператор А в виде Л = М + N, где М = М*, /V =
= — iV** Если оператор М — невырожденный, то положим В = С = М.
Условие A05.9) выполняется при а = 2, р = — 1:
(САВСГ1)* = (M"i (М + iV))* = (М - iV) M =
= 2Е - (М + ^М = 2-Е - 1 • АВ.
5. Если в разложении А = М + N невырожденным является опера-
оператор N, то положим В = С = АГ. Условие A05.9) выполняется при
а = 2,р=-1:
(СЛБС~х)* = (АГх (М + АО)* = -- (М - АО AT"x =
= 2? - (Л/ + АО АГ1 ='2 • ? - 1 • АВ.
Упражнения.
1. Доказать, что матрица билинейной формы (САВх, у) является:
правой треугольной в базисе si? ..., sni
правой почти треугольной в базисе г0, ..., »•„_!,
левой треугольной в базисах su ..., sn и г0, ..., г„_ь если оператор с
эрмитов.
2. Как меняется вид матрицы билинейной формы (САВх, у) в упражнении 1,
если оператор CAB эрмитов?
3. Доказать, что матрица билинейной формы (Сх, у) является г
правой треугольной в базисе г0, ..., г„_ь
правой треугольной в базисах г0, ..., »•„_! и sl9 ..., sn,
правой треугольной в базисах ABsu ..., ABsn и sl9 ..., sm
правой почти треугольной в базисах АВг0, ..., ABr,,-! и г0, ..., rn_t.
4. Как меняется вид матрицы билинейной формы (Сх, у) в упражнении 3,
если оператор С эрмитов?
5. Доказать, что если условие A05.9) заменить на следующее:
(CABQ-!)* = ао? + ихАВ + ... +
§ 1061 ОСНОВНЫЕ ВАРИАНТЫ 387
то соотношение A05.10) будет таким:
Sl+i = Г» + btSt + fcf-iSi-i + .. . + fy-p+iSj-jp+jL.
6. Доказать, что {Сг^ ^
* (CABsb sd '
7. Доказать, что если операторы CAB и С эрмитовы, то
8. Доказать, что если операторы С4В и С — эрмитовы и положительно
определенные, то at < 0, bf > 0 для всех /.
9. Доказать, что матрица оператора АВ в базисе из векторов sx, ..., sB
или г0, ..., гп-1 имеет трехдиагональный вид.
10. Как протекают методы сопряженных направлений в случае вырожден-
вырожденности оператора А!
§ 106. Основные варианты
Рассмотрим наиболее известные варианты методов сопряженных
направлений. В теоретическом плане все они укладываются в описан^
ную выше схему A05.12). Однако практические вычисления иногда
осуществляются по несколько отличным от нее алгорифмам.
Метод сопряженных градиентов. В этом методе оператор А — эр-
эрмитов положительно определенный, В = С = Е, условие A05.9) выпол^
няется при а = 0, Р = 1. Положительная определенность операторов
CAB = А я С — Е гарантирует отсутствие вырождений в вычислитель-
вычислительном процессе. На каждом шаге метода минимизируется функционал
ошибок с матрицей А. Вычислительная схема метода имеет вид
где
(?уь Г1-х}__ ОУь 5Д fa, Ast) (rh rt)
(Asb ri-x) (Asi9 sd (Ash st) fa_l5 r^J
В методе сопряженных градиентов векторы rf образуют ортогональную
систему, векторы st — А-ортогональную.
Метод ^4Л*-минимальных итерации. В этом методе оператор А —
произвольный невырожденный, В — А*, С = ?, условие A05.9) выпол-
выполняется при а = 0, р = 1. Положительная определенность операторов
CAB = АА* и С = Е гарантирует отсутствие вырождений в вычисли-
вычислительном процессе. На каждом шаге метода минимизируется функцио-
функционал ошибок с матрицей ?, т. е. квадрат евклидовой нормы самой
388 билинейные формы в Вычислительных процессах [Гл. 13
ошибки. Вычислительная схема метода имеет вид
щ = А*г0,
ri = ri-1 +atAuh
= xi-1 +а(щ,
(Auh r,_!) (и,, ц)
В методе уЫ*-минимальных итераций векторы г( и щ образуют
ортогональные системы.
Метод А*А-минимальных итераций. В этом методе опера?op A —
произвольный невырожденный, В = А*, С = АА*, условие A05.9) выпол-
выполняется при а = 0, C = 1. Положительная определенность операторов
CAB = (АА*J и С = АА* гарантирует отсутствие вырождений в вы-
вычислительном процессе*. На каждом шаге метода минимизируется
функционал ошибок с матрицей А*А, т. е. квадрат евклидовой нормы
вектора невязки. Вычислительная схема метода имеет вид
щ = А*г0,
где ' »л
1) , (А*г„А*гд
< ° *?
fli" (Ащ, Лид < °' *?-И*г,-
В методе А*А-минимальных итераций векторы A*rt и Амс образуют
ортогональные системы.
Метод полного эрмитова разложения. В этом методе оператор
А — произвольный невырожденный. Представим его в виде суммы
А = М + N, где М = М*, N= — N*. В случае невырожденности опе-
оператора М или N положим соответственно В = С = М или Б = С =
= iV. Условие A05.9) выполняется при а = 2, C= — 1. Если опера-
оператор М (или iN) является знакопостоянным, процесс протекает без
вырождения. Пусть, например, М>0 и В = С = М Оператор С
будет положительно определенным, и поэтому (Cz, z) = (M~1z, z) > 0
для любого ненулевого вектора z. Рассмотрим теперь оператор
CAB = М~1 + М~хJVM"х. Для любого z # 0 .
(CABz, z) = (М, z) + (Af-^M-1z, z) ^ 0,
§ Юб] ОСНОВНЫЕ ВАРИАНТЫ 389
так как первое скалярное произведение в правой части равенства —
вещественное и в силу положительной определенности оператора по-
положительное, второе скалярное произведение — чисто мнимое в силу
косоэрмитовостй оператора M~1NM~1. Для случая В = С = М вы-
вычислительная схема метода имеет вид
= г0,
Mvt = rh
(vh Аид
[Аиьид9
Если В~С = JV~\ то вычислительная схема и формулы для коэффи-
коэффициентов ah bt остаются такими же, кроме замены, конечно, М на N.
Метод неполного эрмитова разложения. В этом методе оператор А —
эрмитов положительно определенный. Представим его в виде суммы
А — М + N, где М = М*, iV = iV*. Если М — невырожденный, то поло-
положим В = С = М". Условие A05.9) выполняется при а = 0, |3 = 1. Если
оператор М — положительно определенный, процесс протекает без
вырождения. На каждом шаге метода минимизируется функционал
ошибок с матрицей А. Вычислительная схема' остается такой же, как
в случае метода полного разложения.
Ускорение вычислительного процесса. Как мы уже отмечали, методы
сопряженных направлений позволяют определять решение особенно
быстро, если оператор АВ имеет мало попарно различных собственных
значений. На использовании этой особенности построены различные
приемы ускорения процесса решения уравнения A05.1), в основе кото-
которых лежит следующая идея.
Предположим, что оператор А можно представить в виде суммы
А — М + N, где оператор М определяет «главную» часть оператора А
и при этом допускает простое решение уравнений типа A05.1) с опе-
оператором М в левой части. Теперь вместо уравнения A05.1) будем
решать уравнение
1)y = b, A06.1)
где Мх •= у. Если в каком-либо разумном смысле оператор М близок
к оператору А, то большинство собственных значений оператора N
и, следовательно, оператора NM будут близки к нулю или равны
нулю. Применение методов сопряженных направлений к уравнению
A06.1) в данном случае приводит к быстрому нахождению решения.
Заметим, что именно эта идея лежит в основе создания метода
неполного эрмитова разложения, который во многих случаях оказы-
390 БИЛИНЕЙНЫЕ ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
вается более эффективным, чем метод сопряженных градиентов в клас-
классическом варианте. Все зависит от того, насколько удачно осуществлено
разложение оператора А.
Мы не будем подробно останавливаться на вычислительных схемах
процессов ускорения, так как они слишком сильно зависят от исполь-
использования тех или иных частных особенностей оператора А.
Упражнения.
1. В каких условиях целесообразно применять тот или иной вариант
метода сопряженных направлений?
2. Какое число итераций требуется выполнить при реализации различных
вариантов методов сопряженных направлений для оператора А вида Е -Ь Я,
где оператор R имеет ранг г?
3. Считая оператор А матрицей, оценить количество арифметических
операций, которые необходимо выполнить при решении систем линейных
алгебраических уравнений методами сопряженных направлений.
4 Матрица оператора А — эрмитова и отличается от трехдиагональной
небольшим числом своих элементов.. Какой из вариантов методов" сопряжен-
сопряженных направлений целесообразно применять в этом случае?
5. Пусть PQ (t\ Pi(t), ... — некоторая последовательность многочленов.
Выберем вектор х0 и построим последовательность векторов х0> хи ...,.согласно
правилу
хк+! = хк - ВРк{АВ) {Ахк - Ъ\ к^ 0. A06.2)
Как меняются разложения невязок г0, гъ ... по каноническому базису
Жордана оператора АВ с .ростом к в зависимости от выбора последователь-
последовательности многочленов?
6. Как использовать последовательность A06.2) с целью построения
начального вектора для методов сопряженных направлений, обеспечивающего
получение решения за меньшее количество итераций?
7. Какие из систем векторов в каждом из конкретных вариантов методов
сопряженных направлений являются с точностью до нормировки Л-псевдо-
двойственными?
§ 107. Операторные уравнения и псевдодвойственность
Методы сопряженных направлений являются не единственными
методами решения операторного уравнения
Ах = Ь, A07.1)
основанными на использовании билинейных форм. Огромные возмож-
возможности для создания методов дает построение систем векторов, двой-
двойственных или псевдодвойственных по отношению к некоторой би-
билинейной форме, связанной с оператором А уравнения A07.1).
Снова будем считать, что оператор А — невырожденный и действует
в унитарном пространстве Кп. Рассмотрим билинейную форму^(Лх, у)
и предположим, что для нее каким-либо способом получены Л-псевдо-
двойственные с точностью до нормировки системы векторов ии
§ 107J ОПЕРАТОРНЫЕ УРАВНЕНИЯ И ПСЕВДОДВОЙСТВЕННОСТЬ 391
и2, . • •, ип и vu v2, .. •, vm т. е.
(Ащ, vt) ф О, (Ли,, vk) = О, fc < /, A07.2)
для всех г < п. Покажем, что знание Л-псевдодвойственных систем
векторов позволяет построить процесс нахождения решения уравне-
уравнения A07.1).
Выберем произвольный вектор х0. Так как А-псевдодвойственные
системы — линейно независимые, то существует разложение
п
* = Х0 + ? п&У AО7-3)
Если t
то аналогично A05.3), A05.4) имеем
х, - х?-i + а^,, . г, = rf, i + O{Att|. A07.4)
Далее
rf = Axt - Ь =
и в соответствии со вторыми условиями A07.2) находим, что
для всех к < I Итак,
%) в 0 (io7 5)
при & < /. Это позволяет определить коэффициенты аь из A07.4).
Именно,
*.= -i^f. A07,6)
Согласно первым условиям A07.2) знаменатель в правой части A07.6)
отличен от нуля.
Из A07.5) следует, что вектор гп будет ортогонален слева, а в силу
симметрии скалярного произведения просто ортогонален линейно не-
независимым векторам vl9 v29 .. •, vm т. е. гп = 0 и вектор хп является
решением уравнения A07.1).
Описанные методы решения уравнения A07.1) носят общее название
методов двойственных направлений. Число различных методов беско-
бесконечно в полном смысле этого слова, так как существует бесконечное
число различных Л-псевдодвойственных пар систем векторов. Рассмот-
Рассмотренные ранее методы сопряженных направлений, очевидно, входят
в эту группу.
392 БИЛИНЕЙНЫЕ ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
Для методов двойственных направлений не существует в общем
случае какого-либо аналога теоремы 105.1 даже при положительно
определенном операторе А. Поведение ошибок ек — х — хк в этих
методах описывает лишь слабая, но все же полезная
Теорема 107.1. Пусть Рк — оператор проектирования на под-
подпространство, натянутое на векторы ии ..., щ параллельно под-
подпространству, натянутому на векторы щ+х, ..., ип. Тогда
ek = (E-Pk)e0. ' A07.7)
Доказательство. Согласно формуле A07.3) имеем следующее
разложение для ошибки е0 начального вектора х0:
п
ео = х-хо= ? ajuj.
j=i
Но по определению оператора проектирования
к
Рке0 = X
Правая часть этого равенства есть не что иное, как хк — х0. Поэтому
Рк^о = хк-х0 = (х- х0) -{х- хк) = е0- еь
что и доказывает утверждение теоремы.
i Интересные результаты, связанные с Л-псевдодвойственными систе-
системами, можно получить, рассматривая матричную трактовку описанных
методов.
Будем считать, что пространство К„ — не только унитарное, но и
арифметическое, что допустимо в' силу изоморфизма конечномерных
линейных пространств. Все проведенные рассуждения остаются в силе,
меняется лишь терминология: уравнение A07.1) становится системой
линейных алгебраических уравнений, операторы заменяются матрицами,
а под векторами понимаются векторы — столбцы. Обозначим через U
(V) матрицу, столбцами которой являются векторы ul9..., ип (иь ..., 1>п).
Тогда тот факт, что эти векторы удовлетворяют соотношениям A07.2),,
означает, что матрица
С = V*AU
является невырожденной левой треугольной. Отсюда вытекает такое
разложение матрицы А на множители:
Л= \г\Лси~\ A07.8)
Итак, знание Л-псевдодвойственных с точностью до нормировки
систем векторов позволяет решить систему линейных алгебраических
уравнений A07.1) с оценками ошибок A07.7) и получить разложение
A07.8) матрицы А на множители, среди которых есть один треугольный.
Покажем, что справедливо и обратное утверждение. Именно, любой
§ 107] ОПЕРАТОРНЫЕ УРАВНЕНИЯ И ПСЕВДОДВОЙСТВЕННОСТЬ 393
метод решения систем линейных алгебраических уравнений, основанный
на разложении матрицы на множители, среди которых есть хотя бы
один треугольный, определяет некоторые А-псевдодвойственные с точ-
точностью до нормировки системы векторов. Следовательно, реализуя
такие методы по схемам A07.3)—A07.6), можно пользоваться оцен-
оценками A07.7).
Рассмотрим матрицу Р, которая получается из единичной путем
перестановки ее столбцов, или что то же самое, строк в обратном
порядке. Легко проверить, что умножение произвольной матрицы С
справа на Р переставляет в матрице С столбцы в обратном порядке,
умножение матрицы СР слева на Р переставляет в матрице СР строки
в обратном порядке. Поэтому элементы /у матрицы F = РСР связаны
с элементами ctj матрицы С соотношением
Отсюда можно получить ряд полезных следствий. Будем нумеро-
нумеровать диагонали матрицы, параллельные главной, подряд снизу вверх
числами - (п - 1), - (п - 2), ..., 0, ..., (п - 2), (п - 1). При этом диа-
диагональ с нулевым номером является главной. В такой нумерации
элементы /с-й диагонали определяются соотношением j — i — /с. Если
матрица С удовлетворяет условиям
со = 0, k<j-U j-i<U
при некоторых числах i < к, то для матрицы F = РСР будут выпол-
выполняться равенства
Следовательно, при преобразовании F — РСР диагональная матрица
остается диагональной, правая (левая) треугольная станет левой
(правой) треугольной, правая (левая) двухдиагональная — левой (правой)
двухдиагональной и т. п.
Предположим теперь, что реализуется некоторый метод решения
системы линейных алгебраических уравнений A07.1), основанный на
предварительном разложении матрицы А на множители:
А = QCR, A07.9)
где матрица С — треугольная. Не ограничивая существенно общности,
можно считать, что С — левая треугольная, так как в противном
случае вместо разложения A07.9) мы бы рассматривали разложение
A = (QP)(PCP)(PR\
где матрица РСР согласно сказанному выше должна быть левой
треугольной. Искомые матрицы U, V, определяющие А-псевдодвой-
ственные с точностью до нормировки системы векторов ии ..., ип
394 БИЛИНЕЙНЫЕ ФОРМЫ В ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССАХ [Гл. 13
й vu ..., vn; могут быть заданы равенствами
U = R~\ V=Q~1*.
Заметим, что в разложении A07.9), порождаемом каким-либо числен-
численным методом, матрицы Q и R, как правило, достаточно простые. Это
чаще всего унитарные или треугольные матрицы, а также матрицы,
отличающиеся от треугольных перестановкой строк и столбцов.
Поэтому матрицы Д и Q~1* находятся без особых трудностей.
Во всяком случае, общие вычислительные затраты на их нахождение
значительно меньше, чем на получение разложения A07.9). Таким
свойством обладают широко известные методы Гаусса, квадратных
корней, Жордана, ортогонализации, отражений, вращений; методы,
основанные на приведении системы к двухдиагональному виду и на
получении нормализованных разложений; методы сопряженных направ-
направлений и т. д.
Таким образом, большинство существующих численных методов
решения операторных уравнений A07.1) в конечномерном пространстве
в действительности являются методами построения к-псевдодвойствен-
ных систем векторов. Несмотря на разнообразие конкретных форм
самих методов, все они могут быть исследованы с общих позиций
на основе теоремы 107.1.
Упражнения.
1. Будем считать оператор матрицей, а векторы пространства — векторами-
столбцами. Доказать, что в методах двойственных направлений последователь-
последовательные ошибки связаны друг с другом соотношением
где
# (Ю710)
2. Доказать, что операторы Sk удовлетворяют равенствам
3. Доказать, что операторы Sk из A07.10) и оператор Рк из A07.7) связаны
между собой соотношением
4. Что означают операторы Sk и Рл для конкретных методов, определя-
определяемых разложением A07.9)?
5. Как меняются ошибки ек для конкретных методов, определяемых
разложением A07.9)? ~~
6. Какой из известных методов решения систем линейных алгебраических
уравнений не основан на разложении (Ш7.9)?
ЗАКЛЮЧЕНИЕ
В представленном читателю учебном пособии изложен достаточно
обширный материал, необходимый для понимания как теоретических
основ линейной алгебры, так и ее численных методов. Однако в силу
особенностей отдельных учебных программ и ограниченности отведен-
отведенных под этот курс числа лекционных часов не все разделы данной книги
могут оказаться в поле внимания читателя. Поэтому мы остановимся
коротко на общей характеристике всего представленного материала.
Линейная алгебра как, наука изучает множества специальной струк-
структуры и действующие на них функции. Вообще говоря, аналогичные
задачи стоят и перед другими областями математики, например,
математическим анализом. Характерная особенность именно линейной
алгебры состоит в том, что множества всегда являются конечномер-
конечномерными линейными пространствами, а функции — линейными операторами.
Изучению общих свойств линейных пространств посвящены §§ 10,
13 — 21, общих свойств .линейных операторов— §§ 56 — 61, 63 — 74. Све-
Сведения, изложенные в этих параграфах, можно получать различными
способами, в том числе непосредственно без привлечения каких-либо
понятий и инструментов исследования, кроме самых элементарных.
Но об одном из дополнительных понятий все же стоит сказать
несколько слов. Это — определитель.
Как числовая, функция, заданная на системах векторов, опреде-
определитель является относительно простым объектом. Тем не менее, он
обладает многими важными свойствами. Эти свойства сделали его
широко используемым инструментом, существенно облегчающимпрове-
дение различных исследований. К тому же определитель весьма часто
применяется при построении численных, методов. Все это заставило нас
уделить понятию определителя достаточно много внимания, рассмотрев
в §§ 34—42, 62 его геометрические и алгебраические свойства. Как
инструмент исследования определитель используется в данной книге при
доказательстве самых различных утверждений.
Другая числовая функция двух векторных аргументов — скалярное
произведение — определяет два важнейших класса линейных пространств,
называемых евклидовыми и унитарными. Основным новым понятием
в этих пространствах является понятие ортогональности. В §§ 27—33
изучаются дополнительные до отношению к скалярному произведению
свойства линейных пространств, а в §§ 75 —81 — дополнительные по
отношению к скалярному произведению свойства линейных операторов.
Системы линейных алгебраических уравнений имеют исключительное
значение во всей математике, а не только в линейной алгебре, Ис-
Исследованию различных их аспектов посвящены §§ 22, 45, 46, 48.
Как правило, лишь перечисленный материал составляет основу
курса линейной алгебры, к которому в качестве отдельного добавляется
курс аналитической геометрии. В настоящем учебном пособии необ-
необходимые сведения из аналитической геометрии даны не изолированно,
396 ЗАКЛЮЧЕНИЕ
а вперемежку с соответствующими сведениями из линейной алгебры.
Подобное построение материала позволило достичь ряда преимуществ:
сократились многие однотипные доказательства в обоих курсах, удалось
подчеркнуть геометрическую образность таких абстрактных алгебраи-
алгебраических понятий, как линейное пространство, плоскость в линейном
пространстве, определитель, системы линейных алгебраических уравне-
уравнений и т. п.
Линейная алгебра в значительной мере обогащается новыми фактами,
если в линейные пространства ввести понятия расстояния между векто-
векторами и предела последовательности векторов. Необходимость этого
введения* диктуется также и требованиями численных методов. Метри-
Метрические свойства линейных пространств изучаются в §§ 49 — 54, метри-
метрические свойства линейных операторов — в §§ 82—84. Конечно, все эти
сведения обычно даются в функциональном анализе, но, как правило,
при этом не подчеркиваются многие важные для конечномерных
линейных пространств результаты.
Численное решение задач линейной алгебры почти всегда сопровож-
сопровождается появлением ошибок округления. Поэтому будущему вычисли-
вычислителю необходимо отчетливо понимать, к каким изменениям свойств
различных объектов линейной алгебры приводят малые изменения
векторов и операторов. Влиянию малых возмущений посвящены §§ 33,
87, 89.
Свойства многих объектов линейной алгебры могут измениться на
противоположные даже при сколь угодно малых возмущениях. Так,
например, линейно зависимая система векторов может стать линейно
независимой или увеличить свой ранг, оператор с жордановой струк-
структурой может стать оператором простой структуры, а совместная система
линейных алгебраических уравнений — несовместной и т. д. Все эти
факты вызывают исключительно большие трудности при практическом
решении задач. ' *.
Мы настоятельно рекомендуем читателю еще раз внимательно про-
прочитать § 22 и разобрать приведенный в нем пример, а также серьезно
задуматься над теми вопросами, которые поставлены в конце параграфа.
Несмотря на неустойчивость многих понятий линейной алгебры,
ее задачи можно решать устойчиво. Для того чтобы продемонстри-
продемонстрировать такую возможность, в книгу включено описание устойчивого
метода решения систем линейных алгебраических уравнений. Его теоре-
теоретическое обоснование и общая схема приведены в §§ 85, 86, 88.
Последняя часть книги посвящена описанию и исследованию раз-
различных вопросов, относящихся к билинейным и квадратичным формам.
Эти числовые функции играют очень важную роль в линейной алгебре
и тесно связаны с построением численных методов. В §§ 90—94
рассматриваются общие свойства билинейных форм и связь их преоб-
преобразований с матричными разложениями, в §§ 98 —101—расширение
понятия ортогональности, в §§ 103 —107 —использование билинейных
форм в вычислительных процессах,
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Адамара неравенство 116
Алгебры основная теорема 220
Аффинная система координат 73, 74, 75
— левая 108
правая 108
Аффинные координаты точки 74, 75
— проекции точки 74, 75
Базис 51
— двойственный 244
— — левый 361
правый 361
— корневой 239
— ортонормированный 93, 357
— псевдодвойственный левый 361
правый 361
— псевдоортогональный 358
Базисы биортонормированные 244
Билинейная форма 291, 294
кососимметричная 239
— — невырожденная 295
— — нулевая 291
полярная 293
— — симметричная 291
эрмитова 293
кососимметричная 294
— симметричная 293
Билинейной формы дефект 299
матрица 298
преобразование 302
ранг 299
Бине—Коши формула 199
Ведущий элемент 68, 134
Вектор 18, 35
— закрепленный 18
— изотропный 295
— корневой 236
— направляющий 139, 150
— нормальный 137, 138, 154
— нормированный 90
— ортогональный 86, 92
слева 346
справа 346
— ортонормированный 86, 92
— сдвига 146
ортогональный 146
— собственный 207
Вектора длина 79, 96
— координаты 51, 79
— корневого высота 237
— невязка 274
— норма 169
— образ, прообраз 179
— проекция 86
координатная 79
ортогональная 83
Вектора проекция ортогональная на гипер-
гиперплоскость 154
подпространство 99
— разложение по базису 51
Векторное произведение 109
Векторов вычитание 22
— линейная комбинация 42
оболочка 42
— ортогональные множества 94
— подсистема 42 .
— система 42
псевдоортогональная 358
— системы база 49
-щ — линейная зависимость 44
— — — независимость 44
объем 109, 114
— — — ориентированный 109, 115
ранг 49
— — эквивалентные 47
элементарные преобразования 50
— сложение 21
— тройка левая 108
— — правая 108
Векторы в общем положении 148
— коллинеарные 20, 90
— компланарные 20
— равные 20
Вьета формулы 223
Гельдера неравенство 167
Гипербола 332
Гиперболоид двуполостный 339
— однополостный 339
Гиперплоскость 149
— диаметральная 326
Гиперповерхность второго порядка 325
Группа 3
— коммутативная (абелева) 26
Группы единица 24
— операция 24
Деление отрезка в данном отношении 82
Делитель нуля 28
Дистрибутивности закон 27
Евклидов изоморфизм 109
Инверсия 123
Индекс суммирования 38
Инерции закон 318
— индекс 319
Каноническая форма Жордана 240
Канонический вид матрицы 310
Каноническое разложение многочлена 221
398
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Каноническое уравнение гиперболоида дву-
двуполостного 339
— — — однополостного 339
гиперболы 332
конуса эллиптического 340
параболоида гиперболического 341
эллиптического 341
параболы 335
прямой линии 139
— — цилиндра 342
эллипса 330
— — эллипсоида 338
Квадратичная форма 293
— — знакопостоянная 296
— строго 296
невырожденная 302
неотрицательная 295
неположительная 296
— — определенная отрицательно 296
положительно 295
Квадратичной формы индекс инерции 319
. матрица 301
сигнатура 319
Кели — Гамильтона теорема 236
Класс 16
Кольцо 27
— коммутативное 27
— некоммутативное 27
Конечная, сумма 38
Конечное произведение 39
Конус эллиптический 340
Корень из оператора 251
— многочлена 215
кратный 222
простой 222
Коши — Буняковского неравенство 90, 105
Крамера формулы 160
Кронекера—Капелли теорема 167
Лапласа теорема 129
Линия второго порядка 329
Матриц произведение 196
— разность 195
— сумма 195
Матрица вырожденная 198
— Грама 345
— диагональная 193
— единичная 193
— квадратная 126
— квазидиагональная 236
— клеточная 227
— кососимметричная 300
— косоэрмитова 301
— ленточная 317
—; невырожденная 198
— нормальная 262
— нулевая 193
— обратная 198
— ортогональная 260
— перестановок 322
— подобного преобразования 206
Матрица положительно определенная 302
— почти треугольная левая 310
правая 310
— прербразования координат 202
— прямоугольная 132
— симметричная 261
— системы 157
расширенная 157
— скалярная 193
— сопряженная 243
— трапециевидная левая 310
правая 310
— лрехдиагональная 317
— унитарная 260
— Фробениуса 211
— эрмитова (самосопряженная) 261
Матрицы главная диагональ 127
— конгруэнтные 300
эрмитово 300
— норма 217
— подобные 106
— произведение на число 195
— равные 194 '
— ранг 132
— след 19$
— транспонирование 128
— эквивалентные 204
Метод АА *-минимальных итераций 388
— А ^-минимальных итераций 387
— Гаусса 68, 134
— неполного эрмитова разложения 389
— полного эрмитова разложения 389
— сопряженных градиентов 387
направлений 383
Минковского неравенство 167
Минор 128
— базисный 132
— главный (угловой) 128
— дополнительный 128"
Минора алгебраическое дополнение 129
Многочлен интерполяционный Лагранжа
223
— минимальный 377
— операторный 229
Множества элемент 7
Множество 7
— выпуклое 154
— замкнутое 163
— конечное 7
— ограниченное 162
Муавра формула 216
Наклонная к подпространству 99
Направление асимптотическое 326
— неасимптотическое 326
Направленного отрезка величина 31
— — умножение на число 32
¦ Направленный отрезок 18
Норма вектора 169
— евклидова 170, 270
— матрицы 271
— оператора 264
— — матричная 269
подчиненная 266
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
399
Норма оператора согласованная 266
спектральная 267
Окрестность 162
Оператор 179
— близкий к тождественному 278
— вырожденный 186
— изометричный 249
— индуцированный 227
— линейный 180
— невырожденный 186
"— неотрицательный 250
— непрерывный 263
в точке 263
— нильпотентный 237
— нормальный 246
— нулевой 180
— обратный 188 '
— ограниченный 263
— ортогональный 257
— положительно определенный 250
— проектирования 194
— простой структуры 208
— противоположный 180
— псевдообратный (обобщенный обратный
276
— симметричный 257
— скалярный 180
— сопряженный 241
-г- — левый 363
правый 363 ч
— тождественный (единичный) 180
— унитарный 248
— эрмитов (самосопряженный) 250
Оператора возмущение 279
— дефект 181
— инвариантное подпространство 226
— каноническая форма Жордана 240
— корневое подпространство 236
— корневой базис 239
— — вектор 236
— матрица 191
— норма 264
— области значений (образ) 179
определения 179
— полярное разложение 256
— произведение на число 184
— ранг 181
— расширение 258
— сингулярные базисы 254
— — (главные) числа 253
— собственное значение 207
подпространство 207
— собственный вектор 207
— степень 189
— характеристический многочлен 211
— число обусловленности 280
— эрмитово разложение 255
"- ядро 181
Операторов вычитание 184
— кольцо 185
— невырожденная группа 186
— произведение 185
— сумма 183
Операторов сумма прямая 233
— циклическая группа Т90
Операторы перестановочные 186
Операция алгебраическая 10
ассоциативная 11
коммутативная 10
— обратная 14
— — левая 14
— — правая 14
Определитель 127
— Грама 133
Определителя разложение по строке (столб-
(столбцу) 130
Ортогонализации процессы 373
Ортогональное дополнение 95
слева 351
— — справа 351
Ортогональные множества 54
Основное тождество 32
Ось 31
— абсцисс 74
— аппликат 75
— Ординат 74
Отрезок в линейном пространстве 150
Парабола 335
Параболоид гиперболический 341
— эллиптический 341
Параллельный перенос 19
Перестановка 123
— нечетная 123 •
— нормальная 123
— четная 123
Перпендикуляр на гиперплоскость 154
— — подпространство 99
Плоскостей пересечение 147
Плоскости параллельные. 147
— пересекающиеся 147
— скрещивающиеся 147
Плоскость в линейном пространстве
.146
Поверхность второго порядка 330
Подпространств пересечение 6l
— сумма 59
— — ортогональная 94
прямая 61
Подпространство замкнутое 155
— инвариантное 226
— корневое 236
— линейное 57
— направляющее 146
— невырожденное 351
— неотрицательное1 155
— неположительное 155
— нетривиальное 58
— нулевое 58, 352
— открытое 154
— отрицательное 154*
— положительное 154
— собственное 207
— тривиальное 58
— циклическое 239
Поле 28
— алгебраически замкнутое 212
400
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Последовательность бесконечно большая
166
— степенная 376
— сходящаяся 162
— фундаментальная 163
Правило замыкания ломаной 22
— параллелограмма. 23
— треугольника 21
Предел последовательности 161
Предельная точка множества 163
Пространств линейных изоморфизм 63
Пространства расширение 258
Пространство арифметическое 66
— бесконечномерное 50
— билинейно метрическое 344
эрмитово 344
— вещественное 35
— евклидово 88
— — комплексное 369
— комплексное 35
— конечномерное 50
— линейное 35
— метрическое 161
— Минковского 368
..— нормированное 169
— полное 164
— псевдоунитарное 369
— рациональное 35
— симплектическое 368
— унитарное 104
Псевдорешение (обобщенное решение) 274
— нормальное 274
Равенство координатное 197
— операторное 197
Равные элементы 17
Расстояние между векторами 98, 161
— — множествами 98
Системы линейных алгебраических уравне-
уравнений неизвестные свободные 70, 160
— — правая часть 67
— — — — решение 68
— — нормальное 159
— — — общее 158
— частное 158
— — — — эквивалентные 68
Скалярное произведение векторов 85, 88,
104
Смешанное произведение векюров 109
Сопряженные числа 167
Сходимость координатная 171
— по норме 170
Транзитивность 16
Транспозиция 123
Угол между векторами 81, 97
— — вектором и подпространством 100
Уравнение в отрезках 138
— операторное 272
— плоскости в пространстве общее 138
нормированное 145
— прямой линии каноническое 139
— — — на плоскости 137
нормированное 145
параметрическое 140, 150
Фредгольма альтернатива 273
— тебрема 273
Фундаментальная система решений 158
Функционал невязки 274
— ошибок обобщенный 385
— регуляризирующий 282
Функция непрерывная 217
Сильвестра критерий 320
Система координат аффинная 73, 74, 75
полярная 77
— — прямоугольная 78
— — сферическая 78
цилиндрическая 78
— линейных алгебраических уравнений 67
— неоднородная 158
— — — — несовместная 68
— . — однородная 158
— — приведенная 158
совместная 68
Системы линейных алгебраических уравне-
уравнений неизвестные 67
Цилиндры 342
Шар 162
— замкнутый 163
Шура теорема 246
Эквивалентности отношение 16
Эллипс 330
Эллипсоид 338
Якоби алгорифм 315