/
Текст
Г. Е. ШИЛОВ
ВВЕДЕНИЕ
В ТЕОРИЮ
ЛИНЕЙНЫХ ПРОСТРАНСТВ
Под редакцией Н. В. ЕФИМОВА
Допущено Министерством высшего
образования СССР в качестве
учебника для физических и физико-
математических факультетов
государственных университетов
ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО
ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 19 5 2 ЛЕНИНГРАД
li-5-2
Редактор Л. А. Чудов.
Техн. редактор С. Я. Ахламов. Корректор Н. В. Казанская.
Подписано к печати 16/IV 1952 г. Бумага 84х108/з2- 6,0 бум. л.
19,68 печ. л. 21„0 9 уч.-изд. л. 43 885 тип. зн. в печ. л. Тираж 10 000 экз.
Т-02П9. Цена книги 6 руб. 30 коп. Переплёт 1 руб. Заказ № 145.
Номинал—по прейскуранту 1952 года.
16-я типография Главполиграфиздата при Совете Министров СССР.
Москва, Трёхпрудные пер., 9.
ОГЛАВЛЕНИЕ
Предисловие редактора 7
От автора 10
Глава 1. Определители И
§ 1. Системы линейных уравнений И
§ 2. Определитель д-го порядка 13
§ 3. Свойства определителя п-то порядка 18
§ 4. Разложение определителя по строке или столбцу.
Алгебраические дополнения 22
§ 5. Миноры. Выражение алгебраических дополнений
через миноры 24
§ 6. Практическое вычисление определителей .... 26
§ 7. Правило Крамера 29
§ 8. Миноры произвольного порядка. Теорема
Лапласа 33
§ 9. О линейной зависимости между столбцами
определителя 37
Глава 2. Линейные пространства 44
§ 10. Введение 44
§ 11. Определение линейного пространства 47
§ 12. Линейная зависимость 52
§ 13. Базис и координаты 56
§ 14. Размерность 58
§ 15. Подпространства 60
§ 16. Линейные оболочки 64
§ 17. Гиперплоскости .* 66
§ 18. Изоморфизм линейных пространств 69
Глава 3. Системы линейных уравнений 72
§ 19. Ещё о ранге матрицы 72
§ 20. Нетривиальная совместность однородной
линейной системы 75
§ 21. Условие совместности общей линейной системы . 76
§ 22. Общее решение линейной системы . . 78
§ 23. Геометрические свойства совокупности решений
линейной системы 81
§ 24. Методы вычисления ранга матрицы и
нахождения базисного минора 83
4 ОГЛАВЛЕНИЕ
Глава 4. Линейные функции векторного аргумента . . 89
§ 25. Линейные формы 89
§ 26. Линейные операторы 91
§ 27. Общий вид линейного оператора в n-мерном
пространстве 93
§ 28. Действия с линейными операторами 98
§ 29. Соответствующие действия с матрицами 101
§ 30. Обратный оператор и обратная матрица 110
§ 31. Простейшие геометрические характеристики
линейных операторов 115
§ 32. Алгебра линейных операторов n-мерного
пространства и её идеалы 119
§ 33. Общие линейные операторы 125
Глава 5. Преобразования координат 126
§ 34. Формулы перехода к новому базису 126
§ 35. Преобразование координат вектора при
изменении базиса 129
§ 36. Последовательные преобразования 131
§ 37. Преобразование коэффициентов линейной формы 133
§ 38. Преобразование матрицы линейного оператора . . 134
§ 39. Тензоры 138
Глава 6. Билинейные и квадратичные формы 145
§ 40. Билинейные формы 145
§ 41. Квадратичные формы 149
§ 42. Приведение квадратичной формы к
каноническому виду 152
§ 43. Вопросы единственности 156
§ 44. Канонический базис билинейной формы 160
§ 45. Построение канонического базиса по методу
Якоби 164
§ 46. Полилинейные формы 167
Глава 7. Евклидовы пространства 170
§ 47. Введение ' 170
§ 48. Определение евклидова пространства 172
§ 49. Основные метрические понятия 174
§ 50. Ортогональный базис в /г-мерном евклидовом
пространстве 180
§ 51. Изоморфизм евклидовых пространств 181
§ 52. Норма линейного оператора 182
§ 53. Ортогональные матрицы и изометрические
операторы 185
§ 54. Связь между линейными операторами и
билинейными формами. Сопряжённый оператор 190
ОГЛАВЛЕНИЕ
5
Глава 8. Ортогонализация и измерение объёмов ... 195
§ 55. Задача о перпендикуляре 195
§ 56 Общая теорема ортогонализации 198
§ 57. Многочлены Лежандра 201
§ 58. Определитель Грама 205
§ 59. Объём ^-мерного гиперпараллелепипеда 207
§ 60. Неравенство Адамара 212
§ 61. Матрица симметричной положительно
определённой билинейной формы в n-мерном линейном
пространстве 215
Глава 9. Собственные векторы и собственные числа . 217
§ 62. Инвариантные подпространства 217
§ 63. Собственные векторы и собственные значения . . 220
§ 64. Вычисление собственных векторов и собственных
значений в конечномерном пространстве .... 223
§ 65. Собственные векторы симметричных операторов . 227
§ 66. Примеры симметричных операторов в
бесконечномерных пространствах 233
Глава 10. Квадратичные формы в евклидовом
пространстве 236
§ 67. Основная теорема о квадратичных формах .... 236
§ 68. О единственности ортогонального и
нормированного канонического базиса квадратичной формы
и соответствующего канонического вида формы . 240
§ 69. Экстремальные свойства квадратичной формы . . 241
§ 70. Квадратичная форма на подпространстве .... 243
§ 71. Канонические коэффициенты сравнимых
квадратичных форм 250
§ 72. Задача о паре квадратичных форм и её решение 251
§ 73. Эффективное построение искомого базиса .... 252
§ 74. Вопросы единственности 254
§ 75. Распределение кривизны нормальных сечений
гладкой поверхности 256
§ 76. Малые колебания механических систем 261
Глава 11. Поверхности 2-го порядка 265
§ 77. Приведение общего уравнения поверхности 2-го
порядка к каноническому виду 265
§ 78. Центральные поверхности 268
§ 79. Невырожденные нецентральные поверхности
(параболоиды) 276
§ 80. Вырожденные цилиндрические поверхности . . . 280
§ 81. Анализ поверхности но её общему уравнению . . 282
Глава 12. Нормированные и метрические пространства 291
§ 82. Введение 291
§ 83. Определение нормированного пространства . . . 292
§ 84. Определение метрического и ростра нства 293
6 ОГЛАВЛЕНИЕ
§ 85. Предельный переход в метрическом-пространстве 295
§ 86. Полные пространства 299
§ 87. Компактные подмножества в метрическом
пространстве 305
§ 88. Непрерывные функции на компактах • 310
§ 89. О норме в конечномерных пространствах .... 313
§ 90. Линейные функционалы 316
§ 91. Билинейные функционалы 318
§ 92. Линейные операторы в бесконечномерных
пространствах 318
§ 93. О пополнении метрического пространства .... 319
Глава 13. Особенности геометрии бесконечномерного
евклидова пространства и ряды Фурье ... 321
§ 94. Задача о наилучшем приближении 321
§ 95. Ряд Фурье и замкнутые ортогональные системы . 324
§ 96. Вспомогательные предложения 331
§ 97. Теорема о рядах Фурье в полном евклидовом
пространстве 334
§ 98. Ряды Фурье в неполном пространстве 337
§ 99. Вопросы сходимости рядов Фурье. Полнота
системы тригонометрических функций и
многочленов Лежандра 339
§ 100. Существование ортогонального дополнения у
замкнутого подпространства полного евклидова
пространства 349
§ 101. Общий вид ограниченного линейного
функционала в полном евклидовом пространстве .... 354
§ 102. Общий вид ограниченного билинейного
функционала в полном евклидовом пространстве .... 355
Глава 14. Линейные интегральные уравнения 357
§ 103. Вполне непрерывные линейные операторы .... 357
§ 104. Собственные векторы вполне непрерывного
симметричного оператора 359
§ 105. Приложения к теории интегрального оператора
Фредгольма 303
§ 106. Решение неоднородного интегрального уравнения 367
§ 107. О неограниченных операторах, обладающих
обратным симметричным и вполне непрерывным
оператором 370
§ 108. Вычисление собственных значений и собственных
функций 374
Алфавитный указатель 377
ПРЕДИСЛОВИЕ РЕДАКТОРА
За долгое время на физических и
физико-математических факультетах наших университетов установились
определённые традиции преподавания геометрических
курсов и их взаимоотношений с другими математическими
дасциплинами. Так, стало принятым на первых двух
«семестрах читать детальный курс аналитической геометрии
двух и трёх измерений и одновременно с ним. общий
курс алгебры, затем более или менее подробный курс
дифференциальной геометрии. Недостатками этого плана
являются: 1) большая затрата времени на частные задачи
трёхмерной аналитической геометрии; 2) разобщённость
основных вопросов аналитической геометрии и линейной
алгебры. Поэтому уже давно, и особенно остро на физических
факультетах, встал вопрос о пересмотре установившихся
традиций. Этот вопрос на протяжении ряда последних лет
подвергался многократному обсуждению на кафедре
математики физического факультета МГУ. В результате этих
обсуждений и как следствие разнообразных вариантов
чтения геометрическргх курсов сотруднршами кафедры
математики физфака МГУ возникла ныне действующая
программа курса «Геометрия», Сущность проведённой
перестройки в главных чертах заключается в следующем.
Традиционный курс аналитической геометрии двух и трёх
измерений значительно сжат и сведён к минимуму,
необходимому для удовлетворения основных потребностей
общего курса физики и дальнейших разделов математики.
Собственно аналитическая геометрия теперь занимает
немногим более одного первого семестра при двух
лекционных часах в неделю. Общая Теория поверхностей
второго порядка в трёхмерном пространстве как сдециаль-
8 ПРЕДИСЛОВИЕ РЕДАКТОРА
ный раздел исключена. Общий курс алгебры снят. За счёт
освободившегося времени, начиная со второго семестра,
центр тяжести переносится на изложение теории линейных
пространств, конечно, в неразрывной связи с линейной
алгеброй. Второй семестр при двух лекционных часах
в неделю посвящен общей идее линейного пространства,
вместе с тем теории матриц и линейных систем; в
первой половине третьего семестра при трёх лекционных
часах в неделю излагается теория евклидовых пространств
вместе с теорией билинейных и квадратичных форм;
здесь же излагается теория поверхностей второго порядка
в и-мерном пространстве (во второй половине третьего
семестра излагается краткий курс дифференциальной
геометрии). При такой структуре курса «Геометрия»
получают надлежащее развитие те общие идеи геометрии
и алгебры, соединение которых необходимо для
дальнейших предметов учебного плана физических факультетов
(в частности, для математической физики).
Книга Г. Е. Шилова «Введение в теорию линейных
пространств» призвана служить учебником по материалу
второго и третьего семестров (само собой разумеется,
исключая дифференциальную геометрию). Последние
главы этой книги (гл. 12—14) выходят за рамки программы;
однако в плане университетского учебника они
необходимы, поскольку дают естественное развитие и
приложения программного материала (эти главы можно
использовать в работе математических кружков и семинаров).
К числу особых достоинств книги Г. Е. Шилова следует
отнести: наглядное построение теории определителей
(по существу без теории подстановок); удачное
объединение теории линейных пространств с теорией матриц;
построение теории евклидовых пространств на базе теории
форм (в частности, существование ортогонального базиса
устанавливается как прямое следствие существования
канонического базиса билинейной формы); удачную схему
приложений метода ортогонализации (вычисление
определителя Грама, его оценки, геометрическая
интерпретации неравенства Адамара); новое доказательство
существования собственных векторов симметрического линей-
цого оператора евклидова пространства в вещественной
ПРЕДИСЛОВИЕ РЕДАКТОРА
9
области (с помощью максимальных векторов); новое
доказательство существования собственных векторов
симметрического оператора Фредгольма и ряд других. Общим
достоинством книги Г. Е. Шилова является богатство
содержания и ясность перспектив приложений.
«Введение в теорию линейных пространств» Г. Е.
Шилова представляет собой по замыслу кафедры математики
физфака МГУ вторую книгу по курсу «Геометрия».
Первой книгой должна быть «Аналитическая геометрия»
П. С. Моденова (в настоящее время готовится к печати).
Обе книги объединяются общей редакцией.
Н. В. Ефимов
ОТ АВТОРА
Настоящая книга возникла в результате обработки
материалов лекционных курсов и семинаров,
проведённых автором за последние годы в Московском
Государственном университете им. М. В. Ломоносова и Киевском
Государственном университете им. Т. Г. Шевченко.
Содержание книги включает в себя объём
обязательного курса линейной алгебры с некоторым развитием его
в сторону применений к анализу, а также ряд смежных
вопросов (напечатанных мелким шрифтом), которые могут
быть использованы на специальных семинарах и в
самостоятельной работе.
Основной текст книги сопровождается рядом задач.
Эти задачи в очень небольшой мере предназначены для
выработки технических навыков; как правило, они
иллюстрируют и развивают материал основного текста и могут
быть также использованы в работе специального семинара.
Частично автор заимствовал эти задачи из
распространённых задачников, среди которых необходимо упомянуть
«Сборник задач по высшей алгебре» Д. К. Фаддеева и
И. С. Соминского и «Сборник задач по высшей
математике» Н. М. Гюнтера и Р. О. Кузьмина.
Автор выражает искреннюю благодарность Д. A. Paii-
кову, прочитавшему книгу в рукописи и сделавшему ряд
ценных замечаний.
Автор
ГЛАВА 1
ОПРЕДЕЛИТЕЛИ
§ 1. Системы линейных уравнений
В этой и двух следующих главах мы будем заниматься
изучением систем линейных уравнений.
В самом общем случае такая система имеет следующий
вид:
а11^1 + ^12^2 + • • • + CllnXn ~ ^1» J
аЪ\х\ + #22^2 + • • • + ^2пХП ~ ^2> I
a*iXi + ak2x2+...+акпхп = Ьк. )
Здесь через хъ хъ ... , хп обозначены неизвестные,
подлежащие определению (заметим, что число неизвестных не
предполагается обязательно равным числу уравнений).
Величины а1Ъ а12, . . . , акп называются коэффициентами
системы. Первый индекс коэффициента указывает номер
уравнения, в котором фигурирует данный коэффициент,
а второй индекс —номер неизвестного, при котором этот
коэффициент поставлен*). Величины 6Ь 62, ... , ЬиУ
стоящие в правых частях равенств (1), называются свободными
членами системы; как и коэффициенты, они
предполагаются известными.
Решением системы называется всякая совокупность
чисел съ с2, .. . , сп, которая, будучи подставлена в си-
*) Поэтому, например, запись a3i должна читаться так:
«а—три-четыре» (а не «а*—тридцать четыре»).
12 ОПРЕДЕЛИТЕЛИ [ГЛ. 1
стему (1) на место неизвестных хъ х2, ... , хт обращает
все уравнения системы в тождества *).
Не всякая система линейных уравнений вида (1) имеет
решение. Например, система
2хх + Зя2 = 5, \
2^ + 3^ = 6 ( (2)
заведомо не может иметь ни одного решения.
Действительно, какие бы числа съ с2 мы ни подставили на место
неизвестных хи х2, левые части уравнений системы (2)
окажутся совпадающими, в то время как правые части —
различные. Поэтому оба уравнения системы (2) такой
подстановкой не могут быть обращены в тождества.
Систему уравнений вида (1), имеющую (хотя бы одно)
решение, мы будем называть совместной; систему, не
имеющую решений, будем называть несовместной.
Совместная система может иметь одно решение или
несколько; в последнем случае для различения решений мы
будем указывать их номера индексами наверху в скобках;
например, первое решение с[{\ с^К --. , c\i\ второе
решение c(i2), с(22), ... , Сп2) и т. д. Решения c(i\ (41*, ... , Сп )
и c(i2), с{£\ ... , <42) считаются различными, если хотя бы
одно из чисел с\ ) (i = 1, 2, ... , п) не совпадает с
соответствующим числом с\2). Например, система
2^ + 3x2 = 0, \
4s1 + 6sa = 0 J ( }
имеет различные решения с\ ) = с*2 ) = 0, с[ ) = 3, с(2 ) = — 2
(а также бесконечное множество других решений). Если
совместная система имеет единственное решение, она
называется определённой; если совместная система имеет по
крайней мере два различных решения, она называется
неопределённой.
*) Подчеркнём, что совокупность чисел^ clf с2. -.. . сп
составляет одно решение системы (а не п решений).
§ 2]
ОПРЕДЕЛИТЕЛЬ n-го ПОРЯДКА
13
Мы можем сформулировать теперь те основные задачи,
которые возникают при изучении системы (1):
I. Узнать, является ли система (1) совместной или
несовместной.
II. Если система (1) совместна, то узнать, является ли
она определённой.
III. Если система (1) совместна и определённа, то
найти её единственное решение.
IV. Если система (1) совместна и неопределённа, то
описать совокупность всех её решений.
Основным математическим инструментом для изучения
линейных систем является теория определителей; мы
переходим теперь к её изложению.
§ 2. Определитель п-го порядка
1. Пусть дана квадратная матрица, т. е. таблица из
п2 чисел ац (i, /= 1, 2, ... , п):
а11 а12
^21 ^22
• а2п
&п\ 0"п2
(4)
Число п, указывающее количество строк и столбцов
матрицы (4), называется её порядком. Числа ац называются
элементами матрицы; первый и второй индексы указывают
у элемента ац соответственно номер строки и столбца, в
которых расположен этот элемент.
Рассмотрим любое произведение п элементов,
расположенных в различных строках и различных столбцах
матрицы (4), т. е. по одному в каждой строке и в каждом
столбце. Такое произведение может быть записано в виде
#0^1, ал 2 •
ч«-
(5)
Действительно, в качестве первого сомножителя мы
всегда можем взять элемент, стоящий в первом столбце
/
14 ОПРЕДЕЛИТЕЛИ [ГЯ. i
матрицы (4); если обозначить через ах номер строки, в
которой находится этот элемент, то индексы этого
элемента будут ах и 1. Аналогично в качестве второго
сомножителя можно взять элемент, стоящий во втором
столбце; его индексы будут а2 и 2, где а2 —номер той строки,
в которой расположен этот второй элемент, и т. д. Таким
образом, индексы аь а2, . . . , ап суть номера строк, в
которых расположены сомножители произведения (5), в
соответствии с принятым порядком их записи по
возрастанию индексов столбцов.
Так как по условию элементы аа 1? аа 2, • • • > #а п
расположены в различных строках матрицы (4), по
одному в каждой строке, то числа аь а2, . . . , а;1 все
различны и представляют собой некоторую перестановку
чисел 1, 2, .. . , п.
Назовём «беспорядком» в этой последовательности аь
а2, .. . , <хп такое расположение индексов, когда старший
индекс стоит раньше младшего. Число всех «беспорядков»
обозначим через N (аь а2, . . . , ап).
Например, в перестановке четырёх цифр 2, 1, 4, 3—два
беспорядка (2 впереди 1, 4 впереди 3), таким образом,
N(2, 1, 4, 3) = 2.
В перестановке 4, 3, 1, 2—пять беспорядков (4 впереди 3,
4 впереди 1, 4 впереди 2, 3 впереди 1, 3 впереди 2); поэтому
N (4, 3, 1, 2) = 5.
Если число беспорядков в последовательности аь ...
. . . , ап четно, поставим перед произведением (5) знак +;
если это число нечётно, поставим перед этим
произведением знак — . Иными словами, условимся перед каждым
произведением вида (5) писать знак, определяемый
выражением
(_ l)N (аь а2, ... , ал)4
Число всех произведений вида (5), которые можно
составить из элементов данной матрицы га-го порядка,
§ 2] ОПРЕДЕЛИТЕЛЬ п-то ПОРЯДКА 15
равно числу всех возможных перестановок чисел 1, 2, .. ., п,
которое, как известно, равно п\
Теперь введём следующее определение.
Определителем матрицы. (4) называется алгебраическая
сумма, состоящая из п\ произведений вида (5), перед
каждым из которых поставлен знак, определённый по
указанному выше правилу:
JD=S(-l)iV(eba2'-,a-,)^iifl»22
^a/iTi*
(6)
В дальнейшем произведения вида (5) будем называть
членами определителя. Элементы ац матрицы (4) будем
называть элементами определителя.
Определитель, соответствующий матрице (4),
обозначается одним из следующих символов:
D--
#n #12 ... а{П
#21 #22 • • • ^2п
#nl #п2 • • • &пп
= det ||а4у|| =йе1||а{у||4>у«1,2,..., п- (7)
Например, для определителей 2-го и 3-го порядка мы
получаем следующие выражения:
#11 #12
#21 #22
#П #12 #13
#21 #22 #23
#31 #32 Й33
: #11#22 — #21#12)
: #11#22#33 + #21#32#13 Н~ #31#12#23 — #31a22a13~"
— #21#12#33 — #11#32#23-
^ Роль определителей при решении систем линейных
уравнений мы покажем на примере системы из двух уравнений с двумя
неизвестными. Если дана система
«21^1 + ^22^== Ъ2,
16
ОПРЕДЕЛИТЕЛИ
[ГЛ. 1
то, исключая обычным образом одно из неизвестных, можно легко
получить формулы
^1«22*~^2а12 alA — «21^1
ХХ:
а11«22—«21«12
«11«22 — «21«12
в предположении, что знаменатели этих отношений отличны от
нуля. Числители и знаменатели получающихся дробей
представляют собой определители 2-го порядка:
11«22 — «12а21 —
&1а22—&2а12 =
<*lA—Д21&1 =
\а1Х а12
| «21 а22
Ьх а12
0% ^22 1
«11 bl\
«21 &2 |
Оказывается, что аналогичные формулы имеют место и для
решения систем с любым числом неизвестных (см. § 7).
2. Правило для определения знака данного члена
определителя можно сформулировать несколько иначе, в
геометрических терминах.
Проведём мысленно в матрице (4) все отрезки,
соединяющие попарно элементы aaii, aa22, ... , aann
произведения (5) и при этом имеющие положительный наклон (т. е.
такие отрезки, правый конец которых расположен выше
левого конца). Будем ставить перед произведением (5)
знак +, если число всех такихотрезков четно, и знак—,
если их число нечётно.
Например, в случае матрицы 4-го порядка перед
произведением a2iai2a43a34 должен быть поставлен знак ■+■, так как в
матрице имеется два отрезка положительного наклона,
соединяющих элементы данного произведения:
а перед произведением a4ia32ai3a24 должен быть поставлен энак —,
так как в матрице имеется пять отрезков с положительным на-
§ 2] ОПРЕДЕЛИТЕЛЬ n-го ПОРЯДКА 1?
клоном, соединяющих его элементы;
В этих примерах количество отрезков положительного на*
клона, соединяющих элементы данного члена, равно числу
«беспорядков» в расположении первых индексов элементов,
составляющих в произведении данный член: в первом примере
последовательность первых индексов 2, 1, 4, 3 имеет два «беспорядка»,
во втором примере последовательность первых индексов 4, 3, 1, 2
имеет пять «беспорядков».
Покажем, что второе определение знака члена
определителя равносильно первому. Для этого достаточно
показать, что число «беспорядков» в последовательности
первых индексов элементов данного члена (при
натуральном порядке вторых индексов) всегда равно числу
отрезков положительного наклона, соединяющих элементы
данного члена в матрице. Но это почти очевидно: наличие
отрезка положительного наклона, соединяющего элементы
a4i и аа//, означает при i < /, что оц > а/, т. е. наличие
«беспорядка» в расположении первых индексов.
Задачи
1. С каким знаком в определитель 6-го порядка входят члены
а) а23а31й42Л5бб14авб>
б) a32043aua5Aea25-
Отв. а) + , б) +.
2. Выписать все члены, входящие в состав определителя 4-го
порядка со знаком — и содержащие множителем я2з>
Отв. апа32а23аи, aua12a2^3v asiart4zaiv
3. С каким знаком входит в определитель п-го порядка член
aina2, n-l ••• anl?
n(n-l)
Отв. ( —1) 2 .
Г. Е. Шилов
18 , ОПРЕДЕЛИТЕЛИ [ГЛ. I
§ 3. Свойства определителя n-го порядка
1. Операция транспонирования.
Определитель
&лл dn
«n2
(8)
|^ln«2/i • • • #r
полученный из определителя (7) заменой строк на столбцы
с теми же номерами, называется транспонированным по
отношению к определителю (7). Покажем, что величина
транспонированного определителя совпадает с величиной
исходного определителя. Действительно, определители (7)
и (8) состоят, очевидно, из одних и тех же членов; поэтому
нам достаточно показать, что одинаковые члены обладают
в определителях (7) и (8) и одинаковыми знаками.
Транспонирование матрицы определителя, очевидно, есть результат
её поворота (в пространстве) на 180° вокруг диагонали
апа22 ... апп. При этом повороте каждый отрезок с
положительным наклоном (например, образующий угол
а < 90° со строками матрицы) переходит снова в отрезок
с положительным наклоном (именно, образующий со
строками матрицы угол 90° —а). Поэтому число отрезков
с положительным наклоном, соединяющих элементы данного
члена, после транспонирования не изменится; следовательно,
не изменится и знак этого члена. Таким образом, знаки
всех членов сохранятся; тем самым величина определителя
остаётся неизменной.
Доказанное сейчас свойство определителя устанавливает
равноправие его строк и столбцов. Поэтому дальнейшие
свойства определителей мы будем формулировать и
доказывать только для столбцов.
2. Свойство антисимметрии. Под
антисимметрией относительно столбцов понимают следующее
свойство определителя: при перестановке двух столбцов
определитель меняет знак. Рассмотрим сначала случай, когда
переставляются два соседних столбца определителя,
например /-й и (/ + 1)-й. Определитель, полученный после пере-
§ 3]
СВОЙСТВА ОПРЕДЕЛИТЕЛИ n-го ПОРЙДКА
19
становки столбцов, будет состоять, очевидно, из тех же
самых членов, что и исходный определитель. Рассмотрим
какой-нибудь из членов исходного определителя. Этот член
в своём составе имеет элемент из /-го столбца и элемент
из (/-|-1)-Го столбца. Если отрезок, соединяющий эти два
элемента, имел положительный наклон, то после
перестановки столбцов его наклон станет отрицательным, и
наоборот. Что же касается остальных отрезков, соединяющих
попарно элементы выделенного члена, то после перестановки
столбцов характер наклона каждого из них останется
неизменным. Следовательно, общее количество отрезков
с положительным наклоном, соединяющих элементы данного
члена, при перестановке столбцов заведомо изменяется на
единицу; поэтому каждый член определителя — а
следовательно, и сам определитель — при перестановке столбцов
меняет знак.
Пусть теперь переставляются не соседние столбцы, а,
например, /-й столбец с к-м столбцом, причём между ними
находится т других столбцов. Эту перестановку можно
осуществить последовательными перестановками соседних
столбцов в следующем порядке: сначала /-й столбец
переставляется с (/+1)-м, далее с (/ + 2)-м, (/ + 3)-м, ..., А-м,
затем получившийся (к — 1)-й столбец (ранее бывший к-м)
переставляется с (А — 2)-м, (к — 3)-м, ..., /-м. Всего
понадобится т-\-1 + т = 2т-\-1 перестановок соседних столбцов;
после каждой из них, по доказанному, определитель
изменяет знак и, следовательно, после конца процесса будет
иметь знак, противоположный начальному (поскольку
2т +1 при любом целом т есть нечётное число).
Следствие. Определитель, имеющий два одинаковых
столбца, равен нулю.
В самом деле, переставляя эти столбцы, мы не изменим
определителя; с другой стороны, по доказанному, он должен
изменить свой знак. Таким образом, Z)= — Д откуда
следует, что D = 0.
Задача
Показать, что из л! членов определителя ровно половина
( "«Г ) получает по определению § 2 знак -f, а вторая половина—
знак —.
2*
20 ОПРЕДЕЛИТЕЛИ [ГЛ. i
Указание. Рассмотреть определитель, все элементы
которого равны единице.
3. Линейное свойство определителя. Это
свойство формулируется следующим образом: если все
элементы j-го столбца определителя D представлены в виде
«линейной комбинации» двух слагаемых:
ау=Х&4 + [1.с4 (* = 1, 2, ..., п)
(X и (1 — фиксированные чист), то определитель D равен
линейной комбинации двух определителей:
D^Wi + vJ)* (9)
причём у каждого us этих определителей все столбцы,
кроме j-го, такие же, как у определителя D, а ]-й
столбец состоит у определителя Dx из чисел &ь у
определителя Б^ — из чисел С\.
Действительно, всякий член определителя D можно
представить в виде
aaiifla22 . . . a^j ... a*nn — aaiia*22 .. . (X6ay + |xcay) ... aann =
= Xaaiia*22 ... Kj ... aa|lIl +1^10^2 ..• сЛ. ... аапП.
Собирая вместе первые слагаемые (с теми знаками, которые
имели соответствующие члены первого определителя) и
вынося за скобки число X, получим в скобках, очевидно,
определитель £)г; аналогично, собирая вторые слагаемые
и вынося за скобки число (i, получим определитель £)а.
Таким образом, формула (9) установлена.
Эту формулу удобнее записать несколько в ином виде.
Пусть D — произвольный фиксированный определитель.
Обозначим через Dj(pi) определитель, который получается
при замене элементов /-го столбца определителя D на
числа pi (& = 1, 2, ..., п). Тогда доказанное нами
равенство (9) получает вид
Dj (Xftt + act) = Щ (bi) + u.Di (a).
Линейное свойство определителя без труда
распространяется на тот случай, когда каждый элемент /-го столбца
§ 3]
СВОЙСТВА ОПРЕДЕЛИТЕЛЯ n-го ПОРЯДКА
21
есть линейная комбинация не двух, а любого другого
числа слагаемых:
aij = lbi + \).Ci+ ... +т/ь
в этом случае
Dj (ay) = Dj (kh + jjici + ... + т/i) =
- XZ>, (b{) + pD, (Ci) +...+zDj (A). (10)
Следствие 1. Общий множитель всех элементов
некоторого столбца определителя можно вынести за знак
определителя.
В самом деле, если а^ = ХЬ{, то по формуле (10)
П,{ац) = 0,{Щ) = Щ{Ъ{),
что и требуется.
Следствие 2. £сдгг некоторый столбец
определителя состоит целиком из нулей, то определитель равен нулю.
В самом деле, 0 есть общий множитель элементов
данного столбца; вынося его за знак определителя, получим:
Df(0) = D,(0 • 1) = 0 • D,(l) = Q.
Задача
Вычислить определитель
л __ I ат + bp an + bq I
~~\cm + dp cn + dq\ '
разложив его на слагаемые.
Отв. k = (mq— np){ad— be).
4. Прибавление к одному столбцу
другого столбца с произвольным множителем.
Определитель не изменится, если к элементам одного из
его столбцов прибавить соответствующие элементы любого
другого столбца, умноженные на фиксированное число.
Пусть к /-му столбцу прибавляется /с-й (к Ф /),
умноженный на число X. В полученном определителе ;-й столбец
будет состоять из элементов вида ац + Xaife (i === 1, 2? .. . ? п)~.
Ь силу формулы (10)
Dj (aiy + Xaife) = Dj (aiy) + IDj (aife),
22
ОПРЕДЕЛИТЕЛИ
[ГЛ. 1
Во втором определителе /-й столбец состоит из элементов
ciik, т. е. совпадает с к-м столбцом. По следствию п. 2,
jD/(aife) = 0, откуда
Dj {aij + laik) = Dj (ay),
что и требуется.
Разумеется, и это свойство можно сформулировать
в более общей форме: определитель D не изменяется,ясли
к элементам его j-го столбца прибавить соответствующие
элементы к-го столбца, умноженные на число X, затем
элементы 1-го столбца, умноженные на число |л, ...,
элементы р-го столбца, умноженные на число % (к Ф /,
кф1, ..., кфр).
Задача
Числа 20 604, 53 227, 25 755, 20 927 и 78 421 делятся на 17.
Доказать, что определитель
[206041
15 3 2 2 7
2 5 7 5 5
I 2 0 9 2 7
.7842l|
также делится на 17.
Указание. Умножить первый столбец на 104, второй—на
103, третий —на 102, четвёртый—на 101 и прибавить к последнему
столбцу; использовать далее следствие 1 п. 3.
Все свойства, доказанные нами в этом параграфе для
столбцов определителя, в силу неизменности определителя
при транспонировании (п. 1) остаются справедливыми и для
его строк.
§ 4. Разложение определителя по строке или столбцу.
Алгебраические дополнения
Рассмотрим произвольный, например /-й, столбец
определителя D. Пусть а^ — некоторый элемент этого столбца.
В правой части равенства
D=S(-l)N(ai,a2 enVia*.2 ••• *.-n,
J-mi \ t 1~ JS
задающего определитель D [см. § 2, формулу (6)], соберём
все члены, содержащие элемент ац, заключим их в скобку
§ 4] РАЗЛОЖЕНИЕ ПО СТРОКЕ ИЛИ СТОЛБЦУ 23
и вынесем за эту скобку элемент ai;-. Величина, оставшаяся
в скобке, обозначается через Ац\ она называется алгебраи-
ческим дополнением элемента ац в определителе D.
Так как в каждый член определителя D входит элемент
из /-го столбца, то равенству (6) можно придать теперь
вид
D = aijAu+a2jA2j+ .. .+anjAnj. (11)
Формула (11) называется формулой разложения
определителя D по элементам /-го столбца. Разумеется,
аналогичную формулу можно написать и для любой строки
определителя D; например, для i-й строки мы получим
такое равенство:
D = ацАц + а{2А12 + ... + airlAin. (12)
Формулы (11) и (12) можно использовать для
вычисления определителя. Но при этом необходимо уметь вычислять
алгебраические дополнения; правила для их вычисления
мы приведём в следующем параграфе.
В заключение настоящего параграфа отметим одно
следствие формул (11) и (12), которое будет в дальнейшем
использовано.
Равенство (11) выполняется тождественно относительно
величин aiy, a^, ..., an;-; поэтому оно останется
справедливым, если заменить в нём а^ (i = 1, 2, ..., п) на любые
другие величины. При такой замене величины Ац, A%j, ...
..., Anj остаются неизменными, поскольку они не зависят
от элементов ац. Заменим в правой и левой частях
равенства (11) элементы ац, а<ц, ..., anj на соответствующие
элементы какого-нибудь другого, например А-го, столбца.
Тогда определитель в правой части (11) будет иметь два
одинаковых столбца и по § 3, п. 2 будет равен нулю.
Мы получаем равенство (при к Ф /) <
а\кАц + аыАг, \.v,. + ankAnj = 0. (13)
Аналогично из формулы (12) при / ф i получаем:
* о-нАи + яю^гг + • • • + ainAin'= 0. . (14)
Полученные результаты сформулируем в виде двух теорем;
24
ОПРЕДЕЛИТЕЛИ
[ГЛ. i
Теорема 1. Сумма всех произведений элементов
какого-нибудь столбца (или строки) определителя D на
соответствующие алгебраические дополнения равна самому
определителю D.
Теорема 2. Сумма всех произведений элементов
какого-нибудь столбца (или строки) определителя D на
алгебраические дополнения соответствующих элементов
другого столбца (строки) равна нулю.
§ 5. Миноры. Выражение алгебраических
дополнений через миноры
Если зачеркнуть в матрице n-го порядка некоторую
строку и некоторый столбец, то оставшиеся элементы
естественно образуют некоторую матрицу (п — 1)-го порядка.
Определитель этой матрицы называется минором данной
матрицы га-го порядка (а также минором её определителя D).
Если были зачёркнуты i-я строка и /-й столбец, то
полученный минор обозначается через Мц или Мц(Р).
Мы докажем, что имеет место равенство
4y = (-l)i+'^i/, (15)
с помощью которого вычисление алгебраических
дополнений сводится к вычислению соответствующих миноров.
Доказательство равенства (15) проведём сначала для
случая i = l, /=1. Соберём в правой части равенства (6)
все члены, содержащие элемент ап. Рассмотрим один
из таких членов. Очевидно, что произведение всех его
элементов, за исключением а1Ъ даёт некоторый член
с минора Мц. Так как в матрице определителя D нет
отрезков с положительным наклоном, соединяющих
элемент ап с остальными элементами выделенного члена,
то знак, который приписывается члену апс определителя D,
совпадает со знаком, который приписывается члену с
в миноре Мц. Выбирая должным образом член
определителя Z), содержащий элемент аш и зачёркивая аи,
можно получить любой член минора Мц. Поэтому
рассматриваемая алгебраическая сумма всех членов
определится D, содержащих аи, равна произведению апМХу
§ 5] миноры 25
Но согласно § 4 эта сумма равна произведению апАц.
Следовательно, Ап = М1Ъ что и требуется.
Теперь мы докажем формулу (15) при любых i и /.
То обстоятельство, что при £ = / = 1 эта формула
справедлива, будет нами существенно использовано.
Рассмотрим элемент ац=*а> расположенный на пересечении
i-й строки и /-го столбца определителя D. Переставляя
последовательно соседние строки и столбцы, мы можем
перевести элемент а в левый верхний угол матрицы;
для этого понадобится £ — 1 + / — 1 = £ + / — 2 перестановок.
В результате мы получим определитель Dx с теми же
членами, какие будет иметь исходный определитель Д
если его умножить на (— 1)*+У-2 _. (_ l)i+j\ Минор Мп (D±)
определителя Dv очевидно, совпадает с минором Mij(D)
определителя £>. По доказанному, в определителе D1
члены, содержащие элемент а, составляют в сумме величину
aM11(D1). Поэтому в составе исходного определителя D
члены, содержащие элемент ai;=a, образуют в сумме
величину
(-1)'+>оЛ/и(/>!) = ay (-1) ЫМцф).
Но согласно § 4 эта же сумма равна произведению
апАц. Следовательно, Л{у = ( — 1)*+У Мц\ тем самым
формула (15) доказана полностью.
Пример. Определитель вида
аи О 0 ... О
a21 а22 0 .. . О
я8з аз2 «зз ... О
Dn =
ат &п2 anz
называется треугольным. Разлагая его по первой строке, получим,
что он равен произведению элемента au на треугольный
определитель п—1 порядка
Ai-iH
«22
а32
О
. О
. О
апп
26 ОПРЕДЕЛИТЕЛИ [ГЛ. 1
Определитель Z)n-i снова разложим по первой строке; получим,
что .#n-i:=a22-£n-2> где Цп„2 — треугольный определитель (п—2)-го
порядка. Продолжая таким образом далее, в конце концов получим:
Dn~ana,22 ... #лл«
§ 6. Практическое вычисление определителей
Формула (12) приобретает особенно простой вид, когда
все элементы i-vi строки, кроме одного, например а^,
равны нулю. В этом случае
D = aikAik, (16)
и вычисление определителя D л-го порядка
непосредственно приведено к вычислению определителя (га — 1)-го
порядка. Но если при а^ФО в i-й строке есть элемент а^,
также не равный нулю, то мы можем вычесть из /-го
столбца определителя D i-й столбец, умноженный
на Х = ——; в результате мы получим определитель, рав-
aik
ный исходному (§ 3, п. 4), у которого /-й элемент 1-й
строки уже равен нулю. Повторяя аналогичные операции,
мы можем от любого определителя с фиксированным
элементом dik Ф 0 перейти к определителю, у которого все
элементы i-й строки, кроме а&, равны нулю, и вычислить
его по формуле (16). Разумеется, аналогичные
преобразования можно производить и со столбцами определителя,
Пример. Вычислим определитель 5-го порядка
1-250-1 3 I
10 3 7 -2
Dsss\ 3—1 0 5 —5
2 6-4 1 2 "
0-3-1 2 3 |
В третьем столбце этого определителя уже имеется два нуля.
Чтобы получить в этом столбце ещё два нуля, нужно ко второй
строке прибавить утроенную пятую, а из четвёртой строки вычесть
учетверённую пятую. После этой операции и разложения опре-
§ 6] ПРАКТИЧЕСКОЕ ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ 27
делителя по третьему столбцу мы получаем:
Z) =
5
-9
-1
18
-3
О
о
о
О -7
-1 2
-1 3
13 7
5 -5
10
3
= (-1)3+5 . (-1)
-2 5-1 3
1 -9 13 7
3-1 5-5
2 18 -7 -10
-2 5-1 3
1 -9 13 7
3-1 5-5
2 18-7 -10
Теперь проще всего можно получить три нуля в первом столбце:
для этого мы прибавим^ к первой строке удвоенную вторую,
а из третьей и четвёртой строк вычтем вторую, соответственно
утроенную и удвоенную:
D= —
-2 5-13
1 -9 13 7
3-1 5-5
2 18 -7 -10
0-13 25 17
1 -9 13 7
0 26 -34 -26
0 36 -33 -24
= -(-1)
1+2
-13 25 17
26 -34 -26
36 -33 -24
Чтобы легче было вычислить полученный определитель 3-го
порядка, постараемся уменьшить абсолютные величины его
элементов. Для этого после вынесения из второй строки общего
множителя 2 прибавим вторую строку к первой и из третьей
строки вычтем удвоенную вторую:
Z)=2
-13 25 17
13 -17 -13
36 -33 -24
= 2
0 8 4
13 -17 -13
10 1 2
= 2-4
0 2 1
13 -17 -13
10 1 2
28
ОПРЕДЕЛИТЕЛИ
[ГЛ. 1
В первой строке имеется уже один нуль. Чтобы получить ещё
один нуль, вычтем из второго столбца удвоенный третий; после
этого определитель легко вычисляется до конца:
2) = 8
0
13
10
2
-17
1
1
-13
2
= 8
0
13
10
0
9
-3
1
-13
2
= 8 (-1)1 + 3
13
10
= 8-3
13
10
=8 • 3(-13-30)= -8-3-43= -1032.
Задачи
1. Вычислить определители
Ai-
246 427 327
1014 543 443
-342 721 621
2 1111
13 111
114 11
1115 1
11116
Отв. A!=— 29 400 000, Д2 = 394.
2. Вычислить определитель
Р(х)-
112 3
1 2—я2 2 3
2 3 15
2 3 1 9-я2
Указание. Очевидно, Р(х) есть многочлен 4-й степени.
Можно подсчитать его старший коэффициент, а затем определить
его корни из условия совпадения строк определителя.
Отв. Р(ж) = — 3(я2 — 1) (я2—4).
3. Вычислить определитель я-го порядка
Д =
X
а
а
1 а
а
X
а
а
а .
а .
х .
а .
. а
. а
. а
. . х
Указание. Прибавить все столбцы к первому.
Отв. Д = [я+ (п— 1)а] {х — а)п~К
1] ЙРАВИЛО КРАМЕРА 2§
4. Вычислить определитель Ван дермоида
. . 1 I
. . %п \
. . л*
гп-1
• • хп I
Указание. Вычесть первый столбец из всех последующих,
разложить по первой строке, затем из каждой строки вычесть
предыдущую, умноженную на хг\ далее использовать индукцию.
Отв. &(хи а?2, . ..,Яп) = (#2 — хх) (я3 — хх).. .(#п —хх) X
X (#3 — #2).. .(#п —#2) X
§ 7. Правило Крамера
Мы можем перейти теперь к решению систем линейных
уравнений. Рассмотрим сначала систему специального
вида
а1ХХх + а12х2 + ,.. + а\пХп = Ьь "|
а21хг + а22^2 + • • • + а-гпХп = Ь2,
:::::::::::::::: : > (17)
с числом неизвестных, равным числу уравнений.
Коэффициенты ay (if /= 1, 2, ..., п) образуют основную матрицу
системы, относительно которой мы предположим, что её
определитель D отличен от нуля. Мы покажем, что
такая система всегда совместна и определённа, и получим
формулу для вычисления её единственного решения.
Допустим сначала, что система (17) имеет некоторое
решение с1ус2, ..., сп; справедлива, следовательно, система
Д («1,321 '••>жп) =
1 1
Xi #2
х\ х%
ja—\ „n-
SO ОПРЕДЕЛИТЕЛИ [ГЛ. i
равенств
fliici + ^12^2 + ... + а1псп = bl9 }
а21сг + a22^2 + ... + а2псп = Ь2>
ЯпЛ + «П2^2 + . . . + ^wAi = Ь
■ \
(18)
Умножим первое из равенств (18) на алгебраическое
дополнение Ац к элементу ап в матрице системы, далее
умножим второе равенство на А21> третье—на Аъх и т. д.,
пока не дойдём до последнего равенства; затем все
полученные равенства сложим. В результате мы получим
следующее соотношение:
{а11А11 + а21А21 + .,
+ {а1гАг1 + а22А21 + .
+ {йгпАп + а2пА21 + .
= Mu + b2A21 + .
.+«nl^nl)C! +
• 4" ^n2^ni) ^2 + •
. + ЬпАп1.
(19)
В силу теоремы 1 коэффициент при сг в соотношении (19)
равен самому определителю D\ в силу теоремы 2
коэффициенты при всех остальных Су(/ =£ 1) обращаются в нуль.
Выражение в правой части есть разложение определителя
Di
0i аХ2... а1п
о2 й22... а2п
ап2.
по первому его столбцу; поэтому равенство (19) можно
теперь записать в виде
откуда
И1
ПРАВИЛО КРАМЕРА
31
Совершенно аналогично можно получить выражение
-£(_
ei=i>
(/-1,2, ...,п),
(20)
где
Я/
а1г а12.. .ai,y_i Ьг ai.j+i • •. я1п
a2i a22. • .^2, j-l 62 a2,j + l • • • a2n
Ct>nl #712* • «Яп,У—1 ^П ^Tl,J+l • • «#7171
= 2МЬ4)
есть определитель, полученный из определителя D заменой
его /-го столбца на столбец из чисел bl7 Ь2, ..., Ьп.
Мы получили следующий результат:
Если решение системы (17) существует, то оно
выражается черев коэффициенты системы и правые части
по формулам (20). В частности, мы получаем, что
решение системы (17), если оно существует, единственно.
Теперь остаётся показать, что решение системы (17)
всегда существует. Рассмотрим величины
d =
Di
(7 = 1,2,
п)
и подставим их в систему (17) на место неизвестных,
хъ х2,..., хп. Покажем, что все уравнения системы (17)
при этом обращаются в тождества. Действительно, для
1-го уравнения мы получаем:
auCi + ai2c2+ ... +агПсп = ац -~+ai2 -^ + ... +а1п-^ =
= ~^ 1>и (Мп + Ь2А21 + ... + ЬпАп1) +
+ «12 (Ml2 + М22 + • • • + ЬпАп2) + . . .
•«. +<iin (biAln -f Ь2А2п + ... + ЬпАпп)] ==
= "5" t&1 (а*^11 + ^12 + • • • + ОщАщ) + • • .
. . . + &i (а41Лг! + Я{2^12 + • • • + «in^in) + • . .
• • • + Ьп (ацАпХ + Я{2^п2+ • • • + ainAnn)].
32 ОПРЕДЕЛИТЕЛИ [ГЛ. 1
Из всех скобок, служащих коэффициентами при
величинах blf b2, ... ,ЬП) отлична от нуля в силу теорем 1 и 2
только одна, именно та, которая стоит при величине Ьи
она равна самому определителю D. Следовательно,
полученное выражение приводится к виду
т. е. совпадает с правой частью i-ro уравнения системы.
Итак, величины Cj действительно образуют решение
системы (17). Тем самым мы получили следующее правило
для получения решения системы (17) (правило Крамера):
Решение системы (17) (и притом единственное)
получается, когда берут в качестве значения неизвестного Xj
дробь, знаменателем которой является определитель
системы (17), а числителем—-определитель, получающийся
заменой j-го столбца в определителе системы (17) на
столбец из правых частей системы.
Нахождение решения системы (17), таким образом,
сводится к вычислению определителей.
Задача
Решить систему уравнений
хх + 2*2 + 3*3 + 4*4 -f 5*5 = 13,
2*1 + *2 + 2*8 + 3*4 + 4*б = 10,
2*г + 2*2 + *3 + 2*4 + 3*5 = И,
2хх + 2*2 + 2*3 + *4 -f 2*5 = 6,
2*х + 2*2 + 2*3 + 2*4 + *5 = 3.
Отв. ^1 = 0, с2 = 2, ^з ——2, с4 = 0, е5 = 3.
Способы решения более общих систем (с
определителем, равным нулю, или с числом уравнений, не равным
числу неизвестных) будут даны в двух следующих главах.
Замечание. Иногда встречаются системы линейных
уравнений, свободные члены которых являются пе числами, а
векторами (в аналитической геометрии, в механике). Теорема
Крамера и её вывод остаются справедливыми и для этого случая:
следует иметь только в виду, что и значения неизвестных
§ 8] МИНОРЫ ПРОИЗВОЛЬНОГО ПОРЯДКА 33
xl,xit...,xn будут не числами, а векторами. Например, система
Xi-\-x2=*i—y ,
имеет решение (единственное)
§ 8. Миноры произвольного порядка. Теорема Лапласа
Теорема § 4 о разложении определителя по строке или
столбцу является частным случаем более общей теоремы
о разложении определителя по целой совокупности строк
или столбцов. Прежде чем сформулировать эту общую
теорему (теорему Лапласа), введём некоторые новые
определения.
Пусть в квадратной матрице п-то порядка указаны
произвольно к<п различных строк и столько же
различных столбцов. Элементы, стоящие на пересечениях этих
строк и столбцов, образуют квадратную матрицу порядка к;
её определитель называется минором к-го порядка данной
матрицы п-то порядка (а также минором k-то порядка
определителя D) и обозначается через
Af-Af*1,i.2,",,i.k
где iXi i2, . .., ih — номера выделенных строк, а Д, /2, ...
..., ]\ — номера выделенных столбцов.
Если зачеркнуть в исходной матрице строки и столбцы,
участвующие в построении минора М', то оставшиеся
элементы снова образуют квадратную матрицу порядка п — к;
её определитель называется минором, дополнительным
к минору М, и обозначается символом
Т7_1^.ь *»•••■•**
В частности, если исходный минор имеет порядок 1,
г. е. совпадает с некоторым элементом ац определителя D,
то дополнительный минор совпадает с минором Мц, о
котором шла речь в § 5.
3 Г Е. Шилов
?А ОПРЕДЕЛИТЕЛИ \.ГЛ. Д
Рассмотрим минор
м 1 = л/1.« *
1 1, 2, .-., fe*
построенный на первых к строках и первых к столбцах
определителя D\ минор, дополнительный к нему, есть минор
Выделим в иравой части формулы (6) § 2 все те
члены определителя, первые к элементов которых
принадлежат минору Mlt а следовательно, остальные п— к
элементов—минору Мх. Фиксируем сначала один из таких
членов с тем, чтобы определить знак, который должен
быть ему приписан; обозначим этот член через с.
Первые к элементов этого члена определяют некоторый
член сг минора Мх\ обозначим через Nx число
соответствующих отрезков положительного наклона; тогда знак,
который должен быть поставлен перед членом сг в
миноре Мг, определяется выражением ( — l)Nl. Остальные
п — к элементов члена с определяют некоторый член с2
минора М2] знак, который должен быть поставлен перед
этим членом в миноре М2, определяется выражением (— 1) 2?
где N2 — число соответствующих отрезков положительного
наклона в миноре /¥2. Поскольку в матрице
определителя D нет ни одного отрезка с положительным наклоном,
который соединял бы элемент минора Мг с элементом
минора М2, общее число отрезков положительного наклона,
соединяющих элементы члена с, равно сумме iVx + iV^
Поэтому знак, который следует поставить перед членом с,
определяется выражением (■—l)^1"1"^2 и, следовательно,
равен произведению знаков членов сх и с2 в минорах Мг
и М2. Заметим, далее, что произведение любого члена
минора А/\ на любой член минора М2 даёт нам один из
выделенных членов определителя D. Отсюда вытекает,
что сумма всех выделенных членов в выражении
определителя D по формуле (6) § 2 равна произведению
миноров Мх и М2.
Теперь решим аналогичную задачу для произвольного
минора М! = Л//*' j22\ [[[] ;£ с дополнительным минором М2.
§ 8].
МИНОРЫ ПРОИЗВОЛЬНОГО ПОРЯДКА
35
Переставляя последовательно соседние строки и столбцы,
мы можем минор Мх перевести в левый верхний угол
определителя D; для этого понадобится всего (н — \)т
+ (i,-2)+...+(ifc-*)+(/1-l) + (/«-2) + ... + (/*-*)
перестановок. В результате мы получим определитель Dx
с теми же членами, какие будет иметь исходный
определитель D> если его умножить на ( — 1)*+>, где i = ii+i2+ ...
та. -f ik, j = h + h + • • • + /*• По доказанному, в
определителе Dx сумма всех тех членов, первые к элементов
которых входят в минор Ми равна произведению МгМ2.
Отсюда следует, что сумма соответствующих членов
определителя D равна произведению
где величина А2 = ( — l)i+J'M2 называется алгебраическим
дополнением минора Мг в определителе D. Иногда
употребляют обозначение
А —."4*1» *2, ..., г/с
/±2— лл, ;г, ..-, )к »
где индексы указывают на номера вычеркнутых строк
и столбцов.
Фиксируем теперь в определителе D строки с номерами
Ну Ч, • • •»ik- В каждый член определителя D входят
некоторые элементы из этих строк. Если собрать вместе все
такие члены, у которых элементы выделенных строк
принадлежат к фиксированным столбцам с номерами /ъ /2, ...
. . ., jkt то, по доказанному, сумма всех этих членов будет
равна произведению минора М)\\ )1\;;;; }£ на
соответствующее алгебраическое дополнение. Все члены определителя,
таким образом, можно разбить на группы, каждая из
которых определяется заданием к столбцов. Сумма членов в
каждой группе равна произведению соответствующего
минора и его алгебраического дополнения. Поэтому весь
определитель представляется в виде суммы
Г) ~ \} л,гП. i2, ..-, ifc^ii, i2, .... гь /0/i\
~ ~ ZJ iri n, h,.... fb*h, /2,..., /и» \*Ч
причём суммирование производится при фиксированных
3*
36 ОПРЕДЕЛИТЕЛИ [ГЛ. t
индексах ilt i2, ...,ife (индексы выбранных строк) но всем
возможным значениям индексов столбцов /\, /г> ••-,/&
(l</i < /2 < • • • < /л<и). Свойство определителя D,
выражающееся равенством (21), и называется теоремой
Лапласа. Очевидно, формула (21) действительно является
обобщением формулы разложения определителя по одной
строке, полученной в § 4.
Пример. Определитель вида
а21
llk
*2/i
am
zkk
О
О
ak+\, l '" afc+l, ft aft+l, ft+1 '' * afe + l, n
*nl
*nh
%n, ft+l
все элементы которого, находящиеся в первых к строках и
последних п — к столбцах, равны нулю, называется
квазитреугольным. Для его вычисления разложим определитель по первым к
строкам с помощью теоремы Лапласа. В сумме (21) останется только
одно слагаемое, и мы получим:
П-
Задача
ап
lik
чн
lkk
aft+i, fc+i
wft+l, n
X ft+i
Сформулировать и доказать теорему, находящуюся в таком же
отношении к теореме Лапласа, в каком теорема 2 находится
к теореме 1 (см. § 4).
Отв.
Ед/ii, i.2, ... \к . -~л%ъ н *ft_л
где ix < *2 < ••• < *к и *i < *2 < • • • < *ь фиксированы, причём
хотя бы одно из ia не совпадает с соответствующим i^ (Коши).
§ 9] О ЛИНЕЙНОЙ ЗАВИСИМОСТИ МЕЖДУ СТОЛБЦАМИ 37
§ 9. О линейной зависимости между столбцами
определителя
1. Пусть нам дано несколько, например mf числовых
столбцов по п чисел в каждом:
1 йх1
«21
1 «nl
г ^2==
1 «12 1
«22
«п2
1 , . . ., Л т —
1 «lm 1
«2т
0"пт
Умножим каждый элемент первого столбца на
некоторое число \ъ каждый элемент второго столбца —на
число >>2, • • • 7 каждый элемент последнего, m-го, столбца
на число Хт и сложим соответствующие элементы
полученных столбцов. В результате получится некоторый новый
числовой столбец, элементы которого мы обозначим
буквами Сх, с2> • • -,Ст- Все эти действия можно наглядно
представить с помощью следующей схемы:
1 ап
«21
1 «nl
+х2
1 а12 1
«22
1 «n2 J
или короче
>ч^1 +Ь%Аъ+ ... +ХтЛт = С\
где через С обозначен получившийся столбец. Этот
столбец С называется линейной комбинацией взятых столбцов
Аъ Аъ ..., Ат; числа Хь Х2, •. ♦, Хт называются
коэффициентами этой линейной комбинации.
Теперь представим себе, что наши столбцы взяты
не сами по себе, а входят в состав некоторого
определителя D п-го порядка. Докажем следующую теорему:
1 «lm
«2m
*
anm
=?
с1
С2
1
On J
38 ОПРЕДЕЛИТЕЛИ [ГЛ. 1
Теорема 3. Если один из столбцов определителя В
является линейной комбинацией других столбцов, то D = 0.
Доказательство. Пусть, например, g-й столбец
определителя D является линейной комбинацией /-го,
&-го, . .., р-го столбцов этого определителя с
коэффициентами, соответственно, Х;, Xfe, . ..,ХР. Тогда, вычитая из
q-io столбца /-й столбец, умноженный на Х;-, затем А-й
столбец, умноженный на Xfe, . . ., наконец, р-й. столбец,
умноженный на Хр, мы согласно § 3, п. 4 не изменим
величины определителя i); но в результате q-u столбец будет
состоять из одних нулей, откуда и вытекает, что# = 0.
Замечательно, что справедлива и обратная теорема:
если заданный определитель D равен нулю, то один (по
меньшей мере) из его столбцов является линейной
комбинацией других столбцов. Доказательство этой теоремы
требует некоторых предварительных построений, к которым
мы и переходим.
2. Пусть опять имеются т числовых столбцов по п
элементов в каждом. Мы можем записать их в виде матрицы
с п строками и т столбцами:
А^
#21 #22
#lm
#2т
#ni #п2
Если фиксировать некоторое число к столбцов этой
матрицы и такое же число к её строк, то элементы,
стоящие на пересечениях указанных столбцов и строк,
естественно образуют квадратную матрицу А-го порядка. Её
определитель называется минором к-го порядка матрицы А;
он может быть равен нулю или отличен от нуля. Если
среди чисел а^ есть отличные от нуля (что мы всегда
будем предполагать), то всегда можно указать целое число
г, обладающее такими свойствами:
а) у матрицы А имеется минор л-го порядка, отличный
от нуля^
б) всякий минор матрицы л, имеющий порядок г+1
я выше (если вообще тазовые существуют), равен нулю.
\
9]
О ЛИНЕЙНОЙ ЗАВИСИМОСТИ МЕЖДУ СТОЛБЦАМИ 39
Число г, обладающее^ указанными свойствами,
называется рангом матрицы Л. Если все а^ равны нулю, то
ранг матрицы считается равным нулю (г — 0). В
дальнейшем мы предполагаем, что г > 0. Тот минор r-то порядка,
который отличен от нуля, называется базисным минором
матрицы А. (Разумеется, у матрицы А может быть и
несколько базисных миноров; но все они имеют один и тот же
порядок г.) Столбцы, на которых построен базисный минор,
называются базисными столбцами.
Имеет место следующая важная теорема:
Теорема 4 («Теорема о базисном миноре»).
Любой столбец матрицы А является линейной
комбинацией её базисных столбцов..
Доказательство. Положим для определённости,
что базисный минор матрицы А расположен в первых г
строках и первых г столбцах матрицы А. Пусть s— любое
целое число от 1 до т, к — любое целое число от 1 до.п.
Рассмотрим определитель (г + 1)-го порядка
D =
а11 а12
^21 ^22
alr ai$
#2r ^г$
&Г1 * &г2
ar
ar
akr flfes
Если &0, определитель D, очевидно, равен нулю,
так как в нём имеются две одинаковые строки.
Аналогично Z> = 0 при $</*.
Если к > г и s > г, то] определитель D также равеп
нулю как минор (г+1)-го порядка матрицы ранга г.
Следовательно, D — 0 при любых значениях к и s.
Разложим определитель D по последней строке; мы получим
равенство
ak\Aki + ak2Ak2-h ... +aftr^kr + afes4fes==0, (Щ
где числа Aki* Акг, ..., Акг, - Aus означают алгебраиче
ские дополнения элементов ан> а&2> •.• •> akr> ahs> ЫЯХ9
дящихся в нижней строке определителя D. Эти алгебрай
40 ОПРЕДЕЛИТЕЛИ [ГЛ. 1
леские дополнения не зависят от числа А, так как
образуются с помощью элементов ац с iO; поэтому мы можем
ввести обозначения
-4ft 1 =Ci, Ak2=sC2y . • •, Akr — Cr< Ak8 = Cs.
Подставляя в равенство (22) последовательно
значения А=1, 2, ...,п, получим систему равенств
Ciflu + С2а12" + . .. + Сга1г + С8аи = 0,
} (23)
Ci^ni + С2йп2 + • • • + Cranr -f- Csan$ —
o. J
Число Cs=:J[fts отлично от нуля, так как AkS есть
базисный минор матрицы А. Разделяя каждое из равенств
(23) на Cs, перенося все слагаемые, кроме последнего,
С ■
в правую часть и обозначая—-~ через Ху (/= 1, 2,..., г),
мы получаем:
а1« = Х1я11 + Х2а12 + .. • + Хга1г, "|
«2s — ^i#2i +^2а22 + -. • + Хга2г> I
; = XjGn! + Х2ап2 + • • • + Хг аг
(24)
Эти равенства показывают, что 5-й столбец матрицы А
является линейной комбинацией первых г столбцов этой
матрицы (с коэффициентами Хь Х2,..., Хг). Поскольку
s может быть любым числом от 1 до т, наша теорема
полностью доказана.
3. Мы можем теперь доказать сформулированное
в конце п. 1 обращение теоремы 3.
Теорема 5. Если определитель D равен нулю, то
у него имеется столбец, который является линейной
комбинацией других столбцов.
Доказательство. Рассмотрим матрицу
определителя D. Поскольку /)=».(), базисный минор этой матрицы
§ 9] О ЛИНЕЙНОЙ ЗАВИСИМОСТИ МЕЖДУ СТОЛБЦАМИ 41
имеет порядок г <п. Поэтому после указания г базисных
столбцов мы сможем найти ещё по меньшей мере один
столбец, не попавший в число базисных. В силу теоремы
о базисном миноре он представляет собой некоторую
линейную комбинацию базисных столбцов. Итак, мы нашли
у определителя D столбец, который является линейной
комбинацией других столбцов, что и утверждалось.
Заметим, что в состав этой линейной комбинации
можно включить и все оставшиеся столбцы определителя Z),
поставив перед ними, например, нулевые коэффициенты.
4. Полученные результаты можно сформулировать
в несколько более симметричном виде.
Если коэффициенты Хь Х2, ..., Xw линейной
комбинации т числовых столбцов Al9 А2, ..., Ат (см. п. 1)
взять равными нулю, то очевидно, что в результате
получится нулевой столбец, т. е. столбец, состоящий из одних
нулей. Но возможно, что нулевой столбец получается из
заданных столбцов не только таким способом, а и с помощью
коэффициентов Хх, Х2, ..., Хт, из которых не все равны
нулю. В этом случае взятые столбцы Аг, А2, ..., Ат
называются линейно зависимыми.
Например, столбцы
1 1
2
3
4
^2 =
2
4
6
8
, . А3 —
1 1 1
1
1
1 1 J
линейно зависимы, так как нулевой столбец получается в
результате линейной комбинации
2.^ — 1 . Л2 + а- А3.
Определение линейной зависимости можно
сформулировать более подробно так: столбцы
«11
«21
|<*nl|
| , А2 =
«12
«22
«П2
42 ОПРЕДЕЛИТЕЛИ [ГЛ. \
называются линейно зависимыми, если существуют
величины Хь Х2, ..., Хт, не все равные нулю, такие, что
удовлетворяется система уравнений
Mil + Ml2 + • • • + ^malm = 0» )
М21 + М22 + ... + Xma2m = О, J
. }
Mm + Mn2 + • • • + ^m = 0, j
или, что то же самое,
Мх + Мг+.-.+ЬпД^О.
Если один из столбцов Alt А2, -.., ^4т, например
последний, является линейной комбинацией остальных
Лт = Mi + Мг + ... + Xm-i4,i-i> (25)
то можно утверждать, что столбцы А1у А2, . . ., -4т
линейно зависимы. Действительно, соотношение (25) равносильно
соотношению
М1 + М2+ ••• +Vi4-i-4s0*);
следовательно, существует линейная комбинация столбцов
Лъ 42, . .. УАт, коэффициенты которой не все равны нулю
(например, последний коэффициент равен — 1) и которая
даёт в результате нулевой столбец; это и означает
линейную зависимость столбцов Аг, А2, ..., Ат.
. Обратно, если между столбцами Al9 А2, ..., Ат имеется
линейная зависимость, то можно утверждать, что (по
меньшей мере) один из этих столбцов является линейной
комбинацией остальных. В самом деле, пусть в равенстве
Mi + М2 + • • • + Vi4-i + К^т = 0, (26)
выражающем линейную зависимость столбцов Al9 А2, .. .
. .., Ат, отличен от нуля, например, коэффициент Хт. Тогда
соотношение (26) равносильно соотношению
Л — — Ь_ A4^h. Л __ *m-i л ,
ш~ X™ х X™ 2 '"■ X™ т"ь
*) В правой части символ 0 означает нулевой столбец.
§ 93 О ЛИНЕЙНОЙ ЗАВИСИМОСТИ МЕЖДУ СТОЛБЦАМИ 43
которое показывает, что столбец Ат является линейной
комбинацией столбцов Аъ А2, . . ., Ат.г.
Итак, столбцы А±, А2, . . ., Ат линейно зависимы тогда
и только тогда, когда один из этих столбцов является
линейной комбинацией остальных столбцов.
Теоремы 3 и 5 показывают, что определитель D равен
нулю тогда и только тогда, когда один из его столбцов
является линейной комбинацией остальных столбцов.
Используя полученное свойство, мы можем
сформулировать следующую теорему:
Теорема 6. Определитель D равен нулю тогда
и только тогда, когда между его столбцами существует
линейная зависимость.
5. Так как при транспонировании определителя его
величина не меняется (§ 3, п. 1), а столбцы заменяются
строками, то во всех формулировках настоящего
параграфа столбцы можно заменить на строки. В частности,
имеет место следующий результат:
Определитель D равен нулю тогда и только тогда,
когда между его строками существует линейная
зависимость.
Задачи
1. Построить четыре столбца из четырёх чисел в каждом,
которые не были бы линейно зависимыми.
Указание. Достаточно, чтобы соответствующий
определитель 4-го порядка был отличен от нуля.
2.^ Показать, что если строки некоторого определителя п-го
порядка линейно зависимы, то линейно зависимы и его столбцы.
Указание. Использовать результаты пп. 4 и 5.
ГЛАВА 2
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
§ 10. Введение
Система линейных уравнений со свободными членами,
равными нулю, а именно
du^ + a12x2+ . . . +а1пжп = 0, )
021^1 + а22х2 + . . . + а2пхп = 0, |
) (1)
называется однородной линейной системой. Такая система
всегда совместна, так как имеет очевидное «нулевое»
решение хг = х2 = ... = хп =■ 0. Решения/ этой системы
обладают следующим замечательным свойством.
Пусть c[U9 с^{\ . .., с^1) и с{2>, 42), ..., с^2) — два
решения такой системы; образуем числа
Cl = c|i) + C(2)f С, = #>+42>, ...,Сп = <#> + #>. (2)
Утверждается, что съ с2, . .., сп снова обрадуют решение
системы (1). Действительно, подставляя эти числа в i-e
уравнение этой системы, мы получаем:
<t>iiCi*+aiZc2+ . • • +^глсп =
= an (^ + <?>) + ai2 (,#> + cf)) + . .. + ain (#> +Ч2))=
= (aii ^> + ^i2 $)+...+ ain #>) +
+ (/iu C(2) + ai2 cf + . . . + ain 42>) = 0,
что и требовалось.
ft i°3
ВВЕДЕНИЕ
45
Это решение мы будем называть суммой решений
4 с[х\ с{*\ ..., с^1) и с[2), с<22>, ..., с<£\ Аналогично, если
сь с2> • • • у сп — произвольное решение системы (1), то
числа Хсх, Хс2, ..., ХсЛ- при фиксированном вещественном л
образуют также решение системы (1); это решение мы
будем называть произведением решения сь с2, ..., сп
на число X.
Таким образом, решения однородной системы молено
складывать друг с другом и умножать на вещественные
числа.
Объекты, над которыми можно производить операции
сложения и умножения на вещественные числа,
встречаются в различных областях алгебры, анализа и
геометрии. Такими объектами прежде всего являются сами
вещественные (а также и комплексные) числа. Примером
объектов другого типа служат свободные векторы на
плоскости или в пространстве, используемые в аналитической
геометрии и в механике; для них также существуют
операции сложения и умножения на вещественные числа
по вполне определённым правилам. Как мы только что
видели, операции сложения и умножения на числа можно
ввести для решений однородной системы линейных
уравнений—объектов алгебры.
В конце первой главы мы складывали друг с другом
и умножали на вещественные числа столбцы, составленные
из п элементов. Это, если угодно, — объекты арифметики.
В анализе функции, заданные на каком-нибудь отрезке,
также по известным правилам можно складывать и
умножать на вещественные числа. Можно было бы возразить,
что такого рода сопоставления бесполезны, ибо природа
описанных выше объектов совершенно различна, и поэтому
определённые для них операции сложения и умножения
на вещественные числа не имеют ничего общего друг
с другом, кроме разве только названий. На самом деле,
такое заключение было бы преждевременным. Если мы
рассмотрим внимательнее операцию сложения в применении
к разным типам объектов, перечисленным выше, то мы
увидим, что эти операции обладают многими общими
свойствами. Например, во всех случаях результат сложения
не зависит от порядка слагаемых. Далее, во всех случаях
46
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
[ГЛ. 2
удовлетворяется сочетательный закон сложения и
распределительный закон умножения на число относительно 4
сложения; первый из них выражается равенством
(x+y) + z = x-j (y + z)y
а второй — равенством
1(х + у)^кх + 1у,
где х, у, z — произвольные объекты рассматриваемой
совокупности, X —произвольное вещественное число;
удовлетворяются и другие арифметические законы. Вместе с ними
во всех рассматриваемых совокупностях являются общими
все те факты, которые основываются только на этих
законах. Если нас интересуют только такие общие факты, то
нам нет надобности учитывать конкретную природу
объектов данной совокупности; более того, привлечение
конкретной природы объектов может лишь осложнить
исследование второстепенными обстоятельствами, не имеющими
отношения к проблеме*).
Мы введем далее понятие линейного пространства.
Так будет названа совокупность объектов любой природы,
над которыми можно производить некоторые действия,
условно именуемые «сложением» и «умножением на
вещественные числа». Поскольку природа элементов не
задана, мы не можем сказать, как именно производятся
действия над ними; но мы будем предполагать, что эти
действия подчиняются определённым арифметическим
законам, которые будут далее целесообразным образом
сформулированы в виде аксиом.
Элементы линейного пространства мы будем называть
векторами, невзирая на то, что по своей конкретной
природе они могут быть вовсе и не похожи на привычные
нам направленные отрезки. Геометрические представления,
связанные с названием «векторы», помогут нам уяснить
*) Разумеется, это зависит от того, какой степени общности
ставится задача. В гл. 14 мы увидим другую картину: решаемая
там задача требует привлечения конкретной природы ~ объекта,
а общие соображения недостаточны.
§ H]
ОПРЕДЕЛЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА
47
и часто предвидеть нужные результаты, а также находить
прямой геометрический смысл в различных фактах из
алгебры и анализа, который без того не был бы
очевидным. В частности, в следующей главе мы получим
простую геометрическую характеристику всех решений
однородной или неоднородной системы линейных уравнений.
В заключительных главах этой книги мы познакомимся
с геометрической трактовкой рядов Фурье и других
объектов анализа.
§ 11. Определение линейного пространства
1. Множество R (элементы которого далее обозначаются
буквами х, у, z, ... и именуются также «векторами»)
называется линейным (аффинным) пространством, если
1) имеется правило, которое позволяет построить для
каждых двух элементов х я у из R третий элемент z £ R *),
называемый «суммой» элементов х и у и обозначаемый х-\-у\
2) имеется правило, которое позволяет построить для
каждого элемента х 6 R и каждого вещественного числа X
элемент u£R, называемый «произведением элемента х на
число X» и обозначаемый Хя; 3) правила образования суммы
элементов и произведения элементов на число
удовлетворяют следующим условиям:
I. а)х-\-у = у + х для любых х и у из R;
б) (х + у) + z = х + {у + z) для любых х, у, z из R;
в) существует элемент 0 («нуль-вектор») такой,
что х-\~0~х для любого x£R;
г) для каждого x£R существует элемент у £ R
такой, что х-\-у~0 («противоположный элемент»);
II. д) 1 • х =х для любого х£ R;
е) а(фх) = (оф)х для любого x£R и любых
вещественных а и Р;
*) Мы используем здесь и в дальнейшем некоторые
обозначения теории множеств. Запись а £ А означает, что элемент а
входит в множество А; запись В с А означает, что множество В
является частью множества А (причём В может и совпадать с А).
Два соотношения В а А, А С В равносильны утверждению, что
множества А и В совпадают.
Знаки £t с называются знаками включения.
48
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
LFJI. 2
III. ni) (cl + $)x ~ax + $x для любого я£Яи любых
вещественных аир;
з) а(х + у) = ах + <ху для любых х и у из R и
любого вещественного а.
Из аксиом I—III можно получить в первую очередь
следующие теоремы:
Теорема 7. В любом линейном пространстве
существует единственный нуль.
Доказательство. Существование хотя бы одного
нуля, утверждается в аксиоме I. в). Допустим, что в
пространстве R имеются два нуля 0г и 02.
Полагая в аксиоме 1. в) # = 0i, 0 = 02, мы получаем:
Ох+ 02 = 0^
Полагая в той же аксиоме х — 02, 0 — 0Ь мы получаем:
02 + 01-02.
Сравнивая первое из полученных равенств со вторым и
пользуясь аксиомой I. а) находим 01 = 02> что и
требовалось.
Теорема 8. В любом линейном пространстве для
каждого элемента существует единственный
противоположный элемент.
Доказательство. Существование хотя бы одного
противоположного элемента утверждается в аксиоме I. г).
Допустим, что для некоторого элемента & имеется два
противоположных элемента уг и у2. Прибавим к обеим
частям равенства х-\-уг = 0 элемент у2; используя
аксиомы I. б) и I. в), мы получаем:
У 2 + (я + У г) = {У 2 + я) + уг = 0 + ух = уг,
2/2 + (£+2/l) = 2/2 + 0 = 2/2,
откуда ух = 2/2, что и требовалось.
Теорема 9. Для всякого элемента х в любом
линейном пространстве имеет место равенство
0.я = 0
(в правой части равенства 0 означает нуль-вектор, в
левой—число 0).
§ 11] ОПРЕДЕЛЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА 49
Доказательство. Рассмотрим элемент 0 • я +1 х;
используя аксиомы III. ж) и II. д), мы получаем:
0-х + 1 *х = (0 + 1)х = 1 -х = х, 0- х + 1 -х=-0 -х + х,
откуда
х = 0 • х + х;
прибавляя к обеим частям равенства противоположный
к х элемент у, находим:
0 = х + у=(0-х + х) + у = 0-х + (х + у) = 0- я+0 = 0.я,
откуда
0 = 0- х,
что и требуется.
Теорема 10. Для всякого элемента х в любом
линейном пространстве противоположным элементом служит
у = (-1).я.
Доказательство. Составим сумму х + у,
используя аксиомы и теорему 9, находим:
х + у = 1 -х+( — \)-х =(1 — 1) -х = 0-х = 0,
что и требуется.
Мы будем обозначать теперь противоположный элемент
к данному элементу х через —х\ доказанная теорема 10
делает естественным это обозначение.
Наличие противоположного элемента позволяет ввести
операцию вычитания. Именно, разность х — у определяется
как сумма х и —у. Это определение согласуется с
определением вычитания в арифметике.
Если указаны природа элементов х> у, z, ... и
правила действий над ними [причём должны быть выполнены
аксиомы а) —з)], мы будем называть линейное
пространство конкретным.
2. В дальнейшем нам будут особенно важны следующие
три типа конкретных пространств.
Пространство F3. Элементы этого пространства —
свободные векторы, используемые в аналитической
геометрии в пространстве. Каждый вектор характеризуется дли-
4 Г. Е. Шилов
50
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
[ГЛ. 2
ной и направлением *). Сложение векторов определено
обычным образом по правилу параллелограмма.
Умножение вектора на число X определено также обычным
образом (именно, длина вектора умножается на |Х|,
направление при X > 0 остаётся неизменным, при X < 0 — заменяется
на противоположное). Легко проверить, что все аксиомы
а)—з) здесь выполнены. Аналогичные совокупности
векторов на плоскости и на прямой, также представляющие
собой линейные пространства, обозначим соответственно
через V2 и Vx.
Пространство Тп. Элемент этого пространства —
любая совокупность п вещественных чисел: я—(£ь $2, • • •, £л)-
Эти числа $!, £2> • • • > £д будем называть координатами
элемента х. Действия сложения и умножения на число
производятся по следующим правилам:
Щг, Ь, -..;, 6п) = («ъ >4, ..., Ху.
Легко проверить, что аксиомы а) — з) удовлетворены.
В частности, элемент 0 есть совокупность п нулей:
0 —(0, 0, ..., 0). Фактически мы имели дело с
элементами этого пространства в § 9; только мы записывали
тогда их не в форме числовой строки, а в форме столбца.
Пространство С(а,Ь). Элемент этого пространства —
любая непрерывная функция х — x(t)y определённая на
отрезке а < t <. 6. Действия сложения функций и
умножения их на вещественные числа определяются по
правилам анализа; выполнение аксиом а) — з) очевидно. При
этом элемент 0 есть функция, тождественно равная нулю.
Заметим, что все свойства элементов конкретных
пространств (например, векторов пространства У3)>
основанные только на аксиомах I —III, справедливы и для
элементов любых линейных пространств. Например,
анализируя доказательство теоремы Крамера о . решении системы
■*) За исключением ну ль-вектора, длина которого равна пулю,
а направление произвольно.
§ 11] ОПРЕДЕЛЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА Ь\
линейных уравнений
йцХх + а12х2 + • • • 4 а1пхп = Ь1}
0>п1%1~Т 0"п2%2 ~Т~ • • • 4" #nn#n — ^п>
мы можем заметить, ^то оно основывалось в той части,
которая касалась величин blt b2, ..., bn, только на том
факте, что эти величины можно было складывать и
умножать на вещественные числа, причём выполнялись
правила I—III. Это позволило обобщить теорему Крамера
на системы, в которых величины bl9 b2, ..., bn суть
векторы (элементы пространства Vs), как мы уже
указывали в § 7. Это позволяет, далее, утверждать, что теорема
Крамера справедлива и для систем, в которых величины
6Ь Ь2, . .., Ьп суть элементы произвольного линейного
пространства R. Отметим только, что значения
неизвестных хъ х2, ..., хп будут тогда также элементами этого
пространства R, линейно выражающимися через
величины Ьъ 62, . . ., Ьп.
Задачи
1. Образует ли совокупность векторов на плоскости, начала
которых находятся в начале координат, а концы—в пределах
первой четверти, линейное пространство (с обычными операциями)?
Отв. Нет, ибо в пределах этой совокупности нельзя умножать
на — 1.
2. Образует ли линейное пространство совокупность всех
векторов на плоскости с исключением векторов, параллельных
некоторой заданной прямой?
Отв. Нет, ибо в пределах этой совокупности нельзя сложить
два вектора, симметричных относительно заданной прямой.
3. Рассмотрим совокупность Р одних положительных
вещественных чисел. Введём операции по следующим правилам: под
«сложением» двух чисел будем понимать их (обычное)
умножение, а под произведением элемента г £ Р на вещественное число X
будем понимать (обычное) возвышение числа г в степень X.
Является ли Р с указанными операциями линейным пространством?
Отв. Да. В частности, «нулём» пространства Р служит
число 1£Р.
3. Замечание. В аналитической геометрии иногда
бывает удобно рассматривать векторы, не свободные,
4*
52
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
[ГЛ. 2
а закреплённые своим началом в начале координат. Такое
рассмотрение удобно тем, что при этом каждый вектор
ассоциируется с некоторой точкой пространства своим
концом и каждая точка пространства может быть
определена соответствующим вектором,—так называемым
радиус-вектором этой точки. Имея в виду эту картину, мы
будем иногда называть элементы линейного пространства
не векторами, а точками. Разумеется, такая перемена
названия не сопровождается никакими изменениями в
определениях и апеллирует лишь к нашим геометрическим
представлениям.
§ 12. Линейная зависимость
Пусть хъ х2, ..., xk — векторы линейного
пространства Ry Ciy С2, ..., Ck — вещественные числа. Вектор
у = Сгхг + С2х2 -+•...+ Ckxk
называется линейной комбинацией векторов хъ х2, . . ., хъ,
числа Си С2, ..., Ck —- коэффициенты этой линейной
комбинации.
Если С1 = С2— ... = Cft — 0, то в силу теоремы 3
и аксиомы I. в) мы получаем, что у = 0. Но может быть
и так, что существует линейная комбинация векторов
#i, х2у . .., 'Xk, у которой не все коэффициенты равны
нулю и которая тем не менее даёт в результате нуль-
вектор; в этом случае векторы #ь х2, .. ., ^называются
линейно зависимыми. Иными словами, векторы х1у х2, . .., Xk
называются линейно зависимыми, если существуют числа
С it С2у . . ., Ck, не все равные нулю и такие, что
Ctxx + С2х2 + ... + Ckxk = 0. (3)
Если же равенство (3) возможно в единственном случае,
когда Сх = С2 — ... = Ck = 0, векторы яь х2, . .., Xk
называются линейно независимыми.
II римеры
i. В линейном пространстве т/3 линейная зависимость
дг.ух пекторов означает, что они параллельны одной и той
§ 12] ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 53
же прямой; линейная зависимость трёх векторов — что они
параллельны одной и той же плоскости. Всякие четыре
вектора линейно зависимы.
2. Выясним, что означает линейная зависимость
векторов хъ х2, ..., хи линейного пространства Тп. Пусть
вектор xt имеет координаты Eil), £(2г\ . . ., & (i~l, 2,. ,. ,&),
тогда линейная зависимость
С1х1 + С2х2 + ... + Ckxk =. О
означает, что выполняется п равенств
) (4)
c№+cA2)+...+chW=o, J
причём среди постоянных Cl9 C2, ..., С^ имеются
отличные от нуля; это — то самое определение линейной
зависимости, которое мы дали в § 9 для числовых столбцов.
Таким образом, вопрос о линейной зависимости векто-
общем случае сводится к вопросу
о существовании ненулевого решения у однородной системы
уравнений с коэффициентами, равными соответствующим
координатам данных векторов. В следующей главе (§ 20)
этот вопрос будет полностью решён, и тем самым будет
получено правило, позволяющее судить о линейной
зависимости или независимости данных векторов пространства
Тп по их координатам.
Но в некоторых случаях мы можем и теперь уже делать
выводы о линейной зависимости или независимости данной
системы векторов. Пусть, например, в пространстве Тп
взяты п векторов
ех = (1,0, 0, ...,0), е2 = (0, 1,0, ...,0), ...
,.., еп-- (0,0,0, ..., 1),
54 ЛИНЕЙНЫЕ ПРОСТРАНСТВА ,ГЛ. 2
Система (4) для этих векторов принимает вид
С1.1 + С8.0 + С8-0+...+С11.0 = 0,
<V0 + <v i + c3-o + ... +сп.о=о,
Сг -0 + C2.Q + Cs • Of ...+С„- 1=0
и, очевидно, допускает единственное решение Сх = Сх = • • •
... =гСп = 0. Таким образом, векторы ег, е2, . .., еп в
пространстве jTn линейно независимы.
Задача
Показать, что в случае п заданных векторов в пространстве
Тп критерием линейной независимости их служит неравенство
нулю определителя, составленного из координат этих векторов.
Указание. Использовать теорему 6 § 9.
3. Линейная зависимость векторов x1=x1(t), х2~
=x2(t),..., xk = Xk(t) пространства С (а, 6) означает, что
между функциями xx(t), x2(t), ..., Xk(t) имеется
соотношение
С 1*1 (0 + С2Х2 (t) + . . . + CkXk (t) SEE 0,
причём постоянные d, C2y ..., С& не все равны нулю.
Например, функции хх (t) =cos2*, x2(t) — sm2t, x8(t) — i
линейно зависимы, так как имеет место соотношение
si (t) + x2 (t)-x3 (t) = 0.
С другой стороны, проверим, что функции 1, t, t2, . .., th
линейно независимы. Допустим, что существует
соотношение ,
С0-1+С4+...+Ск1к = 0. (5)
Тогда, последовательно дифференцируя к раз
равенство (5), мы получим систему Л: -f-1 уравнений относительно
величин С0, Сх, ..., Си с определителем, заведомо
отличным от нуля (§ 5); решая систему по правилам,
Крамера (§ 7), мы получаем, что
с0=с1==...=с =0.
§ 12]
ЛИНЕЙНАЯ ЗАВИСИМОСТЬ
55
Следовательно, функции 1, t> t2, ...,tk линейно
независимы в пространстве С {а, Ь), что мы и утверждали.
Задача
Показать, что в пространстве С (а, Ъ) функции г *, г 2, ..., t k
линейно независимы, если av а3, ..., о^— различные
вещественные числа.
Отметим два простых свойства систем векторов,
связанных с линейной зависимостью.
Лемма 1. Если некоторые из векторов хг, х2, • • • > хп
линейно зависимы, то и вел система xlf х2у . .., Xk линейно
зависима.
Доказательство. Без ограничения общности можно
принять, что линейно зависимы векторы х1у х2> ..., Xj
(/ < к)\ таким образом, имеет место соотношение
Сххх + С2х2 + ... + CjXj = О,
где среди постоянных Сь С2, . . ., С/ имеются отличные
от нуля. В силу теоремы 3 (§ И) и аксиомы I. в)
справедливо равенство
С1х1 + С2х2-\ ... +CfXj + 0- яу+i-f ... +0 . sfe = 0;
оно показывает, что векторы xlt х2, ..., Xk также линейно
зависимы, так как среди постоянных Съ С2, ..., Cj,
0, .. ., 0 имеются отличные от нуля.
Лемма 2. Векторы хг, х2, . . . , Xk линейно зависимы
тогда и только тогда, когда можно выразить один из этих
векторов как линейную комбинацию других.
Предложение, аналогичное сформулированному, уже
встречалось нам прежде; мы доказывали его в § 9, п. 4
для числовых столбцов. Если мы просмотрим ешё раз
это доказательство, то увидим, что оно основано только
на возможности производить со столбцами операции
сложения и умножения на вещественные числа. Следовательно,
это доказательство можно провести для элементов любого
линейного пространства. Вместе с этим и наша лемма
оказывается справедливой для любого линейного
пространства, что нам и требуется.
56 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
§ 13. Базис и координаты
1. Система линейно независимых векторов е1у е2, ..-., еп
некоторого линейного пространства R образует, по
определению, базис пространства В, если для всякого вектора
x£R существует разложение
х = ^1е1 + ^2е2 + ...+Ьпеп. (6)
Легко видеть, что при указанных условиях
коэффициенты разложения (6) определяются единственным образом.
Действительно, если бы для некоторого вектора х можно
было написать два разложения
я = ^1 + ^2+ •-. + 6, А,,
то, вычитая почленно, мы получили бы равенство
О = (Si — iQi) e± + {12 - т)2) е2 + .. . + (£„ - т\п) ет
из которого в силу предположенной линейной
независимости векторов еъ е2} ..., еп мы получили бы, что
Эти единственным образом определяемые числа ?ь £2> • ••> %п
называются координатами вектора х относительно
базиса еи е2, ..., еп.
2. Примеры
1. В пространстве Vs хорошо известный базис образует
тройка единичных взаимно ортогональных векторов
г, j, k. Координаты £ь ?2> ?з вектора х относительно этого
базиса суть проекции вектора х на координатные оси.
2. В пространстве Тп примером базиса служит система
векторов ег - (1, 0, ..., 0), е2 = (0, 1, ..., 0), ..., еп =
= (0, 0, ..., 1), рассмотренная уже нами в§ 12.
Действительно, для любого вектора x = (bl9 £2> • ..,Sn)6 7\i>
очевидно, имеет место равенство
* = 5; (1, 0 0) + |2 (0, 1, ..., 0)+ ... +S„jP, 0, ..., 1),
§ 13]
БАЗИС И КООРДИНАТЫ
57
которое и доказывает в соединении с уже известной
линейной независимостью векторов еъ е2, • • •> £Л> что эти
векторы образуют базис в пространстве Тп.
В частности, оказывается, что числа tlf ?2> • • •> %п
являются как раз координатами вектора х относительно
базиса еъ е2, ..., еп.
3. В пространстве С (а, Ь) базиса —в том смысле, как
он нами здесь определён, — не существует; доказательство
этого утверждения будет дано в следующем параграфе.
3. Основное значение базиса линейного пространства
состоит в том, что линейные операции в пространстве,
вначале заданные абстрактно, при задании базиса
становятся обычными линейными операциями с числами —
координатами взятых векторов относительно этого базиса.
Именно, имеет место следующая теорема:
Теорема 11. При сложении двух векторов
пространства R их координаты (относительно любого базиса)
складываются. При умножении вектора на число все его
координаты умножаются на это число.
Действительно, пусть х = 1гег + £2е2 + • • ♦ + %пеп> У =
==^161 + ^2^2+... + *IiAi-
Тогда в силу аксиом § 11
я + У = & + 'li) ei + (S2 + %) е2 + ... + (£п + *1п) еп>
Хх = \Ьхег + П2е* + - • • + ХЕпе„,
что и требуется.
Задачи
1. Относительно системы векторов е19 еъ . ..,ел линейного
пространства R известно следующее:
а) Каждый вектор x£R допускает разложение
х = 1хех + £2е2 +... -f ?лел.
б) Для некоторого фиксированного вектора x0£R это
разложение единственно.
Доказать, что система elt e2, ..., еп образует базис
пространства R.
Указание. Показать, что нуль-вектор также допускает
единственное разложение по системе elt e2, ...,en. Отсюда
вывести линейную независимость векторов этой системы.
2. Существует ли базис у пространства Р (§ 11, задача 3)?
Отв. Да, из одного вектора—любого элемента я£Р,
отличного оj J.
58 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
§ 14. Размерность
Если в линейном пространстве R можно найти п
линейно, независимых векторов, а всякие п 4-1 векторов
этого пространства линейно зависимы, то число п
называют размерностью пространства R; само же. простран-.
ство R называют, n-мерным. Линейное пространство,
в котором можно, указать сколь угодно большое число
линейно независимых векторов, называют
бесконечномерным .
Теорема 12. В пространстве R размерности п
существует базис из п векторов] более того, любая
совокупность из п линейно независимых векторов
пространства R является базисом этого пространства.
Доказательство. Пусть. е19 е2, ..., еп — система и&
п. линейно независимых векторов заданного га-мерного
пространства R. Если х — некоторый вектор этого же
пространства, то совокупность. из п +1 векторов
X, в]_, *?2, • • • > ^п
линейно зависима; существует соотношение вида
СоХ + С1е1+,..+Спеп^О, (7)
причём среди коэффициентов. С0, Съ ..., Сп имеются
отличные от нуля. Можно утверждать, что коэффициент
С0 заведомо отличен от нуля; действительно, в противном
случае мы получили бы линейную зависимость между
векторами еъ е2, ..., еп, которая, по предположению,
не имеет места. Но в таком случае обычным путём, т. е.
разделяя уравнение на С0 и перенося все остальные члены
вправо, мы получим, что х линейно выражается через
векторы ег, е2, . . ., еп. Поскольку х — любой вектор
пространства R, мы доказали, что векторы еъ е2, .. ., еп
образуют базис в этом пространстве, что и требовалось.
Следующая теорема 13 обратна по отношению
к теореме 12..
Теорема 13. Если в пространстве R имеется
базис, то размерность этого, пространства равна числу
базисных ъекторов.
§.141*
РАЗМЕРНОСТЬ
59
Доказательство. Пусть векторы еъ е2, ...,еп
образуют базис пространства R. По самому определению
базиса векторы еъ ^2, •. ., еп линейно независимы;
следовательно, у нас уже имеется п линейно независимых
векторов./Покажем, что всякие п + 1 векторов
пространства R линейно зависимы.
Пусть в пространстве R заданы п +1 векторов
4-£(1)е
#1 —Ч ^1~Г?2 '
№)
*. = егч + #)*+...+#Ч
(2)
Выписывая в отдельный столбец координаты каждого из
этих векторов, составим матрицу с п: строками и w-fl
столбцами
й1)й2)...йп+1)
4 =
#^2).
вйп+1)
t(l) t(2) t(«+l)
<m <»п • • • ?n
Если г — 0, то линейная зависимость очевидна. Пусть г>0.
Базисный минор (§ 9) матрицы А имеет порядок г*Сп.
Поэтому после указания г базисных столбцов мы сможем
найти ещё по меньшей мере один столбец, не попавший
в число базисных. Но тогда согласно теореме о базисном
миноре этот столбец является линейной комбинацией
базисных столбцов. Соответствующий вектор
пространства R является линейной комбинацией других векторов
(из числа заданных хи х2, ..., хп+1). Но в таком случае
векторы х1у х2, • • •, Яп+i согласно лемме 2 § 12 линейно
зависимы, что и требовалось.
Примеры
1. Пространство Vs трёхмерно, поскольку оно
обладает базисом из трёх векторов f, j, h (§ 13);
соответственна F2 двумерно, Vi одномерно.
60
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
[ГЛ. 2
2. Пространство Тп тг-мерно, поскольку оно обладает
базисом из п векторов е19 е2, ..., еп (§ 13).
3. В пространстве С (а, Ь) имеется какое угодно
большое число линейно независимых векторов (§ 12) и,
следовательно, это пространство бесконечномерно. Поэтому оно не
имеет базиса: наличие базиса привело бы к противоречию
с теоремой 13. Обобщение понятия базиса на случай
бесконечномерного пространства мы откладываем до
гл. 13.
Задача
Какова размерность пространства Р (§ И, задача 3)?
Отв. 1.
§ 15. Подпространства
1. Допустим, что некоторая совокупность L элементов
линейного пространства R обладает следующими
свойствами:
а) если x£L> y£L, то х + у£Ц
б) если zgL, X — вещественное число, то \x£L.
Таким образом, нам задана совокупность элементов
и в ней определены линейные операции. Покажем, что
мы получаем здесь также линейное пространство. Для
этого нужно проверить для совокупности L с операциями
а)—-б) выполнение аксиом § 12. Аксиомы I. а), б), II
и III удовлетворяются, поскольку они удовлетворяются
вообще для всех элементов пространства R. Остаётся
проверить аксиомы I. в) и г). Пусть х •— любой элемент из L\
тогда по условию \x£L при любом вещественном X.
Возьмём Х = 0; тогда, поскольку по теореме 3 (§ И)
0 • х = 0, нуль-вектор принадлежит подпространству L.
Тем самым выполнена аксиома I. в). Возьмём теперь
Х= —1; поскольку по теореме 4 (§ 11) ( —1)# есть
элемент, противоположный элементу х, то совокупность L
вместе с каждым элементом х содержит и противополож- #
ный элемент. Таким образом, выполнена и аксиома I. г),
и наше утверждение полностью доказано.
Поэтому всякая совокупность LciR,
удовлетворяющая условиям а) и б), называется линейным
подпространством (или просто подпространством) пространства i?,
§ 151 ПОДПРОСТРАНСТВА 61
2. Примеры,
1. Нуль-вектор пространства R образует, очевидно,
наименьшее возможное подпространство пространства R.
2. Всё пространство Л —наибольшее возможное
подпространство пространства R.
3. Пусть Z/x и L2 — два подпространства одного и того
же линейного пространства R. Совокупность всех векторов
ж£/?, принадлежащих одновременно к^и L2, образует
подпространство, называемое пересечением подпространств
Z/j и L2- Совокупность всех векторов вида y + z, где
г/gZ/j, 2gL2, образует подпространство, называемое
суммой подпространств Ьг и L2.
4. В пространстве V3 все векторы, параллельные
какой-либо плоскости (или какой-либо прямой), образуют
подпространство. Если говорить не о векторах, а о
точках (см. §11, п. 3), то подпространствами пространства V3
являются совокупности точек, расположенных на
плоскости (или прямой), проходящей через начало координат.
5. В пространстве Тп рассмотрим совокупность L тех
векторов ж = ($г, £2, •••>U> координаты которых
удовлетворяют некоторой однородной системе линейных
уравнений
а11х1 + апх2+ ..'. +а1пхп = 0, \
а21хх + а22х2 + . • • 4- а2пхп = О, j
■■ . . • / (8)
aklxx + ak2x2 + ... + aknxn =. 0. - )
В § 10 мы видели, что решения этой системы можно
складывать друг с другом и умножать на вещественные
числа, получая при этом снова решения системы. Таким
образом, совокупность L есть подпространство
пространства Тп и, следовательно, в свою очередь является
линейным пространством. Мы будем называть его
пространством решений системы (8). В § 23 мы вычислим
размерность этого пространства и построим его базис.
Задача
В пространстве Vs взяты два различных двумерных
подпространства Li и L2 (две различные плоскости, проходящие
62
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
|ГЛ. 2
через начало координат). Что собой представляют их пересечение
и сумма?
Отв. Пересечение — прямая пересечения двух плоскостей
в обычном смысле. Сумма—всё пространство.
3. Отметим некоторые свойства подпространств,
связанные с определениями § 12 —14.
Прежде всего всякое линейное соотношение,
связывающее векторы х, у, .. ., z в подпространстве L,
справедливо и во всём пространстве R, и обратно: в частности,
факт линейной зависимости векторов х, у, . .., z£L
выполняется одновременно в подпространстве L и в
пространстве R. Если, например, в пространстве R всякие п + 1
векторов линейно зависимы, то это утверждение и
подавно будет выполнено в подпространстве L. Отсюда
вытекает, что размерность любого подпространства L в
Пгмерном пространстве R не превосходит числа п. В этом
случае согласно теореме 12 в каждом подпространстве
LCZR можно построить базис из такого числа векторов,
какова размерность подпространства L. Если в
пространстве./? выбран базис еъ е2, .. ., еп, то в общем случае,
разумеется, нельзя выбрать базисные векторы
подпространства L прямо из числа векторов еъ е2, . .., еп хотя
бы потому, что в подпространство L может не входить
ни один из них. Но можно* утверждать обратное: если
выбран базис Д, /2, . .., Д в подпространстве L
(имеющем для определённости размерность I < я), то всегда
можно дополнительно выбрать векторы Д+1, ..., /п во всём
пространстве R так, что система Д, /2, ..., Д, ..., fn
будет базисом во всём R.
Для доказательства будем рассуждать так. В
пространстве R существуют векторы, которые линейно
не выражаются через Д, /2, ..., Д; действительно, если
бы таких векторов не было, то Д, /2, . . ., Д — по
условию линейно независимые —составляли бы базис
пространства /?, и по теореме 13 размерность R была бы
равна /, а не п. Обозначим через Д+i любой из
векторов, не выражающихся линейно через Д, /2, . .., ДЛ
Система Д, /2, . .., Д, Д+1 линейно независима; в самом
деле, если бы существовало соотношение вида
с\/1 + с,/,+ ...н-с1/| + с1-,1/|+1 = о,
§ 15]
ПОДПРОСТРАНСТВА
63
то при Cz+1 Ф О мы получили бы, что вектор :fl+l можно
линейно выразить через /ь /2, /. ., /z, а при С1+1^=0
получили бы, что векторы /ь /2, .. ., fx линейно
зависимы; оба эти вывода противоречат построению. Если теперь
всякий вектор пространства R линейно выражается через
/ь /2, • • •, /л /«4 1, то система /ь /2, . .., /„ /Н1 образует
базис в й (и/ + 1=«), и наше построение закончено.
Если / + 1 <п, то имеется вектор /z+2, не
выражающийся линейно через Д, /2, . .., /z, /z+1. Таким образом, можно
продолжить построение; в конечном счёте (через я — /
шагов) мы получим базис прострацства R.
Задача
Если размерность подпространства LaR совпадает с
размерностью пространства i?, то L = #.
4. Найдём размерность суммы двух конечномерных
подпространств L и М некоторого линейного пространства Я. Пусть /
и m означают размерности этих подпространств. Обозначим через
К пересечение подпространств L и М и через Л—его размерность.
Выберем в К базис elt е2, ..., eh и, используя соображения п. 3,
дополним его векторами/fe+1, /fe+2» •••' h до полног0 базиса
подпространства L и векторами gkJrV gk+2> •••> вт Д° полного базиса
подпространства М. Каждый вектор суммы L -f М, по самому
определению, есть сумма вектора из L и вектора из Мл поэтому
может быть линейно выражен через векторы elf e2, ..., ek,
//г+1, • ••>//> ^4-1» ••'' $т' Покажем, что эти векторы образуют
базис подпространства L + M. Для этого нам остаётся проверить
их линейную независимость. Допустим, что существует линейное
соотношение вида
а1<?1 + ... +akek+ £ft+1 /fc+1 + ... +P,/j + 7ft+i ^ + 1 + -- + 7m £m = 0,
(9)
причём среди-коэффициентов а1} ..., fm имеются отличные от нуля.
Мы можем тогда утверждать, что имеются отличные от нуля
числа в совокупнос1и Yft+i» •■•> 7m > так как в противном случае
векторы еи е2, ..., ek, fk+i, ..., f% оказались бы линейно зависи_
мыми, что невозможно ввиду того, что они образуют базис
подпространства L. Следовательно, вектор
^ =- Tft+i ^fe+i + - - - + Ym gTm ¥= 0, (10)
иначе векторы g/<+1, ..., gm оказались бы линейно зависимыми.
Но из (9) вытекает, что
—х = а1е1+ ... i-3//7,6L,
в то время как (10) показывает, что х £ М. Таким образом, х
64 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
принадлежит и L, и М и, следовательно, входит в
подпространство К. Но тогда
Поскольку векторы elt е2, . . . , ek, gk+i . . ., gm линейно
независимы, то -](ft+| = . ...=Yjn = 0. Полученное противоречие
показывает, что векторы е19 е2, .. ., ek, /h+1, . . ., /;> grfc+1, ..., gm
действительно линейно независимы.
Согласно теореме 13 размерность подпространства L + М
равна числу базисных векторов ех ek, /k+v .. ., //, gfe+i> •••> g/m
но это число равно 1 + т — к. Итак, размерность суммы двух
подпространств равна сумме их размерностей за вычетом
размерности пересечения.
§ 16. Линейные оболочки
1. Важным способом построения подпространств
является образование линейной оболочки заданной системы
векторов.
Пусть ху у у z, ...—некоторая система векторов
линейного пространства Л; линейной оболочкой системы
Ху у, z, ... называется совокупность всех (конечных)
линейных комбинаций
«*+Ру + т*+--- (и)
с вещественными коэффициентами а, (3, -у, ... Легко
проверить, что для этой совокупности выполнены условия
а), б) § 15, п. 1; поэтому линейная оболочка системы
Ху у у z, ... есть подпространство пространства R. Это
подпространство, очевидно, содержит векторы х, у, z, ...
С другой стороны, всякое подпространство, содержащее
векторы Ху у у Zy ..., содержит и все их линейные
комбинации (И); следовательно, линейная оболочка векторов
х, Уу Zy ... есть наименьшее подпространство у
содержащее эти векторы.
Линейная оболочка векторов я, у, z9 ...
обозначается через L(Xy yy z, ...).
2. Примеры
1. Линейная оболочка векторов elf е2 еп, образующих
базис некоторого пространства i?> очевидно, совпадает со всем
пространством R.
§ 16]
ЛИНЕЙНЫЕ ОБОЛОЧКИ
65
2. Линейная оболочка пары (неколлинеарных) векторов
пространства Vz состоит из всех векторов, параллельных плоскости
этих векторов.
3. Линейная оболочка системы функций 1, t, t2, . . ., t&
пространства С (а, Ь) совпадает с совокупностью всех многочленов от t
не выше, чем к-и степени. Линейная оболочка бесконечной
системы функций 1, t, t2, ... состоит из всех многочленов (любой
степени) от переменного t.
3. Отметим два простых свойства линейных оболочек.
Лемма 1. Если векторы х', у', ... принадлежат
к линейной оболочке векторов х, у, ..., то вся линейная
оболочка L(x'9 у', ...) содержится в линейной оболочке
L(x, у, .. .).
Действительно, поскольку векторы х\ у', ...
принадлежат к подпространству L(x, у, .. .), то все их
линейные комбинации, совокупность которых и составляет
линейную оболочку Ь(х',у\..,), также принадлежат
к подпространству L(x, г/, .. .).
Лемма 2. Всякий вектор системы х, у, ..., ли-
нейно зависящий от остальных векторов этой системы,
можно из неё исключить без изменения линейной
^оболочки.
Действительно, если, например, вектор х линейно
зависит от векторов уу z, ..., то это означает, что
x^L(y1z, . . .). Отсюда и из леммы 1 вытекает, что
L(x, у, z, .. .)(ZL(y, z, ...). С другой стороны, очевидно,
L(yy z, .. .)CZL(x, у> z, .>..). Оба полученных включения
показывают, что L(y, z, .. .) = L(x, у, z, .. .), что и
требуется.
4. Поставим вопрос о построении базиса линейной
оболочки и определении её размерности. При решении
этого вопроса мы будем предполагать, что число
векторов ху у, ..., порождающих линейную оболочку L (#, у,...),
конечно (хотя некоторые из заключений и не будут
существенно требовать такого предположения).
Допустим, что среди векторов х9 у, ...,
порождающих линейную оболочку L(xyyy ...), мы смогли найти
г линейно независимых векторов, —обозначим их через
хх, #2» • • •» хг> — через которые может быть линейно
выражен любой вектор из системы х, у, ... В этом случае мы
можем утверждать, что векторы хъ х%, ..., хг образуют базис
5 Г. Е. Шилов
66 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
пространства L(Xj у, ...). Действительно, всякий вектор
■zCZL(x, у, . ..) по самому определению линейной
оболочки линейно выражается через конечное число
векторов из системы х, у, ...; но каждый из векторов этой
системы по условию линейно выражается через хъ х2, . *.
..., хг\ поэтому в конечном счёте и вектор z может быть
линейно выражен непосредственно через векторы xlf х2, ...
...,хг. В соединении с предположенной линейной
независимостью векторов х19 х2, ..., хг мы получаем
выполнение для них обоих условий базиса (§ 13), что и
требовалось.
Согласно теореме 13 размерность пространства
L(x, у у ...) равна числу г. Поскольку в r-мерном
пространстве не может существовать более чем г линейно
независимых векторов, мы можем сделать следующие
выводы:
A. Если число порождающих векторов х, у,....
больше числа г у то векторы х, у, ... линейно зависимы; если
их число равно числу г, то они линейно независимы.
Бг Всякие г+ 1 векторов из системы х, у, ...
линейно зависимы.
B, Размерность пространства L(xty, ...) может
быть определена как максимальное число линейно
независимых векторов в системе х, у, ...
§ 17. Гиперплоскости
1. Как мы уже видели в § 15, геометрический образ,
соответствующий понятию подпространства, для
пространства V3 в «точечной» (а не «векторной»)
интерпретации есть плоскость (или прямая), проходящая через
начало координат. Но плоскости и прямые, не
проходящие через начало координат, желательно было бы также
включить в круг наших рассмотрений. Замечая, что такие
плоскости и прямые получаются из плоскостей и прямых,
проходящих через начало координат, параллельным
перемещением в пространстве, т. е. сдвигом, мы естественно
приходим к следующему общему построению.
Пусть L — некоторое подпространство линейного
пространства R и х0 — фиксированный вектор, вообще говоря,
§ 17)
ГИПЕРПЛОСКОСТИ
67
не принадлежащий L. Рассмотрим совокупность Н всех
векторов х, которые получаются по формуле
я = #о + 2Л
когда вектор у пробегает всё подпространство L.
Совокупность Н называется результатом сдвига
подпространства L вдоль вектора х0 или гиперплоскостью.
Заметим, что гиперплоскость сама, вообще говоря, не
образует подпространства.
2. Примеры
1. В пространстве V3 совокупность всех векторов,
исходящих из начала координат и кончающихся на
некоторой плоскости y» образует гиперплоскость. Легко
проверить, что эта гиперплоскость является подпространством
в том и только в том случае, когда плоскость f проходит
через начало координат.
2. В пространстве Тп рассмотрим совокупность Н тех
векторов # = (£i, %2, ...,5П), координаты которых
удовлетворяют неоднородной совместной системе линейных
уравнений
а11х1 + апх2 + ... + а1пхп = Ьъ )
a/u#i + акгхг + .. . + aknxn = bk
и совокупность L тех векторов у = (%, у]2, ..., т)п),
координаты которых удовлетворяют однородной системе
линейных уравнений с теми же коэффициентами:
ЧхУх + а12у2 + ... + а1пуп = 0, )
«2i2/i + Я22У2 + • • • + а>гпУп = О,
^kitfi + аъъУг + • • • + аыУп = 0. J
Как мы уже знаем, совокупность L есть
подпространство пространства Тп. Пусть х0 = (£|0), $\ . .., £л°-)
есть некоторое решение системы (12). Покажем, что сово-
5*
(12)
68 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
кудность Л совпадает с совокупностью всех сумм х0 + у,
где у пробегает всё подпространство L. Действительно,
если у = (%, ri2, .. ., т]п) есть некоторое решение системы
(13),TOBeKTopa:=:^0 + ?/-(a(i0) + ^b^20) + ^, • • ., ^0) + %г),
очевидно, является решением системы (12), т. е. входит
в совокупность Н. Обратно, если х есть любой вектор
совокупности Н, то разность у = х — х0 удовлетворяет
уже системе (13), т. е. вектор у входит в
подпространство L. В силу данного нами выше определения
совокупность Н есть гиперплоскость, именно, результат сдвига
подпространства L на вектор х0.
3. Каждой гиперплоскости, хотя она и не представляет
собой подпространства, можно приписать некоторую
размерность. Именно, размерность гиперплоскости Н будем
считать равной размерности того подпространства L,
сдвигом которого была получена эта гиперплоскость.
Чтобы это определение было корректным, нужно
показать, что данная гиперплоскость Н может быть получена
сдвигом только одного подпространства. Для
доказательства этого утверждения допустим, что гиперплоскость
Н есть результат сдвига подпространства L на вектор х0
и в то же время результат сдвига подпространства Z/ на
вектор х'0.
Таким образом, для любого z£H имеем z — x0-{-y9
1де y£L, и в то же время £ = #о + 2/'\ где y'£L'. Отсюда
следует, что L' есть совокупность векторов, определяемых
формулой у' = (х0 — х'0) + у, где у — произвольный вектор
из L, т. е. что подпространство Z/ есть результат сдвига
подпространства L на вектор Хх~х0 — х'0. Покажем, что
вектор хг входит в подпространство L. Нуль-вектор, как
и всякий элемент подпространства Z/, можно
представить в виде Хх + yi, где г/igL (поскольку L' есть сдвиг
подпространства L на вектор хг)\ отсюда следует, что
хг — — уг и поэтому Хх входит в L, что мы и утверждали.
Но в таком случае и всякий вектор у' g U входит в
подпространство L, так как представляется суммой вектора
Xx£L. и некоторого вектора у£L. Следовательно, имеет
место включение V dL. В силу полной симметрии условия
аналогично можно доказать, что LciL\ откуда вытекает,
что L = L't что и требовалось.
§ 18J ИЗОМОРФИЗМ ЛИНЕЙНЫХ ПРОСТРАНСТВ 69
В дальнейшем гиперплоскости размерности 1 будем
называть прямыми линиями, гиперплоскости размерности
2 — плоскостями.
Задачи
1. Определён ли однозначно самой гиперплоскостью вектор
сдвига х0, фигурирующий при её построении?
Отв. Нет. Его можно заменить на любой другой вектор этой
гиперплоскости.
2. Показать, что всякая гиперплоскость HciR обладает
следующим свойством: если х £ Я, у С Я, то ах-\- (1—-а) у£ Н
при любом вещественном а. Обратно, если некоторое
подмножество Н £ Я обладает сформулированным свойством, то Н есть
гиперплоскость. Какая геометрическая характеристика
гиперплоскости содержится в этом свойстве?
Отв. В «точечной» интерпретации: каждая гиперплоскость
вместе с любыми двумя своими точками содержит проходяшую
через них прямую.
3. Гиперплоскости Нх и Н2 имеют размерности
соответственно р и q. Какой (наименьшей) размерности нужно взять
гиперплоскость Н3, чтобы она заведомо содержала в себе и Нг
и #2?
Отв. В общем случае p-\-q + l, если это число не
превосходит размерности всего пространства.
4. Та же задача для трёх гиперплоскостей Н1Г Я2, Я8 с
размерностями р, q и г.
Отв. p-\-q-{-r + 2, если это число не превосходит размерности
всего пространства.
§ 18. Изоморфизм линейных пространств
Теорема И, приведённая нами в § 13, п. 3,
показывает, в частности, что любое линейное пространство Д,
обладающее базисом из п векторов (в частности, любое
д-мерное пространство), по существу не отличается от
любого другого пространства с базисом из п векторов
(например, от пространства Тп): в каждом из них вектор
определяется п числами—координатами Еь Е2> • • • > £п> и
линейные операции над векторами сводятся к совершенно
одинаковым действиям над их координатами. Эта мысль
точно выражается следующей теоремой 14; предварительно
мы введём
Определение. Два линейных пространства R' и R"
называются изоморфными, если между векторами xf g R'
и х" £ R" можно установить взаимно однозначное соот-
70 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
ветствие*), причём так, что 1) если вектору £'£/?'
соответствует вектор #"£ Я", а вектору y'£R' соответствует
вектор у" б R", то вектору х* + у' 6 R! соответствует вектор
х» -\-y" £R"; 2) если вектору x'£R' соответствует вектор
х"£Й" и X — вещественное число, то вектору Хж'
соответствует вектор \x"£R".
Теорема 14. Любые два n-мерных пространства
R' и R" изоморфны.
Доказательство. Обозначим через e'v е'2, ..., еп
базис пространства R' и через е\, е\, ..., вп базис
пространства R". Оба эти базиса существуют в силу теоремы 12.
п
Пусть, далее, х' = 2 Eft^fe"" пР(>извольный вектор про-
странства R'. Поставим в соответствие этому вектору
п
вектор х" = 2 ^квлбД* (имеющий в базисе е£, e\, ..., е£
точно такие же координаты, какие вектор х' имеет в
базисе е'г> е'2, ...,е'п). Очевидно, что это соответствие
взаимно однозначно.
Проверим выполнение условий изоморфизма.
Пусть в пространстве R' выбраны два вектора
п п
х' = 2 ^eft и ?/'= 2 ^^', Т0ГДа по теореме И #' + г/' =
n
= 2 (Sfc + ^O^fe- Соответствующие векторы пространства
n n n
Д" суть я" = 2 Ь«*. уГ = 2 %«*> z" = 2 (** + 40 **• c°-
ft-1 ft=i fe«l
гласно теореме 11 z' — zf + y", откуда и вытекает
выполнение условия 1). Выполнение условия 2) про-
*) Соответствие между элементами х' £R' и/£ R" называется
взаимно однозначным, если:
1) каждому элементу xf G К соответствует один и только
один элемент x"£R";
2) каждому элементу xa€R" сопоставлен тем самым один ц
только один элемент #'£#'.
18] ИЗОМОРФИЗМ ЛИНЕЙНЫХ ПРОСТРАНСТВ 71
п
вернется аналогично: если х' = 2 ^L то по теореме И*
п
Х.г' = 2 ^ьеь*> ПРИ этом соответствующие элементы про-
п п
странства Я" суть ж* =2 ^еь и 2" ~ 2 ^ье£"» опять со"
гласно теореме 11 2" = Х#", откуда вытекает выполнение
условия 2). Таким образом, теорема 14 полностью
доказана.
Следствие. Всякое n-мерное пространство
изоморфно пространству Тп.
Задачи
1. Если пространства R' и R" изоморфны и е[, е%, . . ., е4п —
базис пространства R', то соответствующие векторы е', е"9 . ..
. .., €Й€#" образуют базис в пространстве R".
2. Если пространства R' и R" изоморфны и R' имеет
размерность пу то Jf?" также имеет размерность п.
3. Согласно теореме 14 одномерные пространства Vt и Р
(§11, задача 3; § 14, задача 1) изоморфны. Каким образом можно
осуществить этот изоморфизм фактически?
Отв. Поставить в соответствие каждому положительному
числу его логарифм.
ГЛАВА 3
СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ
§ 19. Ещё о ранге матрицы
Мы уже несколько раз встречались с матрицами
в нашем изложении. В этом параграфе мы остановимся
более детально на тех свойствах матрицы, которые связаны
с понятием ранга (§ 9). Это позволит нам дать общее
решение задачи о системах линейных уравнений,
сформулированной в § 1.
Напомним основные определения из § 9.
Пусть дана матрица с п строками и к столбцами,
заполненными числами а^•*) (j — индекс строки, /—-индекс
столбца, i = l, 2, ..., п, /=1, 2, ..., к):
А^
ап а12 ... аги
^21 ^22 • • • &2k
(1)
I anl an2 • • • &nh |
Если в этой матрице выбрать произвольным образом т
строк и т столбцов, то элементы, стоящие на
пересечениях этих строк и столбцов, образуют квадратную матрицу
порядка т.
Определитель этой матрицы называется минором гп-го
порядка матрицы А. Натуральное число г называется
рангом матрицы А, если у неё имеется минор порядка /•,
отличный от нуля, а все имеющиеся миноры порядка
*) Иногда мы будем располагать индексы у элемента матрицы А
по-другому, обозначая элемент, стоящий на пересечении г-й строки
я /-го столбца, символом a\J\
SIP]
ЯЩЁ О РАНГЕ МАТРИЦЫ
73
г-+ 1 и выше равны нулю. Если матрица А имеет ранг /•> О,
то всякий отличный от нуля её минор r-го порядка
называется базисным минором. Столбцы и строки матрицы,
на пересечениях которых находятся элементы базисного
минора, называются базисными столбцами и строками.
Наши дальнейшие рассмотрения будут основаны на
возможности придать любому столбцу из п чисел
геометрический смысл вектора в га-мерном пространстве Л (§14).
Сама матрица А в этой геометрической трактовке
отвечает определённой совокупности к векторов пространства R;
обозначим через Xj вектор, соответствующий /-му столбцу
матрицы А (/ = 1, 2, . .., к). Любое линейное соотношение
между столбцами матрицы мы можем истолковать как
такое же линейное соотношение между соответствующими
векторами (§ 12).
Образуем в пространстве R линейную оболочку
векторов хъ х2, .. ч Xk (§ 16). Покажем, что векторы,
отвечающие базисным столбцам матрицы А — пусть для
определённости первые г её столбцов являются
базисными, — образуют базис этой линейной оболочки. Для этого
достаточно показать, во-первых, что векторы хъ х2, ..., хР
линейно независимы и, во-вторых, что через них может
быть линейно выражен любой из оставшихся векторов
яг+1, ...,Xk (§ 16, п, 4). Проверим сначала первое
из этих утверждений. Линейная зависимость векторов
#i, х2, ..., хг была бы равносильна линейной
зависимости г первых столбцов матрицы А. Но тогда в силу
теоремы 6 (§ 9) любой определитель r-го порядка,
построенный на этих столбцах и каких-нибудь г строках матрицы А,
бьш бы равен нулю. В частности, был бы равен нулю
базисный минор матрицы А, что противоречит его
определению. Таким образом, первое утверждение доказано.
Второе утверждение мы фактически доказали в § 9;
сформулированное там для столбцов матрицы Л, оно составило
содержание «теоремы о базисном миноре». Тем самым мы
полностью доказали, что векторы хъ х2, ..., хг образуют
базис пространства Ь(хъ х2, ..., Zk). В силу теоремы 13
размерность этого пространства равна числу г, т. е. равна
рангу матрицы 4. Мы получили следующий важный
результат:
74 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3
Теорема 15. Размерность линейной оболочки
векторов, определённых столбцами матрицы А, равна рангу
этой матрицы. Векторы, отвечающие базисным столбцам
матрицы А, образуют базис линейной оболочки.
. Дальнейшие предложения представляют собой
очевидные следствия замечаний А, Б и В § 16, п. 4.
Теорема 16. Если ранг матрицы А меньше чем
число её столбцов (г < к), то столбцы матрицы А линейно
зависимы. Если ранг матрицы А равен числу столбцов
(г = к), то столбцы матрицы А линейно независимы.
Теорема 17. Всякие г +1 столбцов матрицы А
линейно зависимы.
Теорема 18. Ранг любой матрицы равен
максимальному числу её линейно независимых столбцов.
Это последнее предложение имеет большое
принципиальное значение, так как оно содержит в себе новое
определение ранга матрицы.
Если транспонировать матрицу А, т. е. перейти от
матрицы А к матрице А', строки которой являются столбцами
матрицы Аг то ранг транспонированной матрицы А' будет,
очевидно, таким же, каков был ранг матрицы А. Но
согласно теореме 18 ранг матрицы А равен
максимальному количеству её линейно независимых столбцов, или,
что то же самое, строк матрицы А. Мы приходим к
.несколько неожиданному заключению:
Теорема 19. Максимальное количество линейно
независимых строк любой матрицы совпадает с
максимальным количеством её линейно независимых столбцов.
Заметим, что теорема 19 не тривиальна; любое прямое
её доказательство потребовало бы цепи рассуждений,
эквивалентной доказательству теорем 4 и 15.
Отметим ещё следующий результат, который вытекает
из теоремы 15 и леммы 2 § 16, п. 3:
Теорема 20. Если один из столбцов матрицы А
является линейной комбинацией других её столбцов, то
его можно вычеркнуть из этой матрицы, не меняя её
ранга.
Задача
В /г-мерном пространстве R взяты к линейно независимых
ректоров г,, ?$, .. ., xh. Показать, что линейная оболочка
§ 20] НЕТРИВИАЛЬНАЯ СОВМЕСТИ. ОДНОРОДН. СИСТЕМЫ 75
Ь~Ь(х1} x2f ..., xk) определена однозначно, если известны
значения всех миноров к-то порядка матрицы Л = ||аР|| из коорди
нат векторов xlt х2, ..., xk в некотором базисе elt e2, ..., еп.
Указание. Нужно так написать условия принадлежности
вектора у подпространству L, чтобы в них участвовали только
миноры к-то порядка матрицы А. Но y£L тогда и только тогда,
когда матрица В, полученная присоединением к матрице А
столбца из координат вектора у> имеет ранг к, или, что то же
самое, каждый её минор (к + 1)-го порядка равен нулю. Разлагая
каждый минор (к + 1)-го порядка матрицы В по последнему
столбцу, можно получить некоторую систему уравнений
относительно координат вектора у с коэффициентами—минорами к-го
порядка матрицы А.
§ 20. Нетривиальная совместность
однородной линейной системы
Пусть дана однородная линейная система
Яц^х +' апх2 + . . . + а1пхп ^ 0, )
#21^1 ~т" #22^2 Н~ ' • ' "г #2п^п =0, |
}
dkiX! -f- ЙЬ2^2 ■+•••• I" dhn^n — 0. J
(2)
Как мы уже знаем, эта система всегда совместна, так
как обладает нулевым решением хх = х2 = ... = хп = 0.
Основная задача, с которой приходится встречаться при
изучении однородных линейных систем, следующая:
при каких условиях однородная система «нетривиально
совместна», т. е. имеет, кроме нулевого, ещё другие
решения! Результаты § 19 позволяют сразу решить эту
задачу. Действительно, существование ненулевого
решения системы (2), как мы видели в § 12, равносильно
линейной зависимости столбцов матрицы
Л =
а11 а12
^21 ^22
Qh\ Ok2
а2п
76 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3
а по теореме 16 эта линейная зависимость имеет место
тогда и только тогда, когда ранг матрицы А меньше числа
столбцов. Итак, мы получаем следующую теорему:
Теорема 21. Если ранг матрицы А равен числу п}
система (2) не имеет ненулевых решений] если же ранг
матрицы А меньше чем п, нулевые решения системы (2)
заведомо существуют; в этом и только в этом случае
наша система нетривиально совместна.
Задача
Показать, что система (2) при к = п имеет решение
Ci = Ailt c2 = Ai2, ...,cn = Ain (1<*<и),
где Aik—алгебраическое дополнение элемента а^ (i
фиксировано), если ранг матрицы А меньше п.
Примечание. Это обстоятельство позволяет легко строить
ненулевые решения системы (2) в случае, когда ранг основной
матрицы равен л—-1.
§ 21. Условие совместности общей
линейной системы
Пусть дана общая линейная система уравнений
#11^1 I #12^2 ~Ь • • ' ~Т &ln%n ==z ^1> |
#21Ж1 + #22#2 + • • • + #2п#п = Ь2,
#fel#l -+• #fe2^2 + • • ■ + 0>kn%n =bk.
Этой системе мы сопоставим две матрицы: матрицу
А =
#11 #12
#21 #22
#1п
#2п
#fel #fc2 • • • #fcn
(3)
g M] УСЛОВИЕ СОВМЕСТНОСТИ ЛИНЕЙНОЙ СИСТЕМЕ 77
называемую основной матрицей системы (3), и матрицу
Ах =
ап а12
^21 ^22•
а1п Ъх
&2п "2
o-ki a>k2
&kn bk
называемую расширенной матрицей системы (3).
Основная теорема о совместности системы (3) гласит:
Теорема 22. Система (3) совместна тогда и только
тогда у когда ранг расширенной матрицы этой системы
равен рангу основной матрицы.
Доказательство. Допустим сначала, что система (3)
совместна; если съ с2, .,., сп — некоторое её решение,
то имеют место равенства
axlcx + а12с2 -г • • • + ащСп = bL,
#21С1 + #22С2 + • • • "Ь а2пСп = Ь2,
akiCi + ak2c2 -+-...+ aknCn = h-
Но эти равенства означают, что последний столбец матрицы
Ах есть линейная комбинация остальных столбцов этой
матрицы (с коэффициентами си с2, ..., сп). В силу
теоремы 20 последний столбец матрицы Ах может быть
вычеркнут без изменения её ранга. Но при вычёркивании
последнего столбца матрица Ах переходит как раз в матрицу А.
Следовательно, если система (3) совместна, матрицы А
и Ах имеют одинаковый ранг.
Допустим теперь, что матрицы А и А± имеют
одинаковый ранг, и покажем, что система (3) совместна. Пусть г
'есть ранг матрицы А (следовательно, и матрицы Ах).
Рассмотрим г базисных столбцов матрицы А\ они будут
базисными столбцами и матрицы Аг. По теореме 4
последний столбец матрицы Аг может быть представлен как
линейная комбинация базисных столбцов —а следовательно,
может быть представлена и как линейная комбинация
78 системы линейных Уравнений [ГЛ. з
всех столбцов матрицы А. Если мы коэффициенты этой
линейной комбинации обозначим через сх, с2, . . ., сПу то
мы получим, что выполняются равенства
аисх + а12с2 + • . . + ЯщСп = h> )
a2iCi + а22с2 + . . + а2пСп ="b2, |
) (4)
fl/uci + ah2c2 -г - •. + ^fenCn = 6fe. )
Таким образом, система (4) удовлетворяется
значениями Xi — Ci, #2 —с2> •••» %п = Сп я, следовательно,
совместна. Доказанная в этом пункте теорема называется
теоремой Кронекера-Капелли.
§ 22. Общее решение линейной системы
Теорема Кронекера-Капелли, устанавливая общее
условие совместности линейной системы, не даёт способа
но л учить решения этой системы. В этом параграфе мы
выведем формулу, заключающую в себе общее решение
линейной системы.
Пусть дана совместная линейная система (3) с
основной матрицей .4 = ||ау|| ранга г. Можно предположить,
что базисный минор М матрицы А расположен в её левом
верхнем углу; если бы это было не так, мы смогли бы
достичь желаемого расположения некоторой перестановкой
строк и столбцов матрицы А> что равносильно некоторой
перестановке уравнений и неизвестных в системе (3).
Рассмотрим первые г уравнений системы (3), причём
перепишем их следующим образом:
fln^i + аХ2х2 + ... + а1гхг = Ьх — alf r+iSr+i — ... — я1пжп, |
a2i#j + а22х2 Н- .. . + а2гхг = h — а2, r+i#r+i — • . . — fynXn, |
япхх + аг2хг +-...+ arrxr = Ъг — аг, r+i#r+i — . ». — а>гп%п- )
(5)
§ 22J ОБЩЕЕ РЕШЕНИЕ ЛИНЕЙНОЙ СИСТЕМЫ ?9
Придадим неизвестным хг+ъ ♦.., хп совершенно
произвольные значения сг+ь ,.., сп. Тогда система (5)
превращается в систему г уравнений для г неизвестных
хъ х2, ..., хг с определителем М, отличным от нуля
(базисным минором матрицы .4). Эта система может быть
разрешена по правилу Крамера (§ 7); существуют
следовательно, числа с1} с2у ..., сп, которые при подстановке
в систему (5) на место неизвестных хъ х2, ..., хп
обращают все уравнения этой системы в тождества. Покажем,
что эти значения cl9 с2, ..., сп удовлетворяют и всем
прочим уравнениям системы (3).
Первые г строк расширенной матрицы Аг системы (3)
являются базисными строками этой матрицы, так как ранг
расширенной матрицы в силу условия совместности равен г
и на первых г строках матрицы Ах построен отличный
от нуля минор М\ В силу теоремы 4 (в применении
к строкам) каждая из последующих строк матрицы Ai
есть линейная комбинация её первых г строк* Для
системы (3) это означает, что каждое уравнение системы (3),
начиная с (г+1)-го, есть линейная комбинация первых г
уравнений этой системы. Следовательно, если первые г
уравнений системы (3) удовлетворяются значениями
#1 = ^1» •••> #п = сп, то все остальные уравнения этой
системы также удовлетворяются этими значениями.
Чтобы записать построенное решение системы (3)
в виде некоторой формулы, обозначим через Л//(оц)
определитель, получающийся из базисного минора
М = det || ац || (i, j — 1, 2, ..., г) заменой его /-го
столбца на столбец из величин аь а2, . .., оц, ..., аг.
Тогда, записывая решение системы (5) с помощью
формул Крамера, мы получим:
\
С1^]Ц Mi (Pi ~ ai> r+iCr+i — ... — aincn) =
= Й[ЛГУ(64) —сг+1^у(а|,r+i)— ... - cnMj(ain)]. (6)
Эти формулы выражают значения неизвестных я/ = с/
(/=1, 2, ..., г) через коэффициенты системы, свободные
члены и произвольные величины (параметры)
сг+1> #г+2> • • • » сп*
но
СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ
[гл. г
Покажем, что в формуле (6) содержится любое
решение системы (3). Действительно, пусть с?, с\, ...
..., с?+ь ..., Сп — произвольное решение системы (3).
Очевидно, что оно является также решением системы (5).
Но по правилам Крамера из системы (5) величины
сь С2, ./.., Сг определяются через величины с?+ь . .., с„
однозначно и именно по формулам (6). Таким образом,
при cr+1 = c?+i, .*., сп = Сп формулы (6) дают нам как
раз взятое решение с?, с\, ..., сг, что и требовалось.
Задачи
1. Решить систему уравнений
#1 + #2 + Х3 + ХА + ХЪ = 7,
Ъхх + 2х2 + #8 4- Х1—Ъхъ = —2,
я2 + 2ж3 + 2я4 + 6яб = 23,
5ж1 + ^ж2 + 3ж3 4-3^4—л5 = 12.
Отв. сх= —16 + с8 + с4 + 5с5, с2 = 23— 2cz — 2c4 — 6с5.
2. Исследовать решения системы
# + Аг/+ з = А,
# + 2/ + А2=А2
в зависимости от значения X.
Х + 1
Оте. Если (А— 1)(Х+2)^0, тож = -
А + 2
увЗГ+2'*я
(А + 1)2
А + 2
Если А=1, система имеет решения, зависящие от двух
параметров. Если А =—2, система несовместна.
3. При каком условии три прямые ахх + Ъху -f- cx =0, а2# + &22/ +
-f с2 = 0, а3х + Ьгу + св~0 проходят через одну точку?
Отв. Матрицы
1 а1 ъх
\а2 &2
1 аз h\
и
\а1 Ъ± сЛ
\а2 Ъ2 с2\
аз ъг °з|
имеют одинаковый ранг.
4. При каком условии п прямые ахх + Ьгу -f- сх = 0, а2# + &22/ +
-f с2 = 0, ..., fln^ + ^n2/ + cn = 0 проходят через одну точку?
Отв. Матрицы
Со
имеют одинаковый ранг.
§ 23] ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА РЕШЕНИЙ 81
§ 23. Геометрические свойства совокупности решений
линейной системы
1. Рассмотрим сначала случай однородной линейной
системы § 20 (2); мы уже знаем, что совокупность всех
решений такой системы образует линейное пространство
(§ 15). Обозначая это пространство через Д, вычислим
его размерность и построим его базис.
Формулы (6) § 22 в данном случае приобретают вид
— Mcj = Cr+iMj{aht г-н) + • • • +cnMi{akn) (7)
(7-1, 2 г),
так как Mj(bk) = Mj (0) =0.
Поставим в соответствие каждому решению (съ с2, ...
... , сг, сг+1, ... , сп) системы (2) вектор (сг+1, ... , сп)
пространства Тп-.г. Так как числа сг+1, ... , сп могут быть
взяты произвольно и однозначно определяют решение
системы (2), то соответствие между пространством
решений системы (2) и пространством Тп-г получается
взаимно однозначным. Поскольку при этом соответствии, как
легко проверить, сохраняются линейные операции, это
соответствие является изоморфным. Итак, пространство
R решений однородной системы линейных уравнений с п
неизвестными и с рангом г матрицы коэффициентов изо-
морфно пространству Тп-Г. В частности, размерность
пространства R равна числу п — г.
Любая система из п — г линейно независимых
решений однородной линейной системы уравнений, являющаяся
вследствие теоремы 12 базисом в пространстве всех
решений, называется фундаментальной системой решений. Для
построения фундаментальной системы решений мы можем
воспользоваться любым базисом пространства Тп~г\ в силу
изоморфизма соответствующие решения системы (2) будут
образовывать базис и в пространстве всех решений этой
системы.
Простейший базис пространства Тп-Г образуется
векторами ех = (1, 0, ... , 0), е2 = (0, 1, . . . , 0), . . .
..., еп~г = (0, 0, . .. , 1) (§ 13). Чтобы получить решение
системы (2), соответствующее, например, вектору еъ нужно
6 г. Е. Шилов
82 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3
в формулах (7) подставить сг+1 = 1, cr+2= ••• = сп^0
и определить соответствующие значения
с{ = с[1) (1 = 1, 2, ... , п).
Аналогично строится решение, соответствующее любому
другому базисному вектору ву (/ = 2, ... , /г —г).
Построенная таким образом совокупность решений системы (2)
называется нормальной фундаментальной системой
решений. Если обозначить эти решения через ж(1), #(2>, ...
..., х(п~г\ то по определению базиса для любого решения
х мы будем иметь равенство
cr = C&W + C*№ + ... + Cn-r*(n-r). (8)
Поскольку в формуле (8) заключено любое решение
системы (2), эта формула даёт общее решение нашей системы.
Задача
Написать нормальную фундаментальную систему решений для
системы уравнений
*1 + #2 + «3 + Х\ + ХЬ = О,
Ъхх + 2#2 + #3 + #4 — 3#5 — О,
#2 + 2#3 + 2ж4 + 6#5 = О,
5а:х + 4я2 + 3#3 + Зя?4 — хь = 0.
Отв. ж(1>=(1, -2, 1, 0, 0),
ж(2>=(1, -2, 0, 1, 0),
ж<8>=(5, -6, 0, 0, 1).
2. Переходим теперь к рассмотрению неоднородной
системы (§ 21, (3)) в общем случае. Как было показано
в § 17, геометрический образ Я, отвечающий
совокупности всех решений неоднородной системы, есть
гиперплоскость в n-мерном пространстве Тп, полученная сдвигом
подпространства R решений соответствующей однородной
системы (по доказанному изоморфного пространству 2Гп-г)
на некоторый вектор х0, являющийся произвольным
частным решением неоднородной системы. Из этого мы выводим
прежде всего, что размерность гиперплоскости Н
совпадает с размерностью подпространства R. Далее, если
/■ — ранг основной матрицы системы (3), то любой век-
S 24] МЕТОДЫ ВЫЧИСЛЕНИЯ РАНГА МАТРИЦЫ 83
тор у подпространства R можно представить в виде суммы
у = С1уО) + С2у<2)+ ... +С„_Г у <»-'>,
где у^\ г/(2\ ... , 2/(n~r) — базисные векторы
подпространства R (фундаментальная система решений).
Следовательно, любой вектор х гиперплоскости Н
можно представить в виде суммы
х==х0 + у=х0 + С1у^ + С2уЫ+ ... +Сп-гУ<п~г>.
Этот результат на языке решений систем (3) и (2) можно
сформулировать так:
Общее решение неоднородной системы (3) равно сумме
любого частного решения этой системы и общего решения
соответствующей однородной системы (2).
Задача
Написать общее решение системы задачи 1 § 22, используя
нормальную фундаментальную систему решений соответствующей
однородной системы, найденную в задаче § 23, п. 1.
Отв. Например,
1 ~16|
23
0
0
I о|
+ сх
I *|
-2
1
0
1 о
+ с2
1 i\
-2
0
1
1 °
+ с3
1 5|
-6
0
0
1 ч
Здесь в первом столбце выписаны координаты вектора
х0—частного решения неоднородной системах; в остальных
столбцах—координаты векторов г/*\ у®\ у&\ образующих нормальную
фундаментальную систему решений соответствующей однородной
системы.
§ 24. Методы вычисления ранга матрицы и нахождения
базисного минора
Для практического использования развитых в
предыдущих пунктах методов решения систем линейных
уравнений необходимо уметь вычислять ранг матрицы и
находить её базисный минор. Очевидно, что определение ранга
матрицы, данное в § 9, само по себе не может служить
разумным способом практического вычисления ранга; па-
6*
84 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3
пример, в квадратной матрице 5-го порядка можно
выделить один минор 5-го порядка, 25 миноров четвёртого
порядка, 100 миноров третьего порядка и 100 миноров
второго порядка; понятно, что если бы мы пожелали найти
ранг этой матрицы с помощью прямого вычисления
величины всех её миноров, это была бы весьма трудоёмкая
задача. В этом пункте будут даны простые способы
подсчёта ранга матрицы и определения её базисного минора.
Эти способы основаны на изучении некоторых операций
со столбцами и строками матрицы, которые не изменяют
её ранга; мы будем называть эти операции
элементарными, операциями. Поскольку ранг матрицы, как мы
уже указывали, не меняется при транспонировании, мы
будем определять эти операции только для столбцов
матрицы; благодаря этому при доказательствах мы сможем
использовать геометрическую интерпретацию матрицы с п
строками и к столбцами как матрицы из координат
некоторой системы к векторов xlf х2, ... , xk n-мерного
пространства R и теорему 15, согласно которой ранг этой
матрицы равен размерности линейной оболочки векторов
X\j Х%7 . . , , X\i.
1. Перестановка столбцов. Пусть в матрице А
произвольно переставлены её столбцы; покажем, что эта
операция не изменяет её ранга. Действительно,
размерность линейной оболочки векторов х1у хъ . . . , х*, не
зависит от того, в каком порядке они записаны;
следовательно, и ранг матрицы А не зависит от порядка её
столбцов.
2. Отбрасывание ненулевого общего
множителя элементов данного столбца. Допустим,
что речь идёт об отбрасывании общего множителя X ф О
у элементов первого столбца матрицы А. Эта операция
равносильна замене системы векторов \х1у #2> • • • > %h
на систему xlf х2, . . . , #ь, но очевидно, что размерности
линейных оболочек этих систем одинаковы (так как сами
линейные оболочки совпадают). Поэтому ранг матрицы А
не меняется в результате этой элементарной операции.
3. Прибавление к одному столбцу другого
столбца с произвольным множителем. Пусть
к /-му столбцу матрицы А прибавлен m-й столбец, умно-
§ 24] МЕТОДЫ ВЫЧИСЛЕНИЯ РАНГА МАТРИЦЫ 85
женный на число X. Это означает, что система векторов
#!,..., Xj, . . . , хт, . . . , Xk заменена на систему
#ъ • • • 7 #/ + ^жт> ••• у хт> ••• » #ь- Покажем, что
линейные оболочки Lx и L2 обеих этих систем совпадают.
Действительно, все векторы второй системы входят в
линейную оболочку векторов первой системы; поэтому в силу
леммы 1 § 16, п. 3 L2CZLl. С другой стороны, равенство
Xj = (xj + X#m) — \хт
показывает, что вектор Xj входит в линейную оболочку
векторов второй системы; так как все остальные векторы
первой системы, очевидно, также входят в эту линейную
оболочку, то LiCZL2. Отсюда вытекает, что L1 = L2.
Поэтому и ранг матрицы А не меняется в результате
рассматриваемой элементарной операции.
4. Зачёркивание столбца, состоящего из
одних нулей. Столбец из одних нулей отвечает
нулевому вектору пространства R. Очевидно, что от
зачёркивания нулевого вектора в системе х1у х2, ... , Xk
линейная оболочка L(xl9x2, ..• , хь) не может измениться;
вместе с нею не может измениться и ранг матрицы А.
5. Зачёркивание столбца, являющегося
линейной комбинацией других столбцов.
Законность этой элементарной операции была доказана
в § 19 (теорема 20).
Подчеркнём ещё раз, что все предложения,
доказанные в пп. 1 — 5 для столбцов матрицы А, справедливы
также и для её строк.
6. Подсчёт ранга матрицы и нахождение
базисного минора. Покажем, как можно
подсчитать ранг заданной матрицы А и найти её базисный
минор, используя операции, перечисленные в пп. 1—5.
Если матрица А состоит из одних нулей, то её ранг,
очевидно, равен нулю. Допустим, что в матрице А имеется
элемент, отличный от нуля; тогда, переставляя строки и
столбцы, можно перевести этот элемент в левый верхний
угол матрицы. Затем, вычитая из каждого столбца
первый столбец с некоторым коэффициентом, можно обратить
в нуль все остальные элементы первой строки. Больше
мы не будем менять элементы первой строки и первого
86 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3
столбца*). Если среди остальных элементов (т. е. не
принадлежащих к первой строке или к первому столбцу) нет
элементов, отличных от нуля, то ранг матрицы А,
очевидно, равен 1. Если среди них имеется элемент,
отличный от нуля, то, перестовляя строки и столбцы, можно
перевести его на пересечение второй строки и второго
столбца и, так же как и раньше, обратить в нуль все
следующие за ним элементы второй строки; отметим, что
указанные операции не затрагивают первой строки и
первого столбца. После этого вторую строку и второй
столбец мы оставляем в покое. Продолжая таким образом
далее, мы приведём матрицу А к одному из следующих
двух видов (считая, что количество столбцов матрицы А
не больше количества её строк, чего всегда можно
добиться транспонированием):
л=
аг
С21
С31
Ckl
Cfc+l, l
Cni
0 0 •
а2 0 .
С32 аз '
сю
Cfe+1,2 '
Сп2
. • о
. . о
. . о
• • afe
• * Cft+it k
' ^nfe
0
0
0
0
0
0 •
0
0
0
0
0
0
или
A =
<*1
C21
CB1
Сml
Cnl
0
a2
£32
cm2
cn2
0 • •
0 . . .
a3 • • •
0
0
0
a.
cT
причём числа a1? a2, ... отличны от нуля. В первом слу-
*) Но, может быть, будем переставлять их.
§ 24] МЕТОДЫ ВЫЧИСЛЕНИЯ РАНГА МАТРИЦЫ 87
чае ранг матрицы Ах равен к и базисный минор (в
преобразованной матрице) стоит в левом верхнем углу; во
втором случае ранг матрицы А2 равен т (числу
столбцов) и базисный минор (в преобразованной матрице) стоит
в первых т строках. Ранг матрицы А, таким образом,
определён; положение базисного минора легко восстановить,
если проследить в обратном порядке за всеми операциями,
которые производились с матрицей А.
Для примера рассмотрим следующую матрицу с пятью
столбцами и шестью строками:
2 -1 ||
5 -1
8 1
4 -1 '
3 2
1 1 ||
Во второй строке матрицы А имеется один нуль; используя
общий метод, мы можем получить в ней ещё три нуля. Для
удобства вначале переставим вторую строку с первой, а затем
первый столбец со вторым (чтобы в левом верхнем углу оказался
наименьший по абсолютной величине элемент -1). Мы получаем *):
-1 -2 0 -5 -1 ||
2 1 6-2-1
1-3-1 8 1
0-1 2-4 -1
-2 -1-7 3 2
-2 -2 -5 -1 1 ||
Теперь для получения трёх новых нулей в первой строке
вычтем из второго, четвёртого и пятого столбцов первый столбец
со множителями 2, 5 и 1:
0 0 0 0 ||
3 6 -12 -3
1-1 3 0
1 2 -4 -1 '
3 -7 13 4
2-5 9 3 ||
*) Знак ео между двумя матрицами означает в данном
случае равенство их рангов.
1
-2
3
-1
-1
-2
2
-1
1
0
-2
-2
6
0
-1
2
-7
-5
-2
1
3
-1
-1
-2
-1
2
1
0
-2
-2
0
6
-1
2
-7
-5
-5
-2
8
-4
3
-1
-1
-1
1
-1
2
1
А<
-1
2
1
0
-2
-2
88 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ ГЛ. 3
1
1
2
0
2
2
0
1
3
-1
3
2
0
-1
6
2
-7
-5
0
3
-12
-4
13
9
0
°
-3
-1
4 '
3
ел
-1
1
2
0
-2
-2
0
1
-3
-1
3
2
0
0
3
1
-4
-3
0
0
-3
-1
4
3
0
0
-3
-1
4
3
Далее проще всего добиваться новых нулей в третьей строке;
мы вначале переставим её со второй строкой, затем прпбавим
к третьему и четвёртому столбцам второй со множителями
1 и -3:
= 4,.
Четвёртый и пятый столбцы полученной матрицы Ах
пропорциональны третьему и их можно зачеркнуть. Оставшаяся матрица
имеет, очевидно, ранг 3; вместе с ней имеет ранг 3 и исходная
матрица А.
Базисный минор матрицы Ах расположен в её первых трёх
строках и первых трёх столбцах. Возвращаясь по цепочке
преобразованных матриц к исходной матрице, мы легко можем
проверить, что все производимые преобразования не влияют на
абсолютную величину этого минора. Следовательно, и в исходной
матрице минор, построенный на первых трёх строках и первых
трёх столбцах, является базисным.
Задача
Определить ранг и базисный минор следующих матриц:
^i =
1 _2 3-1 -1 -2
2-1 1 0-2-2
-2 -5 8-4 3 -1
6 0-1 2-7-5
-1-1 1-1 2 1
Л =
1
1
0
0
0
0
1
1
0
1
1
0
1
1
0
0
0
0
1
1
0 II
0 |
0
0
11
Отв. Ранг Ах равен 3, базисный минор, например, в левом
верхнем углу. Ранг А% равен пяти, базисный минор совпадает
с определителем матрицы.
ГЛАВА 4.
ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА
В общем курсе математического анализа изучаются
функции одного или нескольких вещественных
переменных. В случае функции, например, трёх вещественных
переменных можно говорить о функции, аргументом
которой является вектор пространства V3. Мы будем здесь
изучать функции, аргументом которых будет вектор
произвольного линейного пространства. При этом мы ограни
чимся пока простейшими типами таких функций, а именно,
линейными функциями. Мы будем рассматривать линейные
числовые функции векторного аргумента, т. е. функции,
значения которых суть числа, и линейные векторные
функции векторного аргумента, значения которых суть
векторы, причём векторы того же пространства, в котором
изменяется аргумент.
Векторные линейные функции, называемые иначе
линейными операторами, имеют важное значение в линейной
алгебре и её приложениях.
§ 25. Линейные формы
1. Числовая функция f(x) векторного аргумента х,
охфеделённая на линейном пространстве /?, называется
линейной формой у если она удовлетворяет условиям
(I) f(* + y) = f(*) + f{y)
для любых х, y£R,
(II) / (zx) — а/ (х)
для любого x£R и любого вещественного а.
90 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
Из условий (I) — (II) по индукции легко получить
общую формулу t
f (a1x1 + 4%г + . . • + <ВД0 =
==а1/(я1) + а2/(я2)+ • . . +akf(xh)t (1)
справедливую для любых х}, х2, .. ., Хк£И и любых
вещественных чисел аь а2, . . ., а&.
2. Примеры
1. Пусть в «-мерном пространстве R выбран базис, так что
каждый вектор x£R может быть задан своими координатами
5i, £2» •••» 5л- Тогда /(a;) = gj (первая координата) есть, очевидно,
линейная форма от х.
2. Более общей линейной формой в том же пространстве
является выражение
п
и =1
с произвольно фиксированными коэффициентами си с2, ..., ck.
3. В пространстве С {а, Ь) примером линейной формы является
выражение
f(x) = x{t0),
где ^ — фиксированная точка отрезка a^t^b.
4. В том же пространстве можно рассматривать линейную
форму вида
ъ
/(ж)= \ c(t)x(t)dt,
а
где с (t) — фиксированная непрерывная функция.
5. В пространстве V3 скалярное произведение (х, х0) вектора х
с фиксированным вектором х0 € Vz есть линейная форма от х.
Линейные формы, заданные в бесконечномерных
пространствах, обычно называют линейными функционалами.
3. Найдём общий вид линейной формы f(x) в
n-мерном линейном пространстве R. Пусть еъ е2, . . ., еп —
произвольный базис пространства R. Обозначим величину f(ek)
п
через си (к .=-1,2, .,., п). Тогда для любого х = ^ %ек
§ 26] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 91
в силу формулы (1)
п п п
/(*)=/(2 «**)=Е W(efe) = 2%kCh'
fe=i fe=i /i=i
т. е. значения линейной формы f(x) линейно выражаются
черев координаты вектора х с фиксированными
коэффициентами сь с2, ..., сп .
Таким образом, в примере 2 мы имели самый общий
вид линейной функции в я-мерном пространстве.
Задача
Определив естественным образом сложение линейных форм
и умножение линейной формы на вещественное число, построить
из линейных форм, определённых на линейном пространстве R,
новое линейное пространство Д*. Какова размерность
пространства R*7 если размерность R равна п?
Отв. Также п.
§ 26. Линейные операторы
Мы говорим, что в линейном пространстве R задан
оператор, если имеется функция, которая каждому
вектору х £ R ставит в соответствие вектор у = Ах этого же
пространства.
Оператор А называется линейным, если выполняются
условия
(I) А(х + у) — Ах + Ay для любых х и у из R;
(II) А (ах) = аАх для любого х 6 R и любого числа а.
Так же как и для линейных функций в § 25, из
формул (I) и (II) легко получается более общая формула
А (агхг + а2х2+ . . . + oikxk) = а.1Ах1 + а2Ах2 + . . . + afeAxfe (2)
для любых хъ x2f ..., xk£R и любых вещественных
чисел аь а2, . . ., ak .
Примеры
1. Оператор, который каждому вектору пространства R
ставит в соответствие нуль-вектор, очевидно, является
линейным. Он называется нулевым оператором.
92 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
2. Оператор Е, ставящий в соответствие каждому
вектору х сам вектор х, очевидно, линейный; он называется
единичным или тождественным оператором.
3. Линейный оператор А, переводящий каждый
вектор х в Хж (X — фиксированное число), называется
оператором подобия.
4. На евклидовой плоскости V2 векторы можно
определять полярными координатами: # = {<р, р}. Оператор,
переводящий вектор х ■=[(?, р} в Ах = {ср + <Ро, р} (<Ро —
фиксированный угол), является, как легко проверить с помощью
геометрического построения, линейным. Этот оператор
называется оператором поворота на угол <р0.
5. Пусть еь е2, •••> еп — некоторый базис в га-мерном
пространстве Rn. Поставим в соответствие вектору
n m
х == 2 ^*fe вектор Р#= 2 ^fe> гДе т < п- Оператор Р —
линейный оператор; он называется оператором
проектирования на подпространство /?т, порождённое векторами
^ъ ^2> • • • i ^т-
6. Пусть вх, е2, ..., еп — базис в w-мерном
пространстве Дп> ^ъ ^2, •• •> Хп —га фиксированных чисел.
Определим оператор А для векторов базиса условиями Ае1 = Х1е1,
Ае2 = Х2е2, ..., Aen = Xnen и для любого другого вектора
п
#=2£ье&, естественно, по линейности условием Ая =
п
= 2^ье*# ^тот оператор называется диагональным. Мы
ft=i
дальше увидим, почему выбрано такое название.
7. В пространстве С (а, 6) умножение заданной
функции на любую фиксированную функцию ср(г), в частности
на ср(2) = £, является линейным оператором.
8. В том же пространстве часто рассматривают
интегральный оператор Фредгольма, который заданную
функцию x(t) переводит в
ъ
y(t) = Ax(i)= \ K(t9 s)x(s)ds,
а
§ 27] ОБЩИЙ ВИД ЛИНЕЙНОГО ОПЕРАТОРА 93
где K(t, ^ — фиксированная функция двух переменных
(«ядро» оператора Фредгольма).
9. В бесконечномерных пространствах бывает
необходимо рассматривать линейные операторы, определённые
не на всём пространстве. Таков оператор D
дифференцирования в пространстве С {а, Ь)\
Dx(t) = x'(t),
определённый только на дифференцируемых функциях
пространства С(а> Ь).
Задачи
1. Установить, какие из следующих векторных функций в
пространстве F3 являются линейными операторами:
а) Ах = х-\-а (а — фиксированный ненулевой вектор);
б) А#=а;
в) А# = (а, х) а;
г^ А.& ~~ (cl x\ х*
Д) Ах = (Ц, ?2 + 53> 61), где a = (glf 62f 53);
е) Aaj=(smS1, cosS2> 0);
ж) a^=(2£1-53> e«+e.,6i).
Отв. в) и ж).
2. Будут ли линейными операторами в пространстве всех
многочленов от t а) умножение на t\ б) умножение на г2; в)
дифференцирование?
Отв. Да.
§ 27. Общий вид линейного оператора
в n-мерном пространстве
Пусть А —некоторый линейный оператор и elf e2t ...
..., еп — базис в пространстве Нп. Вектор ег переводится
оператором А в некоторый вектор Аех пространства Rn,
который, как всякий вектор этого пространства, мы можем
разложить по базисным векторам:
М - а\{>в1 + $\ + ... + а(„*W (3)
Аналогично оператор А действует на остальные базисные
векторы:
Ае2 = a(i2)ei + а(22)е2 + .>. + <4i2)en,
(4)
Aen = a\n)ei + af\ +...+ a(nn)e„.
9't ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
Формулы (3) —(4) можно записать короче:
Аеу = 24»ег (/-1,2, .... п).
(5)
Коэффициенты ay (i, /=1, 2, .. ., га) определяют
матрицу
А = 4(в) =
„(1) л(2) л(п)
<#> a(22)
a(2n)
a(1) a(2)
W
которая называется матрицей оператора А в базисе
{е} = {ег, . ..,еп}. Столбцами этой матрицы служат
координаты векторов /х = Ael9 /2 = Ае2, . .., /п = Аеп. Пусть
тепе
рь ж = 2 £/в/ ~~~ произвольный вектор и у = Ах —
У=1
= 2 ^i6i' выясним> как выражаются координаты уц век-
i=l
тора г/ через координаты £;- вектора ж. Мы имеем:
п п п
2 ^i«i = Ах = А ^2 М>) = 2 *>Ае> =
-2«,2«У>в,=2(2^>;
У=1 г = 1 i-1 ;=1
сравнивая составляющие по вектору е-х, находим:
п
/-1
§ 27]
ОБЩИЙ ВИД ЛИНЕЙНОГО ОПЕРАТОРА
95
В раскрытом виде
(7)
Следовательно, зная матрицу оператора А в базисе е1у
е2, -..,еп, можно определить результат применения опе-
п
ратора к любому вектору х — 2 ^и пространства Rn:
координаты вектора у —Ах линейно выражаются через
координаты вектора х по формулам (7). Заметим, что
матрица коэффициентов в формулах (7) совпадает с
матрицей А(е).
Составим матрицы для операторов, приведённых в примерах
1—6 § 26.
1. Матрица нулевого оператора в любом базисе, очевидно,
состоит из одних нулей.
2. Единичный оператор переводит вектор е1 в еЛ = 1 • ех + 0е2 + ...
... -f 0еп, вектор е2 — в е2 = 0 • ех + 1 • е2 + 0 • е3 + . • • -Ь 0 • еп,
вектор еп — в еп = 0 • вхН- ... -Ь 1 • еп. Поэтому матрица единичного
оператора имеет вид
1 0 0 ... 0|
о
о
0
0
1
0
0 ...
1 ...
0
0
0 ...
1|
3. Аналогично, матрица оператора подобия имеет вид
X 0 ... 01
|о х ... о
о о ...
4. В V2 выберем базис из двух единичных взаимно
ортогональных векторов elt е2. Построив чертёж, легко проверить, что
вектор ех после поворота на угол <р0 перейдёт в вектор cos<po*i +
96 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
+ sin<p0e2, а вектор е2—в вектор — sin ^ег + cos y0e2.
Следовательно, матрица оператора поворота имеет вид
I cos <p0 —sin <p0 I
I sin <p0 cos <р01
5. В примере 5 векторы elf е2, ..., ет переходят в себя, а
векторы ет+1, ..., еп — в нуль. Поэтому матрица оператора
проектирования в базисе elt e2, ..., еп имеет вид
1 0 ... О 0 ... О
10 1 ... 0 0 ... 0
т-я строка
|о о ... о о ... о
6. Матрица диагонального оператора (пример 6) в базисе еи
е2, ..., еп имеет вид
IХх 0 ... 0
|о х2 ... о
|о о ... \п\
Элементы, отличные от нуля, могут находиться в этой
матрице только на главной диагонали. Такая матрица называется
диагональной; отсюда и название оператора. Заметим, что в другом
базисе матрица диагонального оператора уже не будет, вообще
говоря, диагональной.
Задача
Составить матрицу оператора А, переводящего в У3 векторы
«i = (0f 0, 1) в ^ = (2, 3, 5),
*2 = (0, 1, 1) в */2 = (1, 0, 0),
«,= (1, 1, 1) в 2/з = (0, 1, -1)
в базисе
а) ^ = (1, 0, 0), *2 = (0, 1, 0), е8 = (0, 0, 1);
б) хх, хъ #3.
Отв. а)
««7<л =
—1
1
—1
-1 2
— 3 3
— 5 5
б)
2
1
2
0
— 1
1
— 1
2
-1
§ 27] ОБЩИЙ ВИД ЛИНЕЙНОГО ОПЕРАТОРА 97
Мы видели, что каждому линейному оператору А,
действующему в /г-мерном линейном пространстве,
соответствует в силу формул (5) некоторая матрица п-то
порядка. Пусть теперь || а№ || *) — произвольная матрица п-го
п
порядка. Еслия = 2£уе;> мы можем построить вектор
п
у = ^ гце{ по формулам
Ъ = а[% + а№%+...+а\п)Ьп, )
ri2^a^ + a(i42+...+a(2n4n,
( (8)
rin = ai% + ai*)Z2+ .. . +а№п. )
Легко проверить, что оператор А, задающий переход
от вектора х к вектору г/, является линейным
оператором. Построим матрицу оператора А в базисе е1у е2> .. ., еп.
Вектор ех имеет координаты £х = 1, Е2= ... =$п = 0; в
силу формул (7) координатами вектора Д = Кех будут
числа а\*\ а!£\ .. ., а(п\ так что
Д = Аех - а[{ \х + а<£ \2 + . .. + <# ^
Аналогично
/. = Ае/ - а^ + а(2яе2 + ... + а#е„ (/ = 1, 2, ..., /г). (9)
Следовательно, матрица оператора А совпадает с
исходной матрицей ||аФ||.
Итак, каждая матрица п-го порядка является
матрицей некоторого линейного оператора А, действующего
в n-мерном линейном пространстве.
Тем самым между линейными операторами,
действующими в тг-мерном пространстве, и матрицами п-то
порядка устанавливается взаимно однозначное соответствие,
осуществляемое с помощью формул (5).
*) Верхний индекс —номер столбца, нижний—номер строки.
7 г. Е. Шилов
98 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
Заметим, что оператор А можно было бы восстановить
по матрице 4 = ||аУ>|| (и притом однозначно), исходя
непосредственно из формул (9). В этих формулах /-й
столбец матрицы А представляет собой набор координат
вектора /; = Ае7. Поскольку /-и столбец матрицы А мы
могли задать произвольно, мы делаем следующий вывод:
каковы бы ни были п векторов fl9 /2, ..., /п в п-мерном
пространстве R, существует (и притом единственный)
линейный оператор, действующий в пространстве R и
переводящий базисные векторы е1у е2, ..',еп
соответственно в Д, /а, . .., /п.
§ 28. Действия с линейными операторами
Над линейными операторами, определёнными в
линейном пространстве Л, можно производить различные
действия, приводящие в результате к новым линейным
операторам. Рассмотрим здесь действия сложения операторов,
умножения на число и умножения операторов друг на друга.
Условимся предварительно равенство операторов А и
В понимать в том смысле, что Ах = Вх для любого x£R.
1. Сложение операторов. Если даны линейные
операторы А и В, то оператор С = А + В определяется
формулой
Ся-=(А + В)ж = Ая + Вя.
Проверим, что С —линейный оператор. Положим х =
= a2/+fte; тогда
C(*y+$z) = A(*y + $z) + B(zy + $z) =
= a Ay + $Az + аВу + £Bz =
Таким образом, оба условия (I) и (И) § 26 заведомо
выполнены.
Легко проверить следующие равенства:
А + В=В + А, )
(А + В) + С = А+(В + С),
А + 0 = А, . (*°)
А + (-А) = 0. |
§ 28] ДЕЙСТВИЯ С ЛИНЕЙНЫМИ ОПЕРАТОРАМИ 99
(Н)
Здесь А, В, С — произвольные линейные операторы, О —
нулевой оператор, —А —оператор, противоположный
к оператору А, т. е. переводящий каждый вектор x£R
в вектор — Ах.
2. Умножение оператора на число. Если А —
линейный оператор, X — вещественное число, то
оператор В = ХА определяется формулой
Вх=--(Щх = 1(Ах).
Легко проверить, так же как в п. 1, что построенный
оператор является линейным. При этом имеют место
соотношения
МХвАН^А,
1 . А = А,
(Х1 + Х2)А = Х1А+Х2А,
Х(А-|-В)=ХА + ХВ.
Соотношения (10) —(И) показывают, что совокупность всех
линейных операторов, действующих в линейном
пространстве R, образует новое линейное пространство.
3. Умножение операторов. Если А и В
—линейные операторы, то оператор С = АВ определяется
условием
Ся = АВя=:А(Вж)
(т. е. сначала на вектор х действует оператор В, а затем
на результат действует оператор А). С есть линейный
оператор, так как
С (ах + Ру) = АВ (ах + Ру) = А (аВх + рВу) = olABx + рАВу '=
= аСя + рСу.
Легко проверяются равенства
Х(АВ) = (ХА)В, \ , .
АП*П— fATttC Г (сочетательные законы).
(А + В)С = АС + ВС, 1 (12)
А (В 4- С) = АВ + АС ( (РаспРеДелитейьные законы).
Проверим, например, второй сочетательный закон.
В соответствии с принятым нами определением равенства
100 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА tPJI. 4
операторов мы должны для любого вектора x£R
доказать равенство
[А(ВС)]я = [(АВ)С]я.
Но по самому определению произведения операторов
[А (ВС)] х - А [(ВС) х] = А [В (Сх)],
[(АВ) С] х = (АВ) (Ся) = А [В (Ся)],
откуда и вытекает требуемое равенство.
Справедливость всех остальных законов проверяется
аналогично.
Выполнение сочетательного закона позволяет
определить степень оператора по правилам
А1-А,
А2 = АА,
А3 - А2А = (АА) А = А (АА) = АА2,
An = An-1A-AAn-1.
При этом имеет место формула
Atn+ft = AwAn (m,n=l,2, ...), (13)
которую легко доказать по индукции.
Ещё положим по определению
А° = Е (тождественный оператор)
и покажем, что формула (13) остаётся справедливой и в том
случае, когда один из показателей обращается в нуль.
Действительно, если В —любой оператор, то
(BE) х = В (Ех) = Вх = Е (Вх),
так что
ВЕ = ЕВ = В.
Полагая В = АП, получаем:
AnE = EAn = An>
что и требуется.
§ 29] СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ С МАТРИЦАМИ 101
Подчеркнём, что произведение операторов не переме-
стительно: вообще говоря, АВ^ВА*).
Пример
Некоммутативные операторы можно построить уже в
пространстве Гг (т. е. на плоскости). Пусть оператор А означает
поворот на угол 90° (пример 4), а оператор Р—проектирование
на ось ех (пример 5). Рассмотрим результат применения
операторов АР и РА к вектору ех:
АР*!=А (Р^) = Аех = е2, ¥Ае1 = Р (кех) = Ре2 = 0.
Тем самым АР^РА.
Задачи
1. В трёхмерном пространстве обозначим через А оператор
поворота на 90° вокруг оси ОХ (от OY к OZ)> через В —оператор
поворота на 90° вокруг оси OY (от OZ к ОХ), через С—на 90°
вокруг оси OZ (от ОХ К OY). Показать, что А4 = В4=С*=Е,
АВ^ВА, А2В2 = В2А2. Имеет ли место равенство АВАВ = А2В2?
2. В пространстве всех многочленов от t обозначим через А
оператор дифференцирования, а через В —оператор умножения
на независимое переменное:
AP(t)=:P'(t), BP(t) = tP(t).
Имеет ли место равенство АВ = ВА? Найти оператор АВ—ВА.
Отв. АВ —ВА = Е.
3. В предположении АВ = ВА доказать формулы
(А + В)2=А2 + 2АВ + В2,
(А + В)3 = А3 + ЗА2В -f ЗАВ2 + В3.
Как следует изменить эти формулы, когда АВ ф ВА?
Отв. (А + В)2 = А2 + АВ + ВА + В2,
(А + В)3=А3 + А2В + ABA + АВ2 + ВА2 + ВАВ+В2А + В8.
4. В предположении АВ —ВА = Е доказать формулу
AWB—BAm = mAm-1 (m=l, 2, ...)•
§ 29. Соответствующие действия с матрицами
1. Предполагая, что R — конечномерное пространство,
выясним, как отражаются действия с операторами на
матрицах этих операторов в некотором фиксированном базисе
{*} = {*!, e2i ..., еп}.
*) Что нисколько не исключает возможности коммутирования
некоторых пар операторов: например, АЕ = ЕА=А для любого А.
102 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
Прежде всего рассмотрим введённое нами в начале § 28
определение равенства операторов А и В. Пусть А= \\ а[П \\
есть матрица оператора А в базисе {е} = {еь е2, ..-,еп}
д-мерного пространства R и В = ||Ь(Л|| есть матрица
оператора В в этом же базисе. Полагая х = е; в равенстве
А£ = В#, мы получаем:
п п
2 а[з)е{ = Aej = Be/ = 2 b^'
Отсюда <4;) = b[j) для всех индексов i и / и, следовательно,
А = В.
Таким образом, равные операторы обладают и
одинаковыми матрицами.
2. Рассмотрим теперь действие сложения операторов.
Пусть в n-мерном пространстве R даны два оператора
А и В и, кроме того, в R выбран базис {е} = {еъ е2, ..♦, еп}»
Пусть, далее, оператору А в этом базисе соответствует
матрица А = || а[^ ||, а оператору В — матрица В = || b[3) ||;
следовательно,
п п
Ае/- 2 а>)е» BeJ = 2 ь^ (/ = 1, 2, .. ., и).
i=i i=i
В таком случае
п
(А + В) е, = ке, + Be, = 2 (4У) + Мй) <Ч,
откуда следует, что оператору А + В соответствует матрица
II 4;)+&1;)||- Такая матрица называется суммой матриц
!|aP>|| s ||#>||.
Переходим к действию умножения оператора А на число.
Если X — вещественное число, то
п
(XA)ey = X(Aey) = 2Jx4V
«=■1
§ 29] СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ С МАТРИЦАМИ ЮЗ
Следовательно, оператору ХА соответствует матрица || \a[j) ||,
получающаяся умножением всех элементов матрицы || а\^ ||
на число X. Такая матрица называется произведением
матрицы \\a[j)\\ на число X.
Поскольку матрицы /г-го порядка и линейные операторы,
действующие в /г-мерном пространстве, соответствуют друг другу
взаимно однозначно (§ 27), действия с операторами соответствуют
одноимённым действиям с матрицами и действия с операторами
подчиняются правилам (10)—(11), мы можем сделать вывод, что
действия с матрицами также подчиняются правилам (10)—(И), что,
впрочем, легко было бы проверить и непосредственно. Тем самым
мы получаем, что совокупность всех матриц п-го порядка
образует линейное пространство. По самому построению оно изоморфно
линейному пространству всех линейных операторов, действующих
в гс-мерном пространстве R.
Задачи
1. Найти размерность линейного пространства R всех
линейных операторов, действующих в /г-мерном пространстве Я,
и построить базис пространства R.
Отв. Размерность пространства R равна /г2. В качестве
базисных операторов можно взять такие, которым соответствуют
матрицы Aij, с единственным ненулевым элементом на
пересечении i-й строки и /-го столбца.
2. Доказать, что для любого оператора А, действующего
в /г-мерном пространстве /?, можно найти многочлен
Р(х) = а0 + а1х + ... +атхт
степени не выше, чем /г2, для которого
Р(А) = я0Е + л1А+...+ятАт
есть нулевой оператор.
Указание. Использовать результат задачи 1.
Примечание. Всякий многочлен Р(х), обладающий
свойством Р(А) = 0, называется аннулирующим многочленом
оператора А. Один из аннулирующих многочленов степени п будет
указан в дальнейшем (§ 38, задача 2).
3. Доказать, что для операторов А и В, действующих в
/г-мерном пространстве i?, равенство АВ—ВА=Е невозможно.
Указание. Использовать результат задачи 2, причём
рассмотреть многочлен Р(х) наименьшей возможной (для
оператора А) степени, и результат задачи 4 § 28.
Примечание. Результат задачи 2 § 28 показывает, что
в рассматриваемом случае предположение о конечномерности
пространств R существенно.
104 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
3. Переходим, наконец, к произведению операторов.
В прежних обозначениях мы получаем:
п
(АВ)е/ = А(Ве/) = А2^'Ч =
1 = 1
= 2 b^Aei = 2 #> S Л = 2(2 а* > #>) «ь
i=l i=l fe=l fe=l i=l
Следовательно, элементы с£;) матрицы С оператора С = АВ
имеют вид
п
^•>==2«")М;') (/,* = 1,2 в). (14)
Это и есть интересующий нас результат. Его можно
выразить так: элемент матрицы С, стоящий на
пересечении её к-й строки и j-го столбца, равен сумме
произведений всех элементов k-й строки матрицы А на
соответствующие элементы /-го столбца матрицы В.
Матрица С = || с^*>||, которая получается из матриц
\\а№\\ и ll&J^H по формуле (14), называется произведением
первой из этих матриц на вторую. Поскольку
произведение линейных операторов не переместительно,
произведение матриц также не переместительно; поэтому при
умножении матриц указание места каждого из
множителей существенно.
Умножение операторов, как мы видели, подчиняется
сочетательному и распределительному законам. Поскольку
матрицы и операторы находятся во взаимно одщэзначном
соответствии и умножение матриц соответствует
умножению операторов, мы можем сделать вывод, что
сочетательный и распределительный законы удовлетворяются
также и для_: умножения матриц. Поэтому, в частности,
так же, как в § 28, мы можем определить действие
возвышения матрицы в степень. Формула (13), очевидно,
будет справедлива и для степеней матрицы.
§ 29] СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ С МАТРИЦАМИ 105
Задачи
1. Найти произведение матрицы А на матрицу В:
А=
Отв. АВ =
II 1
2
3 1
2 4 6
|| 3 6 9
10 0 0
00 0
|| 0 0 0
в=
1 ""1
—2 -
4 1
_1 _2 —4
1 12 4 1
»
2. Выполнить действие возведения в тг-ю степень матриц
А = \
Отв. Лп =
1 111
0 l||
11 7»|
|0 1
и В = \
1, яп=
cos 9 —sin 9
sin <p cos <p
|costt<p —sin n<p ||
1 sin /г<р coswp||
3. Операторы А и В в некотором базисе имеют матрицы
А = \\
ог 0 ... 0
0 о2 ... .0
0 0 . . . ап \
В\
| a 1 0. .0
0 a 1 . . .0 j
—
| 0 0 0.
.
a 1
Найти в этом же базисе матрицы операторов Ak и ВЛ.
Отв.
Ak =
Ji
0 ... 0
<Л . . . о
о о
Bk =
Clafc-i
r2 Jt-2
0 0
d06 ЛИНЕЙНЫЕ -ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ.
ВИЮ
4. Найти все матрицы А 2-го порядка, удовлетворяющие усло-
0 О
О О
Отв. А~
а Ь
с —а
Л2-
где Ьс = —с2.
5. Проверить распределительные и сочетательные законы для
умножения матриц, исходя непосредственно из формулы (14)
6. Вычислить АВ—ВА:
а)
б)
«4 =
А = \
II 1 2 2
2 12
II 1 2 3
1 2 1 01
.112
1—12 11
в=
в=\
1 4
~4
1 1
3
3
.—з
1
2
2
1
—2
5
1 |
°1
1 |
—2 ||
4
—ill
Отв. а)
.10 — 4 -7
6 14 4
■7 5—4
б)
0 0 0
0 0 0
0 0 0
В заключение параграфа мы приведём ещё две теоремы,
относящиеся к произведению матриц, но не имеющие
прямого геометрического смысла.
4. Произведение транспонированных
матриц. Пусть А ж В — две матрицы п-го порядка и С — АВ.
Обозначим через А', В', С матрицы, транспонированные
по отношению к матрицам А, В, С. Покажем, что имеет
место равенство
(АВ)' = В'А'. (15)
Для доказательства обозначим элементы матриц А, В,
Су А', В'у С соответственно через а,ц, 6ij, Ci/, ау = а#,
bij = bji, c\j — Cji. Равенство (14), определяющее элементы счь,
мы можем переписать в виде
;=1 У=1 j-l
§ 29] СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ С МАТРИЦАМИ Ю7
Суммирование проходит по индексу / при фиксированных
индексах ink. Фиксированные индексы указывают, что
для образования элемента с'м в матрице В' используется
&-я строка, а в матрице А'— i-й столбец. В результате
образования суммы произведений соответствующих
элементов получается элемент с£ь лежащий на пересечении
к-и строки и 1-го столбца матрицы С. Но по определению
произведения матриц это и означает, что матрица С" есть
произведение матрицы В' на матрицу А'. Тем самым
равенство (15) доказано.
5. Определитель произведения двух
матриц. Пусть i4 = ||ai;|| и B = \\bjk\\—-две произвольные
матрицы и С = || cik || — произведение первой матрицы на
вторую: С = АВ.
Выпишем определитель матрицы С:
detC =
I ли6п + а12Ь21 + • • • + ainbni aii&i2 + ... + й1пЬп2...
Я21&П + Я22&21 + • • • + <hiJ>nl a21*12 + • • • + <htfin* • • •
ЯщЬп + ЯП2&21 + • • • + dnnbnl <*п1Ь12 + • • • + Я/i Ai2 • • •
... аг1Ь1п + а12Ь2п+.. .+alnbnn I
... a21bln + a22b2n + • • • +
• • • anl6in + <*nAn + • • • + annbnn I
Для вычисления его используем линейное свойство
определителя (§ 3, п. 3). Каждый столбец определителя
матрицы С является суммой п «элементарных» столбцов
с элементами вида аф^ (/, к фиксированы, i вдоль
столбца изменяется от i до тг). Поэтому весь определитель равен
сумме пп «элементарных» определителей, составленных
108 линейные функции векторного аргумента [гл. 4
только из «элементарных» столбцов. Поскольку в каждом
из элементарных столбцов множитель bjk вдоль столбца
не меняется, он может быть вынесен за знак
элементарного определителя. После этой операции каждый из
элементарных определителей принимает следующий вид:
Ьц\Ьг22 • • • Ъ,
гпп
#lii #li2 • • • alin
«2ii 0>2i2 • • • a2in
*nti
bnin
(16)
где il9 i29 .-., in — некоторые числа от 1 до п. Если среди
этих чисел есть одинаковые, то соответствующий
элементарный определитель, очевидно, равен нулю. Мы можем,
следовательно, рассматривать лишь такие элементарные
определители, для которых все индексы ilf i2, ..., in Раз~
личны. В этом случае определитель
A(il9 i2, ...,in) =
&2ii G>2i2
а2гп
*"П\\
*П12
*П1П
с точностью до знака совпадает с определителем матрицы А.
Выясним, какой знак нужно поставить • перед
определителем A(il9 i2> ..., in)> чтобы получился в точности
определитель матрицы А. Для этого будем последовательно
переставлять в определителе A (ilt i2, ..., in) соседние
столбцы с тем, чтобы в результате получить их
нормальное расположение (т. е. совпадающие с расположением
столбцов в самой матрице .4). При каждой перестановке
двух соседних столбцов определитель A (ilf i2, *.., in)
изменит знак; с другой стороны, при этом число
беспорядков в перестановке индексов il9 i2j ..., in изменится
на единицу. Так как в окончательном расположении
столбцов вторые индексы идут в натуральном порядке,
без беспорядков, то число последовательных перемен знака
§ 29] Соответствующие действия с матрицами 109
равно числу беспорядков в перестановке индексов iXi
Н> •••> in*)» Обозначим это число через N. Тогда
выражение (16) приобретает следующий вид:
(-1УХ1&г22 ... binn det А. (17)
Чтобы получить det С, мы должны сложить все
выражения вида (17). При этом общий множитель det А можно
вынести за скобку. В скобке останется сумма членов вида
( — 1) &iil&i22 • •• hnn-
Каждый из них есть, очевидно, член определителя
матрицы В с положенным ему знаком (§ 2); сумма всех
этих членов равна самому определителю матрицы В.
В результате мы получаем следующую важную формулу:
det АВ = det A det В. (18)
Итак, определитель произведения двух матриц равен
произведению определителей матриц-множителей.
Задачи
1. Пусть в гс-мерном пространстве даны т линейно
независимых векторов
п
*ув2#Ч (/' = 1.2, ...f m)
и оператор А действует по формулам
m
Уу==Ажу=2 ah)xh (/ = 1» 2> -м4
Показать, что каждый минор к-го порядка в матрице из
координат векторов г/у (относительно базиса е19 е2, ..., еп) равен
произведению соответствующего минора в матрице из координат
векторов xj на det || а^ \\.
*) Предполагается, что при каждой перестановке индексов
меньший индекс становится впереди большего и тем самым число
беспорядков уменьшается ровно на единицу.
110 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ.-4
2. Доказать, что каждый минор к-то порядка матрицы С = АВ
равен сумме произведений некоторых миноров матрицы A is.
некоторых миноров матрицы В. Написать соответствующую формулу.
Указание. Использовать метод доказательства формулы (18).
Отв.
3. Доказать, что каждый минор fc-ro порядка матрицы ЛВС
равен сумме произведений некоторых миноров к-го порядка
матриц А, В и С.
§ 30. Обратный оператор и обратная матрица
Оператор В, действующий в линейном пространстве Д,
называется обратным *) к оператору А, действующему
в этом же пространстве, если выполняется условие
ВА = Е. (19)
Далеко не всякий линейный оператор обладает
обратным. Например, если оператор А переводит некоторый
ненулевой вектор x£R в нуль, то для любого линейного
оператора В мы будем иметь:
(ВА)ж = В(Ая) = В.0 = 0,
и следовательно, для любого оператора В равенство
ВА = Е невозможно. Таким образом, оператор А не имеет
обратного.
Если R — конечномерное пространство, А и В — матрицы
операторов А и В в некотором фиксированном базисе,
то согласно § 29, п. 3 равенство (19) эквивалентно
равенству
ВА = Е. (20)
Естественно матрицу В, удовлетворяющую
уравнению (20), называть обратной для данной матрицы А.
Согласно теореме о произведении определителей (§ 29,
п. 5) из равенства (20) вытекает
detBdetii = det£=l. (21)
*) Иногда говорят «левым обратным».
§ 30] ОБРАТНЫЙ ОПЕРАТОР И ОБРАТНАЯ МАТРИЦА Ш
Это показывает, во-первых, что необходимым условием
существования обратной матрицы является
неравенство нулю определителя данной матрицы: очевидно, что при
det Л = 0 равенство (21) не может быть выполнено ни
для какой матрицы 5.
Во-вторых, из этой же формулы (21) вытекает, что
обратная матрица, если она существует, всегда имеет
отличный от нуля определитель.
В дальнейшем мы будем называть матрицу с
определителем, отличным от нуля, невырожденной, а матрицу
с определителем, равным нулю, вырожденной. Покажем,
что для всякой невырожденной матрицы существует
обратная матрица, определённая однозначно.
Здесь будет удобнее перейти к геометрическому языку.
Оператор А, отвечающий матрице А, переводит базисные
векторы еъ е2, ..., еп в некоторые векторы /ь /2, ..., /п,
координаты которых выписаны в столбцах матрицы А
(§ 27). Поскольку (let А Ф 0, её столбцы линейно
независимы, и следовательно, векторы Д, /2, ..., /»' снова
образуют базис тг-мерного пространства R.
Допустим на минуту, что искомый обратный оператор
В существует. Тогда должны удовлетворяться равенства
BKek~ek (А-1,2, ...,п) (22)
или
B/ft = efe (*-1,2, ...,*). (23)
Таким образом, нам известно, что искомый оператор В
должен переводить векторы Д в е&. Но векторы /&
образуют базис в пространстве R. Поэтому мы можем задать
оператор В условиями (23), причём он будет определён
однозначно. Поскольку равенства (22) и (23) равносильны,
оператор ВА имеет в базисе {е} единичную матрицу и,
следовательно, является тождественным оператором. Таким
образом, построенный нами по условиям (23) оператор В
является обратным к оператору А и по самому
построению определён однозначно. Отметим, что при этом
оператор А является обратным для оператора В:
действительно, для базиса {/} мы имеем:
ABfk = Ae =/fe; (24)
112 линейные функции векторного аргумента [гл. 4
это показывает, что оператор АВ в базисе Д имеет
единичную матрицу и, следовательно, есть тождественный,
оператор.
Построим теперь матрицу оператора В в базисе {е}„
Обозначим неизвестные элементы этой матрицы через b\j)
(i,/ = 1,2, ...,и), так что
Be; = 26">ei-
(25)
i = l
Применяя к равенствам (25) оператор А и используя
полученное равенство АВ = Е, мы получаем:
в/-З^Ав|=З^А-
(26)
1=1
1 = 1
Таким образом, коэффициенты b[j) суть коэффициенты
разложений векторов ej по системе {/(}. Но в таком
случае эти коэффициенты могут быть получены путём
решения системы уравнений с известными коэффициентами
д=2а^-
i=l
Обозначая Z> = det || a^'> || и решая эту систему по
формулам Крамера (§ 7), мы получаем:
D
/7<J> i /,<*>
а(1)
(In
а^
Лп) . (п)
J")
= IT (Auh + ^«у/» + • • • + ^»///)>
(i)
где Ay означает алгебраическое дополнение элемента а}1
в матрице А. Сравнивая полученный результат с фор-
§30] ОБРАТНЫЙ ОПЕРАТОР И ОБРАТНАЯ МАТРИЦА ИЗ
мулами (26), находим:
Итак, элемент b[3) обратной матрицы равен отношению
алгебраического дополнения элемента а\}) исходной матрицы
к её определителю.
Матрица, обратная к матрице А, обозначается через А'1.
Далее, (А*1)11 обозначается через A~k. Легко доказать
по индукции, что формула (13) распространяется также
и на все отрицательные показатели.
Аналогичные обозначения применяются для обратного
оператора и его степеней. Распространение формулы (13)
на отрицательные показатели для операторов в
конечномерном пространстве вытекает непосредственно из
справедливости этого распространения для матриц. В общем
случае это распространение можно проделать только
в предположении, что оператор А перестановочен со своим
обратным.
Задачи
1. Для матриц А, В, С найти обратные матрицы
н . ~ - || 1 2 —3 II
Отв.
8 Г. Е. Шилов
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
с-^с.
Б~1 = \
1
0
0
— 2
1
0
7 1
-2 1
1 1
114 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
2. Для любой невырожденной матрицы А доказать равенство
(Л'Г1^^-1)'.
3. Исследовать уравнение ХА — 0, где А—данная матрица
2-го порядка, X—искомая матрица 2-го порядка, 0—нулевая
матрица (матрица, все элементы которой равны нулю).
Отв. Если А—нулевая матрица, то X—любая. Если det А Ф О,
то X — нулевая матрица. Если det А = 0, но А—не нулевая
матрица, то её строки пропорциональны; пусть а : р есть
отношение соответствующих элементов первой и второй строк матрицы А,
тогда
х=Л ~^Р ар II
II — h «flf II
При ЛЮбыХ р И q.
4. Пусть А = \\ а[;) || — любая квадратная матрица n-го порядка
и А^р — алгебраическое дополнение элемента cffi в определителе
матрицы А. Матрица Л = ||^4^|| называется присоединенной для
матрицы А.
Показать, что А А = АА ■= (det А) • Е. *
В заключение подчеркнём ещё одно существенное
обстоятельство. Мы уже видели, что в тг-мерном
пространстве оператор А, обладающий обратным оператором, имеет
в любом базисе невырожденную матрицу. С другой
стороны, мы показали, что если матрица оператора А в
некотором базисе не вырождена, то оператор А обладает
обратным и, следовательно, имеет в любом базисе
невырожденную матрицу. Таким образом, факт
вырожденности или невырожденности матрицы оператора не
зависит от выбора базиса в пространстве и определяется только
самим оператором. Операторы, обладающие обратными,
имеют в любом базисе невырожденную матрицу;
операторы, не имеющие обратных, в любом базисе имеют
вырожденную матрицу.
В бесконечномерных пространствах вопросы о существовании
и свойствах обратного оператора решаются уже далеко не так
просто. В частности, из условия ВА=Е, вообще говоря, уже
нельзя заключить, что и АВ = Е: более того, оператор В,
обратный для оператора А, сам может уже не иметь обратного.
Задачи
1. Пусть R — линейное пространство всех многочленов от
аргумента t. Рассмотрим операторы А и В, определённые условиями
А [а0 + a{t + ... + «n*n] = ax + ^J + --+ an*n_1»
B[ai> + ail + ... + antn\ = a0t + ait* + ... + antn+i.
§ 31] ГЕОМЕТРИЧЕСКИЕ ХАРАКТЕРИСТИКИ ОПЕРАТОРОВ Ц5
Показать, что А и В —линейные операторы и что
АВ = Е,
ВА^Е.
Обладает ли оператор А обратным?
Отв. Нет.
2. Если оператор А обладает обратным оператором В и сам
является обратным для некоторого оператора С, то 1) В —С;
2) В—единственный обратный оператор для А.
§ 31. Простейшие геометрические характеристики
линейных операторов
1. Пусть дан линейный оператор А в пространстве Д.
Совокупность векторов у = Ах для всех х g R называется
областью значений оператора А и обозначается через
^(А). Покажем, что Т(А) является подпространством
пространства R. Действительно, если у1 = Ахъ 2/2 = А#2,
то 2/i + г/2 = Axi + Ах2 = А (х1 + х2); далее для любого
вещественного X, очевидно, \у1 = ХАж1 = А(кхг); таким
образом, вместе с векторами ух и у2 векторы у^Л-Уг и Х^
входят в область значений оператора А. В гс-мерном
пространстве R легко вычислить размерность области значений
оператора А, если он задан своей матрицей в некотором
базисе {e}={elf e2, ...,en}. Произведём это вычисление.
Полагая
п
fe-i
мы получаем:
п
У = Ая = 2 ZkAek;
следовательно, область значений оператора А совпадает
с линейной оболочкой векторов Аеи Ае2,. .., Аеп.
Размерность линейной оболочки Ь{Аеъ Ае2, . . ., Аеп) согласно
§ 16, п. 4 равна максимальному количеству линейно
независимых векторов в системе Аеъ Ае2, . .., Аеп. Мы знаем,
что в столбцах матрицы оператора А выписаны координаты
векторов Аву относительно базиса {е}; таким образом,
8*
116 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ.
вопрос о максимальном количестве линейно независимых
векторов в системе Ае;-(/ = 1, 2, ..., п) немедленно
сводится к вопросу о максимальном количестве линейно
независимых столбцов у матрицы оператора А. Но это
последнее в силу теоремы 18 (§ 19) равно как раз рангу
матрицы оператора А. Итак, размерность области
значений линейного оператора А, действующего в п-мерном
пространстве R, равна рангу матрицы оператора А
в каком-нибудь базисе пространства R. Заметим, что
выбор базиса в данном случае безразличен: следовательно,
ранг матрицы оператора А не зависит от выбора базиса,
а только от самого оператора А. В дальнейшем мы будем
ранг матрицы оператора А (в любом базисе) называть
просто рангом оператора А.
2. Переходим теперь ко второй геометрической
характеристике оператора А. Рассмотрим совокупность L тех
векторов x£R, которые оператором А переводятся в нуль.
Эта совокупность называется нуль-многообразием
оператора А и обозначается через N (А). Нуль-многообразие
также является подпространством: очевидно, что из Azi = 0
и А#2 = 0 следует А(х1-\-х2) = Ах1-\-Ах2 — 0, А(>ча;1) =
= ХАях = 0.
Найдём размерность нуль-многообразия оператора А,
действующего в n-мерном пространстве Д, по матрице
этого оператора в некотором базисе {е} = {ег> ..., еп).
п
Пусть я=2 iiei^N(A). Тогда система (6) § 27 при-
i=i
[щмает вид
a\% + a\%+...+a\n)tn = 0,
а(2% + а(22\+ .. . + <#%> = <>,
Очевидно, что и обратно, всякий вектор х £ R, координаты
которого удовлетворяют системе (27). входит в
нуль-многообразие оператора А. Таким образом, вопрос о размер-
(27)
i 31] ГЕОМЕТРИЧЕСКИЕ ХАРАКТЕРИСТИКИ ОПЕРАТОРОВ 117
ности нуль-многообразия оператора А равнозначен вопросу
о размерности подпространства решений системы (27).
В силу § 23 размерность этого подпространства равна
числу п~ г, где г —ранг матрицы из коэффициентов
системы, или, что то же самое, ранг оператора А.
Итак, размерность нуль-многообразия оператора А
равна дополнению ранга оператора А до размерности
пространства R, в котором действует оператор А.
Задача
Показать, что пересечение нуль-многообразия оператора А
с его областью значений совпадает g нуль-многообразием
оператора А2.
3. Замечание. Следующее предложение есть обращение
результатов пп. 1 и 2:
Каковы бы ни были два подпространства N и Т п-мерного
пространства Я, сумма размерностей которых равна
размерности i?, существует линейный оператор А, для которого N (А) = iV,
Г(А) = Г.
Для доказательства обозначим размерности подпространств N
и Т соответственно через к и га = гс —к. Выберем в
подпространстве Т m линейно независимых векторов /15 /2,..., fm- Выберем, далее,
произвольный базис elt e2, ..., еп в пространстве R так, чтобы
первые к векторов базиса лежали в подпространстве N.
Определим оператор А условиями
А^ = 0 (i = l, 2,..., к), )
(28)
А*4+Л=Д (*=1, 2, ..., m). j
Покажем, что оператор А удовлетворяет поставленным
требованиям. Прежде всего, очевидно, что Т (А) есть линейная оболочка
векторов /. (г = 1, 2, ..., т) и, следовательно, совпадает с
подпространством Т. Затем всякий вектор подпространства N по условию
принадлежит к N (А); нам остаётся показать, что любой вектор
пространства N (А) входит в N. Допустим, что для некоторого
п
х— 2 f.ei будет А# = 0. Используя условия (28), мы получаем:
i=l
O^Ax^A(Z1e1 + ... + Znen) = Zk+if1 + ...-\-Znfm).
Поскольку flf /2, ..., /m линейно независимы, мы имеем
£fe+ { =... ss 5П = 0. Но тогда х = ^ + ... + bkek 6 N, что и требуется
4. Следующие теоремы о ранге произведения двух
матриц вытекают из свойств только что введённых
геометрических характеристик.
118 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
Теорема 23. Ранг произведения двух матриц не
превосходит ранга каждого из сомножителей.
Доказательство. Пусть А и В —линейные
операторы, соответствующие перемножаемым матрицам. Тогда
область значений оператора АВ в силу самого его
определения содержится в области значений оператора А.
Поскольку согласно п. 1 размерность области значений
любого оператора равна рангу соответствующей матрицы,
мы получаем, что ранг произведения двух матриц не
превосходит ранга первого множителя. Чтобы доказать,
что он не превосходит также и ранга второго множителя,
перейдём к транспонированным матрицам; используя
формулу (15) § 29, мы получим:
ранг АВ = ранг {АВ)' = ранг В'А' < ранга В' = рангу В,
что и требуется.
Ранг произведения двух матриц может быть и меньше,
чем ранг каждого из сомножителей. Например, матрицы
А =
В =
обе имеют ранг, равный единице, а их произведение
Ю 01
АВ.
0 0
имеет нулевой ранг. Поэтому представляет интерес
следующая теорема, дающая оценку ранга произведения
двух матриц не сверху, а снизу:
Теорема 24. Ранг произведения двух матриц п-го
порядка не менее чем (ri~j-r2) — nf где гг и г 2 —ранги
множителей.
Доказательство. Покажем сначала, что оператор А
ранга г переводит всякое ^-мерное подпространство R' CZ R
в подпространство А (/?'), размерность которого не ниже
г — (п — к). Выберем базис е1у е2, ..., еп в пространстве/?
так, чтобы первые к векторов базиса лежали в
подпространстве R' (см. § 15, п. 3). Координаты векторов Aelt
Ае2, •••, Ае&, порождающих подпространство А(/?'),
занимают в матрице оператора А к первых столбцов.
По условию в матрице оператора имеется г линейно
§32] АЛГЕБРА ЛИНЕЙНЫХ ОПЕРАТОРОВ И ЕЁ ИДЕАЛЫ 119
независимых столбцов. Эти столбцы разобьём на две
группы: в первую группу отнесём те, которые имеют
номера от 1 до к, а во вторую группу —те, которые имеют
номера от к + 1 до п. Численность второй группы не
более чем /г —/с; следовательно, численность первой группы
не менее чем г — (п — к). Таким образом,
подпространство А(Я') имеет не менее чем г — (п—-к) линейно
независимых векторов, что и утверждалось.
Пусть теперь А и В —линейные операторы,
соответствующие перемножаемым матрицам, причём гх есть ранг
оператора" А, г2 есть ранг оператора В. Оценка ранга
матрицы оператора АВ согласно п. 1 есть оценка
размерности области значений этого оператора. Оператор В
переводит всё пространство R в подпространство Т (В)
размерности г2. По доказанному оператор А переводит
подпространство Т (В) в подпространство, размерность которого не
ниже чем гх — (п — г2) = гг + г2 — п. Таким образом, область
значений оператора АВ, а с ней и ранг матрицы АВ
имеют величину не ниже г1+гг — п, что и требовалось.
Следствие 1. Если одна из перемножаемых
матриц порядка п не вырождена (т. е. имеет ранг п)>
то ранг произведения равен рангу второй матрицы.
Действительно, в этом случае оценки ранга
произведения сверху и снизу, полученные в теоремах 23 и 24,
дают одинаковый результат, равный рангу второй матрицы.
Следствие 2. Если обе перемножаемые матрицы
не вырождены, то и их произведение— невырожденная
матрица.
Этот результат вытекает также и из теоремы об
определителе произведения двух матриц, доказанной в § 29.
§ 32. Алгебра линейных операторов п-мерного
пространства и её идеалы
Мы уже видели, что совокупность всех линейных операторов,
действующих в некотором линейном пространстве R, сама
образует новое линейное пространство, которое мы обозначим здесь
через 9t Для элементов пространства 9?, кроме линейных
операций, установлена ещё операция умножения (друг на друга),
удовлетворяющая сочетательным и распределительным законам.
Линейное пространство с операцией умножения, удовлетворяющей
сочетательным и распределительным законам, называется алгеброй:
120 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
таким образом, рассмотренное нами пространство SR представляет
собой пример алгебры.
Пусть дана некоторая алгебра Ш, элементы которой мы будем
обозначать буквами А, В, ... Подпространство Ш' С ffi называется
левым идеалом алгебры Ш, если из В 691' следует ABE 91' для
любого элемента АЕ$- Аналогично подпространство Ш" а $1
называется правым идеалом алгебры Ш, если из Вб^" следует
ВА Е №" для любого элемента А Е Ш.
Укажем некоторые примеры левых и правых идеалов в
алгебре Щ всех линейных операторов, действующих в линейном
пространстве R. Прежде всего вся алгебра Ш и нулевое её
подпространство (т. е. подпространство, состоящее из одного
единственного оператора 0) являются, очевидно, одновременно и левыми
и правыми идеалами. Фиксируем теперь подпространство R' aR
и рассмотрим все те операторы B£$ft, которые каждый вектор
подпространства R' переводят в нуль. Обозначим эту
совокупность операторов через 9Г. Совокупность #Г есть, как легко
проверить, подпространство алгебры Ш. Но, кроме того, оно является
и левым идеалом этой алгебры: действительно, если В# = 0 для
любого x£R'f то и АВ# — 0 для любого x£R'f каков бы ни был
оператор AЕ9?- Фиксируем теперь подпространство й"сйи
рассмотрим все те операторы В 6 9?, область значений которых
содержится в подпространстве R". Обозначим эту совокупность
операторов через 9Г. Совокупность SR" есть, очевидно,
подпространство алгебры Ш. Но, кроме того, оно является и правым
идеалом этой алгебры; действительно, если Вх Е R" для любого
х Е R, то и ВАж 6 R" для любого х Е R, каков бы ни был
оператор AESft-
Оказывается, что в том случае, когда пространство R
конечномерно, указанные примеры являются самыми общими примерами
идеалов алгебры Sft. Именно, имеет место следующая
Теорема 25. Каждый левый идеал Ш' алгебры ffi всех
линейных операторов, действующих в конечномерном пространстве R,
есть совокупность всех операторов В Е ■#« переводящих в нуль все
векторы некоторого подпространства Rr d R. Каждый правый
идеал ffi" этой алгебры есть совокупность всех операторов В Е $1>
у которых область значений принадлежит некоторому
подпространству R" с R-
Для доказательства нам понадобятся некоторые леммы
относительно нуль-многообразий и областей значений линейных
операторов в n-мерном пространстве. Мы будем обозначать нуль-
многообразия операторов А, В, С через iV(A), iV(B), N (С) и их
размерности через а, р, ?; области значений этих операторов будем
обозначать Т (А), Т (В), Т (С) и их размерности через а, Ь, с.
Согласно § 31
а + а = р + Ь = y + с = п.
Лемма 1. Пусть elf e2,...,en — базис пространства R,
причём векторы ец е2, ..., еа принадлежат N (А). Тогда векторы
Леа. р ..., Аеп линейно независимы.
§ 32] АЛГЕБРА ЛИНЕЙНЫХ ОПЕРАТОРОВ И ЕЁ ИДЕАЛЫ 121
Доказательство. Предполагаемое линейное соотношение
Ха+1 Ае»+1 + • • • + ХпАел = О
равносильно соотношению
А (Х*+1 еа+1 + • • • +хд^п) = 0,
откуда x = la+i eA+i + ... + Xn en £ N (А). Но тогда х линейно
выражается через е1? е2, ..., еа:
xs=K+iea+i + •••+хп^д = Mi + Va+ ••- +W
Так как векторы 6lf е2, ..., еп линейно независимы, то Ха, 4 = • • •
... =ХП = 0, что нам и требуется.
Лемма 2. Пусть в Т (А) выбрано а линейно независимых
векторов /lf /2, ..., /rt, причём Д = Ае$ (г — 1, 2, ..., а). Выберем,
далее, п — а линейно независимых векторов ea+ji ♦ ••> en e M№)•
У?пверждается, что векторы elt e2, ..., еп линейно независимы
и образуют, следовательно, базис пространства R.
Доказательство. Если к предполагаемому линейному
соотношению
Х1е1 + Х2е2+ ... +Хпеп = 0
применить оператор А, то, учитывая, что векторы еа+ ^,..., еп
лежат в N (А), а А^вД для i = l, 2, ..., а, мы получим:
В силу линейной независимости векторов fa мы имеем Хх = Х2 = ...
...=rXa=0. Но тогда и Xa+i = ... =ХП = 0, так как векторы
еа+1> •••! *п по условию линейно независимы. Таким образом,
Xi = 0 при любом г = 1, 2, ..., п, откуда и вытекает линейная
независимость векторов е19 е2, ..., еп.
Лемма 3. Если N (В) d N (С), то существует оператор А,
удовлетворяющий условию С —АВ.
Доказательство. Построим базис elt еъ.,.^еп так,
чтобы векторы elf e2, ..., е& лежали в iV(B). Тогда по лемме 1
векторы /р+4 = Ае^+1, ..., fn = Аеп линейно независимы.
Построим векторы Д, /2, ...,/g так, чтобы система /lf /2, . ..»/п
была базисом пространства i?. Определим оператор А равенствами
Afi^Cei (* = 1, 2, ..., л).
Утверждается, что этот оператор А и является искомым.
Действительно, равенство
ABei = Се$
выполнено для i ^ р, поскольку и правая и левая части равны
нулю; для i > р оно выполнено потому, что для этих /Ве$=/;.
Поскольку векторы ех, е2, •••> еп составляют базис, АВ-=С, что
и требовалось.
122 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
Лемма 4. Если Т (В) Z) Т (С), то существует оператор А,
удовлетворяющий условию С = ВА.
Доказательство. Выберем с линейно независимых
векторов Д, /2,..., /с в ^(С)- Определим векторы elf е2, ...,ес
из условий
/4 = Ве4 (£—1, 2 с);
это возможно, поскольку Т (В) ZD Т (С). Используя лемму 2,
построим по векторам Д, /2, ..., /с и оператору С базис gv gv ..., gn
так, чтобы иметь С^=Д (< = 1, 2, ..., с), С^. = 0 ($ > с).
Определим оператор А условиями
( е-х при i ^ г,
А*,-1
'■-( о'
при i > с.
Утверждается, что оператор А является искомым. Действительно,
равенство
ВА£.=С£.
выполняется при^с, потому что для этих J BA^i = Bej = /i = C^;
для i > с и правая и левая части обращаются в нуль. Так как
#i> £г» •••» £л~-базис пространства R, то ВА = С, что и требуется.
Лемма 5. Пусть N (А) является пересечением конечного
числа подпространств Р, Q, ... Тогда существуют операторы
В, С, ... такие, что N (В) Z)P, N (С) Z)Q, ... и В4-С+ ... =А.
Доказательство. Достаточно рассмотреть случай двух
подпространств Р, Q. Пусть выбрано а линейно независимых
векторов elt ez, ..., еа в N (А). Дополним их некоторыми
векторами plt p2i ..., рг до базиса в подпространстве Р и, с другой
стороны, векторами qv qv ..., q — до базиса в подпространстве Q.
В силу § 15, п. 4 векторы еъ ..., е^ pv ..., pr, qv...9 qs линейно
независимы; дополним их векторами Д, /2, ...,/щ До полного
базиса пространства R. Определим операторы В и С условиями
В<ч = 0, Вр. = 0, Bq^Aqi9 ВД = ^-АД,
Oi = 0f. CPi = ApitCqt = 0, СД = 1аД.
Очевидно, что В + С = А; далее, N(B)Z)P, iV(C)Z)Q, что и
требуется.
Лемма 6. Пусть Т (А) является суммой конечного числа
подпространств Р, Q, ... Тогда существуют операторы В, С, ...
ш«иё,чтоГ(В)сР, r(G)crQ, ... вВ + C-f...sA,
Доказательство. Достаточно рассмотреть случай, двух
подпространств Р, Q. Обозначим через S их пересечение. По-
§ 32] АЛГЕБРА ЛИНЕЙНЫХ ОПЕРАТОРОВ И ЕЁ ИДЕАЛЫ 123
строим в подпространстве У (А) базис elt ..., ek> pv ..., pr,
qv ..., qs так, чтобы векторы el9 ..., ek образовали базис
подпространства S, векторы Ci,...,e9 Pv---,pr—базис
подпространства Р и векторы elt ..., ек, qv ..., q —базис
подпространства Q.
Пусть, далее, векторы е?, />?, q? определены равенствами
<<Ч = Аф ^==А/>.*, ^ = Aflf.*.
Согласно лемме 2 векторы е?, p*t q* вместе с а линейно
независимыми векторами j%, взятыми из iV(A), образуют базис
пространства R. Определим операторы В и С формулами
Be?=l*it Bp* = pv В?*=0, В/£ = 0,
Се?=1е{, С/>* = 0, Cq? = g., C/f = 0.
Очевидно, что В + С = А. Далее, 7"(В) порождается векторами
е{ vl pi и поэтому содержится в подпространстве Р; аналогично
Г(С)С(?. Таким образом, лемма 6 доказана.
Переходим к доказательству теоремы 25. Пусть сначала #Г
есть некоторый левый идеал алгебры Sft. Рассмотрим совокупность
iV($ft') всех векторов x£R, для которых В# = 0 при любом В£Щ'.
Очевидно, что N(ffi') есть подпространство. Покажем, что всякий
оператор А, для которого N (di')CZ N (A)f входит в идеал Ш';
этим будет доказано первое утверждение теоремы 25. Сначала
предположим, что N (А) = N (Щ') *).
Подпространство N(31') может быть построено с помощью
следующего конечного процесса. Возьмём произвольный оператор
Bi 6 9Г и образуем N (Вх). Если для всякого Сг g 91' N (CJ 3 N (Bj),
то iV(^/) = iV(B1), и построение закончено. Если найдётся CL£bif
такой, что N (Сх) не содержит iV(Bx), то мы образуем
пересечение N(Blf Сх) подпространств N (Вг) и N (Cj). Если для всякого
ЯхбЗГ JYCD^OiVCB!, C2), то N($t') = N(Blt Cj), и построение
закончено. В противном случае с помощью подходящего оператора
мы можем продолжить построение. После конечного числа шагов
процесс должен закончиться, поскольку каждый шаг связан
с уменьшением размерности.
Итак, можно считать, что подпространство N (W) есть
пересечение конечного числа подпространств P = N (Bx), Q — N (С^,...,
где В19 Сь ... входят в идеал Sft'. В силу леммы 5 мы можем
построить операторы В, С, ... такие, что N (B)Z)P = N (BJ,
N(C)z^Q~N(Ci)t ..., В + С-Ь ... =А. В силу леммы 3
операторы В, С, ... получаются из операторов Въ Сь ... умножением
*) Существование такого оператора А следует, например, из
§ 31, п. 3.
124 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [ГЛ. 4
слева на некоторые операторы; поэтому вместе с операторами
В1} Clf ... операторы В, С, ... также входят в идеал 9Г: вместе
с ними в идеал 91' входит и их сумма В + С + ... = А. Итак,
всякий оператор А, для которого iV(A) = iV(9t'), входит в
идеал 9Г. Снова применяя лемму 3, находим, что к идеалу W
принадлежит и любой оператор А, для которого N (Ах) ZD N (А) =
= iV(9t'V, этим первое утверждение теоремы 25 доказано.
Пусть теперь 9Г —некоторый правый идеал алгебры 9t
Рассмотрим линейную оболочку Т (W) всех векторов Вх для х £ Я,
В£#'. Подпространство Т (91") может быть получено как
конечная сумма подпространств 3П(В1), 77(С1), ...; это может быть
доказано с помощью приёма, аналогичного тому, который мы
применили для пересечений при доказательстве первой части
теоремы. Мы хотим показать, что всякий оператор А, для
которого Т (А) С Т (9Г), входит в идеал 91"; этим второе утверждение
теоремы 25 будет доказано. Пусть сначала Т(А) = Т(Ш") *). Тогда
в силу леммы 6 существуют операторы В, С, ... такие, что
Г (В) С Г (ВО, Г (С) с Г (Q), ... и В + С + ... = А. В силу
леммы 4 операторы В, С, ... получаются из операторов Blf Clf...
умножением справа на некоторые операторы; поэтому вместе
с операторами Вь Сх, ... операторы В, С, ... также входят
в идеал $"; вместе с ними в идеал 9Г входит и их сумма
В + С+ ... = А. Итак, всякий оператор А, для которого 77(А) =
= Т(9Г), входит в идеал 9Г. Снова применяя лемму 4, находим,
что к идеалу 91" принадлежит и любой оператор Аь для которого
Т(Аг)С1 Г (А) = Г (91"). Тем самым теорема 25 полиостью
доказана.
Замечание. Читатель, несомненно, подметил некоторый
параллелизм между доказательствами первого и второго
утверждений теоремы 25. На самом деле второе утверждение можно
полностью вывести из первого. Но соответствующий вывод
требует введения новых понятий, с которыми мы познакомимся
только в главе 7.
В заключение рассмотрим идеал Ш' С 9ft, который является
одновременно и правым и левым (двустороний идеал).
Поскольку 91' есть левый идеал, согласно теореме 25 он совпадает
с совокупностью всех операторов, переводящих в нуль все векторы
некоторого подпространства R' С R- Поскольку 9ft' есть правый
идеал, он совпадает с совокупностью всех операторов, область
значений которых принадлежит некоторому подпространству
й" С й. Но в таком случае всякий оператор, переводящий в нуль
подпространство R', имеет все свои значения в подпространстве Я",
и обратно. Такая ситуация осуществляется, например, в
случае R' = R, i?" = 0; в этом случае 9ft' есть нулевой идеал, который,
как мы уже видели, двусторонен. Если R' Ф R, то согласно § 31,
п. 3 подпространство R" содержит любой наперёд заданный
вектор. Отсюда следует, что R" = R, и идеал 9ft' состоит из всех
*) См. сноску на стр. 123.
§ 33] ОБЩИЕ ЛИНЕЙНЫЕ ОПЕРАТОРЫ 125
линейных операторов, т. е. совпадает со всей алгеброй Ш. Итак,
мы показали, что алгебра SR линейных операторов в и-мерном
пространстве не имеет двусторонних идеалов, кроме тривиальных:
нулевого идеала и всей алгебры Ш.
§ 33. Общие линейные операторы
Мы рассматривали до сих пор линейные функции векторного
аргумента, изменяющегося в линейном пространстве R,
значениями которых были или числа, или векторы того же
пространства R. Но можно встать на более общую точку зрения и
рассматривать функции векторного аргумента, значения которых
суть векторы некоторого линейного пространства R'. Если такая
функция удовлетворяет условиям
А (х + у) = Ах 4- At/,
А (ах) = аА#
(действия в правых частях производятся в пространстве R'), то
она называется общим линейным оператором.
В частности, если R' совпадает с R, мы получаем обычный
линейный оператор; если Я' одномерно, общий линейный
оператор есть обычная линейная форма.
Для общих линейных операторов, определённых в
пространстве R и имеющих свои значения в (одном и том же)
пространстве R', естественно определяются действия сложения и
умножения на вегцественные числа; совокупность всех таких операторов
представляет собой некоторое новое линейное пространство.
Действие умножения разумным образом может быть
определено лишь для двух общих линейных операторов А, В, первый
из которых определён в том пространстве, в котором имеет свои
значения второй оператор; при этом произведение С = АВ
определяется формулой
Ся = (АВ)я = А(Вя).
Задачи
1. Построить общий вид линейного оператора, определённого
в n-мерном пространстве R и имеющего значения в А:-мерном
пространстве R''.
Указание. Ассоциировать с каждым таким оператором
матрицу с к строками и п столбцами.
2. Какое действие с прямоугольными матрицами
соответствует умножению общих линейных операторов?
Отв. Умножение матрицы с п столбцами и к строками
на матрицу с т столбцами и п строками по правилу,
аналогичному обычному правилу умножения матриц.
ГЛАЧВА 5
ПРЕОБРАЗОВАНИЯ КООРДИНАТ
Известно, какую большую роль при решении геометрических
задач средствами аналитической геометрии играет правильный
выбор системы координат. В значительно более обширном круге
вопросов, которые открываются в связи с геометрией л-мерного
линейного пространства, роль правильного выбора системы
координат будет также весьма велика- Эта глава посвящена правилам,
по которым совершается преобразование координат в и-мерном
линейном пространстве. Результаты, полученные здесь, послужат,
в частности, основой для классификации квадратичных форм,
которая будет проведена в следующей главе.
§ 34. Формулы перехода к новому базису
Пусть {е) — {еъе2, • • • , еп] — некоторый базис в
n-мерном пространстве R и {/} = [fl9 /2, ... , /п} — некоторый
другой базис в том же пространстве. Векторы системы {/}
однозначно определяются своими разложениями по
векторам исходного базиса:
-f- .. . -р ап еп,
/1 = а(11)е1 + «(2)1
/2 = а{?\ +- a(i)e% + .. . + а(„2)е„,
/n = a\n)ei + a(2n)e2 +...+ ain)en j
}
(1)
или короче
/,= 2<#)е* (/=1,2, ...,*).
i-l
В формулах (1) или (2) коэффициенты а\})(i, /=1,2,..., п)
(2)
§ 34] ФОРМУЛЫ ПЕРЕХОДА К НОВОМУ БАЗИСУ 127
определяют матрицу
я(,) а(2) ain)\\
которая называется матрицей перехода от базиса {е}
к базису {/). Как и ранее в аналогичных случаях (§ 26
и далее), мы выписываем координаты векторов Д
(относительно базиса {е}) в столбцах матрицы А.
Определитель D матрицы А отличен от нуля;
действительно, в противном случае её столбцы, а с ними и
векторы Д, Д, .. . , /п были бы линейно зависимыми (§ 19).
Матрицу с определителем, отличным от нуля, мы уже
назвали ранее невырожденной. Таким образом, переход
от одного базиса n-мерного пространства R к другому
базису всегда осуществляется с помощью некоторой
невырожденной матрицы.
Обратно, пусть {e} = {el9 е2, . •. , еп} — заданный базис
^-мерного пространства R и А— || а* || — невырожденная
матрица порядка п. Построим по формулам (1) систему
векторов Д, Д, . .. , /п. Очевидно, что эти векторы
линейно независимы, поскольку столбцы всякой
невырожденной матрицы линейно независимы (§ 19). Следовательно,
векторы Д, Д, ... , in образуют новый базис
пространства R. Итак, всякая невырожденная матрица А = \\а[''\\
определяет по формулам (1) переход от одного базиса
n-мерного пространства R к другому базису.
Поскольку матрица А не вырождена, уравнения (1)
можно разрешить относительно векторов еи е2, ••• > еп;
получающаяся при этом система равенств вида
e1 = b(J1)/i + $V,+ ---+U1)/»> 1
e2 = fe(i2)/i + ft(22)/2+... + 42)/«,
) (3)
• • I
*„ = ь?%+йп7.+ -.-+йп7» J
А =
14» I
128 ПРЕОБРАЗОВАНИЯ КООРДИНАТ [ГЛ. 5
определяет, очевидно, переход от базиса {/} к
базису {*}.
Формулы (1) вместе с матрицей А задают и
соответствующий линейный оператор А, определяемый из
соотношений /{ = Ае\ (i = 1, 2, ... , п). Он также называется
оператором перехода от базиса {е} к базису {/}.
Формулы (3) задают обратный оператор А"1.
Отметим один частный случай перехода к новому
базису: именно тот, когда каждый из векторов /&
совпадает с соответствующим вектором е&, умноженным на
некоторое число Х& Ф О (к = 1, 2, ... , п). Формулы (1)
принимают вид
/2= *2е2>
/п — i^n^n
и матрица А имеет диагональную форму
1*1
А =
В частности, при Х1 = Х2= ... =ХП = 1 получаем матрицу
тождественного преобразования, или единичную матрицу
1
£ =
1
(4)
при тождественном преобразовании исходный базис не
изменяется.
§. 35J ПРЕОБРАЗОВАНИЕ КООРДИНАТ ВЕКТОРА 129
§ 35. Преобразование координат вектора
при изменении базиса
Пусть {е} = {elt е2, . .. , еп} и {/} = {Д, /2,.. . , /п} — два
базиса в тг-мерном линейном пространстве В. Для любого
вектора х £ R имеют место разложения
я = Si^i + \гЧ + . . . + Ъпеп = tix/j -(- ij2/a + . . . + ijn/n, (5)
где 5Х, 52» • • • » ^n — координаты вектора х относительно
базиса {е} и тц, tj2, ... , т]п —его координаты относительно
базиса {/}. Поставим задачу о вычислении координат
вектора х относительно базиса (/} по известным его
координатам относительно базиса {е}. Пусть нам дана матрица
А = || a\j) || перехода от базиса {е} к базису {/}. Тогда
векторы {е} выражаются через векторы {/} по формулам (3)
в1=Й1)/1 + Й1)/«4--..+Й1)/т
e2 = *(i2)/i+&?)/.+ ..- + b?)/n,
или короче
п
е/= 2 *^Л (/-1,2,..., л), (6)
где S — || i/^Ц — матрица, обратная к матрице А (§ 30).
Подставляя -формулы (6) в разложение (5), мы получаем:
*=2 to - 2 w*=2 б/ (2 *Рл)=2 (i №,)fk,
/=i fe=l /=1 fe=l ft=l /=1
откуда в силу единственности разложения вектора х по
базису {/}
п
' ^-£^4 (A = l; 2 л). (7)
9 Г. Е. Шилов
130 ПРЕОБРАЗОВАНИЯ КООРДИНАТ
В раскрытом виде получается система равенств
'П1=Ь[% + Ь[\+... + Ь?)1п,
Таким образом, координаты вектора х относительно
базиса {/} линейно выражаются через координаты вектора х
относительно базиса {е}\ коэффициенты этих линейных
выражений образуют матрицу, транспонированную
с матрицей перехода от базиса t{f\ к базису {е} (т. е.
транспонированную с матрицей, обратной к матрице А).
Используя обозначение обратной матрицы А*1 и
транспонированной А'у можно записать матрицу С,
определяемую соотношениями (7), формулой С— (А'1)'.
Имеет место и обратная теорема:
Пусть £ь &2, • • • , in — координаты произвольного
вектора х относительно базиса {е} = {ех, е2, ... , еп}
п-мерного пространства R, и величины тц, т]2, ... , %
определены посредством равенств
Т\1 = Сц?! + Ci2^2 + • • • + Cin£n,
Г\2 = C2i?i + С22-2 + . • • -Ь C2n^n,
где det||c;-ft|| ^= 0. Тогда в пространстве R можно найти
новый базис {/} = {/ъ /г, • • • , /п} таким образом, чтобы
числа тц, 7)2, ... , т,п стали координатами вектора ж
относительно базиса {/;.
Доказательство. Введём матрицу С— ЦсуьЦ и
матрицу А~(С'УХ. С помощью матрицы А построим
новый базис по формулам (1). Утверждается, что этот
базис и есть искомый. Действительно, составим формулы
перехода (7) к координатам вектора х относительно
нового базиса Как мы видели, эти формулы записываются
§ 36] ПОСЛЕДОВАТЕЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 131
с помошью матрицы (Л-1)'. В данном случае эта матрица
совпадает с матрицей С, так как
(4-ч' = (КС')"!]-1)'= (£')' = с.
Следовательно, величины ra, т)2, . .., г\п и координаты
вектора х относительно базиса {/}—одни и те же для
любого вектора х, что и требовалось.
Задачи
1. Вектор х £ R имеет относительно базиса elf е%, ... , еп
координаты £х, £2> • • • > %п- Как построить базис в R, чтобы
координаты вектора х относительно этого нового базиса стали
равными 1, 0, 0, ... , О?
2. В гс-мерном пространстве R выбран базис ег, е2, ... , еп.
Доказать, что каждое подпространство R' a R может быть задано
как совокупность всех векторов х £ /?, координаты которых
(относительно базиса elt е2, ... , еп) удовлетворяют системе
уравнений вида
п
2 аФГ° ('' = 1.2,...,*).
Указание. Выбрать новый базис /ь /2, ... , fn так, чтобы
первые к векторов составляли базис подпространства R'. Записать
условие х £ R' системой координатных уравнений в новом базисе.
Используя формулы перехода, построить соответствующую систему
координатных уравнений в исходном базисе.
3. (Продолжение.) Доказать, что каждая гиперплоскость
НClR может быть задана как совокупность всех векторов х6R,
координаты которых (относительно базиса е19 е2, ... , еп)
удовлетворяют системе уравнений вида
п
S'tA^i е=1.2,...,*).
§ 36. Последовательные преобразования
1. Пусть Л —||4У)|| есть матрица перехода от базиса
{е} = {еъ ег,..., еп} к базису {/}== f/b /2, ..., /„} и B=||b$fc)||—
матрица перехода от базиса {/} к базису {g} = {gi, ga» •••» 8п\-
Определим матрицу перехода от базиса \е) непосредственно
к базису {#}. Формула перехода от базиса {е} к базису {/}
9*
132 ПРЕОБРАЗОВАНИЯ КООРДИНАТ [ГЛ. 5
имеет вид (2)
п
// = 2*(/Ч (/=1,2, ...,п) (8)
i=l
и от базиса {/} к базису [g] соответственно
п
ft=26ifc>// (*=1,2, ...,*). (9)
У=1
Подставляя (8) в (9), получаем:
gfe=2fe/fe)Sfli;')ei = 2(Sffiy)^0si (A-1,2, ...,n).
У«1 г = 1 { = 1 ;-1
(10)
С другой стороны, если С ~ ||4Й) || означает искомую
матрицу перехода от базиса {е} к базису {g}, то мы можем написать:
п
gk-2c^ei (*=1, 2 л). (И)
Сравнивая (10) и (11), мы получаем:
п
c^Va^if (i, *--=1,2, ...,*). (12)
; = 1
Полученная формула (12) только обозначениями индексов
(но не их ролью!) отличается от формулы (14) § 29, п. 3.
Следовательно, искомая матрица С есть произведение
матрицы А на матрицу В.
2. Аналогично может быть построена матрица
последовательного преобразования координат. Пусть ?ь Е2, • • •, £п
суть координаты вектора х относительно базиса {е} и
величины %, т]2, . . ., % и ть т2, ..., хп определены пбсред-
§ 37] ПРЕОБРАЗОВАНИЕ КОЭФФИЦИЕНТОВ ЛИНЕЙНОЙ ФОРМЫ 133
ством равенств
Ч/ = За1Л«| (/=1,2, .... и),
i = l
п
^2^4- (*=1,2, .. ., л)
соответственно с невырожденными матрицами J. = ||aiJ)||
и 5 = ||6yft)||. Тогда, как в п. 1, можно выразить
величины {т| непосредственно через величины {£] по формулам
п п п
i=i ;=1 i-1
где величины c[fe) (i, A= 1, 2, . .., п) образуют матрицу С,
равную произведению матрицы А на матрицу В. Для
доказательства достаточно всюду в выкладке п. 1 заменить
векторы еь /у, gfe соответственно на числа £j, т];-, zk.
Задача
На плоскости выбрано три базиса; координаты вектора х
относительно каждого из них равны соответственно glf ?3; тц, yj2; тх, т2.
Дано
% = an6i + a12Z»\ тг = b^ii + &12£2;
7)2 == a21ix + в22$2а* Т2 =&2l£l + ^22^2;
^ = ||alV||, B=||*l/|l'
Выразить координаты %lt т2 через координаты t\lf г,2.
Отв. Матрица искомого преобразования С^ВА'1.
§ 37. Преобразование коэффициентов
линейной формы
Пусть в ^-мерном пространстве R задана линейная
форма /(#). Как мы видели в § 25, когда в пространстве R
выбран базис {е} = {еь е2, •••» в*Ь значения формы f(x)
можно вычислять по формуле
п
f(x)= S Ch*kt
k =1
134 ПРЕОБРАЗОВАНИЯ КООРДИНАТ . [ГЛ. 5
где lk (&=1, 2, . . ., п) суть координаты вектора х
относительно базиса {е}, а коэффициенты cfe — /(е^)(тг=1, 2, ...п).
Коэффициенты <?&, очевидно, зависят от выбора базиса {е}.
Мы выведем здесь правило, по которому совершается
преобразование коэффициентов линейной формы при
переходе к новому базису.
Допустим, что формулы
п
//=2a*y>e* (/'=1' 2> •••> и) (13)
определяют переход от базиса {е} к новому базису {/).
Найдём коэффициенты линейной формы f(x) в базисе {/}.
Эти коэффициенты суть числа dj = f(fj); вычисляя эти
числа с помощью формулы (13), находим:
п п
i=l ♦ г=1
Таким образом, коэффициенты линейной формы
преобразуются так же, как преобразуются базисные векторы.
Задача
Для данной линейной формы / (ж) -Щ- 0 в n-мерном
пространстве выбрать базис gly g2, ..., gn так. чтобы для всякого вектора
п
ж== 2 ^^ имело место равенство
/(^ = 7)!.
§ 38. Преобразование матрицы
линейного оператора
1. Пусть дан линейный оператор А в га-мерном
пространстве. Обозначим через v4<e) —1| aj;)|| матрицу
оператора А относительно базиса {е\ = {еъ е2,. . . >еп] и через
^(/)~ ilaiP)|l его матрицу относительно базиса {/}==
^= /i. /2» • • •» /п}- Предположим далее, что формулы перехода
§ 38] ПРЕОБРАЗОВАНИЕ МАТРИЦЫ ЛИНЕЙНОГО ОПЕРАТОРА 135
от базиса {е} к базису {/} имеют вид
п
Л=2с?>в/ (А=1>2, ...,*). (И*)
Матрицу перехода ||cjfe)|| обозначим символом С.
Установим связь между матрицами А(е), Аи) и С. Матрица v4(e)
определяется из системы равенств
п
« Аву=:2а*Лв* (/ = 1,2, ...,л), (12*)
а матрица A{f) — из системы равенств
п
А/р=24Р)/3 (Р=1,2, .... л).
9=1
Заменим в последней формуле векторы fq их выражениями -
через векторы {в) по формулам (И*)
а/р=2 а*р) 2 &е*=2 ( 2 с*а) а<р)) «i
q=1 i=l i=l 3=1
и используем выражение векторов Ае/ из (12*):
a /„-as Л-=2 с>р) Ае' = 2 с>р) 2 ^ е* =
y=i y = i y=i i=t
i=i y=i
Сравнивая коэффициенты при ei в двух последних разло^
жениях, находим:
п п
ХЗ .(9) „(Р) VI -</) ЛР)
9=1 У-1
136 ПРЕОБРАЗОВАНИЯ КООРДИНАТ [ГЛ. 5
или в матричной форме
САи) = А(е)С. (13*)
Это и есть искомая связь между матрицами А(е), Ауу и С.
Умножая слева на матрицу С-1, получаем выражение
матрицы Л(/)Г
2. Используя теорему о произведении определителей ■
(§ 29, п. 5), получаем из (13*) следующее соотношение:
det С det Ay) — det Де) det С
или, так как det С Ф О,
detu4(e) = det Ащ.
Итак, определитель матрицы оператора не зависит от
выбора базиса в пространстве. Поэтому мы можрм говорить
об определителе оператора, подразумевая под ним
определитель матрицы этого оператора в произвольном
базисе.
3. Кроме определителя, существуют и другие функции
от элементов матрицы оператора, остающиеся неизменными
при переходе к новому базису. Чтобы построить такие
функции, рассмотрим оператор А —ХЕ, где X —параметр.
Матрицей этого оператора в базисе {е} является, очевидно,
матрица А(е) —- ХЕ, а в базисе {/j — матрица A(f) — Xi?.
По доказанному при любом X
det (Aie) - Щ = det (AU) - Щ.
Справа и слева стоят многочлены п-й степени от X. Так
как эти многочлены совпадают тождественно, то у них
коэффициенты при любой степени X должны быть
одинаковыми. Эти коэффициенты суть некоторые функции от
элементов матрицы оператора, которые, следовательно,
остаются неизменными при изменении базиса. Выясним
§ 381 ПРЕОБРАЗОВАНИЕ МАТРИЦЫ ЛИНЕЙНОГО ОПЕРАТОРА 137
вид этих функций. Определитель матрицы А(е) — \Е имеет
вид
la^-X a(t2) ... а[п) I
аР а^-Х ... аР
I an ап .. . ап — л |
= ( _ l)nXn + AlXn-l+ . . . +Дп^1Х +Дп.
Коэффициент Ах при Х*-1, как легко вывести из основных
свойств определителя, равен (со знаком ( — l)n_1) сумме
диагональных элементов а\Х) -\-а^-\- ... +<4in); это число
называется следом оператора А. Коэффициент Д2 при Хп~2
есть сумма всех диагональных миноров 2-го порядка,
взятая со знаком ( — 1)п~2; аналогично коэффициент Д&
при Xn~fe есть сумма всех диагональных миноров к-то
порядка, взятая со знаком ( — 1)П_А Наконец, коэффициент
Дп при X —свободный член— равен, очевидно, самому
определителю оператора. Многочлен det(.4e —Х£), который,
как мы доказали, не зависит от выбора базиса в
пространстве, называется характеристическим многочленом
оператора А.
Задачи
1. Обозначим через В = В(\) присоединённую матрицу для
матрицы Л—IE (§ 30, задача 4). Матрицу В (к) можно написать
в виде
В(Х) = В(0> + Х^1>+...+Хп-1В(п-1>,
где В^\ В^\ ..., ^п~*1)—числовые матрицы (не содержащие X)
Показать, что эти матрицы удовлетворяют уравнениям
B<n-1>^-B(TI'2> = A1^t
В^А = АЛ#,
где ( — l)u, Ai, A2, ..., Дп—коэффициенты характеристического
многочлена оператора А.
138 ПРЕОБРАЗОВАНИЯ КООРДИНАТ [ГЛ. 5
Указание. Использовать результат задачи 4 к § 30.
2. Показать, что оператор А удовлетворяет уравнению
(_l)^An + ^iAn-1 + ...4-An-iA + An£' = 0.
Указание. Первое из матричных равенств задачи 1
умножить на Ап, второе—на Ап~{ и т. д. и сложить.
Примечание. В задаче 2 § 29 шла речь о существовании
аннулирующих многочленов для оператора А. В настоящей задаче
один из аннулирующих многочленов построен эффективно. При
этом степень построенпого многочлена равна п, что для больших п
много ниже указанной в § 29 границы л2.
Возникает вопрос о том, в какой мере знание
характеристического многочлена определяет геометрические свойства самого
оператора.
Для примера рассмотрим диагональный оператор А (§ 26,
пример 5), причём предположим, что все числа Xlf Х2, ..., Хп
различны. Характеристический многочлен оператора А,
вычисленный но матрице оператора А в базисе eL, e2,
IX! —X 0 ... 0
О Х2—X ... 0
еп, равен
0
0
= (Xi-X)(X,-X) ... (Х„-Х);
это многочлен /г-й степени, имеющий числа Х1? Х2, ..., Хл своими,
корнями. Если мы перейдём к новому базису, то матрица
оператора А, вообще говоря, перестанет быть диагональной. Но по
доказанному характеристический многочлен оператора А не
изменится; вычисленный но новой матрице, он нопрежнему будет
многочленом с корнями Х1? Х2, ..., Хп. В дальнейшем (гл. 9) мы
покажем, что оператор А, характеристический многочлен которого
имеет п различных вещественных корней, в некотором базисе
имеет диагональную матрицу. Таким образом, в случае, когда
характеристический многочлен оператора А имеет п различных
вещественных корней, геометрическая природа оператора А
полностью определена: оператор А есть диагональный оператор. Но
в общем случае, как мы увидим на примерах в главе 9, могут
существовать различные по своим геометрическим свойствам
операторы с одинаковыми характеристическими многочленами.
§ 39. Тензоры
Координаты вектора, коэффициенты линейной формы,
элементы матрицы линейного оператора являются примерами общего
класса геометрических величин, называемых тензорами.
Прежде чем перейти к соответствующему определению,
несколько рационализируем нашу систему обозначений.
§ 39] ТЕНЗОРЫ 139
Векторы базиса n-мерного пространства R будем обозначать,
как и раньше, символами е1} е2, ..., еп (с индексами внизу).
Координаты векторов х, у, ... будем обозначать символами
51, £2, ..., £n; y]1, rf, ..., т", ... (с индексами вверху).
Коэффициенты линейной формы обозначим clt с2, ..., сп (с ии
дексами внизу).
Элементы матрицы линейного оператора обозначим через а\\
при этом верхний индекс означает номер строки, нижний—номер
столбца (в отличие от обозначений, принятых на стр. 94).
Целесообразность такого расположения индексов определяется
следующим соглашением о суммировании: если имеется сумма п
одночленных выражений, причём индекс суммирования i
встречается в общем члене суммы два раза, один раз наверху, другой
раз внизу — знак суммы мы будем опускать.
Например, разложение вектора х по базису {ev e2, ..., еп}
после нашего соглашения приобретает вид
(знак суммирования по i опущен, но подразумевается). Выражение
линейной формы / (х) через координаты вектора и коэффициенты
формы принимает такой вид:
Результат применения оператора А к базисному вектору
принимает следующий вид:
Ле.^а{е.
(подразумевается суммирование по индексу /). Координаты rf
вектора Ах выражаются через координаты вектора х следующим
образом:
(подразумевается суммирование по индексу i).
Величины, относящиеся к новой системе координат, мы будем
обозначать теми же символами, но со штрихами при индексах.
Так, новые базисные векторы мы будем обозначать е{,, е2>, ..•, епЧ
новые координаты вектора х — через £4', 5 , ..., £п и т. д.
Элементы матрицы перехода от базиса е.% к базису ev
обозначим через р\,, так что #
е4.=р|,е{ (14)
суммирование по индексу i).
140 ПРЕОБРАЗОВАНИЯ КООРДИНАТ [ГЛ. 5
Коэффициенты матрицы обратного перехода обозначим через дУ:
ei = qliei, (суммирование по У); (15)
матрица q\ обратна к матрице р\,щ что можно записать в виде
равенства
4?)' = Рпри !'*''■ (16)
г% * [1 при г = / v '
или равенства
0 при V Ф /',
i Г /0
(17)
Для сокращения записи величину, зависящую от индексов i и /
так, что она равна нулю при различных значениях индексов
и единице при совпадающих значениях индексов, обозначают
через ЬгА таким образом, равенство (16) можно записать в виде
а равенство (17)—в виде
Чтобы показать преимущества пользования новыми
обозначениями, выведем заново формулы преобразования координат
вектора, коэффициентов линейной формы и элементов матрицы оператора
при переходе к новому базису.
Пусть вектор ж = £ге| = £г'^,. Подставляя вместо величин ei
равные им величины д\'е^ (14), получаем:
Поскольку е^ — базис, то
5*' = ^'5*. (20)
Это и есть формула преобразования координат вектора. Пусть
дана линейная форма f(x). Числа cv определяются, как обычно,
равенствами Г|, = /(^,). Подставляя вместо ev выражение р\.ei (14),
получаем:
Итак, *
<Ч' = />гЦ; (21)
это и есть интересующая нас формула.
§ 39] ТЕНЗОРЫ A4i
Наконец, пусть дан оператор А. Элементы его матрицы в новом
базисе определяются из равенств
Подставим сюда вместо^, (<?у,)равныеим величины р\ е.% (р^.е*) (14);
тогда мы получим:
Р\Ле. = 4р),ег
Но ке-х — а\е^ так что в результате
Поскольку е — базисные векторы,
р\а\г=а[,р\.
Чтобы получить отсюда а{>, умножим обе части равенства
на д*}' и по индексу / произведём суммирование. В силу формулы
(17) мы получим:
Согласно определению величины о^,' при суммировании по /'
нужно учесть только одно слагаемое, отвечающее значению j' = k'.
При этом Ъ*£, = 1 и, следовательно,
4=А44- (22)
Это и есть искомая формула. Нетрудно проверить, что все три
полученные нами теперь формулы преобразования совпадают с
формулами, полученными нами ранее обычным путём (§ 35, 37, 38).
Формулы (20), (21) и (22) имеют много общего. Прежде всего эти
формулы линейны относительно преобразуемых величин. Далее,
коэффициентами этих формул служат или элементы матрицы
перехода от старого базиса к новому, или элементы матрицы
обратного перехода, или, наконец, и те и другие.
Теперь можно перейти к определению тензора. Тензоры
разделяются на ковариантные, контравариантные и смешанные. Кроме
того, каждый тензор имеет определённый ранг.
Начнём с определения ковариантного тензора для
определённости третьего ранга.
Пусть имеется правило, позволяющее в каждой системе
координат w-мерного пространства R построить л3 чисел Т^к
(составляющих), каждое из которых определяется при придании индексам i,
/, к определённых значений от 1 до п. Эти числа Т^к
образуют по определению ковариантныи тензор третьего ранга, если
преобразование величин Т^к при переходе к новому базису
производится по формуле
TVyk, = PvPj'pk'^ijk'
142 ПРЕОБРАЗОВАНИЯ КООРДИНАТ [ГЛ. 5
Аналогично определяется ковариантный тензор любого другого
ранга: тензор m-го ранга имеет не n:i, а пт составляющих, и в
формуле преобразования стоит не три множителя вида р\п а т
таких множителей.
Коэффициенты линейной формы, которые преобразуются, как
мы видели, по формуле (21), дают пример ковариантного тензора
первого ранга.
Определим теперь контраеариантный тензор третьего ранга.
Пусть имеется правило, позволяющее в каждой системе
координат построить л3 чисел т1*к, каждое из которых определяется
при придании индексам г, /, к числовых значений от 1 до п.
Эти числа Twk образуют по определению контраеариантный тензор
третьего ранга, если преобразование величин Тг^к при переходе
к новому базису производится по формуле
Аналогично определяется контравариантный тензор любого
другого ранга. В частности, координаты вектора х образуют
контравариантный тензор первого ранга.
Введённые нами термины «ковариантный» и
«контравариантный» объясняются очень простым образом. «Ковариантный»
означает «изменяющийся так же», как изменяются базисные векторы,
т. е. с использованием коэффициентов р\. «Контравариантный»
означает «изменяющийся в обратном направлении», т. е. с
использованием коэффициентов q?.
Существуют ещё и смешанные тензоры. Например, ns чисел
т\р заданные в каждой системе координат, образуют смешанный
тензор третьего ранга, два раза ковариантный и один раз
контравариантный, если преобразование величин Т^ к новому базису
производится по формуле
JVj"-PvPr9kI ij'
Аналогично определяется смешанный тензор I раз
ковариантный и m раз контравариантный.
Например, элементы матрицы линейного оператора образуют
смешанный тензор 2-го ранга, один раз ковариантный и один раз
контравариантный. Отметим, что целесообразная расстановка
индексов предназначена прямо указывать характер того или иного
тензора.
В дальнейшем нам ещё будут встречаться конкретные тензоры
разнообразного характера.
Действия с тензорами. Можно определить операцию
сложения двух тензоров одинакового строения, например двух
тензоров т\: и *?*. (два раза ковариантных и один раз контрава-
§ 39] ТЕНЗОРЫ 143
риантных). Это будет тензор Q^ того же строения; в каждой
системе координат при фиксированных i, /, к его составляющая
по определению равна сумме соответствующих составляющих
слагаемых. То, что величины Q\j действительно образуют тензор,
притом того же строения, что и у слагаемых, вытекает из
следующих равенств:
Операция умножения применима к тензорам любого строения.
Например, умножим тензор 71. на тензор Slk. Это будет тензор
четвёртого ранга Q^; в каждой системе координат при
фиксированных i, /, к, I его составляющая по определению равна
произведению соответствующих составляющих множителей.
Тензорный характер Qj;.fe проверяется следующим образом:
Рассморим ещё операцию свёртывания. Она применяется к
тензорам, у которых имеется по меньшей мере один ковариантный
и один контравариантный индекс. Пусть., например, дан тензор
Г|у. Свернуть его по первому нижнему и верхнему индексам
означает в каждой системе координат составить величины
if
Здесь по индексу i подразумевается суммирование; в итоге
величины Tj= T\j зависят только от индекса /. В результате
свёртывания снова получается тензор, ранг которого па две единицы
меньше исходного. Проверим это на рассмотренном примере. Мы
имеем:
Здесь при суммировании по индексу к достаточно ограничиться
только значением k — i\ поскольку о? = 1, мы получаем:
* У Р?Л\з Р)*Л V
что и требовалось.
Что получится, если свернуть смешанный тензор второго
ранга Т\ по его двум индексам? Величина Т = Т\ уже не
имеет ни одного индекса, т. е. в каждой системе координат
144 ПРЕОБРАЗОВАНИЯ КООРДИНАТ [ГЛ. 5
она образует только одно число. Это число—-одно и то же в
любой системе координат: действительно,
Т' = 7у. = р\.д)'т{=Ъ*т{ = Т\ = Т.
Такая числовая величина, не зависящая от системы координат,
называется инвариантом. Следовательно, операция свёртывания
даёт возможность получать инварианты тензоров. Например, если
тензор а[у соответствующий линейному оператору А, свернуть по
его индексам, то полученный инвариант а\ будет суммой
диагональных элементов матрицы оператора А. Инвариантность этой
величины была уже доказана нами другим способом (§ 38).
Задачи
1. Показать, что величины bl образуют тензор 2-го ранга,
один раз ковариантный и один раз контравариантный.
2. Система величин S^ определяется в каждой системе
координат путём решения системы уравнений
где Т1**—тензор два раза контравариантный, причём det || Tlh \\фО.
Показать, что S^—тензор, два раза ковариантный.
3. Если С( и gf имеют смысл тот же, что и в тексте, какой
геометрический смысл имеет свёртка тензора
efif
по обоим его индексам?
ГЛАВА 6
БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ
В этой главе мы будем изучать линейные функции
двух векторных аргументов. В отличие от случая функций
одного аргумента уже теория числовых функций двух
аргументов имеет богатое геометрическое содержание. Мы
ограничимся здесь изучением числовых линейных функций
двух векторных аргументов, оставляя в стороне
векторные функции.
§ 40. Билинейные формы
1. Числовая функция А (я, у) от двух векторных
аргументов х, у в линейном пространстве R называется
билинейной функцией или билинейной формой, если она
является линейной функцией от х при каждом
фиксированном значении у и линейной функцией от у при каждом
фиксированном значении х.
Иными словами, А(ху у) есть билинейная форма от х
и у, если для любых х, у и z удовлетворяются равенства
A(x-\-z, y) = A(x, y)-\-A(z, у), \ линейность по пер-
А(ая, у) =(хА(х,у) (вому аргументу;
А(х9 y-\-z) = A(xt y) + A(x, z)y \ линейность по вто-
А(ж, ау) —аА(х, у) /рому аргументу
Примеры
1. Если /i(~) й h\x)— линейные формы, то А (я, у)»
= Д (х) • /а (у) является, очевидно, билинейной формой от х и у.
Ю г. Е. Шилов
(1)
146 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
2. В л-мерном линейном пространстве с фиксированным
базисом <?!, е?2, .'.., еп примером билинейной формы является
функция
п п
i=lfe=l
п п
где #= 2 ^Л» 2/ = 2 ^kek — произвольные векторы и aik (itk =
i=l i=l
= 1, 2, ... , n)—фиксированные числа.
3. В пространстве С {а, Ъ) функция
ъ ъ
А (х, 2/)= \ \ К (sr t) х (t) у (s) ds dt.
a a
(K(s, ^ — заданная непрерывная функция от s и t) является,
очевидно, билинейной формой векторов х (t) и у (t).
4. В пространстве V8 скалярное произведение двух векторов
х и у есть билинейная форма от х и у.
Из определения билинейной формы, используя
равенства (1), легко получить общую формулу
к т km
А (2 Ч ач, 2 Р/ У/) = 2 2 *#'А <**' *">' (2)
i=l /«1 i=i /=1
в которой #ь я2> ... , Xkf У\, у2i • • • > 2/т— произвольные
векторы пространства Л, а аъ а2, ... , afe, fJlf ф2> • • • >. Pm —
любые вещественные числа.
Билинейные формы, заданные в бесконечномерных
пространствах, называют обычно билинейными функционалами.
2. Общий вид билинейной формы вд-мерном
линейном пространстве. Пусть в n-мерном
линейном пространстве R задана билинейная форма А (х, у).
Выберем в R произвольный базис еь е2, ... , еп. Положим
А(еь ek) = aik (i, k — 1, 2, ... , h). Тогда для любых
п п
»=2^ у==2 №*
§ 40] БИЛИНЕЙНЫЕ ФОРМЫ
согласно формуле (2)
147
п п
А(х, у) —к (2 ^е» 2 W) = 22 M«A(eit вк)=-
i=l
п п
= 22
i=l fe = l
/i=i
«ifeiilQfe.
i=lfe=l
(3)
Таким образом, в примере 2 мы имели самый общий
вид билинейной функции в я-мерном линейном
пространстве.
Коэффициенты а^ образуют квадратную матрицу
А = А(е) =
а11 д12 • • • а1п
а21 а22 • •• а2П
Q"ni 0"П2 * • • 0"пп
\a>ik\
которую мы будем называть матрицей билинейной формы
А(х, у) в базисе {е} = {еъ е2, ... , еп).
3. Симметричные билинейные формы.
Билинейная форма называется симметричной, если для любых
векторов х и у
А (я, у) = А (г/, я).
Если билинейная форма А(х, у) симметрична, то
агь = А(еь ek)~A(ek, е{) = аки
следовательно, матрица А(е) симметричной билинейной
формы в любом базисе е1у е2, *.. , еп пространства R
совпадает с транспонированной матрицей А{е). Легко
проверить, что верно и обратное: если в некотором
базисе {е} = {еъ е2, ... , еп) А'(е) = А(е), то форма А(х, у)
10*
148 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
симметрична; в самом деле,
п п
i, ft = l i, fe=l
n
= 2 а«&Чл = А(з, у),
ft, i=-l
что и требовалось.
В частности, мы получаем: если матрица билинейной
формы А (х, у), вычисленная в некотором базисе,
совпадает с транспонированной матрицей, то в любом другом
базисе пространства R матрица этой формы" также
совпадает с транспонированной.
Матрицу, совпадающую с транспонированной матрицей,
мы будем называть в дальнейшем симметричной.
4. Преобразование матрицы билинейной
формы при переходе к новому базису. При
переходе к новому базису матрица билинейной формы,
разумеется, изменяется; найдём закон её изменения. Пусть
-4(e) = || flyi || есть матрица билинейной формы А (х, у) в
базисе \е} = [el9 е2, ... , еп} и Ay) = || bik || — матрица той
же формы в базисе {/} = {/!, /2, ... ,/n} (i9 /, А, / = 1, 2, ...,и).
Положим, что формулы перехода от одного базиса к
другому имеют вид
п
А=2 Л (£—1,2, .... п)
У-1
с матрицей перехода С = || сФ ||. В таком случае
п п
ь»=a (/i, /о=а (244 2 c'ft) е0 =
= S^^A^e,)- 2<MV
f, 1=1 /, 1=1
§ 41] КВАДРАТИЧНЫЕ ФОРМЫ 149
Полученную формулу мы запишем в виде
b* = si*wV!h). (4)
;=11=1
где c{iy = с(/) — элемент матрицы С", транспонированной по
отношению к матрице С. Формула (4) отвечает
следующему соотношению между матрицами (§ 29):
Аи) = С'А(е)С. (5)
Так как матрицы С и С" не вырождены, то в силу
следствия 1 теоремы 24 ранг матрицы Ау) равеп рангу матрицы
А(е)', следовательно, ранг матрицы билинейной формы не
зависит от выбора базиса.
Для определителей наших матриц в силу теоремы об
определителе произведения матриц (§ 29, п. 5) получается
соотношение
det AU) = det A{e) . (det С)2. (6)
Задача
Образуют ли элементы матрицы билинейной формы тензор
(§ 39) и если да, то какого типа?
Отв. Тензор 2-го ранга, два раза ковариантный.
§ 41. Квадратичные формы
В аналитической геометрии на плоскости одна из основных
задач состоит в приведении общего уравнения кривой 2-го порядка к
каноническому виду путём перехода к некоторой новой системе
координат. Уравнение центральной кривой 2-го порядка с центром
в начале координат х = О, г/=0, как известно, имеет вид
Ax2 + 2Bxy + Cy2 = D. (7)
Преобразование координат производится по формулам
x = a11xf + a12y,t
y = a2ix' + a22y',
где au, a12, a2l, a22—-некоторые числа (обычно синусы и косинусы
угла поворота осей). В результате уравнение (7) приобретает более
простой вид
А'х'* + В'у'* = 1).
150 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
Аналогичная задача может быть поставлена в пространстве любого
числа измерений. Теория квадратичных форм, излагаемая далее,
основной своей целью имеет решение этой задачи и задач,
смежных с нею.
Введём следующее определение.
Квадратичной формой в линейном пространстве R
называется функция А (х, х) от одного векторного
аргумента х 6 /?, которая получается из произвольной
билинейной формы А (х, у) заменой у на х.
В и-мерном линейном пространстве с фиксированным
базисом {е} = {еъ е2, ... , еп\ каждая квадратичная форма
в силу формулы (2) имеет вид
п п
a(s, s)=2 2 aikliik' (8)
i=l ft=l
где Sx, £2> ••• у £п — координаты вектора х относительно
базиса {е}. И наоборот, если задана функция А(х,х) от
вектора х, определяемая в базисе {е\ формулой (8), то
эта функция представляет собой квадратичную форму
от вектора х. Действительно, мы можем ввести
билинейную форму
п п
вк у)=2 2а*^>
i=lУ=1
гДе %> Ъ> • • • » % — координаты вектора у относительно
базиса {е}; тогда очевидно, что квадратичная форма В(х, х)
совпадает с функцией А (ж, х).
Заметим, что в двойной сумме (8) можно совершить
приведение некоторых подобных членов: при i Ф к мы
имеем:
dikk^k + ak£kk = («to + ем) Wh = biktgk,
где
hk = a>ik + an*
Для i = A полагаем:
Ьц = а«.
§ 41] КВАДРАТИЧНЫЕ ФОРМЫ 151
В результате двойную сумму можно записать с меньшим-
числом слагаемых
А (х, х) = 2 ЪцЬ&ъ.
Отсюда следует, что две различные билинейные формы
п п
А(х, 2/)= 2 а^к и С(х> У)~ 2 Cife^fe
i, fe = l i, fc=i
могут после замены у на я привести к одной и той же
квадратичной форме; для этого нужно только, чтобы
имело место равенство atk + а&{ = С|& + с^ для любых i и к.
Таким образом, вообще говоря, нельзя однозначно
восстановить по квадратичной форме породившую её
билинейную форму. В одном случае исходную билинейную
форму можно восстановить: именно, если известно, что
она была симметричной. В самом деле, если aife = afei, то
из уравнения а|л + а^=6^ (при 1фк) коэффициенты
dik однозначно определяются:
aik = aki = bf- (9)
и при i — к
а вместе со всеми а^ однозначно определяется и вся
билинейная форма. Это утверждение можно доказать и не
прибегая к базису и координатам; в самом деле, по
определению билинейной формы
А(х + у9 х + у) = А(х, х) + А(х, у) + А(у, х) + А(у, у)
и при условии симметрии
А(х, у) = у [А(я, у) + А(у, ж)] =
= -j[A(x + y, x + y) — A(x, х) — А(у, у)];
таким образом, значение билинейной формы А (а?, у) для
152 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
любой пары векторов ху у однозначно определяется по
значениям квадратичной формы на векторах х, у
и х + 2/. С другой стороны, чтобы получить из
билинейных форм все возможные квадратичные формы,
достаточно иметь одни лишь симметричные билинейные формы.
В самом деле, если А(#, у)— произвольная билинейная
форма, то
Ai(s, x) = Y[A(x, y) + A(y, x)]
есть симметричная билинейная форма, и
Ai (х, х) = -у [А (х, х) + А (х, х)] = А (я, х),
т. е. квадратичные формы Аг (х, х) в А (х> х) совпадают.
В силу всех этих соображений при использовании
билинейных форм для изучения свойств квадратичных форм
достаточно ограничиться рассмотрением одних только
симметричных билинейных форм.
§ 42. Приведение квадратичной формы
к каноническому виду
Пусть дана произвольная квадратичная форма А (ж, х)
в тг-мерном линейном пространстве Rn. Покажем, что
в пространстве Rn существует базис {/} = {/ь /2,..., /п},
п
в котором для каждого вектора #=2 Wfe значение
квадратичной формы А(х, х) может быть вычислено
по формуле
А (я, а) = ХГ)! + М|+ • • • +W, (Ю)
где Хь Х2, ..., \п —некоторые фиксированные числа.
Всякий базис, обладающий этим свойством, будем
называть каноническим базисом формы А (ж, ж), а
выражение (10) — каноническим видом формы А(х> х): в
частности, числа Аь Х2, ..., Хп будем называть
каноническими коэффициентами формы А(ху х),
§ 42] ПРИВЕДЕНИЕ К КАНОНИЧЕСКОМУ ВИДУ 153
Пусть {еь е2, ..., еп] —произвольный базис простран-
п
ства Лп; если # = 2 ^efe> Т0, как мы Уше знаем> форма
А(х, х) имеет следующий вид:
A(s,s) = 2bih«fc. (И)
Согласно § 35 наше утверждение будет доказано, если мы
сможем написать формулы
Ъ = C2l£l + С22?2 + • • • + С2г&п, I
) (12)
I
*Цп = Сп&1-\-Сп2%2+ ... +Cnn?n J
с невырожденной матрицей С = ||с^|| и такие, что,
выражая координаты {£} в формуле (И) через величины {iq},
мы преобразуем формулу (11) к виду (10).
Будем вести доказательство индукцией по числу
координат, фактически входящих в формулу (11) (т. е. с
отличными от нуля коэффициентами). Если в формулу (11)
фактически входит лишь одна координата, например £г,
т. е. формула (И) имеет вид
A(x,x) = b1£l
то базис {еи Ч, • • • еп) уже является каноническим
(Х1==&11, Х2 = Х3= ... =ХП=0).
Предположим, что каждая форма ^содержащая т— 1
координат (например, Elf £2, ..., £m-i)> может быть
приведена к каноническому виду при помощи преобразования
с невырожденной матрицей. Пусть теперь имеется
форма (11), фактически содержащая т координат £х,
?2> •••» £т- Допустим вначале, что среди чисел bll9
b2*. ...", bmm имеется число, отличное от нуля:
предположим для определённости, что Ьтт Ф 0. Выделим
Э форме (11) группу членов, содержащих координату km\
154 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
эта группа имеет вид
1—1 ^m i "mm
VimZ&m + Ь^т^т + • • • + ^т—1, m£m-l£m + ^min^m -
— °тт [ ~К1 $1 ~Г "о! ^2 ~Г
Ч LOmm ^°тт
wm ""mm
Ь N 2
vm—1, т f , >. Л
• • ' "г —ОА Zm-i+Zm) + Ai (.X, Ж),
LOmm У
где через Ах (х, х) обозначена квадратичная форма,
зависящая только от величин ij1? 52, • ••, 5т-ь Рассмотрим
следующее преобразование координат: >
*1 = 5ъ
т2 = 52,
wm-
-1 = 5m-b
Ьш Ъ^ . *.
5i + ^a *2 + ••• ~\ ohT2 5т-1 + 5т»
^°тт *°тт *°тт
Матрица этого преобразования не вырождена (её
определитель равен 1). В новых координатах форма А(х, х),
очевидно, принимает вид
А (х, х) = В (х, х) + bmm*m*
где квадратичная форма В (х, х) зависит только от
величин ть т2, ..., тт_!. В силу предположения индукции
существует новое преобразование
^1 = ^11^1 + ^12^2+ ••• +Ci,m-l^m-b
f]2 = C2iXi + С22^2 + ••• + <?2, m-l'Cm-b
%i-l ^Cm-l, l^i + Cm_2T2+ ■ • • + cm-l, m-i^m-i,
(13)
с невырожденной матрицей С = ||с{/||, которое приводит
форму В (х, х) к каноническому виду:
В {х, х) = X17if + Х2т]|+ ... +Xtn_1i)w_i.
§ 42] ПРИВЕДЕНИЕ К КАНОНИЧЕСКОМУ ВИДУ 155
Если мы добавим к равенствам (13) ещё одно равенство
то мы получим невырожденное преобразование координат ть
Ч, •• •> тт в координаты 7]Х, i)2, ..., ч]т, после которого
форма А(х,х) примет канонический вид
А (ж, х) = В (ж, ж) + &w4 = Mi + MS + • • •
• • • Т" ^m—l^m—l ~г "тт^
2
Прямой переход от координат {?} к координатам {ч\}
в силу § 36 осуществляется с помощью матрицы, рацной
произведению матрицы перехода от координат {%} к
координатам {т} на матрицу перехода от координат {т} к
координатам {у\}. Так как обе эти матрицы не вырождены,
то и матрица-произведение тоже не вырождена.
Нам остаётся рассмотреть случай, когда в форме
А(х, х) с т координатами ?ь £2> •••, \т все числа ап,
#22 > • • •» «mm равны нулю. Рассмотрим один из членов
<*{&£/ с отличным от нуля коэффициентом а-ф например,
пусть а12 =£ 0. Произведём следующее преобразование
координат;
^3 = ^3'
>■ (14)
?т — ьп
Определитель матрицы преобразования (14) равен —2 и,
таким образом, это преобразование снова невырожденное.
Член ai2?i?2 преобразуется следующим образом:
Д12У2 ^ ai2^i — #12^2 >
поэтому в преобразованной форме появятся сразу два
квадрата координат с ненулевыми коэффициентами
(очевидно, что сократиться с остающимися членами эти
156 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
квадраты не смогут, ибо все остающиеся члены содержат
координату £' с i>2). Таким образом, в координатах
%' к форме (И) уже можно применить наш индуктивный
метод.
Мы доказали теорему для любого натурального т;
в частности, при т = п теорема уже оказывается
доказанной для произвольной квадратичной формы в гс-мерном
пространстве.
Идея нашего доказательства — последовательное
выделение полных квадратов — может быть применена и к
фактическому приведению данной квадратичной формы к
каноническому виду. В § 45 будет описан другой метод,
позволяющий непосредственно получить векторы искомого
канонического базиса и канонический вид формы.
Задача
Преобразовать квадратичную форму
ел+erf.+б,е,
к каноническому виду.
Отв. Например,
где
§ 43. Вопросы единственности
Ни канонический базис, ни канонический вид
квадратичной формы не определены однозначно. Например,
любая перестановка векторов канонического базиса
приводит вновь к каноническому базису. В § 45, между
прочим, будет показано, что для данной квадратичной
формы можно построить канонический базис, взяв первый
вектор этого базиса в пространстве произвольно (за
некоторыми редкими исключениями). Далее, если форма
А (х. х) записана в каноническом виде
1 1
1 1
=="о"^1—2"^2> ^8 = ^8#
А (я, #) = МНМ1+ ... +Kf\n
§43]
ВОПРОСЫ ЕДИНСТВЕННОСТИ
157
{ъ> т)2> ••., % —координаты вектора х), то
преобразование координат
т]1 = а1т1,
7]2 = а2т2,
г\п = аптп
(аъ а2, ..., ап — фиксированные числа, все отличные
от нуля, xl9 т2, ..., тп — новые координаты) приводит
форму А(х,х) к новому виду, также каноническому, но
с другими коэффициентами:
А (х9 х) = (Хха|) xf + (Х2а.) т| + ... + (Хп4) т*.
Заметим, что в этом примере новые коэффициенты
формы А (ж, х) имеют те же знаки, что и старые; таким
образом, общее число положительных коэффициентов
и общее число отрицательных коэффициентов остались
неизменными. Оказывается, что это свойство имеет место
и в общем случае; именно, имеет место следующее
предложение, называется теоремой инерции квадратичных
форм:
Теорема 26. (Теорема и'нерции
квадратичных форм.) Число положительных и число
отрицательных коэффициентов в каноническом виде квадратичной
формы А (х9 х) являются инвариантами формы (т. е.
не зависят от выбора канонического базиса).
Доказательство. Пусть задана квадратичная
форма А (х, х). В некотором базисе {e}={el9 e2, ..., еп}
она имеет вид
п
A (Xf Х)= 2 ai&£h,
i, ft=l
где £ь £2> •••, ?n — координаты вектора х относительно
базиса {е}. Допустим, что она обладает двумя
каноническими базисами {/) = (Д /2, ..., /п} и {g\ = {glt g2, ..., gn).
Обозначим через rilf tj2, ..., rin координаты вектора X
в базисе {/} и через ть т2, ..., тп —в базисе {g}.
158 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
Соответствующие формулы преобразования координат
пусть будут следующими:
ih = fci151+bia6a+. • -+&1п£п> ^1 = с11$1 + с12?2+ .. •+сщ^п> ]
1)2= 62iEi+622*2+ * ' "+Ь2п5п, ^2 = С21$1 + С22*2+ • • • +С2п*п, 1
I
^п = 6п1*1+^п2*2+ • • '+ЬПг£п\ Tn = Cni^1 + Cn2*2 + ---+Cnn$n. J
(15)
В базисе {/} форма А (х, х) имеет вид
А (х, х) = агт\1 + . . . . +afeY]fe — afe+i7]|+1— . . . — аттД, (16)
а в базисе {g} соответственно
А (я, »)=Pii+p,xI+- • • +Pp*p-Pp+i*p+i-- • •—?«*?. (17)
Числа alf a2, ..., aw, j3b p2, ..., pg предполагаются
положительными. Мы покажем, что k = p, m — q.
Приравнивая правые части равенств (16) и (17) и перенося
отрицательные члены в противоположные части равенства,
мы получаем:
a^? + a2if]l+ ... +aft?)ft + iWiVM+ ••• +PaTa =
= afe+17]£+1 + . .. +am^ + p1xf + . .. +pp4. (18)
Допустим, что к < /?.
Рассмотрим векторы #, удовлетворяющие условиям
% = 0, 7)2 = 0, ..., T)fe = 0,
тр+1=0, ...,тд = 0, vh = 0, ..., тп = 0 (19)
Этих условий, очевидно, меньше чем п9 так как к < /?.
Подставляя выражения %, ..., %, тр+ь ..., тп через
координаты {$} по формулам (15), мы получаем однородную систему
.линейных уравнений относительно координат {£}; число
уравнений меньше числа неизвестных, и следовательно,
эта однородная система допускает ненулевое решение х =
= (Si» h> • • •> 5п)- Но, с другой стороны, всякий вектор х,
удовлетворяющий условиям (19), в силу равенства (18)
удовлетворяет и условиям
Т1 = т2=... =тр = 0.
§ 43] ВОПРОСЫ ЕДИНСТВЕННОСТИ 159
Вектор, для которого тх = т2 = ... = хр = тр+1 == .. .
...=i:n = 0, необходимо есть нуль-вектор, и для него все
координаты {£} также должны быть равны нулю.
Полученное противоречие показывает, что
предположение к < р не может осуществиться. В силу полной
симметрии чисел к и р в рассматриваемой задаче также
не может осуществиться и предположение р < к. Отсюда
#=/?. Далее, если рассмотреть условия
Tl = 0, Т2 = 0, . . ., Тр = 0, 7]fe+i=0, . .., T)m=0,
тв+1 =0, ...) хп = 0,
тем же приёмом можно опровергнуть предположение т < q
и по симметрии q < m. Таким образом, окончательно
получаем, что k = p, m—q, что и требовалось.
Полное число членов, входящих в канонический вид
квадратичной формы А (ж, х), называется рангом формы
или её индексом инерции] число положительных членов
называется положительным индексом инерции, число
отрицательных членов — отрицательным индексом инерции.
В следующем пункте будет указано, как вычислить ранг
квадратичной формы, не производя фактического
преобразования её к каноническому виду. Определение
положительного и отрицательного индексов инерции более
сложно; мы вернёмся ещё к этому вопросу в § 45, а также
в § 68.
Задача
Пусть р — положительный индекс инерции квадратичной формы
А(х, х) и ^r — её отрицательный индекс инерции. Пусть заданы р
положительных чисел Х1} Х2, ..., Хр и q отрицательных чисел
p-i, р<2> • •.» Pq- Показать, что существует базис, в котором форма
А(х, х) принимает вид
А (*, *) = Х1*! + Х2т8 + ... +Хр т« + ^t" + 1 + ... +PetJ+e.
Примечание. Это предложение показывает, что числа
р и q — единственные инварианты квадратичной формы.
Квадратичная форма, ранг которой равен числу
измерений пространства, называется невырожденной. Если
при этом положительный индекс инерции равен рангу,
форма называется положительно определённой] иными
160 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
словами, квадратичная форма положительно определённая,
если все п коэффициентов её канонического вида
положительны. Тем самым положительно определённая форма
в каждой точке пространства, кроме начала координат,
принимает положительное значение. И обратно, если
некоторая квадратичная форма в и-мерном пространстве
принимает всюду, кроме начала координат, положительные
значения, то её ранг равен п и положительный индекс
инерции также равен п, т. е. форма положительно
определённая. Действительно, для формы ранга, меньшего п>
или имеющей меньшее, чем п, число положительных
канонических коэффициентов, легко указать точки в
пространстве, отличные от начала координат, где эта форма
принимает отрицательное значение или нуль.
Например, форма ранга 2 в трёхмерном пространстве
А(х,х) = Ц + §
принимает нулевое значение на любом ненулевом векторе
с координатами ?х = 0, £2 Ф 0, £3 = 0. Форма ранга 3
в трёхмерном пространстве
А{х,х) = Ц-Ц + Ц
принимает на тех же векторах отрицательные значения.
Очевидно, что эти примеры имеют общий характер.
§ 44. Канонический базис билинейной формы
1. Вектор Xi называется сопряжённым с вектором ух
относительно билинейной формы А (ж, у), если
А(яь 2/i) = 0,
Если векторы #ь x2i ..., хи, сопряжены с вектором yl9
то также сопряжён с вектором уг любой вектор
подпространства L(xly х2, . .., Хъ) —линейной оболочки векторов
xl9 x2, ...,05ft. Действительно, в силу свойств билинейной
формы
А (а^х + а2ж2 + . .. + akxh, уг) =
= агА (хъ уг) + а2А (ж2, уг) + . .. + aftA (xki y±) == 0.
§ 44] КАНОНИЧЕСКИЙ БАЗИС БИЛИНЕЙНОЙ ФОРМЫ 161
Вообще, если вектор ух сопряжён с каждым вектором
некоторого подпространства R С Л, мы будем называть
этот вектор сопряжённым к подпространству R'.
Базис еь е2, . . «, еп называется каноническим базисом
для билинейной формы А(х, у), если базисные векторы
взаимно сопряжены: А(вг, еь)~0 при i=£k.
Пример
В пространстве V3 в качестве билинейной формы А (х, у)
рассмотрим скалярное произведение векторов х и у.
Сопряжённость векторов относительно этой билинейной формы равнозначна,
очевидно, их ортогональности. Каноническим базисом в этом
случае служит любой ортогональный базис пространства V3.
2. Матрица билинейной формы в каноническом базисе
имеет диагональный вид, так как ащ ~ A(eiy ek) — 0 при
i ^ к. Диагональная матрица совпадает со своей
транспонированной, поэтому билинейная форма, обладающая
каноническим базисом, должна быть симметричной *). Покажем,
что каждая симметричная билинейная форма А(х, у)
обладает каноническим базисом.
Рассмотрим квадратичную форму А(х, х),
соответствующую данной'•билинейной форме А (х, у). Мы знаем, что
в пространстве R существует базис elt е2, ,.., еп,
относительно которого квадратичная форма А (х, х) записывается
в каноническом виде
п
А(я,*)=2^Й-
i = 1
Соответствующая симметричная билинейная форма
А (я, у) согласно формуле (9) имеет канонический вид
п
А(^у) = 2*А^ (2°)
п
Г где у =2 t\ieij> e® матрица, следовательно, диагональ-
г=1
*) Вспомним, что симметричность пли несимметричность
матрицы билинейной формы —факт, не зависящий от 'выбора базиса
(§ 40, п. 3).
И Г. Е. Шилов
162 билинейные и Квадратичный формы [гл. 6
ная. Но это и означает, что базис еь е2, ..., еп является
каноническим для формы А {х, у).
Задача
Преобразовать билинейную форму
А (#, у) = Siij! + Si^ + 52*li + 252*]2 4- 252*]3 + 2£8f)2 + 5?3т|3
к каноническому виду.
Отв. А (х, 2/) = с1х1 + ^2'Т2 + азТз» гДе ci и Ti 0 = 1» 2, 3)—новые
координаты векторов х и у. При этом формулы перехода к новому
базису следующие:
cfi = ii Ч- ^2> а2 = ?2 ~Ь*2^з» ^з^^з-
3. Теорема инерции, доказанная нами для
квадратичных форм, непосредственно переносится и на
симметричные билинейные формы: именно, число положительных
и отрицательных коэффициентов канонического вида (20)
билинейной формы А (х, у) не зависит от выбора
канонического базиса. Поэтому имеют смысл понятия ранга
симметричной билинейной формы, её положительного и её
отрицательного индекса инерции. Ранг симметричной
билинейной формы или полное число слагаемых, входящих
в её канонический вид, совпадает, очевидно, с рангом
матрицы билинейной формы в каноническом базисе. Атак
как ранг матрицы билинейной формы пе зависит от
выбора базиса (§ 40, п. 4), то ранг билинейной формы может
быть найден, минуя само преобразование её к
каноническому виду, как ранг матрицы этой формы в произвольном
базисе.
4. Следующие определения соответствуют определениям,
приведённым в конце § 43 для квадратичных форм.
Билинейная форма А{х, у) называется невырожденной,
если её ранг равен числу измерений пространства — иными
словами; если в канонической записи (20) формы А (ж, у)
все коэффициенты Хь Х2, ..., Хп отличны от нуля. Если
все эти коэффициенты, кроме того, положительны, форма
А (х, у) называется положительно определённой.
Положительно определённая билинейная форма А(х, у)
характеризуется тем, что соответствующая квадратичная форма
А (ж, х) согласно § 43 принимает при каждом х■ Ф 0
положительное значение.
§ 44] КАНОНИЧЕСКИЙ БАЗИС БИЛИНЕЙНОЙ ФОРМЫ 163
Одним из важных примеров симметричной положительно
определённой билинейной формы в пространстве 73 является
скалярное произведение векторов х и у. Действительно, из определения
скалярного произведения непосредственно вытекают соотношения
(я, У)= (У> *),
(х, х) = \х\2 > О при хфО\
первое из них показывает, что билинейная форма (х, у)
симметрична; второе—что соответствующая квадратичная форма
принимает при каждом х ф О положительное значение и, следовательно,
билинейная форма (х, у) положительно определена.
В дальнейшем симметричные положительно определённые
билинейные формы будут играть исключительную роль: именно,
используя такие формы, мы в общем линейном пространстве получим
возможность ввести понятия длин векторов и углов между
векторами (гл. 7).
6. В аналитической геометрии доказывается, что середины
хорд кривой 2-го порядка, параллельных заданному вектору г,
лежат на одной прямой. Вектор s, определяющий направление
этой прямой, называется сопряженным к вектору г. Покажем,
что это определение совпадает с нашим определением сопряжённых
векторов,—по крайней мере для центральных кривых. Как известно,
после переноса начала координат в центр уравнение центральной
кривой принимает вид
или
А (х, x) = d,
где через А(х, х) мы обозначили симметричную квадратичную
форму в левой части равенства. Пусть вектор z определяет середину
некоторой хорды, параллельной вектору г. Это означает, что для
некоторого t удовлетворяются равенства
A(z + tr, z + tr) = d, k(z — tr, z—tr) — d.
В раскрытом виде эти равенства принимают следующую форму;
A (z, z) + Ilk (z, r) + *2А (г, г) = d,
А (г, z)—2tA(z, r) + t2A(r, r) = d.
Вычитая второе равенство из первого, мы получаем:
А (*,*•) = О,
т. е. векторы z и г сопряжены в принятом нами смысле.
Геометрическое место всех векторов z, сопряжённых к данному
вектору г, определяется линейным однородным уравнением A (z, r) —О
и, следовательно, представляет собой прямую, проходящую через
начало координат.
И*
164 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
§ 45. Построение канонического базиса
по методу Якоби
Построение канонического базиса, приведённое в § 42,
имеет тот недостаток, что оно не даёт возможности заранее,
по элементам матрицы А^ симметричной билинейной
формы А (я, у) в заданном базисе {/} = {/ь /2, ..., /п},
рассчитать коэффициенты \г и координаты векторов
канонического базиса. Метод Якоби, излагаемый далее, позволяет
находить эти коэффициенты и координаты векторов
искомого канонического базиса. Но при этом на матрицу Ащ
мы наложим следующее дополнительное условие: главные
миноры матрицы Ац) до (п — \)-го порядка включительно
8i = au, 82 =
#11 #12
#21 #22
•, 0n_i=
#11 #12 •••#!, п-1
#21 #22 • • • #2, п-1
#п-1,1 #п-1,2 • « •#?г-1,п-1
все должны быть отличными от нуля.
Векторы еь е2, ..., еп мы построим по формулам
e3 = a<12)/14.aW/a+/8> (21)
e^i-^/i I- 4")/2 + <)/з+ • • • + ^>/fc + /fc-M,
где коэффициенты a(fe) (i = 1, 2, . . ., &, fc = 1, 2, . .., n— 1)
ешё должны быть определены.
Заметим прежде всего, что переход от векторов
/ъ /а» • • • > /ь к векторам еъ е2, . . ., eh совершается при
§ 45] ПОСТРОЕНИЕ КАНОНИЧЕСКОГО БАЗИСА ПО ЯКОБИ 165
помощи матрицы
а1
о
1
о
о
о
О
О
О
(fc-i) (h-i)
Oil a2
.«fci" 1
с определителем, равным единице; поэтому для к = 1, 2, ..., п
векторы /i,/г, • ••>/& могут быть линейно выражены
через вь е2, ...,е& и, следовательно, линейная оболочка
L [/i, /2, • • -, /ft] совпадает с линейной оболочкой L [е1} ег... efe].
Коэффициенты ai\i= 1,2, . . ., к) мы подчиним тому
условию, чтобы вектор е&+1 был сопряжён с
подпространством Ь(еъ е2, .. ., еь). Для этого необходимо и
достаточно, чтобы выполнялись равенства
A(ek+i9 /0 = 0, A(efc+1, /я) = 0, .. ., A(efc+b /fc)-0. (22)
Действительно, из условий (22) вытекает, что вектор
efe+i сопряжён с линейной оболочкой векторов /ь /2, ..., /ь,
которая по доказанному совпадает с линейной оболочкой
векторов el9 е2> •♦•> е&. Обратно, если вектор е&+1 сопряжён
с подпространством L [еь е2, .. ., еь], то он сопряжён с
каждым вектором этого подпространства и, в частности, с
векторами /ь /2, ..., Д; поэтому выполняются равенства (22).
Подставляя в формулы (22) выражение еъ.+\ (21)
и пользуясь определением билинейной формы, получаем
систему уравнений относительно величин щ ' (i = 1, 2,..., к):
A (eft+,, Д) = <#> А (Д, Д) + a(2ft) А (/„ Д) + ...
...+a(feft)A(/ft,/1)4-A(/h+1)/1) = 0)
А (ек+1, f%) = <#> А (Д, Д) + a(2ft) A (Д, /,)+...
... +*ik)A(fk, Д) + А(Д+1, Д) = 0, (23)
„(Ю
(")
A (efe+1, /ft) = «Г А (Д. /fc)+<tf' А (Д, Д) + .. .
...+<#> А (Д, Д) + A (/*+,,/кЬО.
166 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
Эта неоднородная система уравнений с коэффициентами
^ (/ь /у) = яц (i, )' = 1, 2, . . ., к) имеет по условию
отличный от нуля определитель и поэтому однозначно
разрешима; следовательно, можно определить величины <4fe) и тем
самым построить искомый вектор е&+1-
Для определения всех коэффициентов a[fe) и всех
векторов ek нуншо при каждом к разрешить соответствующую
систему (23), следовательно, всего разрешить п— 1 систем
линейных уравнений.
Обозначим координаты вектора х в построенном базисе
ей е2> • • •> еп через !ь £2, • • • Лп и координаты векюра у
в этом базисе соответственно через tqx, t]2, ...,%.
Билинейная форма А (х, у) в этом базисе принимает вид
A(x,y)=|]X15l14i. (24)
Чтобы вычислить коэффициенты Xit будем рассуждать
следующим образом. Рассмотрим нашу билинейную форму
А (х, у) только в подпространстве Lm = L(elf е2, . .. ет),
где т< п. Форма А(х, у) в базисе Д, /2, .. ., fm
подпространства Lm имеет, очевидно, матрицу
йи а12 . .. dim
a21 a22 • • • а2т
^ml &гп2 • • • &тт
а в базисе еъ е2, . . .,ет —матрицу
II h II
Х2
I m 1|
Матрица перехода от базиса Д, /2, ..., /т„ к базису
ех, е2, ..., ew, отвечающая формулам перехода (21), имеет,
46]
ПОЛИЛИНЕЙНЫЕ ФОРМЫ
167
как мы видели, определитель, равный 1. В силу
формулы (6) § 40 мы должны иметь
det
#11 #12 • • • alrn
#21 #22 • • • #2m
#ml #m2 • • • #n
= det
Xi
(25)
(26)
или, используя обозначения главных миноров,
Sm==X1X2...Xm (wi=l, 2, .. .,л).
Из формулы (25) непосредственно вытекает, что
л1 —°i —#п> л2 — -*-> дз~~*~ > • • •> дп — ^—
°1 °2 йЛ-1
Формулы (26) позволяют найти коэффициенты
билинейной формы в каноническом базисе, не вычисляя самого
базиса.
Наше доказательство позволяет определить также при
условии неравенства нулю главных миноров матрицы Af
значения положительного и отрицательного индексов
инерции билинейной формы А (ж, у) и, следовательно,
квадратичной формы А(х> х).
Задача
Применить метод Якоби для преобразования билинейной формы
А (х, у)= Ei»)! — giif|a — 6a,»)i + ^з + Mi + 2Мз + 2^2 + Мз + 6я*Ча-
Указание. Сначала изменить нумерацию координат таким
образом, чтобы матрица билинейной формы А (х, у)
преобразовалась к виду, допускающему применение метода Якоби.
§ 46. Полилинейные формы
По аналогии с билинейными формами можно рассматривать
линейные функции от большего числа векторов (трёх, четырёх
и более). Все они называются полилинейными формами.
Полилинейная форма А(хи х2,.... х& называется
симметричной, если она не изменяется при перемене местами любых двух
168 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 6
своих аргументов, и антисимметричной, если при перемене
местами двух своих аргументов она изменяет знак.
Примером полилинейной антисимметричной формы от трёх
векторов #, у, z (трилинейной формы) в пространстве У3 является
смешанное произведение этих векторов.
Примером полилинейной антисимметричной формы от п
векторов
*1={«1H<*12, •••» «1М>,^2=^21»«22»
является определитель
А (хг, х2, .. .,хп) =
«11 «12
а21 <222
{«ni> ап2, •••» «пп}
«2П
(27)
Несколько более общим примером является произведение
определителя (27) на фиксированное число С.
Покажем, что всякая полилинейная антисимметричная форма
А (хи #2, • • •» жл) от п векторов хъ х2, ..., хп в n-мерном линейном
пространстве R с фиксированным базисом
€ii c<2,s . ♦ • > Сл равна
определителю (27) с некоторым постоянным множителем С.
Обозначим через С величину A(clf е2, • ••> ^л)- Тогда легко
можно подсчитать величину А (е. , ei2, ..., ^ ), где ilt i2, ..., in —
любые целые числа от 1 до п. Если среди этих чисел имеются
два равных числа, то величина А.(е- , £•!...,*. ) равна нулю, ибо
при перестановке соответствующих аргументов она не изменяется,
в то время как по свойству антисимметрии она должна изменить
знак. Если все числа ij, /2, • • •»in различны, то, произведя столько
перестановок соседних аргументов, сколько беспорядков в
последовательности индексов ij, г2, ..., in *)> — обозначим это число через
N — можно добиться нормального расположения аргументов;
отсюда
,е{ ) = (-!)*-С.
Пусть теперь
A(*ii»*ia'
У-1
., л)
есть произвольная система л векторов пространства R. Составим
*) Ср. доказательство теоремы об определителе произведения
двух матриц (§ 29, п. 4).
§ 46]
ПОЛИЛИНЕЙНЫЕ ФОРМЫ
169
полилинейную форму A(xlf x2, ..., хп):
А(хх, х2, ..., хп) =
п п п
ii=l i2= 1 in=l
= 2 aliia2i2- • • anin A(eu, «i„ • • • , *in) =
ii, i2, ..., Vi==i
n
= C ^ (-1)"в«1а21,...«п1я.
h, i2, ..., in = l
Так как в каждом слагаемом получившейся суммы N означает
число беспорядков в расположении вторых индексов элементов
при нормальном порядке первых индексов, то каждое слагаемое
есть один из членов определителя (27) с положенным этому члену
знаком. Сумма всех этих членов равна поэтому самому
определителю (27). Таким образом, наше утверждение доказано.
В частности, мы показали, что смешанное произведение трёх
векторов х, у, z пространства Vs в любом базисе записывается
как определитель 3-го порядка из координат этих векторов с
коэффициентом, равным смешанному произведению базисных векторов.
Задачи
1. Доказать теорему: полилинейная антисимметричная форма
от п+1 векторов в w-мерном пространстве R тождественно равна
нулю.
2. Доказать теорему: полилинейная антисимметричная форма
от гс — 1 векторов в n-мерном пространстве записывается в любом
базисе как определитель, первые п—1 строк которого заполнены
координатами векторов-аргументов, а последняя л-я строка
фиксирована.
ГЛАВА 7
ЕВКЛИДОВЫ ПРОСТРАНСТВА
§ 47. Введение
Большое многообразие фактов, которыми богата
геометрия, в значительной мере объясняется возможностью
различных измерений — в основном возможностью
измерения длин отрезков и углов между прямыми. В общем
линейном пространстве мы ещё. не имеем способа
производить такие измерения; и это, разумеется, суживает
область нашего исследования.
Желая наиболее естественным образом распространить
на общие линейные пространства методы, связанные
с возможностью измерений, мы будем исходить из
определения скалярного произведения двух векторов,
принятого в аналитической геометрии (и пригодного, конечно,
только ^;ля обычных векторов — элементов пространства V3).
Это определение гласит: скалярное произведение двух
векторов есть произведение длин этих векторов и косинуса
угла между ними. Следовательно, это определение уже
основано на возможности измерения длин векторов и угла
между ними. Но, с другой стороны, зная скаляраые
произведения любой пары векторов, мы можем восстановить
длины их и угол между ними; действительно, квадрат
длины вектора равен скалярному произведению этого
вектора с самим собой, а косинус угла между двумя
векторами —отношению их скалярного произведения к
произведению их длин. Следовательно, в понятии скалярного
произведения потенциально заключены и возможность
измерения длин и возможность измерения углов, а вместе
§ 47]
ВВЕДЕНИЕ
171
с ними —и вся область геометрии, связанная с
измерениями («метрическая геометрия»).
В общем линейном пространстве нам легче будет
ввести понятие скалярного произведения двух векторов
цезависимо от их длин и угла между ними и затем из
имеющегося уже понятия скалярного произведения
получить определения длины вектора и угла между векторами.
Посмотрим, какие свойства обычного скалярного
произведения можно использовать для построения
аналогичной величины в общем линейном пространстве.
В § 44, п. 4 мы уже видели, что в пространстве V3
скалярное произведение (х, у) есть билинейная форма
от векторов х и у, симметричная и положительно
определённая. Формы с такими свойствами, вообще говоря,
имеются и в общем линейном пространстве. Рассмотрим
в общем линейном пространстве произвольную
фиксированную билинейную форму А (х, у), симметричную и
положительно определённую. Назовём её «скалярным
произведением» векторов х и у. После этого определим длину
каждого вектора и угол между каждыми двумя векторами
по тем же правилам, по которым длина вектора и угол
между векторами вычислялись через скалярные
произведения в пространстве Vz. Разумеется, только
дальнейшее исследование может показать, насколько удачно это
определение; и мы увидим на протяжении этой главы
и следующих глав, что это определение на самом деле
позволит распространить на общие линейные пространства
методы метрической геометрии и тем самым значительно
усилить средства исследования математических объектов,
встречающихся в алгебре и анализе.
Отметим здесь одно существенное обстоятельство.
Исходную билинейную и положительно определённую
форму можно выбрать в данном линейном пространстве
многими различными способами. Длина некоторого
вектора х, вычисленная с помощью одной такой формы,
будет отличаться от длины этого же вектора х,
вычисленной с помощью другой формы; то же относится
и к углу между двумя данными векторами. Таким образом,
длина вектора и угол между векторами не
определяются однозначно. Но эта неоднозначность не должна
172 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 7
нас смущать; ведь ничего нет удивительного в том, что
одному и тому же отрезку на прямой, измеренному
различными масштабами, приписываются в результате этих
измерений в качестве его длины различные числа. Можно
сказать, что выбор исходной билинейной симметричной
и положительной формы аналогичен выбору такого
«масштаба» для измерения длин векторов и углов между ними.
Линейное пространство с выбранной в нём
«масштабной» билинейной симметричной положительно
определённой формой будем в дальнейшем называть евклидовым.
Линейное пространство без заданной «масштабной» формы
будем попрежнему называть аффинным.
§ 48. Определение евклидова пространства
Линейное пространство R называется евклидовым, если
1) имеется правило, которое позволяет построить для
каждых двух векторов х и у из R вещественное число,
называемое скалярным произведением векторов х и у
и обозначаемое (х, у); 2) это правило удовлетворяет
следующим требованиям:
(а) (х, у) — (у} х) (иереместительный закон),
(б) (х, у + z) = (х, у) + (х, z) (распределительный закон),
(в) (кх,у) = \(х, у) для любого вещественного числа X,
(г) (х, х) > 0 при х Ф О и (х, х) = 0 при х = 0.
Аксиомы (а) —(г) утверждают в совокупности, что
скалярное произведение векторов х и у есть билинейная
форма [(б) и (в)], симметричная [(a)] и положительно
определённая [(г)]. И обратно, всякая форма, обладающая
этими свойствами, может быть принята за скалярное
произведение.
Примеры
1. В пространстве V3 свободных векторов (§ 11)
скалярное произведение вводится по правилам
аналитической геометрии. Условия (а) —(г) выражают собой
основные свойства скалярного произведения; они доказываются
в векторной алгебре.
§ 48] ОПРЕДЕЛЕНИЕ ЕВКЛИДОВА ПРОСТРАНСТВА 173
2. В пространстве Тп (§ И) мы введём скалярное
произведение векторовя = (£ь £2> • • •> £п)и?/ = (7]ь т}2, ...,т)п)
по формуле
(я, г/) - Si^i + 5i7j2 + . . . + £пт]п. (1)
(Это определение обобщает известную формулу
выражения скалярного произведения векторов в трёхмерном
пространстве через координаты сомножителей в
ортогональной системе координат.) Читатель легко проверит,
что требования (а) —(г) удовлетворяются.
Заметим, что формула (1) —не единственный способ
введения скалярного произведения в Тп. В дальнейшем
(§ 61) мы опишем все возможные способы введения
скалярного произведения в га-мерном линейном пространстве.
3. В пространстве С (а, Ь) непрерывных функций на
отрезке а<£<6 (§ 11) мы вводим скалярное
произведение функций х (t) и у (t) по формуле
ь
{x,y)=^x(t)y(t)dt. (2)
а
Легко проверить, применяя основные правила
интегрирования, что требования (а) —(г) удовлетворяются.
В дальнейшем будем обозначать пространство С {а, Ъ)
со скалярным произведением по формуле (2) через С2(я> Ь).
Задачи
1. Назовём скалярным произведением двух векторов
пространства Vs произведение их длин. Будет ли пространство
евклидовым?
Отв. Нет, ибо не выполняется аксиома (б) и аксиома (в)
для Х = —1.
2. А если назвать скалярным произведением двух векторов
того же пространства произведение их длин на куб косинуса
угла между ними?
Отв. Нет, ибо не выполняется аксиома (б).
3. А если назвать скалярным произведением удвоенное
обычное скалярное произведение этих векторов?
Отв. Можно. Это равносильно изменению масштаба на осях.
Поскольку скалярное произведение векторов хну
является билинейной формой, для него должна быть спра-
174 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ.
ведлива формула (2) § 40. В данном случае эта формула
принимает следующий вид:
k m km
(2а^ь 2 р#/)=2 2а«м*ь уд- (3)
г=1 ;=1 i=lУ-1
Здесь х1у х2, . .., #ь, 2/i, г/2> • • •» 2/т — произвольные
векторы евклидова пространства Л, аг, а2, . . ., aft, (Зь (32, •••
• ■ •, Рт — любые вещественные числа.
§ 49. Основные метрические понятия
Имея скалярные произведения, мы можем дать
определение и основных метрических понятий — длины вектора
и угла между парой векторов.
1. Длина вектора. Длиной вектора х в
евклидовом пространстве R мы будем называть величину
|х|= +У(х, х). (4)
Примеры
1. В пространстве V3 наше определение длины вектора
приводит к обычному значению длины вектора.
2. В пространстве Тп для вектора х = (£ь £2, • • •, U
получается выражение длины в виде
И= + ]Af + 6I+•••+$•
3. В пространстве С2(а, &) длина вектора
х~х(Доказывается равной
\х\ = )/(х, ж) = +]/ \я2(/)Л.
a
Эту величину обозначают иногда ||#(0|| и называют ио/?-
мой функции х (t) (чтобы избежать ложных ассоциаций,
связанных со словами «длина функции»).
Из аксиомы (г) вытекает, что у каждого вектора х
евклидова пространства R существует длина; у всякого
§ 49] ОСНОВНЫЕ МЕТРИЧЕСКИЕ ПОНЯТИЯ 175
вектора х Ф 0 длина положительна, у нуль-вектора длина
равна нулю. Равенство
I as I = Vfa, ьх) = yV (я, ж) = | а | У(х, х) = \а\\х\ (5)
показывает, что абсолютную величину числового
множителя можно выносить за знак длины вектора.
Вектор х, имеющий длину 1, называется
нормированным. Всякий ненулевой вектор у можно нормировать, т. е.
умножить на такое число X, чтобы в результате
получился нормированный вектор. Действительно, уравне-
I
ние | \у | = 1 имеет относительно X решение | X | =:—-.
Множество FCZR называется ограниченным, если
длины всех векторов x£F ограничены фиксированной
константой. Примером ограниченного множества является
единичный шар пространства R — совокупность всех
векторов x£R с длиной, не превышающей единицы.
2. Угол между векторами. Углом между парой
векторов хну мы будем называть тот угол (в пределах
от 0 до 180°), косинус которого равен отношению
(а» У)
\*\\У\ '
Для обычных векторов (в пространстве VB) наше
определение согласуется с обычным выражением угла между
векторами через скалярное произведение.
Чтобы это определение можно было применить в общем
евклидовом, пространстве, необходимо доказать, что
указанное отношение по абсолютной величине не цревосходит
единицы, каковы бы ни были векторы х и у.
Для доказательства этого утверждения рассмотрим
вектор \х — у, где X — вещественное число. В силу
аксиомы (г) при любом X
(kx — у, 1х — у)>0. (6)
Используя формулу (3), мы можем даписать это
неравенство в виде
X«(s, х)-Щх,у) + {у, у)>0. (7)
176
ЕВКЛИДОВЫ ПРОСТРАНСТВА
[ГЛ. 7
В левой части неравенства стоит квадратный трёхчлен
относительно X с постоянными коэффициентами. Трёхчлен
этот не может иметь различных вещественных корней,
так как тогда он не мог бы сохранять знака для всех
значений X. Поэтому дискриминант (х, у)2 — (х, х) (у, у)
этого трёхчлена не может быть положительным. Следо-
# вательно, (х, */)2<(#, х)(у, у), откуда, извлекая
квадратный корень, получаем:
|(*> У)1<ММ. (8)
что и требовалось.
Выясним, когда в неравенстве (8) возможен знак
равенства. Если имеет место равенство
\(х, у)\ = \х\\у\,
то дискриминант квадратного трёхчлена (7) равен нулю и,
следовательно, трёхчлен имеет один вещественный корень Х0.
Мы получаем, таким образом,
Х§(ж, х)-2\0(х, у) + {у, у) = (к0х-у, 10х-у) = 0,
откуда в силу аксиомы (г) находим, что \0х — у— О или
у — \0х. Наш результат можно сформулировать в
геометрических терминах: если скалярное произведение двух
векторов по абсолютной величине равно произведению их длин,
то эти векторы коллинеарны.
Неравенство (8) называют неравенством Коши-Буня-
ковского.
Примеры
1. В пространстве Vz неравенство Коши-Буняковского,
очевидно, вытекает из самого определения скалярного произведения
как произведения длин векторов и косинуса угла между ними.
2. В пространстве Тп неравенство Коши-Буняковского
имеет вид
li^UVi^Vi^-' (9)
|У=1 I j-i У-1
оно справедливо для* любой пары векторов ж = (^1, £2» •••> £п) и
y = (i\lt т)2) •••» т\п), или, что то же самое, для любых двух систем
вещественных чисел £lf 52» "->%п и r\l, yj2, ..., v\n. В такой форме
оно было найдено французским математиком Коши в 1821 г.
§ 49] ОСНОВНЫЕ МЕТРИЧЕСКИЕ ДЮНЯТИЯ 177
3. В пространстве С2 (я, Ь) неравенство Коши-Буняковского
имеет вид
ь I Г ь Гь
^x(t)y{t)dt\<y ^»2(0Л]/ \ У2
(t) dt. (10)
В этом виде оно было открыто русским математиком В. Я. Буня-
ковским к опубликовано им в 1859 г.
В литературе, особенно иностранной, оба эти неравенства
часто называются именем Шварца, хотя у Шварца они появились
только в 1885 г.
Задачи
1. Найти угол между противоположными рёбрами
правильного тетраэдра.
Указание. Обозначить через ei9 e2, ез векторы, идущие из
фиксированной вершины тетраэдра по трём его рёбрам, и найти
векторные выражения для остальных его рёбер.
Отв. 90°.
2. Найти углы в треугольнике, образованном в
пространстве С2(— 1, 1) векторами aj1(^) = l, x2(t) = t и xs(t)=l — t.
Отв. 90э, 60э, 30°.
3. Ортогональность. Векторы х и у называются
ортогональными у если (х, у) — 0. Если х Ф 0 и у Ф 0, то
это определение в соответствии с общим определением
угла между двумя векторами (п. 2) означает, чт.о х и у
образуют угол в 90°. Нулевой вектор оказывается
ортогональным к любому вектору x£R.
Примеры
1. В пространстве Тп условие ортогональности векторов
* = (2ц ?2» ...,5П) и 2/ = (^» г«2, ..мЧп) имеет вид
Например, векторы е1=^(1, 0, ..., 0), е2 = (0, 1, 0, ..., 0), ..., еп —
— (0, 0, ..., 1) попарно взаимно ортогональны.
2. В пространстве С2(я, Ъ) условие ортогональности векторов
x~x(t) и y=y(t) имеет вид
Ь
^ x(t)y(i)dt = 0.
а
т1итатель легко проверит, вычислив соответствующие
интегралы, что в пространстве С2( — *> т-) любые два вектора «три-
12 г. Е. Шилов
178 ЕВКЛИДОВЫ ПРОСТРАНСТВА
гономстрической системы»
1, cost, sin t, cos It, sin 2t, . ..,cosnf, sinnl, ...
взаимно ортогональны.
Приведём несколько простых свойств, связанных с
понятием ортогональности.
Лемма 1. Взаимно ортогональные ненулевые векторы
хъ х2, • • •, %н линейно независимы.
Доказательство. Допустим, что эти векторы
линейно зависимы: тогда имеет место равенство
Сххх -ь С2х% + . .. + Ckxk = О,
где, например, Сх Ф 0. Умножим это равенство скалярно
на хх\ в силу предположения о взаимной ортогональности
векторов xlt х%, ..., Xk мы получим C1(xXi #i) = 0. Отсюда
{хг %) = 0 и, следовательно, хх есть нулевой вектор в
противоречие с предположением.
Результат этой леммы мы часто будем использовать
в такой форме: если сумма взаимно ортогональных
векторов равна нулю, то каждое из слагаемых равно нулю.
Лемма 2. Если векторы уъ у2, --^Уь, ортогональны
к вектору я, то любая линейная комбинация ai2/i+a22/2-l- •••
. . . +<вдь также ортогональна к вектору х.
Доказательство.
(ВД1+ ..-+а*Ук, s) = ai(yb x)+ . ..+afc(yfc, я) = 0.
Следовательно, вектор ^ух + ... -\-&ъУь ортогонален к
вектору х, что и требовалось.
Совокупность всех линейных комбинаций а1у1+а2г/2+ •••
.. . +akyh образует подпространство L--=L(yly y2i ..., yk) —
линейную оболочку векторов у1у у2, . . •, у и (§ 16).
Следовательно, вектор х ортогонален к каждому вектору
подпространства L. В таких случаях мы будем говорить, что
вектор х ортогонален к подпространству L. Вообще, если
F CZ R — произвольное множество векторов в евклидовом
пространстве Я, то мы будем говорить, что вектор х
ортогонален к множеству F, если он ортогонален к любому
вектору из F.
Совокупность G всех векторов х, ортогональных к
множеству F, в силу той же леммы 2 сама составляет, под-
[ГЛ. 7
i
§ 4»]
ОСНОВНЫЕ МЕТРИЧЕСКИЕ ПОНЯТИЯ
179
пространство в пространстве R. Чаще всего такая
ситуация встречается в том случае, когда F есть
подпространство; тогда подпространство G называется ортогональным
дополнением подпространства F.
4. Теорема Пифагора и её обобщение. Пусть
векторы х и у ортогональны; тогда но аналогии с
элементарной геометрией вектор х-\~у можно называть
гипотенузой прямоугольного треугольника, построенного на
векторах хну. Умножая х + 2/ скалярно на себя и
используя ортогональность векторов х и у, мы получаем:
\х + у\2 = (х + у, х + у) = {х, х) + 2(х, у) + (у, у) =
=Ф>я) + (У, у)Н*1я + 1у|2-
Мы доказали тем самым в общем евклидовом
пространстве теорему Пифагора: квадрат гипотенузы равен
сумме квадратов катетов. Нетрудно обобщить эту
теорему на случай любого числа слагаемых. Именно,
пусть векторы хх, х2, • • •> %к взаимно ортогональны и
z = Xi + х2 f ... + xk; тогда
\z\2 = (x1 + x2+ . ..+3*. х1 + х1 + х2 + . .. +хк) =
= |.%|2+|^2|2+...+|^|2- (И)
5. Неравенства треугольника. Если х ж
у—произвольные векторы, то по аналогии с элементарной
геометрией вектор х + у естественно называть третьей стороной
треугольника, построенного на векторах х и у.
Используя неравенство Коши-Буняковского, мы получаем:
\х-\-у\2=;(х + у, х + у) = (х, х) + 2(х, у) +
К '\>\х\*-2\хГ\у\ + \у\* = (\х\-\у\)*
или
\* + У\< М + |2/1> (12)
\х + У\>\\х\-\У\\- (13)
Неравенства (12) —(13) называются неравенствами
трехугольника. Геометрически они означают, что длила*
любой стороны всякого треугольника не больше чем
12*
180 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 7
сумма длин двух других сторон и не меньше чем
абсолютная величина разности длин этих сторон.
Задача
Написать неравенства треугольника в пространстве С2(а, Ь).
Мы могли бы, далее, последовательно переносить на
евклидово пространство остальные теоремы элементарной
геометрии. Но мы ограничимся указанными фактами.
В дальнейшем (§ 51) мы докажем общую теорему, из
которой будет следовать справедливость в евклидовом
пространстве всех теорем элементарной геометрии.
§ 50. Ортогональный базис
в п-мерном* евклидовом пространстве
1. Теорема 27. В n-мерном евклидовом
пространстве R существует базис из п ненулевых взаимно
ортогональных векторов.
Доказательство. Для билинейной формы (х,у),
как и для всякой симметричной билинейной формы
р ^-мерном пространстве, существует канонический базис
(§ 44) уг, у2,---,Уп- Условие канонического базиса
(Уг у yk) = 0 при 1Ф к есть в данном случае условие
ортогональности векторов 2/i и уи', таким образом,
канонический базис у1у у2, ..., уп образуется в данном случае
из п взаимно ортогональных векторов. Это и доказывает
теорему.
В следующей главе мы рассмотрим способы
эффективного построения ортогонального базиса.
Векторы yl9 уг, . . ., уп для дальнейшего удобно
нормировать, разделив каждый из них на его длину. Мы
получаем после этого в пространстве R ортогональный
и нормированный базис {иногда говорят «ортонормиро-
ванный» или «ортонормальный» базис).
2. Пусть вх, е2, • • •> еп — произвольный ортогональный
нормированный базис в тг-мерном евклидовом
пространстве R. Каждый вектор x£R можно представить^ виде
x=t1e1 + t2e2+ . . . +$пеп, (14)
ГА° ъ $2» • • • » in — координаты вектора х. Мы будем также
называть эти координаты коэффициентами Фурье вектора
§ 51] ИЗОМОРФИЗМ ЕВКЛИДОВЫХ ПРОСТРАНСТВ 181
х относительно ортогональной и нормированной системы
el9 e2, ...,еп*). Умножая равенство (14) скалярно на eiy
находим выражение коэффициента ^:
ti=(x,et) (*=1,2, ...,/i). (15)
Если у = %<?i + ri2e2 + ... + ч\пеп — любой другой вектор
пространства Я, то по формуле (3) мы получаем:
(х,У) = *i4i + ^2+ ••• + ^п. (16)
Итак, в нормированном ортогональном базисе
скалярное произведение двух векторов равно сумме произведений
их соответствующих координат —коэффициентов Фурье.
В частности, полагая у = х, получим:
\х\* = (х,х) = Ц + Ц+...+^п. (17)
Задача
Определить косинусы углов между прямой 51 = 5а=. . . — £л
и осями координат в пространстве Тп.
1
Отв. coscp = _—— .
У п
§ 51. Изоморфизм евклидовых пространств
Результаты § 50 показывают, что произвольное
абстрактное д-мерное евклидово пространство R по своим
метрическим свойствам не отличается от конкретного
евклидова пространства Тп (§ 48). Для уточнения этого
утверждения условимся в следующем определении:
Два евклидовых пространства Rf и В!' называются
изоморфными, если между их элементами можно
установить взаимно однозначное соответствие со следующими
свойствами:
1. Если векторам х' и у' пространства R отвечают
векторы х" й у" пространства R", то вектору х*-\-у'£Rf
отвечает вектор х" + у" £R и вектору аж' £ R' отвечает
вектор ax"£R" при любом вещественном а.
2. В тех же предположениях число (х'', у') равно числу
(х», у").
Имеет место следующая теорема изоморфизма:
*) О происхождении такого названия см, § 94.
182
ЕВКЛИДОВЫ ПРОСТРАНСТВА
[ГЛ. 7
Теорема 28. Любые два конечномерных евклидовых
пространства R' и R' одинаковой размерности п
изоморфны.
Доказательство. Выберем произвольный
ортогональный нормированный базис е[, е[, .. ., е'п в
пространстве В! и такой же базис ё[, е\, ..., ё'п в пространстве Я".
Каждому вектору х' = 1хе[ + \ге'г + .. . + \г&'п G R' поставим
в соответствие вектор х" = \хе"х + ^1+ • • • + ^пб R".
Очевидно, что это соответствие взаимно однозначно. Далее нужно
проверить выполнение обоих условий изоморфизма.
Выполнение первого условия изоморфизма проверяется
так же, как и в аналогичной теореме для аффинных
пространств (§ 18) путём выражения результатов
линейных операций через координаты.
Выполнение второго условия изоморфизма вытекает
непосредственно из того, что в обоих пространствах
скалярное произведение записывается через координаты по
одной и той же формуле (16).
Тем самым теорема 28 полностью доказана.
В частности, трёхмерные пространства V3 и Т3
изоморфны; также пространство V3 изоморфно любому
трёхмерному подпространству любого евклидова
пространства Л*). Из этого следует уже упоминавшийся факт,
что всякая метрическая теорема элементарной
геометрии (т. е. теорема, относящаяся к # пространству
V3 или к его двумерному подпространству V2)
автоматически выполняется во всяком евклидовом пространстве Д.
Мы могли бы, в частности, доказанные в § 49 неравенство
Коши-Буняковского и теорему Пифагора вывести
непосредственно из справедливости их в элементарной
геометрии и только что доказанной теоремы изоморфизма.
§ 52. Норма линейного оператора
В трёх последних параграфах этой главы мы будем
рассматривать линейные операторы, действующие в
евклидовом пространстве.
*) Очевидно, что любое подпространство евклидова
пространства само является евклидовым пространством (с тем скалярным
произведением, которое установлено во всём пространстве).
§ 52] НОРМА ЛИНЕЙНОГО ОПЕРАТОРА 183
Наличие метрики в пространстве R позволяет
сопоставить каждому линейному оператору А неотрицательное
число || А ||, называемое нормой оператора А. Именно,
мы рассмотрим числовую функцию F (х) = | Ах |,
определённую для векторов х 6 Д. Нормой оператора А называется
точная верхняя грань (если она существует) значений
этой функции на единичных векторах х:
||A||=sup|A*|. (18)
I а 1 = 1
Всякий вектор х0> на котором достигается точная верхняя
грань (18), называется максимальным вектором
оператора А. Покажем, что в д-мерном евклидовом
пространстве величина ||А|| существует для всякого линейного
оператора А*). Действительно, длина вектора Ах, очевидно,
есть непрерывная функция от координат г\ъ т]2, ...,iqn
этого вектора; каждая же из этих координат есть
линейная функция от координат £ь £а> • • • > &п вектора х.
В конечном счёте |Аж| есть непрерывная функция от
координат £ь £2> • • ■, ?п вектора х. Так как сфера |#| = 1
является ограниченным и замкнутым множеством в
n-мерном пространстве, то по теореме Больцано**)
непрерывная функция |Аж| ограничена на этой сфере. Поскольку
всякое ограниченное множество имеет точную верхнюю
грань, число || А || существует. Далее, по другой теореме
Больцано на сфере |#|-=1 имеется точка xQi в которой
функция |Аж| достигает своей точной верхней грани; ||А||
соответствующий вектор х0 и будет максимальным
вектором для оператора А.
П римеры
1. Норма нулевого оператора, очевидно, равна нулю.
Обратно, если ||А|| = 0, то это означает, что каждый
нормированный вектор х0 переводится оператором А в нуль;
но так как каждый вектор х коллинеарен с некоторым
нормированным вектором х0, то А# = 0 для любого х.
Следовательно, если ||А|| = 0, то А = 0.
*) В бесконечномерном пространстве возможен случай
||А|| = оо. См. § 92.
**) Можно сослаться также на общие теоремы о непрерывных
функциях, которые мы докажем в § 88.
184 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 7
2. Норма тождественного оператора Е равна единице,
так как | Ех | = | х | для любого вектора х. /
3. Пусть в и-мерном евклидовом пространстве
диагональный оператор А задан соотношениями
kei^\iel (t = l, 2, . .., /г),
где еъ е2, . .., еп — ортогональный и нормированный базис.
Покажем, что норма оператора А равна наибольшему из
чисел | Xf | (i == 1, 2, . .., п). Пусть для определённости
наибольшим является число |ХХ|; тогда для любого единич-
п
ного вектора х = 2 %iet мы имеем:
| Ах |2 = (Аж, А*) - (А 2 Mi» A 2 £л) =
i t
откуда lArc^lXjl для |ж| = 1; но, с другой стороны,
полагая х = ег> мы получаем, что | Ах | =■ | Аех \ — \ K^i I - I ^i IJ
отсюда вытекает, что
sup | Ах I = | Xx I,
что мы и утверждали. Одновременно мы показали, что
вектор ег является максимальным вектором для
оператора А.
Покажем, что для любого вектора x£R и любого
линейного оператора А с конечной нормой || А || имеет
место неравенство
\Ах\<\\А\\\х\. (19)
Действительно, неравенство (19) справедливо для
любого единичного вектора по самому определению нормы
оператора А. Если же х — произвольный вектор,
отличный от нуля (для нуль-вектора неравенство (19), очевидно,
выполнено), то -^—единичный вектор и, следовательно,
<||А||. .(20)
А
53] * ОРТОГОНАЛЬНЫЕ МАТРИЦЫ 185
Но, поскольку А —линейный оператор, мы имеем.
умножая теперь неравенство (20) на \x\t мы и получаем
требуемое неравенство (19).
Задача
Проверить неравенства || А + В ||<;|| A ||+J|B || и ||АВ||<:
< || А || || В || для любых двух операторов А и В.
§ 53. Ортогональные матрицы и изометрические
операторы
1. В гл. 5 мы изучали правила преобразований
координат в и-мерпом линейном пространстве при переходе от
одного базиса к другому. В евклидовом пространстве
наиболее важен случай перехода от одного ортогонального
нормированного базиса {е} = (е, е2, ..., еп} к другому
ортогональному нормированному базису {/} = {/ь /2, . . ., /п].
Выясним, какой вид будут иметь соответствующие
формулы перехода. Разлагая векторы базиса {/} по базису {е\,
мы получаем
/1==g(i)ei + g(2De2+...+?a^n,
U = q\2)ei + qpe2 l . . . -г ?<*>*„,
(21)
fn = q^ex + q[pe% +...+ q^en
с матрицей ^=||^)||. Так как векторы (/} ортогональны
и нормированы, то по формулам (16) мы получаем:
п [ 0 при i ф /,
(Л.//)=-З^Мл= (22)
fc-i I 1 при i = j=rz 1, 2, . . ., п.
Всякая матрица @ = ||grjj*)||, обладающая свойствами (22),
называется ортогональной. Если взята произвольная
ортогональная матрица Q — ||^ii» т0 векторы {/],
определяемые по векторам {е} равенствами (21), ортогональны
186 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 7
и нормированы; следовательно, всякая ортогональная
матрица есть матрица перехода от одного
ортогонального и нормированного базиса к такому же.
В частности, ортогональная матрица Q всегда не
вырождена: det^^O.
Элементы q№ ортогональной матрицы Q имеют
непосредственный геометрический смысл: формула (15) § 50, в которой
положено # = /у, приводит к равенству
( -ч /Ч
?i -(//> ef) = cos(//, et).
Таким образом, числа q[}> суть косинусы углов между новыми
и старыми базисными векторами.
2. Рассмотрим линейный оператор Q, соответствующий
формулам (21); он переводит каждый вектор е% в
соответствующий вектор Д. Оператор Q обладает тем важным
свойством, что он не изменяет метрики: иными словами,
скалярное произведение векторов Qx и Qz/ таково же,
каким было скалярное произведение векторов хну.
Действительно, если x-^^^i, 2/ = 271Л> т0
(Q*. Qy)=2 ъъ (Qe- Q«>)=2*я№> />)=2 tw=(*> г/)'
i, j i, J г
поскольку (fi, fj) отлично от нуля только при i*=j и в
этом случае равно единице.
Всякий линейный оператор Q, не изменяющий
метрики пространства, т. е. удовлетворяющий условию
(Qx,Qy) = (x9 у)
для любой пары векторов пространства, называется
изометрическим оператором. Таким образом, мы показали,
что оператор перехода от одного ортогонального и
нормированного базиса гс-мерного евклидова пространства к
другому такому же базису является изометрическим.
Очевидно, что верно и обратное: всякий изометрический
оператор переводит любой ортогональный и нормированный
базис в другой такой же базис.
Задача
Некоторый линейный оператор Q сохраняет длину каждого
вектора; показать, что он является изометрическим.
§ 53] ОРТОГОНАЛЬНЫЕ МАТРИЦЫ 187
Указание. Углы треугольника однозначно определяются
по его сторонам. Другой метод: симметричная билинейная форма
(Q#> Qy) однозначно восстанавливается по квадратичной (Q#, Qx).
3. Теперь построим матрицу, обратную к данной
ортогональной матрице Q.
Разрешая систему (21) относительно векторов elf e2, •. .
..., еп, мы получаем:
ei=M1)/l + />21)/2+...+rf)/n,
e2 = P?)fi + pi2)U+...+p(n)fn,
en — Pi h~rPz h~r • • • -rPn fn-
Так как в этих формулах мы снова имеем переход от
одного ортогонального и нормированного базиса к такому
же, то числа /?(>> должны удовлетворять тем же
соотношениям (22), что и числа qW; следовательно, матрица
обратного перехода также ортогональна. Кроме того,
по формуле (15)
?1Л = (//,*), (23)
Мл = (*/,/0. (24)
откуда р№ = q(p\ таким образом, матрица, обратная к
ортогональной матраце, есть её транспонированная матрица.
Впрочем, этот факт непосредственно вытекает из
формул (22), которые в матричной форме могут быть
записаны следующим образом:
QQ' = E, (25)
откуда
<?' = ?-'•
Из формулы (25), в частности, вытекает, что
det<?.de*(?'==det2<)==l. (26)
Таким образом, определитель ортогональной матрицы
может иметь значения только ±1.
188 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 7
4. В заключение выпишем формулы преобразования
координат вектора х при переходе от ортогонального
и нормированного базиса {е} к другому такому же
базису {/). Пусть £ь £2> •••> tn —координаты вектора #
относительно базиса {е} и ril9 т]2, ..., тт — ето координаты
относительно базиса {/}. Матрица перехода от координат
[£} к координатам {т]} согласно § 35 есть матрица (А*1)',
где Л —матрица перехода от базиса [е] к базису {/}.
Так как в данном случае матрица перехода есть
ортогональная матрица Q, то Q^ — Q'] отсюда следует, что
(Q-1)' = Q. Следовательно, формулы перехода от
координат {£} к координатам {т]} пишутся с помощью той же
самой матрицы Q> что и формулы (21) перехода от базиса
{е} к базису {/}:
\ (27)
^п-^1 + дП2+...+д(пП)5п. J
Такое преобразование координат в евклидовом
пространстве называется изометрическим преобразованием.
Так как ^~1 = ^/, то формулы обратного перехода
получаются с помощью транспонированной матрицы
5i = gV)4i + ?i2)4i+..-+(/in)4n. 1
( \А>)
In - q{n\i + q(n2)ri2 + • • • + 9#V J
Задачи
1. Показать, что для каждого элемента aik ортогональной
матрицы А соответствующее алгебраическое дополнение Aih =
= aik del A.
2. Показать, что произведение двух ортогональных матриц
есть снова ортогональная матрица.
§ 53] ОРТОГОНАЛЬНЫЕ МАТРИЦЫ 189
3. Показать, что при п = 2 всякая <
определителем f 1 имеет вид
cos <p sin <р
1 —sin <p coscp I
ортогональная
'
матрица
т. е. является матрицей поворота.
4. Назовём поворотом в и-мерном евклидовом пространстве R
линейный оператор Kt (зависящий от параметра t, t^^t^t^,
удовлетворяющий следующим условиям:
1) Kf0 = E (тождественный оператор);
2) Kf(x) для каждого х непрерывно зависит от г;, иными
словами, при U ->0 | Kt, мх — KfX | -> 0 для любе го х £ Я;
3) для любых х и у и фиксированного t (t0 ^ г ^ tx) (KfX, Kty) —
= (х, у).
Оператор К = К# называется результатом поворота К#.
• Показать, что detK= -fl.
Указание. detKf есть непрерывная функция от t.
5. (Продолжение.) Если Q есть результат поворота К^
(*o^*^*i) и S есть результат поворота Kg (s0 ^ s <; ^j), то SQ
также есть результат некоторого поворота.
6. (Продолжение.) Пусть R' С R—подпространство размерности
не более чем п—2 и ж, у — единичные векторы, ортогональные
к R'. Построить поворот, переводящий # в у и оставляющий R'
неподвижным.
Указание. Построим ортогональный и нормированный
базис е19 е2, ♦.., еп так, чтобы: 1) ех = х, 2) е2 лежал в плоскости,
определяемой векторами х и у. Тогда можно взять оператор Kt
с матрицей
cos t sin t
*t =
-sm t cos t
1
1
7. (Продолжение.) Показать что всякий изометрический
оператор Q с detQ=l есть результат некоторого поворота.
Указание. Пусть е19 е2, ..., еп — ортогональный и
нормированный базис и ft = Qe,- (* = 1, 2, ..., и). Рассмотреть следующие
повороты: 1) eL ~» /х; при этом е2 перейдёт в некоторый е^\ 2) e^-+f2
при неподвижном /х; при этом е3 перейдёт в некоторое е^-
3) е^ -> /8 при неподвижных fx и /2 и т. д. Затем использовать
задачу 5.
190 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 7
8. (Продолжение.) Показать, что всякий изометрический
оператор Q с detQ= —1 есть произведение оператора поворота и
оператора отражения относительно п—1-мерной гиперплоскости.
9. Показать, что сумма квадратов всех миноров А-го порядка,
расположенных в к фиксированных строках ортогональной
матрицы, равна 1; сумма произведений всех миноров А--го порядка в
одной группе строк на соответствующие миноры А*-го порядка
другой группы строк равна 0.
Указание. Использовать задачу 2 к § 29, п. 5.
10. Оператор А, сохраняющий ортогональность любых двух
векторов х, у (так что из (х, у) = 0 вытекает (Аа:, Ау) = 0),
называется равноугольным оператором. Всякий изометрический
оператор является равноугольным. Кроме того, равноугольным
являются оператор подобия (А# — \х для любого х) и произведение
оператора подобия на изометрический оператор. Доказать, что
всякий равноугольный оператор есть произведение оператора
подобия и изометрического оператора.
Указание. Данный равноугольный оператор С преобразует
ортогональный и нормированный базис elt c2, ..., еп в
ортогональный базис f\=ajlt /3 = ^2/2, •♦., /п=ал/л, где/х, /2, ...,/„
нормированы. Пусть Q—изометрический оператор, переводящий
векторы flt /2, ..., /п в еъ <?2> •••» €п\ тогда матрица
равноугольного оператора QG диагональна. Показать, что условие а{ Ф а}-
позволяет построить пару ортогональных векторов, которые
переходят в неортогональные в результате применения оператора QC
§ 54. Связь между линейными операторами
и билинейными формами. Сопряжённый оператор
1. Пусть А —линейный оператор, действующий в
евклидовом пространстве R. Для любых двух векторов х и у
пространства R мы можем построить величину к(х, у) =
= (х,ку). Легко проверить, что эта числовая функция
от пары векторов х и у является билинейной формой.
Действительно, на основании определений линейного
оператора (§ 26) и скалярного произведения (§ 48) имеют
место равенства
А (хг + хъ у) = (хг + х2у Ау) = (яь Ау) + (х2, ку) =
= A(zb y) + k(x2, у);
к (ах, у) = (our, ку) = а (я, ку) = аА (х, у);
к(х,у1 + у2)^=(х)к(уг + у2)) = (х, кух + Ау2) =
= {х,куг)+{х, ky2) = k(xfy1) + k(xJy2);
А (ж, ау) = (х, А (ау)) = (х, аку) = а (х, = Ау)ак (х, у),
§ 54] ЛИНЕЙНЫЕ ОПЕРАТОРЫ И БИЛИНЕЙНЫЕ ФОРМЫ 191
которые в совокупности и показывают, что А(х, у) есть
билинейная форма.
Предположим теперь, что R — я-мерное евклидово
пространство и пусть А — || аФ \\ есть матрица оператора А
в некотором ортогональном и нормированном базисе
{е} = {еъе2, ---,еп}. Построим в этом же базисе матрицу
нашей билинейной формы А (х> у). Элемент ац этой
матрицы согласно § 40, п. 2 должен быть определён по
формуле
aij = A(ei9 е/Н(еь Аеу).
Но согласно § 27
п
Aej = 2 «fc V
Поэтому
п
Таким образом, матрица оператора А в базисе {е}
совпадает с матрицей формы (х, Ау) в этом же базисе.
Пусть, обратно, в п-мерном евклидовом пространстве R
задана билинейная форма А (х} у); мы утверждаем, что
существует линейный оператор А, для которого выпол-
няется равенство
А (ж, y) = (x,Ay)t
каковы бы ни были векторы х и у из R. Для
доказательства выберем в пространстве R ортогональный и
нормированный базис еь е2, ..., еп и построим линейный
оператор А, матрица которого в этом базисе совпадала бы
с матрицей билинейной формы А (ж, у) в этом же базисе.
Построим затем билинейную форму (х, Ау); по
доказанному её матрица в базисе {е} совпадает с матрицей
оператора А и, следовательно, с матрицей формы А(х, у).
Но тогда для любых х и у значения обеих этих форм
совпадают:
А (я, у) = (х, Ау),
что и требовалось.
192 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 7
Мы не случайно сформулировали и доказали это предложение
для конечномерного евклидова пространства; в бесконечномерном
евклидовом пространстве оно, вообще говоря, уже становится
неверным, и мы отложим рассмотрение этого вопроса до § 102.
В аффинном n-мерном пространстве уже нельзя сопоставить
билинейную форму и линейный оператор на том основании, что
они в некотором базисе имеют одну и ту же матрицу А. В самом
деле, при переходе к новому базису с матрицей перехода С
матрица билинейной формы преобразуется в матрицу С'АС (§ 40,
п. 4), а матрица линейного оператора —в матрицу С'1 АС (§ 38);
при этом результаты, вообще говоря, будут различными. В
евклидовом пространстве переход от одного ортогонального и
нормированного базиса к другому осуществляется с помощью
ортогональной матрицы С; для ортогональной матрицы С =С~1 (§ 53)
и, следовательно, результаты преобразования матрицы билинейной
формы и матрицы оператора будут одинаковыми.
2. В д-мерном евклидовом пространстве R с данной
билинейной формой А(х, у) можно связать ещё один
линейный оператор А*; он определяется из условия
А(х9у) = (А*х,у), (29)
которое должно иметь место для любой пары векторов
х, у £ R. Покажем, что оператор А*, удовлетворяющий
этому условию, существует. Пусть el9 e2, ...,
еп—некоторый ортогональный и нормированный базис пространства Д.
Положим A*ei = 2a/(l>e/» гДе числа а){1) подлежат
определению. Полагая в (29) х = в{, у — е}, находим:
А(еи е/) = аг/ = (А*еь <?>)«= а;*(1).
Итак, число а*(г) найдено; оно определяется
единственным образом. Оператор А*, имеющий в базисе еь е2, .. ., еп
матрицу ||aj(l)||, удовлетворяет равенству (29) при х = в{9
у = ej\ но, поскольку две билинейные формы, совпадающие
на базисных векторах, совпадают тождественно,
равенство (29) удовлетворяется для всех пар х9 у.
Матрица ||а*(г)||, очевидно, транспонирована с
матрицей формы А(х9 у).
Построение можно начинать не с формы А(х, у),
а с оператора А. В этом случае мы приходим к
следующему результату.
§ 54] ЛИНЕЙНЫЕ ОПЕРАТОРЫ И БИЛИНЕЙНЫЕ ФОРМЫ 193
Теорема 29. Каждому линейному оператору А,
действующему в n-мерном евклидовом пространстве Rt
можно однозначно сопоставить оператор А*, действующий
в том dice пространстве и удовлетворяющий соотношению
(А*х, у) = (х, Ау)
для любых векторов х и у. Матрица оператора А*
транспонирована относительно матрицы оператора А
в любом ортогональном нормированном базисе
пространства R.
Оператор А* называется сопряжённым к оператору А.
В частности, если А* = А, оператор А называется
самосопряжённым. Иными словами, оператор А самосопряжён,
если соответствующая оператору А билинейная форма
(ху Ау) симметрична:
(Ах,у) = (х,Ау). (30)
Оператор А, удовлетворяющий уравнению (30) для любыз£
двух векторов х и у, называют поэтому также
симметричным.
Равенство (30) может служить определением caMQconge-;
жённого оператора и в бесконечномерном пространстве,
когда у нас нет способа для построения сопряжённого
оператора.
В силу теоремы 29 матрица симметричного оператора
в любом ортогональном и нормированном базисе совпадает
со своей транспонированной матрицей, иными словами,
есть симметричная матрица. И обратно, каждый
оператор А, имеющий в некотором ортогональном и
нормированном базисе симметричную матрицу, является
симметричным оператором.
Задачи
1. Доказать формулы
(А*)*-А,
(А + В)* = А* + В*,
(ХА)* = ХА*,
(АВ)* = В*А*.
2. В я-меряом аффинном пространстве R заданы два оператора
А и В. Известно, что в некотором базисе матрицы этих
операторов транспонированы друг к другу. Будет ли это свойство
сохранено в любом другом базисе?
Отв. Нет.
13 г
Б. Шилов
194 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 7
3. Для следующих типов операторов найти сопряжённые:
a) Оператор А в n-мерном пространстве переводит каждый
вектор е% ортогонального нормированного базиса в Х$е$, где Х^ —
некоторое число (* = 1, 2, ..., п).
b) Изометрический оператор Q.
Отв. А* = А, Q* = Q-i.
4. Показать, что операторы Ai = A*A, А2 = АА*, А8 = А-ЬА*
самосопряжены, каков бы ни был оператор А. Будет ли
самосопряжённым оператор А4=А—А*, если А Ф А*?
Отв. Нет, так как AJ = — А4.
5. Назовём величину
[А]= sup \A(x,y)\
нормой билинейной формы А (х, у). Доказать, что если оператор А
соответствует билинейной форме А (ж, у), то || А|| = [А].
6. Показать, что операторы А и А* имеют одинаковую норму.
7. Показать, что если #0—«максимальный вектор для опера-
тора А, то . Ах0 есть максимальный вектор для оператора А*.
II А II
8. Если N(A) и Т(А)—нуль-многообразие и область значении
оператора А, то ортогональные дополнения этих подпространств
суть соответственно область значений и нуль-многообразие опера*
тора А**
9. Пусть ЯГ есть левый идеал в алгебре fR всех линейных
операторов в евклидовом пространстве R (см. § 33). Показать, что
совокупность SR" всех операторов, сопряжённых к • операторам,
входящим в ЯГ, есть правый идеал этой алгебры.
10. Введя в линейное пространство R метрику, получить
вторую половину теоремы 25 из первой её половины.
Указание. Использовать результаты задач 8 и 9.
ГЛАВА S
ОРТОГОНАЛИЗАЦИЯ И ИЗМЕРЕНИЕ ОБЪЁМОВ
Мы уже видели в предыдущей главе, что
ортогональная система координат (т. е. система координат,
определяемая ортогональным и нормированным базисом) в
евклидовом я-мерном пространстве является весьма удобной для
решения задач метрического характера.
Эта глава посвящена изложению методов эффективного
построения ортогональных векторных систем в евклидовом
пространстве и тех новых геометрических фактов, которые
обнаруживаются в пространстве с помощью построения
таких систем.
§ 55. Задача о перпендикуляре
1. Рассмотрим в евклидовом пространстве R некоторое
подпространство R' и вектор /, вообще говоря, не
входящий в подпространство R'. Поставим задачу найти
разложение
f = 8 + h, (1)
где вектор g принадлежит подпространству R\ а вектор h
ортогонален к этому подпространству. Вектор g,
участвующий в разложении (1), называется проекцией вектора f
на подпространство Rf, а вектор h —перпендикуляром,
опущенным из конца вектора f на подпространство R'.
Такие названия связаны с привычными нам
геометрическими ассоциациями*)»
*) И предназначены только для того, чтобы вызывать такие
ассоциации. Поскольку понятие «конец вектора» не фигурирует
в нашей аксиоматике, не следует искать в этом названии
логического смысла.
13*
196 ОРТОГОНАЛЙЗАЦИЯ И ИЗМЕРЕНИЕ ОБЪЁМОВ [ГЛ. 8
Мы будем сейчас фактически строить разложение (1)
в предположении, что подпространство R' конечномерно,
например А-мерно. Выберем в подпространстве R
ортогональный и нормированный базис е1у е2, ..., еь и будем
искать вектор g в виде
g = а1ег + а2е2 + .. . + Wb, (2)
где числа аь а2, . .., а& подлежат определению. Вектор
A = / — g должен быть ортогонален к подпространству R'\
необходимым и достаточным условием этой
ортогональности является выполнение равенств
(А,в4) = (/-в>вО = 0 (i = l, 2, ..., к). (3)
Подставляя выражение вектора g из (2) в (3), находим:
(/ — g, ei) = (/-a1e1 —aae2— . ..— <xkeky et) =
= (/> ^i) — ai (ei> ei) = (/> ei) — ai >
так как векторы elf e2, ..., еъ, по предположению,
ортогональны и нормированы. Поэтому вектор h будет
ортогонален к подпространству R' тогда и только тогда,
когда выполняются равенства
«i = (/,ei) (* = 1, 2, ..>, *).
Коэффициенты сц в разложении (2), таким образом,
найдены, и существование, а одновременно и
единственность разложения (1) установлены пока ещё для того
случая, когда подпространство R' конечномерно. Рассмотрение
общего случая мы откладываем до § 100.
2. Применяя к разложению (1) теорему Пифагора,
получаем:
\1\* = \g? + \h\\ (4)
откуда вытекает, что справедливо неравенство
0<|А|<|/|, • (5).
геометрически выражающее тот факт, что длина
перпендикуляра не превосходит длины наклонной.
Отметим те случаи, когда в неравенстве (5) имеет
место знак равенства. Условие 0 =■ | h | равносильно
условию / = § + 0, которое означает, что / входит в подпро-
§ 55] ЗАДАЧА 0 ПЕРПЕНДИКУЛЯРЕ 197
странство R'. Условие |й| = |/|, применённое к
равенству (4), показывает, что g = v и, следовательно,
/-0 + Л;
таким образом, / ортогонален к подпространству R'. Итак,
равенство \ h | = 0 означает, что вектор f входит в
подпространство R'; равенство |й| = |/| означает, что
вектор / ортогонален к этому подпространству. При всяком
ином расположении вектора / длина вектора h будет
положительной величиной, меньшей, чем длина вектора /.
3. В приложениях требуется иногда дать эффективное
решение задачи о перпендикуляре, когда в
подпространстве R' дан некоторый (вообще говоря, неортогональный
и ненормированный) базис {Ьъ 62> •••> bk} = {b).
Чтобы получить это решение, разложим искомый
вектор по базису {Ь}
и подчиним вектор h = f--g условию ортогональности со
всеми векторами Ьъ Ь2, ..., bk- Мы получим следующую
систему уравнений:
(h,b1) = (f-g,b1) =
«=(/.&i)-Pi(bi.*i)-fc(b.fti)-
(h,h) = (f-g,b%) =
= {ftbt)--h(bi,bt)-^(bn,bt)-
-%(bk,h) = 0,
-Pfc(&k,ft») = 0.'
(h,bk) = (f-g,bh) =
= (/, h) - pi (bt, h) - h (h, bk)-...- h(bk, h) = 0.
Возможность решения этой системы зависит от величины
определителя
(buh) (b*,h) ... (bk,h)
(bi, h) {b2, bi) ... (bk, h)
Z> =
(blt bk) (b%, bk) ... {bh, bh)
198 ОРТОГОНАЛИЗАЦИЯ И ИЗМЕРЕНИЕ ОБЪЁМОВ [ГЛ. 8
Мы покажем в дальнейшем (§ 57), что этот определитель
в рассматриваемом случае (когда векторы Ъъ Ь2} ..., bk
линейно независимы) заведомо отличен от нуля. Таким
образом, коэффициенты plf ра> • • •» % можно определить
однозначно и тем самым получить решение интересующей
нас задачи.
Задачи
1. В пространстве Т4 разложить вектор / на сумму двух
векторов, один из которых лежит в подпространстве L [bl9 &2], а
другой ортогонален к этому подпространству:
(а) /=(5,2,-2,2), ^ = (2,1,1,-1), &2 = (1, 1, 3, 0);
(б) / = (-3,5,9,3), ^ = (1,1,1,1), &2 = (2, -1, 1, 1),
&3 = (2, —7, —1, —1).
Отв. (а) £=(3, 1, -1, -2), Л = (2, 1, -1, 4),
(б) £ = (1,7,3,3), А = (-4, -2,6,0).
2. Доказать, что из всех векторов подпространства R'
наименьший угол с вектором / образует вектор g.
§ 56. Общая теорема ортогонализации
1. Для построения ортогональных систем в евклидовом
пространстве основное значение имеет следующая общая
теорема:
Теорема 30. (Теорема ортогонализации.)
Пусть xlt х2, ...,%,... -—некоторая последовательность
векторов евклидова пространства R {конечная или
бесконечная). Обозначим через Ьи = Ь(хъ х2> ..., хъ) линейную
оболочку первых к векторов этой системы. Утверждается,
что существует система векторов ylt у2, ..., у к, • • • >
обладающая следующими свойствами:
1) Для любого натурального к линейная
оболочка Ь'ъ векторов у1у у2у ..., yk совпадает с
подпространством Lft.
2) Для любого натурального к вектор уъ+\
ортогонален к подпространству £&.
Доказательство. Положим уг = ж1# Очевидно, что
при этом выполнено условие L'x = Ьг. Далее будем доказывать
теорему по индукции: предположим, что построены уже к
векторов yl9 у2, ..., уkf удовлетворяющих поставленным
§ 56] ОБЩАЯ ТЕОРЕМА ОРТОГОНАЛИЗАЦИИ 199
условиям, и построим вектор ук+i так, чтобы он также
обладал требуемыми свойствами.
Подпространство Lh конечномерно и поэтому в силу
§ 54 существует разложение
Sk+l=£k + Aki (6)
где вектор gk входит в подпространство Lk, а вектор hk
ортогонален к этому подпространству. Мы положим yk+i = й£.
Проверим выполнение условий теоремы ортогонализации
для определённого таким образом вектора г/ь-ц.
Подпространство Lky по предположению индукции,
содержит векторы Уи у*9 • •., Ук\ поэтому и более широкое
подпространство Lk+i содержит эти векторы; кроме того,
из формулы (6) вытекает, что L^i. содержит вектор
hk = yk+i' Таким образом, подпространство L&+1 содержит
все векторы уи ..., уь+ь а вместе с ними и всю их
линейную оболочку L£+i. Но и обратно, подпространство ££+1
содержит векторы хх, х2> .. -, Xh и, как показывает
равенство (6), содержит и вектор аъ+i; отсюда вытекает, что
Lfe^i содержит всё подпространство Lfe+i. Следовательно,
Li+i = Lft+i, и первое условие теоремы ортогонализации
выполнено. Выполнение же второго условия очевидно по
самому построению вектора уь+\~Ь,ъ..
Индукция, таким образом, оправдана, и тем самым
теорема полностью доказана.
2. Неравенство (5) в данном случае принимает вид
0<|yk+1|<|sfc+i|. (7)
При этом, как показано в § 55, п. 2, равенство 0= [y*+i |
означает, что вектор Хк+\ принадлежит к
подпространству Ьъ и, следовательно, связан линейной зависимостью
с векторами xl9 x2t ...,жк. Противоположное равенство
| yk+i | = | Xk+\ | означает, что вектор xu+i ортогонален
к подпространству £&, и, следовательно, ортогонален
к каждому из векторов хъ х2, ..., Хк.
3. Замечание. Всякая система векторов zlt z2, ...
..., Zk, ..., удовлетворяющая условиям теоремы орггш-
вокализации, совпадает с точностью до числовых
множителей с системой yl9 у2, ..., у к* • • •* построенной при
доказательстве этой теоремы. Действительно, вектор za+t
200 ОРТОГОНАЛИЗАЦИЯ И ИЗМЕРЕНИЕ ОБЪЁМОВ 1ГЛ. 8
должен принадлежать к подпространству Lk+\ и при этом
должен быть ортогонален к подпространству Ьк. Первое
из этих условий приводит к существованию разложения
. *м 1 — Сгуг + С2Уъ + ... + Скук + Скл iyfc+1 ■= ук + Ск+{укл ь
где yk = Сц/i + . . . + Ckyk g Lk, a Cfe+i2/fe+i ортогонален
к Lu. Второе условие в силу § 55, п. 2 приводит к
утверждению, что ун-0 и, следовательно,
что и требуется.
Задачи
1. В пространстве 78 задана система векторов xL=i, #2 = 2f,
#з=гЗ#, s4=4i —2^, ж5= —i + lQ/, жв = i +J + 5Ar. Построить
векторы 2/х, г/а, -.., У«.
-. Ome. 2/! = i, 2/2 = 2/з = 0, 2/4=—2/, y& = 0, У6 = Бк.
2. Построить в трёхмерном подпространстве пространства Т4,
порождённом векторами (1, 2, 1, 3), (4, 1, 1, 1), (3, 1, 1, 0),
ортогональный базис, используя метод теоремы ортогонализации.
Отв. (1, 2, 1, 3); (10, —1, 1, —3); (19, —87, —61, 72).
3. Как было указано в § 50, всякий ортогональный базис
в л-мерном пространстве Rn есть канонический базис для
билинейной формы (#, у). Пусть xlt я8, ...,ял — произвольный базис
пространства Нц. Исходя из этого базиса, построить канонический
базис для билинейной формы (#, у) по методу Якоби (§ 45) и
показать, что он совпадает с базисом, полученным процессом
ортогонализации.
Указание. Использовать § 55, п. 3.
4. В евклидовом пространстве Rn заданы конечные множества
7^= [хи х2, ..., xk) и G = {ylf 2/2> .. •> 2/feb Для того чтобы
существовал изометрический оператор Q, переводящий одновременно
каждый вектор х^ в соответствующий вектор yt (i = 1, 2, ..., к),
необходимо и достаточно, чтобы имели место равенства
(xh xj)^(yv yj) (i, /=1, 2, ..., к).
Указание. Применив к данным системам процесс
ортогонализации, получить ортогональные и нормированные системы
еи ё2, ... и /lf Д, ... Используя § 55, п. 3, показать, что векторы
xlt #2, ... выражаются через еи е2, ... по таким же формулам,
по каким векторы у1У у2, ... выражаются через /lf /2, *..
Оператор Q задать путём отображения системы е19 е2у ... на систему
/it h> • • •
5. Углы между двумя подпространствами.
В евклидовом пространстве R заданы два подпространства PJ и R".
Цусть нормированный вектор е' пробегает единичную сферу подг
§57]
МНОГОЧЛЕНЫ ЛЕЖАНДРА
201
пространства R', а нормированный вектор с" независимо от е'
пробегает единичную сферу подпространства R"'. Угол между е'
и е" на некоторой паре е, = е[, е" — е'[ достигает минимума,
который мы обозначим через <рх. Пусть, далее, е' меняется по своей
единичной сфере, оставаясь ортогональным к е[, и е" меняется
по своей единичной сфере, оставаясь ортогональным к е*. Угол
между е' же" при этих условиях достигнет минимума <f2^<Pi
на некоторой паре е' = е£, е"' = ej. Пусть, далее, е' меняется по
своей единичной сфере, оставаясь ортогональным к е[ и <?£, и е"
меняется по своей единичной сфере, оставаясь ортогональным
к el и е\\ мы получим новый минимум угла 9в^?2 и новую
паРУ еъ и ез- Продолжая этот процесс далее, мы получим
некоторую совокупность углов <рх, ср2, ..., yk, число которых
равно наибольшей из размерностей подпространств R' и R".
Углы fi> ?2» •••» ?& называются углами между подпространствами
R' и R". Показать, что углы <рх, ^>2, •••» 9k определяют
подпространства R' и R" с точностью до положения в пространстве',
точнее говоря, если имеются две пары подпространств R*', R"
и S', S" и углы между подпространствами Я', R" такие же,
какие между подпространствами S', S", то существует
изометрический оператор, переводящий одновременно S' в R* и S" в R".
Указание. Рассмотреть конечные системы е[, е\, e'v
е\, ..., e'h% е£ и f'v fx, /£, /J, ..., /£, /£, полученные при
определении углов между подпространствами Rf и R" и
подпространствами S' и S". Согласно построению (е[, е?) = (/£, /?)=со8<р{
(i = l, 2, ..., *), (el ep = (f'if /р = 0, (е{9 e/) = (/f, //) = 0 (*=£/);
далее показать, что (е£, е?) = (/.', /J) = 0 (используя задачу 2
к § 55). Затем применить результат задачи 4.
§ 57. Многочлены Лежандра
Рассмотрим в евклидовом пространстве С2(— 1, +1) систему
функций х0 (£)= 1, «л (f) = t,..., icft(0 = ^ft,... и применим к ней
теорему ортогонализации. Подпространство Lk — L(l, t, ..., t ) в
данном случае, очевидно, совпадает с совокупностью всех
многочленов степени <; к. Функция xk (t) при любом к линейно независима
от предыдущих функций (см. § 12), поэтому функции у0 (0» Vi (')» •••»
получаемые путём ортогонализации, все отличны от нуля в силу
§ 55, н. 2. По самому построению функция yk (t) должна быть
многочленом к-й степени от г. В частности, непосредственное
вычисление по методу теоремы ортогонализации даёт:
Уо(0 = 4» 2/i(0 = '> 2/2(0 = г2-|"» Уз(0 = *3-у' И т-Д-
Эти многочлены были введены в математику в 1785 г. французским
математиком Лежандром в связи с задачами теории потенциала.
202 ортогонализация и измерение объёмов: [гл7"5
Но только через тридцать лет, в 1814 г., общая формула для
многочленов Лежандра была найдена Родригом. Именно, оказалось,
что многочлен yn(t)'c точностью до числового множителя равен
многочлену
dn
/М*) = -^н-[(*2-1)п] (« = 0, 1, 2, ...). (8)
Мы воспользуемся для доказательства этого предложения
замечанием § 56, п. 3. Именно, мы покажем, что многочлен />п(0
удовлетворяет условиям теоремы ортогонализации; в силу
указанного замечания мы будем для каждого п иметь равенство
pn(t) = Cnyn(t), что нам и нужно.
1. Линейная оболочка векторов р0 (t), Pi(t) pn (t) совпадает
с совокупностью всех многочленов до п-й степени, В самом деле,
в силу формулы (8) многочлен pk(t) есть, очевидно, многочлен
точно &-й степени от t; в частности,
/>о(0 = аои> I
Pi(t) = a10-\-ant, I
Р<Ь (0 = «20 + ^21* + Я22'2>
**('> = «*<> +«м'+•••+*****» I
причём старшие коэффициенты а00у аП) ..., апп отличны от нуля-
Таким образом, все многочлены р0 (t), pxit), ..., рп (t) входят
в линейную оболочку функций 1, £, ..., tn, которая, очевидно, есть
совокупность Ln всех многочленов от t не выше п-и степени. Так
как матрица «линейных соотношений (9) имеет определитель
ЯооЯц • • • a™, отличный от нуля, то и обратно, функции 1, t, t2, ..., tn
могут быть линейно выражены через р0 (t), Pi(t), ..., рп (t); поэтому
линейная оболочка L [p0 (t), px (t), ..., рп (t)] совпадает с линейной
оболочкой 1,(1, tt t2, ..., tn) и, следовательно, совпадает с
совокупностью Lnt что и требовалось.
2. Вектор pn{t) ортогонален к подпространству Z/n_j.
Достаточно проверить, что многочлен pn(t) ортогонален в Са(— 1, 1)
к функциям 1, t, ..., tn_1.
Чтобы установить этот результат, докажем предварительно
лемму:
Лемма об и-к ратном корне. Допустим, что
некоторая функция f{t) может быть представлена в форме
/(0 = (*-«#)п*(0.
(10)
§ 57] МНОГОЧЛЕНЫ ЛЕЖАНДРА 203
еде 9 (*о) =£ 0 (в 'этом случае говорят, что функция / (t) имеет при
£=г0 л-кратный корень). В предположении, что f (t) и <р(*) имеют
п непрерывных производных, утверждается, что имеют место
соотношения
/(*о)=0, /'('о) = 0, ..., /<"-*>(*0) = 0, /(п)(*0)*0.
Доказательство. Дифференцируя формулу (10),
получаем:
г (о=п е-'о)^1 ? (о + е-*о)п *' (0=
=(*-<o)n"1[«?(0 + U-«o)?'(0] = («-«e)n"1?i(<).
где cpi(0 = wf (0 + (* — *о)?'(0; #в частности, у, (г0) = ncp (r0) =£ 0.
Аналогично получаем:
/* (0= (*-*о)п~2 <?2 (0. где срг («в) Ф 0;
/п-1)(0 = («-*о)Тп-1 О» г«е *n-l Uo)^Of
/п)(0= МО. где 9п(«о)^0.
Подставляя во все эти выражения t = t0, приходим к нужному
результату.
В частности, функция (t2—i)n = (*—l)n(t+ l)n имеет л-крат-
ные корни в точках t— ± 1; поэтому при £=±1 величина
[О2— l)n](fe) обращается в 0 при к < п и становится отличной от
нуля при к=п.
Теперь мы покажем, что функция рп (t) = [(t2— 1)п]<п)
ортогональна к функциям 1, *,..., tn~i.
Для доказательства вычислим скалярное произведение tk
и рп (t) при к < п. Интегрируя по частям, мы получаем:
+1
(*\Рп(*))=\ «*[(«•-1)п](п)Л =
+ 1 +1
-1 -1
Внеинтегральный член полученного выражения по лемме об
и-кратном корне обращается в нуль. Оставшийся интеграл снова
берём по частям и продолжаем этот процесс, пока показатель
204 ОРТОГОНАЛИЗАЦИЯ И ИЗМЕРЕНИЕ ОБЪЁМОВ [ГЛ. 8
при t не снизится до нуля:
+ 1
(«*. ^п (*))= -А'*"1 [(*» —l)nJ<n"2)
+ 1
+
-1
+ к (к -1) \ tk~2 [(г2- l)n](.n-2> dt =. . .
-1
+ 1
..= ±к\ { [(*2-l)n](n-ft)tft = ± *
с точностью до числового множителя совпадает с многочленом
pn(t)~ [(*2- 1)п]<п>.
Вычислим значение рп (1). Для этого применим к
функции (t2 — l)n=(t+ l)n (г — 1)п формулу Лейбница л-кратного
дифференцирования произведения:
[(*+l)n(*-l)n](n>==
-(^+l)n№-l)n](n) + ^[(^ + i)n]4(^l)n](n"1) + .-.=
= (^ + 1)ппЦ-С>(г-1)п-1л(п^1)...2(^1)-Ь...
При подстановке t = l все члены этой суммы, начиная со
второго, обращаются в нуль. Мы получаем, следовательно,
Яп(1)=»2»п!
Для вычислительных целей удобнее иметь значения наших
ортогональных функций равными 1 при t = l. Чтобы достичь
этого, мы должны ввести числовой множитель ^—т. Именно,
полученные после этого многочлены и называются многочленами
Лежандра; многочлен Лежандра степени п обозначается символом
Pn(t)> так что
Задачи
1. Найти старший коэффициент Ап многочлена Лежандра
Рп (*)•
п л _ (2пУ
итв. Ап-щщ1 .
2. Показать, что Рп (t) есть чётная функция при чётном п и
нечётная функция при нечётном п. Найти, в частности, Рц(-1).
Отв. Рл(-1)=(-1)п.
§ 58] ОПРЕДЕЛИТЕЛЬ ГРАМА 205
3. Доказать, что в разложении многочлена tPn_x (t) по
многочленам Лежандра
*Л|-1(0в«Л(0 + *Л(0+ ••• +апРп(*)
коэффициенты а0, alf ... , an_z и ап_х равны нулю.
Указание. Записать искомые коэффициенты через
скалярные произведения.
4. Разложить по многочленам Лешандра многочлен (л — 1)-й
степени
Q (t) = Л1-1 Рп (*) - tAn Pn-i (0
(числа Ап определены, как в задаче 1), Подставив значения Ап
и положив затем f = l, получить рекуррентную формулу
Рп(«)-(4л-2)«Рп-1(0 + 4(л-1)«Рп.1(<) = 0.
5. Найти многочлен Q (t) = tn + brf*1"1 + ... + &n-i* + &n* для
которого интеграл
+1
-i
достигает наименьшего значения.
Указание. Разложить Q(t) по многочленам Лежандра.
Отв. Q(t)=-Lpn(t).
6. Доказать, что многочлен Qn(t) = Pn*i (0—Pn-i (0 с
точностью до численного множителя совпадает с многочленом
Лежандра Рп(*)> и найти множитель.
Указание. Воспользоваться замечанием § 56, п. 3 и
результатом задачи 1.
Отв. Qn (t) = (2л — 1) Рп (t).
7. Найти норму многочлена Лежандра Pn(t)-
Оте. UiVOll^-^.
§ 5& Определитель Грама
Определителем Грама называется определитель вида
G(xx, х2, . . . , хк) =
(хъ хх) (хг, х2) • • • («1, аъ)
(я2, Хх) (ж2, х2) • • • (х2, xfe)
(з*, #1) (я*, s2) • • • (#ft, ^)
206 ОРТОГОНАЛИЗАЦИЯ И ИЗМЕРЕНИЕ ОБЪЁМОВ [ГЛ. В
где хи х2, ... , Xk — произвольные векторы евклидова
пространства R.
Для вычисления этого определителя применим к
векторам xl9 х2> ... , хи процесс ортогонализации. Пусть,
например, yi = xx и вектор j/2 = ai2/i + #2 ортогонален
к уг. Заменим на всех местах определителя вектор
хг на уг. Далее умножим первый столбец определителя
Грама на ах (отнеся ах ко второму множителю
скалярных произведений) и прибавим ко второму столбцу. Затем
умножим первую строку определителя на ах (отнеся ах
к первому множителю скалярных произведений) и
прибавим ко второй строке. В результате на всех тех местах
определителя, где был вектор х2> будет находиться
вектор у2.
Далее, пусть у3 = р^ + $2у2 + х3 ортогонален ц уг
и 2/2; умножим первый столбец на {Зь второй —на ра
и результат прибавим к третьему столбцу; ту же
операцию произведём со строками. В результате х3 на всех
местах будет заменён на у3. Мы можем продолжать этот
процесс далее, пока не дойдём до последнего столбца.
Так как наши операции не изменяют величины
определителя, то в результате мы получим:
G(xlt x2,
3ft) =
{Уъ Уг) °
0 (tftt Уг)
0
0
(Ук, Ук)
0 0
= (Уи У±) (2/2, У%) • . • (Ун, Ук)- (И)
В силу результата § 56, п. 2 мы получаем следующее
неравенство:
0 <G(alf x2i ... , xh) < {xlf хг) (х2у х2) ... (xfe, xk). (12)
Выясним, в каких случаях величина G(xlf я2, ... , #ь)
может принимать крайние значения 0 или (хг, хг) (х2> х2)....
.. .(xky хк). Из выражения определителя Грама (11)
вытекает, что он равен нулю в том и только в том случае, когда
один из векторов г/ь у2, ... , yk равен нулю. Но в силу
§ 59] ОБЪЁМ Jfc-МЕРНОГО ГИПЕРПАРАЛЛЕЛЕПИПЕДА 207
§ 56, п. 2 это эквивалентно линейной зависимости векторов
#ъ хъ • • • > #ь- С другой стороны, равенство
определителя Грама правой части неравенства (12) возможно
в силу формулы (11) и § 56, п. 2 только в том случае,
когда векторы хъ х2, ... , хь. взаимно ортогональны.
Итак, мы доказали следующую теорему:
Теорема 31. (Теорема об определителе
Грама.) Определитель Грама векторов хг, х2,— , ж*
равен нулю, если эти векторы линейно зависимы, и поло-
жителей, если они линейно независимы] он равен
произведению квадратов длин векторов х1у х2, ... , хь, если
они взаимно ортогональны, в противном случае он меньше
этой величины.
§ 59. Объём /с-мерного гиперпараллелепипеда
Площадь параллелограмма, как известно из
планиметрии, равна произведению его основания на высоту. Если
параллелограмм построен на двух векторах хх, х2, то можно
принять за основание длину вектора xlf за высоту —
длину перпендикуляра, опущенного из конца вектора х2
на ось вектора хг.
Аналогично объём параллелепипеда, построенного на
векторах хг, х2, х3, также равен произведению площади
основания на высоту; площадь основания есть площадь
параллелограмма, построенного на векторах xlf x2t а
высота есть длина перпендикуляра, опущенного из конца
вектора х3 на плоскость векторов хъ х2.
Эти соображения делают естественным следующее
индуктивное определение объёма А-мерного
гиперпараллелепипеда в евклидовом пространстве.
Пусть дана система векторов xl9 х2, ... , х% в
евклидовом пространстве R. Обозначим через А у перпендикуляр,
опущенный из конца вектора Xj±\ на подпространство
Ь(хг, x2t ... , Xj) (/ = 1, 2, ... , /с —1). Введём, далее,
следующие обозначения:
fi — l^il (одномерный объём —длина вектора хг),
V2 = Vx • | hx I (двумерный объём — площадь
параллелограмма, построенного на векторах хи х2)9
208
ОРТОГОНАЛИЗАЦИЯ И ИЗМЕРЕНИЕ ОБЪЁМОВ [ГЛ. 8
V3 = V2 • 1 h21 (трёхмерный объём — объём
параллелепипеда, построенного на векторах xlt х2у х3)\
Vk = Vk-i • | Aft_i | (^-мерный объём — объём
гиперпараллелепипеда, построенного на векторах хъ
Х2, • • • > %k)>
Очевидно, что объём Vfc может быть вычислен по формуле
Vh = V[xu х2, ..., &fe] = |*il • |Ai| ... | bfe_i|^
Используя формулу (И) § 58, мы можем выразить
величину Vk через векторы хи х2у ... , #&:
(жь хг) (xlf х2) • • • (яь ifc)
(^2> #l) (#2> #2/ ' * * \XZ) xk)
(xk, xx) (xkf x2) • • • (ж*, ж*)
Таким образом, определитель Грама от к векторов
xlf х2, ... , Xk равен квадрату объёма к-мерного гипер*
параллелепипеда у построенного на этих векторах.
Пусть $) суть координаты • вектора Xj относительно
ортогонального и нормированного базиса el9 е2, ... , еп
(/ = 1, 2, ... , к, i =5 1, 2, ... , /г). Выражая скалярные
произведения векторов через координаты, мы получим
следующую формулу:
vl=
«W+W+.
I ?(l)t(i)
• • т vl in ...
• • т^ ?n Sn • • •
Г t(2) t(ft)
• • • #> I^W + ..".:. +'#»#»
I ь§] Объём кмёрйого гйпёмараллеяёпийёда 209
Будем, далее, рассуждать подобно тому, как мы
рассуждали в § 29, п. 5. Каждый столбец полученного
определителя является суммой п «элементарных» столбцов
с элементами вида ^^[л\ причём в каждом
«элементарном» столбце а и t фиксированы, а / изменяется от 1 до л»
Поэтому весь определитель равен сумме nk
«элементарных» определителей, составленных только из
«элементарных» столбцов. В каждом из «элементарных» столбцов
множитель Йв) постоянен, и поэтому его можно вынести за
знак «элементарного» определителя. После этого каждый
из «элементарных» определителей принимает следующий вид:
t(l) t(2)
4
t(D c(l)
t(2) t(2)
ni Ч2
t(0
t(2)
4
ё
:(fe)
(13)
где ilf i2, ... , ik — некоторые числа от 1 дол. Если
среди этих чисел есть одинаковые, то соответствующий
«элементарный» определитель, очевидно, равен нулю. Таким
образом, мы должны рассмотреть лишь такие случаи,
когда ii, &"2, . • • , ik все различны. Выделим в общей сумме
те слагаемые вида (13), у которых группы iu i2, ... , ik
имеют одинаковый состав и отличаются лишь порядком.
Сумму всех таких слагаемых обозначим через
M*[jlf /2, ... , Д],
где /и /2» • • • > /ft СУТЬ переставленные в порядке
возрастания числа il9 i2, ... , ik- Рассуждение, полностью
аналогичное рассуждению § 29, п. 5, приводит нас к
следующему результату: М2 [Д, /2, ... , /*] равняется
квадрату минора матрицы из координат i[j) (/=1, 2, ...
. . . , к, i = 1, 2, ... , /г), построенного на столбцах этой
матрицЫу имеющих номера jly /2, ... , Д. Общая же
сумма всех слагаемых (13) получается равной сумме
квадратов всех миноров &-го порядка матрицы || ^;) ||.
14 г. Е. Шилов
210 ОРТОГОНАЛЙЗАЦЙЙ И ИЗМЕРЕНИЕ ОБЪЁМОВ [ГЛ.' 8
Итак, квадрат объёма &-мерного
гиперпараллелепипеда, построенного на векторах Xj (/ = 1, 2, ... , А),
равен сумме квадратов всех миноров к-го порядка в
матрице из координат векторов Xj относительно (любого)
ортогонального и нормированного базиса elf е2, ... , еп.
В случае к = п матрица || $Р \\ имеет только один
минор Л-го порядка, равный определителю матрицы ||$л||.
Поэтому объём n-мерного гиперпараллелепипеда,
построенного на векторах xlt x%> ... , хп> равен (по
абсолютной величине) определителю из координат векторов
Xi (t===l, 2, ... , п) относительно (любого)
ортогонального и нормированного базиса.
Задачи
1. Вывести первый результат задачи 9 § 53 из геометрических
соображений.
Указание. Изометрический оператор сохраняет Аг-мерные
объёмы.
2. Показать, что для любого линейного оператора А,
действующего в гс-мерном евклидовом пространстве Л, отношение
ь(Х\~~. [Аа?1? А#2> •»« > Ажп]
V[xlf #2, ... , яп]
постоянно (т. е. не зависит от выбора векторов xlt хъ ... , xn)t
и найти его величину («коэффициент искажения»).
Отв. &(A) = |detA|.
3. Показать, что для любых двух линейных операторов А
и В имеет место равенство fc(AB) = /r(A). ft (В).
4. Показать, что при и>3 всякий линейный оператор Q,
действующий, в тг-мерном пространстве Я и не изменяющий
площади любого параллелограмма, так что
V[x, y] = V[A*f Ay],
есть изометрический оператор.
Указание. Достаточно показать, что Q—равноугольный
оператор (задача 10 к § 53). В предположении, что имеется
прямой угол, который переходит не в прямой, построить
параллелограмм, площадь которого в результате применения оператора Q
изменится.
5. Показать, что при k < n всякий линейный оператор Q,
действующий в л-мерном пространстве R и не изменяющий объема
любого А*-меркого гиперпараллелепипеда, является изометрическим
(М. А. Красносельский).
Указание. Обобщить конструкцию задачи 4.
§ 59] ОЁЪЁМ ^-МЕРНОГО ГИПЕРПАРАЛЛЕЛЕПИПЕДА 211
Замечание. Для к=п утверждение задачи 5 уже не имеет
места, так как в этом случае всякий оператор Q с detQ=±l
будет удовлетворять условию задачи.
6. Пусть уLl у2, .... ут суть ортогональные проекции
векторов #!, х2, •••> хт на некоторое подпространство. Доказать, что
объём параллелепипеда, построенного на векторах у19 у2, ..., ymt
не превосходит объёма параллелепипеда, построенного на
векторах #!, #2, хт-
7. (Продолжение.) Предположим, что в задаче 6 как векторы
xlf х2, ..., хт, так и векторы ylt y2t ..., ут линейно независимы.
Показать, что справедлива формула
V[yl9 у2, ••, 2/тл] =
= F [xlt x2, ..., хт] • cos ax cos а2 ... cos cxm,
где al9 а2, ..., ат—углы между подпространствами L {хх
*2> -> sml—bi и L {уи уъ ..., ym}=L2 (задача 5 к § 56).
Указание. Выбрать в подпространствах 1ц и L2 базисы'
elt (?2, ...,вти Д, /2, ..., /т, полученные при построении углов
<*!, а2, ..., ат. В пространстве R построить базис elt е2, ..., ет,
em+i> --'>en> пеРвые векторы которого получены путём орто-
гонализации векторов ег, е29 ..., ет, Д, /2, ..., fm- Разложить
векторы хъ х2, ..., xmi yl9 y2, ..., ут по построенному базису.
Показать, что матрицы этих разложений имеют только по одному
минору m-го порядка, если не считать миноров, заведомо равных
нулю. Использовать, далее, выражение объёма параллелепипеда
через миноры соответствующей матрицы.
8. Будем называть к-вептором совокупность к векторов
евклидова пространства R. Два ^-вектора {х19 х2, ..., xk} и {yif у2, ..., yk)
называются равными, если 1) объём V [xlt x2i ..., xk} равен объёму
V {2/i, y2, ..., 2/ft}; 2) линейная оболочка Ь(хъ х2, ..., xk)
совпадает с линейной оболочкой L(yx, y2, ..., yk)\ 3) системы xlt
x2i ..., xk и ylt у2, •--> Уь. имеют одинаковую ориентацию
(т. е. оператор в пространстве L(xlt х2, ...,xk), переводящий
систему {хъ х2, ..., xk} в систему {ylt y2, ..., yk), имеет
положительный определитель).
Показать, что Д-вектор {х1У х2, ..., xk] в и-мерном
пространстве R определяется однозначно, если известны величины всех
миноров &-го порядка матрицы || £^ || (i = 1, 2, ..., nt j = 1, 2, ..., к),
составленной из координат векторов хг, х2, ..., xh в
произвольном ортогональном и нормированном базисе е19 е2, ..., *п
пространства i?.
Указание. Использовать задачу к § 19 и задачу 1 к § 29,
п. 5. _
9. ясли л-вектор {жх, х21 ..., xk] равен л-вектору {yv y2l ..., у^}
(см. задачу 8), то миноры к-то порядка матрицы из координат
14*
212 ОРТОГОНАЛЙЗАЦЙЯ Й ИЗМЕРЕНИЕ ОБЪЁМОВ [ГЛ. 8
векторов xlt х2% ..., xk равны соответствующим минорам матрицы
аз координат векторов ylt y2t ..., t/fe.
Указание. Проверить утверждение задачи в специальном
базисе, первые к векторов которого принадлежат к
подпространству L {#!, х2> ..., xk]. Для перехода к общему случаю исполь*
зовать задачу 1 к § 29, п. 5, причём показать, что det || аФ || = 1.
10. Назовём «углами» между двумя ft-векторами {xlt x2t ..., xk)
и {уi, Уъ • ♦• > Уь) набор углов между подпространствами Li =
= Ь{хъх21 •••>*&} и L2 = L{ylt у2, ...,2/fe> (задача 5 к § 56),
выбираемых, однако, с тем дополнительным условием, чтобы
векторы *?!, <?2> • • •» ek> взятые в подпространстве Lx для построения
этих углов, имели бы ту же ориентацию, что и векторы
хъ х2, .. •, %k (это условие играет роль лишь при построении
последнего вектора efe); аналогично и в подпространстве L2.
Показать, что углы рх, р2» •> Рь между к векторами и углы
«и <*2> ..., ak между соответствующими подпространствами
связаны следующими соотношениями:
«j = fy (/'<*)» «fc = Pft или afe=*—pft.
И. Назовём скалярным произведением двух Л-векторов
X={xlt x2i ..., #fe} и F={2/i, 2/2» •••> 2/fe}» заданных матрицами
X и У в некотором ортогональном и нормированном базисе
пространства R, сумму всех произведений миноров к-го порядка
матрицы X на соответствующие миноры матрицы У. Показать,
что это скалярное произведение равно:
V [х1У х2, ..., xk] • V [у19 2/2, ..., Ук] ' cos Pi • cos p2 • • • cospft,
гДе Pi» Рг> •••» Pfe"~yrjIbI между Л векторами X и У.
Указание. Выбрать в пространстве R базис, как показано
в задаче 7, и проверить утверждение задачи в этом базисе. Для
перехода к общему случаю действовать так же, как в задаче 9.
§ 60. Неравенство Адамара
Из результатов § 58 можно получить одну важную
оценку абсолютной величины произвольного определителя
к-то порядка
Ец£ 12 • • • Sifc
£l2 £22 • • • %2k
Z> =
%k\ ?i
ki Sfe2
• %kk
§ 60] НЕРАВЕНСТВО АДАМАРА 213
Будем истолковывать числа Еи, fo, ..., Uk
(?=1, 2, ..., А) как координаты вектора ач в
ортогональном нормированном базисе ^-мерного евклидова
пространства. Последний результат § 58 даёт нам возможность
истолковать абсолютную величину определителя D как
объём Л;-мерного гиперпараллелепипеда, построенного на
векторах xlt х2, • .., хъ., и использовать выражение объёма
через определитель Грама D2 = G(xli х2, ..., %ъ)-
Применяя теорему 31, получаем:
k и
D2 < (xl9 Xi) (x2, x2) ... (xh, xk) = Д 2 $i-
Это неравенство носит название неравенства Адамара.
Отметим, что оно обращается в равенство в силу
теоремы 31 в том и только в том случае, когда векторы
хи х2, ..., Xk взаимно ортогональны.
Неравенство Адамара имеет прозрачный геометрический
смысл: объём гиперпараллелепипеда не превосходит
произведения длин его рёбер; он равен этому произведению
в том и только в том случае, когда его рёбра взаимно
ортогональны.
Задачи
1. Пусть хъ хг, ..., xh, у, z—векторы евклидова
пространства R. Доказать неравенство
У[х19 а2, ..., xk, у, z] V[xlt х2, ..., xki z]
V [х1у х2, ..., xk, у] ""- V [xlt х2, ..., xk] *
Указание. Речь идёт о том, чтобы сравнить высоты двух
гиперпараллелепипедов.
2. Пусть хъ х2, ..., хт — векторы евклидова пространства Л.
Доказать неравенство
т 1
V[xlf x2, .,zm]<Y[ {V[x± xh__v xk+{i ..., хм]}™"1 . (15)
Каков его геометрический смысл?
Указание. Неравенства
V[a?i» «2» »"»Дт1 ^ т/[^1? ...,xh] n
V[xlt ..., ajft_Jf xk. v ..., ящ] F[^,
214
ОРТОГОНАЛИЗАЦИЯ И ИЗМЕРБНИБ ОБЪЁМОВ [ГЛ. 8
легко получаются из неравенства (14). Перемножить их для всех
Л=1, 2, ..., т, произвести сокращения и извлечь корень
(т—1)-й степени. Геометрический смысл: объём иг-мерного
гиперпараллелепипеда не превосходит произведения корней (т — 1)-й
степени из объёмов его (т—1)-мерных граней.
3. (Продолжение.) Доказать неравенства, уточняющие
неравенство Адамара:
Г[хих2, .,,ят]<Д {V[xlt
ft=l
• » xk—i> xk+v ' • •» хш\
1 • 2
1
m-1
< П {V[xl9...txh_vxh+if
x x n(wi-i)("»-2)^
Д {У!*,,, *,,,...,*„]}*«-»>M)...r,
1 m
l<tsi<S2^m s= 1
(M. К. Фаге).
Указание. Написать неравенство (15) для aSi, a?S2, ...,' х8г
и перемножить такие неравенства для всех допустимых значений
4. Если | aik | ^ If, то по неравенству Адамара det||flife||^
<Мплп'2. Показать, что эта оценка не может быть улучшена
для л = 2™.
Указание. Требуется построить в 2т-мерном пространстве
гиперпараллелепипед, у которого проекции рёбер на каждую
ось не превосходят по абсолютной величине числа М и объём
которого в точности равен Мппп12.
Отв. Для М = 1 матрица Ат координат искомых векторов
в 2т-мерном пространстве может быть задана рекуррентной
формулой
1 1
лщ —
A-m-i -Am_x
Аг =
1 -т-1
Примечание. Для пф2т оценка Mnnnj2 может быть
улучшена.
§ 61] МАТРИЦА ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЁННОЙ ФОРМЫ 215
§ 61. Матрица симметричной положительно
определённой билинейной формы
в п-мерном линейном пространстве
Как мы уже указывали в § 44, п. 4, билинейная
форма А (х, у) называется положительно определённой, если
при х Ф О А (ж, х) > 0. Мы ставим сейчас целью
определить, при каких условиях симметричная билинейная
форма, заданная в некотором базисе га-мерного линейного
(аффинного) пространства симметричной матрицей А =
= ||flife||> будет положительно определённой. Следующая
теорема даёт решение этой задачи.
Теорема 32. Для того чтобы симметричная
матрица .4=||aife|| определяла положительно определённую
билинейную форму А(х, у), необходимо и достаточно,
чтобы все главные миноры матрицы ||а^|| были
положительны.
Доказательство. Если симметричная билинейная
форма положительно определена, то мы введём в аффинном
пространстве R скалярное произведение по формуле
(х, у) = А(х, г/).
В частности,
а{/ = А(еь ej) = (eit ej).
Таким образом, главные миноры матрицы А представляют
собой в данном случае определители Грама (§ 58) для
базисных векторов el9 е2, ..., ен (& = 1, 2, ..., п) и как
таковые положительны.
Обратно, если главные диагональные миноры матрицы
|| ау || положительны, то в силу формул (26) § 45 будуу
положительны все коэффициенты X/ в выражении формы
А(х, у) в её каноническом базисе еъ еа, • • •» еп- В
частности, для
*
216* ОРТОГОНАЛИЗАЦИЯ И ИЗМЕРЕНИЕ ОБЪЁМОВ [ГЛ. 8
получим
А(з, я) = Х1т} + Х2т}+ ... + Хпт£>0,
что и требуется.
Задача
Дана симметричная матрица Л = ||яу||, обладающая
свойствами
I «и I > О,
«11 «J2
«21 «22
>о,...,
Доказать, что а > 0.
71п
«21 «22 • • • «2П
аШ ап2 • • • апп
>0.
ГЛАВА 9
СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЧИСЛА
§ 62. Инвариантные подпространства
Пусть в линейном (аффинном) пространстве R задан
линейный оператор А. Введём следующее определение.
Подпространство R' линейного пространства R называется
инвариантным относительно оператора А, если из x£R'
следует Ax£R'.
В частности, тривиальные подпространства — нулевое
и всё пространство — являются инвариантными для
всякого линейного оператора; нас будут интересовать,
естественно, только нетривиальные инвариантные
подпространства. Рассмотрим с этой точки зрения примеры
линейных операторов, указанные в § 26.
1. Для операторов в примерах 1—3 каждое
подпространство является инвариантным.
2. Оператор поворота на плоскости (пример 4) не имеет
нетривиальных инвариантных подпространств.
3. Оператор проектирования (пример 5) имеет,
например, следующие инвариантные подпространства: подпро-
т
странство R' из векторов #=2 Еь^, которые не изме-
п
няются, и подпространство R" из векторов у= 2 ^ен,
которые переходят в нуль.
4. Каждое подпространство, порождённое некоторыми
из базисных векторов. el9 e2, ...,еп, является
инвариантным для диагонального оператора (в примере 6).
218 СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЧИСЛА [ГЛ. 9
5. Для оператора умножения на t в пространстве
С {а, Ъ) (пример 7) совокупность всех функций, равных
нулю на некотором интервале Д, внутреннем к отрезку
[а, 6], является инвариантным подпространством, притом
бесконечномерным.
6. Линейные комбинации п фиксированных функций
вида eklt, ek2t9 ..., eknt образуют д-мерное инвариантное
подпространство для оператора дифференцирования в
примере 9.
Задачи
1. Какая особенность появится у матрицы оператора А,
действующего в n-мерном пространстве i?, если первые к векторов
базиса выбраны в ^-мерном инвариантном подпространстве?
Отв. В первых к столбцах матрицы все элементы (А+1)-й
и следующих строк равны нулю.
2. Если А—невырожденный линейный оператор в л-мерном
линейном пространстве, то всякое подпространство, инвариантное
относительно А, будет инвариантным и относительно А"1.
3. Если пространство R можно представить в виде прямой
суммы *) двух подпространств Rx и i?2, инвариантных относительно
оператора А, то в базисе elt еъ
ek+\>
еп, первые к
векторов которого принадлежат подпространству Rlt а остальные
п—/:—подпространству #2, матрица оператора А имеет вид
Л =
к\
М-1
L fe.fe+i П(
А2 | О
О
Каков геометрический смысл квадратных матриц Ах и Л2?
Отв. Матрица Лх есть матрица оператора А,
рассматриваемого как оператор, действующий только в подпространстве Rlt
записанная относительно базиса elt e2, ...,<?fe. Аналогичный
смысл имеет матрица Л2.
4. Если аннулирующий многочлен P(t) оператора А
разлагается на два взаимно простых множителя Р (г) = />!(*) • Р2(*)> то
матрицу оператора А в некотором базисе можно записать в виде
4 =
\А1
II °
0 1
At\
*) R называется прямой суммой подпространств i?x и Я2, если
сумма Лх и jR2 равна Я, а пересечение Rx и R2 есть нуль-вектор.
Ср. § 15. . .,
§ 62] ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 219
где матрицы Ах и А2 аннулируются соответственно многочленами
Pi(t)*P%(t).
Указание. Существуют многочлены St (t) и S2 (t), для
которых
Л (O^i (t) + Pt(t)S% Wsi. (•).
Все векторы x£R, для которых Р1(А)х = 0, и все векторы y£R,
для которых Р2(А)2/ = 0, образуют подпространства Лх и i?2;
используя равенство (*), показать, что пересечение i?x с i?2 равно
нулю, а сумма R^ и i?2 есть всё пространство R. Далее
использовать результат задачи 1.
5. Если подпространство Rx и-мерного евклидова пространства
R инвариантно относительно оператора А, то ортогональное
дополнение подпространства Rx инвариантно относительно
сопряжённого оператора А*.
6. Для изометрического оператора А, действующего в
евклидовом пространстве R и удовлетворяющего условиям задачи 4,
базис для построения матрицы А можно выбрать ортогональным
и нормированным.
Указание. Показать, что каждый вектор z±Rx (задача 4)
входит в подпространство i?2^ используя разложения z=
= Рх (A) Sx (A) z + Р2 (A) S% (A) z и инвариантность ортогонального
дополнения к подпространству Rx.
7. Если многочлен [Р (t)]k является аннулирующим для
изометрического оператора А, то многочлен Р (г) также является
аннулирующим для этого оператора.
Указание. Рассмотреть ортогональное дополнение Z к
инвариантному (относительно А) подпространству Н всех
векторов я, для которых Р(А)я = 0. Подпространство Z также
инвариантно относительно оператора А, следовательно, и относительно
[Р(А)]*"1. Но если zt'Z, то [P(A)]fc-!s6#, откуда [P(A)]fc"12=0.
Отсюда получить, что [P(0]fe~1 есть аннулирующий многочлен
оператора А.
8. Если аннулирующий многочлен оператора А есть многочлен
2-й степени, то любой вектор х пространства Я лежит в
инвариантной (относительно А) плоскости или прямой.
Указание. Векторы #, Ах, А2х линейно зависимы.
9. Для всякого изометрического оператора А пространство R
можно разложить в прямую сумму некоторой инвариантной
плоскости (или прямой) и ортогонального к ней инвариантного
подпространства.
Указание. Всякий вещественный многочлен, в том числе
аннулирующий многочлен оператора А, можно разложить на
взаимно простые вещественные множители вида [P(t)]h, где Р(г) —
многочлен не выше 2-й степени. Далее использовать задачи 4—8.
10. Для всякого изометрического оператора А в евклидовом
пространстве R можно выбрать ортогональный и нормированный
220 СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЧИСЛА [ГЛ. 9
базис, в котором матрица А оператора А имеет вид
cos ax sin <хх
-sino^ cos ax
cos a2 sin a2
—sin a2 COS a2
A =
(все невыписанные элементы матрицы равны нулю).
Указание. Найти сначала матрицу изометрического
оператора А, действующего в двумерном или одномерном
пространстве. Далее применить результат задачи 8.
§ 63. Собственные векторы и собственные
значения
1. Особую роль играют одномерные инвариантные
подпространства оператора А; они называются иначе
инвариантными, или собственными, направлениями. Всякий
(ненулевой) вектор, принадлежащий к одномерному
инвариантному направлению оператора А, называется
собственным вектором оператора А; иначе говоря, вектор х Ф О
называется собственным вектором оператора А, если
оператор А переводит вектор х в коллинеарный ему вектор:
Ах = \х. (1)
Число X, фигурирующее в этом равенстве, называется
собственным значением (собственным числом) оператора А,
соответствующим собственному вектору х.
Опять обратимся к примерам § 26.
1. В примерах 1 — 3 каждый ненулевой вектор пространства
есть собственный с собственными значениями соответственно О,
1, X.
§ 63] СОБСТВЕННЫЕ BEKTOPbt И (ЗОБС^ВЁНЙЫЁ ЗНАЧЕНИЯ 221
2. Оператор поворота (пример 4) не имеет собственных векторов.
3. Оператор проектирования (пример 5) имеет собственные
т п
векторы вида х = 2 ^kek и У~ 2 ^*еь с собственными значени-
fe=l fe=m+l
ями соответственно 1 и 0. Можно проверить, что иных
собственных векторов у оператора проектирования нет.
4. Диагональный оператор (пример 6) по самому
определению имеет собственные векторы elf е2, ... , еп с собственными
значениями соответственно Xlf Х2, ... , Хп.
5. Оператор умножения на t (пример 7) не имеет собственных
векторов в пространстве С (я, Ь), так как нет такой непрерывной
функции х (t) ф 0, которая удовлетворяла бы уравнению
tx (t) == lx (t).
6. О собственных векторах оператора Фредгольма (пример 8)
будет речь впереди (гл. 14).
7. Чтобы найти собственные векторы оператора
дифференцирования (пример 9), нужно решить уравнение х' (t)=\x(t),
откуда x(t) = Cext. Мы получаем бесконечное множество
собственных векторов с различными собственными значениями.
2. Укажем два простых свойства собственных векторов.
Лемма 1. Собственные векторы хъ х2, ...>хт
оператора А с попарно различными собственными
значениями Хь Х2, ... ,Хт линейно независимы.
Это утверждение мы докажем индукцией по числу т.
Очевидно, что для т = 1 лемма верна. Допустим, что
лемма верна для всяких т — 1 собственных векторов
оператора А; покажем, что она продолжает оставаться верной
и для всяких т собственных векторов оператора А.
Предполагая противное, допустим, что между т собственными
векторами оператора А имеется линейная зависимость
С\Хх -f- C%X% -f- . . . -f Ст%т === О»
где, например, Сг Ф 0. Применяя к этому равенству
оператор А, получаем:
C\kiXi -f- t/2^2^2 ~Ь • • • + СгФтхт = 0.
Умножим первое равенство на Хт и вычтем из второго;
тогда мы получим:
С\ (^i — ^m) xi + С2 (^2 — лт) £2 + • • •
У
222 СбЁСФЙЁЙЙШ ВЕКТОРЫ Й СОБСТВЕННЫЕ ЧИСЛА [М. 9
откуда, по индуктивному предположению, все
коэффициенты должны быть равными нулю. В частности,
Сг (Хх — Хт) = 0, что противоречит условиям Сх ф§,\\ф Хт.
Следовательно, наше предположение неверно и векторы
х19 х2, ... , хт линейно независимы.
В частности, в n-мерном пространстве линейный
оператор А не может иметь более п собственных векторов
с различными собственными значениями.
Лемма 2. Собственные векторы линейного
оператора А, отвечающие данному собственному значению X,
образуют подпространство R^ClR-
В самом деле, если Ая1 = Хя1 и Ах2 = Х^2, то
А (ахг + (teg) = аАжх + РАя2 = ab#i + РХ#2 = ^ (ахг + Р^г) >
чем утверждение леммы доказано.
Подпространство Д(д) называется собственным
подпространством оператора А, отвечающим собственному
значению X.
Задачи
1. Если линейные операторы А и В перестановочны (т. е.
АВ = ВА), то всякое собственное подпространство оператора А
является инвариантным подпространством для оператора В.
2. Если сумма (§ 15) собственных подпространств оператора А
совпадает со всем пространством R и каждое собственное
подпространство оператора А является инвариантным для оператора
В, то А и В перестановочны.
3. Если х и г/—«собственные векторы оператора А с
различными собственными значениями, то ах + $у (а ф О, р Ф 0) заведомо
не является собственным вектором оператора А.
4. Если каждый вектор пространства R является
собственным вектором для оператора А, то А = ХЕ (X—вещественное
число).
Указание. Использовать результат задачи 3.
5. Если линейный оператор А перестановочен со всеми
линейными операторами, действующими в пространстве, то А = ХЕ.
Указание. Подбирая должным образом оператор В и
используя задачу 1, свести решение к задаче 4.
6. Если линейный оператор А имеет собственный вектор е0
с собственным значением Х0, то для оператора А2 вектор е0 также
является собственным с собственным значением, равным X2.
7. Если линейный оператор А не имеет собственных векторов,
то оператор А2 может их иметь (пример: оператор поворота на 9СР
в плоскости). Показать, что если оператор А2 имеет собственный
64]
ЁЫЧЙСЛЁЙЙЁ СбЁСТЁЁЙНЬТХ ЁЁКТОРбВ
223
вектор с неотрицательным собственным значением Х = [л2, то
оператор А также имеет собственный вектор.
Указание. Использовать разложение оператора А2-—[а2Е
на множители.
§ 64. Вычисление собственных векторов
и собственных значений в конечномерном
пространстве
Пусть el9 е2, ... , еп — базис га-мерного пространства Rn
и А —некоторый линейный оператор. Допустим, что
п
вектор ж = 2 ^fe^ft есть собственный вектор оператора А,
так что Axz=\x с некоторым X. Используя формулы (7)
§ 27, мы можем это равенство переписать в
координатной форме
K1 = a[\ + a[%+...+a(fkn,
^2 = а(21)11 + а(22)$2+...+4пЧ„,
^п = яп Si-f-an ^2+ • • • +fln ?m
или
(ei0-X)?i+ <Л +••• +
,(*>£
,(2)
afc"5i + (eJf'-X) ?,+ ...+
a\n)l„ = 0, ]
4n)?n =0, 1
ai% +a%\ +...+(ain)-Wn=0. j
(2)
Эта однородная система уравнений относительно величин
Si, 62, • • • , £п допускает ненулевое решение в том и только
в том случае, когда её определитель равен нулю:
Д(Х) =
«(i2)
42>-Х ..
а\»>
a(2n>
= 0.
(3)
a(1)
a(2)
а(П)-
224 СОБСТВЕННЫЕ BEKfoPbi Й СОБСТВЕННЫЕ ЧИСЛА [ТП. §
Многочлен п-ж степени относительно X, стоящий в левой
части этого уравнения,—это уже известный нам
характеристический многочлен оператора А (§ 38, п. 2). Всякому
его вещественному корню Х0 отвечает собственный вектор,
который определяется после подстановки в (2) вместо X
величины Х0 путём решения получившейся совместной
системы относительно величин Ei, £2, •••> %п-
Разберём некоторые возможности, могущие
представиться при решении характеристического уравнения (3).
1. Случай отсутствия вещественных
корней. Если все корни уравнения Д(Х) = 0 мнимы, то
линейный оператор А, очевидно, не имеет совсем
собственных векторов.
Например, оператор поворота на угол у0фтп(т=:0, ± 1, ±2,...)
на плоскости V2, как мы уже отметили, не имеет собственных
векторов. Этот факт, геометрически очевидный, легко
устанавливается алгебраически. В самом деле, уравнение (3) для оператора
поворота имеет вид
I cos ср0—X — sin<p0 | Q
I sin<p0 cos<p0 — Х|
или после раскрытия определителя
1— 2Xcos<p0 + X2 = 0
и если ср0 ф тк(т = 0, ± 1, ±2,...), то это уравнение не имеет
вещественных корней.
2. Случай наличия п различных
вещественных корней. Если все п корней Хь Х2, ... , Хп
уравнения Д(Х) = 0 вещественны и различны, то мы
сможем найти п различных собственных векторов опера-
тотра А, решая систему (2) последовательно при
Х = ХЬ Х2, ... , Хп. В силу леммы 1 § 63, п. 2
полученные собственные векторы /ь /2, ... , fn линейно
независимы. Примем их за новый базис и построим матрицу
оператора А в этом новом базисе. Поскольку
Af2 = X2/2,
Afn — Xn/n,
§ 64] ВЫЧИСЛЕНИЕ СОБСТВЕННЫХ ЬЕКТОРОВ 225
матрица Ау) имеет вид
II >ч 0 ... О ||
О Х2 ... О
IIо о ... хп||
Используя определение диагонального оператора (§ 26,
пример 6), мы можем сформулировать полученный
результат следующим образом: в n-мерном пространстве всякий
линейный оператор, характеристический многочлен
которого имеет п различных вещественных корней, является
диагональным; матрица этого оператора, построенная
в базисе из его собственных векторов,, диагоналъна и её
диагональные элементы суть собственные значения
оператора.
3. Случай кратного вещественного корня.
Пусть X = Х0 — некоторый вещественный корень
уравнения (3) кратности г > 1. Возникает следующий вопрос:
какова размерность соответствующего собственного
подпространства RSX*\ или, иными словами, сколько линейно
независимых решений допускает система (2) при X = Х0?
Обозначим размерность этого собственного
подпространства через т. Выберем базис в пространстве R так,
чтобы первые т векторов базиса лежали в Л(А°). Тогда
матрица оператора А в этом базисе будет иметь в
первых т столбцах на главной диагонали число Х0, все же
остальные элементы этих столбцов будут равны нулю.
Определитель матрицы А — \Е поэтому будет иметь
множителем выражение (Х0 — Х)т. Следовательно, кратность
корня Х0 характеристического многочлена det (A — \Е)
будет не меньше т. Итак, справедливо неравенство г > т.
Мы получили следующее предложение:
Размерность собственного подпространства
оператора А, отвечающего корню Х0 характеристического
многочлена, не превышает кратности корня Х0.
В частности, простым корням характеристического
многочлена отвечают одномерные собственные
подпространства.
15 г. Е. Шилов
226 СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЧИСЛА tf\Jl. &
В примерах 1 — 3, 5, 6 § 26 размерности собственных
подпространств, как легко проверить, совпадают с кратностями
соответствующих характеристических корней. Но бывает и так,
что размерность собственного подпространства действительно
меньше кратности соответствующего корня. Для примера
рассмотрим оператор А в 72> заданный матрицей
ЧеГ
0
с произвольным |л Ф 0. Характеристический многочлен имеет вид
(Х0 — X)2; он имеет двойной корень Х = Х0. Система (2) в данном
случае принимает вид
0.^+0.52=0,
p--5i+o.e2=o .
и имеет единственное (с точностью до числового множителя)
решение
5i = 0, ?2=1.
Таким образом, собственное подпространство оператора А,
соответствующее собственному значению Х=Х0, имеет размерность 1,
меньшую, чем кратность корня Х0.
Задачи
1. Найти собственные значения и собственные векторы
операторов, заданных следующими матрицами:
в)
а)
2
0
0
12—1-
1
0—1 0
0 2 1
-1 0 |
1 -1
1 3
1
б)
-1 -2 2
0 1 0
0 0 1
г)
0
1
0
0
0
0
0
0
1
1
0
0
— 1
— 1
0
1
Оте. а)Х1==2, /1 = (1, 0, 0); Х2 = 1, /2 = (1, 0, 1); Х3= -1,
/3-(0, 1, -1); б) Х1=в — 1, А-(1, 0, 0); Х2 = А3=1, /, = (1, 0, 1);
/8 = (0, 1,-1); в) Хг = 2, А = (1, 0, 0); г) Х1 = 1, /1==(1, 0, 0, -1);
Х2 = 0, /2 = (0, 1, 0, 0).
2. Пусть оператор А, действующий в и-мерном пространстве R,
имеет ^-мерное инвариантное подпространство R'. Тогда, считая
временно, что оператор А определён только в подпространстве /?',
мы можем построить для него характеристический многочлен
§ 65J СОБСТВЕННЫЕ ВЕКТОРЫ СИММЕТРИЯ. ОПЕРАТОРОВ 227
к-й степени. Показать, что этот многочлен является делителем
характеристического многочлена оператора А, действующего
во всём пространстве R.
Указание. Использовать задачу 1 § 62 и инвариантность
характеристического многочлена (§ 38, п. 2).
3. Найти все инвариантные подпространства диагонального
оператора с различными диагональными элементами и доказать,
что их число равно 2П.
Указание. Нужно доказать, что в каждом ^-мерном
инвариантном подпространстве имеется к собственных векторов.
Для этого использовать результат задачи 2.
§ 65. Собственные векторы симметричных операторов
1. Мы переходим к изучению собственных векторов
у некоторого важного класса линейных операторов,
действующих в евклидовом пространстве Л —именно, у
симметричных операторов (§ 54, п. 2). Мы выбираем именно
этот класс операторов по следующим причинам: во-первых,
такие операторы играют большую роль в математической
физике (см. гл. 14); во-вторых, теория собственных
векторов для этих операторов носит исчерпывающий
характер.
Напомним, что оператор А, действующий в евклидовом
пространстве Д, называется симметричным, если
соответствующая оператору А билинейная форма (ж, Ау)
симметрична, т. е. для любых векторов х и у пространства R
имеет место равенство
(Ах, у) = (х,Ау). (4)
Как мы уже указывали в § 54, п. 2, в я-мерном
евклидовом пространстве матрица А симметричного оператора
в любом ортогональном нормированном базисе совпадает
со своей транспонированной матрицей, иными словами, А
есть симметричная матрица. И обратно, каждый оператор А,
имеющий в некотором ортогональном и нормированном
базисе симметричную матрицу, является самосопряжённым
оператором.
2. Докажем сначала несколько простых лемм.
Лемма 1. Собственные векторы симметричного
оператора А, отвечающие различным собственным значениям,
взаимно ортогональны.
15*
228 СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЧИСЛА [ГЛ. 9
Действительно, пусть имеют место равенства
А.Х :== кХ,
и X ф ^. Умножим первое равенство скалярно на у,
второе на х и вычтем второе из первого:
{Ах,у)-(х, Ay) = (k — \i){x, у).
Левая часть этого равенства равна нулю вследствие
симметрии оператора. Так как \ Ф ji, то (ху г/) = 0, что и
требовалось.
Лемма 2. Пусть R' —подпространство в евклидовом
пространстве Л, инвариантное относительно
симметричного оператора А. Тогда ортогональное дополнение R"
подпространства R' (§ 49, п. 3) также инвариантно
относительно оператора А.
Доказательство. Пусть ж —любой вектор
подпространства Я', у — любой вектор подпространства Я".
По условию (Ах, ?/) = 0. Но в силу симметрии оператора
в таком случае и (х, Ау) = 0. Это означает, что вектор Ау
ортогонален к любому вектору x£R' и, следовательно,
Ay£R" для любого у £Я", что и требовалось.
Следующая лемма основана на определениях, данных
в § 52.
Лемма 3. Всякий максимальный вектор
симметричного оператора А является собственным вектором для
оператора А2 с собственным значением || А ||2.
Доказательство. Пусть х0 — максимальный вектор
оператора А; это означает, что | х01 = 1 и
\Ах0\* = (Ах07 Ая0)Н|А||2.
Положим Ax0 — z0. Поскольку оператор А
симметричен, мы имеем:
(As0, Ax0) = {zQ, Ax0) = (Az0, So)-
Оценим полученную величину, используя неравенство
Коши-Буняковского (§ 49, п. 2) и неравенство (19) из § 52:
JIА ||а = (Az0,050) < | Az01 • |«o| = |Az0|<;|| А|| - 1 «о 1 =
Н| А И А*о |< || А ||2.
g 65] СОБСТВЕННЫЕ ВЕКТОРЫ СИММЕТРИЧ. ОПЕРАТОРОВ 229
Поскольку правая и левая части неравенства
совпадают, на всех промежуточных этапах должен стоять знак
равенства. Но неравенство Коши-Буняковского
обращается в равенство лишь в том случае, когда фигурирующие
в нём векторы коллинеарны (§ 49, п. 2); поэтому мы
делаем вывод, что
P^Zq t== KXq.
Величину X легко определить: из условия (AzQyx0)-=
= || А ||2 непосредственно вытекает, что Х = ||А||2. Итак,
AZq = A Xq = || А II XQi
что и требовалось.
Лемма 4. Если у симметричного оператора А
имеется максимальный вектор, то имеется и
собственный вектор с собственным значением +|| А|| или —1| А||.
Доказательство. Пусть х0 — максимальный вектор
оператора А. В силу леммы 3 он является собственным
вектором для оператора А2 с собственным значением || А ||2:
А2я0 = ||А||2я0.
Этому равенству можно придать вид (обозначая
Р = ЦА||)
(А-1хЕ)(А + |аЕ)я0 = 0.
Допустим, что zQ = (А+ (хЕ) х0 Ф 0. Тогда из условия
(A-^E)z0 = 0
или, что то же,
Az0 — |xz0,
вытекает, что z0 есть собственный вектор оператора А
с собственным значением р. = || А ||. Если же (А + \хЕ) х0 = 0,
то
Ах0 = — !^о»
и получается, что уже х0 есть собственный вектор
оператора А с собственным значением — (х= — ||А||. Тем
самым лемма 4 полностью доказана. *
Заметим, что в леммах i — 4 не предполагалась
конечномерность пространства R. Следующая теорема 33, напро-
230.. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЧИСЛА [ГЛ. 9
тив, существенно основана на предположении о
конечномерности пространства:
Теорема 33. (Теорема о симметричном
операторе.) Симметричный оператор А в п-мерном
евклидовом пространстве R имеет п взаимно
ортогональных собственных векторов.
Доказательство. Оператор А, как всякий
оператор в конечномерном пространстве, имеет
максимальный вектор (§ 52). Применяя лемму 4, получаем, что
у оператора А имеется собственный вектор ех с
собственным значением Хь равным \\А\\ или —1|-4||.
Рассмотрим ортогональное дополнение R' в
пространстве R к одномерному подпространству Rl9 порождённому
вектором ех; R'x есть (п — 1)-мерное подпространство
пространства R, инвариантное по лемме 2 относительно
оператора А. Мы можем теперь считать оператор А заданным
только в подпространстве Я'; повторяя предыдущие
рассуждения, мы сможем указать в этом подпространстве
у оператора А новый собственный вектор е2.
Соответствующее собственное значение Х2 по абсолютной
величине равно точной верхней грани функции | Ах | на
единичной сфере пространства R и, следовательно, не
превосходит |Х!|=:||А||.
Подпространство Д2, порождённое векторами е1 и е2,
инвариантно относительно оператора А, так как
A (oLtfx + а2е2) = о^А^ + а2Ае2 = о^Х^ + а2Х2е2.
Поэтому в силу леммы 2 ортогональное дополнение R"
подпространства R2 также инвариантно относительно
оператора А. Повторяя предыдущие рассуждения, мы
построим в R" третий собственный вектор е3 с собственным
значением Х3; при этом |Х3|<|Х2|< | Хл |. Продолжая этот
процесс, мы последовательно построим систему п взаимно
ортогональных собственных векторов el9 e2, . .., еп с
соответствующими собственными значениями Хь Х2, .. ., Хп,
идущими в порядке убывания модулей: | Хх | > | Х21 > ... >• | Хп|.
Следствие 1. Всякий симметричный оператор —
диагональный', существует базис (притом ортогональный),
q котором матрица этого оператора, имеет,
диагональный вид.
§ 65] СОБСТВЕННЫЕ ВЕКТОРЫ СИММЕТРИИ. ОПЕРАТОРОВ 231
Следствие 2. Если матрица \\a\j)\\ симметрична,
то соответствующее ей характеристическое уравнение (3)
§ 64 не имеет комплексных [невещественных) корней.
Каждому вещественному корню X уравнения (3) отвечает
ровно столько линейно независимых решений системы (2),^
какова кратность корня X.
Действительно, в силу § 64, п. 3 каждому
вещественному корню X отвечает некоторое число линейно
независимых решений системы (2), не большее, чем кратность
корня X.
Если допустить, что какому-то корню Х0 отвечает
меньшее, чем кратность корня Х0, число линейно
независимых решений системы (2) § 64 или что
существуют комплексные корни уравнения (3), то полное число
линейно независимых решений всех систем (2) для всех
вещественных корней уравнения (3) будет заведомо
меньше чем п.
Но по доказанному симметричный оператор с
матрицей ЦаФЦ должен иметь п линейно независимых
собственных векторов. Следовательно, ни одно .из наших
допущений не может осуществиться, откуда и вытекает
справедливость утверждения.
Следующая теорема 34 показывает, что результат
теоремы 33 нельзя обобщить на несимметричные операторы.
Теорема 34. Если линейный оператор А,
действующий в n-мерном евклидовом пространстве R, имеет п
взаимно ортогональных собственных векторов, то А —
симметричный оператор.
Доказательство. Примем п взаимно
ортогональных и нормированных собственных векторов оператора А
за базис пространства R. Тогда матрица оператора А
в этом базисе будет диагональной и, следовательно,
симметричной матрицей. Отсюда и из § 54, п. 2 вытекает,
что А — симметричный оператор, что и утверждалось.
Задачи
1. Симметричный оператор, действующий в n-мерном
евклидовом пространстве R, называется положительно определённым,
если все его собственные значения Х1}Ха, ...,ХЛ положительны.
Показать, что для данного симметричного положительно
определенного оператора Л всегда можно найти симметричный и поло:
232 СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЧИСЛА [ГЛ. 9
жительно определённый оператор В такой, что В2 = А
(«квадратный корень из оператора А»).
Указание. Построить оператор В по формулам Ъе{ = 4- }/"\i ei
(г = 1, 2, ..., п), где elf e2, ..., еп— канонический базис
оператора А.
2. Извлечь квадратный корень из оператора А, заданного
в ортогональном и нормированном базисе матрицей
113
7
1 2
7
24
9
2 1
9
29 J
Указание. Предварительно преобразовать базис так, что-
бы матрица данного оператора приняла диагональный вид,
Отв.
3 2 О II
2 4 2.
О 2 5 I
3. Показать, что квадрат нормы любого оператора А в /г-мер-
ном евклидовом пространстве равен максимальному собственному
значению (симметричного) оператора А*А.
Указание. Провести рассуждение, аналогичное
доказательству леммы 3, но без предположения симметричности оператора А,
Использовать задачу 7 § 54.
4. Известно, что некоторый линейный оператор А есть
произведение симметричного оператора S и изометрического Q : A = SQ.
Показать, что S2=AA*.
5. Показать, что всякий оператор А с. detA^O может быть
представлен как произведение симметричного и изометрического
оператора.
Указание. Показать, что оператор АА* симметричный
и положительно определённый (задача 1), поэтому можно найти
симметричный и положительно определённый оператор S так,
чтобы иметь S2 —АА*. Далее построить оператор Q по формуле
Q = S А и показать, что Q — изометрический оператор.
6. Доказать единственность представления оператора А в виде
произведения SQ в условиях задачи 5.
Указание. Использовать результат задачи 4.
7. Исследовать вопрос о возможности и единственности
представления A = SQ в предположении det A=0.
Отв. Возможно, но не единственным образом.
8. Показать, что симметричные операторы А и В
перестановочны тогда и только тогда, когда они имеют общую систему из
п взаимно ортогональных собственных векторов.
У к а з а п и е.. Использовать задачи 1 и 2 к § 63.
/я=
§ 66] ПРИМЕРЫ СИММЕТРИЧНЫХ ОПЕРАТОРОВ 233
§ 66. Примеры симметричных операторов
в бесконечномерных пространствах
Мы рассмотрим в этом параграфе некоторые конкретные
операторы, имеющие применения в математической физике.
1. Рассмотрим оператор умножения на t в евклидовом
пространстве Са(я, Ь), Этот оператор симметричен: для любых х (t)
и y(t) из Cz(a, Ь)
Ь Ъ
(tx, y)= \ tx(t)y(t)dt=\ x(t)ty(t) dt~(x, ty).
а а
Заметим, что оператор умножения на г не имеет собственных
векторов (§ 63). Таким образом, основная теорема о
симметричных операторах (§ 65) не может быть перенесена на
бесконечномерные пространства.
2. Рассмотрим интегральный оператор Фредгольма (£ 26,
пример 8).
Если ядро К (t, s) этого интегрального оператора
симметрично, т. е. К (t, s) = K(s, t), то оператор Фредгольма симметричен;
действительно, для любых x(t), y(t) из С2(а, Ь)
ь ъ
(Ах, у)= \ \ K(t, s) x(s) y(t) dt ds =
a a
b b
= \ \ К (s, t) x (s) у (t) dt ds —
a a
b
= [ x (s) Г \k(s, t) y(t) dt J ds = (x, Ay).
В отличие от оператора умножения на t симметричный
оператор Фредгольма имеет собственные векторы. Мы будем
заниматься их изучением далее, в главе 14.
3. Дифференциальный оператор Штурм а-Л и у-
вилля. Так называется оператор в пространстве С2(я, Ь),
определённый формулой
где <р (t) и q (t) — заданные функции. Область определения
оператора Ъ[х] — не всё пространство С2(а, Ь), а некоторая его часть
(состоящая заведомо только из дважды дифференцируемых фупк
ций), которая будет уточнена в дальнейшем.^ Очевидно, что L [х]
есть линейный оператор. Составим билинейные формы (Ъ{х],у)
234 СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЧИСЛА [ГЛ. 9
и (Ху Ъ[у]) и вычислим их, пользуясь интегрированием по частям:
ь
о.м.у>-^ {!['£]+*•}**-
а
Ь Ъ
dx \Ь С dx dy . , Г j*
= py4t\a-\rTtTtdt+\qxydt'
a a
Ь
a
Ь # Ь
dy\b Г dy dx . С .
a a
Мы видим, что равенство (L [#], t/) = (aj, L [2/]), а вместе с ним
и симметрия оператора L имеют место, если выполняется условие
/ dx dij\
^yTt~xTt)
= 0 (5)
для любых двух функций х (t) и у (t) из области определения £
оператора L [х]. Например, условие (5) выполняется, если для
любой функции х (t) G £
х(а) = х(Ъ) = 0. (6)
Другими типами условий, налагаемых на функции x{t)£Q
могут служить равенства
ж(а) + Л1ж'(а) = 0, x (b) + h2xf (Ь) = 0 (7)
или
а; (а) =ж (Ь), ж'(а) = а:' (&) (8)
и т. п. Вообще годятся любые линейные однородные условия,
обеспечивающие выполнение равенства (5) *); каждое из них
фиксирует некоторую область Q определения оператора L [х], в
которой он будет симметричным оператором.
В частности, при p(t) = 1, q (t) ~ 0 мы получаем оператор
Ъ[х] = х" (t), (9)
симметричный, например, при выполнении условия (8). Найдём в
*) Само равенство (5) не может быть принято за определение
области Q, потому что в нём фигурируют две функции x(t) и у (£),
в то время как определение области должно* содержать только
одну функцию.
§ 66] ПРИМЕРЫ СИММЕТРИЧНЫХ ОПЕРАТОРОВ 235
соответствующем евклидовом пространстве собственные функции
этого оператора. Для этого нужно решить уравнение
я"(0 = МО> (Ю)
причём выбрать только такие решения, которые удовлетворяют
условию (8). Будем считать для простоты а==—к, Ъ = ъ. Тогда
уравнение (10) имеет очевидные решения хп= Ап cos nt + Bn sin nt,
причём X соответственно принимает значения 0, I2, 22 ... п2, ...;
постоянные Ап и Вп произвольны.
Многочлены Лежандра также являются собственными
функциями некоторого оператора Штурма-Лиувилля. Чтобы найти этот
оператор, положим уп (t)=(t2 — 1)" и продифференцируем по г.
yn(t) = 2nt(t^l)n-i,
откуда следует, что (t2 — l)y'n (t) = 2ntyn (t). Это уравнение мы
продифференцируем и + 1 раз по t, применяя формулу Лейбница
= 2nty%W(t) + 2n(n + l)yW(*)-
Заменяя в этом равенстве у^ (t) на pn(t), преобразуем его к виду
1
l(t2—\)p'n(t)]' = n(n+l)pn(t), или после умножения на -jpj
±[(t*~'l)±Pn(t)]=n(n+l)Pn(t). * (11)
Равенство (11) показывает, что многочлен Лежандра Рп (t)
является собственной функцией оператора Штурма-Лиувилля
LW-A [(«.-1) !«W] (12)
с собственным значением \ = п(п-{-1). Оператор Штурма-Лиувилля
(12), определённый на интервале — l^f^l, не требует никаких
дополнительных условий симметрии, так как равенство (5)
автоматически выполняется для всех дважды дифференцируемых
функций ж (г)£С2( —1, 1) в силу того, что p(t)~t2— 1 обращается
в нуль при t=^± 1.
Применяя лемму 1 § 65, мы заново получаем свойство ортого<-
налъности тригонометрических функций (для различных п)
и многочленов Лежандра. В дальнейшем, в главах 13 и 14, мы
проДолжим изучение свойств операторов Штурма-Лиувилля.
ГЛАВА 10
КВАДРАТИЧНЫЕ ФОРМЫ В ЕВКЛИДОВОМ
ПРОСТРАНСТВЕ
§ 67. Основная теорема о квадратичных формах
Начнём с рассмотрения следующего предложения,
касающегося симметричной билинейной формы в евклидовом
пространстве:
Теорема 35. В n-мерном евклидовом пространстве
всякая симметричная билинейная форма имеет
канонический базис из взаимно ортогональных векторов.
Доказательство. Рассмотрим линейный оператор А}
отвечающий данной симметричной билинейной форме
А (ху у). Этот оператор также симметричен. Согласно теореме
о симметричном операторе (теорема 33) в пространстве R
имеется ортогональный и нормированный базис из
собственных векторов оператора А. В этом базисе матрица
оператора А —диагональная. Поскольку эта же матрица
является и матрицей билинейной формы А(х, у),
построенный базис есть канонический базис формы А(хуу), что
и требовалось.
Этот результат мы применим теперь для изучения
квадратичных форм.
Пусть дана квадратичная форма
п
А(х,х) = 2 аИ*& (aij = <*»)• (!)
г, У-1
Будем считать числа £ь £2> •• •> ?п координатами вектора л
в n-мерном евклидовом пространстве R со скалярным
§ 67] ОСНОВНАЯ ТЕОРЕМА О КВАДРАТИЧНЫХ ФОРМАХ Й37
произведением, определённым по формуле
п
где у = (т)1,%, •• •,%). Базисв1=(1,0, ..., 0}, еа={0, 1, .. .
..., 0}, ..., еп = {0, 0, ..., 1} является ортогональным
п
и нормированным базисом в /?, причём £=2 ^еь
г=1
п
у = 2 ^i* Рассмотрим билинейную форму
п
А(^> у)= 2 а^/>
i, /= 1
соответствующую квадратичной форме (1).
В силу теоремы 35 у этой формы существует
ортогональный и нормированный базис Д, /2, ..., /п. Если
относительно этого базиса векторы хну имеют
соответственно координаты ть т2, ..., тп и 0Ь 02, • ••, вп> то
форма А (#, у) будет иметь вид
п
а квадратичная форма А (х, х) примет вид
п
А(х,х)=%\& (2)
Переход от базиса еи е2, ..., еп к базису /ь /2, ..., /п
осуществляется с помощью некоторой ортогональной
матрицы (§ 53, п. 1) @ = ||gW|| по формулам
п
/> = 2^;>е* о'=1»2 и)-
238 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
Связь между координатами ть т2, ..., тп и Еь £2>
..., £п может быть записана в силу формул (28) § 53
системой равенств
п
&i = 2#*i (i = l,2, ...,7i) (3)
с использованием транспонированной матрицы Q'. Мы
получили тем самым следующую важную теорему:
Теорема 36. (Теорема о квадратичной
форме в евклидовом пространстве.) Всякая
квадратичная форма (1) может быть приведена к
каноническому виду (2) с помощью изометрического
преобразования координат (3).
Последовательность действий, которые нужно произвести
для построения формул перехода (3) и канонического вида
(2) квадратичной формы (1), вытекает из результатов § 64
и 65; мы приведём её здесь в окончательном виде.
1) По квадратичной форме (1) строим симметричную
матрицу А - || a[j) ||, где a[j) = ai}\
2) Составляем характеристический многочлен Д (X) =
— det(A — X2?) и находим его корни. В силу следствия
2 теоремы 33 этот многочлен имеет п вещественных
корней (не обязательно различных).
3) Зная корни многочлена Д(Х), можно написать уже
квадратичную форму в каноническом виде (2), в частности
можно сказать, каковы её положительный и
отрицательный индексы инерции.
4) Корень Хх подставим в систему (2) § 64. Для
данного корня Хх эта система должна иметь ровно столько
линейно независимых решений, какова кратность корня Хх.
Найдём эти линейно независимые решения, пользуясь
правилами решения однородных систем линейных
уравнений.
5) Если кратность корня \х больше единицы, ортого-
нализируем полученные линейно независимые решения по
методу § 56.
6) Проделав указанные операции с каждым корнем,
мы получим систему из п взаимно ортогональных векто-
§ 67] ОСНОВНАЯ ТЕОРЕМА О КВАДРАТИЧНЫХ ФОРМАХ 239
ров. Пронормируем её, разделив каждый вектор на его
длину. Полученные векторы
f2 = {g[2\ д?\ • .-,<7<|2)Ь
образуют уже ортогональную и нормированную систему.
7) Используя числа qV\ можно написать формулы
перехода (3).
8) Если требуется дать выражения новых
координат {т} через старые координаты {£], то, вспоминая, что
матрица, обратная к ортогональной, получается
транспонированием, мы можем написать искомые выражения
в виде
п
Задача
Преобразовать ортогональным преобразованием к
каноническому виду следующие квадратичные формы:
а) 2д + а-4?1?я-45я?8;
б) 25? + 551 + 55J + /i5i€2 - 46^, - 85258;
в) 25f +1%\ + 251 + 2:1 - 4«« + ^5, + 252^з -45854;
г) Ц& + 25!5з ~ 25i54 - 2?2?з + 2с2&4 + 253?4.
От. а) 4Ч? + ч| —2Ч«; Ъ-уЬ-уЬ + з-Ь.
2 с . 1 t 2 t
^2 ~ "3" ?1 "Г "з" *2 з* ^3»
ъ = "з" £i + "3" ^+у £з;
б) lOijf + ijI + Tjl; Ъ = -^1 + | &2-у£3,
240 КВАДРЛТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
в) 4!-*ii + 34i + 54i:
г) чЦ-ОЦ-^-Зч!;
§ 68. О единственности ортогонального и нормированного
канонического базиса квадратичной формы
и соответствующего канонического вида формы
Мы видели в § 43, п. 3, что в аффинном
пространстве ни канонический базис, ни канонический вид
квадратичной формы не определены однозначно; вообще говоря,
можно было зключить в канонический базис формы любой
наперёд заданный вектор. В евклидовом пространстве
и при условии, что рассматриваются только
ортогональные и нормированные базисы, положение иное. Дело
в том, что вместе с матрицей квадратичной формы, как
мы видели, преобразуется и матрица соответствующего
симметричного линейного оператора; если найден
канонический базис квадратичной формы, то одновременно найден
базис из собственных векторов симметричного оператора.
При этом коэффициенты квадратичной формы в
каноническом базисе («канонические коэффициенты») совпадают
с соответствующими собственными значениями оператора.
Но собственные значения оператора А суть корни
уравнения det(A — XE) = 0, которое не зависит от выбора базиса
^i = у Si + у £2 + у ^~Ь"2 ^4»
1 , , 1 , 1 , 1 ,
^2 = у 5l Г у ^2 — у ^3—у *4>
1 , 1 , , 1 с 1 ,
y^i-y^i-у^з—у^4>
о ^2 о" ?3 1 "о" ^4 >
■Si-
42 = —о" ^з i—о~ *•*»
•44 = у Si ■
111
у ^2 + у ?з 2" ^4 ^
§ 69] ЭКСТРЕМАЛЬНЫЕ СВОЙСТВА КВАДРАТИЧ. ФОРМЫ 241
и инвариантно связано с оператором А. Следовательно,
совокупность канонических коэффициентов формы (Ах> х)
определена однозначно. Что же касается канонического
базиса квадратичной формы (Ах, х), то он определён
с той же степенью произвола, с какой определена полная
ортогональная и нормированная система собственных
векторов оператора А: именно, не считая взаимных
перестановок этих векторов, можно любой из них умножить
на — 1; более общим является любое изометрическое
преобразование в собственном подпространстве,
отвечающем фиксированному собственному значению X.
§ 69. Экстремальные свойства
квадратичной формы
. Пусть в евклидовом пространстве R задана
квадратичная форма А(х, х). Будем рассматривать её значепия
на единичной сфере пространства R так, что (х, х) = 1,
и поставим следующий вопрос: в каких точках единичной
сферы значения формы стационарны! Напомним, что
дифференцируемая числовая функция /(#), определённая
для точек некоторой поверхности U, принимает по
определению в точке x0£U стационарное значение, если
в точке х0 производная функции / (х) по любому
направлению на поверхности U равна нулю. В частности,
функция f(x) стационарна в тех точках, где она достигает
максимума или минимума.
Задача о& определении стационарных значепий есть
задача на условный экстремум; одним из методов её
решения является метод Лагранжа, который мы сейчас
и используем *). Построим в пространстве R
ортогональный и нормированный базис и обозначим через 5Ь £г> •••> £п
координаты вектора х в этом базисе. В этих
координатах квадратичная форма будет иметь вид А (#, х) =
п
= 2 аФ&> а условие (х, #) = 1 запишется равенством
i, ; = 1
*) См., например, Ь. И. Смирнов, Курс высшей
математики, т. 1, стр. 392. Гостехиздат, 1951.
16 г. Е. Шилов
242 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
п
2 £? = 1. Следуя методу Лагранжа, построим функцию
г=1
п п
и приравняем нулю её первую частную производную
по Si(i = l, 2, ..., л):
п
2 2 «y£y-2X£i = 0 (i=l,2, ...,n).
/=i
После сокращения на 2 мы получаем уже знакомую нам
систему *) (§ 64)
(«и — Ь) &i 4- «12^2 + • • • + a<ir£n = О,
Д21?1 + (а22 — М ^2 + • • • + а>2г&п = 0,
«mSi + ап&ъ + . .. + (апп — X) En = О,
которая служила для определения собственных векторов
симметричного оператора, отвечающего квадратичной
форме А(х, х)\ отсюда вытекает следующее предложение:
Квадратичная форма А(х,х) принимает
стационарные значения на тех векторах единичной сферы, которые
являются собственными векторами симметричного
оператора А, соответствующего форме А(х, х).
Вычислим сами значения, которые принимает форма
в стационарных точках. Для этого введём соответствующий
симметричный оператор А и представим квадратичную
форму в виде А(х> х)~(Ах, х). Так как по доказанному
форма А(х,х) принимает стационарное значение на
некотором собственном векторе в{ оператора А, то мы имеем
Ае{^\{е[\ отсюда
А(<ч, р{)^{А'и *ч) = >ч(<ч, с4Н>ч.
*) Ifanov.miii. что atj~a,ji(iy / = 1, 2, . .., п).
§ 70] КВАДРАТИЧНАЯ ФОРМА НА ПОДПРОСТРАНСТВЕ 243
Итак, стационарное значение формы А(х, х) при х~ех
равно соответствующему собственному значению
оператора А. Так как собственные значения оператора А
совпадают с каноническими коэффициентами формы А(х, х),
то мы можем, далее, заключить, что стационарные
значения формы А(х, х) совпадают с её каноническими
коэффициентами.
В частности, максимум формы А (х, х) на единичной
сфере равен наибольшему из её канонических
коэффициентов, минимум — наименьшему.
Задачи
1. Доказать последнее утверждение непосредственной
выкладкой.
2. Каковы при | х \ — 1 стационарные значения квадратичной
формы
А{х, х) = х\ + -*- + -^- (* = (#!, х2, х3))
и каков их характер?
Отв. Максимум при х = (± 1, 0, 0), где А(х, ж) = 1.
1
Минимум при # = (0, 0, ±1), где А(#, я) = -^- .
1
Минимакс при # = (0, ± 1, 0), где А (#, #)= —
(г. е. при движении по единичной сфере в одну сторону от точки х
функция А(#, х) возрастает, а в другую—убывает).
§ 70. Квадратичная форма на подпространстве
Как билинейную, так и квадратичную форму А (х, х) можно
рассматривать не во всём n-мерном пространстве i?n, а* в
некотором Л-мерном подпространстве Rk с i?n, и разыскивать в этом
подпространстве ортогональный и нормированный канонический
базис. Пусть форма А (х, х) во всём пространстве Rn имеет
канонический вид
А(*>*)«Х15} + Х168+...+ХЛе», (4)
а в подпространстве Щ — канонический вид
А (х, х) = Нх* + y2t] + ... + iv!>
16*
244 КВАДРАТЙЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
Выясним, как связаны коэффициенты p.lf ц2. ..., p-ft с
коэффициентами Xlf Х2, ...Хп. Для удобства предположим, что нумерация
канонических коэффициентов произведена в порядке их убывания,
так что
Xi^Xa> ...>Xn, [х1>[л2> ... ^fxfe.
Величина Xlf как мы уже знаем, есть максимальное значение
квадратичной формы А {г, х) на единичной сфере пространства Rn;
аналогично ^ есть максимальное значение квадратичной формы
А (х, х) на единичной сфере подпространства Rk и потому [лх ^ Хх.
Покажем, что f4^^n-ft+i-
Для этого предварительно отметим следующий результат,
легко вытекающий из рассмотрений § 15, п. 4:
Лемма. Если в n-мерном пространстве Rn выделены два
подпространства Rp и Rqt% размерности которых р и q в сумме
превышают число Пу то пересечение Rp и Rq имеет размерность, не
меньшую, чем p-\-q — п.
Переходим к доказательству неравенства цх > Xn_fe+1 • Пусть
elt e2, ...,en—канонический базис формы А(#, х), в котором
она записывается в виде (4). Рассмотрим (п—к + 1)-мерное
подпространство i?', порождённое векторами elf e2, ..., en_fe+1.TaK
как ft + (n—Лг-Ь 1) = /г +1 > п, то подпространства R' и Rk в силу
нашей леммы имеют хотя бы один общий ненулевой вектор.
Пусть это—вектор ж0={5(10), ..., 4°-ы-1» °» •••J0};
предположим, что #0 нормирован, т. е. что |ж0| = 1. Для вектора х0
по формуле (4) имеем:;
А (*„ *,) = Xtf? +...+ ln_k+ j gW\+ 4 >
>VK+i(^°>V..+eUi> = Vb+i-
Отсюда вытекает, что jtj как максимальное значение квадратичной
формы А (ж, ж) на единичной сфере подпространства Rk не может
быть меньше чем Xn—fe+1, что и требуется.
Таким образом, величина ^ заключена в следующих
границах:
Х1>Р-1>*п-ы-г * ^
Для различных Л-мерных подпространств величина цх
принимает, естественно, различные значения. Покажем, что существуют
такие к-мерные подпространства, для которых (хх принимает
крайние значения, указанные в неравенстве (5).
Рассмотрим подпространство R', порождённое первыми к
векторами ех, е2, ..., ек канонического базиса формы А (ж, х).
§ 70] КВАДРАТИЧНАЯ ФОРМА НА ПОДПРОСТРАНСТВЕ 245
В подпространстве R' в базисе ely e2l ..., ek форма А (я, х) имеет
вид
A(*la) = X16J + X168+...+Xfcej{.
В любом другом каноническом базисе подпространства R' форма
А(#, х) имеет вид
А (х, х) = |х1т| + |х2т| + ... + [xftx|,
причём в силу теоремы единственности § 68 и принятого порядка
нумерации канонических коэффициентов мы имеем |л1 = А1. Таким
образом, на подпространстве R' величина ^ достигает наибольшего
возможного значения Хх.
Рассмотрим теперь подпространство R", порождённое
последними к векторами en_fe+1, еп_к+2> •••» еп канонического базиса
формы А(х, х). В подпространстве R" в базисе *n__fe+1, ..., еп
форма А (х, х) имеет вид
A (z, *)=V-JH-i6£-Vbl+"-+Xnen-
В произвольном каноническом базисе подпространства R" форма
А (#, х) принимает вид
А (я, х)=[а^! + wi • • • + Wh-
Так же как и выше, мы заключаем, что (J-i==An_^^.i»
Следовательно, на подпространстве R" величина (хх достигает своего
наименьшего значения Xn_fe+1.
/ Мы получаем, таким образом, новое определение
коэффициента Xn__ft , 4; коэффициент Xn_fe , j в канонической записи формы
А(х, х) равен наименьшему значению максимума квадратичной
формы А (ж, х) на единичных сферах всех возможных к-мерных
подпространств пространства Rn,
Используя это свойство, мы можем дать оценки для
остальных канонических коэффициентов формы А (х> х) на
подпространстве Rk. Например, если фиксировано подпространство Rk, ц2 есть
наименьший из максимумов квадратичной формы А (х, х) на
единичных сферах (к— 1)-мерных подпространств пространства i?fe.
В то же время Xn.ft+2 есть наименьший из максимумов
квадратичной формы А (х, х) на единичных сферах всех (к—1)-мерных
подпространств пространства i?n; поэтому (x2^Xn_fe+2- Аналогично
H^K-k+Z'P^K-k+b' •••> V-k^K- G ДРУгой стороны, Х2 есть
наименьший из максимумов квадратичной формы А (х, х) на
единичных сферах (п—1)-мерных подпространств пространства Rn\
но каждое (л —1)-мерное подпространство пересекается с
подпространством Rfr согласно нашей лемме по подпространству,
246 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
имеющему не менее (л-—1) +А-—п — к—1 измерений; поэтому число
Х2 не менее чем наименьший из максимумов формы А (х, х) на
единичной сфере этих подпространств и, в частности, не менее
чем число |х2 наименьший из максимумов формы А (#, х) на
единичных сферах к — 1-мерных подпространств пространства i?fe.
Следовательно, Х2^|х2- Аналогично Х3^(х3, ..., Xft^jife. Итак,
канонические коэффициенты [л1? jx2, ..., \^k удовлетворяют
неравенствам
} W
г
Задача
Показать, что каждая из величин \ilf (л2, ..., (xfe может
достигать крайних границ, указанных в неравенствах (6).
При к = п— 1 неравенства (6) приобретают следующий вид:
Х2^(х2 ^ Х3,
^п_1>^п_1
(6')
Если (я ■—1)-мерное подпространство Яп-1, на котором
рассматривается квадратичная форма А (х, х), задано своим уравнением,
например, вида
ai5i + «i6i+...+anen = 0 . C«? + «l+--.+«i=l) (6i)
то коэффициенты ц1? ц2 ^n—i М0ГУТ быть вычислены
эффективно.
В предположении, что все числа Х1? Х2, ... , Хл различны,
приведём метод вычисления этих коэффициентов,
принадлежащий М. Г. Крейну.
Из коэффициентов alt <х2, . . ., ап по крайней мере один отличен
от нуля. Пусть, например, ап ф 0. Тогда из уравнения (6Х) мы
П-1
1 VI
получаем: £п = Tj afii- Подставляя £п в выражение квадра-
/-1
п
тичной формы А (х9 #) = т. ^ft»l, мы получаем: в подпростран-
h-1
§ 70] КВАДРАТИЧНАЯ ФОРМА НА ПОДПРОСТРАНСТВЕ 247
стве #n_j в координатах tlt g2, . . ., 5П_1 форма А (ж, х) имеет вид
п-1
A(x,*) = X15I+X16I+. ... +Хп_16Ь_1 + ^(2в/е/)2''
; = 1
Канонические коэффициенты этой квадратичной формы
определяются как её стационарные значения на единичной сфере
подпространства Яп_1 (§ 69); эта последняя в координатах glf g2, ...
• • чЛп-\ имеет уравнение
п-1
B(*f«)=6! + gi + ...+6Ui + ^(Say6y)S==1-
У-1
Для определения стационарных значений действуем, как
ц ранее, по методу Лагранжа: составляем функцию
п п—1
А(*, *)-№(*, *)= ^ (^/—a) g;. + ^ji^2 aygy)2
;-1 " /-1
и приравниваем нулю её частные производные по gfe(fc=l, 2, ...
...,я-1)
п-1
/=i
Искомые коэффициенты р.1? {а2, . .., цп-1 являются корнями того
уравнения, которое получается, когда мы приравняем нулю
определитель D(k) системы линейных уравнений (б2). Матрица из
коэффициентов этой системы есть, очевидно, сумма двух матриц,
первая из которых диагональна, с числами Xfe — X по диагонали
(к — 1, 2, ...,я—1), а вторая имеет вид
а1а1 а2«1 • • • ап-1а1
ахо.г а2а2 . . . an_ja2
а1аП-1 а2аП-1 •" «n-lV-l
В силу линейного свойства определителей (§ 3, п. 3) искомый
определитель равен сумме определителя первой матрицы и всех
248 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
определителей, полученных заменой некоторых столбцов
определителя первой матрицы йа соответствующие столбцы второй
матрицы Г с учётом множителя -^— J . Поскольку всякие два столбца
второй матрицы пропорциональны, достаточно рассматривать
только те случаи, когда один из столбцов определителя первой
матрицы заменён на соответствующий столбец второй матрицы.
Если, в частности, к-и столбец первой матрицы заменён на #-й
столбец второй матрицы, то соответствующий определитель имеет
следующее значение:
П (*,—А)
:* ;-i
Введём обозначения
w-1
Е(к)-- П (Afc — А) (определитель первой матрипы),
fe=i
G(X)=J[(Xk-X).
ft-i
Тогда искомый определитель />(Х) примет вид
п-1
^MW + ^WSt^t
(63)
fc=l
Решая уравнение D(K) = 0, мы и найдём интересующие нас
величины |х1? (х2, ...,^n_i. Заметим, что они зависят не от самих
чисел ау, а от квадратов этих чисел; таким образом, если у одного
или нескольких коэффициентов уравнения (6j) изменить знак, то
§ 70] КВАДРАТИЧНАЯ ФОРМА НА ПОДПРОСТРАНСТВЕ 249
искомые канонические коэффициенты формы А (ж, х) на
подпространстве Rn^i не изменятся.
Формула (63) интересна ещё и потому, что она позволяет
построить по данным числам ц1? (х2, ..., М-П_р удовлетворяющим
неравенствам (6'), подпространство /?n__j, на котором форма
А (х, х) имеет канонические коэффициенты jij, |л2, ..., M-n_j (в
предположении, что числа Х1т Х2, ...,ХП различны).
Заметим, что формулу (63) мы можем записать в виде
п-1 Л п
^G(X)~""G(X)+2j Г
D(\) n2E(k) v «J v oft
fc-i fe fe-1 ft
таким образом, .числа а?, а?, ..., a^ пропорциональны
коэффициента^)
там разложения рациональной функции ' на простейшие дроби.
G (л;
Пусть заданы числа jij, «л2, ..., ^n-r удовлетворяющие нера-
П-1
венствам (6')- Положим Z>x (X) = ТТ (jxft — X) и разложим рациональ-
Ную фуНКЦИЮ "° "™™«™"*"« тг«л*„.
(65)
Покажем, что коэффициенты clf с2, ..., сп — одного знака. Известно,
что эти коэффициенты вычисляются по формулам *)
п • на простейшие дрос
О (К)
D1(X) cx с2
С(\) -Xi-X^Xa-X"1"*
)и:
•+х„-х
Z),(Xk) А(Хй)
к (Xft-X1)...(Xk-Xk_1)(Xfe-Xk+1)...(Xk_Xn) С'Ай)'
Числа jDx (Хх), Z)x (Х2), .. 4, Z^ (Хп) имеют попеременно
противоположные знаки, поскольку корни многочлена Dx (К) по условию
перемежаются с корнями многочлена G (X). Числа Gf (Xx), G' (Х2), ...
..., G' (Хп) также имеют попеременно противоположные знаки,
поскольку Хц Х2, ..., Хп—простые корни многочлена G(k). Поэтому
отношения ■ , п , а с ними и коэффициенты cfe имеют одинаковые
*) См., например, М. Гребенча, С. Новосёлов, Курс
математического анализа, стр. 405. Учпедгиз, ,195^.
250 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
знаки. С точностью до множителя можно все коэффициенты ck
считать положительными, а их сумму — равной единице, и тогда
определить числа olf а2, ..., ап из условий
а! = с1> а|=с2, ..., < = V (66)
Числа oj, оа, ..., ап можно взять любого знака. Покажем, что
подпространство Яп_г, определяемое уравнением
«i5i + «2^2+ ... +а„%п:==0>
и будет искомым.
Действительно, многочлен D(k), корни которого суть
канонические коэффициенты формы А(х, х) на подпространстве Яп_3,
по доказанному выражается с помощью формулы (63) или
эквивалентной ей (64). Сравнивая (64) и (65) и учитывая (66), мы
получаем, что многочлен В(к) отличается только числовым
множителем от построенного нами многочлена Dx (X). Но тогда корни
многочлена D(K) совпадают с числами [Llf ц2, ..., р-п_3, что и
утверждалось.
Замечание. Можно показать, что задача о построении
подпространства Rk, на котором квадратичная форма А (х, х) имеет
канонические коэффициенты jxlf ja2, ..., [*fe, удовлетворяющие
неравенствам (6), имеет решение и в общем случае (т. е. не только
при к=п—1 и не только при условии, что все числа Х1} Х2, ..., \п
различны).
§ 71. Канонические коэффициенты сравнимых
квадратичных форм
Квадратичные формы А (ж, х) и В (х, х) называются
сравнимыми, если для любого х£Й выполняется неравенство А (х> х)^
^ В (х, #). Пусть Х2 ^ Х2 > ... ^ Хп — канонические коэффициенты
формы А (х, х), {хх > (х2 >. ... > [лп — канонические коэффициенты
формы В (#, х). Покажем, что для любого к (l^&O) имеет
место неравенство Xfe ^ (xfe *). Но это утверждение непосредственно
вытекает из свойства канонических коэффициентов, приведённого
в предыдущем параграфе: так как Xfe равен наименьшему из
максимумов формы А(х, х) на некоторой системе подпространств, a \t.h
равен наименьшему из максимумов формы В (х, х) на той же
системе подпространств, то, поскольку всюду А(х, х)^.В(х, х), мы
имеем Xfes^|Aft, что и требуется.
*) Оно было бы очевидным, если бы формы А (х, х) и В (х, х)
имели общий канонический ортогональный и нормированный базис.
§ 72] ЗАДАЧА О ПАРЕ КВАДРАТИЧНЫХ ФОРМ 251
§ 72. Задача о паре квадратичных форм
и её решение
В некоторых вопросах математики и физики
существенную роль играет решение следующей задачи: для двух
квадратичных форм А (х, х) и В(х, х), заданных в п-мер-
ном аффинном пространстве /?, указать базис, в
котором обе эти формы записываются в каноническом виде
(т. е. в виде суммы квадратов координат с некоторыми
коэффициентами).
Следующий пример на плоскости (п = 2) показывает, что эта
задача не всегда допускает решение.
Рассмотрим следующие две формы от двух переменных ij, £2:
В (х, х) = 6i5a.
Найти общий канонический базис для этих форм—означает
найти общую пару взаимно сопряжённых векторов для гипербол
А (ж, л;)= 1 и В (х, #) = 1 (см. § 44, п. 5). Эти гиперболы
равносторонние; из аналитической геометрии известно, что
сопряжённые направления таких гипербол симметричны относительно их
асимптот. Поэтому полярные углы <pi и <р2> отвечающие паре
сопряжённых направлений, для первой гиперболы связаны равенством
а для второй гиперболы —равенством
<Р1 + <Р2 = 0
(оба равенства с точностью до слагаемого, кратного ъ).
Так как эти равенства исключают одно другое, то в данном
случае общих взаимно сопряжённых направлений не существует.
Оказывается, что задача имеет решение, если
дополнительно допустить, что одна из этих форм, например
В(#, х)у положительно определённая (т. е. В(х, #) > О
при х Ф 0).
Существование решения легко установить следующим
путём. Пусть В (ху у) — симметричная билинейная форма,
соответствующая квадратичной форме В (ж, х). Введём
в аффинное пространство R евклидову метрику, полагая
(ос, г/) = В(ж, у).
252 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
Выполнение аксиом скалярного произведения
обеспечивается симметричностью и положительной
определённостью формы В(х, х).
В силу § 67 существует ортогональный и
нормированный (относительно введённой нами метрики) базис, в
котором форма А (ху х) принимает канонический вид
А (х, х) = \гц1 + Х2т]1 + ... + Kill (7)
(т]ь f]2> • • •> ^п —как и всегда, координаты вектора х в
построенном базисе). В этом же базисе вторая квадратичная
форма В(х, х) в силу формулы (17) § 50 имеет вид
В(я,а)Н*.*) = ч! + ч1+•••+<•
Итак, базис, в котором обе формы имеют канонический
вид, существует.
§ 73. Эффективное построение искомого базиса
Используем для вычисления координат векторов
искомого базиса экстремальные свойства квадратичных форм.
Как было показано в § 69, векторы искомого базиса суть
те векторы, которые подчинены условию (#, х) = В (х> х) = 1
и для которых форма А(х, х) принимает стационарные
значепия. Положим, что в исходном базисе формы А'(х, х)
и В(х, х) имели следующие выражения:
п п
А (я, аг)= 2 aifcWfc> B(s, я)= ^ taWfe.
г, fe=l г, fe=l
Действуя по методу Лагранжа, мы должны составить
функцию
п п
^(|ъ Es, • • • ,6»)= 2 «ikMk-l* 2 6**&
г, fe = l i, fe = l
и приравнять нулю её частные производные по всем
координатам:
п п
2 «»& - г 2 *«& = ° (i = l,2,..., •»). (8)
§ 73] ЭФФЕКТИВНОЕ ПОСТРОЕНИЕ ИСКОМОГО БАЗИСА
Полученная система однородных уравнений
(an — |лЬц) Si + («i2 —1^12) £2 + • • •
(a2i — pAi) Si + (a22 — ^22) £2 + • • •
253
{ani — l^niHi -Han2 —1^712) ^2+ • • •
• • • + (<*in — pbln) £n = 0,
• • • +{a>2n — \**Ь2п) Sn==0,
• • • + (dun — pbnn) in = 0
(9)
допускает непулевые решения тогда и только тогда,
когда её определитель обращается в нуль:
Ли —H-fcii Л12 —H-bi2 ' ' ' Лщ —jibln
«21 — ^^21 «22 — 1^22 ' ' ' «2n — |*^2n
Лш — Н-Ьщ «п2 — Н^
П2
«nn j^^n
(10)
Решая уравнение (10), мы находим п возможных
значений |i, = |ifc (А= 1, 2, .. . , и); подставляя ръ в систему (9),
. , £nk) соответ-
мы сможем найти координаты $fc), (&fe)>
ствующего искомого базисного вектора.
Теорема, доказанная в § 72, обеспечивает
существование вещественных корней определителя системы (9) и
для каждого кратного корня — наличие соответствующего
числа линейно независимых решений этой системы.
Переходим к вычислению канонических
коэффициентов. Покажем, что коэффициенты Хь Х2, . . . , Хп в кано-
пической записи (7) формы А(х, х) совпадают с
соответствующими корнями определителя системы (9) |аь
^2, • • • , [ап- Здесь можно было бы использовать
рассуждение, аналогичное проведённому в § 69; мы теперь
предпочитаем провести непосредственное вычисление. Если
для заданного корня |хт умножить i-o уравнение системы
254 КВАДРАТЙЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
на i-ю координату решения ^ш) (i = 1, 2, ... , п) и все
эти уравнения сложить, то получим равенство
г, fe = l
п
г, fe=l
так как В(ет, ет)= 1.
С другой стороны, канонические координаты %,%,...
• •. , ^ш для вектора ет имеют, очевидно, значения т]| = 0
п
при i Ф т, т]т == 1, и форма А (#, ж) = ^j Mf ПРИ # = ат
i = l
становится равной Хто. Отсюда jxm = X/n, что и требовалось.
Этот результат даёт возможность написать форму
А(х,х) в искомом каноническом виде, минуя
вычисление канонического базиса.
Задачи
1. Найти обшую пару сопряжённых направлений у кривых
г2 ,,2
2. Построить линейное преобразование, переводящее две
квадратичные формы
А(х, *) = g? + 2g1g2 + 2g?i-2gJg3 + 3gi,
В (х, х) - g} + 2g2g2 + 3gf + 2g2g8 - 2gxg3 + 6g;
к каноническому виду; указать канонический вид.
Отв. А (х, х) = Y)« + т,| + i)J, В (я, я) = 7]| + 2т4| + 3iq|,
5i = TQi — TQe + 2т|8, g2=-ri2 — rj3, g3 = v]3.
§ 74. Вопросы единственности
Поставленная в начале § 72 задача об одновременном
приведении к каноническому виду двух квадратичных
форм А (х, х) и В(х,х), из которых, например, В(х, х)
положительно определена, решена нами в несколько уси-
§ 74) ВОПРОСЫ ЕДИНСТВЕННОСТИ 255
ленной форме; именно, форма В(х, х) приведена к виду
суммы квадратов координат с коэффициентами, равными 1.
Вообще говоря, это не требуется, и поэтому коэффициенты
преобразованных форм заведомо не определяются
однозначно. Мы покажем всё же, что отношения
соответствующих канонических коэффициентов не зависят от
способа одновременного приведения форм А(х, х) и В (х7 х)
к каноническому виду.
Пусть формы А(х, х) и В(ху х) двумя способами
приведены к каноническому виду: в координатах £ь ?2, ... , £п
п п
А (х, х) = 2 х^> в О*- х) = 2 Vi^'
г=1 г=1
а в координатах 7]ь ri2, . .. , rin
п п
А (ж, х) = 2 Prti, в (я, я) = 2 TiT^
Так как форма В (я, х) — положительно определённая,
числа Vj и Tj (£ = 1, 2, ... , гг) все положительны.
Рассмотрим новое преобразование координат
j/4Si = Si, Vr'Ci'4i=='4i.
Тогда формы А (ж, я) и В (я, х) преобразуются к виду
а) в координатах ^:
п п
А(*,*)=2^1, в (*,*) = 2 8;
г-1 г=1
б) в координатах щ:
п
A(x,x) = %£fil В(Ж,*)=2чг.
Пусть еь е2> ••• , еп — базис, отвечающий координатам^,
;г /ь /г» • • • > /п — базис, отвечающий координатам т\^
i> MCiowKo. определяемой формой В(х,х), оба эти базиса
i.'l ч )1\)1;альны и нормированы. Но тогда по теореме един-
256 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
ственности § 68 совокупность канонических
коэффициентов формы А(Ху х) определена однозначно; таким образом,
последовательность чисел — , —, .. . , — должна
совпадать с последовательностью — ,—,...,— с точностью
до порядка следования. Но это и есть то утверждение,
которое требовалось доказать.
Задача
Показать, что базис, в котором формы А (х, х) и В (х, х)
записываются в каноническом виде, определён однозначно с
точностью до числовых коэффициентов, если все отношения
hi hi hi
попарно различны.
§ 75. Распределение кривизны нормальных сечений
гладкой поверхности
Мы предполагаем известными следующие основные факты из
дифференциальной геометрии:
а) Векторное уравнение r = r(t) с дважды дифференцируемой
векторной функцией r(t) скалярного переменного t при условии
г' (t) Ф 0 определяет гладкую пространственную кривую (т. е.
кривую с непрерывно вращающейся касательной). Будем обозначать
эту кривую буквой Г. При данном значении t — t0 вектор rt *)
направлен по касательной к кривой Г в точке, отвечающей
значению параметра t = t0. Длина этого вектора зависит от выбора
параметра t вдоль данной кривой; в частности,. если параметром
служит длина дуги 5 кривой Г, отсчитываемая от некоторой
фиксированной точки, то длина вектора rs = x равна единице. Равен-
I dj* I
ство -г = 1 можно записать в виде | dr | = ds, что уже не
зависит от выбора параметра.
б) Вектор rtt в общем случае не коллинеарен с вектором rt
и определяет вместе с ним соприкасающуюся плоскость кривой Г
при £ = £0; её положение не зависит от выбора параметра t. Если
параметр снова есть длина дуги, то rss = zii = kv, где v
—единичный вектор, направленный по той нормали к кривой Г, которая
лежит в соприкасающейся плоскости (эта нормаль называется
главной нормалью) в сторону вогнутости кривой Г, & — поло-
*)'Мы употребляем символ rt как сокращённое обозначение
„ dr
производной ~г .
§ 75] РАСПРЕДЕЛЕНИЕ КРИВИЗНЫ НОРМАЛЬНЫХ СЕЧЕНИЙ 257
жительный коэффициент, называемый кривизной кривой V в точке
t = t0 (он равен пределу отношения угла поворота касательной
к соответствующему приращению дуги, когда это последнее
стремится к нулю).
в) Векторному уравнению r = r(u, v) с двумя скалярными
параметрами и дважды дифференцируемой по этим параметрам
функцией г (и, v) (причём вектор ги предполагается неколлинеар-
ным с rt) отвечает некоторая поверхность П. Линии u = Clt v = C2
образуют на этой поверхности координатную сеть. Уравнения
u = u(t), v=;v(t) с дважды дифференцируемыми функциями u(t)
и v (t) (uf + vf Ф 0) определяют на поверхности П гладкую
кривую Г. Дифференцируя её векторное уравнение r*=r[u(t), v(t)],
получаем:
dr = rudu -f rvdv. (11)
Таким образом, касательный вектор ко всякой гладкой кривой
на поверхности П в данной точке поверхности линейно выражается
через векторы ги и rvt которые, очевидно, являются
касательными к координатным линиям, проходящим через данную точку.
Поэтому все касательные векторы в данной точке поверхности
заполняют некоторую плоскость S — касательную плоскость
к поверхности П.
Возведя равенство (11) в скалярный квадрат, мы получим
выражение для квадрата дифференциала дуги кривой Г:
ds* =г | dr |2 = (ru, ru)du* + 2 (ru, rv) du dv + (r„ rr) dv\
Скалярные произведения, являющиеся коэффициентами
полученной квадратичной формы относительно переменных du, dv,
обозначаются буквами E = (ru, ru), F — (ru, rv), G — (rv, rv)\ таким
образом,
ds* = Е du* + IF dudv+G dv\ (12)
Вычислим теперь кривизну кривой Г в данной её точке. Для
этого найдём вторую производную функции г [u(t), v(t)] по дуге s:
, d*r d .
— гши\ + 2ruvusvs + rtvv\ + ruu8S + rtvea.
Полученное равенство умножим скалярно на единичный
нормальный к плоскости S вектор т (из двух возможных направлений
его выбрано и фиксировано любое): при этом обозначим L — (ruu, m)\
M = (ruv, m), N = (rvv, m) (скалярные произведения (ги, т)
и (rT, m), очевидно, обращаются в нуль)
17 Г. Е. Шилов
258 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
Скалярное произведение (v, m) есть косинус угла 8 между вектс
ром v, определяющим направление главной нормали к кривой Г,
и вектором т, идущим по нормали к поверхности.
Положим Лг cos 8 = Лгп; число кп называется нормальной
кривизной поверхности в данной точке по данному направлению
(т. е. по тому направлению, в котором проведена кривая Г;
очевидно, кп не зависит от того, какая именно кривая проведена
по этому направлению). В частности, если линия Г есть
сечение Гп поверхности плоскостью, проходящей через нормальный
вектор т (такие линии называются нормальными сечениями
поверхности-), то 9 = 0 или тс и, следовательно, Ttn—^rk. Таким
образом, кп по абсолютной величине равна кривизне нормального
сечения, проведённого в данном направлении. Знак величины кп
указывает на направление вогнутости кривой Гп; именно, lin > 0,
если 6 = 0, т. е. вектор v главной нормали к кривой Гл
совпадает с вектором т, и Тсп < 0, если вектор v противоположен
вектору т. Формула (13) теперь принимает следующий вид:
Теперь мы выясним, как зависит нормальная кривизна в данной
точке от направления, которым она определяется. Заметим, что
это направление задаётся вектором dr-=^rudu -f rvdv, касатель-
ным к кривой X, или просто отношением -=- . Формула (13) и дает
решение поставленной задачи; именно, она определяет Тсп в
зависимости от т- • Далее мы будем исследовать эту формулу.
Прежде всего заметим, что квадратичная форма
(12)—положительно определенная, поскольку её значение для любых
значений du и dv равно квадрату соответствующего дифференциала
дуги.
Мы можем теперь, используя общую теорию § 72, найти на
касательной плоскости новый базис е1у е2, в котором обе формы
(dr, dr\ = ds2 = E du2 + 2F du dv + G dv2 (первая)
(dr, dr)n = kn ds2 = Ldu2 + 2M dudv + N dv2 (вторая)
примут канонический вид. Для этого построения необходимо
ввести на плоскости скалярное произведение, определив его для
любых двух векторов drx и dr2 как значение симметричной
билинейной формы, соответствующей первой квадратичной форме.
Образуем эту билинейную форму; если координаты векторов dr1
и dr2 в базисе ru, rv обозначить соответственно через duv dvx
§ 75] РАСПРЕДЕЛЕНИЕ КРИВИЗНЫ НОРМАЛЬНЫХ СЕЧЕНИЙ 259
и du2, dv2, то билинейная форма будет иметь вид
(drlt fi?r2)j = Е dux du2 -f F du1dv2 + F du2 dvl -f G dvx dv2.
Но очевидно, что это выражение есть обычное скалярное
произведение векторов
drx — ги dux + rv dvx и dr2 = ru du2 -f rv dv2.
Поэтому скалярное произведение, определяемое билинейной
формой (drlf dr2)v совпадает с обычным скалярным произведением
(dri, dr2). Искомый канонический базис elf e2i который по
построению § 72 является ортогональным и нормированным относительно
скалярного произведения (drXi dr2)v будет ортогональным и
нормированным в обычном смысле. Итак, на касательной
плоскости S существует ортогональный и нормированный базис elt e2,
относительно которого квадратичные формы I и II записываются
в каноническом виде (dr = t1e1 + £2е2):
(dr, dr)n = Хх51 + Х2С1 (dr, dr)x = g} + g.
Поэтому в базисе еь е2 формула (14) для нормальной кривизны
примет следующий вид:
* _*iS? + X2SS
п~~ Й + С1 '
С2
Отношение с2 * 2 есть, очевидно, квадрат косинуса угла <р, обра-
П + ^2
£2
зованного векторами dr и еА; аналогично, ^ есть квадрат
Ь1 ~Г $2
синуса этого угла; следовательно,
кп = \х cos2 <р +l2 sin2 <p = А*п (<р )•
Коэффициенты Хх и Х2 легко определяются при подстановке
в эту формулу значении <р = 0 и <p = -rf • ПРИ ср = 0 получаем:
*i = M0),
т. е. Хх есть нормальная кривизна, отвечающая вектору ел.
Аналогично \2 есть нормальная кривизна, отвечающая вектору е2.
Числа ki=skn(0) и к2 = кп ( -^- J называются главными кривизнами
поверхности П в данной точке. Направления векторов ех и е2
называются главными направлениями на поверхности «У. Мы
получили формулу Эйлера, выражающую нормальную кривизну для
любого направления через главные кривизны и угол <р:
%п (<р) =1^ cos2 ? + &2 sin2 ср.
17*
260 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
Чтобы графически изобразить изменение кривизны в зависимости
от угла <р, рисуют на плоскости S кривую с полярным
уравнением
1
К I *„(?)!
или, что то же,
Эта кривая есть объединение двух кривых 2-го порядка с
главными осями, идущими по векторам ех и е2:
(индикатриса Дюпена); она даёт геометрически наглядную картину
распределения нормальной кривизны в данной точке поверхности.
В частности, очевидно, что нормальные кривизны кг и &2 суть
наибольшее и наименьшее из всех значений нормальной кривизны
поверхности II в данной точке. Впрочем, это можно легко
получить и# из общей теории экстремальных значений квадратичных
форм; действительно, канонические коэффициенты квадратичной
формы по § 73 совпадают со стационарными значениями этой
формы при условии (dr, rfr)T = l; но из формулы (14) при условии
(dr, Jr)j==l мы получаем, что (dr, с^*)ц = Лп> следовательно,
стационарные значения формы (dr, dr)u при условии (dr, dr)j=l суть
стационарные значения нормальной кривизны; так как в данном
случае имеется всего два стационарных значения, то они должны
быть именно максимумом и минимумом нормальной кривизны.
Теперь выпишем формулы для вычисления главных кривизн
и главных направлений в данной точке поверхности.
Пусть (da, <ft))«— вектор на плоскости S, определяющий
главное направление. Формулы (9) § 73 в нашем случае приобретают
следующий вид:
(L — pJS) du + (М — |xF) dv = 0,
(М — pF)du + (N—y.G)dv
а уравнение (10) § 73 записывается в виде
L—рЕ М— y.F
-0, 1
= 0, J
(15)
= 0. (16)
Корни уравнения (16) в силу § 73 совпадают с коэффициентами
Хх и Х2 преобразованной формы (dr, dr)lv т. е. по доказанному
со значениями главных кривизн. Подставляя каждый из этих
корней в систему (15), мы найдём координаты du и dv для
соответствующего главного направления. Впрочем, в данном случае можно
§ 76] МАЛЫЕ КОЛЕБАНИЯ МЕХАНИЧЕСКИХ СИСТЕМ
261
непосредственно написать уравнение для определения
отношения -г-. Систему (15) можно переписать в виде
1. (Ldu + Mdv)—p(Edu + Fdv) = 0,
1. (Mdu+N dv)—y.(Fdu + Gdv) = 0,
откуда вытекает, что
Ldu + Mdv Edu+Fdv
Mdu + Ndv Fdu + Gdv
Разделяя каждую строку определителя на du, находим:
,dv
du
, dv
= 0.
L + M-j-
du
E + F-
M + N
dv
du
F + G
du
= 0.
(17)
dv
du
Два корня полученного квадратного уравнения относительно
dv
дают два значения отношения -г-, определяющие два главных
направления. Рассматриваемое не в одной точке, а на целом
участке поверхности уравнение (17) представляет собой
дифференциальное уравнение семейства линии, которые в каждой точке
поверхности П касаются одного из главных нормальных сечений;
эти линии называются линиями кривизны поверхности П.
§ 76. Малые колебания механических систем
Мы предполагаем известными следующие факты из
теоретической механики:
а) Положение механической системы с л степенями свободы
задаётся значениями п обобщённых координат qlf д2, ..., дп-
Кинетическая энергия этой системы, равная сумме произведений масс
точек системы на полуквадраты их скоростей, выражается в виде
некоторой квадратичной формы относительно величин дц д& • • -> Яп
(точка сверху означает дифференцирование по времени)
коэффициенты которой суть функции от координат gi (i = 1, 2, ..., п)
и времени. Потенциальная энергия системы есть некоторая
функция от координат gi и времени
262 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ;ПРОСТРАНСТВЕ [ГЛ. 10
б) Уравнения движения системы (уравнения Лагранжа)
в любой системе обобщённых координат имеют следующий вид:
Ц^)-щ(Т-и)=0 (,=1,2 п)- (18)
В стационарных внешних условиях Т и U явно от времени
не зависят; в дальнейшем это будет предполагаться без особых
оговорок.
Пусть теперь дх = q\, ..., Яп = Яп есть состояние равновесия
системы. В состоянии равновесия тождественно (по t) равна нулю
кинетическая энергия системы, так как </£ = 0, а также и её
производные по qif которые представляют собой линейные формы от
^•(/ = 1,2, ...,п)\ поэтому величины q\, q°2, ...,?n
удовлетворяют уравнению
dq{
Иными словами, положения равновесия возможны только в
стационарных точках потенциальной энергии. Можно показать, что
точка минимума потенциальной энергии отвечает устойчивому
положению равновесия. Рассмотрим такую точку минимума. Без
ограничения общности можно считать, что обобщённые
координаты glt q2i ..., qn обращаются в этой точке в нуль и само
значение потенциальной энергии также равно нулю. Если
ограничиться изучением движения в малой окрестности нулевой точки,
то можно считать коэффициенты квадратичной формы Т
постоянными (равными своим значениям в нулевой точке);
потенциальную же энергию U, отбрасывая в её разложении Тейлора члоны
выше 2-го порядка, можно считать квадратичной формой
относительно координат qi (i — 1, 2, ..., п) с постоянными
коэффициентами:
п
Так как обе формы U и Т положительно определены, то
существует линейное преобразование переменных qi в переменные *г)|
Я.
"i=2 V1; (*===1' 2' ••■' л>'
п
*i=2 CiA'
/=1
§ 76] МАЛЫЕ КОЛЕБАНИЯ МЕХАНИЧЕСКИХ СИСТЕМ 263
приводящее формы U и Т к виду
п п
i=l i=l
В обобщённых координатах т). (* = 1, 2, ..., и) уравнения Лагранжа
(18) записываются следующим образом:
Эти уравнения могут быть легко решены: именно,
^i = ^iC0S(0i('--*i)>
где константы ^ ж Аь определяются из начальных условий
(начальных значений координат т). и г)г). Величины о^ называются
собственными частотами системы или, пользуясь акустической
терминологией, высотами тонов системы. Следовательно, каждая
из координат т^ совершает гармоническое колебание с
фиксированной собственной частотой o>i# В силу теоремы единственности § 74
высоты тонов системы однозначно определяются заданием
потенциальной и кинетической энергии системы и не зависят от выбора
преобразования (19).
Фактическое выражение координат qi через t]i (или наоборот)
и вычисление собственных частот проводятся методами § 73.
Мы остановимся сейчас на некоторых общих теоремах о
характере малых колебаний механической системы.
Допустим, что у рассматриваемой системы увеличилась
жёсткость; иными словами, потенциальная энергия U заменилась
на U' > U при неизменной кинетической энергии Т. При этом
каждая собственная частота o>i заменяется на ь>[ > о>. (§ 71).
Следовательно, при увеличении жёсткости системы высоты её тонов
увеличиваются или по крайней мере не уменьшаются.
Допустим, что у рассматриваемой системы увеличилась
инертность; иными словами, потенциальная энергия U не изменилась,
а кинетическая Т заменилась на Т">!Г. Покажем, что это
влечёт, вообще говоря, уменьшение высоты тонов системы.
Действительно, формы U и Т обе положительны, и мы могли бы привести
их к каноническому виду иным образом, именно,
п п
(т1? т2, ..., тп —новые координаты). По теореме единственности § 74
получающиеся при этом числа Х{ обратны соответствующим числам
(о)х ^ о>2 ^ ... ^ о)п > 0).
264 КВАДРАТИЧ. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. 10
«Dj (i'ei, 2, ..., п). Поэтому уравнения Л'агранжа в координатах т{
Xfx. + T^O (*=1, 2, ..., п)
можно переписать так:
t4 + «*T4 = 0.
Решения этих уравнений снова суть гармонические колебания
с частотами о>4. При увеличении инертности системы каждое
число X. заменяется на X? ^ Х4; поэтому каждая частота о>4
заменяется на о)С ^ о>^. Следовательно, при увеличении инертности
системы высоты ее тонов уменьшаются или по крайней мере не
увеличиваются.
Допустим, что на рассматриваемую систему наложены п — г
связей вида
ail*i.+ fli2?2+ •••+flrin?n=:0 C=1» 2> •■.,*-'•)• (20)
В результате паша система будет системой уже не с п, а только
t r степенями свободы *). Спрашивается, что можно сказать о её
новых высотах тонов? Если обозначить эти тоны через vx, v2, ..., vr,
-причём vj > v2> ... >. vr> то, поскольку числа v4 суть
канонические коэффициенты формы i/ на подпространстве, определяемом
уравнениями (20), мы можем непосредственно написать
неравенства, полученные в § 70:
wi > V! > %__г+1.
«r>vr>«n.
Эти неравенства определяют границы, в которых заключается
каждая собственная частота системы, на которую наложены
связи (20).
*) Предполагается, что все уравнения системы (20) независимы,
или, что то же самое, ранг матрицы ||а$у|| равен числу
уравнений системы (20).
ГЛАВА И
ПОВЕРХНОСТИ 2-ГО ПОРЯДКА
§ 77. Приведение общего уравнения поверхности
2-го порядка к каноническому виду
Поверхностью 2-го порядка в n-мерном
пространстве мы будем называть геометрическое место точек
^ = (£i> ^2> ••♦> £п), удовлетворяющих уравнению вида
п п
2 аЛ + 2 2^ + с==0 (1)
i,ft=l i = l
или
А(х, х) + 21{х) + с = 0,
п
где A(xt х) = 2 aift^h — квадратичная форма от радиус-
i,fe=l
п
вектора точки х, l(x)=Jt Ь^ —линейная форма, с —по-
г=1
стоянная *).
Пространство /? будем считать евклидовым и числа
£ь ^2> ••> £п — координатами вектора х в ортогональном
и нормированном базисе. Задачей настоящего пункта
является выбор в пространстве R нового ортогонального
*) В случае п = 2 геометрический образ, определяемый
уравнением (1), называется кривой 2-го порядка. Однако в
дальнейшем мы всюду употребляем слово «поверхность», не
оговаривая каждый раз, что при гс==2 его нужно заменить словом
«кривая».
266 ПОВЕРХНОСТИ 2-ГО ПОРЯДКА [ГЛ. 11
и нормированного базиса и нового начала координат так,
чтобы наша поверхность 2-го порядка определялась
некоторым специальным и особенно простым уравнением,
которое называется каноническим. В дальнейшем по капо-
ническому уравнению мы изучим свойства поверхности.
Совершим прежде всего в пространстве R
ортогональное преобразование координат
п
*=2вд (i==1- 2> •••>")> (2)
как указано в § 67, с тем, чтобы в новых переменных
квадратичная форма А (я, х) преобразовалась к
каноническому виду
п
А (х, я)=2Х^г
i=l
Уравнение (1) будет после подстановки (2) иметь вид
п п
2^ + 22^ + с = 0, (3)
i=i i = l
где U (i — 1, 2, . . ., га) — новые коэффициенты линейной
формы 1(х).
Если в полученном уравнении \{ Ф 0 для некоторого &',
то переносом начала координат можно добиться
исчезновения соответствующего члена первого измерения. Пусть,
например, \г Ф О, тогда, очевидно,
Mi+2/mi=xl(14l+£)"-!-.
Положим ъ[ = тц + -~ ; это равносильно переносу начала
координат в точку ( — у-, 0, 0, .. ., 0 j . В результате
подстановки группа членов Х^ -f 2lifii заменится на
2 I2
^i^i -~ir» таким образом, член второго измерения оста-
нется с тем же самым коэффициентом Хь член первого
измерения пропадёт, свободный член получит добавок
§ 77] ПРИВЕДЕНИЕ К КАНОНИЧЕСКОМУ ВИДУ 267
— -~ . После всех таких преобразований уравнение поверх-
ности примет вид
М! + М! + • • • + М? + 2/r+i^r+1 + • • • +■ 2/п^п + с = 0.
Здесь опущены для простоты записи возможные штрихи
у координат, а сами координаты заново перенумерованы
так, чтобы вначале шли координаты, участвующие в
квадратичной форме, так что Хь Х2, ..., Хг отличны от нуля,
Xfe = 0 при к > г. Если при этом все числа /r+i, /r+2, • - -Лп
оказались равными нулю, то мы получаем каноническое
уравнение центральной поверхности
м?+мг+...+м?-и==о. (4)
Допустим, что среди чисел /r+i, .. ., ln имеется хотя бы
одно отличное от нуля. Тогда мы совершим новое
ортогональное преобразование координат по формулам
^i = 4i»
^2= %,
ТГ = 7]г,
где М — положительный множитель, обеспечивающий орю-
гональность матрицы преобразования: так как у
ортогональной матрицы сумма квадратов элементов каждой
строки должна быть равна 1, то
Остальные строки (следующие за (г + 1)-й) могут быть
произвольными, лишь бы полученная матрица была
ортогональной.
Это требование можно сформулировать в данном случае
следующим образом: элементами (г-ь2)-й, (r-f 3)-й, ..., /г-й строк
матрицы должны являться координаты векторов, образующих
ортогональный и нормированный базис в ортогональном
дополнении к (г -f 1)-мерному подпространству евклидова пространства Тю
порождённому векторами (1, 0, 0,...), (0, 1, 0, ..., 0), ..., (0, 0, ...
1
..., 1, 0, ..., 0), —-р- (0, 0, ..., 0Г> 'г-и> 'V+2' • • > *л)-
268 ПОВЕРХНОСТИ 2-ГО ПОРЯДКА [ГЛ. 11
Отсюда вытекает, что задача построения искомой матрицы
всегда разрешима.
В результате этого преобразования уравнение
поверхности приобретает вид
>^1+ • • • + ХГТ? = 2Л/ТГ+ ! — С.
Если с ф О, дальнейший перенос начала координат по
формуле
т;+1 = тг+1 — ^ > 2Мъ'г+1 = 2Мтг+1 — с
позволяет освободиться от свободного члена; уравнение
(опять с опущенным штрихом у последней координаты)
получает вид
^?+...+Хгт2 = 2Мтг+1; (5)
это — каноническое уравнение нецентральной поверхности.
Центральную поверхность будем называть вырожденной
конической, если в её уравнении вида (4) с = 0. Всякую
поверхность будем называть вырожденной цилиндрической,
если в её каноническом уравнении участвует менее чем
п координат. Все введённые названия будут разъяснены
в дальнейшем.
§ 78. Центральные поверхности
Центром поверхности называется точка х0 = (%1, £!>>•••
. ..,?п)> обладающая следующим свойством: если точка
(£? + £ъ £§ 1- £г> • • • An + 5n) лежит па поверхности, то
симметричная с ней относительно х0 точка (£? — ll9 bl — i*,...
...,££ —?n) также лежит на поверхности. У поверхности
с каноническим уравнением (4) существуют центры;
всякая точка, для которой т)1 = 7]2= .. . =т]г = 0, является,
очевидно, центром. Этим объясняется название этого
класса: центральные поверхности.
Покажем (это будет использовано в дальнейшем), что
никаких других центров у поверхности с уравнением (4)
не существует. Действительно, пусть (£g, £5» •••Да) есть
§ 78] ЦЕНТРАЛЬНЫЕ ПОВЕРХНОСТИ 269
центр этой поверхности. Тогда из условия
вытекает
^i(^-ei)2+x2(?e-s2)2+...+xr(^-y2+^o.
Вычитая второе равенство из первого, мы получаем:
Шг + Ы%+ • • • +М& = 0.
Возьмём на поверхности точку, в которой £2 = £3= . . .
. ..=$г = 0, ?i Ф 0. (Очевидно, что уравнению (4) можно
удовлетворить такими значениями.)
Тогда мы получим:
^ = 0,
откуда li = 0. Аналогично показываем, что £§ = .♦.=£? — 0,
что нам и требуется.
Рассмотрим сначала невырожденную центральную
поверхность, т. е. предположим, что г = п и с ф 0. Тогда
уравнение (4) легко преобразовать к виду
4--^1.-4--32-4- -4- У*1 —4
где числа а& определяются формулами
ak-
+ |/|-f I (* = 1, 2, ....fn);
они называются полуосями поверхности.
Перенумеруем координаты заново с тем, чтобы сначала
шли слагаемые с положительными знаками:
Случай А —0 естественно исключить из рассмотрения,
так как при к = 0 никакие вещественные значения т^,
7]2, ...,^п не могут удовлетворить уравнению (6); в этом
случае говорят иногда, что уравнение (6) определяет
«мнимую» поверхность.
270 ПОВЕРХНОСТИ 2-ГО ПОРЯДКА [ГЛ. 11
Остаются п различных типов невырожденных
центральных поверхностей, отвечающих значениям А = 1, 2, ...,га.
В двумерном случае (п — 2) уравнение (6) определяет
при к — 1 и к = 2 две известные из аналитической
геометрии кривые:
(ft = l) 4—1-=1 (гипербола),
"l u2
(ft = 2) J? 4 4" = * (эллипс).
При /г = 3 имеем А = 1, А = 2, & = 3 и соответственно
три невырожденные центральные поверхности в
трёхмерном пространстве, определяемые следующими
уравнениями:
(* = 1) 4~4—-^т=1.
v ' а\ а\ а\
(к-2\ ^ 4- ^«—Jl-1
(Л = з) Jl +jL + jL^i.
Напомним читателю построение каждой из этих
поверхностей.
Рассмотрим сечения каждой из них горизонтальными
плоскостями 7]з = Са3( —оо < С < оо). Эти сечения
представляют собой соответственно: гиперболы с
вещественной осью %
(* = !> -J-^-1 + C,
эллипсы, определённые для всех значений С:
(* = 2) |"+|- = 1 + С2'
или эллипсы, определённые только для |С|<1:
(* = 3) Jl + JI-I-C*.
»1 «2
Чтобы определить положения вершин этих сечений,
построим сечения поверхности координатными плоскостями
тгц = 0, т]2 = 0. Для случая к = 1 мы получаем при этом
§ 78] ЦЕНТРАЛЬНЫЕ ПОВЕРХНОСТИ 271
действительное сечение только координатной плоскостью
т]2 = 0, которое будет представлять собой гиперболу
'и Мз __ л
Вершины гипербол горизонтальных сечений будут
располагаться на этой кривой; в результате построения полу-
Черт. 1.
чаем поверхность, называемую двуполостным
гиперболоидом (черт. 1).
Для случая к = 2 сечения обеими координатными
плоскостями т]! = О, у\2 = 0 представляют собой гиперболы
с мнимой осью т]3:
Совокупность эллипсов горизонтальных сечений с
вершинами на этих гиперболах составляет поверхность,
называемую однополостным гиперболоидом (черт. 2). Наконец,
в случае к = 3 сечения координатными плоскостями ^ — О,
ri2 —0 —эллипсы; проводя эллипсы горизонтальных
сечений, получаем эллипсоид (черт. 3).
272
ПОВЕРХНОСТИ 2-ГО ПОРЯДКА
[ГЛ. 1 I
Черт. 2s
Черт. 3.
§7&] ЦЕНТРАЛЬНЫЕ ПОВЕРХНОСТИ 273
Поверхности 2-го порядка в пространстве более чем трёх
измерений уже не поддаются наглядному геометрическому
представлению. Тем не менее мы можем указать и в многомерном
случае существенные различия между типами центральных
поверхностей, отвечающих различным значениям Л = 1, 2, ..., п. Будем
исходить из геометрически очевидных различий в трёхмерном
пространстве. На двуполостном гиперболоиде (к= 1) существует
пара точек, которые нельзя путём непрерывного передвижения
по поверхности привести к совпадению: достаточно взять одну
из точек пары на одной полости, а вторую точку—на другой
полости, чтобы получить такую пару. На однополостном
гиперболоиде (к=2) уже всякие две точки можно привести к совпадению
с помощью непрерывного передвижения по поверхности; но есть
замкнутая линия (например, горловая линия гиперболоида),
которую нельзя непрерывной деформацией свести в одну точку.
На эллипсоиде (к = 2) уже всякая замкнутая линия может быть
сведена в одну точку. Эти факты могут служить исходным пунктом
при формулировке геометрических различий между центральными
поверхностями в n-мерном пространстве.
Введём следующие определения. Фигура А называется гомео-
морфной фигуре В, если существует взаимно однозначное и
взаимно непрерывное отображение множества точек фигуры А на
множество точек фигуры В. Фигура А, расположенная на поверхности
S, называется гомотопной фигуре В, расположенной на этой же
поверхности, если фигура А может быть переведена в фигуру В
с помощью непрерывной деформации, в процессе которой фигура А
остаётся всё время на поверхности S.
Геометрические различия между центральными поверхностями
с помощью этих определений формулируются следующим образом.
Для А = 1 можно указать на поверхности пару точек, не
гомотопных друг другу. Для к = 2 всякая точка на поверхности гомотопна
всякой другой точке; но существует линия, гомеоморфная
окружности, которая не гомотопна точке. Для & = 3 всякая линия,
гомеоморфная окружности, гомотопна точке; но существует не
гомотопная точке часть поверхности, гомеоморфная сфере (точнее,
двумерной сфере, т. е. сфере в трёхмерном пространстве).
Продолжая таким образом, мы сможем сформулировать для каждого к
отличительное свойство соответствующей центральной поверхности:
всякая её часть, гомеоморфная (к—1)-мерной сфере, гомотопна
точке, но существует часть, гомеоморфная Д-мерной сфере, которая
не гомотопна точке. Из этого результата, в частности, вытекает,
что центральные поверхности в n-мерном пространстве не гомео-
морфны друг другу при различных к. На* доказательствах этих
интересных предложений мы останавливаться не можем.
Рассмотрим теперь случай с = 0. Уравнение (4)
становится однородным: вместе с точкой (тц, т)2> •••> %) ему
удовлетворяет и точка (ti\l9 Щ2, ..., Щп) при любом t.
Это означает, что поверхность образована из прямых линий,
18 Г. Е. Шилов
ч
274 ПОВЕРХНОСТИ 2-ГО ПОРЯДКА [ГЛ. 11
проходящих через начало координат *). Такая вырожденная
поверхность называется конической.
В случае г = п каноническое уравнение конической
поверхности мы сможем записать в виде
J3Lj- I т'^ ^+1 ^ —О
п2 I • * * ~Г 2 2 * ' * 2 U<
"1 ah afe+l an
Оценим число различных типов конических
поверхностей при заданном и. Если число т — п — к отрицательных
коэффициентов в каноническом уравнении (4) больше у,
то, умножая уравнение на —1, мы получаем уравнение
той же поверхности, но с числом "отрицательных
коэффициентов, уже меньшим у. Следовательно, достаточно
рассмотреть случаи, отвечающие значениям т<у. Если
п — чётное, то, исключая случай точки (& = 0), получаем
у различных типов конических поверхностей, отвечающих
значениям т= 1, 2, . ..,—; если тг —нечётное, то
различных типов оказывается -у-, именно т—1, 2, ...
2 '
На плоскости (/г = 2), кроме точки, имеется один такой
тип (иг —1) с каноническим уравнением
Соответствующий геометрический образ — пара
пересекающихся прямых с уравнениями ^~ — ± ~- .
В трёхмерном пространстве (п = 3), кроме точки,
имеется также только один тип конической поверхности
*) За единственным исключением, когда все слагаемые в
сумме (2) одного знака, и уравнение определяет одну точку —начало
координат.
78]
л—1
ЦЕНТРАЛЬНЫЕ ПОВЕРХНОСТИ
275
— = 1 j с каноническим уравнением
а\ "Г af аз
Соответствующий геометрический образ —конус (черт. 4;
в частном случае, при а1 = а2 —прямой круговой конус).
1
ж
%
ш$
Черт. 4;
Чтобы представить себе форму конической поверхности в
общем случае, рассмотрим её сечение гиперплоскостью
к)п = Сап (— оо < С < оо)
?)1
2
"фН-1
2
Afe+l
?)n-l /ч2
ап-\
Это уравнение соответствует центральной поверхности
в (/г —1)-мерном пространстве. Все эти поверхности (при
18*
276 ПОВЕРХНОСТИ 2-ГО ПОРЯДКА [ГЛ. 11
различных значениях С) геометрически подобны друг другу,
соответствующие размеры полуосей пропорциональны
величине С.
Таким образом, каждая коническая поверхность в
тг-мерном пространстве может быть получена из некоторой
центральной поверхности в (п — 1)-мерном пространстве
Rn-i при помощи перемещения этой центральной
поверхности вдоль оси, перпендикулярной к/?n_i, с
одновременным пропорциональным растяжением во всех направлениях.
Чтобы получить при этом все возможные типы конических
поверхностей, достаточно использовать лишь те
центральные поверхности в (п— 1)-мерном пространстве, для которых
число отрицательных слагаемых в каноническом уравнении
не превосходит у — 1.
§ 79. Невырожденные нецентральные поверхности
(параболоиды)
Тем же путём, как и в § 78, мы можем, привести
каноническое уравнение нецентральной невырожденной
поверхности к виду
• "^ о. _u ч£ ^fe+i чД-i _ 0<у> /7\
~г -г • • - -г —2 2 • • • —i— — ^Чп- \';
ai ak ak+i «n-1
Оценим число различных типов невырожденных
нецентральных поверхностей. Если число отрицательных
слагаемых в правой части уравнения (7) больше -^- ,
то, умножая уравнение (7) на — 1, мы получаем уравнение
той же поверхности, но с числом отрицательных слагаемых
л —1
в левой части, меньшим —тр-, и с измененным знаком
правой части. После зеркального отражения
знак у правой части восстанавливается. Таким образом,
число различных типов невырожденных нецентральных
поверхностей (если не причислять к различным типам
поверхности, получающиеся друг из друга зеркальным
отражением) определяется количеством целых чисел т,
§ 79] НЕВЫРОЖДЕННЫЕ НЕЦЕНТРАЛЬНЫЕ ПОВЕРХНОСТИ 277
удовлетворяющих неравенству О < т < ^-к— ; это количеств
равно 4р при чётном п и .—у- при нечётном п. На
плоскости (п = 2) существует единственная невырожденная
нецентральная кривая (парабола) с каноническим
уравнением
7]2 = 2а|т]2 (т = 0).
В трёхмерном пространстве имеются две невырожденные
нецентральные поверхности ( /г = 3; —^— = -4— *= ^
/>2
2) 4—?-= 2i, (w=l).
В первом случае сечение поверхности плоскостью
7]з = С>0 представляет собой эллипс; чтобы определить
положение вершин эллипса, построим сечения
поверхности координатными плоскостями % = 0 и т]2 = 0, В
каждом из этих сечений мы получим параболу; следы этих
парабол на плоскости ч]3 = С укажут положение вершин
эллипса.
Получающаяся поверхность (черт. 5) называется
эллиптическим параболоидом (в частном случае, при ах = а2,
круговым параболоидом). Во втором случае сечение
поверхности плоскостью 7]3 = С > 0 представляет собой гиперболу
с вещественной осью т^. Чтобы определить положение
вершины, рассмотрим сечение поверхности координатной
плоскостью т]2 = 0; в сечении получится парабола к]| = 2af7)3,
след которой на плоскости т)3 = С укажет положение вершин
гиперболы. Сечение плоскостью у)3 = С < 0 представляет
собой гиперболу с вещественной осью т]2; вершины этой
гиперболы лежат на параболе т]§ = —2a\r\z в плоскости
% = 0.
В сечении % = 0 получаем пару прямых, которые служат
асимптотами для проекций на плоскость т]3 = 0 всех
рассмотренных нами гипербол в горизонтальных сечениях
278
ПОВЕРХНОСТИ 2-ГО ПОРЯДКА
[ГЛ. 11
Черт. 5.Г
Черт. 6.
§ 79] НЕВЫРОЖДЕННЫЕ НЕЦЕНТРАЛЬНЫЕ ПОВЕРХНОСТИ 279
поверхности. Сама поверхность называется гиперболическим
параболоидом (черт. 6).
Чтобы представить себе форму поверхности (7) в общем
случае, будем следить за изменением формы её сечения
гиперплоскостью -qn = C при изменении С от 0 до + оо.
В каждом таком сечении получается центральная
поверхность в (и — 1)-мерном пространстве. Все эти поверхности
подобны друг другу; соответствующие размеры полуосей
(в отличие от конической поверхности) изменяются по
параболическому закону (пропорционально корню
квадратному из С). При С — О центральная поверхность становится
конической. При С < О центральная поверхность переходит
в сопряжённую поверхность (т. е. коэффициенты
канонического уравнения с отрицательными и положительными
знаками меняются ролями). В частпом случае, когда все
коэффициенты уравнения (7) одного знака,—для
определённости положительного, — поверхность существует
только в полупространстве т)п>0.
Название класса рассматриваемых невырожденных
поверхностей объясняется тем, что они действительно не
обладают центром. Для доказательства допустим противное.
Пусть поверхность (7) имеет центр t]J, т]°, .-.., к$. Так
как этот центр должен быть, в частности, центром
симметрии сечения т]п = ть, представляющего собой
невырожденную центральную поверхность в (п — 1)-мерном
пространстве, то необходимо
Таким образом, центр должен находиться на оси т]п. Перейдём
мг произвольной точки %, i)2, ..., %_ь т]п + 5, лежащей
на поверхности, тз симметричную точку — тц, ..., — т)п_ь
т\п~-8. При этом уравнение (7) не должно нарушиться.
Но левая его часть остаётся неизменной при указанном
переходе; следовательно, не меняется и правая часть,
откуда вытекает, что 8 = 0. Мы получаем, что на
поверхности вовсе нет точек ~ч\п~Ф 7$. Но, очевидно, уравнение (7)
допускает решение г\ъ %, ..., ч\п с т)п ф т]£. Полученное
противоречие показывает, что наша поверхность не может
иметь центра.
280 ПОВЕРХНОСТИ 2-ГО ПОРЯДКА [ГЛ. 11
§ 80. Вырожденные цилиндрические поверхности
Вырожденными цилиндрическими мы назвали те
поверхности, в канонических уравнениях которых участвует
меньше чем п координат. Пусть, например, в каноническом
уравнении отсутствует координата ч\п. Тогда все
сечения поверхности (га — 1)-мерными гиперплоскостями г\п = С
( — оо < С < оо) представляют собой одну и ту же
поверхность в (п— 1)-мерном пространстве. Следовательно,
всякая вырожденная цилиндрическая поверхность образуется
поступательным движением некоторой поверхности 2-го
порядка в (п — 1)-мерном пространстве Rn-\ вдоль
перпендикуляра к этому (п — \)-мерному пространству.
Найдём соответствующие линии на плоскости (п =2);
так как в каноническом уравнении в данном случае
может участвовать только одна координата, то это
уравнение имеет вид
При С > О мы получае^ пару параллельных прямых,
при С — 0 — пару слившихся прямых, при С < 0 — мнимую
линию.
Чтобы построить цилиндрические поверхности в
трёхмерном пространстве (п =- 3), нужно подвергнуть
поступательному движению вдоль оси т)3 все кривые 2-го порядка
на плоскости (тц, tj2). При этом эллипс, гипербола,
парабола соответственно дают эллиптический, гиперболический,
параболический цилиндры (черт. 7). Пара прямых,
пересекающихся, параллельных или слившихся, приводит
соответственно к паре плоскостей —пересекающихся,
параллельных или слившихся (черт. 8).
Задачи
1. Какие поверхности второго порядка в трёхмерном
пространстве (ху у, z) задаются уравнениями
а) к 9 + 1 lf ; 4 9 1 - Х*
в) з = г/2 + з2; г) г/=я2 + 22-И; д) y=xz.
Отв. а) Одиополостный гиперболоид с осевой линией вдоль
оси у; б) одиополостный гиперболоид с осевой линией вдоль оси х;
§80] ВЫРОЖДЕННЫЕ ЦИЛИНДРИЧЕСКИЕ ПОВЕРХНОСТИ 281
Черт. 7.
Черт. 8.
282 ПОВЕРХНОСТИ 2-ГО ПОРЯДКА [ГЛ. 11
в) круго'вой параболоид с осевой линией вдоль оси х\ г) круговой
параболоид с осевой линией вдоль оси у, сдвинутый на 1 вдоль
этой оси; д) гиперболический параболоид.
2. Доказать, что середины хорд поверхности 2-го порядка,
параллельных вектору у = {gx, £а, ..., £п}, расположены на
(п—1)-мерной гиперплоскости (диаметральной гиперплоскости,
сопряженной с вектором у). •
3. Упростить уравнения поверхностей 2-го порядка в
трёхмерном пространстве (х> yt z) и дать соответствующие формулы
преобразования координат
а) 5я24-б2/2 + 722 — 4^2/+ 42/2— 10я + 8г/-1-14г — 6 = 0,
б) х2 + 2у2—22 + 12ху —4xz—8yz + 14я + 16у—122—3 = О,
в) 4я2 + у2 + 422—Ьху + 8я2 — 42/2 — 12я — 12у + 62 = 0.
Owe. а) ж1 + 2у| + 3*| = 6; 3 (ж — 1)= — ajx + 2^ + 2^,
3^ = 22?! —y!+22lf
3(2 + 1) = 2^ +22/!— 2Х.
б) ^ + 22/?-322 = 6; 3 (х + 1) = — «i + 2y1 + 2e1>
3(2/+l) = 2ir1-2/i + 221,
32 = 2^! +22/i — 2Х.
в) yl = 2x1; 3(я — т)==2ж1 + 22/1 + 21,
3 (2/+ 2/п) = 2^—2/1—22l,
3 (2 +2m)=—«! +22/1 — 22!,
(иг — произвольно).
4. Показать, что в пересечении эллипсоида с полуосями
а>\ !> а2 ^> • • • ^> ап и ^-мерной гиперплоскости, проходящей через
центр этого эллипсоида, получается эллипсоид с полуосями
&1 > &2 > • • • > &fe> где
<*1>&1>яп-Ы-1>
Указание. Полуоси эллипсоида определяются по
каноническим коэффициентам соответствующей квадратичной формы.
Использовать результаты § 70.
§ 81. Анализ поверхности по её общему уравнению
Мы описали все возможные типы поверхностей 2-го порядка
в n-мерном евклидовом пространстве. Тип поверхности
определяется по её каноническому уравнению. Но часто поверхность
задаётся не каноническим, а общим уравнением (1) и бывает су-
§ 81] АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЁ ОБЩЕМУ УРАВНЕНИЮ 283
щественно определить тип поверхности, иными словами, построить
её каноническое уравнение, не производя всех преобразований,
описанных в § 77.
Оказывается, чтобы написать каноническое уравнение
поверхности, заданной уравнением (1), достаточно знать следующие
величины:
1. Корни многочлена п-й степени
*№=
а21
л\п
а2п
*nl
1п2
Япп-Х
= 0.
- Коэффициенты многочлена п-й степени
Un — X a12 ... а1п
а2\ а22—'X ... Я0
Ai(X) =
*i
л2п
ит
ип2
апп — 1 Ьп
by
Чтобы получить явные выражения для коэффициентов этого
многочлена, используем линейное свойство определителя (§3, п. 3).
Каждый столбец определителя Ах (X) (кроме последнего) можно
представить в виде суммы двух столбцов, первый из которых
состоит из чисел а,ц (i = l, 2, ..., и, / фиксировано) и числа Ьу,
а второй — из п нулей и числа —X. Соответственно
определитель Д^Х) представляется в виде суммы некоторого^ числа
определителей, каждый из которых получается заменой некоторых
столбцов (кроме последнего) в матрице
Ai =
*п
«21 fl22
Mn
l2n
wnl
*1
un2
ann К
n
(8)
на столбцы, состоящие из п нулей и одного элемента —X,
причём так, что число —X оказывается на главной диагонали
матрицы. Каждый из этих определителей после разложения по тем
284 * ПОВЕРХНОСТИ 2-ГО ПОРЯДКА
[ГЛ. 11
столбцам, в которых стоят числа —X, приводится к виду
(-■K)kMn+i_k,
где Л—число столбцов, содержащих элементы —X, a Mn+1_fe —
некоторый минор (п +1—Л>го порядка. Этот минор характерен
тем, что он вместе с каждой строкой матрицы А1 использует
столбец этой матрицы с таким же номером и заведомо использует
последнюю строку и последний столбец этой матрицы. Миноры,
обладающие этим свойством, мы будем называть окаймлёнными.
Очевидно, что каждый окаймлённый минор матрицы Аг будет
фигурировать в разложении определителя Дх (X). Отсюда мы
непосредственно получаем, что коэффициент при (~Х)Ь в разложении
определителя Дх (X) по степеням —X равен сумме всех
окаймлённых миноров порядка *п-\-\—к. Разложение определителя Дх (X)
удобно записать в виде
Ai (*) = «n+i-anX + an-i*2- • • • +ai(-*)n ;
при такой записи коэффициент ал будет равен сумме всех
окаймлённых миноров матрицы Alt имеющих порядок к.
Корни характеристического многочлена Д(Х), как мы уже
знаем, дают нам коэффициенты при квадратах переменных в
каноническом уравнении. Чтобы найти оставшийся член (нулевой
степени, если каноническое уравнение имеет вид (4), или первой
степени, если оно имеет вид (5)), необходимо выяснить поведение
коэффициентов многочлена Дх (X) при преобразованиях координат.
Рассмотрим в (п + 1)-мерном евклидовом пространстве i?n+ {
квадратичную форму
i, fe»l i=i
где glf £2> •••, Sn> £n+i суть координаты вектора я£#п+1 в
некотором ортогональном нормированном базисе elt e2i ..., еп, еп+1.
Этой квадратичной форме отвечает симметричный оператор А1У
имеющий в базисе {е} матрицу (8); мы будем обозначать её также
через А(еу
Наряду с этим оператором рассмотрим оператор Ех,
определяемый равенствами E1^ = <?jt при к^п, Е!<?п+1 = 0. Ему
отвечает следующая матрица (в том же базисе е1ч еъ
1
#i =
сп+\
):
(10)
§ 81] АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЙ ОБЩЕМУ УРАВНЕНИЮ 285
Обозначим через Rn подпространство с базисом из векторов
<?!, е2, ..., еп; оператор Ех в этом подпространстве, очевидно,
является тождественным оператором.
Пусть дано некоторое изометрическое преобразование Q в
пространстве Rn; оно переводит ортогональный нормированный
базис еъ <?2, ..., еп в некоторый базис /3, /2, ..., /п, также
ортогональный и нормированный. Построим изометрическое
преобразование Qx в пространстве Яп+1, полагая Qie1 = /1, Qie2 = /2, ...
Q>ien = fn> Qi<?n+i==en+i=^n+l- Если матрица оператора Q в
пространстве Rn имела вид
Q=
Яп Я12 ... Я in
Я21 Я22 • • • Ччп
Яп1 ?п2
то в пространстве -Rn+1 матрица построенного оператора Qx будет
иметь вид
\Яп Я\г ••• Яхп 01
|?21 ?22 ••• ?2n 0
Qi =
?nl Яп2
о о
?пп °
0 1
Эта матрица отвечает следующим формулам преобразования
координат (§ 53)
El = ЯиЧЦ + Я21Ч\2 + • • • + Яп!^
?2
= ?12*)l + Я22*\2 + • • • + tf n2V
(11)
%п =Я1пЪ + Я2пЪ + • • • + WW
Оператор Ах в новом базисе А, /2, . ..»/п+1 имеет матрицу
i4(/) = Q_1-4(e)Q (§ 38); оператор Ех—ту же матрицу (10), что и
раньше. По § 38, п. 2 справедливо равенство
det (AU) — 1ЕХ) = det (.Л(е) —X^).
286
ПОВЕРХНОСТИ 2-ГО ПОРЯДКА
[ГЛ. 11
Допустим теперь, что преобразование Q было выбрано то самое,
которое в § 77 приводило квадратичную форму А (#,#) =
п
= 2 °ih£fik K каноническому виду
i, ft-l
Из формул (И) вытекает, что преобразование Q переводит
квадратичную форму от л+1 переменного (9) в форму
2 ХА +2 S ^Vln+i Wn+i-
i-i
i-l
Матрица оператора Alf которая, как мы знаем, преобразуется
одинаково с матрицей квадратичной формы, приобретает после этого
преобразования следующий вид:
A(f)~
h
До
К
г+1
О
1Х 12 ... 1Г 1Г^\ ♦ ♦ • In с
Многочлен A!(X) = det (Ays—IEJ будет равен определителю
Х2-Х
X,—X
Хг—X
—X
г+1
lx L ... lr I
г+1
§ 81] АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЁ ОБЩЕМУ УРАВНЕНИЮ 287
Коэффициенты этого многочлена можно вычислить с помощью
окаймлённых миноров матрицы А, -ч так же, как они вычислялись
раньше через окаймлённые миноры матрицы A,es = Ai.
Заметим, что при г < п все окаймлённые миноры матрицы
А^ выше (г-{-2)-го порядка заведомо обращаются в нуль, так
как содержат два пропорциональных столбца. Таким образом,
при г < п коэффициенты аг+з» аг+4> ••• Равны нулю.
Кроме того, при г < п окаймлённые миноры (г -Ь 2)-го порядка,
кроме заведомо равных нулю, необходимо используют первые г
строк и г столбцов матрицы А^у
Окаймлённые миноры (г + 1)-го порядка могут и не
использовать этих г строк и столбцов; отметим всё же два случая, когда
это использование заведомо имеет место:
1) г = гс; очевидно, что у матрицы А,^ имеется единственный
минор (г+1)-го (т. е. {п-\-\)-то порядка, совпадающий с её
определителем; он содержит все строки и столбцы матрицы Ауу
2) г < п, Zr+1 = Zr+2= ... =r/n = 0; кроме заведомо равных
нулю, имеется один окаймлённый минор (г + 1)-го порядка; он
построен на строках и столбцах с номерами 1, 2, ..., г, лН-1.
Посмотрим, далее, как отразится на матрице оператора AL
следующий этап преобразований уравнения (1) § 77, имеющий
целью аннулирование величин llt l2l . . ., lr> После
преобразования
Yi;==Y]l+X7Yln+1' ^=^ (* = 2, 3,-..., л + 1)
матрица A(f) переходит в матрицу
К
К
О h ... lr I
r-И
r-f 1
*1
Операция, произведённая с нею, может быть описана ещё так:
из последнего столбца вычтен первый столбец, умноженный на
U
~- , а затем из последней строки вычтена первая строка, также
288
ПОВЕРХНОСТИ 2-ГО ПОРЯДКА
[ГЛ. 11
умноженная на -у-. Аналогично могут быть описаны
дальнейшие преобразования, имеющие целью аннулировать величины
h> ^з» • • -f V» в результате всех этих преобразований матрица А,*,
переходит в матрицу
К
О О
К
0 1
r+i • •
К
Г+i
При этих преобразованиях заведомо не изменяют свою величину
те окаймлённые миноры матрицы А,^у в которых участвуют
первые г строк и г столбцов этой матрицы. Рассмотрим многочлен
А(г)(Х) =
*! — X
Хг-Х
— X
О I.
г+1
=«;+!-«;*+•••+«i(-*)n.
г+1
-X L,
Коэффициенты этого многочлена вычисляются через окаймлённые
миноры матрицы А^ТХ по тем же правилам, как коэффициенты
многочлена Дх (X) через окаймлённые миноры матрицы А^у В силу
доказанного выше свойства неизменности миноров (r-f2)-ro
порядка (при г < п) мы получаем, что аг+2 = аг+2» также Е ДВУХ
указанных особых случаях мы будем иметь aj.+ 1 = «r+1.
§ 81J АНАЛИЗ ПОВЕРХНОСТИ НО ЕЁ ОБЩЕМУ УРАВНЕНИЮ 289
Рассмотрим сначала особый случай r. — п, Тогда коэффициент
q^+1 многочлена А^г) (X) равен, очевидно, произведению \и Х2>. . .
. . , \пс; тем самым величина с в каноническом уравнении (4)
оказывается равной
ап+1
ап+1
AjA2 . . » Ад А^А2.. . A h •
Пусть теперь г < п. Определим нужный для дальнейшего
коэффициент аг+2 у многочлена А^) (X) *). Окаймлённые миноры
матрицы порядка г+ 2, за исключением заведомо равных нулю,
имеют вид
О
х2 о
о о
О 1Я
= — XjX2
■. К*Ъ
(m = ft + l, ..., п)
и их сумма, равная коэффициенту ar+24=sar+ 2» выражается в видр
-Х1Х2,..Хг(/{+1+...+ф.
Вспомним, что условием приводимости уравнения (1) к
канонической форме (5) было наличие среди коэффициентов 1^\, .*..', ln
хотя бы одного, отличного от нуля. Теперь мы можем
эквивалентное условие сформулировать в виде неравенства
аг+2 * °
и одновременно построить формулу для вычисления коэффициента
М канонической формы (5)
":г+2
уг/2—72 I I /2 -_ LZ_f
М *r+i-h...-r--n- XiXa . . . ХГ
Если же аг+2==0, то_/Г1 4 =Zr+2:= • • • =^п==0, и уравнение
приводится к канонической форме (4). Мы приходим здесь ко
второму особому случаю. Коэффициент
ar+1—°V+i ® этом случае
равен, очевидно, произведению
ХХХ2 ... Хг • с,
*) Нетрудно проверить, что и у многочлена Мр (к) все
коэффициенты ат при т ; г-f-2 в этом случае заведомо обращаются
в нуль.
lbJ г. Е, Шшюь
290 ПОВЕРХНОСТИ 2-ГО ПОРЯДКА [ГЛ.И
откуда коэффициент с канонической формы (4) получается равным
Лг+1
лг+{
Aj/ig . . . Лг ^1^2 • • • ^Г
в Приведём сводку полученных результатов. При этом корни
\lt Х2, ...,ХП характеристического многочлена А (X) условимся,
как и ранее, выписывать в таком порядке, чтобы сначала шли
корни, отличные от нуля. Произведение Хг ... Хг обозначим
через Лг.
Данные
Каноническое уравнение
Хп = ° ) ап-и Ф О
;}
V
Ni-2
)Ч-
п+1
Vi?+М + • • • + К-1<-1 +
= о
+ 2
V л»-1v
Ml+VI + • • ■ + К- i-чЛ-1 + х^=°
'n-l
V)! + Ml+--+V-2*)«-2 +
М! + Vil + • • • + xn_2^n_2 + -jZ=±.=о
X, = 0 \ а.Ф 0
>i ¥= 0 J a, =
h^ + 2\/
X,r,?+-^ = 0
17 T«=°
Приведённая в этом параграфе схема анализа уравнения
поверхности 2-го порядка принадлежит П. С. Моденову.
ГЛАВА 12
НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ
ПРОСТРАНСТВА
§ 82. Введение
Мы видели, что использование метрики в линейных
пространствах привело нас к значительному прогрессу
в изучении геометрических свойств этих пространств. Мы
обнаружили большое многообразие геометрических фактов
как для конечномерных пространств, где эти
геометрические факты приводят к ряду алгебраических теорем,
так и для бесконечномерных, в частности,
функциональных пространств, где эти же факты становятся теоремами
из анализа. Три последние главы этой книги в основном
посвящены изучению геометрии бесконечномерных
пространств, или, иначе говоря, геометрической трактовке
фактов классического анализа.
Здесь нужно отметить следующее обстоятельство.
Если мы хотим выявить геометрическое содержание новой
области, например определённой части анализа, то, может быть,
имеющаяся у нас евклидова метрика (метрика, определяемая
с помощью скалярных произведений) не будет отвечать здесь
сути дела. Нужно всегда иметь в виду, что аксиомы геометрии,
как и все основные схемы и положения науки, не произвольно
придумываются учёными, а возникают из самой действительности
путём глубокого её изучения и выявления наиболее существенных
её свойств. В частности, и классические операции анализа далеко
не всегда можно подчинить геометрической схеме евклидовой
метрики. Например, такое существенное для анализа понятие, как
равномерная сходимость последовательности функций на заданном
отрезке, как можно показать, не может быть определено с помощью
евклидовой метрики, каким бы способом она ни была задана.
Чтобы включить в нашу геометрическую теорию
рассмотрение таких основных понятий анализа, мы введём ниже понятие
нормированного пространства и метрического пространства.
19*
292 НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 12
§ 83. Определение нормированного пространства
Линейное пространство R называется нормированным,
если: 1) имеется правило, которое позволяет построить
для каждого вектора xciR вещественное число,
называемое длиной, или нормой, вектора х и обозначаемое | х \
(или || ж ||); 2) это правило удовлетворяет следующим
требованиям:
1. \х\ > 0 при х Ф 0; для гг = 0 |я|=0.
2. |аж| = |а| \х\ для любого x£R и любого
вещественного а.
3. |#-t 2/|<|#1 + |у| для любых х и у из R
(неравенство треугольника).
Примеры
1. Трёхмерное векторное пространство VB с обычным
! заданием длины вектора, очевидно, является
Нормированным.
2. Всякое евклидово пространство является дормиро-
, ванным; длина вектора х, определённая равенствам
"|ж |= -т-'У^ж, х)9 как мы видели, удовлетворяет условиям
1, 2, 3 (§§ 48-49, аксиома (г), формулы (5) и (12))*).
3. Пространство С(а,Ь) становится нормированным
при введении нормы по формуле
|| ж ||= max) я (г) | *.(j)
(две чёрточки у знака нормы написаны, чтобы огаичить
норму функции от её абсолютной величины). Легко
проверить, что аксиомы нормы 1—3 выполняются.
Заметны, что введённая нами норма существенно отличается
от той, которая построена в С (а, Ь) как в евклидовом
пространстве (§ 49); с помощью скалярного произведения
Гь
.г, х) = 1/ \ х2 \
Н = уЧг, *)=1/ \x*{t)tlt.
*) Собственно, этим и объясняется введённое нами здесь
наименование «неравенство треугольника».
§ &м чдарл&далЕииЕ метрического пространства. : 293
Можно доказать, что норма (1) в пространстве G (а, Ъ) не может
быть получена из скалярного произведения, каким &ы законом
оно ни задавалось. Мы сохраним обозначение С (а, Ь) как для
линейного пространства, так и для нормированного пространства
всех непрерывных функций на отрезке а <; г ^ 6 с нормой по
формуле (1).
Так же, как в евклидовом пространстве, мы будем'назы-
вать множество EClR ограниченным, если для всехх£Е
величины | х | ограничены фиксированной константой.
Примером ограниченного множества является единичный
шар — совокупность всех xCZR, для которых | х | < 1.
Вообще совокупность векторов x$R, для которых
\х — ж01 О, называется шаром радиуса г с центром в х0.
§ 84. Определение метрического пространства
Многие важные соотношения между функциями,
относящиеся в основном к предельному переходу, не
зависят от наличия линейных операций, установленных
в функциональном пространстве. Для того чтобы такие
соотношения изучать в форме, освобождённой от всего
постороннего, мы введём, далее, понятие метрического
пространства. Так будет названа совокупность объектов
любой природы, для которых указаны взаимные
«расстояния», удовлетворяющие некоторым естественным условиям.
Мы не будем предполагать наличия линейных операций,,
связывающих элементы метрического пространства; таким
образом, метрическое пространство уже может не быть
линейным пространством.
Определение. Произвольное множество R
некоторых элементов («точек>>) х, у, ... называется
метрическим пространством, если 1) имеется правило, которое
позволяет построить для любых двух точек х, y£R число
?{Х>У) («расстояние от х до у»), 2) это правило
подчинено следующим требованиям (аксиомам):
1. р(у, х)—р(х, у) для любых х и у (симметрия
расстояния);
2. р (х, у) > 0 при х £ у; р (х, х) = 0 для любого х 6 R;
3. р(з\ z)<p{#. у) 4-о (у. z) для любых #, у7 *£#
(неравенство треугольника).
294. НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА 1ГЛ. \2
Примеры
1. Любое множество /?, расположенное в трёхмерном
пространстве, является метрическим пространством, если
за р(х, у) мы будем принимать обычное расстояние
между точками х и у из R.
2. Любое множество R непрерывных функций,
определённых на отрезке а < t < b> с введением расстояния
по формуле
РИ0> 2/(ОН sup И*)-У(01
становится метрическим пространством.
3. Вообще любое множество точек, расположенных
в линейном нормированном пространстве R, естественно,
является метрическим пространством с расстоянием,
определяемым по формуле
р(х,у) = \х'-у\.
В частности, все рассмотренные нами ранее евклидовы
и нормированные пространства являются метрическими
пространствами. Множество Е в метрическом
пространстве R называется ограниченным относительно точки
x0£Rf если расстояния от точки x0£R до точек х£Е
ограничены некоторым числом. Так, ограничен
относительно точки х0 любой шар с центром в точке xQ, т. е.
совокупность всех точек х, для которых р(х, х0)<г;
число г называется радиусом шара.
Если множество Е ограничено относительно точки х0,
то оно ограничено относительно любой другой точки
xx£R. В самом деле, если для х£Е величины р(ж, х0)
ограничены константой К% то величины р(х, хг) в силу
неравенства треугольника
Р (z, #i) < Р (х, х0) + р (х0, хх)
ограничены константой K + p(x0t xx). Поэтому в
дальнейшем мы будем называть множество Е, ограниченное
относительно какой-либо точки xQ. просто ограниченным
множеством.
$86] ПРЕДЕЛЬНЫЙ ПЕРЕХОД 295
§ 85. Предельный переход в метрическом
пространстве
1. Будем говорить, что последовательность точки
хъ x2f ..., хт, ... метрического пространства R
сходится к точке х того же пространства, если
lim р {ху хт) = 0.
Точка х называется пределом последовательности
Xi, Х%, . . ., Хту . . .
Нетрудно показать, что элемент х определяется при
этом однозначно. Действительно, если бы мы имели
соотношения
lim р (ху хт) = 0, lim р (г/, хт) = 0,
m-»co m-»oo
то для заданного е > 0 мы могли бы указать номер N,
начиная с которого выполнялись бы неравенства
р (х, хт) < у , p(y,%)<j (m>N),
и, следовательно, по неравенству треугольника
Так как в полученном неравенстве е произвольно мало, то
р(з, у) = 0,
откуда в силу аксиомы 1
что и требуется.
Примеры
1. Пусть i?n — и-мерное евклидово пространство
и el9 e2y ..., еп —некоторый ортогональный и
нормированный базис в Rn. Положим
X = ^х + ^2 + • • • + StAi,
*т- 1[т)ег + \Т\+ ... + &т)е» (го = 1, 2, ...),
296" НОРМИРОВАННОЕ И МЕТР1ТЧЕСКЙЕ ПРОСТРАНСТВА [ГЛ. 1 2
тогда
*-«««(6i-6iw))ei+...+(6»-^m))en.
В еилу формулы (17) § 50 мы имеем:
I * - *т Iе = (*1 - ^V + • • • + (5п - ИГ0)2-
Очевидно, что расстояние |#—-#т| от точки х до точки
хт стремится к нулю при т—>со тогда и только тогда,
когда все числовые последовательности ^™\ ?2W\ • • •
• • •, £nm) (/№=1,2, .. .) при т —> со сходятся
соответственно к пределам £х, £2> . .-,Sn- Кратко это выражают
так: сходимость в Яп есть сходимость по всем
координатам.
2. Сходимость последовательности функций хт (t) £C(a,b)
к функции x(t) означает, что при т—> оо
p(xfxm)= sup \x(t) — xm(t)\—>0.
В анализе такая сходимость называется равномерной
сходимостью.
3. Сходимость последовательности функций xm(t) из
пространства С2(а}Ь)к функции x(t) означает, что при
т—>оо
ь
р2(#> ^m)(^ — Ят,Я — Ят)= ^ | ж(/)—ДГт^) |2Л —>0.
а
В анализе такая сходимость называется сходимостью
в среднем. Всякая равномерно сходящаяся
последовательность функций, очевидно, сходится также и в среднем.
Но легко построить последовательность функций, сходящуюся
в среднем и не сходящуюся равномерно. Пусть, например, функция
xm(t), вообще заключённая между нулём и единицей, отлична от
а „1
нуля только в интервале йт длины, меньшей —, и достигает
в этом интервале значения 1. Очевидно, что
ь
§85] ПРЕДЕЛЬНЫЙ ПЕРЕХОД ' 297
так что последовательность хт (t) при т —> оо в среднем стре*
мится к нулю. Но maxxm(t) = l для любого т, так что
последовательность хт (t) не сходится к нулю равномерно. Можно
проверить, что эта последовательность ни к какой функции не
сходится равномерно. Более того, интервалы Дт можно выбрать так,
что эта последовательность вообще не будет сходиться ни при
одном значении t.
2. Точка х метрического пространства R называется
предельной для множества F CZ /?, если существует
последовательность #ь х2> ... точек F, сходящаяся к точке х:
Другое определение предельной точки, очевидно
эквивалентное вышеприведённому, гласит: точка х есть
предельная точка множества F, если для любого е > 0
существует точка у £F, для которой р(х, у) < е, причём у Ф х.
Подмножество^ С R называется замкнутым, если оно
содержит все свои предельные точки.
Пример
Если R" означает ортогональное дополнение некоторого
подпространства R' евклидова пространства R (§ 49, п. 3),
то R" замкнуто, каково бы ни было R'. Действительно,
пусть я —некоторая предельная точка подпространства R".
Образуем последовательность хх, х%, ..., хт> ... точек
подпространства Д", сходящуюся к точке ж» Если х'—любая
точка подпространства R\ то (х\ хт) = 0 для любого т.
Отсюда и по неравенству Коши-Буняковского
\\Х у X) I = I \Х , X) (X , Хт) | =
= \(х',х — хт)\<\х'\.\х--хт\—*>0,
значит (х',х) = 0. Таким образом, элемент х ортогонален
к любому х' 6Д'. Следовательно, по самому определению
ортогонального дополнения, x£R"y что и требуется.
3. Пусть дано произвольное множество А элементов
метрического пространства; обозначим через А множество,
состоящее из всех точек множества А и, кроме того, из
всех предельных точек множества А (не входящих в А).
Это множество А называется замыканием множества А,
Покажем, что замыкание произвольного множества А
всегда является замкнутым множеством. Пусть а — любая
предельная точка для множества А; это означает, что для
298 НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 12
любого заданного г > 0 можно указать точку х £ А, для
которой р(а, х) < ^ • Поскольку х £ А, то эта точка ж есть
или точка множества А, или предельная точка для
множества А. В обоих случаях мы можем указать точку
х£А, для которой р(х, х) < -^ (в частности, в первом
случае можно положить х — х). Используя неравенство
треугольника, находим р (а, х) < р (а, я) -f p (х, #) < -у + 4- = з;
следовательно, для любого е > 0 мы можем указать точку
х£А, для которой р(а, х) < е. Придавая е
последовательные значения 1, 1/2) 7з ••• 1/л, •••> мы получим в А
последовательность точек xlt х2, .. ., хПу ..., сходящуюся
к точке а. Таким образом, точка а — предельная для
множества А и, следовательно, входит в А. Итак, всякая
предельная точка для множества А сама входит в
множество А; это означает, что множество А замкнуто, что
и утверждалось. Заметим, далее, что всякое замкнутое
множество F, содержащее множество А> должно содержать
и все предельные точки множества А и, следовательно,
всё множество А. Так как по доказанному множество А
замкнуто, то оно может быть охарактеризовано теперь
как наименьшее замкнутое множество, содержащее
множество А.
Примеры
1. Замыкание множества А всех рациональных точек
на вещественной прямой есть совокупность всех
(рациональных и иррациональных) точек этой прямой.
2. Как будет показано в § 99, п. 8, замыкание
множества всех многочленов Р (t) = а0 4- axt + ... + antn в
пространстве С (а, Ь) совпадает со всем пространством С (а, Ь).
3. Пусть Л —линейное нормированное пространство
и Л —подпространство пространства R. Покажем, что
замыкание А также является подпространством. Для
доказательства необходимо установить справедливость
следующих фактов:
1) Если х£А, у£А, то х + у£А.
2) Если х£А, X — вещественное число, то \х£А,* .
Мб]
ПОЛНЫЕ ПРОСТРАНСТВА
299
Для доказательства утверждения 1) рассмотрим
последовательности хп£А и уп£А, сходящиеся соответственно
к пределам х и у. Тогда
I (я + У) — (*п + Уп) | = | {х - хп) + (У — Уп)\<
<\х — хп\ + \у — уп\->0,
и, следовательно, последовательность хп-{-уп сходится
к х + у. Так как хп + уп€А> то х + у£А, что и требуется.
Для доказательства утверждения 2) рассмотрим
последовательность хп£А, сходящуюся к элементу х. Тогда
j Х# — \хп | = | к (х — хп) | = | /. | | х — хп | —> О,
и, следовательно, последовательность Ххп сходится к
элементу \х; так как )*хп£А, то \х£А, что и утверждалось.
4. Если замыкание некоторого подмножества А
метрического пространства R совпадает со всем пространством Д,
как это имеет место в примерах 1 и 2, множество А
называется плотным в пространстве Я.
§ 86. Полные пространства
1. Последовательность хъ хг, ..., хШу ... точек
метрического пространства R называется фундаментальной,
если для любого е > О существует номер N такой, что
для Пу m > N выполняется неравенство
Р\Хп> Хт)^.&.
Кратко мы будем писать в таких случаях:
lim p(xn, хт) — 0.
Если R есть вещественная прямая с обычной метрикой,
то понятие фундаментальной последовательности точек
совпадает с классическим понятием фундаментальной
числовой последовательности. В теории вещественных чисел
доказывается критерий Коши, в силу которого всякая
фундаментальная числовая последовательность является
сходящейся. В общем метрическом пространстве критерий
Цощи оказывается уже несправедливы^.
300 НОРМИРОВАННЫЕ-*! МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ТЛ1ГИ
Примерь!
1. Уже на открытом интервале (0, i) вещественной оси, оче-~
видно, являющемся метрическим пространством, обнаруживается
невыполнение критерия Коши. В самом деле, последовательность 1,
111 * ' -
— , —, ..., —, ..., очевидно, является фундаментальной; но она
z о m
не является сходящейся в рассматриваемом метрическом
пространстве. Единственная точка, к которой эта последовательность
могла бы сходиться, есть точка 0, не входящая в наше метриче-,
ское пространство.
, 2. Другим примером является метрическое пространство С* (я, Ъ).
Последовательность непрерывных функций xm (t), заключённых
между 0 и 1 и при m —> со равномерно стремящихся на каждом
интервале (а, с—г) к 0, а на каждом интервале {с + е, &) — к 1
(с — фиксированная точка между а и Ь), удовлетворяет критерию
Коши; в самом деле,
Ь С— е с+е Ь
jj|-*n(0-*Jn(*)N'= jj + J + ^ <* + 2e + 3=4s
' а а с—е с+е
для достаточно больших пит. Но в то же время
последовательность xm(t) не сходится в среднем ни к какой непрерывной функции.
Для доказательства этого утверждения заметим следующее.
Если последовательность функций /m(t) (m = l, 2, ...) сходится
в среднем на промежутке Д — {а<^<£} к непрерывной функции f (t),
а <?_ некотором промежутке Ь = {с<^ t^d], внутреннем к
промежутку Д, равномерно сходится к функции <р(0» то в этом
промежутке Ь имеет место тождество <р (t) ~/(г). Действительно, в
пространстве С % (с, d) мы имеем соотношения
d Ъ
?2(fn, /)= ^ I fn(0-/(012-л< ^ ]/п(0~/(0рл"^а
с - а - - • - ; '
d
?%(fn.l)={ l/n(0-?(0lfA< max|/„(0-T(OI2W-0->0.
В силу единственности предела (§ 85, п. 1) мы имеем f(t) = y(t)t'
что и утверждалось.
Если мы предположим, что построенная выше последователь-,
ность x1(t), x2(t), ..., xn(t), ... сходится в среднем к некоторой
непрерывной функции / (г), то по доказанному мы должны были
бы иметь равенство /(г) = 0 при a ^t < с, /(0 — 1 при с < t^b.
Но очевидно, что в таком случае, каково бы ни было значение
/(с), функция /(0 не будет непрерывной функцией на отрезке
a^t^b.
§ аеь полные пространства 301
/ 2. Установим некоторые простые свойства сходящихся
и фундаментальных последовательностей.
; Лемма 1.' Всякая сходящаяся последовательное™ ь
фундаментальна.
Действительно, по неравенству треугольника
Р (#п> %т) ^С р (Уп> #) ~г Р \ху %т)
и если хп —>х, правая часть для достаточно больших пит
становится меньшим любого наперёд заданного е.
Лемма 2. Всякая фундаментальная
последовательность ограничена.
А Действительно, пусть хг, х2, ..., хту ...—заданная
фундаментальная последовательность и х--любая точка
пространства; для заданного г > 0 найдём N так, чтобы
иметь р(хн, хт) < е для любого т> N. Обозначим, далее,
через М наибольшее из расстояний р (х, хг)\ р(х, #2)>--
.*., р(х, хм). Тогда по неравенству треугольника
Р (ж, хт) < p (x, xN) + p (xNf ят)'< М + г
для любого га > N и по определению М
для ra<iV; таким образом, для любого m
■ р(;Г, Хт) <М + в1
что и требовалось.
3. Определение полного пространства.
Метрическое пространство R называется полным, если
в нём всякая фундаментальная последовательность есть
последовательность сходящаяся.
t л Примеры
li Проверим, что /г-мерное евклидово пространство R
есть Полное пространство. Пусть еи е2, ..., еп —
ортогональный нормированный базис пространства Диа:т= {^i(m),
с2<т), . . ., Ц™)} (т= 1", 2, . ..) —фундаментальная
последовательность. ПОСКОЛЬКУ j ty) — ;<?) Г < 2 - Е^Р' ~~ ^'"Г ^
302 НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. И
= | хр ~ xq |2, числовая последовательность Й*> (р = 1, 2;...)
при каждом фиксированном /=1, 2, ..., и является
фундаментальной числовой последовательностью и, как
таковая, имеет некоторый предел Si» Числа llt £a> •••» £п
определяют вектор x£R. Поскольку
Ix-Xml^^iU-^V^O прит-^оо,
i
вектор х есть предел взятой фундаментальной
последовательности. Итак, каждая фундаментальная
последовательность пространства R имеет в этом пространстве
предел, что нам и требуется.
2. Пространство С {а, Ъ) — полное. В самом деле, если
последовательность функций xn(t)£C(a, Ъ)
фундаментальна, то при т —> оо, п—» оо
sup \xm(t)-xn(t)\-*0. (2)
Фиксируем ?; числа xn(t) в силу соотношения (2)
будут образовывать фундаментальную числовую
последовательность, которая в силу классического критерия Коши
обязана быть сходящейся последовательностью. Пусть
х (t) есть предел хп (t) при п —» оо * Переходя в неравенстве
sup |жт(0-Яп(0Кв (n,m>N^N(s))
к пределу при т—>оо, получаем:
sup |s(0-3n(0l<e (n>N = N(z)).
a<t^b
Следовательно, функция x(t) есть предел равномерно
сходящейся последовательности непрерывных функций хп (t)
и поэтому в силу известной теоремы из анализа
непрерывна. Таким образом, в пространстве С {а, Ъ) всякая
фундаментальная последовательность является сходящейся;
следовательно, С (а, Ъ) — цолное пространство.
3. Пространство С2(а, Ь) неполно (см. пример 2, п. 1).
4. Пространство 1%. Элементом этого пространства
является любая последовательность чисел x = (ii, 6g,.... Sn, •••) со
§ 86] ПОЛНЫЕ ПРОСТРАНСТВА 303
сходящейся суммой квадратов
оо
Линейные операции определяются естественным образом:
(6i, £а> .♦., 5П> •••) + (%, ?]2> •-, V •••) =
— (Sl + T)!, 62 + 1)2. ...» 6n + V ...)•
«(Si, Sa, ..., Sn, . ..) = (e5i, «62, ♦••, «8n, ...).
Скалярное произведение векторов
a = (6i, £2, ..., gn, ...) и 2/ = (т)1, ri2, ,.., Y)n, ...)
задаётся по формуле
oo • *
(*.y)=2 ^n- (3)
n-i
Необходимо проверить законность этих определений. Прежде
осегонеравенство Коши-Буняковского (§ 49, п. 2)
п+т I /~п+т /~п+т
fr = n I fc«n h = n
в соединении с классическим критерием сходимости Когаи
показывает, что ряд (3) для х6*2- y£h всегда является сходящимся.
Далее, равенства
n-j-m п+т
2 и*>г=°2 2 &• :•-.•-.•
n-fm n(-n». " ■ n+rh n\-m
2 (5*+w =2 %+2 2 y* + 2'r*
показывают, что для x £ /2 и г/ £ /2 сходятся ряды
oo 00 .
2 <в5*>*и 2 ^ + ^>2 • -'■ ■
304 НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 12
и, следовательно, определённые нами операции сложения
векторов и умножения на число выполнимы ъ пределах
пространства /2.
Все аксиомы скалярного произведения (§ 48) очевидным
образом выполняются. Построенное пространство оказывается,
таким образом, евклидовым; проверим, что оно полно.
Пусть *т^(Г\ 4m)> •••• #°, •••) И=1, 2, ...)-:
Фундаментальная последовательность векторов пространства 12- Так
как для т и р, стремящихся к бесконечности, по условию
оо
im-ip|«=2l6nm)-5nP)la^O..
71=1
то, в частности, каждое слагаемое | 6^*-6^ |2 (при
фиксированном п) стремится к нулю, когда тир неограниченно
увеличиваются; поэтому при каждом фиксированном п последователыюсть
координат 6^ (т =1, 2, ...) в силу классического .критерия
Коши является сходящейся. Обозначим 6п = Ит6^; покажем, что
т-юо
вектор # = (8i, £2« •••» 6ni •••) принадлежит пространству 1&
По лемме 2
• '• оо
n= 1
где К не зависит от т. Поэтому для любого фиксированного N
N N
*~* m-* oo 4*--
П»1 71=1
оо
отсюда непосредственно вытекает сходимость ряда ^j ^n* ^с"
п=1
таётся показать, что |я—хт\—^0, когда т—>оо. Для этого
в неравенстве
JV
n-i
справедливом для заданного е > 0 при достаточно больших тир
и любом N, перейдём к пределу при р —> оо.
§ 8 7] КОМПАКТНЫЕ ПОДМНОЖЕСТВА 305
В результате мы получим неравенство
N
2 i«(«m)-5ni2<*.
из которого после перехода к пределу при N —> со получается
неравенство
оо
n-i
справедливое для всех достаточно больших т, что и требуется.
§ 87. Компактные подмножества в метрическом
пространстве
1. Множество Fy расположенное в метрическом
пространстве /?, называется компактным, если всякое
бесконечное подмножество F' CZF содержит по крайней
мере одну сходящуюся (в R) последовательность.
Приме ры
1. Всякое бесконечное ограниченное множество F точек
на вещественной прямой R компактно в силу известной
теоремы Больцано. Неограниченное множество на той же
прямой не компактно, ибо из него всегда можно выбрать
подмножество, не содержащее ни одной сходящейся
последовательности (как именно?).
2. Проверим выполнение аналогичных утверждений
для бесконечного ограниченного множества F в га-мерном
евклидовом пространстве Rn. Пусть F' — любое
бесконечное подмножество множества F. Выберем в Rn
произвольный ортогональный и нормированный базис; в этом
базисе каждый вектор х имеет координаты £ь £2> •••> £п-
Числовое множество всех координат {^} для x£F'
ограничено и по теореме Больцатю содержит сходящуюся
последовательность,
Таким образом, из множества F' возможно выбрать
последовательность векторов хъ х2, ..., хт, ..., первые
координаты которых образуют сходящуюся числовую
последовательность. Числовое множество вторых
координат {?2/ для векторов этой последовательности опять огра-
20 г. Е. Шилов
306 НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. \ 2
ничено; следовательно, мы можем, откинув излишние
векторы и изменяя нумерацию, добиться того, чтобы
у последовательности xl9 х2, ...,#m, ... не только
первые, но и вторые координаты образовали сходящуюся
последовательность. Продолжая этот процесс далее, мы
в конце концов добьемся того, что у последовательности
хъ х2, .. ., хт, . .. каждая из п координат образует при
т —* оо сходящуюся последовательность. Но тогда и сама
последовательность хъ х2, ...,хт, ... окажется
сходящейся по метрике пространства Rn. Таким образом,
всякое бесконечное ограниченное множество в n-мерном
евклидовом пространстве компактно.
В частности, компактен единичный шар n-мерного
евклидова пространства Rn.
Замечание. Конечные подмножества метрического
пространства мы также будем причислять к компактным.
Все теоремы, которые мы будем доказывать для
компактных множеств, для конечных множеств будут
выполняться тривиальным образом.
Лемма. Компактное множество в любом
метрическом пространстве ограничено. В самом деле, пусть
некоторое множество F CZ R не ограничено. Выбрав некоторую
точку x0CZF, мы сможем для каждого натурального п
указать точку xn£F так, что р(х0у хп) > п.
Подмножество F' CZF, составленное из точек х1} x2i . .., хп, . . ., не
может содержать ни одной фундаментальной
последовательности, ибо в силу леммы 2 всякая фундаментальная
последовательность ограничена. Таким образом, F не
компактно, откуда и вытекает утверждение леммы.
Итак, для бесконечных подмножеств га-мерного
евклидова пространства компактность равнозначна
ограниченности. В бесконечномерном евклидовом пространстве
ограниченные бесконечные множества уже могут не быть
компактными.
Пример
Единичная сфера бесконечномерного евклидова
пространства R не компактна, так как она содержит
бесконечную систему взаимно ортогональных единичных
векторов еь е2, ..., еПу... Поскольку | еп — ет \2 = (еп — ет,
§ 87] КОМПАКТНЫЕ ПОДМНОЖЕСТВА 307
еп — ет) = 2, из этой системы нельзя выбрать ни одной
сходящейся последовательности.
Задача
Показать, что в пространстве /2 множество точек xz=(Zlt £2...,
• ••> £п> •••)> выделяемое неравенствами | £л I ^—(я=1, 2, ...),
компактно.
2. Единичная сфера пространства С {а, Ь) не
компактна: из множества функций, построенных в примере 3 § 85,
п. 1, принадлежащих к единичной сфере этого
пространства, нельзя выделить ни одной равномерно сходящейся
последовательности (почему?).
3. Как показал Ф. Рисе, единичная сфера любого
нормированного бесконечномерного пространства некомпактна.
4. Можно указать удобное условие компактности
семейства функций в пространстве С (а, Ь). Условимся
называть семейство F непрерывных функций {/ (t)) (a < t < Ь)
равностепенно-непрерывным, если для любого заданного
г > 0 можно указать такое 8 > 0, что при выполнении
условия | V — V | < 8 имеет место неравенство | / (£') —
— /(*")|<s Для каждой функции f{t)£F.
Например, семейство функций F — {y(t)}, имеющих
непрерывные производные, ограниченные по абсолютной величине одним
и тем же числом М, равностепенно-непрерывно. В самом деле,
е
для заданного е > 0 положим & = —; тогда при | г' — t" \ < Ь по
формуле конечных приращений для любой функции y(t)£F
(*' < 5 < t")
\9(t')-9(t'')\ = \t'-t"\\4'(t)\^\t'--tf'\M <Mb = z.
Напротив, семейство F = {sinnt} (я=1, 2, ...) не является
равностепенно-непрерывным. В самом деле, для заданного е > 0 и для
каждой отдельной функции fn(t) = sin nt из F можно указать
Ь — Ъ(п), обеспечивающее выполнение неравенства | /п (£')-—/n (t") \<л
при \t' — tn\ <Ь; легко проверить, что Ь(п) должно иметь
величину порядка — *), и поэтому не может существовать поло-
*) По той же формуле конечных приращений
sin nt — sin nt0 = n(t —10) cos ntlt 10 < fx <; t.
Если sinrtfo = 0, то cos nt0= ± i и, ^следовательно, при малом
t —10 величина | cos nt1 | как угодно близка к единице. Поэтому,
20*
308 НОРМИРОВАННЫЕ- И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ.12
жительного Ь, пригодного одновременно, ддя всех функций
/„о. ;
Условие компактности, о котором идёт речь,
формулируется следующим образом.
Теорема Ар чел а. Бесконечное ограниченное и
равностепенно-непрерывное семейство F— {f(t)}ClC(а, Ъ)
является компактным в С {а, Ъ).
Доказательство. Пусть гъ г2\ . . . —
последовательность всех рациональных точек отрезка а<£<&*).
Числовое множество {/ (гг)} по теореме Больцано
компактно; следовательно, из множества всех данных функций F
можно выделить последовательность F± = {ап (t)\ (п = 1,
2, ...) так, чтобы числа a1(r1)y a2(/*i)> ••• образовали
сходящуюся числовую последовательность. Далее
числовое множество {ап(^2)\ по той же теореме Больцано
компактно, и из множества Рг мы можем выделить
последовательность F2 = {bn{t)} так, чтобы числа bx(r2)y h(r2), . ..
образовали сходящуюся числовую последовательность.
Продолжая этот процесс далее, мы построим систему
последовательностей функций
fi={flnW), ^WtM*)}. •••> {^р = «»(*)}. ...,
в которой каждая следующая последовательность является
частью предыдущей, причём так, что последовательность
Fp — {qn(t)} сходится в точке t = rp (и, следовательно,
во всех точках t = rlf г2у . . ., rv).
если мы хотим, чтобы правая часть была по модулю меньше s,
необходимо, чтобы величина 5 = |г —10\ была меньше — .
*) Рациональные числа (т. е. дроби вида — , где р и
q—целые) отрезка a^t^b можно занумеровать, например,
следующим образом. Сначала занумеровать все дроби вида =j (их
конечное число); затем последующими номерами обозначить
несократимые дроби вида — ; затем нумеровать несократимые дроби вида —-
и т. д. Очевидно, что любое рациональное число получит при
этом некоторый номер; располагая рациональные числа по
порядку номеров, мы и построим искомую последовательность.
§'87]
КОМПАКТНЫЕ ПОДМНОЖЕСТВА
309
Построим теперь новую, так называемую
«диагональную» последовательность
/i(0 = M0, /»(0 = ^(0. •••>Ы0 = ?р(0> •••
Эта последовательность, начиная с некоторого члена,
является частью каждой последовательности Fv, и поэтому
она сходится в каждой рациональной точке rv отрезка
Мы утверждаем, что она является сходящейся в
пространстве С(а\ Ь). Поскольку это пространство полно
(§ 86, п. 3), достаточно доказать, что последовательность
/i(0> /г(0» •••> /п(0» ••• фундаментальна. Чтобы
доказать это, мы должны для заданного е > 0 указать номер
N — N(e) так, чтобы при любом п> N выполнялось
неравенство
\fn(t) — /n-Hn(0l<£
для всех t в промежутке а<£<6.
Найдём для числа -|- положительную величину 8 из
условия равностепенной непрерывности семейства F.
Затем разобьём отрезок а < t < Ъ конечным числом
рациональных точек Si, $2у ..., $и на частичные интервалы так,
чтобы длина каждого из них не превосходила 8. Так
как диагональная последовательность {/п(0} сходится
в каждой рациональной точке, то для заданного ~ мож-
о
но указать номер N, что при п > N и любом т будет
иметь место неравенство
I/»(*/)-/*+«(«/) К у (7 = 1,2 к). (4)
Пусть t -— любая точка отрезка и Sj — ближайшая к ней
точка деления.
Так как \t — $j\ < 8, то в силу равностепенной
непрерывности семейства F мы будем иметь:
l/n(^)-/n(0Ky, (5)
| fn+m (Sf) - fn+m (0 К у ' (6)
310 НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 12
Следствием неравенств (4) —(6) является искомое
неравенство
!/«(0-/n+m(0l<e,
которое, таким образом, доказано.
Замечание. Очевидно, что условия теоремы Арчела
являются также достаточными для компактности
семейства функций в пространстве С2(а, Ъ). Можно показать,
что условия теоремы Арчела являются необходимыми
условиями компактности в пространстве С (а, Ъ), но не
являются необходимыми в пространстве С2(а, Ь).
Замкнутое компактное подмножество F метрического
пространства R называется компактом.
Пример
Открытый интервал на прямой —компактное множество, но
не компакт. Отрезок (замкнутый интервал)—компакт.
§ 88. Непрерывные функции на компактах
Числовая функция f(x), определённая на некотором
подмножестве F метрического пространства /?, называется
непрерывной в точке x0£Ff если для любого е > 0 можно
указать такое 8 > 0, что для всех x£F, для которых
р(х, #0)<5, выполняется неравенство
|/(*)-/Ы|<г.
Функция f(x) называется непрерывной на множестве F,
если она непрерывна в каждой точке x0£F.
Пример
В нормированном пространстве R норма вектора х
является непрерывной функцией от х на пространстве R.
Действительно, пусть задан вектор х0 и
положительное число s. Рассмотрим совокупность всех векторов x£R,
для которых р(х, х0) — \х — #o|<s. В силу неравенства
треугольника
\х\ = \х — х0 + х0\<\х — х0\ + \х0\<\хо\ + г,
KIH^o — я + #|<|#о — я| + |я|<|я| + е,
откуда
||я| — |ж0||<е.
§ 88] НЕПРЕРЫВНЫЕ ФУНКЦИИ НА КОМПАКТАХ 311
Таким образом, полагая &(е) = е, приходим к
выполнению условия непрерывности функции \х\ при х = х0. Так
как х0 — любая точка пространства R, то функция \х\
непрерывна на всём R, что и требуется.
Так же как и в классическом анализе, можно дать
второе определение непрерывной функции. Именно,
функция f(x) называется непрерывной в точке x0£F, если для
любой последовательности хп —■> xQ, xn g F (п — 1, 2, ...)
имеет место предельное соотношение f(xn)—>f(x0).
Эквивалентность этих двух определений доказывается обычным
путём, так же как в классическом анализе.
Далее, без изменения переносятся доказательства
теорем о том, что сумма, разность, произведение и частное
двух непрерывных функций (последнее — в предположении,
что знаменатель отличен от нуля) суть также
непрерывные функции.
Мы покажем сейчас, что известные из анализа
основные свойства непрерывных функций на отрезке —
ограниченность функции и достижение функцией точной
верхней (нижней) грани —- являются общими свойствами
непрерывных функций на любом компакте.
Теорема 37. Всякая непрерывная функция f(x)t
определённая на компакте F, метрического
пространства R ограничена.
Доказательство. Допустим, что f(x) не
ограничена. Тогда для любого целого п можно указать точку
xn£F, в которой \f(xn)\> п.
Последовательность точек хъ х2, ..., хп, ... в силу
предположения о компактности должна содержать
сходящуюся последовательность: отбросив, если потребуется,
часть точек, мы можем предположить, что сама эта
последовательность сходится к некоторой точке x0£R; в силу
предположения о замкнутости F имеем х0 6 F. Тем самым
существует число f{xQ). В силу непрерывности f(x) существует
окрестность точки х0, определяемая, например,
неравенством р (х, х0) < §, в которой \f(x) — f (х0) | < 1 или | / (х) | <
<|/(^о)| + 1- С другой стороны, в этой окрестности
имеются точки последовательности хъ х2> ... со сколь
угодно большими номерами; в этих точках | / (х) |
принимает сколь угодно большие значения. Полученное противо-
312 НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 12
речие показывает, что f(x) но может быть
неограниченной; таким образом, на самом деле f(x) ограничена, что
и требуется.
Теорема 38. Всякая непрерывная функция f(x),
определённая на компакте F метрического
пространства Н> достигает точной верхней (и нижней) грани.
Доказательство. Пусть М — точная верхняя грань
значений f(x). Для любого целого п можно указать
точку хП9 в которой выполняется неравенство
\M-f(xn)\<±.
Допустим, что функция f(x) ни в одной точке
компакта F не принимает значения М. Тогда функция
непрерывна на компакте F и по теореме 37 ограничена.
Но на последовательности точек хп знаменатель стремится
к нулю. Поэтому функция ср (х) не может быть
ограниченной. Полученное противоречие показывает, что наше
допущение несправедливо; следовательно, в некоторой точке
компакта F функция f(x) принимает значение М.
Следствие. Так как единичная сфера
конечномерного евклидова пространства компактна (пример 1, п. 1)
и, очевидно, замкнута, то всякая непрерывная функция,
определённая на этой сфере, ограничена и достигает
точной верхней и нижней граней.
Замечание. Теоремы 37 и 38 перестают быт*ь
справедливыми для множеств, не являющихся компактами. Очень
легко указать непрерывные функции на интервале, для
которых та или другая теорема неверна. Немного более
сложная конструкция позволяет построить непрерывную функцию
на единичном шаре бесконечномерного евклидова
пространства, неограниченную или же ограниченную, но не
достигающую точной верхней границы.
Задачи
1. Функция / (х) определяется на бесконечномерном евклидовом
пространстве В. следующим образом: пусть elf <?2, ...
—последовательность взаимно ортогональных нормированных векторов
§ 89] О Н0РМЕВ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВАХ 313
1
и Un—шар радиуса у с центром в конце вектора еп\ положим
в пределах шара Unf(x) = n (1 — 2р), где р есть расстояние от конца
вектора х до конца вектора еп\ вне всех Un положим /(ж) = 0.
Показать, что / (х) непрерывна и не ограничена на единичном
шаре.
2. Изменить конструкцию, данную в задаче 1, так, чтобы
получить функцию, ограниченную в единичном шаре, но не
достигающую точной верхней границы.
§ 89. О норме в конечномерных пространствах
1. Допустим, что некоторое линейное пространство R
нормировано, причём двумя способами. Обозначим норму
вектора х, полученную первым способом, через \х\ъ
а норму, полученную вторым способом, через |х|2.
Назовём эти две нормы равносильными, если
существуют положительные постоянные Сх и С2,
удовлетворяющие неравенствам
I # |2 ^ ^1 I % |1> I % |1 "^ ^2 I % |2 •
Две равносильные нормы приводят к одному и тому
же виду сходимости в пространстве R: этим мы хотим
сказать, что всякая последовательность хъ #2, ..., хп, .. .,
сходящаяся в R в смысле, определённом одной из данных
норм, будет сходящейся и в смысле, определяемом другой
нормой. Действительно, если, например, \х — хп\г—>0,
то и \х — £n|2<Ci|# — xn\x также стремится к нулю.
То же относится и к фундаментальным последовательностям.
В этом параграфе мы покажем, что любые две нормы,
введённые в n-мерном линейном пространстве R,
равносильны.
2. Выберем в га-мерном пространстве R произвольным
образом базис еь е2, •••> Сп> Тогда в пространстве/?
можно ввести евклидову метрику, полагая для векторов
п п
х ^ 2 ^квк и У ^ 2 ^kek скаляРное произведение равным
ft=i fe=i
n
величине .(#, ?/)■= ^ hk^lk- Норму (длину) вектора х в этой
fc=t
314 НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 12
евклидовой метрике обозначим через ||я||. Пусть, кроме
того, в пространстве R задана норма \х\. Мы пскажем,
что эта норма | х | всегда равносильна евклидовой. Пусть М
означает максимум из величин | ег |, | е2 |, ..., | еп\. Тогда,
используя неравенство треугольника и неравенство Коши-
Буняковского (§ 49, п. 2), мы для любого вектора х можем
написать неравенство
п п п
%lkek\<%\lk\\ek\<M2\\lk\.l<
'ь=1 fe=i ' fe=i
<M\/n\/ 2Й = Л//л||я||
fe=i
или
I^KdHajll, (7)
где Сi = М ]/ п .
Таким образом, одно из нужных нам неравенств
установлено. Чтобы получить второе необходимое неравенство,
покажем сначала, что все координаты всех векторов
единичной сферы {|#| = 1} ограничены в совокупности.
Докажем это утверждение для какой-нибудь одной —для
определённости первой—координаты. Допуская противное, мы для
любого натурального т сможем указать вектор хт, | хт | — 1,
у которого первая координата £х превосходит число т.
В этом Случае, очевидно, || хт || = V 2 £i > I £i I также
превосходит число т. Рассмотрим векторы ут= Хт
И хт II
(т = 1, 2, ...). Они принадлежат к евклидову единичному
шару. В силу компактности последнего (§ 87, пример 2)
можно предполагать, что последовательность уш сходится
по евклидовой метрике к некоторому вектору у; при этом
в силу непрерывности нормы (§ 88) ||j/|| = lim ||г/т|| = 1
т-»оо
и, следовательно, у Ф 0. Но сходимость по евклидовой
метрике в силу доказанного уже неравенства (7) влечёт
сходимость по второй норме; таким образом, и по второй
норме ут-^у. Но |sm| = l, \\хт\\>ту откуда |ут| =
= ' ~т' < ——> 0; следовательно, по второй норме ут —> 0,
§ 89] О НОРМЕ В КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВАХ 315
у = lim ym = 0. Полученное противоречие убеждает нас
в справедливости утверждения.
Обозначим через К верхнюю границу координат точек
единичной сферы {| х | = 1}. Пусть теперь х ■= 2 1кеь —
любой вектор, отличный от нуля. Тогда ■гт=:Хтт^
принадлежит к единичной сфере, и по доказанному
Щ-<К (*=1,2, ...,»),
или, что то же самое,
|Ы<ЛГ|ж| (А=1, 2, ...,/г).
Поэтому
1И = "|/ ^l<VnK^\x\^K\x\Vn
или
где С2~ К \^п. Мы получили второе требуемое
неравенство. Таким образом, всякая норма в пространстве R
равносильна введённой нами евклидовой норме. Отсюда
легко вытекает, что две любые нормы в пространстве R
равносильны друг другу.
3. Мы уже видели, что тг-мерное евклидово
пространство полно (§ 86, п. 3). Поскольку понятие полноты
базируется на основе определений фундаментальных и
сходящихся последовательностей, то мы можем сделать вывод,
что n-мерное нормированное пространство полно при
любом выборе нормы.
4. Сходимость в тг-мерном пространстве, определяемая
евклидовой нормой, есть сходимость по всем координатам
(§ 85, пример 1). Поскольку двум равносильным нормам
отвечает один и тот же тип сходимости, мы можем
заключить, что сходимость в n-мерном пространстве,
определяемая любой нормой, есть сходимость по всем
координатам.
5. Пусть конечномерное пространство Rn является
подпространством более широкого (возможно, бесконечно-
316 НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 12
мерного) нормированного пространства R. Покажем, что Rn
замкнуто в пространстве R. Для доказательства
рассмотрим любую последовательность • векторов хт £ Rn
(w=l, 2, .. .), "сходящуюся к некоторому вектору x£R,
и покажем, что x£Rn. Подпространство Rn само является
нормированным пространством (с тем определением нормы,
которое действует во всём R). Так как сходящаяся в R
последовательность хт фундаментальна (лемма 1 § 86),
то она является фундаментальной и в Rn. В силу полноты
конечномерного пространства Rn (п. 3) в Rn имеется
предел х этой последовательности по норме пространства Rn
(а следовательно, и по норме всего К). Но, поскольку
сходящаяся последовательность имеет единственный предел
(§85,п. 1), мы имеем x = x£Rn, что и требовалось.
§ 90. Линейные функционалы
В нормированном пространстве R (в частности, в
евклидовом) можно рассматривать линейные и билинейные
функционалы (§ 25). Однако содержательная теория линейных
функционалов получается при выполнении, кроме обычных
условий (I) —(II) § 25, следующего дополнительного
условия:
(III) |/(#)| ограничена, когда вектор х изменяется
в единичной сфере пространства R.
Линейные функционалы f(x)> удовлетворяющие также
условию (III), мы будем называть ограниченными
линейными функционалами.
Примеры
Разберём с точки зрения выполнения условия (III) примеры
3—5 § 25, п. 2.
1. Функционал f(x) = x(t0) ограничен в С (а, Ъ), ибо из
|| х (г) \\ = шах | х (г) | ^ 1 вытекает | х (t0) | <: 1. В то же время
в С2 (а, Ъ) этот функционал не ограничен, так как условие
ь
(X, х) = \ X*(t)dt=l
а
ничем не ограничивает значение функции х (t) в точке ц.
§ 90] ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ 317
2. Функционал
ъ
/(*)=jj c(t)x(t)dl
а
ограничен в С (а, Ъ)\ действительно, из неравенств || х (t) || ^1,
с (t) ^ М (= max | с (г) I) вытекает:
а<^1<Ъ
\f(x)\^M(b-a). (8)
Этот функционал ограничен и в С2 (я, Ъ) как скалярное
произведение вектора х (t) на фиксированный вектор с (t) (см. следующий
пример).
3. Функционал f(x) = (x, x0) в евклидовом пространстве R
ограничен, так как при | х | <^ 1 по неравенству Коши-Буняков-
ского
1/(*)|<|*1 |*01<К1- (9)
4. В n-мерном нормированном пространстве всякая линейная
функция ограничена. Действительно, в § 25, п. 3 мы видели, что
любая линейная функция f(x) в гс-мерном пространстве R имеет
вид
п
/(*)=2сл, (10)
где Si, £2> •••» 5П—координаты вектора х относительно
произвольно выбранного базиса, сг, с2, ..., сп—некоторые числа.
А в § 89 мы показали, что каждая координата вектора х
ограничена в единичной сфере пространства R. Поэтому и линейная
комбинация (10) координат вектора х ограничена в единичной
сфере пространства R, что и требуется.
5. Пусть / (х)—ограниченный линейный функционал. Величину
| / | = sup | / (х) | для | х | ^ 1 мы будем называть нормой
линейного функционала /(#). Для произвольного х£Я вектор -|—г
I х I
имеет норму, равную 1, поэтому
х
4т I/(*)! =
Л 1*1
1/1.
откуда мы получаем неравенство
|/(*)|<|/|.|*1- (11)
Из неравенства (11), в частности, вытекает, что ограниченный
линейный" функционал является непрерывной функцией на
пространстве R (§88).
318 НОГМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 12
Действительно, для фиксированного x0£R при достаточно
малом | х—х0 | мы получаем:
1/(*)-/ЫЫ/(*-*о)|<|/1 !^—^оI < ^
для произвольно заданного е > 0. Тем самым мы доказали, что
функционал / (х) непрерывен в точке х0 £ R. Так как х0 —
произвольная точка R, то функционал f (х) непрерывен на всём R, что и
требовалось.
§ 91. Билинейные функционалы
Билинейные функционалы А(х, у) в нормированном
пространстве R также обычно рассматриваются при
следующем дополнительном условии:
(III) \А(х, у)\ ограничена, когда векторы х и у
изменяются (независимо друг от друга) в единичном шаре
пространства R.
Билинейные функционалы, удовлетворяющие
условию (III), мы будем называть ограниченными билинейными
функционалами.
Примеры
1. Легко проверить, что билинейная функция
ъ ь
А(х,у)=[ \K(s,t)x(t)y(s)dtds
а а
(§"40, пример 3) ограничена как в С (a, b), так и в C2(at b), если
функция К (5, t), например, непрерывна.
2. В гс-мерном нормированном пространстве всякая
билинейная форма является ограниченным билинейным функционалом.
Доказательство проводится так же, как для линейных форм
(см. § 90).
§ 92. Линейные операторы в бесконечномерных
пространствах
В нормированном пространстве R (в частности,
евклидовом) важный класс образуют ограниченные линейные
операторы. Так называются линейные операторы А,
удовлетворяющие следующему дополнительному условию:
(III) Величина \Ах\ ограничена, когда вектор х
изменяется в единичной сфере пространства R.
«93] О ПОПОЛНЕНИИ МЕТРИЧЕСКОГО ПРОСТРАНСТВА 319
Так, операторы в примерах 7 и 8 § 26 ограничены в
пространстве С2 (а, Ь).
Легко проверить аналогично тому, как это сделано
в § 90 для линейных функционалов, что в п-мерном
нормированном пространстве всякий линейный оператор
ограничен.
Назовём линейный оператор А непрерывным в точке
х -- х0, если lim | Ax — AxQ \ = 0. Легко доказать, точно
Х-*Х0
так же как и для линейных функционалов, что
ограниченный линейный оператор непрерывен в любой точке х0 £ R.
Точная верхняя грань М величины | Ах | при | х | < 1
называется нормой ограниченного оператора А.
Всякое собственное значение X ограниченного оператора А
по модулю не превосходит нормы оператора; действительно, если
е — соответствующий нормированный собственный вектор, то
Результаты § 65 показывают, что для симметричных линейных
операторов в гс-мерном евклидовом пространстве максимальный
модуль собственного значения совпадает с нормой оператора.
В п. 14 мы обобщим эту теорему на некоторый класс операторов
в бесконечномерном пространстве. Но в общем случае это
утверждение несправедливо хотя бы потому, что существуют линейные
операторы, вовсе не имеющие собственных векторов и
собственных значений (§ 63).
Примером неограниченного оператора является оператор
D дифференцирования (пример 9 § 25). Действительно,
рассмотрим функции smnt (тг=1, 2, ...); они
принадлежат к единичной сфере пространства С2(0, 1) и к
области определения оператора D. В результате применения
оператора D к функциям sin nt мы получим функции
п cos nt, нормы которых не ограничены.
В дальнейшем мы ещё встретимся с неограниченными
операторами.
§ 93. О пополнении метрического пространства
В теории Кантора вещественные числа определяются при
помощи фундаментальных последовательностей рациональных
чисел *). Рациональные числа образуют в обычной метрике не-
*) См., например, В. В. Немыцкий, Курс математического
анализа, М.—Л. 1944.
320 НОРМИРОВАННЫЕ И МЕТРИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 12
полное метрическое пространство R, и процесс построения
вещественных чисел, в частности, есть процесс построения полного
пространства R, включающего пространство R. Метод Кантора,
должным образом обобщённый, позволяет любое неполное
метрическое пространство R включить в некоторое полное
пространство R. Если R было при этом линейным нормированным
пространством, то R будет полным линейным нормированным
пространством; если R было евклидовым, то R будет полным евклидовым
пространством.
Мы не будем приводить деталей этого построения, так как
в дальнейшем нам оно не понадобится *). Отметим только
следующее обстоятельство.
Результат применения метода Кантора к рациональным
числам—именно совокупность вещественных чисел—имеет прямой
геометрический смысл. В других случаях природа новых точек,
присоединяемых к пространству R в процессе пополнения, не всегда
очевидна. Если, например, исходное пространство R есть
пространство многочленов Р (t) от одного переменного t с метрикой,
заданной при помощи нормы
|| Р (011= max |P(0|,
то с помощью теоремы Вейерштрасса, которую мы докажем в § 99
(теорема 44), можно установить, что пространство R есть
пространство С (а, Ь). Совсем не просто выяснить, какова конкретная
природа элементов пространства R, получающегося при
пополнении неполного евклидова пространства С2(а, &)J ответ на этот
вопрос требует предварительного построения теории меры и
интеграла Лебега **).
*) См. Ф. Хаусдорф, Теория множеств, 1937, стр. 152.
**) См. И. П. Натансон, Теория функций вещественной
переменной, М.—JL, 1950, гл. VII.
ГЛАВА 13
ОСОБЕННОСТИ ГЕОМЕТРИИ БЕСКОНЕЧНОМЕРНОГО
ЕВКЛИДОВА ПРОСТРАНСТВА И РЯДЫ ФУРЬЕ
§ 94. Задача о наилучшем приближении
Задача, которую мы будем решать, формулируется
следующим образом:
Пусть в евклидовом пространстве R задана некоторая
ортогональная и нормированная система векторов еъ еъ ...
.. ., еп и некоторый вектор /.
Требуется найти в подпространсте R', порождённом
векторами еъ е2, ..., еПу такой вектор у, чтобы
разность f — y имела наименьшую возможную длину.
Эта задача о наилучшем приближении тесно связана
с задачей о перпендикуляре, рассмотренной в § 55.
Именно, как показано в § 55, существует разложение
/ = * + *■ 0)
где g£R', a h ортогонален к Д'. Мы утверждаем, что
вектор g—-проекция вектора f на подпространство R —
является решением задачи о наилучшем приближении.
Действительно, возьмём в подпространстве R'
произвольный вектор у. Мы имеем:
f-y = h + (g-y).
Так как векторы h и g — y взаимно ортогональны, то по
теореме Пифагора
(f-yr = \h\2 + \g-y\\
откуда следует, что разность f — y имеет наименьшую
длину, если y — g, что мы и утверждали.
21 Г. Е. Шилов
322 ряды фурье [гл. 13
Как показано в § 55, п. 1, вектор g может быть
представлен в виде
п
g=2 ад*,
^==1
где afe = (/, ей) (А=1, 2, ..., п). Длина вектора h легко
вычисляется по теореме Пифагора
п п
iM2H/i24iN2=i/i2-2^=i/i2-2(/>e*)2- (2)
fe=i ft=i
В приложениях часто требуется дать решение аналогичной задачи
для ортогональной, но не нормированной системы векторов Д,
fk
/г> •••» in- В этом случае, полагая *ь =7-7—7 > мы получаем нор-
I /ftl
мированную систему; по доказанному решение имеет вид
п п п ,
*-2 w-S с/. *> *~ s(/. ш) rir
(/■ 4)
. (4- 4)
ft-i ft-i fe=i
-Y^-/ (3)
/i«i
Пример
Дана непрерывная функция f(t) (—тс<*<тс); требуется
п
построить тригонометрический многочлен Sn (t) = Y (a cos A: t +
fe=0
+ &ft sin fo) так, чтобы отклонение Sn (t) от / (£) в среднем (т. е.
тс
значение интеграла \ \Sn(t)-—f(t)\2dt) было наименьшим воз-
—75
можным. Мы знаем, что векторы cos kt, sin kt (& —О, 1, ..., n)
ортогональны в пространстве C2(—-тс, тс) (§ 49, п. 3), поэтому мы
можем применить формулу (3).
Определим сначала знаменатели коэффициентов в этой
формуле. Легко проверить, что
ТС ТС 75
V 1.<Й = 2те, \ сов8 Л* Л = \ sin2 fa«тс
—7С —ТС —ТС
(*=1, 2 п).
§ 94] ЗАДАЧА О НАИЛУЧШЕМ ПРИБЛИЖЕНИИ 323
Применяя формулу (3), получаем решение задачи в виде
п
Sn (0 = у + 2 (ah cos ** + h 8in *0.
ft=i
где
ic 1
<xfe — — \ f(t) cos to dt,
}
* 1 С
Pfe = — \ /(*) sin kt dt
(ft = 0, 1, 2, ..., л).
(4)
В анализе числа afe и рк носят название коэффициентов Фурье.
Напомним, что мы в § 50 назвали коэффициентами Фурье
скалярные произведения вида (#, ek), где eh (я=1, 2, ...) —любая
ортогональная нормированная система векторов евклидова пространства.
Если нам будет нужно подчеркнуть, что речь идёт именно
о коэффициентах Фурье по тригонометрической системе, мы будем
их называть тригонометрическими коэффициентами Фурье.
Задачи
1. Для функции t/(0 = l'| ( —я < * < Тс) написать тригономе-
5
трический многочлен S6 (t) = >►. ak cos ** + Pft s*n ^ так' чт°бы от"
ft=0
клонение Ss(t) от y(t) в среднем было наименьшим возможным.
Построить на одном чертеже у (t) и S5 (t).
iz 4
Отв. S5(t) = -7: cos t*
4 соя Zt 4 cos bt
~^ 9 IT 25 '
2. На отрезке — l^t < Z ортогональную систему составляют
функции cos -т-t, sin -j t (& = 0, 1, 2. ...)• Написать формулы
для коэффициентов разложения данной функции / (t) по этой
системе.
где
Отв. /(0=у+2 (aftcos-7 ' + Miny '
l i
afc = l С /(t)COS^tdt. Pfc = -j ^ f(t)sin~tdt.
21*
324
РЯДЫ ФУРЬЕ
[ГЛ. 13
3. Что можно сказать о тригонометрических коэффициентах
Фурье чётной функции f(t), нечётной функции / (t)?
Указание. Функция / (£) называется чётной, если / (—1) =
= f(t), и нечётной, если / (— t) = — / (t).
Отв. Если f{t) четна, ph = 0 (A=l, 2, ...).
Если fit) нечётна, afe= 0 (# = 0, 1, 2, ...).
§ 95. Ряд Фурье и замкнутые ортогональные системы
1. Пусть теперь в евклидовом пространстве R выделена
бесконечная нормированная система {е} = {ег, е2, ..., еп, ...}.
Поставим следующую задачу (конкретные формы этой
задачи весьма существенны в некоторых областях
математической физики): можно ли для любого вектора x£R,
выбирая должным образом достаточно большое п и
коэффициенты аь а2, ..., ап, сделать разность
п
сколь угодно малой в смысле метрики пространства R?
При заданном п мы в § 94 уже видели, каким
образом следует выбрать коэффициенты <хь а2, . . ., ап, чтобы^
п
получить наименьшее значение длины вектора # — 2 аь.ен\
эти числа должны быть равны коэффициентам Фурье
(х, ек) вектора х относительно системы {е}. Сумма
п
sn=2 (^> efe)6k
есть п-я частная сумма ряда
со
2 (ж, eh) ек.
Этот ряд называется рядом Фурье вектора х
относительно системы {е). Теперь мы можем дать
следующую эквивалентную формулировку нашей задачи: будет
§ 95] ЗАМКНУТЫЕ ОРТОГОНАЛЬНЫЕ СИСТЕМЫ 325
ли для всякого вектора x£R его ряд Фурье
относительно системы {е} сходиться к х по метрике
пространства Я?
2. Простой пример показывает, что наша задача не
для всякой системы векторов {е} имеет положительное
решение. Допустим, что имеется вектор х0 Ф О,
ортогональный ко всем векторам системы {е}. Его
коэффициенты Фурье относительно этой системы все обращаются
в нуль; поэтому соответствующий ряд Фурье сходится
к нуль-вектору и, следовательно, не сходится к
вектору х0. Таким образом, для положительного решения
задачи во всяком случае необходимо, чтобы система
векторов {е} была достаточно богата —настолько, чтобы в
пространстве R не было ни одного ненулевого вектора х,
ортогонального к каждому вектору системы. Такие
ортогональные системы мы будем называть замкнутыми.
Вообще введём следующее определение:
Система векторов {х} = [х1у х2, ..., хп,.. .} в евклидовом
пространстве R называется замкнутой, если вектор x£R,
ортогональный к каждому вектору хп(п = 1, 2, ...),
равен нулю. Отметим, что от системы {х} не требуется
взаимная ортогональность входящих в неё векторов.
Если пространство R тг-мерно, то замкнутой
ортогональной системой в нём является любая ортогональная
система из п ненулевых векторов elf е2, ..., еп.
Действительно, ненулевой вектор х, ортогональный ко всем
векторам еъ е2, ..., еп по лемме 1 § 49, п. 3, был бы
линейно независимым от них; в га-мерном пространстве нашлись
бы, таким образом, га + 1 линейно независимых вектора,
что невозможно.
3. В бесконечномерном евклидовом пространстве вопрос
о замкнутости той или иной системы ортогональных
векторов является далеко не столь простым. Для
пространства С2(а, Щ можно указать один приём, который в
некоторых случаях привадит к положительному ответу;
в частности, этот приём можно применить для
доказательства замкнутости тригонометрической системы и
системы многочленов Лежандра. Он состоит в следующем.
Допустим, что для каждой точки t0 (a <t0 < Ъ) и
каждого 8 > 0 такого, что а < t0 — 28, b > t0 + 2b, в линей-
326
РЯДЫ ФУРЬЕ
[ГЛ. 13
ной оболочке заданной системы функций e1(t)f e2(t), ...
..., en(0> • • • (проверяемой на замкнутость) можно найти
такую последовательность функций <pi(0> ?2(0> • • • > к0~
торая обладает следующими свойствами (черт. 9):
(I) <fn(t)>\ на интервале (*0-—8, *0 + 8).
(II) срп(г)>0на интервале (*0 — 28, г0 + 28).
(III) Вне интервала (^0 — 28, ^0 + 28) функции yn(t)
равномерно стремятся к нулю, когда п—>оо.
л%М
В этом случае исходная система функций {е(г)} =
= {^i (t), e2 (t), . ..} замкнута.
Для доказательства допустим противное: существует
непрерывная функция /(г)=^=0, ортогональная ко всем
функциям ег{£), e2(t), .. . Пусть ^-—внутренняя точка
интервала (а, 6), в которой f(tQ) Ф О, и пусть для
определённости / (t0) = 2с > 0. В силу непрерывности / (t)
существует интервал с центром в точке t0> в котором
значения функции f(t) превосходят величину с;
обозначим концы этого интервала через t0
смотрим интеграл
и t0-\ 28. Рас-
'n=J f(t)<?n(t)dt,
представляющий скалярное произведение функции / (t)
с указанной выше функцией <рп(0> построенной для
данных t0 и 8. Поскольку f(t) ортогональна к функциям
ei(0» вг(0» •••» т0 в силу леммы 1 § 49, п. 3 f(t)
ортогональна и к функции <рп(0> входящей в линейную
оболочку системы этих функций; таким образом, /п = 0.
§ 95] ЗАМКНУТЫЕ ОРТОГОНАЛЬНЫЕ СИСТЕМЫ 327
С другой стороны, часть интеграла 1Пу
соответствующая интервалу (^0 — 2S, £0-Ь28), положительна (в силу
условия (II)), причём заведомо превосходит величину
\ /(*)?п(0°^ > с • 2S (в силу условия (I)). Оставшаяся
часть стремится при п—^оо к нулю вместе с
функцией срп(£) (в силу условия (Ш)). Но в таком случае
при достаточно большом п величина 1п уже не может
быть равна нулю. Полученное противоречие показывает,
что функция /(£), ортогональная ко всем функциям
e1(t),e2{t), ..., не может быть отличной от нуля.
Следовательно, система {e(t)} замкнута, что и требуется.
4. Покажем, как построить функции срп(0 для
тригонометрической системы. Из тригонометрии известно, что
функции уп (t) = cos2n -^-* при любом натуральном п
могут быть выражены линейно через функции 1, cos г,
sin£, cos2*, sin2£, .. ., cosraJ, sinnt*).
Графики функции г/п(0 изображены на черт. 10.
Каждую из них разделим на её значение в точке
*) Вот одно из доказательств. По формуле Эйлера
сое ¥ = у (***+*-**),
откуда
1 1 / - 2
.J-tp . t-tp
1 2 \2п
е
2тг .. t— to . ,п ,. t—to
1 vir* гк1Г •-*&"-*> —
ft=0
2n
_ 1 V* г (ft-n) t
~~ 22ГС 2j ake '
fc=0
где cLh^C\ne~x^h"^n>i to . Отделяя в этой сумме вещественную
и мнимую части по формуле el<p = cos<p + *sin<p, приходим к
выражению функции cos2n-^- (* —10) в виде линейной* комбинации
функций 1, cosf, sin t, ..., cos nt, sin nt.
328
РЯДЫ ФУРЬЕ
[ГЛ. 13
*1 = *о + 8; проверим, что полученная последовательность
функций
cos2n4-(*-*o)
?»(0 = — (5)
cos2nyS
удовлетворяет требуемым условиям. В самом деле, на
интервале (t — Ъ, t-\-b) числитель отношения (5) больше
.cos*»J#-y
cos* yt-t0)
tn+П
Черт. 10.
чем знаменатель и, следовательно, <рп(г)>1; очевидно,
вне этого интервала 0 < <рп (0 < 1 • Наконец, при 11 —10 | > 2S
мы имеем:
=.2П* /плеЯ \2П
1?п(01<
coszn5
2n &
cos у
^cosS
cosy
откуда вытекает равномерное стремление <рп(0 к нулю
при п—>оо в области \t — £0|>8.
Таким образом, условия (I) —(III) для построенной
последовательности функций срп(£) выполнены. Применяя
доказанную теорему, получаем:
Система тригонометрических функций 1, cos t, sin t,. ..
. . ., costtl, sinnl, ... замкнута в пространстве С2( — тг, it).
5. Покажем, как построить функции <pn(0 для
доказательства полноты системы многочленов Лежандра.
Рассмотрим последовательность многочленов
*.w-[i-(t?)T-
Графики этих многочленов изображены на черт. 11.
Каждый из этих многочленов, как и вообще любой много-
§ 95] ЗАМКНУТЫЕ ОРТОГОНАЛЬНЫЕ СИСТЕМЫ 329
член 2п-й степени, может быть выражен линейно через
многочлены Лежандра P0(t), Pi(t), .. ., P2n(t). Если
разделить каждый из многочленов Rn{t) на его значение
в точке t0 ± 8, то, так же как и выше, легко доказать,
что полученные функции срп(г) —- A x2in удовлетво-
ряют условиям (1) —(III). Таким образом, мы получаем:
Система многочленов Лежандра PQ (t), Pi(t), ...
■ • •> Pn(t), . - • замкнута в пространстве С2( — 1, 1).
Черт. И.
6. Замечание. Одновременно мы доказали, что
(неортогональная) система степеней 1, t, t2, ... замкнута
в пространстве С2 ( — 1, 1). Доказательство теоремы
замкнутости для этих функций легко может быть
обобщено на случай любого отрезка а<г<6. Для
тригонометрической системы обобщение это, вообще говоря,
не может быть произведено. Так в пространстве С2 (— 2ic, 2тс)
функция sin-н- ортогональна ко всем функциям системы
1, cos*, sin t, .. ., cosra£, sinnt, ...
Наоборот, на меньшем отрезке 0<£<гс уже система
sin t, sin2z, . .., sinal, .. . является замкнутой.
Для доказательства рассмотрим произвольную
функцию f(t)£C(0, тс), ортогональную ко всем функциям
системы sin t, sin 2ty . .., sin nt> ..., и покажем, что / (t) = 0.
Продолжим функцию f(t) на отрезок — тс<г<0 по
формуле /( — £)= — f(t). Легко проверить, что
определённая таким образом функция f(t) (возможно
—разрывная при t = 0) ортогональна ко всем функциям
тригонометрической системы sin £, sin2£, ..., 1, cos г, cos2£; ...;
действительно, при помощи подстановки —t — s мы на-
330
РЯДЫ ФУРЬЕ
[ГЛ. 13
ходим:
) cos nt dt =■•
$/(<)<
0 к тс тс
= \ -j- \ = — \f(s) cosns ds + \ / (t) cos ^ dt = 0,
i/w
0
sin nt dt =
0 те
= \ -f- \ = \ / ($) sin tts ds + W (£) sin nt dt -=--
-тс О 6 0
re
= 2 [ f(t)sinntdt=Q (л = 1, 2, ...).
о
Если /(£)=£= 0, то заведомо существует точка г0 т^ О,
в которой / (t0) Ф 0; так как в окрестности этой точки / (t)
непрерывна, то рассуждения, приводящие к противоречию
с предположением / (t0) ф О, здесь можно провести без
всяких изменений. Таким образом, получим, что f(t) = Q
и, следовательно, система sin t, sin 2t, . . ., sinnt, ...
замкнута в пространстве С (0, тс).
7. Используя замкнутость системы тригонометрических
многочленов и системы многочленов Лежандра, можно усилить
результаты относительно соответствующих операторов Штурма-Лиувилля,
полученные нами в § 66. А именно, докажем следующие
предложения:
1. а) Уравнение х" (t) = X& (t) в классе дважды
дифференцируемых функций на отрезке—тс^г^тс, удовлетворяющих
условиям (3) § 66, имеет решения только при Х = —л2 (л = 0, 1, 2, ...).
1. б) При каждом п эти решения исчерпываются формулой
хп (t) = Лп cos nt 4- Вп sin.nt,
где Ап vl Bn — произвольные постоянные.
2. а) Уравнение [(£2-—1)#' (t)]' = \x(t) в классе дважды
дифференцируемых функций на отрезке — 1 ^ t^ 1 имеет решения толи-*
ко при Х = я(гс-|-1) (л = 0, 1, 2, ...).
§ 96] ВСПОМОГАТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ 331
2. б) При каждом п решение этого уравнения исчерпывается
формулой
где Сп—произвольная постоянная.
Утверждения 1. а) и 2. а) вытекают из того, что
предположение противного приводит к существованию функции,
ортогональной в силу леммы 1 § 65 ко всем тригонометрическим функциям
cos nt, sinnt (я=0, 1, 2; ...) или соответственно ко всем
многочленам Лежандра Pn(ij (/г = 0, 1, 2, ...), что невозможно в силу
замкнутости этих ортогональных систем.
Утверждения 1. б) и 2. б) означают, что собственные
подпространства рассматриваемых операторов
Штурма-Лиувилля имеют определённую размерность
(соответственно 2 и 1).
Ясно, что размерность собственного подпространства R^
оператора Ь(х)=х", отвечающего значению Х=—п2, не меньше двух,
так как уравнение #"=— п*х допускает два линейно независимых
решения xt = cos nt, х2=sin nt, удовлетворяющих граничным
условиям. Также ясно, что размерность собственного подпространства
В.(п) оператора L(x) = [(t2—1)' х']', отвечающего значению Х =
= п (п + 1), не меньше единицы, так как уравнение L (х) — п (п +1) ж
допускает ненулевое решение x=Pn(t).
Если бы размерность некоторого собственного подпространства
R^ было бы больше утверждаемой, то мы смогли бы указать
в нём вектор z, ортогональный к уже известным собственным
векторам в подпространстве R^n\ Кроме того, в силу той же
леммы 1 § 65 этот вектор был бы ортогонален ко всем прочим
известным собственным векторам для других значений п; в силу
полноты системы собственных векторов вектор z должен быть
нулевым.
Примечание. Результаты 1. а) и 1. б) можно получить и
непосредственно, используя тот факт, что общее решение
уравнения х" (t) = lx (t) даётся формулой x(t) — A cos у^Д t + В sin У —It.
§ 96. Вспомогательные предложения
Мы приведём здесь некоторые леммы, которые будут
использованы далее при общем исследовании рядов Фурье.
Лемма 1. В евклидовом пространстве R скалярное
произведение (а, у) есть непрерывная функция от обоих
переменных х и у, т. е. если хп—>х, Уп—>У, то
{хп, Уп)->(х, У).
Доказательство. Положим у — уп = йш х — хп = кп]
по условию |/гп|—>0, \кп\—>0. По неравенству Коши-
332 РЯДЫ ФУРЬЕ [ГЛ. 13
Буняковского
\(х9 у) — (хп, уп)\ = \(х, у)-(х-кПу у —Дп)| =
= |(«Ж) + (у,^)-(*«,Ап)|<|я:||Ап| + |у||Ап|+1*п||Ап|;
при возрастании п эта величина стремится к нулю.
Отсюда следует, что {х> у) = lim (хпу уп), что и требовалось.
n -voo
Лемма 2. 2?с/ш еь е2, ... , еп, ... —ортогональная
и нормированная система векторов евклидова
пространства R и
•=2 ****» у 2 ^в*'
mo
(*> 2/) =2 Ьч*.
Доказательство. Применяя лемму 1, получаем:
п п
(ж, y) = (lim 2 Ънен, Km 2 W*H
= Ит (2 ?fteft> 2 %еЛ
п оо
lim 2 **%= 2 ^ft>
n"TOfe=i fc-i
что и требуется.
Лемма 3. Если система {е} — [elt е2, ... , еп, ...}
замкнута и для данного вектора х ряд Фурье
со
2 (ж» eh)eh
fe-1
сходится по метрике евклидова пространства R к
некоторому вектору s, то s= х.
§ 96] ВСПОМОГАТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ 333
Доказательство. Пользуясь леммой 1, определим
коэффициенты Фурье вектора s:
(s, ет)= ( lim У (х> eh)eh9 ет) =
\п~* со Г™\ '
п
= lim (У. (х, ek)ek, вт)=(ж, ет).
Отсюда (s — ж, ет) = 0 для любого т?г. В силу замкнутости
системы {е} вектор s — x равен нулю, что и требовалось.
Лемма 4. (Неравенство Бесселя.)
Коэффициенты Фурье любого вектора х по любой ортогональной
и нормированной системе {е} в евклидовом пространстве R
удовлетворяют неравенству
со
2 (х, ehf<(x, x). (6)
Доказательство. Для конечного п в силу
равенства (2) § 94 мы имеем:
п
fc-i
переводя к пределу при тг—>оо, получаем искомое
неравенство. Одновременно получается сходимость ряда из
квадратов коэффициентов Фурье любого вектора х по
ортогональной нормированной системе {е}.
Отметим неравенство Весселя для ортогональной, но
ненормированной системы {/} = {/!, /2, ... , /п, ...}:
ft=l «=1
Лемма 5. Если Ъъ £2, • • • > Sm • • • —произвольная
последовательность чисел со сходящимся рядом квадратов
и {е} — ортогональная нормированная система векторов
334
РЯДЫ ФУРЬЕ
[ГЛ. 13
евклидова пространства R, то частные суммы sn ряда
СО П
образуют в R фундаментальную последовательность
(§ 86, п. 1).
Доказательство. Предполагая п > т, вычислим
длину вектора sn — sm:
n n n
m-M m+1 m+1 *
В силу предположения о сходимости ряда из квадратов
чисел %k последний член равенства при п ■—> оо, т —> оо
делается сколь угодно малым, что и требуется.
§ 97. Теорема о рядах Фурье в полном
евклидовом пространстве
Теперь для полного евклидова пространства R мы
докажем основную теорему о рядах Фурье относительно
данной замкнутой ортогональной системы.
Теорема 39. Если евклидово пространство R полно,
то для всякого вектора x£R ряд Фурье (х, ег) ег+(х, е2) е2+...
по данной замкнутой ортогональной системе {е} сходится
по норме к вектору х.
Доказательство. Частные суммы ряда Фурье
вектора х по леммам 4 и 5 образуют фундаментальную
последовательность. В силу полноты пространства R эта
фундаментальная последовательность сходится к некоторому
вектору $£R. По лемме 3 s = x, что и требуется.
Следствие. (Равенство Парсевал я-Л я п у-
нова.) В предположениях теоремы 39 для любых х и у
из R имеет место равенство
со
(*. У) =2 (ж> ек)(У> efc). (8)
fc-1
§ 97] РЯДЫ ФУРЬЕ В ПОЛНОМ ПРОСТРАНСТВЕ 335
Доказательство. По теореме 39
со со
х = 2 (ж, ек) ekf у = 2 (У> ek^ ek'
Поэтому равенство (8) является непосредственным
следствием леммы 2.
В частности, для любого x£R
со
(х, х) = 2 (ж, е*)2.
Это равенство обобщает теорему Пифагора на
бесконечномерное пространство.
Замечание. Пусть i?—некоторое нормированное
пространство. Будем называть систему векторов elf е2, ..., еп, ... линейно
независимой, если из равенства
СА + СЛ+ •. • + Сп*л + ... =0 (9)
(сходимость ряда понимается по норме пространства R) вытекает
С1=С2= ... =СП= ... =0. По аналогии с определением §15
будем линейно независимую систему elt е2, ..., еп, ... называть
базисом пространства Й, если для всякого вектора x£R
существует разложение
х = 6Л + £2<?2 + ... + &п*п + • • • (Ю)
Используя простейшие свойства сходящихся рядов, мы можем
таким же приёмом, как в § 15, показать, что числа ?1? £2, • • •> 5nv
определены вектором х однозначно; поэтому мы можем называть
их координатами вектора х относительно базиса еЛ, е2, ..., еп, ...
В евклидовом пространстве всякая ортогональная система
е1У е2, ..., еп, ... линейно независима. Действительно, если
равенство (9) скалярно умножить на еп и воспользоваться леммой 1,
то мы получим Сп = 0.
Теорема о рядах Фурье показывает, что в полном евклидовом
пространстве замкнутая ортогональная система elt е2, ..., еп> ...
всегда является базисом.
В частности, в этом случае для каждого вектора х £ R
существует единственное разложение его по векторам системы ely e2f ...
..., еп, ... —именно, разложение в ряд Фурье с коэффициентами
£п=(#, еп) (если еп нормированы).
Используя теорему 39, мы можем обобщить теорему об
изоморфизме конечномерных евклидовых пространств § 51 на неко-
I
336 РЯДЫ ФУРЬЕ [ГЛ. 13
торый класс бесконечномерных пространств. Введём следующее
определение:
Евклидово пространство R называется сепарабелъным, если
можно указать счётное подмножество Е с Я *), имеющее любую
точку x£R своей предельной точкой (§ 85, п. 2).
Примеры
1. Вещественная прямая, рассматриваемая как одномерное
евклидово пространство Ri, сепарабельна; в качестве счётного
множества Е можно выбрать множество всех рациональных чисел.
2. Конечномерное евклидово пространство Rn сепарабельно;
если в R выбран ортогональный и нормированный базис elf e2. ...
..., еп, то в качестве счётного множества Е можно выбрать
множество всех таких векторов, у которых все координаты
относительно базиса е19 е2, ..., еп—рациональные числа.
3. Пространство 12 (§ 86, п. 4) сепарабельно; в качестве
множества Е возьмём совокупность элементов вида (£ь £2» • ••> £п> О,
О, ...), у которых координаты 6lf ?2>. •••» %п — рациональные
числа, п пробегает все целые числа.
Теорема. Всякоз полное сепарабелъное евклидово
пространство R изоморфно пространству 12.
Доказательство. Покажем прежде всего, что в
пространстве R существует замкнутая ортогональная система векторов.
Для этого выпишем в одну последовательность /lf /2, ..., /п, ...
все точки счётного множества Е и подвергнем эту
последовательность процессу ортогонализации (§ 56). Пусть {eh} (& = 1, 2, .. .)—
полученная ортогональная система векторов; покажем, что она
замкнута. Пусть имеется вектор хфО> ортогональный к каждому
вектору ek (я=1, 2, ...). Так как вектор /п для любого п
принадлежит к линейной оболочке векторов elt е2, ..., еп, то элемент х
ортогонален и к каждому вектору /п (я=1, 2, ...). По теореме
Пифагора
l*-/nl2H*l2 + l/n|2>M2>o,
следовательно, из векторов {/«} нельзя составить
последовательности, сходящейся к вектору х, что противоречит предположению.
Итак, вектора хфО, ортогонального ко всем векторам е1У е2, ...
...,еп, ..., существовать не может; следовательно, система {еь}
замкнута, что и утверждалось.
Как всегда, можно считать, что система {ek} нормирована.
По теореме 39 каждый вектор #£# имеет разложение
со
*=2(*,ek)«fc,
fc=l
*) О счётных множествах см., например, И. П. Натансон,
Введение в теорию функций вещественного переменного. 1950, стр. 12.
§ 98] РЯДЫ ФУРЬЕ В НЕПОЛНОМ ПРОСТРАНСТВЕ 33
где коэффициенты (я, eh) образуют последовательность со
сходящимся рядом квадратов, входящую, следовательно, в
пространство Z2. Вектор х={(х, ег), (я, е2), ...} £ /2 мы_и поставим в
соответствие взятому вектору х £ R. Пусть теперь a5=(g1, g2f ...) —любой
вектор пространства 12. Рассмотрим в пространстве R ряд
оо
tkek. По лемме 5 и в силу полноты R он сходится к некото-
k=l
рому элементу х £ R. В силу единственности ряда Фурье
коэффициенты Фурье вектора х совпадают с числами £ш (т = 1, 2, ...).
Тем самым построенное соответствие между R и 12 является взаимно
однозначным. Очевидно, что это соответствие сохраняет линейные
операции. Проверим сохранение скалярного произведения. Если
со оо
fc-i fe*l
со
то в силу леммы 2(x, У)= 7j ^rtr a по самому определению ека-
k-i
оо
лярного произведения в /2 (•r'^)==Zj^^' Таким образом,
A-I
(ху 2/) = (гс, у), что и требуется; тем самым теорема полностью
доказана.
§ 98. Ряды Фурье в неполном пространстве
В неполном евклидовом пространстве R условия
замкнутости ортогональной системы {е} уже недостаточно для
доказательства теоремы о рядах Фурье, аналогичной
теореме 39*).
Введём следующее определение.
Система векторов {е} = {elt е2, . . ., еП9 ...}
нормированного (в частности, евклидова) пространства R называется
полной, если каждый элемент х£ R является пределом (по
норме) некоторой последовательности линейных
комбинаций векторов системы {е}.
*) Можно было бы пополнить пространство Я, как ониеано
в § 93. Но после пополнения замкнутая ортогональная система {«}
могла бы перестать быть замкнутой
S
22 г. Е. Шилов
338
РЯДЫ ФУРЬЕ
[ГЛ. 13
Теорема 40. В евклидовом пространстве R всякая
полная ортогональная система {е}-=-{еъ е%, ...} является
и замкнутой.
Допустим обратное. Пусть существует вектор х Ф 0,
ортогональный к каждому вектору ей (А = 1, 2, ...).
Пусть Д, /2, ... —последовательность линейных
комбинаций векторов {е}} сходящаяся к вектору х. Векторы /ь
/2, ... как линейные комбинации векторов {в} также
ортогональны к вектору х. Применяя теорему Пифагора,
находим: | /п — х |2 = | /п |2 + | # |2 > | # |2 > 0, что
противоречит сходимости векторов /п к вектору х.
Теорема 41. В полном евклидовом пространстве
всякая замкнутая ортогональная система {е} = {ei, е2, . . .}
является полной.
ЭтЬ непосредственно следует из основной теоремы
о ряде Фурье (§ 97).
Заметим, что в неполном евклидовом пространстве могут
существовать замкнутые, но неполные ортогональные системы.
Один пример такой замкнутой, но неполной ортогональной
системы предложен в задаче 4 к § 100.
Следующая основная теорема обнаруживает
существенное значение полноты данной ортогональной системы
векторов {е} в вопросе о разложении любого вектора х
в ряд Фурье по системе {е}. Отличие этой теоремы от
аналогичной теоремы 39 (§ 97) состоит в том, что
теорема 39 была основана на предположении о полноте
евклидова пространства R, в котором задана система \е}\
теорема, доказываемая ниже, не требует полноты
пространства Д, но зато предполагает, что полна система {е}.
Теорема 42. Для всякого вектора х евклидова
пространства R ряд Фурье (х, eijei + (х, е2)е2-\- . . . по
данной полной ортогональной системе {е} = {еъ е2, .. ., е&, . ..}
сходится по норме к вектору х.
Доказательство. Так как система {е} полна, то
для заданного s > 0 можно указать линейную
комбината
цию$=2^еь векторов этой системы, для которой
\s — x\ < г. Но так как наилучшее приближение по нор-
§ 99] ВОПРОСЫ СХОДИМОСТИ РЯДОВ ФУРЬЕ 339
ме даёт при данном п отрезок ряда Фурье sn = 2 (#> ek) ей
fe=i
(§ 94), то и подавно кг— 2 (#, e^)ek
fe=i
<s.
Устремляя s к нулю, мы получаем, что существует
некоторая последовательность частных сумм ряда Фурье,
сходящаяся к вектору х. Но при увеличении п норма
разности x — sn может только уменьшаться (§ 94), поэтому
последовательность всех частных сумм ряда Фурье также
сходится к вектору х. Это и завершает доказательство.
§ 99. Вопросы сходимости рядов Фурье.
Полнота системы тригонометрических функций
и многочленов Лежандра
Применение теоремы 42 к конкретным ортогональным
системам тригонометрических функций или многочленов
Лежандра требует предварительной проверки полноты
этих систем. Существует общий приём проверки полноты
данной системы функций, который является некоторым
углублением приёма проверки замкнутости системы
функций, описанного в § 95. Но ввиду сравнительной
сложности доказательств мы предпочитаем провести здесь более
элементарное рассмотрение, основанное на специальных
свойствах тригонометрической системы и многочленов
Лежандра.
1. Оценка тригонометрических
коэффициентов Фурье для некоторого класса
непрерывных функций. Мы будем сейчас
рассматривать функции /(/), непрерывные на отрезке — тс<го,
имеющие непрерывную производную /' (t) и
удовлетворяющие условию /( —тг) = /(тг) *), которое будет в
дальнейшем называться «условием периодичности».
*) Это условие обеспечивает непрерывность периодической
функции, полученной из функции / (t) путём применения
формулы
f(t + 2n) = f(t).
22*
340 рядьцфурье [гл. is
Произведя интегрирование по частям, вычислим
коэффициенты Фурье функции f(t) по формулам (4) § 94:
те те
шп= \ f (t) cos ntdt =f(t) —
J n I
—те —те
те
_1 V f'(t)smntdt, (11)
—1С
r.bn= \ f(t)smntdt=-f(t)^ | +
те
+ ^ [ /' (0 cos ntdt. (12)
-w
В силу условия / (— тс) == / (чи) внеинтегральные члены
обращаются в нуль. Обозначим через а'п и 6„
коэффициенты Фурье функции //(0бС2( — тс, тс). Формулы (И)
и (12) показывают, что
\п I 1&;1 I* I К1
1а»1=—> рп| = —.
Применяя элементарное неравенство 21 /?д | < р2 + q2,
справедливое для любых вещественных чисел р и qf мы
получаем интересующие нас неравенства
2|«nt<|b;|2+-^, 2|6n|<|a;|2+-i-. (13)
2. Используя полученные оценки (13), мы докажем
теперь следующее важное предложение:
Теорема 43. Для всякой функции /(06^2 (—-тс, тс),
имеющей непрерывную производную и удовлетворяющей
условию периодичности /(-— iu) = /(iu), её ряд Фурье
со
"Т" + 2 (anCosrc£ + &nsinn£), (14)
n=l
где
л те
1С If
ап = — \ f(t) cos ntdt, bn~ — \ /(0 sin ntdt
—тс —те
(л-0, 1, 2, ...) .
§ 99] ВОПРОСЫ СХОДИМОСТИ РЯДОВ ФУРЬБ 341
сходится к /(/) абсолютно и равномерно на отрезке
Доказательство. По неравенству Бесселя § 96 (7),
применённому к функции /' (t)£C2( — тг, т:), ряды У\ \Ьп\2
и 2la"l2 СХ°ДЯТСЯ- Кроме того, числовой ряд 2 т »
как известно, также сходится. Поэтому ряд (14) согласно
признаку Вейерштрасса сходится абсолютно и равномерно.
Его сумма s(t) как непрерывная функция, входит в
пространство С2( — тс, тс). В силу леммы 3 § 96 и доказанной
в § 95 замкнутости тригонометрической системы s(t) = f(t).
Итак, ряд (14) сходится абсолютно и равномерно и имеет
сумму f(t), что и требовалось.
3. Замечание. Доказанное утверждение останется
справедливым, если производная функция f(t) только
кусочно-непрерывна *).
Действительно, доказательство теоремы 43
основывалось на оценках (13) коэффициентов Фурье функции f(t).
Но оценки (13) остаются справедливыми и для функции f(t)
с кусочно-непрерывной производной; в этом нетрудно
убедиться, производя интегрирование по частям в каждом из
промежутков непрерывности /' (t) и суммируя результаты.
Задачи
1. Пусть функция f(t)£C(-~я, гс) имеет т непрерывных
производных, удовлетворяющих условию периодичности /fe*(—*)=
= /*)(«) (* = 0, 1, 2,.. . ., т). Как быстро стремятся к нулю её
коэффициенты Фурье?
00
0тв- ЙЬ^г- 2i-i<»-
71=0
*) Функция <р (*) называется кусочно-непрерывной на отрезке
а ^ * < &» если она непрерывна во всех точках этого отрезка, за
возможным исклю юнием конечного числа точек tu t2, . .. , tn,
причём в каждой из точек разрыва должны существовать пределы
значений f(t) справа и слева. Таким образом, задание кусочно-
непрерывной функции на отрезке a^.t^b равносильно заданию
конечного числа не связанных друг с другом непрерывных
функций на отрезках «<£<*!, tt <; t <; ц, . . ., tn ^ t < Ь.
342 ряды фурье |гл. 13
2. Функция / (t) определяется следующими условиями:
{1 при 11 | <е,
О при \г\^2г,
линейно соединяет крайние значения для е -< 11| ^ 2s.
Очевидно, что f(t)£C ( — тс, тс). Разложить её в ряд Фурье и
показать, что
сю
21 ап к4-
Указание. При ос < 1 пользоваться оценкой | sin о | < | а | ;
при а > 1 — оценкой | sin а | <; 1.
3. Разложив функцию/(0==*2(~ тсе^г <тс)в ряд Фурье и
подставив некоторые значения t, найти суммы рядов Эйлера
оо оо сх
si==S w S2=S (_1>П+1Ж' s'=2 (2я-1)» •
п=1 п=1 п=1
тс2 тс2 тс2
Отв. s^-g-, 52=="J2"» 5з=="8~*
4. Написать ряд Фурье для разрывной функции
—к— при 0 < t < тс,
9(°" ^ « + ' ' , п
- при —тс < t < 0.
Прямым вычислением показать, что частные суммы этого ряда
стремятся к ср(г) в среднем при я—>оо.
оо
sin nt
Отв. ?(0~2^
п=1
Указание. Учесть решение задачи 3.
5. Пусть /(£) кусочно-непрерывна при —-тс<;*.<7с и имеет
кусочно-неирерывную производную (такие функции называются
кусочно- гладкими).
Показать, что частные суммы её ряда Фурье в среднем
сходятся к этой функции.
Указание. Вычесть из /(t) линейную комбинацию
функций вида y(t—10) (см. задачу 4) g расчётом получить в результате
непрерывную функцию.
6. Если функция f(t) — кусочно-гладкая при — тс<£^тс,
то ряд Фурье сходится к f(t) в каждой точке, где / (t)
непрерывна; в точках разрыва ряд сходится к полусумме предельных
§ 99] ВОПРОСЫ СХОДИМОСТИ РЯДОВ ФУРЬЕ 343
значений /(£) справа и слева; во всяком замкнутом промежутке,
где нет точек разрыва /(f)» — сходится равномерно (теорема
Дирихле).
Указание. Проверить все утверждения для функции <р(t)
задачи 4 и затем использовать идею решения задачи 5.
7* Разложить функцию / (t), кусочно-гладкую при 0 ^ г < тс,
в ряд» вида
оо
/(*>=2 anc°snt>
сю
/(0=2 &п sin л*,
сходящиеся в среднем. Сформулировать условия равномерной
сходимости этих рядов.
Указание. Продолжить функцию / (t) на отрезок — тс ^ * < 0
как чётную (или как нечётную) функцию и использовать задачу
3 к § 94.
Отв. Условия равномерной сходимости (достаточные):
/(0) = /(гс) = 0, f(t) непрерывна, f (t) кусочно-непрерывна.
4. Мы переходим теперь к вопросу о полноте (§ 98)
системы тригонометрических функций 1, cos£, sin t, cos 2t,
sin2?, ... Рассмотрим вначале эту систему в
нормированном пространстве С( — тс, тс). Покажем, что
тригонометрические функции в этом пространстве не образуют
полной системы. Действительно, для любой линейной
комбинации f{t) тригонометрических функций (такие
линейные комбинации называются тригонометрическими
многочленами), очевидно, удовлетворяется условие
периодичности /( — iu) = /(ir); это же условие будет выполнено
и для любой функции x(t), являющейся пределом
тригонометрических многочленов по норме пространства
С( — тс, тс), поскольку сходимость по этой норме влечёт
сходимость в каждой точке отрезка — тс<г<тс;
следовательно, если функция x(t)£C( — тс, тс) не удовлетворяет
условию периодичности, она заведомо не может быть
пределом тригонометрических многочленов. Тем самым
система тригонометрических функций не полна в
пространстве С ( — тс, тс), что мы и утверждали.
Поэтому мм ограничимся подпространством С ( —тс, те)
пространства С( — тс, тг), состоящим из всех функций
344 ряды фурье [гл.1з
я (0 6 С (— те, ic), удовлетворяющих условию периодичности
я( —ic) = #(ic). Покажем, что система
тригонометрических функций l,^cos£, sin*, cos2£y sin2£, ... noma
в подпространстве С ( — ic, ic).
Пусть #(£)£С( — тс, тс). Для заданного s>0 разобъём
отрезок — те < t < it точками деления — тс —t0 < гг < ...
. • - <*п = 1с на такие мелкие части, чтобы для любого t
при *f<£<£i+i удовлетворялось неравенство
\x(t)-x(ti)\<±. (15)
Об ачим через х (t) непрерывную функцию, которая
* *(& = 0, 1, 2, .. ., п) принимает соответственно
(h) и линейна в оставшихся промежутках,
x(t) справедливы при *i<f<fi+t нера-
\х{г)-х(и)\<\х\гш)-х(гк)\ =
= \х(гм)-х(ь)\<\. (16)
Яз неравенств (15) и (16) как следствие получаем для
любого t:
\х{1)-х{1)\<\х{г)-х(1{)\ + \х{и)--~х(1)\< | е. (\Ъ
Функция х (t) также удовлетворяет условию
периодичности и, кроме того, имеет кусочно-непрерывную
производную. В силу п. 3 мы можем найти
тригонометрический многочлен T(t)t для которого при всех t
\x{t)-T(t)\<$. (18)
Из неравенств (17) и (18) следует в свою очередь,
что
\x(t)-T(t)\<\z(t)-x(t)\ + \Z{t)-T{t)\<*.
Таким образом, для любого е > 0 мы можем указать
тригонометрический многочлен T(t), отстоящий от
функции x(t) по норме пространства С( — ic, ic) менее чем
на е. Очевидно, что это даёт полноту тригонометрической
сцстемы в пространстве 5( —ic, ic).
§ 99] ВОПРОСЫ СХОДИМОСТИ РЯДОВ ФУРЬЕ 345
5. Покажем теперь, что система тригонометрических
функций 1, cos£, sin£, ... полна в евклидовом
пространстве С2( — те, те). Пусть y(t)—-любая функция
пространства С2( — те, тс) и М = тах|?/(г) |. Для заданного е > О
определим функцию x(t) следующими условиями, полагая
*i = — те
U = те —
32М2 '
32М2
1) я( —ic) = s(ic) = 0,
2) s(*i) = y(*i), x(t2) = y{t2),
3) на отрезках — те<^<^ и ^2<^ <^ #(0 линейна,
4) при £!<£<£2 %(t) совпадает с y(t).
Из условий 3) —4) легко получить, что
те
:(0-у(01|*= ][x(t)-y(t)fdt =
—ТС
*i те
= ^ [ж (0-У (<)]**+ ^ [x(t)~y(t)]2dt<
< max [x(t)-y(t)]t(t1 + v) +
+ max [x(t)-y(t)]*(-K-tt)<
<Ww+Ww4tT'
откуда
£
*(0-у(0И<т- (19>
Так как функция x(t) удовлетворяет условию
периодичности, то в силу п. 4 мы можем найти
тригонометрический многочлен Т (t), который для всех t (— те < t < те)
удовлетворяет неравенству
\x{t)-T{t)\<
у?*
346 РЯДЫ ФУРЬЕ [ГЛ. i 3
и, следовательно,
\\x{t)-T{t)r= \ [x(t)-T(t)ydt<-^.2*=^у
—т.
ИЛИ
\\x(t)-T(t)\\<±. (20)
Из неравенств (19) и (20) с помощью неравенства
треугольника получаем:
112/(0- Г(01|<||V(t)-x(t)\\ + \\x(t)-T(ОН <s.
Итак, для любого е > 0 мы можем указать
тригонометрический многочлен Т (£), отстоящий от функции y(t)
по норме пространства С^-— тс> тс) менее чем на е. Это
и доказывает полноту системы тригонометрических
функций 1, cos£, sint, ... в пространстве С2( — тс, тс).
Применяя теорему 42, получаем
Следствие. Для любой функции x(t)£C2( — тс, тс)
её тригонометрический ряд Фурье сходится в среднем
к функции x{t).
6. Из полноты тригонометрических функций в
пространстве С ( — тс, тс) (п. 4) легко вывести полноту системы
функций 1, t, t2, ... (степенной системы) в этом же
пространстве. Действительно, пусть x(t)£C ( — тс, тс) и для
заданного е > 0 найден тригонометрический многочлен Т (t),
для которого при всех t (— тс < t < тс)
\x(t)-T{t)\<\. (21)
Разлагая Т (t) в ряд Маклорена *), мы сможем указать
многочлен Р (t) — а0 + axt + ... + antn, для которого при
— тс < t < тс выполняется неравенство
\P(t)-T(t)\<±. (22)
Из неравенств (21) и (22), как и раньше, вытекает, что
\x(t)-P(t)\ <e;
*) Относительно рядов Маклорена см., например, Б. И.
Смирно в, Курс высшей математики, т. I.
§ 99] ВОПРОСЫ СХОДИМОСТИ РЯДОВ ФУРЬЕ 347
следовательно, для любого е > О мы можем указать
многочлен P(t), отстоящий от функции *x(t) по норме
пространства С( — тс, тс) меньше чем на е; тем самым
доказана полнота степенной системы в пространстве С( — тс, тс).
7. Покажем, что степенная система в отличие от
тригонометрической полна и в пространстве С (— тс, тс), а не
только в его подпространстве С (—тс, тс). Действительно,
если x(t) — любая непрерывная функция па отрезке
— тс < t < тс, то, вычтя из неё некоторую надлежащим
образом подобранную линейную функцию Рг (t), мы можем
получить в результате функцию x(t), уже
удовлетворяющую условию периодичности. Согласно п. 4 при
заданном е>0 существует многочлен P(t), для которого имеет
место неравенство
\x(t)-P(t)\<e.
Подставляя в это неравенство х (t) = #(£) —/^ (г) и
обозначая через R(t) сумму P(t) и P\{t), получаем:
|*(0-Д(01<в.
Но R{t)y очевидно, снова является многочленом от t.
Следовательно, степенная система полна в пространстве
С( — тс, тс), что и утверждалось.
8. Покажем, что степенная система 1, t, t2, . . . полна
в пространстве С(а> Ь) для любых а и Ъ.
Пусть у (t) — любая непрерывная функция на отрезке
а < t < b. Выберем линейную функцию t = as + Р так,
чтобы значениям t = a, b отвечали значения s — —тс, тт.
Тогда функция x(s)~y (as + [3) будет непрерывной
функцией на отрезке — тс<$<тс. Согласно п. 7 существует
многочлен P(s), для которого при всех s( — tc<s<tc)
\P(s) — x(s)\< s.
Подставляя вместо s в этом неравенстве равную величину
— (£ — р), получаем для а<г<&:
^(т<'-Р))-Н0
<г.
348
РЯДЫ ФУРЬЕ
[ГЛ. 13
Но функция Р(— (* — Р) ) , очевидно, является
многочленом от t. Следовательно, степенная система 1, t, t2, ...
полна в пространстве С (а, Ь)> что мы и утверждали.
Из полученного результата вытекает следующая
Теорема44. (Теорема Вейерштрасса.) Любая
непрерывная функция у (t) на отрезке а < t < b может
быть представлена как предел равномерно сходящейся
на этом отрезке последовательности многочленов.
Поскольку система многочленов Лежандра на отрезке
—1<£<1 имеет ту же линейную оболочку, что и
степенная система 1, ty /2, ..., мы доказали одновременно
и полноту системы многочленов Лежандра в
пространствах С( — 1, 1) и С2( —1, 1). Применяя теорему 42,
получаем далее: для любой функции x(t)£C2{ — 1, 1) её
ряд Фурье по многочленам Лежандра сходится в среднем
к функции x(t).
Задачи
л тт л 1-3-5 ...(2Л—1) п , 0
1. Положим а0=1, afe = — (ft = l, 2, . . .)•
Доказать для любого п формулу
Рп (cos б) = а0ап cos nb -f fli«n_ i cos (rc —• 2) 6 -f . . + ana0 cos nb, (23)
где Pn(t)~ многочлен Лежандра.
Указание. При п = 0 и и = 1 формула (23) проверяется
непосредственно. Для п > 1, используя рекуррентную формулу,
полученную в задаче 4 § 57, провести рассуждение по индукции.
2. Для 11\ < 1 доказать неравенство
Указание. Использовать результат задачи 1 и условие
/»„(!) = 1.
3. В предположении /(0£С2( —1, 1) и /'(0€^2( —1. 1) Дать
выражение коэффициентов Фурье по многочленам Лежандра
функции f(t) через аналогичные коэффициенты для её производной.
Отв. a^^-fa^-y^jK+l (*>1>-
4. Доказать, что для каждой функции f(t)EC2( — 1, 1),
имеющей непрерывную первую и кусочно-непрерывную вторую
производные, ряд Фурье функции f(t) по многочленам Лежандра
сходится к f(t) абсолютно и равномерно на отрезке —1<!*<;1.
Указание. Использовать метод п. 2—3; учесть решение
задач 2 и 3 и обобщённое неравенство Бесселя § 96 (7).
§ 1001 СУЩЕСТВОВАНИЕ ОРТОГОНАЛЬНОГО ДОПОЛНЕН Я 349
§ 100. Существование ортогонального дополнения
у замкнутого подпространства полного
евклидова пространства
Мы определили в § 49, п. 3 ортогональное дополнение
подпространства F евклидова пространства R как
совокупность всех векторов х £ R> ортогональных к каждому
вектору подпространства F\ Но нужно выяснить,
существуют ли вообще в пространстве R ненулевые векторы х,
удовлетворяющие требуемому условию.
Пусть дан вектор х; ортогональный к некоторому
подпространству А евклидова пространства R. Покажем, что
х ортогонален и к замыканию А подпространства А
(§ 85, п. 3). Действительно, если у £А, то существует
последовательность уп£А, сходящаяся к вектору у. По
предположению, (х, уп) = 0. Но тогда по лемме 1 § 96
(х, y) = lim(x, уп) = 0,
т. е. вектор у также ортогонален к вектору х. Поскольку
у »- любой вектор подпространства А> х ортогонален
ко всему А у что и утверждалось.
Поэтому, например, не существует вектора х Ф 0,
ортогонального к некоторому плотному (§ 85, п. 4) подпространству А £ R.
Действительно, если бы такой вектор х существовал, то по
доказанному он-был бы ортогонален и к замыканию А = Я, т. е. он
был бы ортогонален к любому вектору пространства R. В
частности, мы имели бы (х, х) = 0, что противоречит предположению
хфО.
Таким образом, в дальнейшем мы можем ограничиться
тем случаем, когда подпространство F замкнуто.
В частности, всегда замкнуто конечномерное
подпространство F (§ 89). И для этого случая мы уже знаем» что
ортогональные векторы к F всегда существуют (§ 55), если только, конечно,
РФ R.
Мы докажем здесь, что для всякого замкнутого
подпространства F полного евклидова пространства R
существуют ненулевые векторы, ортогональные к F.
Предварительно установим три леммы.
Лемма 1. (Неравенство />. Лева.) Пусть х, ynz —
три произвольных вектора в евклидовом пространстве R.
350
РЯДЫ ФУРЬЕ
[ГЛ. 13
Обозначим через а плоскость, определяемую векторами х
и у (или прямую, если х и у коллинеарны). Пусть h —
длина перпендикуляра, опущенного из конца вектора z
на плоскость а (§ 55). Имеет место неравенство
Ix-yKVlz-xf-W+yiz-yl2- h2.
Доказательство (черт. .12). Обозначим через и
перпендикуляр, опущенный из конца вектора z на
плоскость а, и через v — проекцию вектора z на плоскость а.
Черт. 12.
Вектор и ортогонален к любому вектору в плоскости а,
в частности к векторам v — х и v — у. Так как и + (v —- х) =
= (н + v)-— &—z — х и u-\-(v — y) = z — у, то по теореме
Пифагора
| v — х\2 — | z — х\2— \и |2 = | z — х\2 — /г2,
\v — y\* = \z — y\* — \u\*=--\z — y\* — h*.
По неравенству треугольника
\x — y\<\x — v\ + \v — y\<
^Vr\z-x\2-h2 + yr\z-y\2-h2,
что и требовалось.
Мы будем использовать более слабое неравенство
|а-у|<^|г-а|2-<*8 + 1^г-у|2-«*2> (24)
где d — некоторая величина, не превосходящая h.
§ 100] СУЩЕСТВОВАНИЕ ОРТОГОНАЛЬНОГО ДОПОЛНЕНИЯ 351
Лемма 2. Пусть F — подпространство евклидова
пространства R, z —вектор, не входящий в F. Обозначим
через d расстояние от вектора z до подпространства F,
т. е. точную нижнюю грань расстояний от z до
векторов подпространства F. Допустим, что вектор z можно
представить в виде
где \u\ = d> a v£F. Тогда вектор и ортогонален к
любому вектору подпространства F.
Доказательство. Если подпространство F
конечномерно, то согласно § 94 разложение z = и + v с
наименьшим возможным | и | осуществляется только в том
случае, когда вектор и ортогонален к F; таким образом,
для конечномерного подпространства лемма уже доказана.
В общем случае рассмотрим произвольный вектор x£F
и плоскость П, определяемую векторами х и у. Очевидно,
что плоскость П входит в подпространство F; поэтому
расстояние от вектора z до плоскости П не менее чем d.
Так как, с другой стороны, расстояние от z до v б П
точно равно d, то расстояние от z до плоскости П не
более чем d\ таким образом, расстояние от z до II в
точности равно d. Так как П — конечномерное пространство
(двумерное), то вектор и ортогонален к каждому вектору
этого пространства, в частности ортогонален к вектору х.
Учитывая, что х был произвольным вектором
подпространства F, приходим к справедливости утверждения леммы.
Лемма 3. Если F —замкнутое подпространство
полного евклидова пространства R и z —вектор, не входящий
в F, то существует разложение
z = u+ 'о, (25)
где вектор v£F, а вектор и ортогонален к каждому
вектору подпространства F. Векторы и, v при этом
определяются однозначно.
Доказательство. Обозначим через d точную
нижнюю грань расстояний от вектора z до векторов
подпространства F. Допустим, что d = 0; это означало бы, что мы
можем указать в F последовательность xlf х2, ..., хп, ...,
352
РЯДЫ ФУРЬЕ
[ГЛ. 13
для которой |z — хп\ —»0. Но в этом случае вектор z
должен был бы принадлежать подпространству v в силу его
замкнутости. Так как по усдовию это не имеет места,
то d > 0. Найдём в F последовательность векторов
X\i ^2» • • • > ^nt • •« так, чтобы иметь \z — xn\—>d.
Плоскость, проходящая через векторы хп и :rw (при
фиксированных т, п), входит в подпространство F\ поэтому
перпендикуляр итп, опущенный из конца z на эту плоскость,
имеет длину hmn^d. Применяя к векторам хт, хп и итп
неравенство Б. Леви (21), получаем:
| ^п — ^т | < К | ^ — ^п |2 — rf2 + "К | ^ — ^т |2 — ^2 -> 0
при п> т —> оо; таким образом, последовательность^, х2, ...
фундаментальна. Так как R полно, a F замкнуто, то эта
последовательность имеет предел v£F. Переходя к
пределу при п —> оо в соотношении | z — хп \ —> d, получаем
\z — v\ = d. Положим u=--z — v; так как \u\ = d, то по
лемме 2 вектор и ортогонален к каждому вектору
подпространства F.
Нам остаётся показать, что полученное нами
разложение (25) — единственно возможное. Допустим, что наряду
с разложением (25) имеется ещё одно
z = u' + v', (26)
где v'£F, а и' ортогонален к F. Вычитая (25) из (26),
получаем:
0 = (и' — ц) + (г/ — v).
Здесь г/ — v£F> а вектор и'— и ортогонален к F9
поскольку и' и и ортогональны к F. В силу леммы 1 § 49,
п. 3 и' — и = 0, V — v = 0, откуда и'=н, v' = v, что и
требуется.
Лемма 3 обнаруживает уже существование
ортогональных векторов для всякого замкнутого подпространства F
полного евклидова пространства Л. Совокупность всех
таких векторов образует, как мы уже знаем,
ортогональное дополнение G подпространства F. Это
ортогональное дополнение G — подпространство, причём замкнутое
(§ 85, п. 2).
§ 100] СУЩЕСТВОВАНИЕ ОРТОГОНАЛЬНОГО ДОПОЛНЕНИЯ 353
Все наши рассуждения можно резюмировать следующей
'теоремой:
Теорема 45. Для всякого замкнутого
подпространства F полного евклидова пространства R существует
замкнутое ортогональное дополнение G. Каждый вектор
z£R может быть представлен в виде z = u~\-v9 где u£G,
v£F. Слагаемые и и v определены вектором z и
подпространством F однозначно.
Задачи
1. Показать, что подпространство F с Са( —1, 1), образованное
из всех функций х (t), удовлетворяющих условию
1
x(t)dt = 0,
0
замкнуто.
Указание. Линейный функционал
1
f(x)= \ x(t)dt
о
ограничен и, как следствие этого, непрерывен (§ 90).
2. Показать, что ортогональное дополнение подпространства F
задачи 1 состоит из единственного элемента х (t) = 0. В чём
причина кажущегося противоречия с теоремой об ортогональном
дополнении?
3. Пусть Fi есть совокупность всех многочленов Р (t) с
рациональными коэффициентами, для которых
1
Р (1) dl = О.
о
Показать, что единственная функция пространства Са(—1, 1),
ортогональная ко всем функциям совокупности Fl9 есть
тождественный нуль. __
Указание. Применяя теорему 44, показать, что FX~F
(задача 1), и затем использовать начало § 100.
4. Функции системы Fx (задача 3) можно записать в виде
последовательности
Л(0> P*(t), .... Pn(*h •■■
Показать, что эта последовательность, будучи замкнутой в
пространстве Са(—1, 1), неполна в этом пространстве,
У к а з а и и е. Показать, что линейные комбинации функций
не могут стать как угодно близкими, например, к функции х (t) == 1.
23 г. Е. Шилов
354
РЯДЫ ФУРЬЕ
[ГЛ. 13
§ 101. Общий вид ограниченного линейного
функционала в полном евклидовом пространстве
Пусть f(x) — ограниченный линейный функционал
в полном евклидовом пространстве /?, отличный от
тождественного нуля. Рассмотрим подпространство R' CZ R,
определяемое уравнением f(x) = 0. Используя непрерывность
функционала f(x) (§ 90), легко проверить, что R' замкнуто.
Пусть R" •— ортогональное дополнение подпространства R'.
Покажем, что R" одномерно. Пусть zlf z2G#"; тогда
у = / (zx) z2 — / (z2) zx также входит в R'; но, с другой
стороны,
/Ы = /(21)/Ы-/Ы/Ы = о,
откуда следует, что y£R'. Но из y£R' и y£R"
вытекает, что (у,у) = 0 и что, следовательно, 2/ = 0. Так как
/ (zi) Ф 0, f(z2) ф 0, то векторы zx и z2 линейно зависимы.
Следовательно, R" не может иметь более одного измерения.
Пусть теперь е £ R!' — нормированный вектор. Всякий
вектор z£R" представляется в виде z = Xe; с другой
стороны, как мы показали в § 100, всякий вектор x£R
разлагается в сумму x = z + у (z £/?", y£R'). Так как z = \e,
то х~\е + у = (х, е)е-{-у.
Отсюда вытекает, что
/ (х) = (х, е) f(e) + f (у) = {х, е) / (е) = (z9 f (е) е) = (х, ж0),
где х0 = f(e)e — фиксированный вектор пространства Л".
Итак, любой ограниченный линейный функционал в полном
евклидовом пространстве R представляет собой скалярное
произведение вектора х на фиксированный вектор х0.
Вектор х0 при этом определяется однозначно, ибо из
тождества (х, х0) = (х, Хх)-вытекало бы, что (х, х0 — хг) = 0 для
любогох £ R; но тогда и (х0 — xlfx0 — хг) = 0, откуда я0 = хх.
Норма вектора х0 равна норме | /1 линейного
функционала f(x); действительно, с одной стороны, для |#|<1
| {ху х0) | < | х01 в силу неравенства Коши-Буняковского;
с другой стороны, полагая х = Тл-г, мы получаем (х, х0)=
= |жо|» откуда
1/1= SUP !/(*)!= sup | (ж, *0)| = |*о|.
! * I ^. 1 1*1^1
§ 102] ОБЩИЙ ВИД БИЛИНЕЙНОГО ФУНКЦИОНАЛА 355
Мы показали, в частности, что в полном евклидовом
пространстве всякий ограниченный линейный функционал
f(x) на единичной сфере достигает точной верхней грани
своих значений. В произвольном нормированном
пространстве этот факт, вообще говоря, не имеет места.
§ 102. Общий вид ограниченного билинейного
функционала в полном евклидовом пространстве
Если А — ограниченный линейный оператор в
пространстве /?, то выражение (Ах9 у) является в R ограниченным
билинейным функционалом. Покажем, что всякий
ограниченный билинейный функционал А (ж, у) в полном
евклидовом пространстве R получается аналогичным образом
с помощью некоторого ограниченного линейного
оператора А.
Фиксируем в билинейном функционале А (ж, у) первый
аргумент х; билинейный функционал становится при этом
линейным функционалом от второго аргумента у. Согласно
§ 101 в пространстве R существует элемент х'
(зависящий от х) такой, что
А (ху у)=ь{х'9 у)
для всех y£R. Элемент х' однозначно определён
элементом #^ покажем, что соответствие х—>х' определяет
некоторый линейный ограниченный оператор А.
Действительно, пусть элементам хх и х2 отвечают соответственно
х[ — Ахг и х'г — Ая2; это означает, что для любого у
А(х19 у)^(х[, у),
А(я2> 2/) = (я2, у)-
Но тогда и
А (<*!&! + а2я2, у) = ахА (х1у у) + а2А (х2, у) =
= ai(x'l, 2/) + oc2(x;, у)^(^1х[ + а2х2> у),
откуда
А (а&х + а2х2) = dxx'x + а2£2 = ахА (ж,) + а2А (ж2);
таким образом, оператор А линейный. Чтобы доказать
его ограниченность, обозначим через М точную верхнюю
23*
356 РЯДЫ ФУРЬЕ [ГЛ. 13
грань величины | А {х, у) | при | # | < 1, | г/1 < 1; тогда,
если | гс | < 1, | у | < 1,
\(х',у)\ = \А(х,у)\<М.
Ах
Полагая у = , , получаем:
\Ах\<М.
Таким образом, точная верхняя грань чисел |А#| при
|#|<1 также не превосходите/. Следовательно,
оператор А ограничен. Итак, существует ограниченный
линейный оператор А такой, что равенство
А (ж, у) = (Ах, у)
имеет место для всех х и у пространства R.
Наше утверждение об общем виде ограниченного
билинейного функционала тем самым доказано.
ГЛАВА 14
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
§ 103. Вполне непрерывные линейные операторы
Мы видели в § 65, что в конечномерном евклидовом
пространстве симметричный линейный оператор всегда
обладает собственными векторами. В бесконечномерном
евклидовом пространстве, вообще говоря, такой факт уже
не имеет места; на примере оператора умножения на
независимое переменное в пространстве С2(а, Ъ) (§ 26,
пример 7; § 63, пример 5; § 66, пример 1) мы убедились,
что существуют симметричные линейные операторы, вовсе
не имеющие собственных векторов. Тем не менее имеется
большой и важный для математической физики класс
симметричных линейных операторов, обладающих
собственными векторами, и притом в достаточно большом
количестве. Описанию этих операторов и посвящена
настоящая глава.
Определение. Линейный оператор А, действующий
в евклидовом пространстве R, называется вполне
непрерывным, если он переводит единичную сферу
пространства R в компактное множество (§ 87).
Примеры
1. В конечномерном пространстве любой линейный
оператор является вполне непрерывным, так как любой
линейный оператор переводит единичную сферу в
ограниченное (§ 92) множество, а в конечномерном пространстве
всякое ограниченное множество является компактным.
В бесконечномерном евклидовом пространстве уже
единичный оператор Е не является вполне непрерывным, так
как он переводит единичную сферу в себя, следовательно,
не в компактное множество (§ 87, п. 1).
358 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 14
2. В евклидовом пространстве С2(а, Ь) важным
примером вполне непрерывного оператора является
интегральный оператор Фредгольма
ъ
Аж(0 = у(0=:\ к(*> s)x(s) ds
а
(§ 26, пример 8). Проверим, что этот оператор вполне
непрерывен. Пусть V и V — две произвольные точки на
отрезке а < t < Ь. По неравенству Буняковского (§ 49,
п. 2 (13))
ь
\У(*')~У{П\г<\\ \K(t',s)-K(t",s)\\x(s)\dsY<
а *
Ь Ь
<\\K{f,s)-K{t",s)\*ds. ^ \x(s)\*ds.
а а
Предполагая ядро K(t,s) непрерывным*), мы для
заданного е > 0 можем найти 8 > 0 так, чтобы из неравенства
11' — V | < 8 вытекало | К (f, s) — K{t\ s) | < г для всех s.
Тогда для х ($) из единичной сферы пространства С2 (а, Ь)
мы получаем:
\у(П-у(П\2<*2(Ь-а).
Тем самым семейство [функций y(t) оказывается
равностепенно-непрерывным (§ 87, п. 4).
Но, очевидно, оно является и ограниченным, ибо по
тому же неравенству Буняковского
ь ь
|г/(0|2< ^\K(t,s)\*ds- ^\x(s)\*ds<m*(b-a),
а а
где т означает максимум модуля функции К (t, s) в
квадрате а < t, s < Ь. В силу замечания к теореме Арчела
(§ 87, п. 4) семейство функций {y(t)} компактно в С2(а, Ь).
Таким образом, оператор Фредгольма вполне непрерывен,
что и требовалось.
Отметим следующее свойство вполне непрерывных
операторов. Пусть Р — подпространство пространства R,
*) Результат верен и в более слабых предположениях.
§ 104]
СОБСТВЕННЫЕ ВЕКТОРЫ
359
инвариантное относительно данного вполне непрерывного
оператора А, действующего во всём пространстве Л. Если
Р — замкнутое подпространство, то можно утверждать, что
оператор А, рассматриваемый только на Р, является
вполне непрерывным и в пространстве Р. Действительно,
если хп (п = 1, 2, ...) — любая последовательность
векторов единичной сферы подпространства Р, то из
последовательности векторов Ахп можно выбрать
последовательность, сходящуюся в В (в силу того, что оператор А
вполне непрерывен в В), например к некоторому вектору х0.
Векторы фАхп принадлежат подпространству Р (так как Р
инвариантно относительно А), и поскольку Р замкнуто,
вектор х0 также принадлежит Р. Следовательно, из всякой
последовательности векторов Ахп (| хп\ < 1, хп£ Р) можно
выбрать сходящуюся в Р подпоследовательность] это и
доказывает наше утверждение о полной непрерывности
оператора А в подпространстве Р.
§ 104. Собственные векторы вполне
непрерывного симметричного оператора
Лемма 1. Симметричный вполне непрерывный
оператор обладает максимальным вектором (§ 52).
Доказательство. Так как множество всех векторов
у = Ах для | х | < 1 по условию компактно в пространстве В,
то оно ограничено (§ 87, лемма 1): sup | у | = М < со. Число М
равно норме \\А\\ оператора А (§52). Таким образом,
вполне непрерывный оператор А ограничен и как
следствие непрерывен (§ 92). Выберем последовательность
у и = Ахп, где | хп | = 1 (п = 1, 2, .. .) так, чтобы иметь
Ит\уп\ = М. Из последовательности уп можно извлечь
П-+СО
по условию сходящуюся подпоследовательность; зачеркнув
лишние векторы и исправив нумерацию, можно считать,
что сама последовательность уп сходится при п —>со;
пусть y = lim уп- В силу непрерывности нормы (§ 88, п. 1)
п-»оо
\у\ = Ит|уп| = М. Проверим, что вектор z~—y являет-
ся искомым максимальным вектором.
360 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 14
Прежде всего в силу непрерывности оператора А мы
имеем:
Az= lim A (%f) = lim A (^p) .
Векторы -~ принадлежат к единичной сфере, и поэтому
векторы А ( -^р ) по длине не превосходят М.
Используя неравенство Коши-Буняковского и симметрию
оператора А, мы можем составить неравенство
Кт?)|>(Чт80 •*■)-"
М >
\~м~' п) "Ж' п' "~>^»
из которого вытекает, что
I Az I = lim
М
-МУ
т. е. z есть максимальный вектор, что и требовалось.
Применяя лемму 4 § 65, получаем далее:
Лемма 2. Симметричный вполне непрерывный
оператор А обладает собственным вектором с собственным
значением ± Af = ± || Л||.
Используя процесс, приведённый в теореме 33 (§ 64),
можно построить другие собственные векторы. Мы
предпошлём этому построению следующую лемму:
Лемма 3. У вполне непрерывного оператора А
всякая ортогональная нормированная система собственных
векторов с собственными значениями, превосходящими по
модулю положительное число В, конечна.
Доказательство. Допустим, что нашлась
бесконечная система F таких собственных векторов. Каждый
из них оператором А переводится в себя самого с числовым
множителем, большим числа 8.
Пусть et и ej — какие-нибудь два из этих собственных
векторов: |е^ = |еу| = 1, (еь е,-) = 0, Ав| = Х|е|, Ае/ = Х;-е;-.
Мы имеем:
| Ае{ - Аеу |2 = | Х^ - XА-12 = X? + Ц > 2§2.
§104] СОБСТВЕННЫЕ ВЕКТОРЫ 361
Это означает, что расстояния между векторами,
полученными после воздействия оператора А на векторы
системы F, заведомо будут превосходить 8|/*2. Но из
совокупности таких векторов нельзя выбрать никакой сходящейся
последовательности, что противоречит полной
непрерывности оператора А.
В частности, существует только конечное число взаимно
ортогональных векторов с данным собственным значением
\ Ф 0; иными словами, каждое собственное
подпространство, отвечающее ненулевому собственному значению вполне
непрерывного симметричного оператора А, конечномерно.
Эта лемма позволяет сделать определённые выводы
относительно совокупности всех собственных векторов и
собственных значений оператора А. Рассмотрим на
вещественной оси множество всех собственных значений
оператора А. В силу леммы 3 существует лишь конечное
число собственных значений, превосходящих по
абсолютной величине данное положительное число 8; поэтому
открывается возможность занумеровать натуральными
числами все собственные значения в порядке убывания
абсолютной величины. Условимся, что при этом мы будем
каждое собственное значение снабжать столькими
последовательными номерами, какова размерность
соответствующего собственного подпространства. В таком случае
последовательности всех ненулевых собственных значений
оператора А
^1, ^2> ^3> • • • у 'чп> • • •
мы можем сопоставить последовательность собственных
векторов
^1> ^2) ^3> • * • > ^п> • • • »
причём Аеп — \пеп (/г — 1, 2, ...). Можно считать, что
векторы еъ е2, • • • взаимно ортогональны и нормированы.
В самом деле, если \п #ХШ, то ортогональность еп и ет
выполняется по лемме 1 § 65; если же Xn = Xm, то в
пределах конечномерного собственного подпространства,
отвечающего собственному значению Xn = Xm, мы всегда можем
провести ортогонализацйю. Нормировка всех полученных
векторов завершает построение.
362 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 14
Покажем теперь, что каждый вектор z, ортогональный
ко всем построенным векторам еь е2, • • •» еп, • • •,
переводится оператором А в нуль.
Рассмотрим совокупность Р всех векторов zt
ортогональных ко всем векторам е1} е2, .... еп, ... Эта
совокупность Р является замкнутым подпространством как
ортогональное дополнение линейной оболочки L(elt е2, ...).
Поскольку линейная оболочка Ь(еъ е2, ...), очевидно,
инвариантна относительно оператора А, её ортогональное
дополнение Р по лемме 2 § 65 также инвариантно
относительно оператора А. Обозначим через М (Р) верхнюю
границу значений | Ах | на единичной сфере
подпространства Р. В силу леммы 2 в подпространстве Р имеется
собственный вектор е0 с собственным значением \0~М(Р).
Но по самому построению подпространства Р оно не может
содержать ни одного собственного вектора с ненулевым
собственным значением. Отсюда Х0 = М (Р) = 0; но это
означает, что Az = 0 для любого вектора z£P, что мы
и утверждали.
Полученные результаты мы сформулируем в виде
следующей теоремы:
Теорема 46. У каждого вполне непрерывного
симметричного оператора А ф 0 в евклидовом пространстве R
существует ортогональная система собственных векторов
elf е2, ..., еПу ... (конечная или бескднечная) с ненулевыми
собственными значениями, обладающая тем свойством,
что каждый вектор z, ортогональный ко всем векторам
elt е2 . .., еп, ..., оператором А переводится в нуль.
Если пространство R полно, то теорема 46 может быть
ещё усилена:
Теорема 47. В полном евклидовом пространстве R,
в котором задан симметричный вполне непрерывный
оператор А, каждый вектор х может быть представлен
в виде суммы
х = х1 + х2, (1)
где А#2 = 0, а хг можно разложить в ряд Фурье по
ортогональной системе собственных векторов elf е2у ..., еп1 ...
с ненулевыми собственными значениями, построенной
в теореме 46.
§ 105] ИНТЕГРАЛЬНЫЙ ОПЕРАТОР 363
|
Доказательство. Пусть Л'— подпространство, со- !
ставленное из всех конечных сумм Cie1 + c2e2 + . . . +спеп
и из их пределов по норме; так как оно замкнуто, то
в силу § 100 существует ортогональное дополнительное
подпространство R", и всякий вектор x£R может быть
разложен в сумму
X =■• Х\ -р Х2,
где x1£R', x2$R". По теореме 46 А:г2 = 0. В
подпространстве R\ ортогональная система el7 е2, . . ., enf ... полна
по самому построению подпространства R'. Поэтому в силу
теоремы 42 вектор хг разлагается в ряд Фурье по системе
еъ е2, • • • у епу • • •» что и требовалось.
Вектор у, который может быть представлен в виде
у = Ах, мы будем называть по установившейся традиции
истокообразно представимым. Заметим, что в полном
евклидовом пространстве всякий истокообразно предста-
вимый вектор у разлагается в ряд Фурье по собственным
векторам оператора А с ненулевыми собственными
значениями. Действительно, для любого z£R" мы имеем
(у, z) = (Ax> z) = (x, Az) = (#, 0) = 0, откуда вытекает, что
y(zR'; дальше остаётся применить результат теоремы 47.
§ 105. Приложения к теории интегрального
оператора Фредгольма
Интегральный оператор Фредгольма
ь
y(t)=^K(t,s)x{8)ds,
а
как мы видели в § 103, является вполне непрерывным
оператором в пространстве С2(а, Ь). Условием симметрии
его, как было показано в § 65, является выполнение'
равенства
K(t,s)=-K(s, t).
Тем не менее не все результаты § 104 можно
применить для симметричного оператора Фредгольма, поскольку
пространство С%(а,Ъ), в котором он действует, неполно.
364 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 14
Теорема 46, во всяком случае, не зависит от полноты
пространства; поэтому мы можем считать доказанным, что
оператор Фредгольма А обладает ортогональной
системой ех (t), e2(t), . . ., еп (t),. .. нормированных
собственных функций с отличными от нуля собственными
значениями, причём всякая функция z(t)£C2(a, b), ортогональная
ко всем этим функциям, переводится оператором А
в нуль.
С другой стороны, использование конкретной природы
оператора А позволяет усилить некоторые результаты § 104.
Прежде всего равенство, определяющее собственные
функции оператора Фредгольма,
ь
\K(t,s)en(s)ds^\nen(t) . (2)
а
показывает, что величина hnen(t) является
коэффициентом Фурье функции K(t,s) (при постоянном значении t);
отсюда, применяя неравенство Бесселя (§ 96), находим:
b N
5*а(*,*)&>2й^(0 (3)
а п=0
при каждом значении N. Интегрируя это неравенство по t,
получаем
Ь Ь N
jj ^ K*(t, s)dsdt>% l2n
а а п=0
при любом натуральном N, откуда вытекает сходимость
ряда из квадратов собственных значений симметричного
оператора Фредгольма (в общем случае симметричного
и вполне непрерывного оператора этот факт уже не имеет
места).
Функцию g(t) вида
ъ
g(t)=^K(t,8)f(s)ds
§1051 ИНТЕГРАЛЬНЫЙ ОПЕРАТОР 365
с произвольной непрерывной функцией / (s) в соответствии
с определением § 104 мы будем называть «истокообразно
представимой через ядро К (t> s)»*).
Имеет место следующая важная теорема (Гильберт).
Теорема 48. Каждая функция g(t)7 истокообразно
представимая через симметричное udpoK(t,s),
разлагается в равномерно и абсолютно сходящийся ряд Фурье
по собственным функциям оператора Фредголъма с ядром
K(t,s):
оо
g = ^lk{f,ek)eh. (4)
ft-1
Доказательство. Мы имеем:
(g, ek) = (A/, ek) = (/, Aek) = (/, \kek) = lk (/, ek),
поэтому для любых целых п и т
п-\-т n-fm
[2l(g,^)-^(0l]8=[S \(f,ek)-hek(t)\ j2<
k = П k = П
n-fm nfm
<S(/'e*)B-2x**(0 (5)
fe = n 7i = n
*) Функция g(t) может быть физически истолкована
следующим образом. Пусть, например, изучается распределение
температуры в стержне, расположенном вдоль отрезка я<: t^b. Пусть
известно, что распределение температуры в этом стержне,
вызванное наличием источника тепла мощности 1 в фиксированной
точке s, изображается функцией К (t, s). Тогда интеграл
ъ
g(t)=^K(t,s)f(s)ds
а
представляет собой распределение температуры в стержне, в
каждой точке которого имеется некоторый источник тепла, мощность
которого задаётся функцией / (s). Следовательно, g (t)
представлена с помощью источников. Отсюда термин «истокообразно
представлена».
/
366* ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 14
(последнее в силу неравенства Коши для конечной суммы;
см. § 49, (9)). Так как в правой части равенства (5)
сумма Х£бп(0+ ... во всяком случае, ограничена (в силу
неравенства (3)), а сумма (/, еп)2 + ... делается сколь угодно
малой при достаточно большом п (в силу неравенства
Бесселя, § 96, лемма 4), то сумма и в левой части
равенства (5) обладает этим последним свойством;
следовательно, рассматриваемый ряд Фурье сходится
абсолютно и равномерно. Остаётся доказать, что его сумма s (t)
совпадает с. функцией g(0*). Для этого рассмотрим
разность g — s. Проверим, что она ортогональна к
каждому вектору еъ\ действительно, (g — st еь) = (#, efe) —
п
- (s, ek) = 0, тай как (s, ek) = lim ( У (g, ет) ет, екЛ =
тп=1
= (g, efe). Поэтому в силу теоремы 46 A(g —s) = 0.
Вычислим теперь скалярное произведение (g — $ni g — s), где
п
sn— 2 (#> ет)ет. Вычисляя, находим:
m=l
п
(g-sn,g-s)=(^Af— 2 (8, еш)ет, g-s) =
= ^f-i(g,em)^,g-s) =
ТП=1 J
n
m= 1
Но в таком случае и (g — s, g — s) = lim (g — sn, g — sn) = 0,
n-»-oo
откуда g~s, и равенство (4) тем самым доказано.
*) Мы не можем здесь воспользоваться леммой 3 § 96, так
как система ег, е2, ..., вообще говоря, не замкнута во всём
пространстве R. Если же мы ограничимся подпространством #',
порождённым векторами elt e2, ..., то заранее не известно,
входит ли в него вектор g.
§ 106] РЕШЕНИЕ НЕОДНОРОДНОГО ИНТЕГР. УРАВНЕНИЯ 367
§ 106. Решение неоднородного интегрального
уравнения
Естественный базис, в котором удобно решать задачи,
связанные с оператором Фредгольма, представляет собой
система его собственных функций. Типичной такой
задачей является решение неоднородного интегрального
уравнения
ъ
9(t) = f(t)+^K(t,8)<f(s)ds,
а
где f(t) и К (/, s) = K (sy t) даны, а ср (t) — искомая
функция.
В абстрактном пространстве аналогичное уравнение
имеет вид
? = / + А?, (6)
где А — симметричный вполне непрерывный оператор.
Проектируя левую и правую части равенства (6) на
ось, определяемую собственным вектором е^ (так, что Ае& —
= \kek), мы получаем:
(?» «*) = (/> *fe) + (A<p, з0 = (/. ен) + (ь Аб>*) =
= (/, efe) + (<p, Xfeefe) = {/, ek) + \h(<f, eh), (7)
откуда при lk Ф 1 находим:
(*'*) = Т=Х^ (8)
Тем самым однозначно определяются коэффициенты Фурье
вектора ср. В случае Xfe=l и (/, eft) Ф 0 получается
противоречивое равенство и, следовательно, искомого
вектора ср заведомо не существует. Если же при Xfe = 1
(/> вл) = 0, то равенство (7) не накладывает никаких
условий на величину (ср, ен)9 которая может быть, таким
образом, произвольной. Мы пришли к следующему
результату:
Если среди собственных значений оператора А нет
значения 1, то все коэффициенты Фурье искомого регие-
368 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 14
ния по системе еь е2, ... определяются однозначно по
формуле (8). Если среди собственных значений оператора
А есть 1 и f не ортогонален к подпространству
соответствующих собственных векторов, то решение ср не
существует вовсе; если же / ортогонален к указанному
подпространству, то соответствующие коэффициенты
Фурье искомого решения ср могут быть выбраны
произвольно.
Если решение ср существует, то вектор ср —/ = Аср
«истокообразно представим» и по теореме 47 разлагается
в ряд Фурье
со
?-/=2^, (9)
если пространство R полно; а для интегрального
оператора Фредгольма, действующего в неполном пространстве
С2{а, Ь)у мы показали в § 105, что это разложение будет
тем не менее также сходящимся, причём не только по
норме, но абсолютно и равномерно.
Вычисляя коэффициенты Фурье ck в равенстве (9), мы
получаем для Х& Ф 1:
(f e )
Ck = (<р - /, eh) = (ср, eh) - (/, ek) - -^~- - (/, ek) =
К
откуда
X
<р = /+2 (Д^)-*^. (Ю)
■\ fe=l k
Но ряд, построенный независимо от предыдущих
рассмотрений
S (/»в*) т^т~6k
в полном пространстве **?, сходится по норме, ибо
квадраты коэффициентов, очевидно, образуют сходящийся ряд
§ 106] РЕШЕНИЕ НЕОДНОРОДНОГО ИНТЕГР. УРАВНЕНИЯ 369
(§ 96). Для интегрального оператора Фредгольма в
пространстве С2(а, Ь) этот ряд сходится также абсолютно и
равномерно, ибо, обозначая через К наибольшую из ве-
личин п—с—г*), мы аналогично выкладке в § 105 имеем:
I a""Aft I
n+rn . n-fm
[ 2 |(/. e")id^-^(0| |2<^2[ 2 \(f,ek)lkek(t)\Y<
ft=n ft=n
n-fm п+т
<Z*2(/,eft)s. %Kel(t).
Таким образом, вектор ср, определяемый формулой (10),
существует. Проверим, что он действительно является
решением уравнения (6). В самом деле,
со
A9 = Af+^(f,ek)J^hek =
ft=l
СО
= 3Xfe (/»«*)е*+3 (/'**) т~тгх*в*=
сю
= 2 (1+1^г)м/.*)*=
fe=i
= S r=kr(/'6*)e*=?""/•
■Aft
Наконец, если среди собственных значений оператора
есть число Хь = 1 и соответствующие коэффициенты (/, еь)
равны нулю (что, как мы видели, является необходимым
условием разрешимости уравнения (6)), то ряд (10) также
определяет решение; при этом вместо конечного числа
1
*) Величины -г-А—г—| в совокупности ограничены, так как
I1 •* I
\k -+ 0 (§ 104, лемма 3).
24 г. Е. Шилов
370 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 14
коэффициентов (/, еъ) j—5Г~' не имею1Чих смысла при
Xfe = l, можно взять произвольные числа. Доказательство
получается с помощью выкладки, аналогичной
приведённой выше.
§ 107. О неограниченных операторах, обладающих
обратным симметричным и вполне непрерывным
оператором
Пусть L — неограниченный линейный оператор в
евклидовом пространстве Я с некоторой линейной областью
определения /?' С Л- Ограниченный оператор А,
определённый во всём пространстве Я> называется обратным
для оператора L, если для любого х£Я элемент Ах£Я'
и LA х ^ хи если для любого у 6 Я' AL у = у.
Пример
В качестве оператора L рассмотрим в пространстве С2 (а, Ь)
оператор дифференцирования
hx(t) = x' (t),
определённый на функциях x(t)£C2(a, b), равных нулю при х — а
и имеющих непрерывную производную. Под оператором А будем
понимать интеграл с переменным верхним пределом
t
Ах (t) = \ х (s) ds.
а
Оператор А, как легко показать, ограничен в С2 (я, Ь) (ср.
доказательство ограниченности оператора Фредгольма в § 103).
Очевидно, что hAx (t) = x(t) для любого x(t)^C2(ot Ь) и Ahx(t) = x (t)
для любого х (t) из области определения оператора L.
Следовательно, А —обратный оператор для L.
Предположим, что данный неограниченный оператор L
обладает обратным оператором А. Можно утверждать
в этом случае, что все собственные значения оператора А
отличны от нуля: в самом деле, если бы для
некоторого х было А# = 0, то и # = LA:r был бы нулевым
вектором. Далее, всякий собственный вектор оператора А
с собственным значением X является одновременно
собственным вектором оператора L с собственным значе-
§ 107] О НЕОГРАНИЧЕННЫХ ОПЕРАТОРАХ 371
1
нием у . Действительно, если Ах = \х, то х = LA x —
= LXx = Х1л\ откуда hx = у #.
Предположим теперь, что оператор А, обратный к
оператору L», вполне непрерывен и симметричен.
Применяя полученный результат и теорему 46, мы
получаем, что существует замкнутая ортогональная
система собственных векторов оператора А с ненулевыми
собственными значениями. Отсюда вытекает, что и у
оператора L существует замкнутая ортогональная система
собственных векторов, с собственными значениями,
отличными от нуля.
В качестве примера оператора L возьмём
дифференциальный оператор Штурма-Лиувилля (§ 66). В теории
дифференциальных уравнений существует теорема, которую
мы здесь приведём без доказательства: если уравнение
Штурма-Лиувилля L [х] = 0 на отрезке а < t < Ъ не имеет
решения, удовлетворяющего граничным условиям *) и
отличного от нуля (такое уравнение и соответствующий
оператор Штурма-Лиувилля мы будем называть неособенными),
то существует симметричная непрерывная функция двух
переменных K(t, $) (функция Грина), обладающая
следующим свойством: если <f{t)£C2(a, 6), то функция x(t),
определяемая равенством
ь
x(t)=<\K(t,s)9(s)ds, (И)
а
удовлетворяет граничным условиям и дифференциальному
уравнению
l [*] = ?(*); (12)
и обратно, всякая функция x(t), удовлетворяющая
граничным условиям и уравнению (12), представляется по
формуле (И)**).
*) Обеспечивающим симметричность оператора
Штурма-Лиувилля. См. § 66.
**) Доказательство имеется, например; в книге И, Г.
Петровского «Лекции об уравнениях с частными производными». М. — Л.,
1950, § 24..
24*
372 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. U
Иными словами, неособенный оператор
Штурма-Лиувилля L [х] обладает ограниченным обратным оператором,
притом симметричным и вполне непрерывным. Отсюда по
доказанному мы получаем важный вывод: у такого оператора
Штурма-Лиувилля существует замкнутая ортогональная
система собственных функций ег (t), e2(t), ..., еп (t), ...
Пусть, далее, дважды дифференцируемая функция x(t)
удовлетворяет граничным условиям; положим cp(£) = L[#].
Тогда по сформулированной выше теореме x(t)
истокообразно представимо через ядро K(t, s) и в силу § 48
разлагается в равномерно и абсолютно сходящийся ряд
по собственным функциям ех(г), e2(t)> ... Таким образом,
мы получаем следующую теорему:
Теорема 49. Ряд Фурье по собственным функциям
неособенного оператора Штурма-Лиувилля во всяком
случае сходится равномерно и абсолютно для всех дважды
дифференцируемых функций x(t), удовлетворяющих
граничным условиям (теорема Стеклова).
Примеры
1. Рассмотрим на отрезке O^t^iz уравнение Штурма-Лиут
вилля у" = 0 с граничными условиями 2/(0) = 0, г/(тс) = 0.
Единственное решение этого уравнения, удовлетворяющее заданным
граничным условиям, есть t/=0, и предпосылка приведённой выше
теоремы выполняется. Эта теорема утверждает в данном случае,
что оператор h[y] = y" имеет ограниченный обратный оператору
симметричный и вполне непрерывный. Далее, у оператора Ъ[у]
существует замкнутая ортогональная система собственных
функций ex(t), е2(£), ... с ненулевыми собственными значениями,
и любая функция f (t) £ С2 (0, тс), удовлетворяющая граничным
условиям и дважды диффе ренцируемая, разлагается в -абсолютно
и равномерно сходящийся ряд по этим собственным функциям.
Очевидно, что в данном случае функции en(t) = sinnt (л=1, 2,...)
являются собственными. Поскольку они образуют замкнутую
ортогональную систему (§ 95), иных собственных функций нет. Теорема
о разложении в данном случае утверждает: всякая дважды
дифференцируемая функция / (t) £ С2 (0, тс), удовлетворяющая
условиям / (0) = / (тс)=0, разлагается в абсолютно и равномерно
сходящийся ряд
со
/(£)= 2 bnsin nt,
-Это предложение может быть выведено из общей теоремы о
разложении функций в тригонометрический ряд Фурье (§99,
§ 107] О НЕОГРАНИЧЕННЫХ ОПЕРАТОРАХ 373
2. Если мы пожелаем применить теорему 49 к оператору
Штурма-Лиувилля Ъ[у] — у" в пространстве С2(—п> %) c
граничными условиями у(—rcj1 = 2/(7:), г/' (-—тс) = г/'(тс) или к оператору
L[t/] = ((t2—1)2/')' в пространстве С2( —1, 1), рассмотренном нами
выше (§§ 56, 95, п. 7), то мы встретимся с затруднением,
заключающимся в том, что соответствующие уравнения L [у] = 0
допускают ненулевое решение y(t)= 1, и, следовательно, предпосылка
теоремы 49 не выполнена. Следующая лемма позволяет обойти это
затруднение.
Лемма. Предположим, что линейный оператор А имеет
собственные векторы е1У е2, ..., еп, ... с собственными значениями
Xi, Х2, ..., Хп, ... Рассмотрим линейный оператор А—Х0Е, где
Хо— фиксированное число. Утверждается, что векторы elf е2, ...
...,еп, ... являются собственными также и для оператора
А—Х0Е, причём соответствующие собственные значения суть
^1—^0) ^2 — Х0> •••Дп — Х0, •••
Доказательство. Применяя оператор А—Х0Е к вектору
еп, находим:
(A—X0E)en = Aen —X0en = (Xn — Х0)еа,
т. е. вектор еп является собственным также и для оператора
А—Х0Е, и соответствующее собственное значение равно Хп — л0.
Переходим теперь к рассмотрению указанных выше
операторов Штурма-Лиувилля. Оператор L[y] = y" в пространстве
С2(—тс, тс), как мы уже знаем, имеет собственные функции
1, cos £, sin tf ..., cos nt, sin nt, ... с собственными значениями
соответственно 0, —1, —1, .... —л2, — п2, ...; собственных
функций с иными собственными значениями у данного оператора не
существует (§ 95. п. 7). Выберем число Х0, отличное от всех
чисел —п2(л = 0, 1, 2,...)- Тогда по нашей лемме оператор
L[2/] — X0y будет иметь ту же самую систему собственных
функций с собственными значениями — /г2—Х0, каждое из которых
отлично от нуля. Иных собственных значений у оператора
L [у] — \0у не существует, так как уже имеющаяся система
собственных функций замкнута в пространстве С2( — 1, 1). Применяя
теорему 49, получаем: каждая дважды дифференцируемая
функция f(t), удовлетворяющая условиям /(— тс) — /(тс), /'(—тс) =
=/'(те)» разлагается при — tc<;*s^tc в абсолютно и равномерно
сходящийся ряд Фурье
оо
/(о=-у-+2 апcosnt+bnsinnu
Аналогично, рассматривая в пространстве С2(—1,1) оператор
L[t/] = (02 — 1)?/')' И используя нашу лемму, получаем теорему
о разложении в ряд по многочленам Лежандра для любой дважды
дифференцируемой функции f(t)£C2( — 1, 1).
Ранее (§ 99) мы получили теорему о разложении в ряд Фурье
для функции /(*)?Сз(—тс, тс), удовлетворяющей менее ограничи-
374 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 14
тельным условиям (кусочная непрерывность f (%)). Полученная
здесь теорема налагает, как мы видим, более жёсткие требования
на функцию f(t), но зато имеет значительно более широкий
характер.
Но и в общем случае можно освободиться от слишком
жёстких требований, налагаемых на функцию / (t). Оказывается, что
всякое условие, обеспечивающее равномерную сходимость
тригонометрического ряда Фурье для функции /(*), обеспечивает вместе
с тем и равномерную сходимость ряда по собственным
функциям любого оператора Штурма-Лиувилля *).
§ 108. Вычисление собственных значений
и собственных функций
Для практических применений все полученные нами
результаты требуют знания системы собственных функций
ek (t) (fe = l, 2, ...) соответствующего оператора Фред-
го льма. Мы укажем один простой случай, когда эти
функции легко вычисляются (общие методы нужно искать
в специальных сочинениях, посвященных интегральным
уравнениям и их применениям**).
Предположим, что ядро K(t,s) представляется в виде
конечной суммы произведений вида
Pi(s)<2i(t) (i=l, 2, ...,m),
где функции Pi(s)f а также qi(t) линейно независимы:
m
*(*.*н2л(*)*|(0-
В таком случае оператор А имеет вид
Ь т т
Аср (0 - $ 2 Pi (*) 9\ (0 9 (*)ds = S Ь* W' <13>
где
b
a
*•) Б. М. Левитан. Разложение по собственным функциям,
AL — Л., 1950, стр. 35-39.
**) См., например, Л. В. Канторович и В. И. Крылов,
Приближённые методы высшего анализа, М- — Л., 1949, гл. IJ.
g 108] ВЫЧИСЛЕНИЕ СОБСТВЕННЫХ ЗНАЧЕНИЙ 375
иными словами, он отображает всё пространство С2(а, Ь)
на конечномерное подпространство, порождённое
функциями qi(t)(i=ly 2, ..., т). Таким образом,
собственные функции с ненулевыми собственными значениями
следует искать только в этом подиространстве; они
должны иметь вид
т
«(«Н 2 *?*(')• (14)
Для определения коэффициентов Ci подставляем функцию
(14) в уравнение (2); мы получаем:
т Ь т
ио=2 XCi9i^)= [ к(*> *) 2 ад*(#=
i=i a ft-1
mm Ъ
= S 1ich(\pi(s)qk(s)ds)qi(t) =
*-H-l о У
m m
:==2 2 ChPib<li(t)>
где
ь
Pik= ^ Pi (*) ?k (*) <&• (15)
a
Следовательно,
m
Xci==2 «Wife (i^-l* 2, ..., m). (16)
fc-i
Эта система уравнений позволяет обычным способом
найти X и константы С{.
Особенно простой вид эта система получает тогда,
когда pi{s) = qi\s) и (pif qk) = 0 при i Ф к.
В этом случае величины pik равны нулю при i Ф А,
и система (15) имеет очевидное решение: c^ — i для
некоторого к, Ci — О при i фку\ = pkk- Собственная функция,
отвечающая этому решению, в силу формулы (14)
совпадает с функцией pk(t) = Qk(t)' Таким образом, в данном
376 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 14
случае собственными функциями являются сами функции
Pb(t) (fe = l, 2, ..., т)у а собственными значениями —
числа pkk — квадраты норм этих функций.
Следующие задачи решаются по методу, изложенному
в этом пункте.
Задачи
Решить уравнения:
2 ' '
1. <р(*) = 3 V sty(s) ds + 3« — 2.
О
g
Отв. <р(г) = --г— 2.
i
2. 9(0 = 3 ^ 5icp (s)tfs-f Зг —2.
О
Огая. y(t) — Ct—2, С произвольно.
1
3. <р(0 = \ (s + 0<P(s)rf54-18*2 — 9* —4.
О
Ome. <p(*) = 18*2 + 12* + 9.
ТС
4. <р(0 = \ cos(s + 0?(5)^5+^
о
Отв. <р (г) = 1-
О
2 sin t
1—i
2
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
Адамара неравенство 213, 214
Алгебра 120
Алгебраическое дополнение
минора 35
элемента определителя 23
Аннулирующий многочлен 103,
138, 218, 219
Антисимметричная
полилинейная форма 167,168, 169
Антисимметрия определителя 18
Арчела теорема 308
Аффинное пространство 47, 172,
Базис канонический
билинейной формы 161
квадратичной формы 152,
156, 157
— линейной оболочки 65, 66
— ортонормальный 180
— пространства 56
Базисные векторы 58
— миноры 39, 59, 73
— столбцы 39, 73
— строки 73
Бесконечномерное пространство
58-
Беспорядок 14
Бесселя неравенство 333, 341
Билинейная форма 145
— — , канонический базис 161
, — вид 161
, матрица 147
невырожденная 162
симметричная 147, 163
положительно
определённая 162,163
Билинейный функционал 146
Билинейный функционал
ограниченный 318
, общий вид 355
Больцано теорема 183, 305
Буняковского-Коши неравенство
176, 179, 229, 297, 303, 307,
331, 354, 358, 360
Вандермонда определитель 29
Веиерштрасса признак 341
— теорема 320, 348
Вектор 46
— , длина вектора 174
— истокообразно представимый
363
— максимальный 183, 184, 359
— нормированный 174
— , ортогональный
подпространству 178
— , проекция на подпростран-
* ство 195
— собственный 220
— сопряжённый относительно
билинейной формы 160
Векторы базисные 58
— ортогональные 177
— линейно зависимые 52
независимые 52
— , полная система 337
Векторные линейные функции
см. Линейные операторы
Взаимно однозначное
соответствие 70
Вполне непрерывный оператор
357
Высота тона 263
Гильберт 365
378
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
Гиперболический параболоид
277
Гиперболоид двухполостный 271
— однополостный 271
Гиперпараллелепипед 207, 208,
210 213
Гиперплоскость 67, 69, 131, 139
— диаметральная 282
Главная нормаль 256
Главные кривизны 259, 260
— миноры 164, 167
— направления 259, 260
Гомеоморфные фигуры 273
Гомотопные фигуры 273
Грама определитель 205—207
Грина функция 371
Двухполостный гиперболоид 271
Диагональная матрица 96, 138,
161
— последовательность 309
Диагональный оператор 92, 138,
225
Дирихле теорема 343]
Дифференциальный оператор
Штурма-Лиувилля 233, 235,
330,331,371
Дифференцирования оператор
93, 370
Длина вектора 174
Дюпена индикатриса 260
Евклидовы пространства 172.
181, 335
сепарабельные 336
Единичная матрица 95
Единичный оператор 92
Жёсткость системы 263
Замкнутая система векторов
325
Замкнутое множество 297
Замкнутость системы
многочленов Лежандра 329, 330
тригонометрических
функций 329, 330
Замыкание множества 297
Идеал 120, 194
—-двусторонний 124
-5- левый IgO
Идеал правый 120, 194
Изометрический оператор 186,
190,210,219,220,232
Изометрическое преобразование
188,238,285
Изоморфизм евклидовых
пространств 181, 335
сепарабельных 336
— линейных пространств 69
Инвариантное подпространство
217—2,18
Инварианты квадратичной
формы 157, 159
— тензора 144
Индекс инерции квадратичной
формы 159
Индикатриса Дюпена 260
Инертность системы 263—264
Интеграл Лебега 320
Истокообразно представимый
вектор 363
— представимая через ядро
функция 365
Канонический базис билинейной
формы 161
квадратичной формы 152,
156
— вид билинейной формы 161
квадратичной формы 152,
156, 157
Канонические коэффициенты
квадратичной формы 152
Каноническое уравнение
нецентральной поверхности 268
поверхности 2-го порядка
267
центральной поверхности
267
Кантора теория вещественных
чисел 319, 320
Касательная плоскость 257
Квадратичная форма 150, 236
, инвариант 157
, индекс инерции 159
, канонический базис 152,
156,157
, вид 152, 158, 15'/
, канонические
коэффициенты 152
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
379
Квадратичная форма
невырожденная 159
, отрицательный индекс
инерции 159
положительно
определённая 159
, положительный индекс
инерции 159
, ранг 159
, сравнимость 250
, стационарные значения
241
, теорема инерции 157
Квадратная матрица 13
Квадратный корень из оператора
232
Квазитреугольный определитель
36
Д-вектор 211, 212
Кинетическая энергия 261
/r-мерная сфера 273
Ковариантныи тензор 141, 142,
149
Компакт 310
Компактное множество 305
Коническая поверхность 274
Контравариантный тензор 141,
142
Координаты вектора
относительно базиса 56
Коэффициенты Фурье 323, 324,
325, 333, 337, 340, 341
вектора 180,181
по многочленам Лежандра
348
Коши 36
— критерий 299, 300, 302—304
Коши-Буняковского неравенство
17&, 179, 182
Крамера правило 32
— теорема 50, 51
— формулы 79
Крейна метод 248
Критерий Коши 299, 300, 302,
303, 304
Кривизна кривой 257
— нормальная, 258
Кривизны линии 261
Кронекера-Капелли теорема 78
Кусочно-гладкая функция 342,
343
Кусочно-непрерывная функция
341, 342
Лагранжа метод 241, 242
— уравнения движения системы
262, 264
Лапласа теорема 33, 35, 36
Лебега интеграл 320
Леви неравенство 349, 352
Лежандра многочлены 201, 204,
205, 235, 325, 328, 329, 330,
339, 348, 373
Лейбница формула 204
Линейная комбинация столбцов
определителя 37
— оболочка системы векторов
64
— однородная система
уравнений 44
— система уравнений 11
— форма 89
Линейное пространство 48, 60
матриц и-го порядка 103
Линейно зависимые векторы 52
— независимые векторы 52
Линейный оператор 89
неограниченный 370
ограниченный 318
— функционал 316
Линии кривизны 261
Маклорена ряд 346
Максимальный вектор 183, 184,
194, 228, 229, 359
Матрица билинейной формы 147,
148, 161
— диагональная 96, 138, 161
— единичная 128
— квадратная 13
— нулевого оператора 95
— обратная 111
— обратного перехода 140
— оператора 94
поворота 96
подобия 95
проектирования 96
— определителя 15
— перехода от одного базиса
к другому 127, 139, 186, 187
— , порядок 13
380
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
Матрица присоединённая 114
— , произведение матриц 104
— , — на число 103
— , ранг 39, 73, 74
— симметричная 148
— системы линейных уравнений
основная 29, 77
расширенная 77
Метод Крейна вычисления
канонических коэффициентов 246
— Лагранжа 241, 252
— Якоби 164
Метрическое пространство 291,
293
Минор, алгебраическое
дополнение минора 35
— базисный 39, 59, 73
— главный 164, 167
— дополнительный 33
— к-ro порядка 33
—- окаймлённый 284, 287, 289
— определителя 24
— , произведение миноров 34
Многочлены Лежандра 201, 204,
205, 235, 325, 328, 329, 330,
339,348,373
— тригонометрические 322, 343
Множество замкнутое 297
— , замыкание множества 297
— компактное 305
— ограниченное 175, 293
— плотное в пространстве 299
Неравенство Адамара 213, 214
— Б. Леви 349, 352
— Бесселя 333, 341, 348, 366
— Коши 366
— Коши-Буняковского 176,179,
229, 303, 307, 331, 354, 358,
360
— треугольника 179, 293
Норма 174, 292
— ограниченного оператора 183,
319
Нормаль главная 256
Нормальная кривизна 258
Нормальное сечение
поверхности 258
Нормированное пространство 291
Нормированный вектор 175
Нормы равносильные 313
Нулевой оператор 91
, матрица 95
— столбец 41
Нуль-вектор 47, 61
многообразие линейного
оператора 116, 117, 194
Оболочка линейная 160
Обратная матрица 111
Обратный оператор 110
Общее решение системы
линейных уравнений 82
Однополостный гиперболоид 271
Однородная линейная система 44
Оператор 91
— вполне непрерывный 357
— диагональный 92, 138, 221,
225, 227, 230
, матрица 96, 221
— дифференцирования 92, 221,
370
— единичный 92
— изометрический 186, 219, 220
— линейный 89
— , матрица оператора 95
— неограниченный 319
— , норма 183
— нулевой 91
— , нуль-многообразие
оператора 116
— , область значений оператора
115, 116
— обратный 110
— общий 125
— , определитель оператора 136
— , перестановочность
операторов 222
— перехода от одного базиса
к другому 128
— поворота 92, 221
, матрица 96
— подобия 92
, матрица 95
— проектирования 92, 221
, матрица 96
— самосопряжённый 193, 194
— симметричный 193, 227
—, след 137
— , сложение 98
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
381
Оператор, собственное значение
220
— сопряжённый 193, 194
— , степень оператора 100
— тождественный 92
— , умножение на число 99
— умножения 221, 233
— фредгольма 92, 221, 233, 358,
363, 364,365,367, 369,370,374
, ядро 93
— , характеристический
многочлен 137
— Штурма-Лиувилля 233, 235,
330, 331, 371
неособенный 371, 372
Операции элементарные 84
Определитель 15
— антисимметричный 18
— Вандермонда 29
— Грама 205—208, 215
— квазитреугольный 36
— , минор определителя 24
— транспонированный 18
— треугольный 25
— оператора 136
— произведения двух матриц
107
— , разложение по элементам
столбца 23
Ортогонализация 198
Ортогональная матрица 185
Ортогональное дополнение
подпространства 179
Ортогональность векторов 177
Ортонормальный базис 180
Параболоид гиперболический 277
—г эллиптический 277
Парсеваля равенство 334
Пересечение подпространств 61
Перестановочность операторов
222
Периодичности условие 339
Пифагора теорема 179, 182, 321,
322, 335, 336, 338
Плоскость касательная 257
— соприкасающаяся 256
Поверхность коническая 274
— 2-го порядка 265
вырожденная 268
Поверхность 2-го порядка,
каноническое уравнение 266
невырожденная 268
нецентральная 276
, полуоси 269
, центр 268
— сопряжённая 279
Подпространство 60
— инвариантное 217, 218
— , ортогональное дополнение
179
— , пересечение подпространств
61
— , размерность 62, 64
— собственное 222
— , сумма подпространств 61
Полная система векторов 337
Полное пространство 301
Полнота системы многочленов
Лежандра 328
тригонометрических
функций 343—345
степеней 347
Полилинейная форма 167
— — антисимметричная 167—
169
симметричная 167
Положительный индекс инерции
159
— наклон отрезка в матрице
16
Положительно определённая
билинейная форма 162, 215
квадратичная форма 159
— определённый симметричный
оператор 231
Полуоси поверхности 2-го
порядка 269
Порядок матрицы 13
Последовательность
фундаментальная 299
— функций диагональная 309
Потенциальная энергия 261
Правило Крамера 32, 79, 80
Предел 295
Предельная точка 297
Преобразование изометрическое
188
— коэффициентов линейной
формы 134
382
Преобразование матрицы
билинейной формы 148
Признак Вейерштрасса 341
Присоединённая матрица 114
Проектирования оператор 92
Проекция вектора на
подпространство 195, 321
Произведение векторов
скалярное 163
— двух матриц, ранг 118
, определитель 107
транспонированных
106
— матриц 104
— матрицы на число 103
— миноров 34
Пространство аффинное 47,
172
— бесконечномерное 58
— евклидово 172
— — сепарабельное 336
— линейное 46
, изоморфизм 69—71
— метрическое 291, 293
— нормированное 291
— полное 301
— , размерность 58
— решений системы линейных
уравнений 61
Равенство операторов 102
— Парсеваля-Ляпунова 334
Равномерная сходимость 296
Равносильные нормы 313
Равностепенно непрерывное
семейство функций 307
Разложение определителя по
элементам столбца 23
Размерность линейной оболочки
74
— нуль-многообразия 117
— области значений линейного
оператора 116
— подпространства 62, 64
— пространства 58
Ранг квадратичной формы 159
— линейного оператора 116
— матрицы 30, 73, 74
— произведения двух матриц
118
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
Ранг симметричной билинейной
формы 162
— тензора 141
Расширенная матрица системы
уравнений 77
Решение нетривиальное 75
— системы линейных уравнений
11, подпространство решений
61
Рисе Ф. 307
Родрига формула 202
Ряд Маклорена 346
— Фурье 47, 325, 362
вектора 324
— Фурье-Лежандра,
сходимость в среднем 348
— Эйлера 34/2
Самосопряжённый оператор 193
Свободные члены системы 11
Свёртывание-тензоров 143
Семейство функций
равностепенно непрерывных 307, 358
Сепарабельное евклидово
пространство 336
f изоморфизм 336
Симметричная билинейная
форма 147, 152
, ранг 162
— матрица 148
— полилинейная форма 167
Симметричный оператор 193
Система векторов полная 337
, линейная оболочка 64
Система линейных уравнений
И
несовместная 12
, общее решение 82
однородная 44
, основная матрица 29
, произведение
решения на число 45
, решение 11
, свободные члены 11
совместная 12,
неопределённая 12, определённая 12
, сумма решений 45
многочленов Лежандра,
замкнутость 329, 330
, полнота 328
Алфавитный указатель
383
Система решений
фундаментальная 81—83
— степеней, полнота 347
— тригонометрических
функций, полнота 343—345
Скалярное произведение
векторов 163
След оператора 137
Сложение операторов 98
— тензоров 142
Смешанный тензор 141, 142
Собственное значение оператора
220
— подпространство оператора
222
Собственный вектор 220
Собственные частоты системы
263
Совместная система линейных
уравнений 12
неопределённая 12
определённая 12
Соответствие взаимно
однозначное 70
Соприкасающаяся плоскость 256
Сопряжённая поверхность 279
Сопряжённый вектор 160
— оператор 193
Стеклова теорема 372
Степень оператора 100
Столбец нулевой 41
Столбцы базисные 39
Строки базисные 73
Сумма подпространств 61
— решений системы линейных
уравнений 45
Сходимость в среднем 296
ряда Фурье-Лежандра
348
тригонометрического
ряда Фурье 346
— по всем координатам 296
— равномерная 296
Тензор 138, 141, 149
— , инварианты 144
— ковариантный 141, 142, 149
— контравариянтиыи 141, 142
— , ранг 141
— смешанный 141, 142
Тензорх свёртывание тензоров
143
— , сложение тензоров 142
— , умножение тензоров 143
Теорема Арчела 308
— Больцано 184, 305
— Вейерштрасса 320, 348
— Дирихле 343
— Крамера 50, 51
— Кронекера-Капелли 78
— Лапласа 33, 35, 36
— о базисном миноре 39
— об инерции квадратичных
форм 157
— об ортогонализации 198
— о квадратичной форме в
евклидовом пространстве 238
— о симметричном операторе
230
— Пифагора 179, 182, 321, 322,
335, 336, 338
— Стеклова 372
Теория Кантора вещественных
чисел 319—320
— определителей 13
Тождественный оператор 92
Тон, высота тона 263
Точка предельная 297
Транспонированный
определитель 18
Треугольный определитель 25
Тригонометрическая система
функций, полнота 343—345
Тригонометрические
коэффициенты Фурье 323, 324
, оценка их 339
Тригонометрический многочлен
322, 343
— ряд, сходимость в среднем 346
Трилинейная форма 168
Угол между векторами 175
подпространствами 200
Умножение операторов 99
— тензоров 143
Уравнение Штурма-Лиувилля
371, 372
Уравнения Лагракжа движения
системы 262, 264
Условие периодичности 339
384 АЛФАВИТНЫ
Фигуры гомеоморфные 273
— гомотопные 273
Форма билинейная 145
, канонический вид 161
невырожденная 162
— квадратичная 150
, индекс инерции 159
невырожденная 159
, отрицательный индекс
инерции 159
положительно
определённая 159
, положительный индекс
инерции 159
, ранг 159
— линейная 89
— полилинейная 167
антисимметричная 167—
169 - *ч
симметричная 167
— трилинейная 168
Формула Лейбница 204
— Родрига,202
— Эйлера 259, 327
Формулы Крамера 79
Фредгольма оператор 92
Фундаментальная
последовательность 299
— система решений 81—83
Функционал билинейный 146,
318, 355
— линейный 316, 354
Функция Грина 371
— , истокообразно представи-
мая через ядро 365
— кусочно-гладкая 341, 342, 343
— непрерывная на компакте
311—313
Фурье коэффициенты 323, 324,
325, 333, 337, 340, 341
вектора 180, 181
— ряд 47, 325, 362
УКАЗАТЕЛЬ г
Фурье тригонометрический ряд, *
оценка коэффициентов 339 $
, сходимость в сред- ;
нем 346
Характеристические корни 226
Характеристический многочлен
оператора 137, 138, 225—227,
238
Центральная поверхность,
каноническое уравнение 267
, центр
Частоты собственные системы 263
Член определителя 15
Штурма-Лиувилля
дифференциальный оператор 233, 235,
330, 331, 371
неособенный оператор 371,
372
уравнение 371, 372
Эйлера ряд 342
— формула 259, 327
Элемент матрицы 13
, положительный наклон
отрезка элементов 16
— определителя 15
, алгебраическое
дополнение 23
— противоположный 47
Элементарные операции 84
Эллипсоид 271
Эллиптический параболоид 277
Энергия кинетическая 261
— потенциальная 261
Ядро оператора Фредгольма 93
Якоби метод построения
канонического базиса 164, 200